Innehållsförteckning:

Hur hanterar du NA-värden i R?
Hur hanterar du NA-värden i R?

Video: Hur hanterar du NA-värden i R?

Video: Hur hanterar du NA-värden i R?
Video: Så hanterar du en gnällig kollega - Nyhetsmorgon (TV4) 2024, November
Anonim

När du importerar datauppsättning från andra statistiska applikationer saknade värden kan vara kodad med ett nummer, till exempel 99. För att låta R vet att det är en saknat värde du måste koda om den. En annan användbar funktion i R till hantera saknade värden är na . utelämna() som tar bort ofullständiga observationer.

Bara så, hur hanterar du NA i R?

NA-alternativ i R

  1. utelämna och na. exclude: returnerar objektet med borttagna observationer om de innehåller några saknade värden; skillnader mellan att utelämna och utesluta NA:er kan ses i vissa förutsägelse- och restfunktioner.
  2. pass: returnerar objektet oförändrat.
  3. fail: returnerar objektet endast om det inte innehåller några saknade värden.

Likaså, hur hanterar du saknade kategoridata i R? Det finns olika sätt att hantera saknade värden av kategoriska sätt.

  1. Ignorera observationer av saknade värden om vi har att göra med stora datamängder och färre antal poster har saknade värden.
  2. Ignorera variabel, om den inte är signifikant.
  3. Utveckla modell för att förutsäga saknade värden.
  4. Behandla saknad data som bara en annan kategori.

På samma sätt kan man fråga sig, hur ställer man in saknade värden i R?

I R , saknade värden representeras av symbolen NA (inte tillgänglig). Omöjlig värden (t.ex. dividerat med noll) representeras av symbolen NaN (inte ett tal). Till skillnad från SAS, R använder samma symbol för tecken och siffror data . För mer övning i att arbeta med saknar data , prova den här kursen om städning data i R.

Vad betyder Na Rm i R?

När du använder en dataramfunktion na . rm i r hänvisar till den logiska parametern som talar om för funktionen om den ska tas bort eller inte NA värden från beräkningen. Det bokstavligen betyder NA avlägsna. Det är varken en funktion eller en operation. Det är helt enkelt en parameter som används av flera dataramfunktioner.

Rekommenderad: