Wojciech Sobala

Wojciech Sobala Redaktor
statystyczny,
biostatystyk,
Instytut Medycyny
Pr...

Temat: Indeksy na podstawie zmiennych które mają braki danych

Jeżeli zmienna której używamy do wybrania podzbioru danych (np. df[x>0,]) zawiera braki danych (NA) to w wyniku otrzymujemy wszystkie rekordy spełniające warunek oraz te dla których zmienna ma braki danych. Pewnym rozwiązaniem problemu jest zastosowanie funkcji is.na (df[!is.na(x) & x>0,]) ale nie jest zbyt wygodne gdy wybieramy rekordy na podstawie warunków dla wielu zmiennych.
Czy istnieją inne rozwiązania tego problemu?
Michał Bojanowski

Michał Bojanowski socjolog, analityk

Temat: Indeksy na podstawie zmiennych które mają braki danych


x <- c(1, NA, 2, NA, 3)
x[ x > 1 ]
# [1] NA 2 NA 3
x[ which(x > 1) ]
# [1] 2 3

Następna dyskusja:

Tworzenie kolumn na podstaw...




Wyślij zaproszenie do