Temos um quadro de dados de um arquivo CSV. O quadro de dados DF
possui colunas que contêm valores observados e uma coluna ( VaR2
) que contém a data em que uma medição foi realizada. Se a data não foi registrada, o arquivo CSV contém o valor NA
, para dados ausentes.
Var1 Var2
10 2010/01/01
20 NA
30 2010/03/01
Gostaríamos de usar o comando subset para definir um novo quadro de dados de new_DF
forma que contenha apenas linhas que tenham um NA'
valor da coluna ( VaR2
). No exemplo dado, apenas a linha 2 estará contida na nova DF
.
O comando
new_DF<-subset(DF,DF$Var2=="NA")
não funcionar, o quadro de dados resultante não tem entradas de linha.
Se no arquivo CSV original Valor NA
são trocados com NULL
o mesmo comando produz o resultado desejado: new_DF<-subset(DF,DF$Var2=="NULL")
.
Como posso fazer esse método funcionar, se para a sequência de caracteres o valor NA
é fornecido no arquivo CSV original?