Minhas matrizes numpy usam np.nanpara designar valores ausentes. À medida que faço a iteração no conjunto de dados, preciso detectar esses valores ausentes e tratá-los de maneiras especiais.
Usei ingenuamente numpy.isnan(val), o que funciona bem, a menos que valnão esteja entre o subconjunto de tipos suportados por numpy.isnan(). Por exemplo, dados ausentes podem ocorrer em campos de string, caso em que recebo:
>>> np.isnan('some_string')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: Not implemented for this type
Além de escrever um invólucro caro que captura a exceção e retorna False, há uma maneira de lidar com isso de maneira elegante e eficiente?
pandas.isnull()parece funcionar perfeitamente. O único tipo de dados com o qual estou lidando atualmente com quebras numpy.isnan()é string, e pandas.isnull()lida bem com isso. Na verdade, ele parece lidar bem com qualquer objeto arbitrário que eu joguei nele. Você estava preocupado com algum problema específico? Caso contrário, você pode querer enviar seu comentário como uma resposta completa, já que parece uma resposta canônica, pelo menos para usuários de pandas.
pandastempandas.isnull(): Não tenho certeza se isso atende às suas necessidades, portanto, alguns dados de exemplo podem ser bons.