Estou usando a biblioteca do pandas para ler alguns dados CSV. Em meus dados, certas colunas contêm strings. A string "nan"é um valor possível, assim como uma string vazia. Consegui fazer os pandas lerem "nan" como uma string, mas não consigo descobrir como fazer com que não leia um valor vazio como NaN. Aqui estão dados de amostra e saída
One,Two,Three
a,1,one
b,2,two
,3,three
d,4,nan
e,5,five
nan,6,
g,7,seven
>>> pandas.read_csv('test.csv', na_values={'One': [], "Three": []})
One Two Three
0 a 1 one
1 b 2 two
2 NaN 3 three
3 d 4 nan
4 e 5 five
5 nan 6 NaN
6 g 7 seven
Ele lê "nan" corretamente como a string "nan ', mas ainda lê as células vazias como NaN. Tentei passar stro convertersargumento para read_csv (com converters={'One': str})), mas ainda lê as células vazias como NaN.
Sei que posso preencher os valores após a leitura, com fillna, mas não há realmente nenhuma maneira de dizer aos pandas que uma célula vazia em uma coluna CSV específica deve ser lida como uma string vazia em vez de NaN?
keep_default_naabaixo.