Eu tenho um DataFrame de pandas preenchido principalmente com números reais, mas também existem alguns nan
valores.
Como posso substituir os nan
s com médias de colunas onde eles estão?
Essa pergunta é muito semelhante a esta: matriz numpy: substitui os valores nan pela média de colunas , mas, infelizmente, a solução fornecida não funciona para um DataFrame do pandas.
df.fillna(df.mean())
retornará o novo quadro de dados, portanto você precisará escreverdf=df.fillna(df.mean())
para mantê-lo.