Eu uso pandas.to_datetime
para analisar as datas nos meus dados. Por padrão, os pandas representam as datas datetime64[ns]
, embora as datas sejam apenas diárias. Gostaria de saber se existe uma maneira elegante / inteligente de converter as datas para datetime.date
ou datetime64[D]
para que, quando eu escrevo os dados em CSV, as datas não sejam anexadas 00:00:00
. Eu sei que posso converter o tipo manualmente, elemento por elemento:
[dt.to_datetime().date() for dt in df.dates]
Mas isso é muito lento, pois tenho muitas linhas e meio que derrota o propósito de usar pandas.to_datetime
. Existe uma maneira de converter a dtype
coluna inteira de uma só vez? Ou, como alternativa, pandas.to_datetime
suporta uma especificação de precisão para que eu possa me livrar da parte do tempo enquanto trabalho com dados diários?
df.dates.apply(lambda x: x.date())
deve ser pelo menos um pouco mais rápido. também dê uma olhada em github.com/pydata/pandas/issues/2583