Estou fazendo uma análise de dados exploratória em alguns dados e recebo estes histogramas:
Isso parece um candidato para uma transformação de log nos dados, então eu executo o seguinte código Python para transformar os dados:
df["abv"].apply(np.log).hist()
df["ibu"].apply(np.log).hist()
plt.show()
E eu recebo este novo gráfico dos histogramas transformados:
Estou certo de que uma transformação de log foi correta nesse caso e, se sim, qual é a melhor maneira de interpretar os resultados?
hist(logx=True)
.