Muitas pessoas usam uma ferramenta principal como o Excel ou outra planilha, SPSS, Stata ou R para suas necessidades estatísticas. Eles podem recorrer a algum pacote específico para necessidades muito especiais, mas muitas coisas podem ser feitas com uma planilha simples ou um pacote geral de estatísticas ou um ambiente de programação de estatísticas.
Eu sempre gostei do Python como uma linguagem de programação e, para necessidades simples, é fácil escrever um programa curto que calcule o que eu preciso. O Matplotlib me permite traçá-lo.
Alguém mudou completamente, digamos R, para Python? O R (ou qualquer outro pacote de estatísticas) possui muitas funcionalidades específicas para as estatísticas e possui estruturas de dados que permitem pensar nas estatísticas que você deseja executar e menos na representação interna de seus dados. O Python (ou alguma outra linguagem dinâmica) tem o benefício de permitir que eu programe em uma linguagem familiar e de alto nível, e me permite interagir programaticamente com sistemas do mundo real nos quais os dados residem ou dos quais eu posso fazer medições. Mas não encontrei nenhum pacote Python que me permitisse expressar coisas com "terminologia estatística" - de simples estatísticas descritivas a métodos multivariados mais complicados.
O que você pode recomendar se eu quiser usar o Python como um "ambiente de trabalho estatístico" para substituir R, SPSS etc.?
O que eu ganharia e perderia, com base na sua experiência?