Ambos parecem extremamente semelhantes e estou curioso para saber qual pacote seria mais benéfico para a análise de dados financeiros.
Ambos parecem extremamente semelhantes e estou curioso para saber qual pacote seria mais benéfico para a análise de dados financeiros.
Respostas:
O pandas fornece ferramentas de manipulação de dados de alto nível construídas sobre o NumPy. O NumPy por si só é uma ferramenta de nível bastante baixo, semelhante ao MATLAB. pandas, por outro lado, oferece rica funcionalidade de séries temporais, alinhamento de dados, estatísticas favoráveis a NA, agrupamento, mesclagem e junção de métodos e muitas outras conveniências. Tornou-se muito popular nos últimos anos em aplicações financeiras. Terei um capítulo dedicado à análise de dados financeiros usando pandas no meu próximo livro.
NA-friendly statistics
, mencionada na sua resposta.
O numpy é exigido pelos pandas (e por praticamente todas as ferramentas numéricas do Python). O Scipy não é estritamente necessário para pandas, mas é listado como uma "dependência opcional". Eu não diria que os pandas são uma alternativa ao Numpy e / ou ao Scipy. Em vez disso, é uma ferramenta extra que fornece uma maneira mais simplificada de trabalhar com dados numéricos e tabulares no Python. Você pode usar estruturas de dados do pandas, mas utilizar livremente as funções Numpy e Scipy para manipulá-las.
O Pandas oferece uma ótima maneira de manipular tabelas, pois você pode facilitar o binning ( binning um quadro de dados em pandas no Python ) e calcular estatísticas. Outra coisa excelente nos pandas é a classe Panel, na qual é possível juntar séries de camadas com propriedades diferentes e combiná-las usando a função groupby.