Incidentalmente, uma pergunta sobre o uso de planilhas do Google levantou opiniões contrastantes (por isso, interessantes) sobre isso: alguns de vocês usam a planilha do Google Docs para conduzir e compartilhar seu trabalho estatístico com outras pessoas?
Eu tenho em mente um artigo mais antigo que não parecia tão pessimista, mas é apenas citado marginalmente no artigo que você mencionou: Keeling e Pavur, um estudo comparativo da confiabilidade de nove pacotes de software estatístico (CSDA 2007 51: 3811). Mas agora, encontrei o seu no meu disco rígido. Também houve uma edição especial em 2008, consulte a seção Especial no Microsoft Excel 2007 e, mais recentemente, no Journal of Statistical Software: Sobre a precisão numérica de planilhas .
Eu acho que é um debate de longa data, e você encontrará vários artigos / opiniões sobre a confiabilidade do Excel para computação estatística. Eu acho que existem diferentes níveis de discussão (que tipo de análise você planeja fazer, você confia no solucionador interno, existem termos não lineares que entram em um determinado modelo etc.) e podem surgir fontes de imprecisão numérica como resultado de erros de computação adequados ou problemas de escolhas de design ; isso está bem resumido em
M. Altman, J. Gill e MP McDonald,
Questões Numéricas em Computação Estatística para o Cientista Social , Wiley, 2004.
Agora, para análise exploratória de dados, existem várias alternativas que fornecem recursos aprimorados de visualização, gráficos multivariados e dinâmicos, por exemplo, GGobi - mas consulte tópicos relacionados neste wiki.
Mas, claramente, o primeiro ponto que você mencionou aborda outro problema (IMO): o uso de uma planilha para lidar com grandes conjuntos de dados: simplesmente não é possível importar um grande arquivo csv para o Excel (estou pensando em dados genômicos, mas se aplica a outro tipo de dados de alta dimensão). Não foi construído para esse fim.
R
SAS).