Eu li o Cisne Negro há alguns anos atrás. A idéia do Cisne Negro é boa e o ataque à falácia lúdica (ver as coisas como se fossem jogos de dados, com probabilidades conhecidas) é bom, mas as estatísticas são escandalosamente deturpadas, com o problema central sendo a alegação errada de que todas as estatísticas desmoronam se as variáveis normalmente não são distribuídos. Fiquei suficientemente irritado com esse aspecto ao escrever a carta a Taleb abaixo:
Dear Dr Taleb
Li recentemente "O Cisne Negro". Como você, sou fã de Karl Popper e me vi concordando com muito do que está nele. Penso que a sua exposição da falácia lúdica é basicamente sólida e chama a atenção para um problema real e comum. No entanto, acho que grande parte da Parte III decepciona muito seu argumento geral, mesmo a ponto de possivelmente desacreditar o restante do livro. É uma pena, pois acho que os argumentos em relação aos Cisnes Negros e às "incógnitas desconhecidas" mantêm seus méritos sem depender de alguns dos erros da Parte III.
A principal questão que desejo apontar - e buscar sua resposta, principalmente se eu entendi mal as questões - é a sua deturpação do campo das estatísticas aplicadas. Na minha opinião, os capítulos 14, 15 e 16 dependem em grande parte de um argumento de homem de palha, deturpando estatísticas e econometria. O campo da econometria que você descreve não é o que me ensinaram quando estudei estatística aplicada, econometria e teoria de risco atuarial (na Universidade Nacional da Austrália, mas usando textos que pareciam bastante comuns). As questões que você levanta (como as limitações das distribuições gaussianas) são bem e verdadeiramente compreendidas e ensinadas, mesmo no nível de graduação.
Por exemplo, você se esforça para mostrar como a distribuição de renda não segue uma distribuição normal e a apresenta como argumento contra a prática estatística em geral. Nenhum estatístico competente jamais diria que sim, e as formas de lidar com esse problema estão bem estabelecidas. Apenas o uso de técnicas do nível mais básico da "economia do primeiro ano", por exemplo, transformar a variável usando seu logaritmo faria seus exemplos numéricos parecerem muito menos convincentes. Essa transformação de fato invalidaria muito do que você diz, porque a variação da variável original aumenta à medida que sua média aumenta.
Estou certo de que existem econometristas incompetentes que fazem regressões OLS, etc. com uma variável de resposta não transformada, como você diz, mas isso apenas os torna incompetentes e usam técnicas bem estabelecidas para serem inapropriadas. Eles certamente teriam sido reprovados mesmo nos cursos de graduação, que passam muito tempo procurando maneiras mais apropriadas de modelar variáveis como renda, refletindo a distribuição real observada (não gaussiana).
A família de Modelos Lineares Generalizados é um conjunto de técnicas desenvolvidas em parte para solucionar os problemas que você levanta. Muitas famílias de distribuições exponenciais (por exemplo, distribuições Gama, Exponencial e Poisson) são assimétricas e apresentam uma variação que aumenta à medida que o centro da distribuição aumenta, contornando o problema que você aponta ao usar a distribuição Gaussiana. Se isso ainda é muito limitativo, é possível eliminar completamente uma "forma" pré-existente e simplesmente especificar uma relação entre a média de uma distribuição e sua variação (por exemplo, permitindo que a variação aumente proporcionalmente ao quadrado da média), usando o método de estimativa "quase-verossimilhança".
Claro, você poderia argumentar que essa forma de modelagem ainda é muito simplista e uma armadilha intelectual que nos leva a pensar que o futuro será como o passado. Você pode estar correto, e acho que a força do seu livro é fazer com que pessoas como eu considerem isso. Mas você precisa de argumentos diferentes daqueles que você usa nos capítulos 14-16. O grande peso que você atribui ao fato de que a variação da distribuição gaussiana é constante, independentemente de sua média (que causa problemas de escalabilidade), por exemplo, é inválida. Assim como sua ênfase no fato de que as distribuições da vida real tendem a ser assimétricas, e não curvas de sino.
Basicamente, você adotou uma simplificação excessiva da abordagem mais básica da estatística (modelagem ingênua de variáveis brutas como tendo distribuições Gaussianas) e mostrou, em detalhes, (corretamente) as deficiências de uma abordagem tão simplificada. Você então usa isso para fazer a diferença para desacreditar todo o campo. Este é um grave lapso na lógica ou uma técnica de propaganda. É lamentável porque diminui seu argumento geral, muitos dos quais (como eu disse) achei válidos e persuasivos.
Eu estaria interessado em ouvir o que você diz em resposta. Duvido que seja o primeiro a levantar essa questão.
Com os melhores cumprimentos
EDUCAÇAO FISICA