Muitos PDFs variam de menos a infinito positivo, mas alguns meios são definidos e outros não. Que característica comum torna computável?
Muitos PDFs variam de menos a infinito positivo, mas alguns meios são definidos e outros não. Que característica comum torna computável?
Respostas:
A média de uma distribuição é definida em termos de uma integral (escreverei como se fosse uma distribuição contínua - como uma integral de Riemann, por exemplo - mas a questão se aplica de maneira mais geral; podemos prosseguir com a integração de Stieltjes ou Lebesgue para lidar com corretamente e tudo de uma vez):
Mas o que isso significa? É efetivamente uma abreviação de
ou
(embora você possa quebrá-lo em qualquer lugar, não apenas em 0)
O problema surge quando os limites dessas integrais não são finitos.
Por exemplo, considere a densidade padrão de Cauchy, que é proporcional a ... observe que
Seja , então d u = 2 x
o que não é finito. O limite na metade inferior também não é finito; a expectativa é assim indefinida.
Ou se tivéssemos como variável aleatória o valor absoluto de um Cauchy padrão, toda a sua expectativa seria proporcional ao limite que acabamos de ver (ie ).
Por outro lado, algumas outras densidades continuam "até o infinito", mas sua integral tem um limite.
As outras respostas são boas, mas podem não convencer a todos, especialmente as pessoas que dão uma olhada na distribuição de Cauchy (com ) e dizem que ainda é intuitivamente óbvio que a média deve ser zero.
A razão pela qual a resposta intuitiva não está correta da perspectiva matemática é devido ao teorema de rearranjo de Riemann (vídeo) .
Efetivamente, o que você faz quando olha para um Cauchy e diz que a média "deve ser zero" é que você está dividindo o "centro" em zero e reivindicando o equilíbrio entre os momentos dos dois tamanhos. Ou, em outras palavras, você está implicitamente fazendo uma soma infinita com "metade" dos termos positivos (os momentos em cada ponto à direita) e "metade" dos termos negativos (os momentos em cada ponto à esquerda) e reivindicando-os soma a zero. (Para o tecnicamente espírito: )
O teorema de rearranjo de Riemann diz que esse tipo de soma infinita (uma com termos positivos e negativos) só é consistente se as duas séries (somente termos positivos e somente termos negativos) são convergentes quando tomadas independentemente. Se os dois lados (positivo e negativo) são divergentes por si mesmos, você pode criar uma ordem de soma dos termos, de modo que somar a qualquer número. (Vídeo acima, a partir das 6:50)
Portanto, sim, se você fizer a soma de maneira equilibrada de 0 a 0, os primeiros momentos da distribuição de Cauchy serão cancelados. No entanto, a definição (padrão) de média não impõe essa ordem de soma. Você deve poder somar os momentos em qualquer ordem e ter a mesma validade. Portanto, a média da distribuição de Cauchy é indefinida - escolhendo criteriosamente como você soma os momentos, você pode fazê-los "equilibrar" (ou não) em praticamente qualquer ponto.
Portanto, para definir a média de uma distribuição, as integrais de dois momentos precisam ser convergentes de forma independente (finita) em torno da média proposta (que, quando você faz as contas, é realmente apenas outra maneira de dizer que a integral completa ( ) precisa ser convergente). Se as caudas são "gordas" o suficiente para tornar infinito o momento para um lado, você está pronto. Você não pode equilibrar isso com um momento infinito do outro lado.
Devo mencionar que o comportamento "contra-intuitivo" de coisas como a distribuição de Cauchy é inteiramente devido a problemas ao pensar no infinito. Pegue a distribuição Cauchy e corte as caudas - mesmo arbitrariamente, como em mais / menos o número xkcd - e (uma vez re-normalizado), de repente você obtém algo que é bem comportado e tem uma média definida. Não são as caudas gordas em si mesmas que são um problema, é como essas caudas se comportam quando você se aproxima do infinito.
O general Abrial e Glen_b tiveram respostas perfeitas. Eu só quero adicionar uma pequena demonstração para mostrar que a média da distribuição Cauchy não existe / não converge.
No experimento a seguir, você verá que, mesmo que você obtenha uma amostra grande e calcule a média empírica da amostra, os números são bem diferentes de experimento para experimento.
set.seed(0)
par(mfrow=c(1,2))
experiments=rep(1e5,100)
mean_list_cauchy=sapply(experiments, function(n) mean(rcauchy(n)))
mean_list_normal=sapply(experiments, function(n) mean(rnorm(n)))
plot(mean_list_cauchy,ylim=c(-10,10))
plot(mean_list_normal,ylim=c(-10,10))
Você pode observar que temos experimentos e, em cada experimento, amostramos 1 × 10 5 pontos de duas distribuições, com um tamanho de amostra tão grande, que a média empírica em diferentes experimentos deve estar bastante próxima da média verdadeira. Os resultados mostram que a distribuição de Cauchy não possui uma média convergente, mas a distribuição normal possui.
EDITAR:
Como @ mark999 mencionado no bate-papo, devemos argumentar que as duas distribuições usadas no experimento têm uma "variação" semelhante (a razão pela qual eu uso a citação é porque a variação da distribuição de Cauchy também é indefinida). Aqui está a justificativa: o PDF deles é semelhante.
Observe que, olhando o PDF da distribuição de Cauchy, suporíamos que fosse , mas pelas experiências que podemos ver, ele não existe. Esse é o ponto da demonstração.
curve(dnorm, -8,8)
curve(dcauchy, -8,8)
Por definição da integral Lebesgue-Stieltjes, a média existe se:
https://en.wikipedia.org/wiki/Moment_(mathematics)#Significance_of_the_moments
Como a distribuição no círculo é simétrica rotacionalmente, não pode haver média, mediana ou modo no círculo. Da mesma forma, momentos mais altos, como variação, não podem fazer sentido. Essa distribuição surge naturalmente em muitos contextos. Por exemplo, meu projeto atual envolve imagens microscópicas de tecido cancerígeno. Os muitos objetos na imagem não são simétricos e uma "direção" pode ser atribuída a cada um. A hipótese nula óbvia é que essas direções são distribuídas uniformemente.