Digamos que temos . Qual é a distribuição amostral de sua amostra?
Em outras palavras, que distribuição a amostra significa de uma versão beta segue?
Digamos que temos . Qual é a distribuição amostral de sua amostra?
Em outras palavras, que distribuição a amostra significa de uma versão beta segue?
Respostas:
Nota: consulte também para a mesma pergunta /math/85535/sum-of-niid-beta-distributed-variables
Para o caso de uma distribuição uniforme, , a distribuição da soma de um número de variáveis independentes (e a média está relacionada) foi descrita como a distribuição de Irwin-Hall .
Se
então você tem uma spline de grau
onde o pode ser descrito por uma relação de recorrência:
Você pode ver a fórmula acima como sendo construída por uma convolução repetida de com onde a integral é resolvida por partes. Podemos generalizar isso para variáveis distribuídas Beta com qualquer e ?
Seja
Esperamos que a função seja dividida em partes (embora possivelmente não seja mais um spline). A convolução para calcular a distribuição de será algo como:
Para :
Para números inteiros e : os termos como e podem ser expandidos para valores inteiros de e , de modo que a integral seja fácil de resolver.
Por exemplo:
A solução para valores inteiros de e também será um spline. Possivelmente, isso poderia ser convertido em alguma fórmula agradável (ou provavelmente não tão agradável) para situações mais gerais (não apenas e ou ). Mas, nesse ponto, é preciso tomar algumas xícaras de café, ou melhor, uma infusão, para lidar com essas coisas.
Eu pensei que era uma pergunta interessante, então aqui está uma rápida exploração visual. Para , primeiro selecionei 4 distribuições Beta separadas (PDFs mostrados abaixo).
Em seguida, coletei amostras médias, e plotei os histogramas correspondentes, como mostrado abaixo. Os resultados parecem normais e estou inclinado a acreditar na afirmação de @ ChristophHanck de que o Teorema do Limite Central (CLT) está funcionando aqui.
Código MATLAB
% Parameters
n = 5000;
K = 5000;
% Define Beta distributions
pd1 = makedist('Beta',0.25,0.45);
pd2 = makedist('Beta',0.25,2.5);
pd3 = makedist('Beta',4,0.15);
pd4 = makedist('Beta',3.5,5);
% Collect Sample Means
X1bar = zeros(K,1);
X2bar = zeros(K,1);
X3bar = zeros(K,1);
X4bar = zeros(K,1);
for k = 1:K % get K sample means
X1bar(k) = mean(random(pd1,n,1)); % take mean of n samples
X2bar(k) = mean(random(pd2,n,1));
X3bar(k) = mean(random(pd3,n,1));
X4bar(k) = mean(random(pd4,n,1));
end
% Plot Beta distribution PDFs
Xsupport = 0:.01:1;
figure, hold on, box on
title('Beta(\alpha_1,\alpha_2) PDFs')
plot(Xsupport,pdf(pd1,Xsupport),'r-','LineWidth',2.2)
plot(Xsupport,pdf(pd2,Xsupport),'b-','LineWidth',2.2)
plot(Xsupport,pdf(pd3,Xsupport),'k-','LineWidth',2.2)
plot(Xsupport,pdf(pd4,Xsupport),'g-','LineWidth',2.2)
legend('(0.25,0.45)','(0.25,2.5)','(4,0.15)','(3.5,5)')
figure
s(1) = subplot(2,2,1), hold on, box on
histogram(X1bar,'FaceColor','r')
s(2) = subplot(2,2,2), hold on, box on
histogram(X2bar,'FaceColor','b')
s(3) = subplot(2,2,3), hold on, box on
histogram(X3bar,'FaceColor','k')
s(4) = subplot(2,2,4), hold on, box on
histogram(X4bar,'FaceColor','g')
title(s(1),'(0.25,0.45)')
title(s(2),'(0.25,2.5)')
title(s(3),'(4,0.15)')
title(s(4),'(3.5,5)')
Edit: Este post foi uma tentativa rápida de fornecer algo ao OP. Como apontado, sabemos que o Teorema Central do Limite (CLT) implica que esses resultados serão válidos para qualquer distribuição com uma variação finita.