Distribuição da soma dos quadrados das variáveis ​​aleatórias distribuídas em T


11

Eu estou olhando para a distribuição da soma dos quadrados das variáveis ​​aleatórias distribuídas em T, com expoente de cauda . Onde X é o rv, a transformação de Fourier para , fornece uma solução para o quadrado antes da convolução . X 2 F ( t ) F ( t ) n F ( t ) = 0 exp ( iαX2F(t)F(t)n

F(t)=0exp(itx2)((αα+x2)α+12α B(α2,12))dx

Com , a solução é possível, mas pesada e impossível de se inverter para fazer um Fourier inverso para . Portanto, a pergunta é: foi realizado um trabalho sobre a distribuição da variação da amostra ou desvio padrão das variáveis ​​aleatórias distribuídas em T? (Seria para o StudentT o que o qui-quadrado é para o gaussiano). Obrigado.F ( t ) nα=3F(t)n

(Solução possível) Eu descobri que é Fisher distribuído, portanto, veremos a soma das variáveis ​​distribuídas de Fisher. F ( 1 , α )X2F(1,α)

(Solução possível) A partir das funções características da média de resumiu tem os mesmos dois primeiros momentos de um de distribuição, quando estes existem. Portanto, com a raiz quadrada e fazendo uma mudança de variável dentro de uma distribuição de probabilidade, a densidade do desvio padrão das variáveis ​​T da n-amostra pode ser aproximada com: nX2F(n,α)

g(u)=2αα/2nn/2un1(α+nu2)α2n2B(n2,α2)

1
T2 é distribuído. A média e a variação de uma soma de variáveis ​​independentes distribuídas por são facilmente derivadas, mas a distribuição não está disponível na forma fechada. Veja esta pergunta para alguns detalhes. Você pode achar útil o artigo vinculado. A função característica também é dado na página Wikipedia para o F. [a variância da amostra de variáveis distribuídas-t é uma questão bastante diferente.]FF(1,α)
Glen_b -Reinstate Monica

Respostas:


7

Um esclarecimento de sua pergunta (parece-me haver duas partes relacionadas, mas diferentes): você está procurando (1) distribuição de uma soma de variáveis quadráticas independentes independentes t_ e (2) a amostragem distribuição da variância (ou desvio padrão relacionado) de uma amostra aleatória retirada de uma distribuição (presumivelmente o seu motivo para perguntar sobre (1)).n tαtα

Distribuição da soma das variáveis quadráticas independentestα

Se são variáveis aleatórias (independentes) com df, é falso que (que é o que você parece reivindicar em sua segunda "solução possível"). Isso é facilmente verificado considerando o primeiro momento de cada um (o primeiro momento do último é vezes o primeiro). Titαtαi=1nTi2F(n,α)n

A afirmação em sua primeira "solução possível" está correta: . Em vez de recorrer a funções características, acho que esse resultado é mais transparente ao considerar a caracterização da distribuição como a distribuição da razão que é uma variável normal padrão e é uma variável do qui-quadrado com graus de liberdade, independentes de . O quadrado dessa razão é, então, a razão de duas variáveis ​​independentes do qui-quadrado, escaladas por seus respectivos graus de liberdade, isto é, comTi2F(1,α)tZU/αZUαZV/1U/αV=Z2, que é uma caracterização padrão de uma distribuição (com o numerador df igual a 1 e o denominador df igual a ).F(1,α)α

Considerando a observação que fiz nos primeiros momentos do primeiro parágrafo acima, pode parecer que uma afirmação melhor pode ser que [Eu tenho notação levemente abusada aqui, usando a mesma expressão para a distribuição, bem como uma variável aleatória com essa distribuição.]. Enquanto os primeiros momentos coincidem, os segundos momentos centrais não (para a variação da primeira expressão é menor que a variação da última expressão) - portanto, essa afirmação também é falsa. [Dito isto, é interessante observar que , que é o resultado que esperamos ao somar ao quadrado (padrão) variáveis ​​normais.]i=1nTi2nF(n,α)α>4limαnF(n,α)=χn2

Amostragem de distribuição de variação ao amostrar de uma distribuiçãotα

Considerando o que escrevi acima, a expressão que você obtém para "a densidade do desvio padrão das variáveis ​​T da n-amostra" está incorreta. No entanto, mesmo que sido a distribuição correta, o desvio padrão não é simplesmente a raiz quadrada da soma dos quadrados (como você parece ter usado para chegar à sua densidade ). Em vez disso, você procuraria a distribuição de amostragem (em escala) de . No caso normal, o LHS dessa expressão pode ser reescrito como uma soma de variáveis ​​normais ao quadrado (o termo dentro do quadrado pode ser reescrito como uma combinação linear de variáveis ​​normais que é novamente normalmente distribuída), o que leva à familiarF(n,α)g(u)χ 2 t ti=1n(TiT¯)2=i=1nTi2nT¯2χ2 . Infelizmente, uma combinação linear de variáveis (mesmo com os mesmos graus de liberdade) não é distribuída como , portanto, uma abordagem semelhante não pode ser explorada.tt

Talvez você deva reconsiderar o que deseja demonstrar? Pode ser possível alcançar o objetivo usando algumas simulações, por exemplo. No entanto, você indica um exemplo com , uma situação em que apenas o primeiro momento de é finito; portanto, a simulação não ajudará nos cálculos desse momento. F ( 1 , α )α=3F(1,α)


Obrigado Mark; de fato, a convolução fracassa, embora os dois primeiros momentos sejam preservados. Vai tentar o Chi-quadrado e reverter.
Nero

Eu reformulei minha pergunta. Ou devo postar modificações em outro lugar da página?
Nero

Nero - as alterações na sua pergunta devem aparecer na pergunta. Você sempre pode sinalizar como a pergunta mudou na pergunta, se isso ajudar (embora tenha em mente que todo o histórico de edições da pergunta e respostas está disponível, se necessário).
Glen_b -Replica Monica

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.