Um normal dividido por fornece uma distribuição t - prova


10

Seja e .W ~ χ 2 ( s )ZN(0,1)Wχ2(s)

Se e são distribuídos independentemente, a variável segue uma distribuição com graus de liberdade .W Y = ZZW tsY=ZW/sts

Estou procurando uma prova desse fato; uma referência é boa o suficiente se você não quiser escrever o argumento completo.


11
Isso é demonstrado formalmente em stats.stackexchange.com/questions/52906 : a proporção, quando escrita como integral, é vista como uma mistura de gaussianos, e essa demonstração mostra que a mistura está na distribuição.
whuber

Em alguns livros didáticos, essa é uma definição de distribuição t. Você não precisa provar isso. Como obter um pdf, dada essa definição, é uma pergunta válida.
mpiktas 15/05

Respostas:


12

Seja uma variável aleatória qui-quadrado com graus de liberdade. Então a raiz quadrada de , é distribuída como uma distribuição chi com graus de liberdade, que tem densidade n Y YnY N f Y ( Y ) = 2 1 - NYY^n

(1)fY^(y^)=21n2Γ(n2)y^n1exp{y^22}

Definir . Então , e pela fórmula da mudança de variável, temos que YX1nY^Y^X=n

fX(x)=fY^(nx)|Y^X|=21n2Γ(n2)(nx)n1exp{(nx)22}n

(2)=21n2Γ(n2)nn2xn1exp{n2x2}

Seja uma variável aleatória normal padrão, independente das anteriores, e defina a variável aleatóriaZ

T=ZYn=ZX
.

Pela fórmula padrão para a função densidade da razão de duas variáveis ​​aleatórias independentes,

fT(t)=|x|fZ(xt)fX(x)dx

Mas para o intervalo porque é um rv não negativo. Portanto, podemos eliminar o valor absoluto e reduzir a integral para[ - , 0 ] XfX(x)=0[,0]X

fT(t)=0xfZ(xt)fX(x)dx

=0x12πexp{(xt)22}21n2Γ(n2)nn2xn1exp{n2x2}dx

(3)=12π21n2Γ(n2)nn20xnexp{12(n+t2)x2}dx

O integrando em parece promissor para eventualmente ser transformado em uma função de densidade gama. Os limites da integração estão corretos, portanto, precisamos manipular o integrando para se tornar uma função de densidade Gamma sem alterar os limites. Defina a variável(3)

mx2dm=2xdxdx=dm2x,x=m12
Fazendo a substituição no integrando, temos

(4)I3=0xnexp{12(n+t2)m}dm2x=120mn12exp{12(n+t2)m}dm

A densidade gama pode ser escrita

Gamma(m;k,θ)=mk1exp{mθ}θkΓ(k)

Coeficientes correspondentes, devemos ter

k1=n12k=n+12,1θ=12(n+t2)θ=2(n+t2)

Para esses valores de e os termos no integrando envolvendo a variável são o núcleo de uma densidade gama. Portanto, se dividirmos o integrando por e multiplicarmos fora da integral pela mesma magnitude, a integral será a distribuição gama. funcionar e será igual a unidade. Portanto, chegamos aθ ( θ ) k Γ ( k )kθ(θ)kΓ(k)

I3=12(θ)kΓ(k)=12(2n+t2)n+12Γ(n+12)=2n12nn+12Γ(n+12)(1+t2n)12(n+1)

Inserindo o acima na eq. temos(3)

fT(t)=12π21n2Γ(n2)nn22n12nn+12Γ(n+12)(1+t2n)12(n+1)

=Γ[(n+1)/2]nπΓ(n/2)(1+t2n)12(n+1)

... que é chamada de (função de densidade) da distribuição t do aluno, com graus de liberdade.n


23

Embora ES Pearson não gostasse, o argumento original de Fisher era geométrico, simples, convincente e rigoroso. Baseia-se em um pequeno número de fatos intuitivos e facilmente estabelecidos. Eles são facilmente visualizados quando ou , onde a geometria pode ser visualizada em duas ou três dimensões. Com efeito, isso equivale ao uso de coordenadas cilíndricas em para analisar iid variáveis ​​normais.s=1s=2Rs×Rs+1

  1. s+1 independentes e identicamente distribuídas As variáveis ​​normais são esfericamente simétricas. Isso significa que a projeção radial do ponto na esfera unitária tem uma distribuição uniforme em .X1,,Xs+1(X1,,Xs+1)SsRs+1Ss

  2. Uma é a soma dos quadrados das variáveis ​​normais normais independentes de .χ2(s)s

  3. Assim, configurando e , a razão é a tangente da latitude do ponto em .Z=Xs+1W=X12++Xs2Z/Wθ(X1,,Xs,Xs+1)Rs+1

  4. tanθ é inalterado por projeção radial em .Ss

  5. O conjunto determinado por todos os pontos de latitude em é uma esfera dimensional de raio . Sua medida dimensional é proporcional aθSss1cosθs1

    coss1θ=(1+tan2θ)(s1)/2.

  6. O elemento diferencial é .d(tanθ)=cos2θdθ=(1+tan2θ)dθ

  7. Escrever fornece , de onde e Juntas, essas equações implicamIncorporar o fator de em uma constante de normalização mostra que a densidade de é proporcional at=Z/W/s=stanθtanθ=t/s

    1+t2/s=1+tan2θ
    dt=sdtanθ=s(1+tan2θ)dθ.
    dθ=1s(1+t2/s)1dt.
    1/sC(s)t

    (1+tan2θ)(s1)/2dθ=(1+t2/s)(s1)/2 (1+t2/s)1dt=(1+t2/s)(s+1)/2dt.

Essa é a densidade t de Student.

Figura

A figura mostra o hemisfério superior (com ) de em . Os eixos cruzados abrangem o hiper-planoOs pontos pretos fazem parte de uma amostra aleatória de uma distribuição normal padrão com variação : são os valores projetados para uma latitude constante , mostrada como a faixa amarela. A densidade desses pontos é proporcional ao volume dimensional dessa banda, que em si é um de raio . O cone sobre essa banda é desenhado para terminar a uma altura de . Até um fator deZ0SsRs+1Ws+1θs1Ss1θtanθs, a distribuição t de Student com graus de liberdade é a distribuição dessa altura ponderada pela medida da faixa amarela ao normalizar a área da esfera unitária para a unidade.sSs

Aliás, a constante de normalização deve ser (como mencionado anteriormente) vezes os volumes relativos das esferas ,1/s

C(s)=1s|Ss1||Ss|=1ssπs/2Γ(s+12+1)(s+1)π(s+1)/2Γ(s2+1)=1ssπs/2(s+1)/2Γ(s+12)(s+1)π(s+1)/2(s/2)Γ(s2)=Γ(s+12)sπΓ(s2).

A expressão final, embora convencional, disfarça levemente a expressão inicial lindamente simples, que revela claramente o significado de .C(s)


Fisher explicou essa derivação para WS Gosset (o "Estudante" original) em uma carta. Gosset tentou publicá-lo, dando a Fisher o crédito total, mas Pearson rejeitou o jornal. O método de Fisher, aplicado ao problema substancialmente semelhante, porém mais difícil, de encontrar a distribuição de um coeficiente de correlação amostral, foi finalmente publicado.

Referências

RA Fisher, Distribuição de Frequência dos Valores do Coeficiente de Correlação em Amostras de uma População Indefinidamente Grande. Biometrika vol. 10, n ° 4 (maio de 1915), pp. 507-521. Disponível na Web em https://stat.duke.edu/courses/Spring05/sta215/lec/Fish1915.pdf (e em muitos outros lugares através da pesquisa, uma vez que este link desaparece).

Joan Fisher Box, Gosset, Fisher e a distribuição t. The American Statistician , vol. 35, n ° 2 (maio de 1981), pp. 61-66. Disponível na Web em http://social.rollins.edu/wpsites/bio342spr13/files/2015/03/Studentttest.pdf .

EL Lehmann, Fisher, Neyman e a Criação de estatística clássica. Springer (2011), capítulo 2.


Esta é uma prova fantástica! Eu sinceramente espero que você encontre essa mensagem, embora já tenha se passado vários anos. No sexto passo desta prova, acredito que haja um erro. Cos ^ -2 (teta) = (1 + tan ^ 2 (teta)), não o inverso. Rezando para que haja uma solução fácil?
Math Enthusiast

Obrigado por suas observações. Não encontro nenhum erro na etapa 6. Talvez você esteja tentando ler " " (que significa o poder de ) como se isso significasse " "? cos2(θ)2cos(θ)(ArcCos(θ))2
whuber

11
Usei a identidade simples para deduzir que na Linha 5 Mas, pelo mesmo raciocínio da Linha 6, . Isso entra em conflito com a afirmação de que o elemento diferencial é igual asec2θ=tan2θ+1cosθ=(tan2θ+1)1/2cos2θ=sec2θ=(tan2θ+1)(tan2θ+1)1
Math Enthusiast

@ Math Obrigado - você está certo, é claro. Eu editei os pontos (6) e (7) para corrigir a álgebra.
whuber

11
Uau, que alívio! Boas festas para você
Math Enthusiast

1

Eu tentaria mudar de variáveis. Defina e por exemplo. Então , . Então. Onde é a matriz Jacobiana da função de multivariada e de e . Então você pode integrar fora da densidade da junta. , , eY=ZWsX=ZZ=XW=sX2Y2fX,Y(x,y)=fZ,W(x,sx2y2)|det(J)|Z W X Y x ZJZWXYxZZX=1WZY=0WWX=2sXY2WY=2sX2Y3 .

J=(102sX2Y3)

Então . Eu só dei uma olhada no Elementos de Teoria Distribuição por Thomas A. Severini e ali, eles tomam . A integração das coisas se torna mais fácil usando as propriedades de uma distribuição Gaama. Se eu usar , provavelmente precisaria completar quadrados. X=WX=Z|det(J)|=2sx2y3X=WX=Z

Mas não quero fazer o cálculo.


11
Eu não votei em você, de fato, apenas votei em você. Mas acho que talvez o voto negativo tenha chegado antes da sua edição.
Monolite

Desculpe por isso, vou ter cuidado a partir de agora.
Ztyh 12/0515
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.