Ordenar estatísticas (por exemplo, mínimo) da coleção infinita de variáveis ​​do qui-quadrado?


11

Esta é a minha primeira vez aqui, portanto, deixe-me saber se posso esclarecer minha pergunta de alguma forma (incluindo formatação, tags, etc.). (E espero poder editar mais tarde!) Tentei encontrar referências e resolvi-me usando a indução, mas falhei em ambas.

Estou tentando simplificar uma distribuição que parece reduzir a uma ordem estatística de um conjunto infinito contável de independentes variáveis aleatórias com diferentes graus de liberdade; especificamente, o que é a distribuição do th menor valor entre independente ?χ2mχ22,χ42,χ62,χ82,

Eu estaria interessado no caso especial : qual é a distribuição do mínimo de (independente) ?m=1χ22,χ42,χ62,

No mínimo, pude escrever a função de distribuição cumulativa (CDF) como um produto infinito, mas não posso simplificá-la ainda mais. Eu usei o fato de que o CDF de é (Com , isso confirma o segundo comentário abaixo sobre equivalência com uma distribuição exponencial com expectativa 2.) O CDF do mínimo pode então ser escrito como O primeiro termo no produto é apenas , e o "último" termo éχ2m2

F2m(x)=γ(m,x/2)/Γ(m)=γ(m,x/2)/(m1)!=1ex/2k=0m1xk/(2kk!).
m=1= 1 - ¸ m =
Fmin(x)=1(1F2(x))(1F4(x))=1m=1(1F2m(x))
e-x/2e-x/2Σ k = 0
=1m=1(ex/2k=0m1xk2kk!).
ex/2ex/2k=0xk/(2kk!)=1 . Mas não sei como (se possível?) Simplificá-lo a partir daí. Ou talvez uma abordagem totalmente diferente seja melhor.

Outro lembrete potencialmente útil: é o mesmo que uma distribuição exponencial com a expectativa 2 e é a soma de dois desses exponenciais, etc. χ 2 4χ22χ42

Se alguém está curioso, estou tentando simplificar o Teorema 1 neste artigo para o caso de regressão em uma constante ( para todos os ). (Eu tenho vez de distribuições desde que multiplicado por .)i χ 2 Γ 2 kxi=1iχ2Γ2κ


Será que isso responde sua pergunta?
Mkttas #

@mpiktas: obrigado pela sugestão. É semelhante, exceto que, em vez de exponenciais com diferentes parâmetros de taxa, tenho qui-quadrados com diferentes graus de liberdade (e um número infinito deles, não finito). E enquanto é exponencial, não são; são somas de exponenciais, mas somas de exponenciais não são exponenciais. (E, idealmente, eu estou esperando por uma estatística geral fim, embora o min seria um grande começo.) χ 2 4 , χ 2 6 , χ22χ42,χ62,
David M Kaplan

1
Duvido que exista um formulário fechado para isso. No entanto, ele tem uma caracterização curiosa: quando é a variável Poisson ( λ / 2 ), k = 1 , 2 , , então 1 - F m i n ( λ ) é a chance de que todos os X kk . Xkλ/2k=1,2,1Fmin(λ)Xkk
whuber

1
T1,T2,Exp(1/2)1 / 2 L 1 = T 1 L 2 = T 2 + T 3 U 3 = T 4 + T 5 + T 6 L i ~ χ 2 = P ( N ( t ) iN(t):=sup{n:i=1nTit}1/2U1=T1U2=T2+T3U3=T4+T5+T6 P(Uit)Uiχ2i2são independentes e pela propriedade estacionária de incrementos independentes de um processo de Poisson, temos que . P(Uit)=P(N(t)i)
Cardeal

@ Cardeal Claro: é uma boa maneira de vê-lo. A curiosidade não está no relacionamento entre Poissons e Gammas; está na descrição do próprio evento!
whuber

Respostas:


8

Os zeros do produto infinito serão a união dos zeros dos termos. A computação para o vigésimo termo mostra o padrão geral:

gráfico de zeros complexos

Esse gráfico dos zeros no plano complexo distingue as contribuições dos termos individuais no produto por meio de símbolos diferentes: a cada passo, as curvas aparentes são estendidas ainda mais e uma nova curva é iniciada ainda mais à esquerda.

A complexidade desta imagem demonstra que não existe solução de forma fechada em termos de funções conhecidas de análises superiores (como gama, tetas, funções hipergeométricas etc.), bem como as funções elementares, conforme pesquisado em um texto clássico como Whittaker & Watson ).

Assim, o problema pode ser colocado de maneira mais proveitosa de maneira um pouco diferente : o que você precisa saber sobre as distribuições das estatísticas dos pedidos? Estimativas de suas funções características? Momentos de baixa ordem? Aproximações para quantis? Algo mais?


Por que zeros do produto são importantes? Sinto que estou perdendo algo trivial.
Mpgtas 5/08

2
@mp Os zeros e pólos mostram algo sobre a complexidade da função. As funções racionais têm um número finito delas. Funções elementares normalmente têm uma linha de zeros, como em , integral, para ; funções "transcendentais" típicas têm padrões de zeros um pouco mais complexos, como em todos os números inteiros não positivos (recíprocos da função Gama) ou em uma rede de pontos (funções teta e funções elípticas). O padrão complicado exibido aqui sugere que será difícil ou impossível expressar o CDF em termos dessas funções familiares. n exp ( )2iπnnexp()
whuber

2
@whuber (1/2), obrigado! Eu não sabia sobre as diferentes classes de funções que tinham esses diferentes padrões de zeros no plano complexo; isso parece muito útil, e seu gráfico parece responder à minha pergunta (como colocado).
David M Kaplan

@whuber (2/2), estava verificando um caso especial de uma distribuição (complicada) de um estimador fornecida em outro artigo. Eles usaram a existência da distribuição para justificar o uso do bootstrap; meu consultor sugeriu que eu tentasse aproximar a distribuição. Parece que a distribuição deles pode estar desativada para este caso especial (onde eu sei o que deveria ser); portanto, consultarei meu consultor após o prazo de concessão; mas potencialmente, eu tentaria fazer uma expansão de ordem superior do -stat de ordem (dividida por ) como , em um cenário mais complicado. Irá postar novamente se sim; obrigado novamente! m m mmm
David M Kaplan

4

qual é a distribuição do mínimo de (independente) ?χ22,χ42,χ62,

Desculpas por chegar seis anos atrasado. Embora o PO provavelmente já tenha se voltado para outros problemas, a questão permanece fresca e achei que poderia sugerir uma abordagem diferente.


Nos é dado onde onde com pdf :X i ~ Chisquared ( v i ) v i = 2 i f i ( x i )(X1,X2,X3,)XiChisquared(vi)vi=2ifi(xi)

insira a descrição da imagem aqui

Aqui está um gráfico do do pdf correspondente , conforme o tamanho da amostra aumenta, para :i = 1  a  8fi(xi)i=1 to 8

insira a descrição da imagem aqui

Estamos interessados ​​na distribuição de .min(X1,X2,X3,)

Cada vez que adicionamos um termo extra, o pdf do último termo marginal adicionado muda cada vez mais para a direita, de modo que o efeito da adição de mais e mais termos se torna não apenas cada vez menos relevante, mas depois de apenas alguns termos , torna-se quase insignificante - no mínimo na amostra. Isso significa, na verdade, que apenas um número muito pequeno de termos provavelmente será importante ... e adicionar termos adicionais (ou a presença de um número infinito de termos) é em grande parte irrelevante para o problema mínimo da amostra.

Teste

Para testar isso, calculei o pdf de para 1 termo, 2 termos, 3 termos, 4 termos, 5 termos, 6 termos, 7 termos, 8 termos, para 9 termos e para 10 termos. Para fazer isso, usei a função mathStatica , instruindo-a aqui para calcular o pdf da amostra mínima (a estatística de ordem ) em uma amostra do tamanho , e onde o parâmetro (em vez disso de ser corrigido) é :1 r j i v imin(X1,X2,X3,)OrderStatNonIdentical1stjivi

insira a descrição da imagem aqui insira a descrição da imagem aqui

Fica um pouco complicado à medida que o número de termos aumenta ... mas eu mostrei a saída para 1 termo (1ª linha), 2 termos (segunda linha), 3 termos (3ª linha) e 4 termos acima.

O diagrama a seguir compara o pdf da amostra mínima com 1 termo (azul), 2 termos (laranja), 3 termos e 10 termos (vermelho). Observe como os resultados são semelhantes com apenas 3 termos versus 10 termos: insira a descrição da imagem aqui

O diagrama a seguir compara 5 termos (azul) e 10 termos (laranja) - os gráficos são tão semelhantes que se apagam e nem se pode ver a diferença:

insira a descrição da imagem aqui

Em outras palavras, aumentar o número de termos de 5 para 10 quase não tem impacto visual discernível na distribuição da amostra mínima.

Aproximação semi-logística

Finalmente, uma excelente aproximação simples do pdf da amostra mínima é a distribuição semi-logística com o pdf:

g(x)=2ex(ex+1)2 for x>0

O diagrama a seguir compara a solução exata com 10 termos (que são indistinguíveis de 5 termos ou 20 termos) e a aproximação semi-logística (tracejada):

insira a descrição da imagem aqui

Aumentar para 20 termos não faz diferença discernível.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.