A presente questão é um caso específico em que você está lidando com uma quantidade que é uma função linear de uma variável aleatória multinomial. É possível resolver seu problema exatamente, enumerando as combinações multinomiais que satisfazem a desigualdade necessária e somando a distribuição nesse intervalo. No caso em que é grande, isso pode se tornar computacionalmente inviável. Nesse caso, é possível obter uma distribuição aproximada usando a aproximação normal ao multinomial. Uma versão generalizada dessa aproximação é mostrada abaixo e, em seguida, é aplicada ao seu exemplo específico.N
Problema geral de aproximação: suponha que tenhamos uma sequência de variáveis aleatórias permutáveis com intervalo . Para qualquer , podemos formar o vetor de contagem , que conta o número de ocorrências de cada resultado nos primeiros valores da sequência. Como a sequência subjacente é intercambiável, o vetor count é distribuído como:1,2,...,mn∈NX≡X(n)≡(X1,X2,...,Xm)n
X ~ Mu(n,θ)θ=limn→∞X(n)/n.
Agora, suponha que tenhamos algum vetor de pesos não negativos e usamos esses pesos para definir a função linear:w=(w1,w2,...,wm)
A(n)≡∑i=1mwiXi.
Como os pesos não são negativos, essa nova quantidade não diminui em . Em seguida, definimos o número , que é o menor número de observações necessárias para obter um valor mínimo especificado para nossa função linear. Queremos aproximar a distribuição de no caso em que esse valor é (estocástico) grande.nN(a)≡min{n∈N|A(n)⩾a}N(a)
Resolvendo o problema geral de aproximação: Primeiramente, observamos que, como não diminui em (o que vale porque assumimos que todos os pesos são não negativos), temos:A(n)n
P(N(a)⩾n)=P(N(a)>n−1)=P(A(n−1)<a).
Assim, a distribuição de está directamente relacionada com a distribuição de . Supondo que a quantidade anterior seja grande, podemos aproximar a distribuição da última substituindo o vetor aleatório discreto por uma aproximação contínua a partir da distribuição normal multivariada. Isso leva a uma aproximação normal para a quantidade linear , e podemos calcular diretamente os momentos dessa quantidade. Para fazer isso, usamos o fato de que , e para . Com alguma álgebra básica, isso nos dá:NAXA(n)E(Xi)=nθiV(Xi)=nθi(1−θi)C(Xi,Xj)=−nθiθji≠j
μ≡E(1nA(n))=∑i=1mwiθi,
σ2≡V(1n−−√A(n))=∑i=1mwiθi−(∑i=1mwiθi)2=μ(1−μ).
Tomar a aproximação normal do multinomial agora nos dá a distribuição aproximada . A aplicação desta aproximação produz:A(n) ~ N(nμ,nμ(1−μ))
P(N(a)⩾n)=P(A(n−1)<a)≈Φ(a−(n−1)μ(n−1)μ(1−μ)−−−−−−−−−−−−−√).
(O símbolo é a notação padrão para a função de distribuição normal padrão.) É possível aplicar esta aproximação para encontrar probabilidades referentes à quantidade para um valor especificado de . Essa é uma aproximação básica que não tentou incorporar a correção de continuidade nos valores dos valores subjacentes da contagem multinomial. É obtido fazendo uma aproximação normal usando os mesmos dois primeiros momentos centrais da função linear exata.ΦN(a)a
Aplicação para o seu problema: No seu problema, você tem probabilidades , pesos e o valor de corte . Portanto, você tem (arredondamento para seis casas decimais) . Aplicando a aproximação acima, temos (arredondando para seis casas decimais):θ=(12,16,13)w=(0,ln2,ln3)a=ln100000μ=16ln2+13ln3=0.481729
P(N(a)⩾25)≈Φ(ln100000−24⋅0.48172924−−√⋅0.499666)=Φ(−0.019838)=0.492086.
Pela aplicação da distribuição multinomial exata, somando todas as combinações que atendem ao requisito , pode-se mostrar que o resultado exato é . Portanto, podemos ver que a aproximação está bem próxima da resposta exata no presente caso.P(A(24)<a)P(N(a)⩾25)=0.483500
Esperamos que esta resposta lhe dê uma resposta para sua pergunta específica, além de colocá-la em uma estrutura mais geral de resultados probabilísticos que se aplicam a funções lineares de vetores aleatórios multinomiais. O presente método deve permitir que você obtenha soluções aproximadas para problemas do tipo geral que você está enfrentando, permitindo variações nos números específicos em seu exemplo.