Qual é a aproximação normal da distribuição multinomial?

Se houver várias aproximações possíveis, estou procurando a mais básica.

normal-distribution multinomial approximation

— ericstalbot
fonte

Respostas:

Você pode aproximar isso com a distribuição normal multivariada da mesma maneira que a distribuição binomial é aproximada pela distribuição normal univariada. Verifique os elementos da teoria da distribuição e da distribuição multinomial, páginas 15-16-17.

Let $P=(p_1,...,p_k)$ ser o vector de suas probabilidades. Em seguida, o vector médio da distribuição normal multivariada é $np=(np_1,np_2,...,np_k)$ . A matriz de covariância é um $k \times k$ simétrica matriz. Os elementos diagonais são, na verdade, a variação de $X_i$ 's; ie , . O elemento fora da diagonal na i-ésima linha e j-ésima coluna é , onde não é igual a . $np_i(1-p_i)$ $i=1,2...,k$ $\text{Cov}(X_i,X_j)=-np_ip_j$ $i$ $j$

— Estado
fonte

Confira a segunda referência.

— Stat

Stat, para que esta resposta possa permanecer por si só (e ser resistente à podridão do link), você se importaria em fornecer um resumo da solução?

— whuber

Isso precisa de uma correção de continuidade? Como você aplicaria isso?

— Jack Aidley 23/05

A matriz de covariância não é definida positivamente, mas sim semi-definida positiva, e não é de classificação completa. Isso torna indefinida a distribuição multinormal resultante. Esse é o problema que eu enfrentei. Alguma idéia de como lidar com isso?

— Mohammad Alaggan 13/09/16

@ M.Alaggan: As matrizes de média / covariância definidas aqui têm um pequeno problema: para uma distribuição multinomial com variáveis

, o normal multivariado equivalente tem variáveis

. Isso é evidente no exemplo binomial simples, que é aproximado pela distribuição normal (comum). Para uma discussão mais aprofundada, consulte o Exemplo 12.7 dos Elementos da Teoria da Distribuição .

k

$k$

k - 1

$k-1$

— MS Dousti 21/07

A densidade dada nesta resposta é degenerada e, portanto, usei o seguinte para calcular a densidade resultante da aproximação normal:

Há um teorema que diz dada uma variável aleatória $X = [X_1, \ldots, X_m]^T \sim \text{Multinom}(n, p)$ , para um $m$ -dimensional vector $p$ com $\sum_i p_i = 1$ e $\sum_i X_i = n$ , que;

X \overset{d}{\to} \sqrt{n} diag (você) Q [\begin{matrix} Z_{1 1} \\ ⋮ \\ Z_{m - 1 1} \\ 0 0 \end{matrix}] + [\begin{matrix} n p_{1 1} \\ ⋮ \\ n p_{m} \end{matrix}],

$X \xrightarrow{d} \sqrt{n} \, \text{diag}(u) \, Q \begin{bmatrix} Z_1 \\ \vdots \\ Z_{m-1} \\ 0 \end{bmatrix} + \begin{bmatrix} n p_1 \\ \vdots \\ n p_m \end{bmatrix},$

para $n$ grande , dado;

um vetor $u$ com $u_i = \sqrt{p_i}$ ;
aleatória variáveis $Z_i \sim N(0,1)$ para $i = 1, \ldots, m-1$ , e;
uma matriz ortogonal $Q$ com a coluna final $u$ .

Ou seja, com alguns rearranjos, podemos calcular uma distribuição normal multivariada $m-1$ dimensional para os primeiros componentes $m-1$ de $X$ (que são os únicos componentes interessantes porque $X_m$ é a soma dos outros).

Um valor adequado da matriz $Q$ é $I - 2 v v^T$ com $v_i = (\delta_{im} - u_i) / \sqrt{2(1 - u_m)}$ - ou seja, uma transformação particular do Proprietário.

Se restringirmos o lado esquerdo para o primeiro $m-1$ linhas, e restringir $Q$ ao seu primeiro $m-1$ linhas e $m-1$ colunas (denotar estas e , respectivamente) em seguida: $\hat{X}$ $\hat{Q}$

\hat{X} \overset{d}{\to} \sqrt{n} diag (\hat{você}) \hat{Q} [\begin{matrix} Z_{1 1} \\ ⋮ \\ Z_{m - 1 1} \end{matrix}] + [\begin{matrix} n p_{1 1} \\ ⋮ \\ n p_{m - 1 1} \end{matrix}] \sim N (μ, n Σ),

$\hat{X} \xrightarrow{d} \sqrt{n} \text{diag}(\hat{u}) \hat{Q} \begin{bmatrix} Z_1 \\ \vdots \\ Z_{m-1} \end{bmatrix} + \begin{bmatrix} n p_1 \\ \vdots \\ n p_{m-1} \end{bmatrix} \sim \mathcal{N} \left( \mu, n \Sigma \right),$

para $n$ grande , onde;

$\hat{u}$ indica o primeiro $m-1$ termos de $u$ ;
a média é $\mu = [ n p_1, \ldots, n p_{m-1}]^T$ , e;
a matriz de covariância $n \Sigma = n A A^T$ com $A = \text{diag}( \hat{u} ) \hat{Q}$ .

O lado direito dessa equação final é a densidade não degenerada usada no cálculo.

Como esperado, quando você conecta tudo, obtém a seguinte matriz de covariância:

(n Σ)_{Eu j} = n \sqrt{p_{Eu} p_{j}} (δ_{Eu j} - \sqrt{p_{Eu} p_{j}})

$(n\Sigma)_{ij} = n \sqrt{p_i p_j} (\delta_{ij} - \sqrt{p_i p_j})$

para $i,j = 1, \ldots, m-1$ , que é exatamente a matriz de covariância na resposta original restrita às suas primeiras $m-1$ linhas e $m-1$ colunas.

Esta entrada do blog foi o meu ponto de partida.

— stephematician
fonte

Outro recurso útil são os links fornecidos em: stats.stackexchange.com/questions/2397/…

— stephematician

Boa resposta (+1) --- Observe que você pode incorporar links com a sintaxe [textual description](hyperlink). Tomei a liberdade de editar esta resposta para incorporar seus links.

— Ben - Restabelece Monica