(A resposta abaixo apenas introduz e declara o teorema comprovado em [0]. A beleza desse artigo é que a maioria dos argumentos é feita em termos de álgebra linear básica. Para responder a essa pergunta, basta dizer os principais resultados, mas por todos os meios, verifique a fonte original).
Em qualquer situação em que o padrão multivariado dos dados possa ser descrito por uma distribuição elíptica k variável, a inferência estatística reduzirá, por definição, o problema de ajustar (e caracterizar) um vetor de localização variável k (digamos ) e um por simétrica matriz definida semi-positivo (dizer ) para os dados. Por razões que explico abaixo (mas que você já assume como premissas), muitas vezes será mais significativo decompor em um componente de forma (uma matriz SPSD do mesmo tamanho quek k Σ Σ Σ σ SθkkΣΣΣ) responsável pelo formato dos contornos de densidade da sua distribuição multivariada e um escalar que expressa a escala desses contornos.σS
Nos dados univariados ( ), , a matriz de covariância de seus dados é escalar e, como se segue na discussão abaixo, o componente de forma de é 1, para que seja igual a seu componente de escala sempre e nenhuma ambiguidade é possível.Σ Σ Σ Σ = σ Sk=1ΣΣΣΣ=σS
Em dados multivariados, muitas opções de funções de escala são possíveis. Um em particular ( ) se destaca por ter uma propriedade chave desejável. Isso deve torná-lo a escolha preferida do fator de escala no contexto das famílias elípticas.σ S = | ΣσSσS=|ΣΣ|1/k
Muitos problemas nas estatísticas de MV envolvem a estimativa de uma matriz de dispersão, definida como uma função (al)
semi-positiva simétrica definida em e satisfatória:R k × kΣRk×k
A b
(0)Σ(AX+b)=AΣ(X)A⊤
(para matrizes não singulares e vectors ). Por exemplo, a estimativa clássica de covariância satisfaz (0), mas não é de forma alguma a única.
Ab
Na presença de dados elípticos distribuídos, em que todos os contornos de densidade são elipses definidos pela mesma matriz de forma, até a multiplicação por um escalar, é natural considerar versões normalizadas de da forma:Σ
VS=Σ/S(Σ)
em que é uma função 1-honógena que satisfaz:S
(1)S(λΣ)=λS(Σ)
para todos . Então, é chamado o componente de forma da matriz de dispersão (na matriz de formas curtas) e é chamado de componente de escala da matriz de dispersão. Exemplos de problemas de estimativa multivariada em que a função de perda depende apenas de através de seu componente de forma incluem testes de esfericidade, PCA e CCA, entre outros.V S σ S = S 1 / 2 ( Σ ) Σ V Sλ>0VSσS=S1/2(Σ)ΣVS
Obviamente, existem muitas funções de dimensionamento possíveis, de modo que isso ainda deixa em aberto a questão de qual (se houver) dentre várias opções da função de normalização é, em certo sentido, ideal. Por exemplo:S
- S=tr(Σ)/k (por exemplo, o proposto por @amoeba em seu comentário abaixo da pergunta do OP. Veja também [1], [2], [3])
- S=|Σ|1/k ([4], [5], [6], [7], [8])
- Σ11 (a primeira entrada da matriz de covariância)
- Σλ1(Σ) (o primeiro valor próprio de )Σ
No entanto, é a única função de dimensionamento para a qual a matriz Fisher Information para as estimativas correspondentes de escala e forma, em famílias localmente assintoticamente normais, é diagonal de bloco (que é a escala e os componentes de forma do problema de estimativa são assintoticamente ortogonais) [0]. Isso significa, entre outras coisas, que a escala funcional é a única opção de para a qual a não especificação de não causa perda de eficiência ao executar inferência em . S = | Σ | 1 / k S σ S V SS=|Σ|1/kS=|Σ|1/kSσSVS
Não conheço nenhuma caracterização de otimalidade comparativamente forte para qualquer uma das muitas opções possíveis de que satisfazem (1).S
- [0] Paindaveine, D., Uma definição canônica de forma, Statistics & Probability Letters, Volume 78, Edição 14, 1 de outubro de 2008, páginas 2240-2247. Link não bloqueado
- [1] Dumbgen, L. (1998). No M-funcional de dispersão de Tyler em alta dimensão, Ann. Inst. Statist. Matemática. 50, 471–491.
- [2] Ollila, E., TP Hettmansperger e H. Oja (2004). Métodos de sinais multivariados equivalentes afins. Preprint, Universidade de Jyvaskyla.
- [3] Tyler, DE (1983). Propriedades de robustez e eficiência de matrizes de dispersão, Biometrika 70, 411–420.
- [4] Dumbgen, L. e DE Tyler (2005). Nas propriedades de detalhamento de alguns M-Functionals multivariados, Scand. J. Statist. 32, 247-264.
- [5] Hallin, M. e D. Paindaveine (2008). Testes ótimos baseados em classificação para homogeneidade de dispersão, Ann. Statist., Para aparecer.
- [6] Salibian-Barrera, M., S. Van Aelst e G. Willems (200 6). Análise de componentes principais baseada em estimadores MM multivariados com bootstrap rápido e robusto, J. Amer. Statist. Assoc. 101, 1198–1211.
- [7] Taskinen, S., C. Croux, A. Kankainen, E. Ollila e H. O ja (2006). Funções de influência e eficiências da correlação canônica e estimativas de vetores com base em matrizes de dispersão e forma, J. Multivariate Anal. 97, 359-384.
- [8] Tatsuoka, KS e DE Tyler (2000). Sobre a singularidade de S-Funcionais e M-funcionais em distribuições não elípticas, Ann. Statist. 28, 1219-1243.