Por que os estatísticos definiram matrizes aleatórias?


18

Estudei matemática há uma década, por isso tenho um histórico em matemática e estatísticas, mas essa pergunta está me matando.

Essa pergunta ainda é um pouco filosófica para mim. Por que os estatísticos desenvolveram todo tipo de técnicas para trabalhar com matrizes aleatórias? Quero dizer, um vetor aleatório não resolveu o problema? Caso contrário, qual é a média das diferentes colunas de uma matriz aleatória? Anderson (2003, Wiley) considera um vetor aleatório um caso especial de uma matriz aleatória com apenas uma coluna.

Não vejo sentido em ter matrizes aleatórias (e tenho certeza que é porque sou ignorante). Mas, tenha paciência comigo. Imagine que eu tenho um modelo com 20 variáveis ​​aleatórias. Se eu quiser calcular a função de probabilidade conjunta, por que devo imaginá-las como uma matriz em vez de um vetor?

o que estou perdendo?

ps: desculpe-me pela pergunta mal marcada, mas não havia tags para matriz aleatória e ainda não posso criar uma!

editar: matriz alterada para matrizes no título


1
Eu acho que você está bem conceitualmente pensando nisso como um vetor aleatório que foi reorganizado para que seja matriz.
Matthew Gunn


9
Você também pode perguntar por que as matrizes têm algum interesse. É perfeitamente natural ver aleatoriamente qualquer matriz usada para representar um fenômeno observado ou medido no mundo real. Isso resulta em uma infinidade de possíveis tipos e modelos de matrizes aleatórias, variando de matrizes de adjacência de gráficos aleatórios a matrizes de covariância de amostra e muito mais.
whuber

2
@ Aksakal Acho que o ponto do OP é quando é útil analisar algo como matrizes aleatórias. por exemplo, na classificação de imagens, você normalmente transforma suas matrizes de imagens em vetores. não há uma 'análise' de matriz. portanto, o comentário de whuber é a melhor resposta até agora: por exemplo, uma matriz de covariância deve ser semi-definida positiva - se você deseja simular matrizes aleatórias de covariância, é mais fácil trabalhar com uma especificação de matriz do que com um vetor.
precisa saber é o seguinte

2
Matrizes aleatórias são apenas um caso especial de tensores aleatórios.
Anony-Mousse - Reinstala Monica

Respostas:


23

Depende de qual campo você está, mas um dos grandes incentivos iniciais para o estudo de matrizes aleatórias surgiu da física atômica e foi pioneiro por Wigner. Você pode encontrar uma breve visão geral aqui . Especificamente, foram os autovalores (que são níveis de energia na física atômica) de matrizes aleatórias que geraram toneladas de interesse, porque as correlações entre os autovalores deram uma ideia do espectro de emissão dos processos de decaimento nuclear.

Mais recentemente, houve um grande ressurgimento nesse campo, com o advento da (s) distribuição (ões) Tracy-Widom para os maiores autovalores de matrizes aleatórias, além de conexões impressionantes com campos aparentemente não relacionados, como teoria da telha , física estatística, integrável sistemas , fenômenos KPZ , combinatória aleatória e até a hipótese de Riemann . Você pode encontrar mais alguns exemplos aqui .

Para mais exemplos práticos, uma pergunta natural a ser feita sobre uma matriz de vetores de linha é como podem ser os componentes do PCA. Você pode obter estimativas heurísticas assumindo que os dados provêm de alguma distribuição e analisando os autovalores da matriz de covariância, que serão previstos a partir da universalidade aleatória da matriz : independentemente (dentro do razoável) da distribuição de seus vetores, a distribuição limitadora do autovalores sempre abordarão um conjunto de classes conhecidas. Você pode pensar nisso como um tipo de CLT para matrizes aleatórias. Veja este documento para exemplos.


Obrigado pela sua resposta. Eu suspeitava que pudesse estar relacionado a alguns aspectos matemáticos. Mas agora tudo faz sentido, a física sempre esteve em torno da matemática e o contrário também.
Eduardo

De Wigner papel foi em meados dos anos 1950, de Wishart papel foi no final de 1920. Então, é difícil afirmar que Wigner deu o primeiro grande empurrão, na minha opinião.
Aksakal

13

Você parece confortável com aplicações de vetores aleatórios. Por exemplo, eu lido com esse tipo de vetores aleatórios todos os dias: taxas de juros de diferentes tenores. O Federal Reserve Bank possui a série H15 , observe as letras do Tesouro por 4 semanas, 3 meses, 6 meses e 1 ano. Você pode pensar nessas 4 taxas como um vetor com 4 elementos. Também é aleatório, veja os valores históricos na trama abaixo.

insira a descrição da imagem aqui

Como qualquer número aleatório, podemos nos perguntar: qual é a covariância entre eles? Agora você obtém matriz de covariância 4x4. Se você o estimar em dados diários de um mês, obtém 12 matrizes de covariância diferentes a cada ano, se desejar que elas não se sobreponham. A matriz de covariância de amostra de séries aleatórias é, ela própria, um objeto aleatório, consulte o artigo de Wishart "A DISTRIBUIÇÃO DE MOMENTOS DE PRODUTOS GERALIZADOS EM AMOSTRAS DE UMA POPULAÇÃO NORMAL MULTIVARIADA". aqui . Há uma distribuição chamada depois dele.

Essa é uma maneira de obter matrizes aleatórias. Não é de admirar que a teoria da matriz aleatória (RMT) seja usada em finanças, como você pode ver agora.


1
Você mencionou a estimativa em "dados de um mês", quer dizer "dados diários de um mês"?
John

1
@ John, neste exemplo em particular, sim, diariamente. No entanto, algumas séries são medidas intra-dia, como preços de ações. Se você possui um portfólio de ações, pode obter matrizes de covariância intra-dia em frequências muito altas.
Aksakal

3
+1. Parafraseando aqui, mas acho que uma maneira de motivar matrizes aleatórias é que, nesses casos, estamos frequentemente interessados ​​na relação entre (e não apenas dentro) vetores aleatórios. Isso naturalmente motiva o pensamento sobre matrizes em vez de vetores.
Cliff AB

@Aksakal Os dados que você menciona vêm com frequência mensal e diária. Achei confuso antes de você revisar o post, porque não faria sentido estimar uma matriz de covariância usando um mês de dados mensais.
John John

@ John, você pode estimar a matriz de covariância em dados mensais ou semanais, sobrepostos ou não sobrepostos, etc. Não existe uma maneira correta de fazer isso.
Aksakal

8

Na física teórica, matrizes aleatórias desempenham um papel importante na compreensão de características universais de espectros de energia de sistemas com simetrias específicas.

Minha formação em física teórica pode me levar a apresentar um ponto de vista um pouco tendencioso aqui, mas eu até sugeriria que a popularidade da teoria da matriz aleatória (TMR) se originou de sua aplicação bem-sucedida na física.

Sem entrar muito em detalhes, por exemplo, os espectros de energia na mecânica quântica podem ser obtidos calculando valores próprios dos sistemas hamiltonianos - que podem ser expressos como uma matriz eremita. Frequentemente, os físicos não estão interessados ​​em sistemas específicos, mas querem saber quais são as propriedades gerais dos sistemas quânticos que têm propriedades caóticas, o que leva os valores da matriz hamiltoniana hermitiana a preencher o espaço da matriz ergodicamente com a variação da energia ou outros parâmetros ( por exemplo, condições de contorno). Isso motiva o tratamento de uma classe de sistemas físicos como matrizes aleatórias e a observação das propriedades médias desses sistemas. Eu recomendo literatura sobre a conjectura de Bohigas-Gianonni-Schmidt, se você quiser aprofundar-se nisso.

Em resumo, pode-se, por exemplo, mostrar que os níveis de energia de sistemas que possuem simetria de reversão de tempo se comportam universalmente diferentes dos níveis de energia de sistemas que não possuem simetria de reversão de tempo (o que ocorre, por exemplo, se você adicionar um campo magnético). De fato, um cálculo bastante curto usando matrizes aleatórias gaussianas pode mostrar que os níveis de energia tendem a ser diferentemente próximos nos dois sistemas.

Esses resultados podem ser ampliados e ajudaram a entender também outras simetrias, que tiveram um grande impacto em diferentes campos, como também a física de partículas ou a teoria do transporte mesoscópico e, posteriormente, até nos mercados financeiros.


1
é por isso que eu parei de física :) muito "danos cerebrais"
Aksakal

Estatísticos como Wishart estavam antes dos físicos atômicos.
Kjetil b halvorsen

5

Um mapa linear é um mapa entre os espaços vetoriais. Suponha que você tenha um mapa linear e tenha escolhido bases para seus domínios e espaços de intervalo. Então você pode escrever uma matriz que codifica o mapa linear. Se você deseja considerar mapas lineares aleatórios entre esses dois espaços, deve apresentar uma teoria das matrizes aleatórias. A projeção aleatória é um exemplo simples disso.

Além disso, existem objetos com valor de matriz / tensor na física. O tensor viscoso de estresse é um desses (entre um verdadeiro zoológico). Em materiais viscoelásticos quase homogêneos, pode ser útil modelar as deformações (elásticas, viscosas, et al.) E, portanto, as tensões pontuais como um tensor aleatório com pequena variação. Embora exista um sentido de "mapa linear" para esse estresse / deformação, é mais honesto descrever essa aplicação de matrizes aleatórias como algo aleatório que já era uma matriz.


4

A detecção compressiva como uma aplicação no processamento de imagens depende de matrizes aleatórias como medidas combinadas de um sinal 2D. Propriedades específicas dessas matrizes, ou seja, coerência , são definidas para essas matrizes e desempenham um papel na teoria.

Muito simplificado, verifica-se que a minimização da norma L1 de um determinado produto de uma matriz gaussiana e um sinal de entrada esparso permitem recuperar muito mais informações do que se poderia esperar.

A pesquisa inicial mais notável nesta área que conheço é o trabalho da Rice University: http://dsp.rice.edu/research/compressive-sensing/random-matrices

A teoria dos produtos matriciais como "medidas de um sinal" remonta pelo menos até a Segunda Guerra Mundial. Como um ex-professor meu me contou, testar individualmente cada exército alistado por, digamos, sífilis, era um custo proibitivo. Misturar essas amostras de maneira sistemática (misturando partes de cada amostra de sangue e testando-as) reduziria o número de vezes que um teste precisava ser realizado. Isso pode ser modelado como um vetor binário aleatório multiplicado por uma matriz esparsa.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.