Qual o significado dos vetores próprios de uma matriz de informação mútua?


14

Ao examinar os vetores próprios da matriz de covariância, obtemos as direções da variação máxima (o primeiro vetor próprio é a direção na qual os dados variam mais etc.); isso é chamado de análise de componentes principais (PCA).

Fiquei imaginando o que significaria olhar para os autovetores / valores da matriz de informações mútuas, eles apontariam na direção da entropia máxima?


4
Não sei, mas acabei de aprender que as matrizes de informações mútuas nem sempre são semi-definidas positivas: arxiv.org/abs/1307.6673 .
Ameba diz Reinstate Monica

3
Isso lembra algo em que trabalhamos: people.eng.unimelb.edu.au/baileyj/papers/frp0038-Vinh.pdf
Simone

Respostas:


3

Embora não seja uma resposta direta (como se trata de informações mútuas pontuais ), observe o artigo que relaciona o word2vec a uma decomposição de valor singular da matriz PMI:

Analisamos o skip-gram com amostragem negativa (SGNS), um método de incorporação de palavras introduzido por Mikolov et al., E mostramos que ele está fatorando implicitamente uma matriz de contexto de palavras, cujas células são as informações mútuas (PMI) dos respectivos pares de palavras e contextos, deslocados por uma constante global. Descobrimos que outro método de incorporação, NCE, está implicitamente fatorando uma matriz semelhante, em que cada célula é a probabilidade condicional de log (deslocada) de uma palavra, dado seu contexto. Mostramos que o uso de uma matriz de contexto de palavras PMI Shifted Positive PMI esparsa para representar palavras melhora os resultados em duas tarefas de similaridade de palavras e uma de duas tarefas de analogia. Quando vetores densos de baixa dimensão são preferidos, a fatoração exata com SVD pode obter soluções que são pelo menos tão boas quanto as soluções da SGNS para tarefas de similaridade de palavras. Em questões de analogia, o SGNS permanece superior ao SVD. Conjecturamos que isso decorre da natureza ponderada da fatoração do SGNS.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.