Esses termos são reunidos muito, mas eu gostaria de saber quais são as diferenças, se houver.
obrigado
Esses termos são reunidos muito, mas eu gostaria de saber quais são as diferenças, se houver.
obrigado
Respostas:
LSA e LSI são usados principalmente como sinônimos, com a comunidade de recuperação de informações geralmente se referindo a ela como LSI. O LSA / LSI usa SVD para decompor a matriz termo-documento A em uma matriz termo-conceito U, uma matriz de valor singular S e uma matriz conceito-documento V no formato: A = USV '. A página da wikipedia possui uma descrição detalhada da indexação semântica latente .
Notavelmente, enquanto o LSA e o LSI usam o SVD para fazer sua mágica, existe um método computacional e conceitualmente mais simples chamado HAL (Hyperspace Analogue to Language) que peneira o texto, acompanhando os contextos anteriores e subseqüentes. Os vetores são extraídos dessas matrizes de co-ocorrência (geralmente ponderadas) e palavras específicas são selecionadas para indexar o espaço semântico. De muitas maneiras, entendi que ele tem um desempenho tão bom quanto o LSA sem exigir a etapa matematicamente / conceitualmente complexa do SVD. Veja Lund & Burgess, 1996 para detalhes.
NMF e SVD são ambos algoritmos de fatoração de matriz. A Wikipedia tem algumas informações relevantes sobre NMF .
Os outros respondedores cobriram LSI / LSA ...