Significado de recursos latentes?


15

Estou tentando entender os modelos de fatoração matricial para sistemas de recomendação e sempre leio 'recursos latentes', mas o que isso significa? Sei o que significa um recurso para um conjunto de dados de treinamento, mas não consigo entender a idéia de recursos latentes. Todo artigo sobre o assunto que encontro é superficial demais.

Editar:

se pelo menos você pode me apontar alguns papéis que explicam a idéia.


Aqui está um exemplo simples que pode ajudá-lo a quuxlabs.com/blog/2010/09/…
Akavall

Respostas:


9

Latente significa não diretamente observável. O uso comum do termo na Análise PCA e Fator é reduzir a dimensão de um grande número de recursos diretamente observáveis ​​em um conjunto menor de recursos indiretamente observáveis.


então as dimensões reduzidas são os recursos latentes? No caso do PCA, os vetores próprios da matriz de covariância, ou seja, os principais componentes, certo?
Jack Twain

@AlexTwain correta
samthebest

Você pode me fornecer um tutorial / artigo que mencione isso? Não consigo encontrar nenhum tutorial / artigo sistemático!
21430 Jack Twain

Bem, a página wiki é muito bom, você pode seguir as referências lá se você realmente quer en.wikipedia.org/wiki/Latent_variable
samthebest

1
@JackTwain, a analogia PCA correta é que os recursos latentes são os vetores próprios. Os componentes principais são os pesos atribuídos a cada observação para os principais vetores próprios. Em outros modelos de fatoração de matriz, os recursos latentes desempenham o papel dos vetores próprios. Isso pode parecer pedante, mas o erro não cria fim para a confusão das pessoas.
conjectures

3

No contexto do método de fatoração, os recursos latentes costumam caracterizar itens ao longo de cada dimensão. Deixe-me explicar pelo exemplo.

RRuipuTqipuuqii

puqi


Eu li artigos em que os recursos latentes (como o "vetor de usuário") são usados ​​para prever algumas variáveis-alvo, vamos usar o gênero como exemplo. Ele "funciona", pois um modelo preditivo pode ser construído dessa maneira. Minha pergunta é qual é a diferença entre o "vetor de usuário" e, digamos, a média dos "vetores de itens" para todos os itens que um usuário "visitou"? IOW, você esperaria que o modelo preditivo mencionado acima fosse melhor ou pior com um vs o outro? Obrigado (se você já viu isso).
precisa

@ thecity2, você pode calcular a média de itens do usuário, e isso pode ser útil quando você está lidando com recém-chegados para os quais você não possui vetores de usuário pré-computados (embora seja difícil executar algumas iterações de otimização para calculá-lo). Há também um problema com a média simples: quanto mais itens o usuário consumiu - mais perto de zero é provável que seu vetor de itens médio seja (por causa do regularizador L2 típico e talvez outras propriedades desagradáveis ​​dos espaços de alta dimensão). Por fim, ter um vetor separado é mais flexível: seu modelo pode aprender essa média.
Artem Sobolev

Dito isto, há tentativas de usar o histórico do usuário para modelar o vetor do usuário. Por exemplo, ver o documento "Construir a sua própria música Recommender modelando fluxos de rádio da Internet"
Artem Sobolev

0

Eu diria que os fatores são mais representativos que os principais componentes para obter uma percepção de 'latência' / ocultação de uma variável. A latência é uma das razões pelas quais os cientistas comportamentais medem construções perceptivas como sentimento, tristeza em termos de vários itens / medidas e derivam um número para variáveis ​​ocultas que não podem ser medidas diretamente.


0

Aqui, seus dados são classificações dadas por vários usuários a vários filmes. Como outros já apontaram, meios latentes não são diretamente observáveis.

Para um filme, seus recursos latentes determinam a quantidade de ação, romance, enredo, ator famoso etc. Da mesma forma, para outro conjunto de dados que consiste em dígitos manuscritos, as variáveis ​​latentes podem ser ângulo de arestas, inclinação, etc.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.