Recursos para aprender sobre técnicas de múltiplos alvos?


11

Estou procurando recursos (livros, anotações de aula etc.) sobre técnicas que podem lidar com dados que têm vários destinos (Ex: três variáveis ​​dependentes: 2 discretas e 1 contínua).

Alguém tem algum recurso / conhecimento sobre isso? Eu sei que é possível usar redes neurais para isso.

Respostas:


6

A floresta aleatória lida com isso muito bem, consulte Uma floresta aleatória com várias saídas seria possível / prática? ou a documentação do scikit learn . Eu acho que o GBM ou qualquer método baseado em árvore pode ser adaptado de maneira semelhante.

De maneira mais geral, quando você executa um algoritmo de aprendizado que minimiza uma pontuação, geralmente trabalha em minimizar que é unidimensional. Mas você pode especificar qualquer função de destino. Se você estivesse trabalhando na previsão de posição (bidimensional), seria uma boa métrica.Eu(pEu-yEu)2Eu(y^Eu-yEu)2+(x^Eu-xEu)2

Se você tiver uma saída de tipo misto (classificação e regressão), a especificação da função de destino provavelmente exigirá que você especifique uma função de destino que dê mais peso a alguns destinos do que outros: qual escala você aplica a respostas contínuas? Que perda você aplica a classificações erradas?

Quanto à leitura acadêmica adicional,

Wikipedia do SVM Structured Learning

Alavancagem simultânea de estruturas de saída e tarefa para regressão de saída múltipla

O método de seleção de pontos de referência para previsão de saída múltipla (lida com variáveis ​​dependentes de alta dimensão)


1
Dada a regressão multi-alvo também pretende modelar os relacionamentos entre os Ys, você não gostaria de uma função de perda que mede o ajuste desse relacionamento?
precisa saber é o seguinte

3

Este documento descreve bem os métodos atuais, kits de ferramentas disponíveis e conjuntos de dados para testar.

Por acaso, trabalhei em um problema comercial que requer regressão de vários destinos e descobri que o kit de ferramentas Clus tem uma boa combinação de alto desempenho e robustez

  • A documentação é excelente
  • O kit de ferramentas possui vários métodos para classificação e regressão multi-alvo
  • Ele também suporta indução e clustering baseados em regras.
  • Os modelos de ensemble (Bagging, RandomForest) que eu usei podem ser lidos e interpretados facilmente.

Alguns dos métodos mais recentes (pós-2012) foram implementados como uma extensão do kit de ferramentas Mulan, aqui está o link do Github . Embora esses métodos, como as combinações lineares aleatórias de alvos, relatem um desempenho melhor do que os modelos de conjunto, descobri que o kit de ferramentas não era tão maduro quanto o kit de ferramentas Clus e, portanto, não os usava.


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.