Algoritmos de aprendizado de máquina para dados em painel


12

Nesta pergunta - Existe um método para construir árvores de decisão que leve em consideração preditores estruturados / hierárquicos / multiníveis? - eles mencionam um método de dados em painel para árvores.

Existem métodos de dados de painel específicos para dar suporte a máquinas vetoriais e redes neurais? Se sim, você poderia citar alguns documentos para os algoritmos e (se disponível) pacotes R implementando-o?


1
Eu queria saber o que você decidiu usar para isso? Tentando resolver um problema semelhante.
usar o seguinte comando

Respostas:


1

LSTM (memória de longo prazo) pode ser relevante para você. Esse tipo de modelo pode lidar com vários recursos em vários pontos no tempo, que devem caber nos dados do painel. Aqui está uma explicação muito boa sobre o conceito de LSTM, e aqui está um pacote que implementa uma versão R do LSTM.


0

Quando você possui dados do painel, há tarefas diferentes que você pode tentar resolver, por exemplo, classificação / regressão de séries temporais ou previsão do painel. E para cada tarefa, existem inúmeras abordagens para resolvê-lo.

Quando você deseja usar métodos de aprendizado de máquina para resolver previsões de painel, há várias abordagens:

Em relação aos dados de entrada (X), unidades de tratamento (por exemplo, países, indivíduos, etc.) como amostras de identificação, você pode

  • agrupar as séries temporais e tratar cada compartimento como uma coluna separada, ignorando qualquer ordem temporal, com compartimentos iguais para todas as unidades; o tamanho do compartimento pode, é claro, simplesmente ser a medição observada das séries temporais, ou você pode fazer um upsample e agregar em compartimentos maiores; use algoritmos padrão de aprendizado de máquina para dados tabulares,
  • ou extrair recursos da série temporal de cada unidade e usar cada recurso extraído como colunas separadas, novamente combinadas com algoritmos tabulares padrão,
  • ou use algoritmos especializados de regressão / classificação de séries temporais, dependendo de você observar dados de séries temporais contínuas ou categóricas, isso inclui máquinas de vetores de suporte com kernels especiais que comparam séries temporais com séries temporais.

Em relação aos dados de saída (y), se você desejar prever vários pontos no tempo no futuro, poderá

  • ajuste um estimador para cada etapa que você deseja prever, sempre usando os mesmos dados de entrada,
  • ou ajuste um estimador único para o primeiro passo à frente e na previsão, role os dados de entrada no tempo, usando as previsões do primeiro passo para anexar aos dados de entrada observados para fazer as previsões do segundo passo e assim por diante.

Todas as abordagens acima reduzem basicamente o problema de previsão do painel a um problema de regressão de séries temporais ou de regressão tabular. Depois que seus dados estiverem no formato de série temporal ou de regressão tabular, você também poderá anexar aos usuários recursos que não invariem no tempo.

É claro que existem outras opções para resolver o problema de previsão do painel, como, por exemplo, o uso de métodos clássicos de previsão, como o ARIMA, adaptados aos dados do painel ou métodos de aprendizado profundo que permitem fazer diretamente previsões de sequência em sequência.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.