Preciso de classificação ou regressão para prever a disponibilidade de um usuário, considerando alguns recursos?


9

Ao estudar os métodos de mineração de dados, entendi que existem duas categorias principais:

  • Métodos preditivos:

    • Classificação
    • Regressão
  • Métodos descritivos:

    • Agrupamento
    • Regras de associação

Como desejo prever a disponibilidade (saída) do usuário com base no local, atividade, nível da bateria (entrada para o modelo de treinamento), acho óbvio que eu escolheria "Métodos preditivos", mas agora não consigo escolher entre classificação e regressão. Pelo que entendi até agora, a classificação pode resolver meu problema, porque a saída está "disponível" ou "não disponível".

A classificação pode me fornecer a probabilidade (ou probabilidade) de o usuário estar disponível ou não?

Como na saída, não seria apenas 0 (não disponível) ou 1 (disponível), mas será algo como:

  • 80% disponível
  • 20% não disponível

Esse problema também pode ser resolvido usando regressão?

8080%20%

Respostas:


6
  1. Sim. Por exemplo, a popular regressão softmax fornece distribuição de probabilidade para cada classe.
  2. Sim. Softmax é uma regressão sobre um conjunto de classes discretas.

Podemos usar regressão para classificação, a estratégia mais comum é pegar a classe mais provável para a previsão.


1

Sim, você pode usar classificação ou regressão de acordo com seus requisitos de saída,

Se você deseja uma saída rotulada, como disponível ou não, a classificação deve ser usada.

Se você deseja a saída na forma de% de disponibilidade, a regressão deve ser usada.


Você pode fazer backup disso com fontes de algum lugar?
Mithical

-1

Você pode usar a classificação ingênua de bayes e calcular probabilidades posteriores usando crenças anteriores ou a regressão logística pode ser usada com a função sigmóide.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.