Aprendizado supervisionado
- 1) Um humano constrói um classificador com base na entrada e saída de dados
- 2) Esse classificador é treinado com um conjunto de dados de treinamento
- 3) Esse classificador é testado com um conjunto de dados de teste
- 4) Implantação se a saída for satisfatória
Para ser usado quando: "Eu sei como classificar esses dados, só preciso que você (o classificador) os classifique".
Ponto do método: Classificar rótulos ou produzir números reais
Aprendizagem não supervisionada
- 1) Um humano constrói um algoritmo com base nos dados de entrada
- 2) Esse algoritmo é testado com um conjunto de dados de teste (no qual o algoritmo cria o classificador)
- 3) Implantação se o classificador for satisfatório
Para ser usado quando "Não faço ideia de como classificar esses dados, você (o algoritmo) pode criar um classificador para mim?"
Ponto do método: classificar rótulos ou prever (PDF)
Aprendizagem por reforço
- 1) Um humano constrói um algoritmo com base nos dados de entrada
- 2) Esse algoritmo apresenta um estado dependente dos dados de entrada nos quais um usuário recompensa ou pune o algoritmo através da ação que o algoritmo executou, isso continua ao longo do tempo
- 3) Esse algoritmo aprende com a recompensa / punição e se atualiza, isso continua
- 4) Está sempre em produção, precisa aprender dados reais para poder apresentar ações dos estados
Para ser usado quando: "Eu não tenho idéia de como classificar esses dados, você pode classificá-los e eu darei uma recompensa se estiver correta ou punirei você se não estiver".
É esse o tipo de fluxo dessas práticas, ouço muito sobre o que elas fazem, mas as informações práticas e exemplares são terrivelmente pequenas!