Quais classificadores de aprendizado de máquina são os mais paralelizáveis? Se você tivesse um problema de classificação difícil, tempo limitado, mas uma LAN decente de computadores para trabalhar, com quais classificadores você tentaria?
Por um lado, parece-me com alguns classificadores padrão que eu conheço da pilha acima, mas posso estar totalmente errado:
Florestas aleatórias - Muito paralelizáveis, desde que cada máquina possa armazenar todos os dados (por exemplo, não é possível dividir os dados de treinamento por si só, mas de outra forma paralelizáveis).
Impulsionar -?
Máquina de vetores de suporte - Não é muito paralelizável.
Árvores de decisão - podem ser divididas em parte, mas não com muita eficiência.