O Google está usando diferentes técnicas e algoritmos de aprendizado de máquina para treinamento e previsão. As estratégias para o aprendizado supervisionado em larga escala: 1. Subamostra 2. Paralelamente embaraçosamente alguns algoritmos 3. Descida gradiente distribuída 4. Voto por maioria 5. Mistura de parâmetros 6. Mistura de parâmetros iterativa
Eles devem treinar e prever o modelo com as diferentes técnicas de aprendizado de máquina e usando um algoritmo para decidir o melhor modelo e previsão a retornar.
- Subamostragem fornece desempenho inferior
- A mistura de parâmetros melhora, mas não é tão boa quanto todos os dados
- Algoritmos distribuídos retornam melhores classificadores mais rapidamente
- A mistura de parâmetros iterativos alcança todos os dados
Mas é claro que isso não está claro na documentação da API.