Encontrei muitos artigos que afirmam que os métodos de aumento são sensíveis a valores discrepantes, mas nenhum artigo explica o porquê.
Na minha experiência, os valores extremos são ruins para qualquer algoritmo de aprendizado de máquina, mas por que os métodos de aumento são particularmente sensíveis?
Como os seguintes algoritmos classificariam em termos de sensibilidade a outliers: árvore de impulso, floresta aleatória, rede neural, SVM e métodos de regressão simples, como regressão logística?