Segundo meu entendimento, a distância de Cook mede a influência de cada observação excluindo pontos ao ajustar um modelo. Então, eu suponho que poderia ser uma abordagem razoável para detecção de outlier?
Minhas perguntas, suponha que os dados sejam categorizados em grupos, é possível usar a distância de Cook para detectar o grupo "outlier" em vez do ponto outlier? A distância de Cook é uma boa opção para medir a influência do grupo.
influence()
. Eu tenho outra pergunta sobre o limite. Como o 4 / N usual é "muito sensível", detecta valores extremos, enquanto eu me importo apenas com pontos / grupos influentes extremos. @jchaykow