Estou tentando separar dois grupos de valores de um único conjunto de dados. Eu posso assumir que uma das populações está normalmente distribuída e tem pelo menos metade do tamanho da amostra. Os valores do segundo são mais baixos ou mais altos que os valores do primeiro (a distribuição é desconhecida). O que estou tentando fazer é encontrar os limites superior e inferior que encerrariam a população normalmente distribuída da outra.
Minha suposição me fornece um ponto de partida:
- todos os pontos dentro da faixa interquartil da amostra são da população normalmente distribuída.
Estou tentando testar se os outliers os tiram do restante da amostra até que eles não se encaixem no 3º.dev da população normalmente distribuída. O que não é o ideal, mas parece produzir resultados razoáveis o suficiente.
Minha suposição é estatisticamente correta? Qual seria a melhor maneira de fazer isso?
ps por favor corrija as tags alguém.