Preciso ajustar uma distribuição gaussiana generalizada a uma nuvem de pontos de 7 dim contendo um número bastante significativo de outliers com alta alavancagem. Você conhece algum bom pacote R para este trabalho?
Preciso ajustar uma distribuição gaussiana generalizada a uma nuvem de pontos de 7 dim contendo um número bastante significativo de outliers com alta alavancagem. Você conhece algum bom pacote R para este trabalho?
Respostas:
Também há mclust: http://www.stat.washington.edu/research/reports/2012/tr597.pdf http://cran.r-project.org/web/packages/mclust/index.html
Porém, é preciso ter cuidado: a modelagem de mistura no espaço de alta dimensão pode consumir bastante CPU e memória, se a sua nuvem de pontos for grande. Cerca de quatro anos atrás, eu estava fazendo um lote de dados de pontos de dimensão 11 a 50-200K, e ele tendia a rodar em 4-11 GB de RAM e levava até uma semana para calcular cada caso (e eu tinha 400). Isso certamente é possível, mas pode ser uma dor de cabeça se você estiver usando um cluster de computação compartilhado ou tiver recursos limitados disponíveis.
Isso soa como um modelo gaussiano clássico de mistura multivariada. Eu acho que o pacote BayesM pode funcionar.
Aqui estão alguns pacotes de misturas gaussianas multivariadas