Pacotes Python para trabalhar com modelos de mistura gaussianos (GMMs)


12

Parece haver várias opções disponíveis para trabalhar com GMMs (Gaussian Mixture Models) em Python. À primeira vista, existem pelo menos:

... e talvez outros. Todos eles parecem fornecer as necessidades mais básicas dos GMMs, incluindo criação e amostragem, estimativa de parâmetros, clustering etc.

Qual a diferença entre eles e como determinar qual é o mais adequado para uma necessidade específica?

Ref: http://www.scipy.org/Topical_Software


Você pode tentar criar um perfil de uma versão realmente simples da compactação de imagem usando GMMs. Dada uma imagem, use um GMM para atribuir probabilidades diferentes aos pixels e, em seguida, recrie a imagem usando as probabilidades como índices para o Gaussiano específico do qual é provável que um pixel específico tenha vindo.
Phillip Cloud

@cpcloud - Você quer dizer: configurar um experimento simplificado para executar em cada um desses pacotes, como um ponto de comparação? Bem, tudo bem, mas isso não é uma pequena quantidade de esforço. Espero algumas sugestões de pessoas que usaram esses pacotes.
Aman

2
O Scikit-learn é uma biblioteca popular de aprendizado de máquina que também possui algum suporte ao GMM. Não tenho certeza de que atenda às suas necessidades, mas tem o benefício de ter outros algoritmos e estrutura de aprendizado (por exemplo, validação cruzada, composição do modelo).
Bitwise

O PyPR e o PyEM estão disponíveis apenas para o Python 2 e não parecem mais estar em desenvolvimento ativo. PyMix parece a melhor escolha.
Josh Milthorpe 8/09/16

Respostas:


3

Não sei como determinar em geral qual é o melhor, mas se você conhece a configuração do seu aplicativo o suficiente, pode simular dados e experimentar os pacotes nessas simulações. As métricas de sucesso podem ser o tempo que a estimativa leva e a qualidade da recuperação de sua verdade básica simulada.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.