Aqui está minha velha pergunta
Gostaria de perguntar se alguém sabe a diferença (se houver alguma diferença) entre os modelos Hidden Markov (HMM) e Particle Filter (PF) e, como conseqüência, o Kalman Filter, ou em quais circunstâncias usamos qual algoritmo. Sou estudante e tenho que fazer um projeto, mas primeiro tenho que entender algumas coisas.
Portanto, de acordo com a bibliografia, ambos são modelos de espaço de estado , incluindo estados ocultos (ou latentes ou não observados). De acordo com a Wikipedia (Hidden_Markov_model) "no HMM, o espaço de estado das variáveis ocultas é discreto, enquanto as próprias observações podem ser discretas (geralmente geradas a partir de uma distribuição categórica) ou contínuas (normalmente a partir de uma distribuição gaussiana). Os modelos ocultos de Markov também podem ser generalizados para permitir espaços de estado contínuos. Exemplos de tais modelos são aqueles em que o processo de Markov sobre variáveis ocultas é um sistema dinâmico linear, com uma relação linear entre variáveis relacionadas e onde todas as variáveis ocultas e observadas seguem uma distribuição gaussiana. Em casos simples, como o sistema dinâmico linear mencionado acima, a inferência exata é tratável (nesse caso, usando o filtro Kalman); no entanto, em geral, a inferência exata em HMMs com variáveis latentes contínuas é inviável e métodos aproximados devem ser usados,"
Mas para mim isso é um pouco confuso ... Em palavras simples, isso significa o seguinte (com base também em mais pesquisas que eu fiz):
- No HMM, o espaço de estado pode ser discreto ou contínuo . Além disso, as próprias observações podem ser discretas ou contínuas . O HMM também é um sistema dinâmico linear e gaussiano ou não gaussiano.
- No PF, o espaço de estado pode ser discreto ou contínuo . Além disso, as próprias observações podem ser discretas ou contínuas . Mas PF é um sistema dinâmico não linear (e não gaussiano?) (Essa é a diferença deles?).
- O filtro Kalman (também me parece o mesmo com o HMM) está sendo usado quando temos um sistema dinâmico linear e gaussiano .
Também como eu sei qual algoritmo escolher, porque para mim tudo isso parece o mesmo ... Também encontrei um artigo (não em inglês) que diz que o PF pode ter dados lineares (por exemplo, dados brutos de um sensor-kinect que reconhece um movimento), o sistema dinâmico pode ser não linear. Isso pode acontecer? Isso está correto? Quão?
Para o reconhecimento de gestos, os pesquisadores podem usar o HMM ou o PF, mas não explicam por que selecionam cada algoritmo ... Alguém sabe como posso ajudar a distinguir esses algoritmos, a entender suas diferenças e a escolher o melhor algoritmo?
Sinto muito se minha pergunta é muito grande ou se algumas partes são ingênuas, mas não encontrei em algum lugar uma resposta convincente e científica. Muito obrigado antecipadamente pelo seu tempo!
Aqui está a minha nova pergunta (de acordo com a ajuda do @ conjugateprior)
Portanto, com uma leitura mais aprofundada, eu gostaria de atualizar algumas das minhas partes do meu comentário anterior e ter certeza de que entendi um pouco mais o que está acontecendo.
- Novamente, em palavras simples, o guarda-chuva são as redes Bayesianas Dinâmicas sob as quais os modelos de HMM e espaço de Estado estão incluídos (subclasses) ( http://mlg.eng.cam.ac.uk/zoubin/papers/ijprai.pdf ).
- Além disso, a diferença inicial entre os dois modelos é que, no HMM, as variáveis de estado oculto são discretas , enquanto as observações podem ser discretas ou contínuas . Em PF, as variáveis de estado oculto são contínuas (vetor de estado oculto com valor real) e as observações têm distribuições gaussianas .
- Também de acordo com @conjugateprior, cada modelo tem as 3 tarefas a seguir: filtragem, suavização e previsão. Na filtragem, o modelo HMM usa para variáveis de estado oculto discretas o método Algoritmo Forward, espaço de estado usa para variáveis contínuas e sistema dinâmico linear o Kalman Filter, etc.
- No entanto, o HMM também pode ser generalizado para permitir espaços de estado contínuos .
- Com essas extensões do HMM, os dois modelos parecem conceitualmente idênticos (como também é mencionado em Modelo de Markov oculto versus Modelo de transição de Markov versus Modelo de espaço de estado ...? ).
Eu acho que estou usando um pouco mais precisa a terminologia, mas ainda está tudo embaçado para mim. Alguém pode me explicar qual é a diferença entre o HMM e o modelo State Space ?
Porque realmente não consigo encontrar uma resposta que atenda às minhas necessidades.
Obrigado mais uma vez!