Pergunta: Com uma cadeia MCMC de 10 dimensões, digamos que estou preparado para entregar uma matriz dos sorteios: 100.000 iterações (linhas) por 10 parâmetros (colunas), qual a melhor forma de identificar os modos posteriores? Estou especialmente preocupado com vários modos.
Fundo:Eu me considero um estatístico computacionalmente experiente, mas quando um colega me fez essa pergunta, fiquei com vergonha de não conseguir encontrar uma resposta razoável. A principal preocupação é que vários modos possam aparecer, mas apenas se pelo menos oito das dez dimensões forem consideradas. Meu primeiro pensamento seria usar uma estimativa de densidade do kernel, mas uma pesquisa no R não revelou nada promissor para problemas maiores que três dimensões. O colega propôs uma estratégia ad-hoc de binning em dez dimensões e buscando um máximo, mas minha preocupação é que a largura de banda possa levar a problemas de escassez significativos ou à falta de resolução para discernir vários modos. Dito isso, eu aceitaria com prazer sugestões de sugestões automatizadas de largura de banda, links para um estimador de densidade de 10 kernel ou qualquer outra coisa que você conheça.
Preocupações:
Acreditamos que a distribuição pode estar bastante distorcida; portanto, desejamos identificar os modos posteriores e não os meios posteriores.
Estamos preocupados que possam existir vários modos posteriores.
Se possível, preferimos uma sugestão baseada em R. Mas qualquer algoritmo funcionará desde que não seja incrivelmente difícil de implementar. Acho que prefiro não implementar um estimador de densidade de kernel Nd com seleção automática de largura de banda a partir do zero.