Como modelar uma moeda tendenciosa com viés variável no tempo?

Modelos de moedas tendenciosas normalmente têm um parâmetro . Uma maneira de estimar partir de uma série de empates é usar uma distribuição beta anterior e computar a distribuição posterior com probabilidade binomial. $\theta = P(\text{Head} | \theta)$ $\theta$

Nas minhas configurações, devido a algum processo físico estranho, minhas propriedades da moeda estão mudando lentamente e se torna uma função do tempo . Meus dados são um conjunto de empates ordenados, ou seja, . Posso considerar que tenho apenas um empate para cada em uma grade de tempo discreta e regular. $\theta$ $t$ $\{H,T,H,H,H,T,...\}$ $t$

Como você modelaria isso? Estou pensando em algo como um filtro Kalman adaptado ao fato de que a variável oculta é e mantendo a probabilidade binomial. O que eu poderia usar para modelar para manter a inferência tratável? $\theta$ $P(\theta(t+1)|\theta(t))$

Edite as seguintes respostas (obrigado!) : Gostaria de modelar como uma cadeia de Markov da ordem 1, como é feita nos filtros HMM ou Kalman. A única suposição que posso fazer é que é suave. Eu poderia escrever com um pequeno ruído gaussiano (idéia do filtro de Kalman), mas isso quebraria o requisito de que deve permanecer em . Seguindo a idéia de @J Dav, eu poderia usar uma função probit para mapear a linha real para , mas tenho a intuição de que isso daria uma solução não analítica. Uma distribuição beta com média $\theta(t)$ $\theta(t)$ $P(\theta(t+1)|\theta(t)) = \theta(t) + \epsilon$ $\epsilon$ $\theta$ $[0,1]$ $[0,1]$ $\theta(t)$ e uma variação maior poderia fazer o truque.

Estou fazendo essa pergunta, pois tenho a sensação de que esse problema é tão simples que deve ter sido estudado antes.

time-series bayesian kalman-filter

— repied2
fonte

Você pode obter uma estimativa se tiver um modelo de como a proporção de sucesso muda com o tempo. Muitos modelos diferentes funcionariam e as estimativas poderiam variar muito com base no modelo assumido. Não acho que a tratabilidade seja um critério prático para a escolha de um modelo. Gostaria de entender o processo e procurar um modelo que demonstre características que concordam com o comportamento que você espera.

— 22812 Michael R. Chernick

@ MichaelChernick: Obrigado. A única suposição que posso fazer é que está se movendo suavemente e lentamente. Além disso, a rastreabilidade é um critério importante, pois eu realmente quero estender a solução para casos multivariados com interdependências não triviais. Uma solução ideal seria analítica e forneceria atualizações 'online' das estimativas de parâmetros quando um novo dado chegar.

θ

$\theta$

— usar o seguinte comando

Você pode quantificar o que você quer dizer com " está se movendo de maneira suave e lenta?" Os números inteiros são discretos e existem funções suaves que assumem valores arbitrários nos números inteiros, o que significa que a suavidade não oferece restrições. Algumas noções de "lentamente" ainda não dão nenhuma restrição, enquanto outras o fazem.

θ

$\theta$

— Douglas Zare

Quão rápido é "lentamente", como uma mudança na probabilidade de 0,1 / unidade de tempo ou 0,001 ou ... E quanto tempo uma sequência que você espera ter? O intervalo é relativamente estreito (por exemplo, 0,2 - 0,4) ou se aproxima de (0,1)?

— 22412 jbowman

@DouglasZare Por 'suave', eu queria afirmar que E [θ_t + 1 | θ_t] = θ_t (ou muito próximo) e VAR (θ_t + 1 | θ_t) é pequeno. θ não está pulando (caso contrário, nada poderia ser feito realmente).

— repied2

Respostas:

Duvido que você possa criar um modelo com solução analítica, mas a inferência ainda pode ser tornada tratável usando as ferramentas certas, pois a estrutura de dependência do seu modelo é simples. Como pesquisador de aprendizado de máquina, eu preferiria usar o modelo a seguir, pois a inferência pode ser bastante eficiente usando a técnica de Propagação de Expectativas:

Deixe- ser o resultado de julgamento -ésimo. Vamos definir o parâmetro variável no tempo $X(t)$ $t$

$\eta(t+1) \sim \mathcal{N}(\eta(t), \tau^2)$ para . $t \geq 0$

Para vincular a , introduza variáveis latentes $\eta(t)$ $X(t)$

$Y(t) \sim \mathcal{N}(\eta(t), \beta^2)$ ,

e modelo a ser $X(t)$

$X(t) = 1$ se e caso contrário. Você pode realmente ignorar e marginalizá-los para apenas dizer , (com cdf de normal), mas a introdução de variáveis latentes facilita a inferência. Além disso, observe que em sua parametrização original . $Y(t) \geq 0$ $X(t) = 0$ $Y(t)$ $\mathbb{P}[X(t)=1] = \Phi(\eta(t)/\beta)$ $\Phi$ $\theta(t) = \eta(t)/\beta$

Se você estiver interessado em implementar o algoritmo de inferência, dê uma olhada neste artigo . Eles usam um modelo muito semelhante para que você possa adaptar facilmente o algoritmo. Para entender o EP, a página a seguir pode ser útil. Se você estiver interessado em seguir essa abordagem, me avise; Posso fornecer conselhos mais detalhados sobre como implementar o algoritmo de inferência.

— d_ijk_stra
fonte

Para elaborar meu comentário, um modelo como p (t) = p exp (-t) é um modelo simples e permite a estimativa de p (t) estimando p usando a estimativa de probabilidade máxima. Mas será que a probabilidade realmente decai exponencialmente. Esse modelo estaria claramente errado se você observar períodos com alta frequência de sucesso do que em períodos anteriores e posteriores. O comportamento oscilatório pode ser modelado como p (t) = p | sint |. Ambos os modelos são muito tratáveis e podem ser resolvidos com a máxima probabilidade, mas oferecem soluções muito diferentes. $_0$ $_0$ $_0$

— Michael R. Chernick
fonte

Parece que o OP está tentando modelar a probabilidade de sucesso no tempo , , como um processo markoviano, para não especificar alguma forma funcional para .

t

$t$

θ (t)

$\theta(t)$

θ (t)

$\theta(t)$

— Macro

@macro está certo, não sou capaz de fornecer uma forma paramétrica para , e isso não é desejável, pois essa função pode ser algo suave. Quero um modelo de Markov de ordem 1 semelhante a um modelo de Markov oculto ou a um filtro de Kalman, mas com uma variável oculta que aceite valores reais entre 0 e 1 e com uma probabilidade de Bernouilli.

t h e t a (t)

$theta(t)$

— repied2

@pierre Ok, antes da edição, parecia que você estava pensando em estimar o tempo que variava e estava sugerindo o HMM como uma abordagem possível. Eu não estava recomendando uma forma funcional para a forma como ela muda com t. Eu estava argumentando que, sem informações adicionais, muitos modelos de vários tipos poderiam ser construídos e meus dois exemplos foram para mostrar que, sem informações adicionais, as escolhas de modelos poderiam dar respostas muito diferentes. Por que você insistiria em um HMM? Se alguém trabalhou e ajustar seus dados porque a rejeitam porque é "não-analítica.

— Michael R. Chernick

Estou sugerindo que encontrar soluções convenientes não é o caminho para resolver problemas estatísticos práticos!

— 22912 Michael Jackson Chernick

@ MichaelChernick Por fim: gostaria de encontrar uma solução analítica, pois espero que este seja um problema conhecido e as pessoas tenham proposto uma solução analítica suficientemente flexível. Mas concordo com a nossa sugestão de que modelar a 'dinâmica real' é mais importante que o custo computacional em geral. Infelizmente isso é para big data e um algo lento será inútil :-(

— repied2

Sua probabilidade muda com mas como Michael disse, você não sabe como. linearmente ou não? Parece um problema de seleção de modelo em que sua probabilidade : $t$ $p$

$p=\Phi(g(t,\theta))$ pode depender de uma função altamente não linear . é apenas uma função delimitadora que garante entre 0 e 1 probabilidades. $g(t,\theta)$ $\Phi$

Uma abordagem exploratória simples seria tentar vários probits para com diferentes não lineares e executar uma seleção do modelo base nos Critérios de Informação padrão. $\Phi$ $g()$ $g()$

Para responder sua pergunta reeditada :

Como você disse, o uso do probit implicaria apenas soluções numéricas, mas você pode usar uma função logística:

Função logística: $P[\theta(t+1)] = \frac{1}{1+\exp{(\theta(t)+\epsilon)}}$

Linearizado por: $\log{\frac{P}{1-P}} = \theta(t)+\epsilon$

Não tenho certeza de como isso pode funcionar sob a abordagem de filtro Kalman, mas ainda acredito que uma especificação não linear como ou muitas outras sem um termo aleatório faça o trabalho. Como você pode ver, essa função é "smoth" no sentido de ser contínua e diferenciável. Infelizmente, adicionar geraria saltos da probabilidade resultante, o que é algo que você não deseja, então meu conselho seria remover . $\theta(t+1)=a t^3 +bt^2+ct + d$ $\epsilon$ $\epsilon$

Probabilidade de logit: $P[Coin_{t+1}=H | t] = \frac{1}{1+\exp{(\theta(t))}}$

Você já possui randomnes no evento bernoulli (cadeia de Markov) e está adicionando uma fonte adicional devido a . Assim, seu problema pode ser resolvido como um Probit ou Logit estimado por Máxima verossimilhança com como variável explicativa. Suponho que você concorda que essa parcimônia é muito importante. A menos que seu objetivo principal seja aplicar um determinado método (HMM e Kalman Filter) e não fornecer a solução válida mais simples para o seu problema. $\epsilon$ $t$

— JDav
fonte

Se você usar um probit, uma extensão multivariada é simples, pois um probit multivariado pode ser estimado. As dependências seriam implícitas pela matriz de covariância da distribuição normal multivariada implícita.

— JDav