Método 1: Comparando lançamentos de moeda dupla e única como duas variáveis binomiais distribuídas (tendenciosas)
Diga que você vira n vezes ambos com kn vezes cabeças duplas, e você vira m vezes o primeiro com kmvezes as cabeças. Os pesos desconhecidosθ1 1 e θ2 pode ser estimado pela estimativa de probabilidade máxima:
A probabilidade condicional é
P(kn,km|θ1 1,θ2) = (nkn) (mkm)θkn1 1( 1 -θ1 1)n -kn(θ1 1θ2)km( 1 -θ1 1θ2)n -km
Probabilidade de log (e eliminação dos coeficientes binomiais):
logL(θ1,θ2)=knlog(θ1)+(n−kn)log(1−θ1)+kmlog(θ1θ2)+(m−km)log(1−θ1θ2)
Derivados
∂logL(θ1,θ2)∂θ1=knθ1−n−kn1−θ1+kmθ1−θ2m−km1−θ1θ2
∂logL(θ1,θ2)∂θ2=kmθ2−θ1m−km1−θ1θ2
Qual é zero para
θ1=knn
e θ2=kmmnkn
Essa estimativa tem algum viés. Usando simulação, encontrei o valor esperadoE(θ2)>θ2
(e tecnicamente o valor esperado é infinito devido à pequena possibilidade de kn=0 mas você pode adicionar uma regra de parada que impede knde ser zero. Desde akm<kn de qualquer forma, não acredito que isso introduz muito viés, se é que existe)
Método 2: Executando lançamentos de moedas duplas com número de tentativas, dependendo da quantidade de lançamentos necessários para obter k cabeças em lançamentos de moedas únicas (imparciais?)
Você joga a primeira moeda até conseguir k sucesso e conte o número X que você precisa virar.
Então você joga as duas moedas várias vezes n vezes X e conte o número Y que ambas as moedas pousam cabeças.
Intuitivamente, eu diria θ2=Ynk é um estimador imparcial (com um aspecto negativo que θ2pode estar acima de 1). A simulação abaixo parece mostrar que existe apenas um pequeno viés (também a variação / erro é menor em comparação com o primeiro método com quantidade semelhante de lançamentos de moedas). Você precisaria calcular a distribuição conjugada para a variávelY para ver se não há viés.
k=50
p1=0.5
p2=0.5
n=10
X <- rnbinom(10000,k,p1)+k
Y <- rbinom(10000,X*n,p1*p2)
mean(Y/k/n-p2)
var(Y/k/n)
plot(hist(Y/k/n))