Como gerar uma quantidade não inteira de sucessos consecutivos em Bernoulli?

18

Dado:

Uma moeda com viés desconhecido $p$ (cabeça).
Um real estritamente positivo $a > 0$ .

Problema:

Gere uma variável aleatória de Bernoulli com viés . $p^{a}$

Alguém sabe como fazer isso? Por exemplo, quando é um número inteiro positivo, pode-se jogar a moeda vez e ver se todos os resultados foram Heads: se eles emitem '0', caso contrário, emitem '1'. A dificuldade está no fato de que não é necessariamente um número inteiro. Além disso, se eu soubesse o viés , poderia construir outra moeda com o viés desejado. $a$ $a$ $a$ $p$

sampling

— Pedro A. Ortega
fonte

2

@gung: Eu acho que o que se quer é um algoritmo para gerar uma variável de Bernoulli dada uma moeda.

— 22413 Neil G

1

Eu acho que o ponto aqui é que, quando

a > 1

$a>1$ só manter uma média de 1 de cada

a

$a$ cabeças que aparece e quando

a < 1

$a < 1$ , você duplicar cada uma das cabeças de uma média de

1 / a

$1/a$ vezes.

— Macro

3

@ Macro, você poderia expandir a ideia?

— Pedro A. Ortega

1

Caro Pedro, (+1) para o seu post, que é o tipo de pergunta que torna o CV muito revigorante e estimulante, pelo menos para mim. Eu poderia perguntar qual é a origem desta pergunta?

— cardeal

@ cardinal: Mais uma vez obrigado pela sua resposta! Esse problema faz parte de um amostrador para resolver problemas de controle estocástico em que estou trabalhando. A razão pela qual

é desconhecido é porque seria necessário conhecer a constante de normalização (que neste caso é uma função de partição desagradável), mas ainda podemos fazer amostragens usando a amostragem por rejeição. Btw, seria bom citar você pelo nome, não apenas o link para o CV ;-).

p

$p$

— Pedro A. Ortega

19

Podemos resolver isso através de alguns "truques" e um pouco de matemática.

Aqui está o algoritmo básico:

Gere uma variável aleatória geométrica com probabilidade de sucesso . $p$
O resultado dessa variável aleatória determina um valor conhecido fixo . $f_n \in [0,1]$
Gere uma variável aleatória usando lançamentos justos de moedas gerados a partir de lançamentos emparelhados em blocos da nossa moeda . $\mathrm{Ber}(f_n)$ $\mathrm{Ber}(p)$
O resultado resultante será para qualquer , que é tudo o que precisamos. $\mathrm{Ber}(p^a)$ $a \in (0,1)$

Para tornar as coisas mais digeríveis, vamos dividir as coisas em pedaços.

Peça 1 : Sem perda de generalidade, assuma que . $0 < a < 1$

Se , então podemos escrever para algum número inteiro positivo e algum . Mas, para quaisquer dois Bernoulli independentes, temos $a \geq 1$ $p^a = p^n p^b$ $n$ $0 \leq b < 1$ Podemos gerar um Bernoulli da nossa moeda na maneira óbvia. Portanto, precisamos nos preocupar apenas em gerar quando

P (X_{1} = X_{2} = 1) = p_{1} p_{2} .

$\renewcommand{\Pr}{\mathbb P} \Pr(X_1 = X_2 = 1) = p_1 p_2 \>.$

p^{n}

$p^n$

B e r (p^{a})

$\mathrm{Ber}(p^a)$

.

a \in (0, 1)

$a \in (0,1)$

Peça 2 : Saiba como gerar uma arbitráriapartir de lançamentos justos de moedas. $\mathrm{Ber}(q)$

Existe uma maneira padrão de fazer isso. Expanda em sua expansão binária e, em seguida, use nossos lançamentos justos para "combinar" os dígitos de . A primeira correspondência determina se declaramos um sucesso ("cara") ou falha ("coroa"). Se $q = 0.q_1 q_2 q_3 \ldots$ $q$ $q_n = 1$ e nossa moeda jogar for cara, declare cara, se e nossa moeda jogar for coroa, declare coroa. Caso contrário, considere o dígito subsequente contra um novo lançamento de moeda. $q_n = 0$

Peça 3 : Saiba como gerar uma troca de moedas justa com as injustas com viés desconhecido.

Isso é feito, assumindo , lançando a moeda em pares. Se conseguirmos , declarar uma cabeça; se conseguirmos $p \in (0,1)$ $HT$ $TH$ , declarar uma coroa e repetir o experimento até que um dos dois resultados mencionados ocorra. Eles são igualmente prováveis, então deve ter probabilidade . $1/2$

Peça 4 : Um pouco de matemática. (Taylor para o resgate.)

Ao expandir torno de , o teorema de Taylor afirma que $h(p) = p^a$ $p_0 = 1$ Note-se que porque , cada prazo após o primeiro énegativa, de modo que temos

p^{a} = 1 - a (1 - p) - \frac{a (1 - a)}{2!} (1 - p)^{2} - \frac{a (1 - a) (2 - a)}{3!} (1 - p)^{3} \dots .

$p^a = 1 - a(1-p) - \frac{a(1-a)}{2!} (1-p)^2 - \frac{a(1-a)(2-a)}{3!} (1-p)^3 \cdots \>.$

0 < a < 1

$0 < a < 1$

onde

são conhecidosa priori. Portanto onde,epara.

p^{a} = 1 - \sum_{n = 1}^{\infty} b_{n} (1 - p)^{n},

$p^a = 1 - \sum_{n=1}^\infty b_n (1-p)^n \>,$

0 \leq b_{n} \leq 1

$0 \leq b_n \leq 1$

1 - p^{a} = \sum_{n = 1}^{\infty} b_{n} (1 - p)^{n} = \sum_{n = 1}^{\infty} b_{n} P (G \geq n) = \sum_{n = 1}^{\infty} f_{n} P (G = n) = E f (G),

$1 - p^a = \sum_{n=1}^{\infty} b_n (1-p)^n = \sum_{n=1}^\infty b_n \Pr(G \geq n) = \sum_{n=1}^\infty f_n \Pr(G = n) = \mathbb E f(G),$

G \sim G e o m (p)

$G \sim \mathrm{Geom}(p)$

f_{0} = 0

$f_0 = 0$

f_{n} = \sum_{k = 1}^{n} b_{k}

$f_n = \sum_{k=1}^n b_k$

n \geq 1

$n \geq 1$

E já sabemos como usar nossa moeda para gerar uma variável aleatória geométrica com probabilidade de sucesso . $p$

Peça 5 : Um truque de Monte Carlo.

Seja uma variável aleatória discreta, levando valores em com . Deixe . Então $X$ $[0,1]$ $\Pr(X = x_n) = p_n$ $U \mid X \sim \mathrm{Ber}(X)$

P (U = 1) = \sum_{n} x_{n} p_{n} .

$\Pr(U = 1) = \sum_n x_n p_n.$

Mas, considerando e , vemos agora como gerar uma variável aleatória e isso é equivalente a gerar uma um. $p_n = p(1-p)^n$ $x_n = f_n$ $\mathrm{Ber}(1-p^a)$ $\mathrm{Ber}(p^a)$

— cardeal
fonte

Como posso citar você (ou sua solução)?

— Pedro A. Ortega

2

@ Pedro: Suponho que você pode clicar no link "compartilhar" na parte inferior desta resposta. Deve ser um link estável. O Math.SE possui um mecanismo de citação , que não parece estar ativado neste site, mas você pode adaptá-lo.

— cardeal

1

Agora, esta é uma resposta brilhante!

— Zen

1

Eu escrevi isso no fórum de discussão geral da classe Coursera sobre Analytic Combinatorics, já que esse era um bom uso de séries de poder relacionadas a alguns dos materiais abordados lá. class.coursera.org/introACpartI-001/forum/thread?thread_id=108

— Douglas Zare

@ Douglas: Obrigado! Existe uma versão publicamente visível desse segmento ou eu precisaria me inscrever no curso para vê-lo? Pedro e eu discutimos (via e-mail) possíveis caminhos para incluir essa abordagem em algumas de suas pesquisas.

— cardeal

6

A resposta a seguir é boba?

Se são independentes e tem distribuição , então será distribuído aproximadamente como , quando . $X_1,\dots,X_n$ $\mathrm{Ber}(p)$ $Y_n$ $\mathrm{Ber}\left(\left(\sum_{i=1}^n X_i/n \right)^a\right)$ $Y_n$ $\mathrm{Ber}(p^a)$ $n\to\infty$

Portanto, se você não conhece , mas pode jogá-la várias vezes, é possível obter amostras (aproximadamente) de um $p$ $\mathrm{Ber}(p^a)$ variável aleatória .

Exemplo RCódigo de :

n <- 1000000
p <- 1/3 # works for any 0 <= p <= 1
a <- 4
x <- rbinom(n, 1, p)
y <- rbinom(n, 1, mean(x)^a)
cat("p^a =", p^a, "\n")
cat("est =", mean(y))

Resultados:

p^a = 0.01234568 
est = 0.012291

— zen
fonte

2

Gosto dessa resposta, mas suspeito que ela não entenda a questão, que interpretei como pedindo um algoritmo que gera a partir da distribuição solicitada sem conhecer

(ou informações empíricas sobre

). Mas, o problema faz pressuposto de que você pode gerar

variáveis aleatórias, então isso é uma resposta perfeitamente razoável e não é boba em tudo! +1

p

$p$

p

$p$

B e r n o u l l i (p)

${\rm Bernoulli}(p)$

— Macro

1

+1: eu gosto. Eu suponho que você quer dizer que

é distribuído ...?

Y_{n}

$Y_n$

— Neil G

Muito melhor! Tks, @Neil G!

— Zen

1

Isso é engraçado (+1), mas podemos fazer exatamente em um número quase certamente finito de movimentos (e, em média, esse número será relativamente pequeno).

— cardeal

5

Publiquei a seguinte exposição desta pergunta e a resposta do cardeal no fórum de Discussão Geral da atual classe Analytic Combinatorics no Coursera, "Aplicação de séries de poder à construção de uma variável aleatória". Estou publicando uma cópia aqui como wiki da comunidade para disponibilizá-la publicamente e de forma mais permanente.

Havia uma pergunta e resposta interessantes no stat.stackexchange.com relacionadas a séries de potência: "Como gerar uma quantidade não inteira de sucessos consecutivos em Bernoulli?" Parafraseando a pergunta e a resposta do cardeal.

Suponha que tenhamos uma moeda possivelmente injusta que seja cara com probabilidade e um número real positivo . Como podemos construir um evento cuja probabilidade é $p$ $\alpha$ $p^\alpha$ ?

Se fosse um número inteiro positivo, poderíamos simplesmente jogar a moeda vezes e permitir que o evento fosse que todos os lançamentos fossem cara. No entanto, se não é um inteiro, digamos , então isso não faz sentido, mas podemos usar essa idéia para reduzir ao caso em que . Se queremos construir um evento cuja probabilidade é , tomamos a intersecção de eventos independentes, cujas probabilidades são e . $\alpha$ $\alpha$ $\alpha$ $1/2$ $0 \lt \alpha \lt 1$ $p^{3.5}$ $p^3$ $p^{0.5}$

Uma coisa que podemos fazer é construir um evento com qualquer probabilidade conhecida . Para fazer isso, podemos construir um fluxo de bits justas lançando repetidamente a moeda duas vezes, lendo como e como , e ignorando e . Comparamos esse fluxo com a expansão binária de $p' \in [0,1]$ $HT$ $1$ $TH$ $0$ $HH$ $TT$ $p' = 0.a_1a_2a_3..._2$ . O evento em que o primeiro desacordo é onde tem probabilidade . Como não conhecemos , não podemos usá-lo diretamente, mas será uma ferramenta útil. $a_i=1$ $p'$ $p^\alpha$

A idéia principal é que gostaríamos de usar a série de potências para onde. Podemos construir eventos cujas probabilidades sãolançando a moedavezes e ver se são todas caudas, e podemos produzir um evento com probabilidadecomparando os dígitos binários decom um fluxo de bits razoável, como acima e verificando se $p^\alpha = (1-q)^\alpha = 1 - \alpha q - \frac{\alpha(1-\alpha)}{2} q^2 - \frac{\alpha (1-\alpha)(2-\alpha)}{3!}q^3 -...$ $p=1-q$ $q^n$ $n$ $p' q^n$ $p'$ $n$ arremessos são todos caudas.

Construa uma variável aleatória geométrica com o parâmetro . Este é o número de caudas antes da primeira cabeça em uma sequência infinita de lançamentos de moedas. . (Algumas pessoas usam uma definição que difere de $G$ $p$ $P(G=n) = (1-p)^np = q^n p$ $1$ )

Dada uma sequência , Podemos produzir : Inverter a moeda até à primeira cabeça, e se houver caudas antes da primeira cabeça, levar o elemento da sequência de índice . Se cada , podemos comparar com uma variável aleatória uniforme em (construída como acima) para obter um evento com probabilidade $t_0, t_1, t_2, ...$ $t_G$ $G$ $G$ $t_n \in [0,1]$ $t_G$ $[0,1]$ $E[t_G] = \sum_n t_n P(G=n) = \sum_n t_n q^n p$ .

Isso é quase o que precisamos. Gostaríamos de eliminar esse para usar a série de potências para em . $p$ $p^\alpha$ $q$

1 = p + q p + q^{2} p + q^{3} p + . . .

$1 = p + qp + q^2p + q^3p + ...$

q^{n} = q^{n} p + q^{n + 1} p + q^{n + 2} p + . . .

$q^n = q^np + q^{n+1}p + q^{n+2}p + ...$

\begin{array}{rcl} \sum_{n} s_{n} q^{n} & = & \sum_{n} s_{n} (q^{n} p + q^{n + 1} p + q^{n + 2} p + . . .) \\ = & \sum_{n} (s_{0} + s_{1} + . . . + s_{n}) q^{n} p \end{array}

$\begin{eqnarray} \sum_n s_n q^n & = & \sum_n s_n (q^n p + q^{n+1}p + q^{n+2}p + ...) \newline & = & \sum_n (s_0 + s_1 + ... + s_n) q^n p \end{eqnarray}$

Considere . Sejaa soma dos coeficientes dea. Em seguida,. Cadauma vez que os coeficientes são positivos e somam, para que possamos construir um evento com probabilidade $1-p^\alpha = \alpha q + \frac{\alpha(1-\alpha)}{2} q^2 + ...$ $t_n$ $q$ $q^n$ $1-p^\alpha = \sum_n t_n q^n p$ $t_n\in [0,1]$ $1-0^\alpha = 1$ $1-p^\alpha$ comparando um fluxo justo pouco com a expansão binária de . O complemento tem probabilidade $t_G$ $p^\alpha$ conforme necessário.

Novamente, o argumento é devido ao cardeal.

— Douglas Zare
fonte

1

(+1) Obrigado por se dar ao trabalho de postar isso. As diferenças na exposição, embora relativamente pequenas, ajudam a tornar a abordagem mais clara.

— cardeal

4

A resposta muito completa de das contribuições cardinais e subsequentes inspirou a seguinte observação / variante.

Deixe PZ repousar "Probabilidade de Zero" . Se é uma sequência iid Bernoulli com PZ , então $q:=1-p$ $X_n$ $q$ é um Bernoulli rv com PZ . Agora fazendo ou seja aleatório, substituindo-o por um RV inteiro leva a Bernoulli rv com $M_n := \max(X_1,\,X_2,\,\dots, X_n)$ $q^n$ $n$ $N \geq 1$ $M_N$ Portanto, se e se considerarmos darespostado cardeal, encontramos e é como desejado. Isso é realmente possível, uma vez que os coeficientes

P r {M_{N} = 0} = \sum_{n = 1}^{\infty} P r {M_{N} = 0 | N = n} P r {N = n} = \sum_{n = 1}^{\infty} P r {N = n} q^{n} .

$\mathrm{Pr}\{M_N =0\} = \sum_{n=1}^\infty \mathrm{Pr}\{M_N =0 \,\vert\, N =n\} \mathrm{Pr}\{N =n\} = \sum_{n=1}^\infty \mathrm{Pr}\{N =n\} \, q^n.$

0 < a < 1

$0 < a < 1$

P r {N = n} = b_{n}

$\mathrm{Pr}\{N =n\} =b_n$

P r {M_{N} = 0} = 1 - p^{a}

$\mathrm{Pr}\{M_N =0\} = 1- p^a$

1 - M_{N}

$1-M_N$

B e r (p^{a})

$\mathrm{Ber}(p^a)$

b_{n}

$b_n$ satisfaça

e eles somam

.

b_{n} ⩾ 0

$b_n \geqslant 0$

1

$1$

A distribuição discreta de depende apenas de com , lembre-se $N$ $a$ $0 < a < 1$ Tem características interessantes. Acontece que ele tem uma expectativa infinita e um comportamento pesado na cauda

P r {N = n} = \frac{a}{n} \prod_{k = 1}^{n - 1} (1 - a / k) (n \geq 1) .

$\mathrm{Pr}\{N =n\} = \frac{a}{n}\,\prod_{k=1}^{n-1}\left(1 - a/k\right) \qquad (n \geq 1).$

com

n b_{n} \sim c / n^{a}

$n \,b_n \sim c/n^a$

c = - 1 / Γ (- a) > 0

$c = -1/\Gamma(-a) >0$ .

Embora seja o máximo de rvs, sua determinação precisa de um número de que é pois o resultado é conhecido assim que um é . O número de calculado é geometricamente distribuído. $M_N$ $N$ $X_k$ $\leq N$ $X_k$ $1$ $X_k$

— Yves
fonte

X_{k}

$X_k$

θ

$\theta$

(0 < θ < 1)

$(0 < \theta < 1)$

M_{n}

$M_n$

q^{n θ}

$q^{n\theta}$

q^{n}

$q^n$

n θ = a

$n\theta = a$

a > 0

$a>0$

X_{n}

$X_n$

X_{n}^{⋆}

$X_n^\star$

θ

$\theta$ standard Frechet'' by

b_{n} q^{n}

$b_n q^n$

B e r (p)

$\mathrm{Ber}(p)$

N

$N$

— cardeal

(0, 1)

$(0,1)$

f_{n} = \sum_{i = 1}^{n} b_{i}

$f_n = \sum_{i=1}^n b_i$

N

$N$

n b_{n} \sim c n^{- (1 + a)}

$n b_n \sim c n^{-(1+a)}$

f_{n} = \sum_{i = 1}^{n} b_{i}

$f_n = \sum_{i=1}^n b_i$

B e r (p)

$\mathrm{Ber}(p)$

1

c

$c$

- 1 / Γ (- a)

$-1/\Gamma(-a)$

n

$n$

Γ (z)

$\Gamma(z)$

z := - a

$z:=-a$

\prod_{k = 1}^{n - 1}

$\prod_{k=1}^{n-1}$

— Yves

b_{n}

$b_n$

n b_{n}

$n b_n$