Não consigo encontrar uma referência, então vou esboçar a prova aqui.
Teorema. Seja sejam variáveis aleatórias reais. Seja sejam constantes. Suponha que, para todos os e todos no suporte de , temosX1,⋯,Xna1,⋯,an,b1,⋯,bni∈{1,⋯,n}(x1,⋯,xi−1)(X1,⋯,Xi−1)
- E[Xi|X1=x1,⋯,Xi−1=xi−1]≤0 e
- P[Xi∈[ai,bi]]=1 .
Então, para todos ,t≥0
P[∑i=1nXi≥t]≤exp(−2t2∑ni=1(bi−ai)2).
Prova. Defina . Afirmamos que Para todos os e , temos
Por suposição, e para todos os no suporte deYi=∑ij=1Xj
∀i∈{1,⋯,n} ∀λ≥0 E[eλYi]≤e18λ2∑ij=1(bj−aj)2.(*)
iλE[eλYi]=E[eλYi−1⋅eλXi]=E[eλYi−1⋅E[eλXi∣∣Yi−1]].
μ(yi−1):=E[Xi|Yi−1=yi−1]≤0P[Xi∈[ai,bi]]=1yi−1Yi−1. (Observe que .) Assim, pelo
lema de Hoeffding , para todos os no suporte de e todos os . Como , temos, para todos ,
Agora a indução produz a reivindicação (*) acima.
Yi−1=X1+⋯+Xi−1E[eλXi∣∣Yi−1=yi−1]≤eλμ(yi−1)+18λ2(bi−ai)2
yi−1Yi−1λ∈Rμ(yi−1)≤0λ≥0E[eλYi]≤E[eλYi−1⋅e0+18λ2(bi−ai)2].
Agora aplicamos a desigualdade de Markov em e usamos nossa reivindicação (*). Para todos os ,
Por fim, defina para minimizar a expressão da mão direita e obter o resultado. eλYnt,λ>0
P[∑i=1nXi≥t]=P[Yn≥t]=P[eλYn≥eλt]≤E[eλYn]eλt≤e18λ2∑ni=1(bi−ai)2eλt.
λ=4t∑ni=1(bi−ai)2■
Como mencionei no meu comentário, a principal diferença entre esta e a afirmação "usual" da desigualdade de Azuma está exigindo , em vez de . O primeiro permite mais flexibilidade e isso economiza um fator de 2 em alguns casos.Xi∈[ai,bi]Xi∈[−a,a]
Observe que as variáveis aleatórias na prova são um supermartingale. Você pode obter a versão usual da desigualdade de Azuma usando um Martingale , configurando e (onde ) e depois aplique o resultado acima.YiY1,⋯,YnXi=Yi−Yi−1[ai,bi]=[−ci,ci]P[|Yi−Yi−1|≤ci]=1