No espírito desta pergunta Entendendo a prova de um lema usado na desigualdade de Hoeffding , estou tentando entender os passos que levam à desigualdade de Hoeffding.
O que tem mais mistério para mim na prova é a parte em que momentos exponenciais são calculados para a soma das variáveis iid, após o qual a desigualdade de Markov é aplicada.
Meu objetivo é entender: Por que essa técnica gera uma forte desigualdade e é a mais forte que podemos alcançar? Uma explicação típica refere-se ao momento que gera propriedades do expoente. No entanto, acho isso muito vago.
Uma publicação no blog de Tao, http://terrytao.wordpress.com/2010/01/03/254a-notes-1-concentration-of-measure/#hoeff , pode conter algumas respostas.
Com esse objetivo em mente, minha pergunta é sobre três pontos no post de Tao, no qual eu estou preso e que espero que possa dar uma visão, uma vez explicado.
Tao deriva a seguinte desigualdade usando o k-ésimo momento Se isso é verdade para qualquer k, ele conclui um limite exponencial. É aqui que estou perdido. P(|Sn|≥λ√
O lema de Hoeffding é apresentado: Lema 1 (lema de Hoeffding) Seja uma variável escalar que assume valores em um intervalo [ a , b ] . Então, para qualquer t > 0 , E e T X ≤ e T E X ( 1 + S ( t 2 V um r ( X ) exp ( O ( t ( b - a ) ) ) ) . ( 9 )
Em particular, A prova do Lema 1 começa com expectativas sobre a expansão do taylor e t X = 1 + t X + O ( t 2 X 2 exp ( O ( t ) ) ).Por que a expansão pode ser limitada por esse termo quadrático? e como segue a equação 10?Finalmente, um exercício é dado:
Exercício 1 Mostre que o fator (10) pode ser substituído por t 2 ( b - a ) 2 / 8 , e que esta é nítida. Isso forneceria uma prova muito mais curta do que a do Compreendendo a Prova de um Lema Usado na Desigualdade de Hoeffding , mas não sei como resolver isso.
Definitivamente, são bem-vindas quaisquer outras intuições / explicações sobre a prova da desigualdade ou a razão pela qual não podemos derivar um limite mais rígido.