EDIT: versão original perdeu um valor absoluto. Desculpe!!
Oi Ian. Descreverei brevemente duas desigualdades de amostra, uma usando um limite de Lipschitz, a outra usando um limite na segunda derivada e discutirei algumas dificuldades nesse problema. Embora eu esteja sendo redundante, uma vez que uma abordagem usando um derivado explica o que acontece com mais derivados (via Taylor), verifica-se que a segunda versão do derivado é bastante agradável.
Primeiro, com um limite de Lipschitz: simplesmente refaça a desigualdade padrão de Jensen. O mesmo truque se aplica: calcule a expansão de Taylor no valor esperado.
Especificamente, Seja medida correspondente e defina . Se tem Lipschitz constante , então pelo teorema de Taylorμ m : = E ( x ) f LXμm:=E(x)fL
f(x)=f(m)+f′(z)(x−m)≤f(m)+L|x−m|,
em que (Note-se que e são possíveis). Usando isso e refazendo a prova de Jensen (eu sou paranóico e verifiquei se a norma está realmente na wikipedia),x ≤ m x > mz∈[m,x]x≤mx>m
E(f(X))=∫f(x)dμ(x)≤f(m)∫dμ(x)+L∫|x−m|dμ(x)=f(E(X))+LE(|X−E(X)|).
Agora, suponha . Nesse caso,|f′′(x)|≤λ
f(x)=f(m)+f′(m)(x−m)+f′′(z)(x−m)22≤f(m)+f′(m)(x−m)+λ(x−m)22,
e entao
E(f(X))≤f(m)+f′(m)(E(X)−m)+λE((X−m)2)2=f(E(X))+λVar(X)2.
Eu gostaria de mencionar brevemente algumas coisas. Desculpe se eles são óbvios.
Uma é que você não pode simplesmente dizer "wlog " alterando a distribuição, porque você está alterando o relacionamento entre e .f μE(X)=0fμ
Em seguida, o limite deve depender da distribuição de alguma maneira. Para ver isso, imaginar que e . Qualquer que seja o valor de , você ainda recebe . Por outro lado, . Assim, alterando , você pode tornar arbitrariamente a diferença entre as duas quantidades! Intuitivamente, mais massa é afastada da média e, portanto, para qualquer função estritamente convexa, aumentará.f (X∼Gaussian(0,σ2) σ f ( E ( X ) ) = f ( 0 ) = 0 E ( f ( X ) ) = E ( X 2 ) = σ 2 σ E ( f ( X ) )f(x)=x2σf(E(X))=f(0)=0E(f(X))=E(X2)=σ2σE(f(X))
Por fim, não vejo como obter um limite multiplicativo como você sugere. Tudo o que usei neste post é padrão: o teorema de Taylor e os limites de derivativos são pão e manteiga nos limites das estatísticas e automaticamente dão erros aditivos, e não multiplicativos.
Vou pensar sobre isso, e postar alguma coisa. A intuição vaga é que ela precisará de condições muito árduas, tanto na função quanto na distribuição, e que o limite aditivo esteja realmente no centro dela.