A razão pela qual o kernel Epanechnikov não é universalmente usado por sua otimização teórica pode muito bem ser que o kernel Epanechnikov não é realmente teoricamente ideal . Tsybakov critica explicitamente o argumento de que o núcleo Epanechnikov é "teoricamente ótimo" nas páginas 16-19 da Introdução à estimativa não paramétrica (seção 1.2.4).
Tentando resumir, sob algumas suposições sobre o kernel K e uma densidade fixa p one, temos que o erro quadrado integrado médio é, da forma
1nh∫K2(u)du+h44S2K∫(p′′(x))2dx.(1)
A principal crítica a Tsybakov parece estar minimizando os núcleos não negativos, pois muitas vezes é possível obter estimadores com melhor desempenho, que são até negativos, sem restringir os núcleos não negativos.
O primeiro passo do argumento para o kernel Epanechnikov começa minimizando (1) sobre h todos os kernels não negativos (em vez de todos os kernels de uma classe mais ampla) para obter uma largura de banda "ideal" para K
hMISE(K)=(∫K2nS2K∫(p′′)2)1/5
e o kernel "ideal" (Epanechnikov)
K∗(u)=34(1−u2)+
cujo erro quadrado integrado médio é:
hMISE(K∗)=(15n∫(p′′)2)1/5.
Porém, essas escolhas não são viáveis, pois dependem do conhecimento (via p′′ ) da densidade desconhecida p - portanto, são quantidades "oraculares".
Uma proposição feita por Tsybakov implica que o MISE assintótico para o oráculo de Epanechnikov é:
limn → ∞n4 / 5Ep∫( pEn( x ) - p ( x ) )2dx = 34 / 551 / 54( ∫( p′ ′(x))2dx)1/5.(2)
Tsybakov diz que (2) costuma ser considerado o MISE mais viável, mas depois mostra que é possível usar kernels da ordem 2 (para os quais ) para construir estimadores de kernel, para cada , de modo queSK=0ε>0
lim supn→∞n4/5Ep∫(p^n(x)−p(x))2dx≤ε.
Mesmo que não seja necessariamente não negativo, ainda há o mesmo resultado para o estimador de peças positivo, (que é garantido seja negativo, mesmo que não seja):p^np+n:=max(0,p^n)K
lim supn→∞n4/5Ep∫(p+n(x)−p(x))2dx≤ε.
Portanto, para pequeno o suficiente, existem estimadores verdadeiros que possuem MISE assintótico menor que o oráculo Epanechnikov , mesmo usando as mesmas premissas na densidade desconhecida .ε p
Em particular, resulta-se que o menor valor do MISE assintótico para um fixo sobre todos os estimadores de kernel (ou partes positivas dos estimadores de kernel) é . Portanto, o oráculo de Epanechnikov não está nem perto de ser o ideal, mesmo quando comparado aos verdadeiros estimadores.p0
A razão pela qual as pessoas avançaram no argumento para o oráculo de Epanechnikov é que muitas vezes se argumenta que o próprio núcleo não deveria ser negativo, porque a densidade em si não era negativa. Mas, como Tsybakov aponta, não é preciso assumir que o núcleo não é negativo para obter estimadores de densidade não negativos e, ao permitir que outros kernels possam ser estimadores de densidade não negativos que (1) não são oráculos e (2) ter um desempenho arbitrariamente melhor que o oráculo Epanechnikov para um fixop . Tsybakov usa essa discrepância para argumentar que não faz sentido defender a otimização em termos de um fixo , mas apenas as propriedades de otimização uniformes em uma classepde densidades. Ele também aponta que o argumento ainda funciona ao usar o MSE em vez do MISE.
EDIT: Ver também Corolário 1.1. na p.25, onde o núcleo de Epanechnikov se mostra inadmissível com base em outro critério. Tsybakov realmente parece não gostar do núcleo Epanechnikov.
kdensity
.