Solução para o exercício 2.2a.16 de "Estatísticas robustas: a abordagem baseada em funções de influência"

Na página 180 de Estatísticas robustas: A abordagem baseada nas funções de influência encontra-se a seguinte pergunta:

16: Mostre que para estimadores invariantes à localização sempre . Encontre o limite superior correspondente no ponto de ruptura da amostra finita , ambos no caso em que é ímpar ou é par. $\varepsilon^*\leq\frac{1}{2}$ $\varepsilon^*_n$ $n$ $n$

A segunda parte (após o período) é realmente trivial (dada a primeira), mas não consigo encontrar uma maneira de provar a primeira parte (sentença) da pergunta.

Na seção do livro referente a esta questão, encontra-se (p98):

Definição 2: O ponto de ruptura da amostra finita de um estimador na amostra é dado por: $\varepsilon^*_n$ $T_n$ $(x_l,\ldots, x_n)$

$ε_{n}^{*} (T_{n}; x_{i}, \dots, x_{n}) := \frac{1}{n} max {m : max_{i_{1}, \dots, i_{m}} sup_{y_{1}, \dots, y_{m}} | T_{n} (z_{1}, \dots, z_{n}) | < \infty}$ $\varepsilon^*_n(T_n;x_i,\ldots,x_n):=\frac{1}{n}\max\{m:\max_{i_1,\ldots,i_m}\sup_{y_1,\ldots,y_m}\;|T_n(z_1,\ldots,z_n)|<\infty\}$
onde a amostra $(z_1,\ldots,z_n)$ é obtida substituindo $m$ pontos de dados $x_{i_1},\ldots,x_{i_m}$ pelos valores arbitrários $y_1,\ldots,y_m.$

A definição formal de é executada em quase uma página, mas pode ser vista como Embora não seja definido explicitamente, um pode-se adivinhar que a localização invariável significa que deve atender a $\varepsilon^*$

ε^{*} = lim_{n \to \infty} ε_{n}^{*}

$\varepsilon^*=\underset{n\rightarrow\infty}{\lim}\varepsilon^*_n$

T_{n}

$T_n$

T_{n} (x_{1}, \dots, x_{n}) = T_{n} (x_{1} + c, \dots, x_{n} + c), for all c \in R

$T_n(x_1,\ldots,x_n)= T_n(x_1+c,\ldots,x_n+c), \text{ for all } c\in \Bbb{R}$

Eu (tento) responder à pergunta do whuber no comentário abaixo. O livro define o estimador várias páginas, começando em p82, tento reproduzir as partes principais (acho que ele responderá à pergunta do whuber): $T_n$

Suponha que tenhamos observações unidimensionais que são independentes e distribuídas de forma idêntica (iid). As observações pertencem a algum espaço de amostra , que é um subconjunto da linha real (geralmente simplesmente é igual a , portanto as observações podem ter qualquer valor ) Um modelo paramétrico consiste em uma família de distribuições de probabilidade , no espaço de amostra, onde o parâmetro desconhecido pertence a algum espaço de parâmetro $(X_1,\ldots,X_n)$ $\mathcal{H}$ $\mathbb{R}$ $\mathcal{H}$ $\mathbb{R}$ $F_\theta$ $\theta$ $\Theta$

...

Identificamos a amostra com sua distribuição empírica , ignorando a sequência das observações (como quase sempre é feito). Formalmente, , é dada por onde , é o ponto de massa uma em . Como estimadores de , consideramos as estatísticas com valor real . Em um sentido mais amplo, um estimador pode ser visto como uma sequência de estatísticas , uma para cada tamanho de amostra possível . Idealmente, as observações são feitas de acordo com um membro do modelo paramétrico $(X_1,\ldots,X_n)$ $G_n$ $G_n$ $(1/n)\sum_{i=1}^n\Delta_{x_i}$ $\Delta_{X}$ $X$ $\theta$ $T_n=T_n(X_1,\ldots,X_n)=T_n(G_n)$ $\{T_n,n\geq 1\}$ $n$ $\{F_\theta;\theta\in\Theta\}$ , mas a classe de todas as distribuições de probabilidade possíveis em é muito maior. $\mathcal{F}(\mathcal{H})$ $\mathcal{H}$

Consideramos estimadores que são funcionais [ie, para todos os e ] ou que podem ser substituídos assintoticamente por funcionais. Isso significa que assumimos que existe um [onde o domínio de é o conjunto de todas as distribuições para o qual é definido], de modo que em probabilidade quando as observações são iid de acordo com a verdadeira distribuição in . Dizemos que $T_n(G_n)=T(G_n)$ $n$ $G_n$ $T:\mbox{domain}(T)\rightarrow\mathbb{R}$ $T$ $\mathcal{F}(\mathcal{H})$ $T$
$T_{n} (X_{1}, \dots, X_{n}) \underset{n \to \infty}{\to} T (G)$ $T_n(X_1,\ldots,X_n)\underset{n\rightarrow\infty}{\rightarrow}T(G)$ $G$ $\mbox{domain}(T)$ $T(G)$ é o valor assintótico de em . $\{T_n;n\geq 1\}$ $G$

...

Neste capítulo, sempre assumimos que os funcionais em estudo são consistentes com Fisher (Kallianpur e Rao, 1955): que significa que em o modelo em que o estimador mede assintoticamente a quantidade certa. A noção de consistência de Fisher é mais adequada e elegante para os funcionais do que a consistência usual ou imparcialidade assintótica.
$T (F_{θ}) = θ for all θ \in Θ$ $T(F_\theta)=\theta\;\mbox{ for all } \theta\in\Theta$ $\{T_n;n\geq 1\}$

self-study robust

— user603
fonte

Como exatamente este livro define "estimador"? Parece-me que qualquer estimador limitado deve ter um ponto de ruptura de ; portanto, certamente está colocando algum tipo de restrição especial em ; e sempre existem estimadores invariantes por localização limitados (eles incluem as constantes).

T_{n}

$T_n$

1

$1$

T_{n}

$T_n$

— whuber

Obrigado pelo material expandido. Ainda parece que há muitos contra-exemplos. Um simples é o estimador constante para a família de um parâmetro de distribuições normais de variância . Este é um estimador invariável da variação. Seu ponto de decomposição é . É consistente com Fisher (trivialmente), mas preciso interpretar a definição com cuidado: " " não pode se referir necessariamente a todos os parâmetros; portanto, nenhum estimador invariável em localização poderia ser consistente!

T_{n} (X_{1}, \dots, X_{n}) = 1

$T_n(X_1,\ldots,X_n)=1$

1

$1$

1

$1$

θ

$\theta$

— whuber

@ whuber: Obrigado, eu entendo o seu contra-exemplo. Acho que vou entrar em contato com o autor e pedir mais informações ...

— user603

Livros estatísticos mais antigos usavam "invariáveis" de uma maneira ligeiramente diferente do que se poderia esperar; a terminologia ambígua persiste. Um equivalente mais moderno é "equivariante" (consulte as referências no final deste post). No presente contexto, significa

T_{n} (X_{1} + c, X_{2} + c, \dots, X_{n} + c) = T_{n} (X_{1}, X_{2}, \dots, X_{n}) + c

$T_n(X_1+c,X_2+c,\ldots,X_n+c) = T_n(X_1,X_2,\ldots,X_n) + c$

para todos os reais . $c$

Para resolver a questão, suponha que tenha a propriedade de, para suficientemente grande , todo real e todo , $T_n$ $n$ $c$ $m \le \varepsilon^{*}n$

| T_{n} (X + Y) - T_{n} (X) | = o (| c |)

$|T_n(\mathbf{X + Y}) - T_n(\mathbf{X})| = o(|c|)$

sempre que difere de por no máximo em no máximo coordenadas. $\mathbf Y$ $\mathbf{X}$ $c$ $m$

(Essa é uma condição mais fraca do que a assumida na definição de limite de quebra. De fato, tudo o que realmente precisamos assumir é que, quando é suficientemente grande, a expressão " " tem algum valor garantido menor que em tamanho.) $n$ $o(|c|)$ $|c|/2$

A prova é por contradição. Suponha, portanto, que esse também seja equivalente e suponha . Então, para , suficientemente grande , é um número inteiro para o qual e . Para quaisquer números reais defina $T_n$ $\varepsilon^{*} \gt 1/2$ $n$ $m(n) = \lfloor \varepsilon^{*}n\rfloor$ $m(n)/n \le \varepsilon^{*}$ $(n-m(n))/n \le \varepsilon^{*}$ $a,b$

t_{n} (a, b) = T_{n} (a, a, \dots, a, b, b, \dots, b)

$t_n(a, b) = T_n(a, a, \ldots, a,\ b, b, \ldots, b)$

onde existem 's e ' s. Ao alterar ou menos das coordenadas, concluímos ambos $m(n)$ $a$ $n-m(n)$ $b$ $m(n)$

| t (a, b) - t (0, b) | = o (| a |)

$|t(a,b) - t(0,b)| = o(|a|)$

| t (a, b) - t (a, 0) | = o (| b |) .

$|t(a,b) - t(a,0)| = o(|b|).$

Para a desigualdade do triângulo afirma $c\gt 0$

\begin{aligned} c = | t_{n} (c, c) - t_{n} (0, 0) | & \leq | t_{n} (c, c) - t_{n} (c, 0) | + | t_{n} (c, 0) - t_{n} (0, 0) | \\ = o (c) + o (c) \\ < c / 2 + c / 2 \\ = c \end{aligned}

$\eqalign{ c = |t_n(c, c) - t_n(0, 0)| &\le |t_n(c, c) - t_n(c, 0)| + |t_n(c, 0) - t_n(0,0)| \\&= o(c) + o(c) \\&\lt c/2 + c/2 \\ &= c}$

A desigualdade estrita na penúltima linha é assegurada para suficientemente grande . A contradição que implica, , prova $n$ $c \lt c$ $\varepsilon^{*} \le 1/2.$

Referências

EL Lehmann, Teoria da estimativa pontual . John Wiley 1983.

No texto (capítulo 3, seção 1) e uma nota de rodapé que acompanha Lehmann escreve

Um estimador que satisfaça para todos os será chamado equivariável ... $\delta(X_1+a, \ldots, X_n+a) = \delta(X_1,\ldots,X_n)+a$ $a$

Alguns autores chamam esses estimadores de "invariantes". Como isso sugere que o estimador permanece inalterado sob , parece preferível reservar esse termo para funções que satisfaçam para todo . $X_i^\prime = X_i+a$ $u(x+a)=u(x)$ $x,a$

— whuber
fonte

sim, entrei em contato com o autor principal do livro ontem com a mesma pergunta sobre a definição real de invariância usada (procurei no índice e não consegui encontrá-lo explícito no livro). Votei positivamente porque acho que sua resposta é a correta, mas darei ao autor alguns dias para ter certeza antes de aceitá-la.

— user603

Não recebi uma resposta do autor, mas os argumentos apresentados acima (na resposta e no comentário) me convenceram de que essa deve ser realmente a interpretação correta do problema.

— usar o seguinte comando