Como mostrar que uma estatística suficiente NÃO é mínima o suficiente?

Meu problema de lição de casa é dar um contra-exemplo em que uma determinada estatística não é, em geral, mínima o suficiente. Independentemente dos detalhes de encontrar um contra-exemplo específico para essa estatística específica, isso levanta a seguinte questão para mim:

Pergunta: Como se pode formular a condição de não ser uma estatística mínima suficiente de uma maneira que seja possível provar que uma estatística suficiente satisfaz a condição?

Trabalho até agora: A definição de estatística mínima suficiente no meu livro (Keener, Estatística Teórica: Tópicos para um Curso Básico ) é a seguinte:

Uma estatística é o mínimo suficiente sse é suficiente e, para cada estatística suficiente existe uma função tais que ae . $T$ $T$ $\tilde{T}$ $f$ $T = f(\tilde{T})$ $\mathcal{P}$

Observe que (ae ) significa que o conjunto em que a igualdade falha é um conjunto nulo para todas as distribuições de probabilidade no modelo estatístico , . $\mathcal{P}$ $P$ $\mathcal{P}$ $P \in \mathcal{P}$

Tentando negar isso, chego a:

Uma estatística não é mínima o suficiente se pelo menos um dos seguintes itens for válido: TT
1. $T$ não é suficiente.
2. Existe, pelo menos, uma estatística suficiente para os quais há nenhuma função tais que ae . $\tilde{T}$ $f$ $T = f(\tilde{T})$ $\mathcal{P}$

Portanto, se uma estatística é suficiente, parece que seria extremamente difícil mostrar que ela não é mínima o suficiente, mesmo que não seja suficiente. (Porque seria preciso mostrar 2. em vez de 1., uma vez 1. é falso - mas 2. seria muito difícil mostrar porque, mesmo que se tenha uma estatística counterexample em mente, ainda se tem para mostrar a inexistência de qualquer função com essa propriedade. E a inexistência é muitas vezes difícil de mostrar.) $\tilde{T}$

Meu livro não fornece condições equivalentes (isto é, necessárias e suficientes) para que uma estatística seja uma estatística mínima suficiente. Nem sequer fornece condições alternativas necessárias para que uma estatística seja uma estatística suficiente mínima (além de ser uma estatística suficiente).

Portanto, para o meu problema de lição de casa, se eu não posso mostrar que a estatística não é suficiente (porque é), então como eu poderia mostrar que não é suficiente o suficiente?

self-study mathematical-statistics sufficient-statistics

— Chill2Macht
fonte

Você já pensou em começar com uma estatística mínima suficiente e depois ampliá-la para incluir mais componentes?

— whuber

Na matemática em geral, muitas vezes se prova a inexistência de algo assumindo que ele existe e usando-o para encontrar uma contração.

— Kodiologist

Uma estatística é uma função com valor vetorial dos dados. Tem componentes. Por exemplo, uma estatística mínima suficiente para a família de distribuições Normal é o vetor vetorial que consiste na média e variação da amostra. Juntar mais componentes - incluir a distorção da amostra e curtose, por exemplo - fornece uma estatística com quatro componentes. Minha sugestão apenas afirmou o óbvio: essa nova estatística é obviamente suficiente, porque seus dois primeiros componentes já são suficientes. Mas é mínimo o suficiente?

— whuber

Não vejo como alguma dessas observações sobre bijeções ou homeomorfismos poderia ser relevante. Você está usando alguma definição incomum de "estatística" ou "suficiente"?

— whuber

Você parece estar usando algum tipo de definição não convencional de suficiência. No meu exemplo, tudo o que importa é que as novas estatísticas sejam estatísticas genuínas - funções mensuráveis dos dados. O mapa de

(que recupera as duas originais estatísticas, o mínimo suficiente um) é mensurável (de facto, diferenciável). É tudo o que você precisa verificar. R4 $\mathbb{R}^4$

R2 $\mathbb{R}^2$

— whuber

Respostas:

Como você declarou:

Se existem $x1,x2∈X$ tal que $f(x1)=f(x2)$ mas $g(x1)≠g(x2)$ , então $g$ não pode ser escrito como uma função de $f$ , ou seja, existe não existe função $h$ com $g=h∘f$ .

Assim, por exemplo, no caso em que $X_1, ...., X_n$ são variáveis aleatórias independentes de Bernoulli. Podemos provar que $(x_1, ...., x_n)$ não é minimamente suficiente, mostrando que não é uma função de $\sum x_i$ . Isso é óbvio, já que a função deve mapear $1$ para ambos $(1,0,0...,0,0,0)$ e $(0,0,0...,0,0,1)$ .

— Euclides
fonte

Eu estive pensando sobre esse problema um pouco mais recentemente, e aqui está o que eu inventei.

Deixe ser um espaço de probabilidade, então uma variável aleatória é uma função mensurável , onde é um espaço mensurável ( tem um designado -álgebra, e é mensurável no que diz respeito a esta -álgebra eo -álgebra em ). A distribuição de é apenas a medida de retração em , ou seja, $\Omega$ $X$ $X: \Omega \to \mathcal{X}$ $\mathcal{X}$ $\mathcal{X}$ $\sigma$ $X$ $\sigma$ $\sigma$ $\Omega$ $X$ $\mathcal{X}$ . Então umaestatísticadeé qualquer função mensurável * , onde é outro espaço mensurável arbitrário. $\mathbb{P}_{\mathcal{X}}(A) = \mathbb{P}_{\Omega}(X^{-1}(A))$ $X$ $f: \mathcal{X} \to \mathcal{Y}$ $\mathcal{Y}$

Dadas duas estatísticas , , o que significa " ser uma função de "? $f: \mathcal{X} \to \mathcal{Y}$ $g: \mathcal{X} \to \mathcal{Z}$ $g$ $f$

Tanto quanto posso dizer, parece significar que existe uma função ** mensurável tal que , ou seja, que pode ser fatorado por . $h: \mathcal{Y} \to \mathcal{Z}$ $g = h \circ f$ $g$ $f$

(Em outras palavras, " deve ser bem definido como uma função em ".) $g$ $f(\mathcal{X}) \subseteq \mathcal{Y}$

Então, quando é possível esse fatoramento? Vamos pensar em termos de relações de equivalência. Especificamente, defina a relação de equivalência em por $\sim_f$ $\mathcal{X}$ , da mesma forma, defina a relação de equivalência em por $x_1 \sim_f x_2 \iff f(x_1) = f(x_2)$ $\sim_g$ $\mathcal{X}$ . $x_1 \sim_g x_2 \iff g(x_1) = g(x_2)$

Em seguida, a fim de a ser factorável por , as relações de equivalência e necessidade de ser compatíveis uns com os outros, no sentido em que, para qualquer *** , $g$ $f$ $\sim_f$ $\sim_g$ $x_1, x_2 \in \mathcal{X}$ , ou seja, não pode pegar dois elementos equivalentes em e mapeá-los para valores que não são equivalentes em , ou seja, " não pode desfazer a redução de informações anteriormente executada por ". $x_1 \sim_f x_2 \implies x_1 \sim_g x_2$ $g$ $f$ $g$ $g$ $f$

Em outras palavras, deve ser bem definido como uma função em , ou seja, deve existir uma função tal que , onde é a projeção canônica . (Para aqueles desconfortáveis com o absurdo abstrato, é essencialmente , e $g$ $\mathcal{X}/\sim_f \cong f(\mathcal{X})$ $\tilde{g}: \mathcal{X}/\sim_f \to \mathcal{Z}$ $g = \tilde{g} \circ \pi_f$ $\pi_f$ $\mathcal{X} \to \mathcal{X}/\sim_f$ $\pi_f$ $f$ é essencialmente. A formulação acima apenas torna as analogias com outras situações mais claras.) $\tilde{g}$ $h$

Nas palavras mais simples possíveis, pode ser escrito como função de se e somente se, para qualquer , $g$ $f$ $x_1, x_2 \in \mathcal{X}$ . $f(x_1) = f(x_2) \implies g(x_1) = g(x_2)$

Por exemplo, considere e uma variável aleatória arbitrária com valor real e, em seguida, pode ser escrito como uma função de , mas não vice-versa, porque $\mathcal{X} = \mathcal{Y} = \mathcal{Z} = \mathbb{R}$ $X$ $g: x \mapsto x^2$ $f: x \mapsto x$ , mas mas . $x_1 = x_2 \implies x_1^2 = x_2^2$ $1^2 = (-1)^2$ $1 \not= -1$

Em particular, suponha que toda classe de equivalência em seja um singleton (isto é, é injetivo ). Então sempre pode ser escrito como uma função de , pois , ou seja, $\sim_f$ $f$ $g$ $f$ $\mathcal{X}/\sim_f \cong \mathcal{X}$ significa que $f(x_1) = f(x_2) \implies x_1 = x_2$ (em geral, para não necessariamente injetável, apenas uma direção vale), portanto nossa condição se torna $x_1 = x_2 \iff f(x_1) = f(x_2)$ $f$ , que é trivialmente satisfeita paraqualquer . (Para definir , ele pode fazer o que quiser em desde que seja mensurável e, em seguida, para qualquer , ou seja, tal que para alguns , defina para ser $x_1 = x_2 \implies g(x_1) = g(x_2)$ $g: \mathcal{X} \to \mathcal{Z}$ $h$ $\mathcal{Y} \setminus f(\mathcal{X})$ $y \in f(\mathcal{X})$ $y = f(x)$ $x \in \mathcal{X}$ $h$ . Isso é bem definido quando é injetivo, porque existe umúnico tal que . De maneira mais geral, isso é definido apenas quando, independentemente de qual escolhemos em , ainda é o mesmo valor, ou seja, $h: y = f(x) \mapsto g(x)$ $f$ $x \in \mathcal{X}$ $f(x) = y$ $x$ $f^{-1}(y)$ $g(x)$ .) $f(x_1)=f(x_2)\ (=y) \implies g(x_1)=g(x_2)$

Além disso, olhando o Teorema 3.11 em Keener, sua declaração é meio desajeitada, mas pensando nos termos acima, acredito que pode ser reescrita como:

Suponha que seja uma estatística suficiente ****. Então, uma condição suficiente para que seja mínimo o suficiente é que ela possa ser escrita em função da razão de verossimilhança. $T$ $T$

A partir disso, fica imediatamente claro que a razão de verossimilhança deve ser por si só mínima o suficiente.

Isso também leva à conclusão de que:

Se existem tal que mas , então não pode ser escrito como uma função de , ou seja, existe não existe função com . $x_1, x_2 \in \mathcal{X}$ $f(x_1)=f(x_2)$ $g(x_1) \not= g(x_2)$ $g$ $f$ $h$ $g = h \circ f$

Portanto, a condição não é tão difícil de mostrar como eu pensava.

* Keener não trata da questão de saber se uma estatística precisa ser uma função mensurável ou apenas uma função arbitrária ou não. No entanto, tenho certeza de que uma estatística deve ser uma função mensurável, porque , caso contrário, não poderíamos definir uma distribuição para ela , ou seja, uma medida de retração.

** Se não fosse mensurável, teríamos uma contradição porque e são mensuráveis e a composição de funções mensuráveis é novamente mensurável. No mínimo, deve ser mensurável restrito a , embora eu ache que isso significaria, na maioria dos casos razoáveis, que teria que concordar com com uma função mensurável em todo (pegue em $h$ $f$ $g$ $h$ $f(\mathcal{X}) \subseteq \mathcal{Y}$ $h$ $f(\mathcal{X})$ $\mathcal{Y}$ $h|_{f(\mathcal{X})}$ $f(\mathcal{X})$ e, por exemplo, em se existir um ponto mensurável , observe que e devem ser mensuráveis em ), de modo que o wlog possa ser considerado mensurável em todos . $z$ $Y \setminus f(\mathcal{X})$ $z \in \mathcal{Z}$ $f(\mathcal{X})$ $Y \setminus f(\mathcal{X})$ $Y$ $h$ $\mathcal{Y}$

*** Pelo menos isso é necessário e suficiente para a existência de uma função arbitrária fatorando e acima de , e acho que ** implica que, se existe uma função arbitrária, essa função também deve ser mensurável, uma vez que e são, ou seja, seria realmente uma estatística . $g$ $f$ $f$ $g$ $\mathcal{Y} \to \mathcal{Z}$

**** A condição dada é equivalente a ser suficiente pelo teorema da fatoração, 3.6. $T$

— Chill2Macht
fonte

Como você define a taxa de verossimilhança?

— Xian

@ Xi'an Eu realmente não me lembro de todas as coisas estúpidas que escrevi acima, para ser honesto, não tenho certeza de que parte você está se referindo. Se você está sugerindo implicitamente que primeiro prove que a estatística da razão de verossimilhança é mínima o suficiente e reduza qualquer outra prova de suficiência mínima a uma "equivalência de suficiência" adequada com a estatística da razão de verossimilhança, que provavelmente é útil na prática, mas pelo menos teoricamente só parece chutar a lata pela estrada (porque, então, como se compreende a prova de suficiência mínima da estatística LR?)

— Chill2Macht