Estou me ensinando algumas estatísticas por diversão e tenho alguma confusão em relação a estatísticas suficientes . Vou escrever minhas confusões em formato de lista:
Se uma distribuição tiver parâmetros, ela terá n estatísticas suficientes?
Existe algum tipo de correspondência direta entre as estatísticas suficientes e os parâmetros? Ou as estatísticas suficientes servem apenas como um pool de "informações" para que possamos recriar a configuração para calcular as mesmas estimativas para os parâmetros da distribuição subjacente.
Todas as distribuições têm estatísticas suficientes? ie o teorema da fatoração pode falhar?
Usando nossa amostra de dados, assumimos uma distribuição da qual é mais provável que os dados sejam e, em seguida, podemos calcular estimativas (por exemplo, o MLE) para os parâmetros para a distribuição. Estatísticas suficientes são uma maneira de poder calcular as mesmas estimativas para os parâmetros sem precisar confiar nos próprios dados, certo?
Todos os conjuntos de estatísticas suficientes terão uma estatística suficiente?
Este é o material que estou usando para tentar entender o assunto: https://onlinecourses.science.psu.edu/stat414/node/283
Pelo que entendi, temos um teorema de fatoração que separa a distribuição conjunta em duas funções, mas não entendo como somos capazes de extrair a estatística suficiente depois de fatorar a distribuição em nossas funções.
A questão de Poisson dada neste exemplo teve uma fatoração clara, mas foi afirmado que as estatísticas suficientes eram a média da amostra e a soma da amostra. Como soubemos que essas eram estatísticas suficientes apenas observando a forma da primeira equação?
Como é que é possível realizar as mesmas estimativas MLE usando estatísticas suficientes se a segunda equação do resultado fatoração, por vezes, vai depender dos valores de dados si mesmos? Por exemplo, no caso de Poisson, a segunda função dependia do inverso do produto dos fatoriais dos dados, e não teríamos mais os dados!
Por que o tamanho da amostra não seria uma estatística suficiente em relação ao exemplo de Poisson na página da web ? Exigiríamos que n reconstruísse certas partes da primeira função. Por que também não é uma estatística suficiente?