Parece-me que você está considerando um mundo de frequentistas e bayesianos. Isso não é muito matizado. Como se você tivesse que ser um ou outro, ou como se os métodos aplicados fossem determinados por algumas crenças pessoais (em vez de conveniência e o problema específico e as informações disponíveis). Acredito que este é um equívoco baseado nas tendências atuais de se chamar de freqüentista ou bayesiano, e também muita linguagem estatística pode ser confusa. Apenas tente que um grupo de estatísticos explique o valor de p ou o intervalo de confiança.
Algumas obras clássicas podem ajudá-lo a entender a inferência freqüentista. As obras clássicas contêm princípios fundamentais, aproximam-se do calor da discussão entre os proponentes e fornecem um pano de fundo da motivação (prática) e relevância da época.
Além disso, esses trabalhos clássicos sobre métodos freqüentistas foram escritos em uma época em que as pessoas trabalhavam principalmente com princípios bayesianos e cálculo matemático de probabilidade (observe que a estatística nem sempre é como se você estivesse trabalhando em um problema típico de matemática com probabilidades, as probabilidades podem ser muito mal definido).
Probabilidade freqüentista não é probabilidade inversa
'Probabilidade inversa' Fisher 1930
Você faz uma noção da probabilidade de ser uma expressão bayesiana com um plano anterior
Contudo,
enquanto a matemática coincide (quando interpretada incorretamente, já que você pode obter P (x | a) = P (a | x), até uma constante, mas não são os mesmos termos), a construção e o significado são diferentes.
Probabilidade não pretende ser uma 'probabilidade bayesiana baseada em anteriores planos ou uniformados'. A probabilidade nem sequer é uma probabilidade e não segue as regras das distribuições de probabilidade (por exemplo, você não pode adicionar probabilidade para eventos diferentes e a integral não é igual a um); é somente quando você a multiplica por um plano anterior, que isso se torna uma probabilidade, mas o significado também mudou.
Algumas citações interessantes de 'probabilidade inversa' 1930 Fisher.
Métodos bayesianos e frequentistas são ferramentas diferentes :
... existem duas medidas diferentes de crença racional apropriadas para diferentes casos. Conhecendo a população, podemos expressar nosso conhecimento incompleto ou expectativa da amostra em termos de probabilidade; conhecendo a amostra, podemos expressar nosso conhecimento incompleto da população em termos de probabilidade. Podemos afirmar a probabilidade relativa de que uma correlação desconhecida seja + 0,6, mas não a probabilidade de que ela esteja no intervalo de 0,559 a 0,605.
Note que não é uma certa afirmação de probabilidade, que um método freqüentista fornece.
Ao construir uma tabela de valores correspondentes, podemos saber, assim que T for calculado, qual é o valor fiducial de 5%, valor de , e que o valor real de será menor que esse valor em apenas 5%, de provações. Essa é uma declaração de probabilidade definida sobre o parâmetro desconhecido , que é verdadeiro independentemente de qualquer suposição quanto à sua distribuição a priori .θ θθθθ
- um método frequentista afirma a probabilidade de um experimento (com intervalo aleatório) ter o valor verdadeiro de um parâmetro (possivelmente aleatório) dentro do intervalo fornecido por uma estatística.
- Isso não deve ser confundido com a probabilidade de que um experimento específico (com intervalo fixo) tenha o valor verdadeiro do parâmetro (fixo) dentro do intervalo fornecido pela estatística.
Consulte também 'Sobre o "erro provável" de um coeficiente de correlação reduzido de uma amostra pequena.' Fisher 1921, no qual Fisher demonstrou a diferença de seu método não ser uma probabilidade inversa bayesiana.
No artigo anterior, verificou-se, aplicando um método desenvolvido anteriormente, que o valor << mais provável >> da correlação da população era numericamente ligeiramente menor que o da amostra. Essa conclusão foi criticada negativamente na Biometrica , aparentemente com a suposição incorreta de que eu a deduzi do teorema de Bayes . Será mostrado neste artigo que, quando as curvas de amostragem são tornadas aproximadamente normais, a correção que propus é igual à distância entre o valor da população e o ponto médio da curva de amostragem e, portanto, não é mais do que a correção de uma viés constante introduzido pelo método de cálculo. Nenhuma suposição quanto à probabilidade a priori está envolvida.
e
... dois conceitos radicalmente distintos foram confundidos sob o nome de << probabilidade >> ...
isso é probabilidade e probabilidade. Veja também a nota no final do artigo de Fishers de 1921, na qual ele fala mais sobre a confusão.
Observe novamente que a probabilidade é uma função de um conjunto de parâmetros, mas não uma função de densidade de probabilidade desse conjunto de parâmetros.
A probabilidade é usada para algo que você pode observar. Por exemplo, a probabilidade de um dado rolar seis. A probabilidade é usada para algo que você não pode observar, por exemplo, a hipótese de que um dado rola seis 1/6 do tempo.
Além disso, você pode gostar do trabalho de Fisher, no qual ele é muito mais leve em sua opinião sobre o teorema de Bayes (ainda descrevendo as diferenças). 'Sobre os fundamentos matemáticos das estatísticas teóricas' Fisher 1922 (especialmente a seção 6 'solução formal do problema de estimativa')
Mais
Se você puder entender e apreciar os comentários de Fisher sobre a diferença entre probabilidade inversa e o princípio da probabilidade, convém ler mais sobre as diferenças nos métodos freqüentes.
'Esboço de uma teoria da estimativa estatística baseada na teoria clássica da probabilidade' Neyman 1937
Que é um trabalho de 50 páginas e difícil de resumir. Mas ele lida com suas perguntas sobre imparcialidade , explica o método dos mínimos quadrados (e a diferença com o método da máxima verossimilhança) e fornece especificamente um tratamento dos intervalos de confiança (o intervalo freqüentista já não é semelhante, único e muito menos o mesmo que os intervalos bayesianos para priores planos).
Quanto ao teste F, não está claro o que, em nome de Laplace, você acha que está errado. Se você gosta de um uso precoce, pode procurar em 'Estudos sobre variação de culturas. II A resposta manurial das diferentes variedades de batata '1923 Fisher e Mackenzie
Este artigo tem a expressão de anova em um modelo linear reconhecível, subdividindo as somas de quadrados entre grupos e dentro deles.
(no teste do artigo de 1923, o teste consiste em uma comparação das diferenças entre os logs dos desvios padrão da amostra com um erro padrão calculado para essa diferença que é determinada pela soma dos graus de liberdade . Trabalhos posteriores tornam essas expressões mais sofisticadas que levam à distribuição F, de modo que podem difundir as idéias que se pode ter sobre ela. Mas, em essência, sem o malabarismo técnico devido a distribuições mais exatas para números pequenos, sua origem é muito parecida com um teste z).12d1+12d2