Houve alguma confusão na minha cabeça sobre dois tipos de estimadores do valor populacional do coeficiente de correlação de Pearson.
A. Fisher (1915) mostrou que para a população normal bivariada, o empírico é um estimador negativamente tendencioso de ρ , embora o viés possa ser de uma quantidade praticamente considerável apenas para o tamanho pequeno da amostra ( n < 30 ). A amostra r subestima ρ no sentido de que está mais próxima de 0 que ρ . (Exceto quando o último é 0 ou ± 1 , para então r é imparcial.) Vários estimadores quase imparciais de ρ foram propostos, sendo o melhor provavelmente o Olkin e Pratt (1958) corrigiram :
is positively biased relative to , meaning absolute value: is farther from than (is that statement true?). The texts say it is the same problem as the over-estimation of the standard deviation parameter by its sample value. There exist many formulas to "adjust" observed closer to its population parameter, being the most well-known (but not the best). The root of such adjusted is called shrunken :
Present are two different estimators of . Very different: the first one inflates , the second deflates . How to reconcile them? Where to use/report one and where - the other?
In particular, can it be true that the "shrunken" estimator is (nearly) unbiased too, like the "unbiased" one, but only in the different context - in the asymmetrical context of regression. For, in OLS regression we consider the values of one side (the predictor) as fixed, attending without random error from sample to sample? (And to add here, regression does not need bivariate normality.)