Por que os problemas de regressão são chamados de problemas de "regressão"?


Respostas:


34

O termo "regressão" foi usado por Francis Galton em seu artigo de 1886 "Regressão à mediocridade na estatura hereditária". Que eu saiba, ele só usou o termo no contexto de regressão em relação à média . O termo foi adotado por outros para obter mais ou menos o significado que tem hoje como método estatístico geral.


15
Galton derivou uma aproximação linear para estimar a altura de um filho a partir da altura do pai naquele artigo. Sua equação foi ajustada para que um pai de estatura média tivesse um filho de estatura média, mas um pai mais alto que a média teria um filho mais alto que a média em 2/3 da quantia que seu pai é. Mesmo com menor que a média. Isso poderia ser argumentado como uma regressão linear simples (significado de hoje). E é claro que hoje a regressão tem um significado ainda mais amplo: é qualquer modelo que faz previsões contínuas. É interessante o quanto o uso original dessa palavra mudou.
Rm999 21/05

3
Responder por NRH está correto. O link a seguir fornece muito mais detalhes sobre o artigo de Francis Galton "Regressão à mediocridade na estatura hereditária" blog.minitab.com/blog/statistics-and-quality-data-analysis/…
Gaurav Singhal

está na hora da comunidade estatística substituir a palavra 'regressão' por um termo mais direto e claro, talvez 'preditor de fórmula'?
Aviad Rozenhek

4

Ao contrário de progredir, estamos voltando à média, ou seja, regressando. Daí o termo regressão! Eu acho que é algo que foi pego e preso.


2

@ Mark White já mencionou o link, mas para aqueles que não têm muito tempo para verificar o link, aqui está a resposta exata e devidamente referenciada:

Origem da 'regressão'

O termo "regressão" foi cunhado por Francis Galton no século 19 para descrever um fenômeno biológico. O fenômeno foi que as alturas dos descendentes de ancestrais altos tendem a regredir para uma média normal (um fenômeno também conhecido como regressão à média) (Galton, reimpresso 1989). Para Galton, a regressão tinha apenas esse significado biológico (Galton, 1887) , mas seu trabalho foi posteriormente estendido por Udny Yule e Karl Pearson a um contexto estatístico mais geral (Pearson, 1903).

Referências

https://en.wikipedia.org/wiki/Regression_analysis#History

Galton, F. (1877). Leis típicas da hereditariedade. III Nature, 15 (389), 512-514.

Galton, F. (reimpresso 1989). Parentesco e Correlação. Statistical Science, 4 (2), 80-86.

Pearson, K. (1903). A lei da hereditariedade ancestral. Biometrika, 2 (2), 211-228.


A regressão de Galton como em "regressão à média" faz sentido. no entanto, eu não entendo o uso da palavra 'regressão' como 'aprender uma fórmula de variáveis ​​independentes para uma variável de resultado'
Aviad Rozenhek 27/10

11
Geralmente, isso significa que, mas o aprendizado de máquina usa regressão, mas a regressão não é uma técnica de aprendizado de máquina, apesar da opinião popular e incorreta. O aprendizado estatístico é separado do aprendizado de máquina, mas, em geral, os proponentes de ML utilizam métodos estatísticos e os rotulam incorretamente como ML, de modo que surgem incongruências aparentes. A regressão de Galton é regressão; tem a ver com modelar / prever uma tendência.
LSC

0

"Regressão" vem de "regressão", que por sua vez vem do latim "regressus" - para voltar (para alguma coisa).

Nesse sentido, a regressão é a técnica que permite "voltar" de dados confusos e difíceis de interpretar a um modelo mais claro e significativo. Como físico, gosto da idéia, pois os físicos veem os fenômenos naturais como os múltiplos resultados possíveis de uma lei natural relativamente simples.

Em outras palavras, a palavra regressão parece sugerir que os dados são apenas o efeito visível e tangível de um "modelo estatístico". Em outras palavras, o modelo vem primeiro, e seu desejo é usar os dados "para voltar" ao que os originou.


0

Como eu sei, a palavra regressionem significado estatístico é a medida da relação entre o valor médio de uma variável e os valores correspondentes de outras variáveis.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.