A razão pela qual as plotagens são universalmente usadas para introduzir uma regressão simples - uma resposta prevista por um único preditor - é que elas ajudam na compreensão.
No entanto, acredito que posso dar algo do sabor que possa ajudar a entender o que está acontecendo. Nisto, vou me concentrar principalmente em tentar transmitir um pouco do entendimento que eles fornecem, o que pode ajudar com alguns dos outros aspectos que você normalmente encontrará na leitura sobre regressão. Portanto, esta resposta lidará principalmente com um aspecto específico da sua postagem.
Imagine que você está sentado diante de uma grande mesa retangular, como uma mesa de escritório simples, uma com um braço inteiro (talvez 1,8 metros), talvez com metade dessa largura.
Você está sentado diante da mesa na posição usual, no meio de um lado comprido. Nesta mesa, um grande número de pregos (com cabeças bastante lisas) foi martelado na superfície superior, de modo que cada um aperta um pouco (o suficiente para sentir onde estão e o suficiente para amarrar um barbante neles ou prender um elástico) )
Essas unhas estão a distâncias variadas da borda da mesa, de maneira que, em uma extremidade (digamos, na extremidade esquerda), elas normalmente estejam mais próximas da borda da mesa e depois, enquanto você se move em direção à outra extremidade, as cabeças das unhas tendem a estar mais distantes da sua borda.
Além disso, imagine que seria útil ter uma noção de quão longe as unhas estão, em média, da sua borda, em qualquer posição da sua borda.
Escolha algum lugar ao longo da borda da mesa e coloque a mão ali, depois estenda a mão diretamente sobre a mesa, arrastando suavemente a mão de volta em sua direção e depois para longe novamente, movendo a mão para frente e para trás sobre as cabeças das unhas. Você encontra várias dúzias de inchaços nessas unhas - aquelas na largura mais estreita da sua mão (à medida que se afasta diretamente da borda, a uma distância constante da extremidade esquerda da mesa), uma seção ou tira, com aproximadamente dez centímetros de largura .
A idéia é descobrir uma distância média de um prego a partir da borda da mesa nessa pequena seção. Intuitivamente, é apenas o meio dos solavancos que atingimos, mas se medimos cada distância até um prego naquela seção da mesa com a largura da mão, poderíamos calcular essas médias facilmente.
Por exemplo, poderíamos usar um quadrado T cuja cabeça desliza ao longo da borda da mesa e cujo eixo corre em direção ao outro lado da mesa, mas logo acima da mesa para não batermos nas unhas quando ela deslizar para a esquerda ou à direita - ao passarmos por uma unha, podemos obter sua distância ao longo do eixo do quadrado T.
Assim, em uma progressão de lugares ao longo de nossa borda, repetimos esse exercício de encontrar todas as unhas em uma faixa na largura da mão, correndo na nossa direção e para longe de nós e encontrando a distância média delas. Talvez dividamos a mesa em tiras da largura das mãos ao longo da borda (para que cada unha seja encontrada em exatamente uma tira).
Agora imagine que havia 21 tiras desse tipo, a primeira na borda esquerda e a última na borda direita. Os meios se afastam ainda mais da nossa mesa à medida que avançamos pelas tiras.
Esses meios formam um estimador de regressão não paramétrico simples da expectativa de y (nossa distância) dada x (distância ao longo da borda da extremidade esquerda), ou seja, E (y | x). Especificamente, este é um estimador de regressão não paramétrico binned, também chamado de regressograma
Se essas médias de faixa aumentassem regularmente - ou seja, a média estava aumentando aproximadamente na mesma quantidade por faixa à medida que passávamos pelas faixas -, poderíamos estimar melhor nossa função de regressão assumindo que o valor esperado de y fosse linear função de x - ou seja, que o valor esperado de y dado x fosse uma constante mais um múltiplo de x. Aqui a constante representa onde as unhas tendem a estar quando x é zero (geralmente podemos colocá-lo na extremidade esquerda extrema, mas não precisa ser), e o múltiplo particular de x é o quão rápido, em média, a média muda à medida que avançamos um centímetro (digamos) para a direita.
Mas como encontrar uma função linear?
Imagine que passamos um elástico sobre cada cabeça de unha e prendemos cada um a uma vara longa e fina que fica logo acima da mesa, em cima das unhas, para que fique em algum lugar perto do "meio" de cada tira que estávamos para.
Prendemos as faixas de tal maneira que elas apenas se esticam na direção em direção a nós (e não à esquerda ou à direita) - deixadas sozinhas elas puxariam para fazer sua direção de esticar em ângulo reto com o manípulo, mas aqui evitamos isso, para que a direção do alongamento permaneça apenas nas direções em direção ou fora da nossa borda da mesa. Agora deixamos o bastão assentar à medida que as faixas o puxam em direção a cada unha, com mais unhas distantes (com mais elásticos esticados) puxando correspondentemente mais forte do que as unhas próximas ao bastão.
Então o resultado combinado de todas as bandas que puxam o bastão seria (pelo menos idealmente) puxar o bastão para minimizar a soma dos comprimentos quadrados dos elásticos de borracha esticados; nessa direção, diretamente sobre a mesa, a distância entre a borda da mesa e o manche em qualquer posição x seria nossa estimativa do valor esperado de y, dado x.
Esta é essencialmente uma estimativa de regressão linear.
Agora, imagine que, em vez de pregos, tenhamos muitas frutas (como maçãs pequenas, talvez) penduradas em uma árvore grande e desejamos encontrar a distância média das frutas acima do solo, pois ela varia de acordo com a posição no solo. Imagine que, neste caso, as alturas acima do solo aumentem à medida que avançamos e um pouco maiores à medida que avançamos para a direita, novamente de maneira regular; portanto, cada passo à frente normalmente altera a altura média aproximadamente na mesma quantidade e cada passo para a right também mudará a média em uma quantidade aproximadamente constante (mas essa quantidade de mudança na média à direita é diferente da quantidade de mudança na frente).
Se minimizarmos a soma das distâncias verticais ao quadrado dos frutos para uma folha fina e plana (talvez uma folha fina de plástico muito rígido) para descobrir como a altura média muda à medida que avançamos ou avançamos para a direita, isso seria uma regressão linear com dois preditores - uma regressão múltipla.
Esses são os únicos dois casos que os gráficos podem ajudar a entender (eles podem mostrar rapidamente o que acabei de descrever detalhadamente, mas espero que você tenha uma base para conceituar as mesmas idéias). Além desses dois casos mais simples, resta apenas a matemática.
Agora dê o seu exemplo de preço da casa; você pode representar a área de cada casa a uma distância ao longo da borda da mesa - representar o maior tamanho da casa como uma posição próxima à borda direita, todos os outros tamanhos de casas estarão em alguma posição mais à esquerda, onde um certo número de centímetros representará alguns número de metros quadrados. Agora a distância representa o preço de venda. Represente a casa mais cara como uma distância específica próxima à extremidade mais distante da mesa (como sempre, a extremidade mais distante da sua cadeira), e cada centímetro que se afastar representará um número de riais.
No momento, imagine que escolhemos a representação para que a borda esquerda da mesa corresponda a uma área da casa igual a zero e a borda próxima a um preço da casa igual a 0. Posicionamos uma unha para cada casa.
Provavelmente, não teremos pregos perto da extremidade esquerda da borda (eles podem estar principalmente na direção certa e longe de nós) porque essa não é necessariamente uma boa escolha de escala, mas sua escolha de um modelo sem interceptação faz com que isso uma maneira melhor de discutir isso.
Agora, em seu modelo, você força o bastão a passar por um laço no canto esquerdo da borda próxima da mesa - forçando o modelo equipado a ter preço zero pela área zero, o que pode parecer natural - mas imagine se houver alguns componentes razoavelmente constantes do preço que afetavam todas as vendas. Então faria sentido ter a interceptação diferente de zero.
De qualquer forma, com a adição desse loop, o mesmo exercício de elástico de antes encontrará nossa estimativa de mínimos quadrados da linha.