Uma suposição para a análise de regressão é que e não estão entrelaçados. No entanto, quando penso nisso, parece-me que faz sentido.Y
Aqui está um exemplo. Se tivermos um teste com 3 seções (AB e C). A pontuação geral do teste é igual à soma das pontuações individuais para as 3 seções. Agora faz sentido dizer que pode ser pontuado nas seções A e a pontuação geral do teste. Então a regressão linear pode responder a essa pergunta: qual é a variabilidade na pontuação geral do teste atribuível à seção A? Aqui, vários cenários são possíveis:Y
- A seção A é a mais difícil das 3 seções e os alunos sempre obtêm a nota mais baixa. Nesse caso, intuitivamente seria baixo. Como a maior parte da pontuação geral do teste seria determinada por B e C.
- A seção A foi muito fácil para os alunos. Também neste caso a correlação não seria alta. Como os alunos sempre pontuam 100% desta seção e, portanto, esta seção não diz nada sobre a pontuação geral do teste.
- Seção A tem dificuldade intermediária. Nesse caso, a correlação seria mais forte (mas isso também depende das outras pontuações (B e C).
Outro exemplo é o seguinte: analisamos o conteúdo total de um oligoelemento na urina. E analisamos independentemente as espécies individuais (formas químicas) desse oligoelemento na urina. Pode haver muitas formas químicas. E se nossas análises estiverem corretas, a soma das formas químicas deve nos dar o mesmo que o conteúdo total de um elemento (analisado por uma técnica diferente). No entanto, faz sentido perguntar se uma forma química está correlacionada com o conteúdo total de elementos na urina, pois esse conteúdo total é um indicador da ingestão total de alimentos desse elemento. Então, se dissermos que é o elemento total na urina eY é a forma química A na urina, estudando a correlação, podemos explorar se essa forma química é a principal que contribui para a variabilidade geral ou não.
parece-me que às vezes faz sentido mesmo quando e não são independentes e que, em alguns casos, isso pode ajudar a responder perguntas científicas.Y
Você acha que pode ser útil ou significativo nos exemplos acima? Se considerarmos o exemplo da pontuação do teste acima, eu já diria que haveria cerca de 33% de contribuição de cada seção se a dificuldade fosse exatamente a mesma para os alunos. Mas, na prática, isso não é necessariamente verdade. Então, eu estava pensando que talvez o uso da análise de regressão possa nos ajudar a conhecer a verdadeira variabilidade atribuída a cada seção de um exame. Parece-me, portanto, que seria significativo, mesmo sabendo que a hipótese nula não é verdadeira.R 2
Existem métodos alternativos de regressão modificados para explicar essas situações e fornecer parâmetros significativos?