Eu tenho dados para os quais calculei a correlação de Spearman e quero visualizá-los para uma publicação. A variável dependente é classificada, a variável independente não é. O que eu quero visualizar é mais a tendência geral do que a inclinação real, então classifiquei a independente e apliquei a correlação / regressão de Spearman. Mas quando plotei meus dados e estava prestes a inseri-los em meu manuscrito, deparei-me com esta afirmação ( neste site ):
Você quase nunca usará uma linha de regressão para descrição ou previsão ao fazer a correlação de classificação de Spearman; portanto , não calcule o equivalente a uma linha de regressão .
e depois
Você pode representar graficamente os dados de correlação de classificação de Spearman da mesma maneira que faria para uma regressão ou correlação linear. Não coloque uma linha de regressão no gráfico ; seria enganoso colocar uma linha de regressão linear em um gráfico quando você a analisasse com correlação de classificação.
O fato é que as linhas de regressão não são tão diferentes de quando eu não classifico o independente e calculo a correlação de Pearson. A tendência é a mesma, mas devido às taxas exorbitantes de gráficos coloridos em periódicos, fui com a representação monocromática e os pontos de dados reais se sobrepõem tanto que não são reconhecíveis.
Eu poderia contornar isso, é claro, fazendo dois gráficos diferentes: um para os pontos de dados (classificado) e outro para a linha de regressão (sem classificação), mas se a fonte que citei estiver errada ou o problema não tão problemático no meu caso, facilitaria minha vida. (Eu também vi essa pergunta , mas não me ajudou.)
Edite para informações adicionais:
A variável independente no eixo x representa o número de recursos e a variável dependente no eixo y representa a classificação se os algoritmos de classificação forem comparados em seu desempenho. Agora, tenho alguns algoritmos comparáveis, em média, mas o que quero dizer com meu gráfico é algo como: "Enquanto o classificador A fica melhor, mais recursos estão presentes, o classificador B é melhor quando menos recursos estão presentes"
Edite 2 para incluir meus gráficos:
Classificações de algoritmos plotados versus o número de recursos
Classificações de algoritmos plotados versus o número classificado de recursos
Então, para repetir a pergunta do título:
Tudo bem traçar uma linha de regressão para dados classificados de uma correlação / regressão de Spearman?