Eu já li todas as páginas deste site tentando encontrar a resposta para o meu problema, mas ninguém parece ser o certo para mim ...
Primeiro, explico o tipo de dados com o qual estou trabalhando ...
Digamos que eu tenha um vetor de matriz com vários nomes de cidade, um para cada um dos 300 usuários. Eu também tenho outro vetor de matriz com respostas de pontuação a uma pesquisa de cada usuário ou um valor contínuo para cada usuário.
Gostaria de saber se existe um coeficiente de correlação que calcule a correlação entre essas duas variáveis, portanto, variáveis nominais e numéricas / ordinais
Pesquisei na Internet e, em algumas páginas, eles sugerem o uso do coeficiente de contingência ou do V de Cramer ou do coeficiente Lambda ou Eta. Para cada uma dessas medidas, basta dizer que elas poderiam ser aplicadas a esses dados nos quais temos uma variável nominal e um intervalo ou variável numérica. O fato é que pesquisar e pesquisar, tentando entender cada uma delas, em algum momento é escrito ou observando os exemplos de que eles são razoáveis para usá-las se você tiver uma variável nominal dicotômica, exceto para o Cramer V, outras vezes não é escrito nenhum requisito para o tipo de dados. Muitas outras páginas dizem que é correto aplicar a regressão, isso é correto, mas eu gostaria de saber se existe um coeficiente como pearson / spearman para esse tipo de dados.
Também acho que não é tão apropriado usar o coeficiente de correlação de Spearman, já que as cidades não são classificáveis.
Eu também construí a função de Cramer V e Eta por mim mesmo (estou trabalhando com Matlab), mas para Eta eles não falam sobre nenhum valor p para ver se o coeficiente é estatisticamente significativo ...
No site matlabWorks, também há uma boa caixa de ferramentas que diz para calcular eta ^ 2, mas o tipo de entrada necessário não é compreensível.
Está aqui alguém que fez um teste como o meu? Se você precisar de mais detalhes para entender o tipo de dados que estou usando, basta me perguntar e tentarei explicar melhor.