Fiquei me perguntando se alguém poderia me ajudar com informações sobre curtose (ou seja, existe alguma maneira de transformar seus dados para reduzi-los?)
Eu tenho um conjunto de dados de questionário com um grande número de casos e variáveis. Para algumas das minhas variáveis, os dados mostram valores de curtose bastante altos (isto é, uma distribuição leptocúrtica), que é derivada do fato de que muitos dos participantes deram exatamente a mesma pontuação para a variável. Eu tenho um tamanho de amostra particularmente grande; portanto, de acordo com o teorema do limite central, as violações da normalidade ainda devem ser boas.
O problema, no entanto, é o fato de que os níveis particularmente altos de curtose estão produzindo vários discrepâncias univariadas no meu conjunto de dados. Assim, mesmo que eu transfira os dados ou remova / ajuste os valores extremos, os altos níveis de curtose significam que as próximas pontuações mais extremas se tornam automaticamente extremos. Eu pretendo usar (análise de função discriminante). Diz-se que o DFA é robusto ao afastamento da normalidade, desde que a violação seja causada por distorção e não por discrepâncias. Além disso, também é dito que o DFA é particularmente influenciado por discrepantes nos dados (Tabachnick & Fidel).
Alguma idéia de como contornar isso? (Meu pensamento inicial era uma maneira de controlar a curtose, mas não é uma coisa boa se a maioria da minha amostra está dando classificações semelhantes?)