"Nenhum método gráfico" é uma grande desvantagem, mas ... aqui estão algumas idéias estranhas. Ambos tratam as classificações como contínuas, o que é uma fraqueza conceitual, e provavelmente não é a única ...
Kurtosis
- A curtose de {1,1,1,5,5,5} = 1. Você não terá uma curtose mais baixa com nenhum combo de 1 a 5 classificações.
- A curtose de {1,2,3,4,5} = 1,7. Menor significa valores mais extremos; mais alto significa mais meio.
- Isso não funcionará se a distribuição não for aproximadamente simétrica. Vou demonstrar abaixo.
Regressão binomial negativa
Com um quadro de dados como este: Ajustar o modelo F r e q u o e n c y ~ R um t i n g + √
Rating12345Frequency31157937
usando regressão binomial negativa. O
√Frequency∼Rating+Rating−−−−−−√ coeficiente
R a t i n g deve ser próximo de zero se as classificações forem
distribuídas uniformemente, positivo se houver proporcionalmente mais valores de faixa intermediária (cf.
distribuição binomialRating−−−−−−√ ) ou negativo com distribuições polarizadas como a acima, para as quais o coeficiente é - 11.8
FWIW, aqui está o código r com o qual eu brinco :
x=rbinom(99,4,c(.1,.9))+1;y=sample(0:4,99,replace=T)+1 #Some polarized & uniform rating data
table(x);table(y) #Frequencies
require(moments);kurtosis(x);kurtosis(y) #Kurtosis
Y=data.frame(n=as.numeric(table(y)),rating=as.numeric(levels(factor(y)))) #Data frame setup
X=data.frame(n=as.numeric(table(x)),rating=as.numeric(levels(factor(x)))) #Data frame setup
require(MASS);summary(glm.nb(n~rating+sqrt(rating),X)) #Negative binomial of polarized data
summary(glm.nb(n~rating+sqrt(rating),Y)) #Negative binomial of uniform data
Não resisto a jogar um enredo ...
require(ggplot2);ggplot(X,aes(x=rating,y=n))+geom_point()+stat_smooth(formula=y~x+I(sqrt(x)),method='glm',family='poisson')
O Rating−−−−−−√
Editar: acabei de ver esta pergunta anunciada na barra lateral:
e quando cliquei, vi-a nas perguntas da Hot Network, vinculando-se novamente, como às vezes acontece ,
então pensei que isso poderia merecer uma revisão de uma maneira mais geralmente útil. Decidi experimentar meus métodos nas avaliações de clientes da Amazon para Camiseta de manga curta The Mountain Three Wolf Moon :
RatingFrequency1208254389419852273
βRating√=−19.1
σ2FrequencyThe Mountain Three Wolf Moon Short Sleeve Tee Ratings=1.31
x=rep(5:1,c(2273,198,89,54,208))
var(x)/(4*length(x)/(length(x)-1))