Eu apenas tive que resolver esse problema exato. Tivemos uma escala de 9 pontos que foi alterada para uma escala de 5 pontos em um rastreador que remonta 10 anos. Não apenas isso, mas algumas das declarações também mudaram. E estávamos reportando como uma forma do Net Promoter Score.
A solução que usamos aplicou é um design emparelhado, perguntando a cada entrevistado algumas das declarações antigas da maneira antiga (assim como toda a nova). Só pedimos a um casal o caminho antigo, e não todos, uma vez que isso minimiza a fadiga dos entrevistados. Em seguida, pegamos cada pontuação na escala de 9 pontos e descobrimos que ela é média na pontuação de 5 pontos e usamos isso para corrigir a mudança de escala E a mudança de instrução. Isso é bastante semelhante ao chamado "julgamento semântico do valor da palavra fixa" em alguns artigos, mas em vez de usar especialistas para decidir o "valor da palavra", usamos os dados reais dos entrevistados.
Por exemplo, se a pontuação média na escala de 5 pontos fosse 1,2 para os respondentes que responderam a 2 na escala de 9 pontos, para comparar diretamente anos com escalas diferentes na escala de 5 pontos, substituiríamos todos os 2 na escala de 9 pontos com 1.2, faça o mesmo para todas as pontuações de 9 pontos e prossiga normalmente.
Fizemos uma coisa semelhante ao relatar o NPS. Mas primeiro convertemos a escala de 5 pontos para a escala NPS de 1 (promotor), 0 (passivo), -1 (detrator), por exemplo, se a média na escala NPS foi de 0,9 para um 2 na escala de 9 pontos, substituímos com 0,9, faça o mesmo para todas as pontuações de 9 pontos e calcule o NPS normalmente.
Para avaliar a eficácia disso, comparamos primeiro as pontuações do NPS 'não corrigidas' usando as escalas de 9 e 5 pontos para ver se havia realmente algum problema e, depois, as 'corrigidas'. Ainda não tenho os dados, mas informarei quando o fizermos!