Uma abordagem simples seria a seguinte.
Para as duas perguntas de preferência, faça a diferença absoluta entre as respostas dos dois entrevistados, fornecendo duas variáveis, digamos z1 e z2, em vez de quatro.
Para as questões de importância, posso criar uma pontuação que combine as duas respostas. Se as respostas fossem, digamos, (1,1), eu daria 1, a (1,2) ou (2,1) recebe 2, a (1,3) ou (3,1) recebe uma 3, um (2,3) ou (3,2) recebe um 4 e um (3,3) recebe um 5. Vamos chamar de "pontuação de importância". Uma alternativa seria usar max (response), fornecendo 3 categorias em vez de 5, mas acho que a versão de 5 categorias é melhor.
Agora eu criaria dez variáveis, x1 - x10 (para concretude), todas com valores padrão de zero. Para as observações com uma pontuação de importância para a primeira pergunta = 1, x1 = z1. Se a pontuação de importância para a segunda pergunta também = 1, x2 = z2. Para as observações com uma pontuação de importância para a primeira pergunta = 2, x3 = z1 e se a pontuação de importância para a segunda pergunta = 2, x4 = z2 e assim por diante. Para cada observação, exatamente um de x1, x3, x5, x7, x9! = 0 e da mesma forma para x2, x4, x6, x8, x10.
Tendo feito tudo isso, eu executaria uma regressão logística com o resultado binário como a variável alvo e x1 - x10 como os regressores.
Versões mais sofisticadas disso podem criar escores de maior importância, permitindo que a importância do entrevistado masculino e feminino seja tratada de maneira diferente, por exemplo, a (1,2)! = A (2,1), onde ordenamos as respostas por sexo.
Um déficit desse modelo é que você pode ter várias observações da mesma pessoa, o que significaria que os "erros", em termos gerais, não são independentes entre as observações. No entanto, com muitas pessoas na amostra, eu provavelmente ignoraria isso, para uma primeira passagem, ou construiria uma amostra onde não houvesse duplicatas.
Outro déficit é que é plausível que, à medida que a importância aumenta, o efeito de uma determinada diferença entre preferências em p (falha) também aumentaria, o que implica uma relação entre os coeficientes de (x1, x3, x5, x5, x7, x9) e também entre os coeficientes de (x2, x4, x6, x8, x10). (Provavelmente não é uma ordem completa, pois não é claro a priori para mim como uma pontuação de importância (2,2) se relaciona com uma pontuação de importância (1,3).) No entanto, não impusemos isso no modelo. Provavelmente eu ignoraria isso no começo e veria se estou surpreso com os resultados.
A vantagem dessa abordagem é que ela não impõe nenhuma suposição sobre a forma funcional da relação entre "importância" e a diferença entre respostas preferenciais. Isso contradiz o comentário anterior sobre o déficit, mas acho que a falta de uma forma funcional imposta é provavelmente mais benéfica do que a falha relacionada em levar em conta as relações esperadas entre os coeficientes.