Existem duas partes para isso: (a) selecionar um gráfico ( desenho experimental ) para determinar quais pares de ensaios os alunos avaliarão no processo de classificação por pares; e (b) classificar todos os ensaios, com base nas notas dos pares, para determinar qual o professor deve classificar. Vou sugerir alguns métodos para cada um.
Escolhendo um gráfico
Declaração do problema. O primeiro passo é gerar um gráfico. Em outras palavras, você precisa selecionar quais pares de ensaios serão exibidos aos alunos durante o exercício de classificação por pares.
Solução sugerida. Para esta tarefa, sugiro que você gere um gráfico aleatório , selecionado uniformemente aleatoriamente no conjunto de todos os gráficos tridimensionais (simples).G
Justificação e detalhes. Sabe-se que um gráfico regular aleatório é um bom expansor. De fato, os gráficos regulares têm fator de expansão assintoticamente ideal. Além disso, como o gráfico é aleatório, isso deve eliminar o risco de distorcer a classificação. Ao selecionar um gráfico uniformemente aleatoriamente, você garante que sua abordagem seja igualmente justa para todos os alunos. Suspeito que um gráfico 3-regular uniformemente aleatório seja ideal para seus propósitos.d
Isso levanta a questão: como podemos selecionar um gráfico 3-regular (simples) em vértices, uniformemente aleatoriamente?n
Felizmente, existem algoritmos conhecidos para fazer isso. Basicamente, você faz o seguinte:
Crie pontos. Você pode pensar nisso como 3 cópias de cada um dos n vértices. Gere, uniformemente aleatoriamente, uma correspondência perfeita aleatória nesses 3 n pontos. (Em outras palavras, repita o procedimento a seguir até que todos os 3 pontos n estejam emparelhados: selecione qualquer ponto não emparelhado e emparelhe-o com outro ponto escolhido uniformemente aleatoriamente no conjunto de pontos não emparelhados.)3 nn3 n3 n
Para cada dois pontos correspondentes à correspondência, desenhe uma aresta entre os vértices correspondentes (dos quais são uma cópia). Isso fornece um gráfico em vértices.n
Em seguida, teste se o gráfico resultante é simples (ou seja, não possui auto-loops nem arestas repetidas). Se não for simples, descarte o gráfico e volte para a etapa 1. Se for simples, você terminou; imprima este gráfico.
O ( 1 )
Eu vi essa abordagem creditada a Bollobas, Bender e Canfield. A abordagem também é resumida brevemente na Wikipedia . Você também pode encontrar uma discussão nesta postagem do blog .
nnn
Classificação de todos os ensaios
Declaração do problema. OK, agora você tem um gráfico e apresentou esses pares de ensaios (conforme indicado pelas bordas do gráfico) aos alunos para que eles classifiquem durante o exercício de classificação por pares. Você tem os resultados de cada comparação de ensaios. Agora, sua tarefa é inferir uma classificação linear em todos os ensaios, para ajudá-lo a determinar quais os que o professor deve avaliar.
Solução. Sugeri que você usasse o modelo Bradley-Terry . É uma abordagem matemática que resolve exatamente esse problema. Foi projetado para classificar jogadores em algum esporte, com base nos resultados de partidas entre alguns pares de jogadores. Ele assume que cada jogador possui uma força (desconhecida), que pode ser quantificada como um número real, e a probabilidade de Alice vencer Bob é determinada por alguma função suave da diferença de suas forças. Então, dados os registros de ganhos / perdas em pares, ele estima a força de cada jogador.
Isso deve ser perfeito para você. Você pode tratar cada ensaio como um jogador. Cada comparação entre dois ensaios (durante o processo de classificação por pares) é como o resultado de uma correspondência entre eles. O modelo de Bradley-Terry permitirá que você pegue todos esses dados e inferir uma força para cada ensaio, onde forças mais altas correspondem a melhores ensaios. Agora você pode usar esses pontos fortes para classificar todos os ensaios.
Euj
Existem maneiras alternativas de inferir classificações ou classificações para todos os ensaios, dados os dados que você possui. Por exemplo, o método Elo é outro. Resumo vários deles na minha resposta a uma pergunta diferente ; leia essa resposta para mais detalhes.
Outro comentário: O modelo de Bradley-Terry assume que o resultado de cada comparação entre dois jogadores é uma vitória ou uma perda (ou seja, um resultado binário). No entanto, parece que você realmente terá dados mais detalhados: seu controle deslizante fornecerá uma estimativa aproximada de quanto melhor o aluno classificou um ensaio do que outro. A abordagem mais simples seria apenas mapear cada controle deslizante para um resultado binário. No entanto, se você realmente quiser, poderá usar todos os dados usando uma análise mais sofisticada. O modelo de Bradley-Terry envolve fazer regressão logística. Se você generaliza isso para usar o logit ordenado , aposto que você poderia tirar proveito das informações extras que você tem de cada controle deslizante, já que os resultados dos controles deslizantes não são binários, mas são uma das várias possibilidades.
Uso eficiente do professor
Você sugere que o professor classifique manualmente o X% superior e o X% inferior de todos os ensaios (usando a classificação deduzida dos resultados da classificação por pares). Isso poderia funcionar, mas suspeito que não seja o uso mais eficiente do tempo limitado do professor. Em vez disso, gostaria de sugerir uma abordagem alternativa.
Sugiro que você classifique o professor em um subconjunto dos ensaios, com o subconjunto cuidadosamente selecionado para tentar fornecer a melhor calibração possível para todos os ensaios que não foram classificados pelo professor. Para isso, acho que pode ajudar se você selecionar uma amostra de ensaios que cubram a gama de respostas possíveis (portanto, para cada ensaio, há algum ensaio com classificação de professor que não está muito longe disso). Para isso, posso pensar em duas abordagens que você poderia considerar tentar:
nkkk
kd( eEu, ej)eEuejSd( e , S) = mine′∈ Sd( e , e′)eSke1 1, e2, … , Ek, Como segue:ei + 1d( e , { e1 1, e2, … , EEu} )ee ∉ { e1 1, e2, … , EEu}kkk
Suspeito que qualquer uma dessas abordagens possa fornecer pontuações mais precisas do que fazer com que o professor classifique os X% superiores e os X% inferiores dos ensaios - uma vez que os melhores e os piores ensaios provavelmente não são representativos da massa de ensaios no meio.
d( e1 1, e2) = ( s ( e1 1) - s ( e2) )2s ( e )ee1 1e2k