Aqui está uma variedade surpreendentemente vasta de índices de cópias de respostas, com poucas discussões sobre seus méritos: http://www.bjournal.co.uk/paper/BJASS_01_01_06.pdf .
Existe um campo da psicologia (educacional) chamado teoria da resposta ao item (TRI) que fornece a base estatística para perguntas como essas. Se você é americano e fez um SAT, ACT ou GRE, lidou com um teste desenvolvido com o IRT em mente. O postulado básico da TRI é que cada aluno é caracterizado por sua capacidade a i ; cada questão é caracterizada por sua dificuldade b j ; e a probabilidade de responder a uma pergunta corretamente é
π ( a i , b j ; c ) = P r o b [ aluno iEuumaEubj
onde Φ ( z ) é o cdf do padrão normal ec é um parâmetro adicional de sensibilidade / discriminação (às vezes, é tornado específico da pergunta, c j , se houver informações suficientes, ou seja, participantes de teste suficientes para identificar as diferenças). Uma suposição escondida aqui que, dada a estudantes capacidade i
π( aEu, bj; c ) = P r o b [ aluno que responde à pergunta j corretamente ] = Φ ( c ( aEu- bj) ))
Φ ( z)ccjEu, as respostas para perguntas diferentes são independentes. Essa suposição é violada se você tiver uma série de perguntas sobre o mesmo parágrafo do texto, mas vamos abstraí-lo por um minuto.
Para perguntas "Sim / Não", esse pode ser o fim da história. Para mais de duas perguntas de categoria, podemos supor que todas as escolhas erradas são igualmente prováveis; para uma pergunta com k j escolhas, a probabilidade de cada escolha errada é π ′ ( a i , b j ; c ) = [ 1 - π ( a i , b j ; c ) ] / ( k j - 1 ) .jkjπ′( aEu, bj; c ) = [ 1 - π( aEu, bj; c ) ] / ( kj- 1 )
Para os alunos de habilidades e um k , a probabilidade de que eles combinam em suas respostas para uma pergunta com dificuldade b j é
ψ ( um i , um k ; b j , c ) = π ( um i , b j ; c ) π ( a k , b j ; c ) + ( k - 1 ) π ′ (umaEuumakbj
Se desejar, você pode dividir isso em probabilidade de corresponder à resposta correta, ψ c ( a i , a k ; b j , c ) = π ( a i , b j ; c ) π ( a k , b j ; c )
ψ ( aEu, umk; bj, c ) = π( aEu, bj; c ) π( ak, bj; c ) + ( k - 1 ) π′( aEu, bj; c) π′(ak,bj; c )
ψc(aEu,umk;bj, C )= π(aEu,bj; c) π(ak,bj; c ), e a probabilidade de corresponder a uma resposta incorreta,
, embora da estrutura conceitual da TRI, essa distinção dificilmente seja material.
ψEu( aEu, umk; bj, c ) = ( k - 1 ) π′( aEu, bj; c ) π′( ak, bj; c )
Eu( i , k ) = ∑j1 { correspondej} emψ ( aEu, umk; bj, c ) + 1 { sem correspondênciaj} em[ 1 - ψ ( aEu, umk; bj, C ) ]
E( i , k ) = E [ I( i , k ) ] = ∑jψ ( aEu, umk; bj, C ) lnψ ( aEu, umk; bj, c ) + ( 1 - ψ ( aEu, umk; bj, C ) ) ln[ 1 - ψ ( aEu, umk; bj, C ) ]
{ c , bj, j = 1 , 2 , … }{ aEu}lme4
irt <- glmer( answer ~ 1 + (1|student) + (1|question), family = binomial)
ou algo muito próximo disso.