Semelhanças e diferenças entre o modelo de TRI e o modelo de regressão logística

9

Apesar das semelhanças básicas como os dois modelos, a probabilidade de sucesso, em vez de modelar diretamente a variável resposta; Acredito que existem respostas mais confiáveis que apontam as diferenças e semelhanças entre esses modelos.

Uma diferença é que, na logística, pode-se usar diferentes tipos e diferentes números de variáveis independentes; enquanto no modelo da TRI apenas temos apenas uma variável independente que é a capacidade.

Mais uma semelhança: para estimar os parâmetros em logística, usamos a abordagem de máxima verossimilhança. Na TRI também usamos a probabilidade máxima marginal como uma das abordagens de estimativa de parâmetros.

Então, alguém pode indicar as diferenças estatísticas / matemáticas nesses dois modelos?

— Artiga
fonte

1

A TRI (também conhecida como análise de características latentes) às vezes é chamada de análise fatorial logística ( consulte ). A diferença entre LR e IRT é paralela à diferença entre regressão linear e análise fatorial. Na regressão, a variável dependente é fornecida, juntamente com as variáveis independentes do manifesto. Na análise fatorial e em outros modelos de variáveis latentes, o latente é extraído das variáveis manifestas fornecidas; além disso, é o latente que então é visto como a variável independente que "prediz" as manifestas.

— ttnphns

@ttnphns, muito obrigado pela resposta. Portanto, estou cometendo um erro se estiver referindo uma variável Y como resposta a um item e depois modelando a probabilidade de que ela esteja correta. Nesse cenário, eu já não conhecia minha variável dependente? E mais uma pergunta, variável manifesta, você quer dizer dependente na TRI, certo?

— Art

Repetir. Em uma regressão, você tem DVs manifestos Y e IVs manifestos X. Em modelos de variáveis latentes (análise fatorial, TRI, ...) Você tem apenas X. Os fatores latentes F são extraídos de X, mas extraídos para considerá-los como preditores de X, ou seja, eles servem os IVs para X, que são os DVs. Na regressão logística, a DV categórica é uma função logística da combinação linear de IVs (geralmente contínuos). Na TRI, as variáveis categóricas observadas são função logística da combinação linear de Fs contínuos.

— ttnphns

11

Dê uma olhada na Seção 1.6 ("A perspectiva da regressão linear") em De Boeck e Wilson (2008), Modelos de resposta a itens explicativos ( http://www.springer.com/de/book/9780387402758 ) e Formann, AK (2007). , (Quase) Equivalência entre estimativas de máxima verossimilhança condicional e de mistura para alguns modelos do tipo Rasch. Em M. von Davier e CH Carstensen (Eds.), Modelos Rasch multivariados e de distribuição de mistura (pp. 177-189), Nova York: Springer.

Em resumo: os modelos de TRI são modelos de efeitos mistos não lineares generalizados :

a pontuação de um aluno em um item é a variável dependente, $Y_{pi}\in\left\{ 0,1\right\}$ $p$ $i$
dada a característica de um aluno amostrado aleatoriamente, por exemplo, , as respostas são assumidas como independentes, distribuídas por Bernoulli, $\theta_{p}\sim N\left(\mu,\sigma^{2}\right)$
dado , o preditor é uma combinação linear de características do item $\theta_{p}$ $\eta_{pi}=\textrm{logit}\left(P\left(Y_{pi}=1\right)\right)$ $η_{p Eu} = \sum_{k = 0 0}^{K} b_{k} X_{Eu k} + θ_{p} + ε_{p Eu},$ $\eta_{pi}=\sum_{k=0}^{K}b_{k}X_{ik}+\theta_{p}+\varepsilon_{pi},$
deixar se , e , caso contrário - assim se obter o modelo Rasch $X_{ik}=-1,$ $i=k$ $X_{ik}=0$ $P (Y_{p Eu} = 1 ∣ θ_{p}) = \frac{\exp (θ_{p} - b_{Eu})}{1 + \exp (θ_{p} - b_{Eu})};$ $P\left(Y_{pi}=1\mid\theta_{p}\right)=\frac{\exp\left(\theta_{p}-b_{i}\right)}{1+\exp\left(\theta_{p}-b_{i}\right)};$

Observe que os modelos de TRI são estendidos para diferentes aspectos:

No que diz respeito ao poder discriminatório (2PL) e proporção supondo (3PL) de um produto $P (Y_{p Eu} = 1 ∣ θ_{p}) = c_{Eu} + (1 - c_{Eu}) \frac{\exp ({uma}_{Eu} (θ_{p} - b_{Eu}))}{1 + \exp ({uma}_{Eu} (θ_{p} - b_{Eu}))}$ $P\left(Y_{pi}=1\mid\theta_{p}\right)= c_i+(1-c_i)\frac{\exp\left(a_{i}\left(\theta_{p}-b_{i}\right)\right)}{1+\exp\left(a_{i}\left(\theta_{p}-b_{i}\right)\right)}$
$P (Y_{p Eu} = k ∣ θ_{p}) = \frac{\exp ({uma}_{Eu k} θ_{p} - b_{Eu k})}{\sum_{k = 0 0}^{K} \exp ({uma}_{Eu k} θ_{p} - b_{Eu k})}$ $P\left(Y_{pi}=k\mid\theta_{p}\right)=\frac{\exp\left(a_{ik}\theta_{p}-b_{ik}\right)}{\sum_{k=0}^{K}\exp\left(a_{ik}\theta_{p}-b_{ik}\right)}$
$θ_{p} \sim N (Z β, σ^{2}),$ $\theta_{p}\sim N\left(\mathbf{Z}\boldsymbol{\beta},\sigma^{2}\right),$
$P (Y_{p Eu} = 1 ∣ θ_{p}) = \frac{\exp (\sum_{d} {uma}_{Eu d} θ_{p d} - b_{Eu})}{1 + \exp (\sum_{d} {uma}_{Eu d} θ_{p d} - b_{Eu})}, θ_{p} \sim N^{d} (μ, Σ)$ $P\left(Y_{pi}=1\mid\theta_{p}\right)=\frac{\exp(\sum_{d}a_{id}\theta_{pd}-b_{i})}{1+\exp(\sum_{d}a_{id}\theta_{pd}-b_{i})},\quad\theta_{p}\sim N^{d}\left(\boldsymbol{\mu},\Sigma\right)$
$P (Y_{p Eu} = 1 ∣ θ_{p (eu)}) = \frac{\exp (θ_{p (eu)} - b_{Eu (eu)})}{1 + \exp (θ_{p (eu)} - b_{Eu (eu)})}, θ_{p (eu)} \in {θ_{p (1)}, \dots, θ_{p (eu)}}$ $P\left(Y_{pi}=1\mid\theta_{p(l)}\right)=\frac{\exp(\theta_{p(l)}-b_{i(l)})}{1+\exp(\theta_{p(l)}-b_{i(l)})},\quad\theta_{p(l)}\in\left\{ \theta_{p(1)},\dots,\theta_{p(L)}\right\}$

(retirado dos slides useR! 2015 para o pacote R TAM )

— Tom
fonte

3

Também há artigos disponíveis gratuitamente por de Boeck et al neste jstatsoft.org/article/view/v039i12, além de seu folheto statmath.wu.ac.at/courses/deboeck/materials/handouts.pdf

— Tim

0

A resposta de @ Tom é excelente, mas eu gostaria de oferecer uma versão mais heurística e que introduz um conceito adicional.

Regressão logística

Imagine que temos várias perguntas binárias. Se estivermos interessados na probabilidade de responder sim a qualquer uma das perguntas e se estivermos interessados no efeito de algumas variáveis independentes nessa probabilidade, usamos a regressão logística:

$P(y_i = 1) = \frac{1}{1 + exp(X\beta)} = logit^-1(X\beta)$

$\beta$

IRT

Agora, observe que eu disse que tínhamos várias perguntas binárias. Todas essas perguntas podem ter algum tipo de característica latente, por exemplo, habilidade verbal, nível de depressão, nível de extroversão. Frequentemente, estamos interessados no nível da característica latente em si.

$\beta$ $\theta$ $\theta$

$P(y_i = 1) = logit^-1[a_i(\theta_j - b_i)]$

$a_i$ $b_i$

$\theta$

Usei itens binários e regressão logística para simplificar, mas a abordagem generaliza para itens ordenados e regressão logística ordenada.

IRT explicativa

$\beta$

Como mencionado anteriormente, um modelo para estimar a característica latente é apenas contar o número de respostas corretas ou somar todos os valores de seus itens do Likert (ou seja, categóricos). Isso tem suas falhas; você está assumindo que cada item (ou cada nível de cada item) vale a mesma quantidade da característica latente. Essa abordagem é bastante comum em muitos campos.

Talvez você possa ver para onde estou indo com isso: você pode usar a TRI para prever o nível da característica latente e, em seguida, realizar uma regressão linear regular. Isso ignoraria a incerteza no traço latente de cada pessoa.

$\theta$ $\theta$

Mais leitura disponível na excelente introdução de Phil Chalmers ao seu mirtpacote. Se você entende as porcas e parafusos do IRT, eu iria para a seção IRT de efeitos mistos desses slides . O Stata também é capaz de ajustar modelos explicativos de TRI (embora eu acredite que não possa caber em modelos aleatórios de IRT explicativos, como descrevi acima).

— Weiwen Ng
fonte