Como lidar com o efeito teto devido à ferramenta de medição?


12

Reuni dados psicofisiológicos que medem a capacidade dos sujeitos (dois grupos) de perceber a vibração. Uma sonda vibratória se move contra a pele em deslocamentos cada vez menores, e o sujeito indica quando eles sentem a vibração. Infelizmente, em altas frequências, a sonda só pode se mover a uma curta distância e, às vezes, a maior distância que a sonda pode se mover ainda não é grande o suficiente para os sujeitos perceberem. Portanto, tenho valores-limite precisos para alguns assuntos, mas para alguns que nunca sentiram a vibração, simplesmente tenho um valor que sei que o limiar deles é maior que. Existe alguma maneira de eu ainda incluir esses dados? E qual é a melhor maneira de analisá-lo?


5
Estes são chamados de observações censuradas . Como incluí-lo depende do tipo de análise estatística que você está conduzindo.

Concordo com o procrastinador, exceto que usaria o termo truncado. A abordagem para um problema similar chamado censura correta ocorre na análise de sobrevivência. Lá, você mantém o valor truncado, mas possui uma variável indicadora para informar se o valor é um valor completo ou censurado. Na análise de sobrevivência, existe uma maneira simples de lidar com isso, mas isso é porque você está estimando uma curva de sobrevivência. Aqui você pode querer calcular médias. Se você ignora a trucação, subestima a média. Se você jogar fora os pontos truncados, subestima a média.
Michael R. Chernick

Para incorporar adequadamente os valores truncados, você precisa ter um modelo de probabilidade para a distância da sonda, uma vez que é maior que o limite. Em seguida, você pode calcular a média dessa distribuição e calcular uma média ponderada usando a média dos valores que não foram trocados com a média da distribuição truncada em que a ponderação está de acordo com a proporção de casos truncados.
Michael R. Chernick

4
O truncamento é o que aconteceria se você jogasse fora os dados não quantificados. Você não quer fazer isso! Você está certo, Cale, de que há informações nesses valores censurados e em suspeitar que existem algumas maneiras padrão de analisá-los (e armadilhas para os incautos). Mas, para fornecer uma boa resposta, precisaríamos saber que tipo de análise você procura. Em particular, o tratamento desses dados é fundamentalmente diferente, dependendo se eles aparecem como variáveis ​​dependentes ou independentes em uma regressão. Talvez você possa elaborar sobre isso?
whuber

1
Pequenos detalhes não relacionados à questão estatística em questão, mas pode ser útil saber: dados desse tipo são geralmente chamados de dados "psicofísicos", não "psicofisiológicos" (que incluem itens como medidas de freqüência cardíaca ou condutância da pele, mas não julgamentos subjetivos sobre sensações ) Isso também pode ajudá-lo a procurar literatura sobre como as pessoas geralmente tratam esse tipo de dados.
Gala #

Respostas:


2

Eu gosto de usar modelos de mistura heterogêneos para descrever efeitos combinados de fontes fundamentalmente diferentes.

Você pode olhar algo como um modelo "Zero Inflated Poisson" no estilo de Diane Lambert. " Regressão de Poisson inflada a zero, com aplicação a defeitos de fabricação ", Diane Lambert, Technometrics, vol. 34, Iss. 1, 1992

Acho essa idéia particularmente agradável porque parece contradizer a noção de que a aplicação do desenho estatístico de experimentos à medicina não pode curar completamente a doença. Por trás da noção, está a idéia de que o método científico não pode completar seu objetivo na medicina vem da idéia de que não existem dados sobre doenças de um indivíduo saudável "perfeitamente" e, portanto, que os dados não podem informar o remédio da doença. Sem medição, não há espaço para melhorar.

Usar algo como um modelo inflado a zero permite extrair informações úteis de dados que são parcialmente "livres de erros". Ele está usando a percepção do processo para pegar as informações que poderiam ser consideradas "silenciosas" e fazê-las falar. Para mim, esse é o tipo de coisa que você está tentando fazer.

Agora não posso começar a afirmar quais combinações de modelos usar. Suspeito que você possa usar um Modelo de Mistura Gaussiana com inflação zero (GMM) para iniciantes. O GMM é um pouco de um aproximador universal empírico para PDFs contínuos - como o primo PDF da aproximação da série Fourier, mas com o apoio do teorema do limite central para melhorar a aplicabilidade global e permitir tipicamente muitos menos componentes para criar um " boa "aproximação.

Melhor da sorte.

EDITAR:

Mais sobre modelos com inflamento zero:


0

Agrupar os resultados e definir uma escala pode ser uma solução.

Faça uma variável de categoria assim (ou diferente):

  1. Alta sensibilidade
  2. Sensibilidade normal
  3. Baixa sensibilidade
  4. Insensível (aqueles que estão fora de escala no seu caso)

Você pode usar essa variável para fazer a análise, mas se os resultados são significativos depende de quão bem você define as categorias.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.