Censura à direita e esquerda


10

A Wikipedia fornece as seguintes definições:

Censura correta : um ponto de dados está acima de um determinado valor, mas não se sabe quanto.
Censura à esquerda : um ponto de dados está abaixo de um determinado valor, mas não se sabe quanto.

Nestas definições, o que se entende por:

  • "ponto de dados"
  • "certo valor" e
  • "quanto"

Em geral, o que é censura à direita e à esquerda?

A afirmação abaixo é verdadeira:

"Na censura à direita, temos apenas o limite inferior para o valor censurado".

Qual seria a afirmação análoga para a censura à esquerda?


Consulte também stats.stackexchange.com/questions/197628/… para saber mais sobre a censura.
Tim

Respostas:


14

Como a tag de sobrevivência é usada, adicionarei uma resposta que oferece alguns exemplos com um sabor de análise de sobrevivência.

Ponto de dados

Por um ponto de dados, queremos dizer apenas alguma observação, ou seja, o resultado de uma ou mais variáveis. Por exemplo, podemos ter o seguinte em um conjunto de dados: a pessoa 1 em nosso estudo é do sexo masculino e morre aos 58 anos. Poderíamos considerar isso um ponto de dados. Mas no seu exemplo, é claro que o ponto de dados consiste apenas no resultado de uma variável, por exemplo, 58.

Censura à direita

Se estamos modelando o tempo até o fracasso, há uma razão óbvia para a censura, a saber, que não temos necessariamente tempo para esperar que todos os assuntos falhem. Digamos que estamos testando o efeito das vacinas infantis. Se tivéssemos conduzido um estudo randomizado, o último de nossos indivíduos morreria daqui a cem anos ou mais. Isso naturalmente introduz a censura, neste caso a censura correta, como em algum momento precisaríamos dizer "não sabemos quanto tempo essa pessoa viverá, apenas sabemos que ela ainda está viva". A censura à direita também pode ocorrer se as pessoas no estudo randomizado perderem o acompanhamento, por exemplo, elas podem querer interromper sua participação no estudo ou se afastar. Estes são exemplos de censura à direita, basicamente nós ' estamos interessados ​​na longevidade de nossos assuntos, mas devido a circunstâncias práticas, apenas temos observações censuradas, o que significa que, para alguns assuntos, nunca saberemos quando eles morrerão, apenas que em algum momento (o tempo de censura) eles ainda estavam vivos. Assim, sabemos que para um indivíduo censurado, o ponto de dados (hora da morte) é maior que um determinado valor (o tempo de censura).

Censura à esquerda

Como um exemplo de censura à esquerda, considere o seguinte. Digamos que alguma tropa de babuínos sempre dorme nas árvores. Queremos estimar a que horas da manhã eles descem das árvores e vamos assumir que eles descem todos os dias. Nós os seguimos por vários dias, no entanto, gostamos de dormir, o que significa que alguns dias eles descem antes mesmo de chegarmos ao local. Se chegarmos às 9 horas da manhã no dia e os babuínos já tiverem descido, teremos dados censurados à esquerda. Queremos saber quando eles desceram, mas tudo o que temos é um limite superior (9h), porque sabemos que no momento da chegada eles já haviam descido. Analogamente, agora sabemos que o ponto de dados (hora da descida no dia ) é menor que um determinado valor (9h).xx

Este exemplo é retirado de

Andersen, PK, Borgan, Ø, Gill, RD e Keiding, N. (1993), Modelos Estatísticos baseados em Processos de Contagem , Série Springer em Estatística, Springer-Verlag, Nova York.

Este livro fornece uma definição matemática de censura e provavelmente não é o primeiro livro sobre análise de sobrevivência que se deve obter. No entanto, também possui alguns exemplos intuitivos, como o descrito acima.


Mas, digamos, um babuíno ainda não desceu quando chegamos ao local (9h, certo valor). Então começamos a observar quando ele descerá. Então, não temos o ponto de dados (hora da descida) acima de determinado valor (9h)? Mas ainda são dados censurados à esquerda. A wikipedia deu a definição de maneira mais geral?
ABC

1
Eu assumi que toda a tropa desceu de uma só vez, todos juntos. Mas isso não faz muita diferença. Se chegarmos após a descida, conheceremos apenas um limite superior na hora da descida (a saber, a nossa hora de chegada); portanto, esse ponto de dados (hora da descida no dia específico) será censurado à esquerda. Se chegarmos antes da descida, esse ponto de dados não será censurado (a menos que nos cansemos de esperar e partamos antes da descida, nesse caso, temos dados censurados à direita, assumindo que eles descem todos os dias).
swmo

Outro exemplo de dados censurados à direita são os dados com intervalo de tempo em que não sabemos que estão começando. Isso geralmente é mal interpretado como dados censurados à direita (existem vários exemplos em fóruns e listas de discussão com esse equívoco).
Drevicko

4

Suponha que eu possua um bar onde as bandas tocam. O bar é bem pequeno, então apenas 150 pessoas podem assistir a um show a qualquer momento (essa é a chave). Como vendo ingressos para os shows, meus dados contábeis ficariam assim:

date     band               price   tickets_sold
10/01/14 Texas Instruments  $20     2
10/02/14 Unkind Donuts      $30     150
...
03/02/15 The Capybaras      $15     120

Um ponto de dados é apenas uma linha nesta tabela.

Suponha que a variável que eu quero considerar seja a demanda por tickets. A demanda pelo primeiro show não é censurada. Apenas duas pessoas queriam ver a Texas Instruments por US $ 20 e 148 ingressos não foram vendidos. Conheço exatamente a demanda de US $ 20: os 2 ingressos que foram vendidos.

No entanto, a variável demanda é censurada na segunda linha porque o programa esgotou. Eu sei que pelo menos 150 pessoas queriam ver o Unkind Donuts por US $ 30 por ingresso, mas quantas pessoas que se recusaram sem ingresso são desconhecidas para mim, então não sei exatamente a demanda. Tudo o que sei é o limite inferior de 150.

Agora, suponha que eu quisesse avaliar a participação no terceiro show. Poderíamos contar pessoas na porta, mas, para o bem deste exemplo, vamos supor que meu segurança seja ruim em aritmética. Sabemos que algumas pessoas compram ingressos e depois não vêm. Isso significa que o comparecimento é de no máximo 120, já que é quantos ingressos vendidos. Esse é o limite superior da participação em The Capybaras, que é censurado à esquerda.


1

Um equívoco comum com a censura à esquerda é a classificação de um ponto de dados com intervalo de tempo em que você não sabe que está começando. Muitos acham que isso é censurado à esquerda, mas na verdade é censurado à direita, já que temos um limite mais baixo na duração do intervalo.

Um exemplo concreto pode ser dados clínicos sobre a duração da "varíola", geralmente uma doença não terminal, e estamos interessados ​​no tempo que as pessoas levam para se recuperar. Os sintomas da varíola são fáceis de observar (por exemplo: seus dentes ficam verdes). A maioria das pessoas em nosso estudo sabe exatamente quando isso começou e quando terminou.

O exemplo clássico de dados censurados à direita neste tipo de estudo são indivíduos que ainda estavam com varíola no final do estudo ou ainda com varíola quando desapareceram ("perdidos para acompanhar") durante o estudo (vamos supor que saber a data de início da doença para essas pessoas). Para essas pessoas, temos um limite menor de duração, portanto, seus dados são censurados corretamente . Isso é intuitivamente "censurado à direita", pois não sabemos o lado direito do período.

O problema é quando não sabemos a data de início do período (pessoas que moram sozinhas e não têm espelho, por isso não sabem quando seus dentes ficaram verdes). Estes são esquerdos ou direitos censurados? Muitos pensam erroneamente que o lado esquerdo do período é desconhecido e, portanto, deixado censurado. Esse é um resultado infeliz da terminologia, que eu acho que desenvolveu na ausência desse tipo de censura. Para essas pessoas, temos um limite mais baixo no período (sabemos que eles tiveram febre, pelo menos desde quando o vizinho mencionou seus dentes verdes até que melhoraram ou o estudo terminou e eles ainda estavam doentes), portanto, seus dados são certo censurado .


2
Eu acho que sua resposta é um pouco confusa. No começo, você fala sobre censurar um intervalo de tempo, mais tarde sobre censurar um período de tempo (um único número). No último parágrafo, você pode igualmente afirmar que os dados são intervalos desde o momento do início da varíola até a morte. Nesse caso, você teria intervalos censurados à esquerda no seu exemplo, pois não necessariamente sabe a hora exata do início, apenas um limite superior. Igualmente bem, você pode (como você) observar a duração da varíola; nesse caso, você pode obter um limite mais baixo da duração e, assim, ter a censura correta.
swmo

Como você codificaria isso nos dados, por exemplo, em um objeto R Surv? O evento de um registro censurado à direita à esquerda seria "remissão" ou "ocorrência de evento", enquanto o evento de um registro censurado à direita seria "censurado à direita / sem ocorrência / sem remissão"? Além disso, parece que as taxas de risco devem ser diferentes entre os dois tipos de eventos truncados à direita, uma vez que devem ser modelados como uma função desde o início da doença? Que tipo de modelo lidaria com isso?
Allen Wang

@AllenWang Com medo de não ser muito familiar com os objetos R Surv, mas espero que a terminologia deles seja consistente. Portanto, se você tiver cuidado para entender e segui-la, deve ficar bem. Quanto às taxas de risco, não há diferença, em ambos os casos, você só tem um limite inferior na duração do evento.
drevicko
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.