Qual é a diferença entre censura e truncamento?


30

No livro Modelos Estatísticos e Métodos para Dados da Vida , está escrito:

Censura: Quando uma observação é incompleta devido a alguma causa aleatória.
Truncamento: quando a natureza incompleta da observação se deve a um processo de seleção sistemático inerente ao desenho do estudo.

O que se entende por "processo de seleção sistemático inerente ao desenho do estudo" na definição de truncamento?

Qual é a diferença entre censura e truncamento?


3
Dê uma olhada na resposta aqui .
Dimitriy V. Masterov

3
Censura: "Tivemos uma observação nessa região em algum lugar, mas não sabemos o que é". Truncamento: "Observação? Que observação?"
Glen_b -Reinstala Monica

De onde são citadas suas definições?
Glen_b -Reinstala Monica

11
@Glen_b Eu editei minha pergunta.
ABC

Respostas:


57

1 11,25245

Censura : algumas observações serão censuradas, o que significa que sabemos apenas que elas estão abaixo (ou acima) de alguma ligação. Isso pode ocorrer, por exemplo, se medirmos a concentração de um produto químico em uma amostra de água. Se a concentração for muito baixa, o equipamento de laboratório não poderá detectar a presença do produto químico. Ainda pode estar presente, portanto, sabemos apenas que a concentração está abaixo do limite de detecção do laboratório.

<1.5<1.5245,

Truncamento : o processo que gera os dados é tal que só é possível observar resultados acima (ou abaixo) do limite de truncamento. Isso pode, por exemplo, ocorrer se as medições forem realizadas usando um detector que somente será ativado se os sinais detectados estiverem acima de um determinado limite. Pode haver muitos sinais de entrada fracos, mas nunca podemos dizer usando este detector.

245

Então, nesse uso dos termos, "censurado" é enganoso se pensarmos em termos dos usos não técnicos da palavra? ou seja, nesse sentido estatístico, significa algo como "vago" ou "conhecido apenas por um alcance", e não em um sentido não técnico - ou seja, suprimido ou removido, como quando um livro é removido das lojas porque do seu conteúdo.
Mars

3
Para um exemplo concreto de truncamento, as companhias de seguros de automóveis nunca ouvem falar de acidentes em que o dano é menor que o dedutível, porque as pessoas não informam lá. Isso é truncamento esquerdo; nunca vemos dados sobre esses incidentes. Para um exemplo de censura correta, quando um paciente doente decide parar de consultar seu médico ou se muda para uma cidade diferente, tudo o que se sabe é que eles estavam vivos no dia em que partiram, mas não sabemos quando eles morreram .
David White

@ Marte: Concordo que soa ao contrário do uso não técnico moderno, em que "censurar" remove todos os vestígios e "truncar" remove detalhes. Mas, nas estatísticas, a "censura" é usada no sentido não técnico mais antiquado, em que um censor pode remover, mas não eliminar, qualquer vestígio de algo: caixas pretas ou borrões colocados sobre partes ofensivas de uma foto ou vídeo, bipes que cobrem palavrões no rádio, ou cartas dos soldados para casa ou documentos classificados, onde as partes censuradas (termo mais moderno "redigido") estão ocultas.
Wayne

Imagine que eu avalio o lapso de tempo entre dois tipos de eventos. Mas só posso gravar um evento por 1 ano. O tempo será censurado ou truncado?
skan

4

Assim como uma perspectiva de outro campo (programação), censurar e truncar são duas operações distintas.

Ao trabalhar com um conjunto de dados sensíveis, para os números de segurança social exemplo e números de telefone, eu poderia censurar -lo ou tê-lo censurado antes de o acesso ser concedido:

123-12-1234 => 999-99-9999
567-56-5678 => 999-99-9999
(906) 123-4567 => (000) 000-0000

Isso permite que o restante do aplicativo opere normalmente, com estruturas de dados semelhantes, mas sem conteúdo informativo real ou disseminação de informações privadas.

O truncamento, por outro lado, normalmente está apenas cortando os valores restantes após um certo ponto. Para trabalhar em um aplicativo, não preciso de centenas de milhares de registros, talvez precise apenas de 50 de cada um, o que torna o acesso aos dados muito mais rápido e os conjuntos de dados menores.

Uma variante semelhante de truncamento ocorre ao inserir um valor em uma coluna ou tipo de dados de comprimento ou precisão limitados:

abcdefghijklmnopqrstuv => abcdef
10.23412421345 => 10.23
10.92455311 => 10

11
+1 É importante saber que a censura e o truncamento podem ter significados completamente diferentes fora das estatísticas!
MånsT
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.