Os repositórios de dados de saúde pública nos Estados Unidos estão mudando para uma AGE no formato de anos, com incrementos de cinco anos, devido ao impacto dos regulamentos da HIPAA em relação à ocultação e ocultação intencional de dados por motivos de privacidade pessoal.
Dado esse desafio ao que havia sido no passado (antes do HIPAA) um nível de dados de medida de escala bastante razoável com base na diferença entre a data de nascimento e a data da morte, talvez seja necessário reconsiderar a AGE como uma variável de escala que pode ser descrito parametricamente em conjuntos de dados de saúde pública, a favor de modelos que descrevem a idade de maneira não paramétrica, como um nível de medida ordinal. Sei que isso pode parecer "exagerado" para muitas facções da comunidade de informática biomédica, mas essa ideia pode ter algum mérito em termos de "interpretação", conforme descrito nos comentários acima.
E quanto a todo o poder analítico disponível para as abordagens não paramétricas? Sim, é verdade que todos nós quase universalmente tentamos aplicar técnicas GLM (modelo linear geral) a uma variável que se apresenta a nós em distribuições que se comportam da maneira que a AGE faz.
Ao mesmo tempo, o formato dessa distribuição e como esse formato está sendo determinado pelos efeitos de interação de múltiplas dimensões em centróides multidimensionais e centróides de subgrupos presentes na distribuição devem ser levados em consideração. O que fazer com esses conjuntos de dados muito complexos?
Quando um elemento de dados falha em atender às "premissas do modelo", examinamos progressivamente (eu disse transversalmente, não para baixo; devemos ser empregadores de método com oportunidades iguais, cada ferramenta vem da fábrica com o formulário segue as regras de função) da lista de outros modelos possíveis para encontrar aqueles que "não falham" nos testes de suposições.
No atual formato dos conjuntos de dados de saúde pública, precisamos (como uma comunidade de visualização de dados) realmente de apresentar um modelo mais padrão para lidar com a AGE em incrementos de cinco anos (5YI). Meu voto na visualização de dados do AGE (dado o novo formato 5YI) é usar histogramas e gráficos de caixas e bigodes. Sim, isso significa a mediana. (Sem trocadilhos!)
Às vezes, uma imagem vale mais que mil palavras e um resumo é um resumo de mil palavras. O gráfico de caixa e bigode mostra a "forma" da distribuição como uma representação simbólica significativa do histograma em um nível quase icônico de resolução. Comparar as distribuições dos incrementos de cinco anos de idade, mostrando gráficos de caixas e bigodes "lado a lado", nos quais é possível comparar instantaneamente visualmente padrões de 75 a 50 (mediana) a 25º ntiles, seria um "padrão universal" elegante para comparar a IDADE entre o mundo. Para aqueles de nós que continuam gostando da emoção da representação de dados através da mecânica textual da exibição tabular, o diagrama "caule e folha" também pode ser útil quando empregado como elemento gráfico visual animado em um "sparkline"
A IDADE atingiu a maioridade. Ele precisa ser explorado ainda mais com os algoritmos computacionais mais poderosos que estão agora disponíveis.