Análise da linha do tempo


10

Estou realizando pesquisas sobre a relação entre a ordem de nascimento de uma pessoa e o risco posterior de obesidade usando dados de várias coortes de um ano (por exemplo, http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2908417/ ).

Um dos principais desafios é que a ordem de nascimento está vinculada a outros recursos, como idade materna, número de irmãos mais novos e / ou mais velhos e espaçamento de nascimentos, que também podem influenciar o resultado por meio de diferentes mecanismos. Além disso, qualquer influência dessas coisas no risco de obesidade posterior pode ser modificada pela composição de gênero dos irmãos, incluindo a "criança indexada" (a participante da coorte de nascimentos).

Para cada criança indexada, era possível traçar uma linha do tempo que mostrasse todos os nascimentos na família, com a idade materna na variável tempo.

insira a descrição da imagem aqui

Estou tentando identificar métodos para analisar esses tipos de dados, onde a ordem, o tempo e a natureza dos eventos podem ser importantes. Estou fazendo essa pergunta aqui por causa da diversidade de aplicativos com os quais os membros trabalham - espero que alguém tenha algumas sugestões imediatas que levem muito mais tempo para me identificar sozinhas. Qualquer cutucada na (s) direção (ões) correta (s) seria muito apreciada.

Pergunta (s) relacionada (s): Como devo analisar os dados sobre os intervalos de nascimento das mulheres?


11
+1. A pergunta usual: você tem os dados do IMC dos pais?
Deer Hunter

Sim, existem alguns dados antropométricos longitudinais para as mães das crianças-índice. Infelizmente, não para os irmãos, impedindo qualquer análise interna vs entre famílias.
DL Dahly

Não há muitos pensamentos úteis sobre a questão da linha do tempo no momento. Você pode querer ter a idade materna no primeiro parto como outra variável independente; Eu suponho que você já fez análise exploratória e visualização ...
Deer Hunter

É evidente que a idade materna é importante, e é por isso que os prazos acima usam a idade materna como variável temporal. Acho que o que espero encontrar é um método alternativo que ofereça mais do que apenas jogar tudo em um modelo linear.
DL Dahly

Não tenho certeza se isso importa, mas eu acho que o peso ao nascer, ou o peso médio ao nascer dos filhos de uma mulher pode ser uma covariável interessante. Além disso, você pode fornecer mais informações sobre seu resultado? Você tem medidas repetidas?
ReliableResearch

Respostas:


2

Você pode considerar o uso de modelos multiníveis (regressão mista) para estimar os efeitos entre e dentro da família. Uma estratégia possível é usar uma abordagem de construção de modelo hierárquica planejada. Por exemplo, teste cada preditor em potencial em um modelo univariado. Se os efeitos entre famílias removerem o efeito da ordem de nascimento, isso sugere fortemente que a ordem de nascimento não é importante, mas que outras influências são. Um exemplo de citação para isso para efeitos de ordem de nascimento no QI:

Espero que isso seja útil.


+1 para uma boa ideia que me deparei também, mas não tenho dados de resultados de irmãos para essa análise específica.
DL Dahly

0

Estou abordando isso como uma questão estatística e não tenho conhecimento especial dos problemas médicos.

Observando o artigo a que você se refere, vejo que uma coorte continha 970 indivíduos. Se você tiver dados sobre várias coortes aproximadamente desse tamanho, o tamanho geral do seu conjunto de dados oferece a oportunidade de selecionar subconjuntos razoavelmente grandes nos quais a linha do tempo de cada indivíduo atende a condições específicas. Por exemplo, um subconjunto pode incluir, por exemplo, todos os indivíduos do sexo masculino com idade materna 25-29. Uma regressão, para esse subconjunto, de uma medida adequada da obesidade posterior contra a ordem de nascimento, eliminaria qualquer efeito possível na obesidade posterior das diferenças de gênero da criança-índice e eliminaria amplamente qualquer efeito possível da idade materna.

Não é fácil estender essa abordagem ao gênero dos irmãos, pois se uma condição para um subconjunto for, digamos, que o filho indexador tenha um irmão mais velho, isso implica que o filho indexador não é ele próprio filho mais velho, estreitando o intervalo da variável independente na regressão. No entanto, uma maneira de contornar isso pode ser definir condições usando "se houver". Por exemplo, um subconjunto pode ser definido para incluir todos os indivíduos do sexo masculino com idade materna de 25 a 29 anos e os irmãos mais velhos, se houver, todos do sexo feminino. Esse subconjunto ainda incluiria indivíduos com qualquer ordem de nascimento.

Se um subconjunto for definido por um conjunto de condições muito complexo, o número de indivíduos que ele contém pode ser tão pequeno que as estimativas resultantes dos coeficientes seriam imprecisas demais para serem úteis. Se essa abordagem fosse adotada, provavelmente haveria uma troca de julgamento, na definição de subconjuntos, entre a eliminação do maior número possível de efeitos possível e a inclusão de indivíduos suficientes para produzir um resultado útil.


Obrigado pela resposta Adam. Nesse caso, no entanto, não acho que estratificar a amostra lhe dirá algo além de um modelo ajustado da mesma forma. Pode muito bem ser que um modelo linear adequadamente especificado seja a melhor maneira de fazer isso ... Eu só esperava ver se estatísticos em outros campos lidavam com problemas semelhantes de maneiras diferentes.
DL Dahly

Concordo - se é isso que você está dizendo - que minha abordagem é equivalente a uma única regressão em todo o conjunto de dados usando inúmeras variáveis ​​indicadoras. Tomando a idade materna como exemplo, um problema em potencial em qualquer modelo que a trate como uma variável contínua é que ela requer uma suposição de forma funcional (uma relação entre idade materna e obesidade posterior pode ser curvilínea). Por outro lado, um modelo que utiliza um conjunto de variáveis ​​indicadoras para faixas etárias maternas não precisa dessa suposição e, nesse sentido, é mais geral.
Adam Bailey

0

Eu sugeriria a análise funcional dos dados, mas suspeito que você possa ter muitas famílias com muito poucos filhos para obter estimativas razoáveis. Vá em frente e leia-o, pois ele atende às suas necessidades. Talvez alguém já tenha usado com dados semelhantes.

Se você não quiser fazer algo tão paramétrico em massa, use sua experiência clínica para reduzir a dimensionalidade dos dados. Por exemplo, uma variável em seu modelo pode ser o número de filhos, outra pode ser o número médio de anos entre os filhos e assim por diante. Se houver algum efeito nessas variáveis, ele poderá aparecer mesmo que você não tenha especificado corretamente o formulário funcional imediatamente. Uma construção de modelo mais orientada ao conhecimento pode permitir que você crie um modelo altamente preditivo - apenas certifique-se de manter um conjunto de validação!


Uso o FDA e não sei como isso se aplica. Eu poderia definir o eixo x = 0 para cada filho do índice e ter outros irmãos plotados em +/- tempo nesse eixo; e ter idade materna como eixo y; e então estimar um objeto de dados funcionais monotônicos para cada filho do índice ... mas assim que eu fiz isso, perdi todas as informações sobre o número real de irmãos e onde eles caem ao longo da linha (porque tudo agora é resumido por a função). O FDA inclui vários modos de análise - você tinha algo mais específico em mente?
DL Dahly
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.