Estou tentando entender como posso modelar melhor uma variável onde, com o tempo, obtive preditores cada vez mais detalhados. Por exemplo, considere modelar taxas de recuperação em empréstimos inadimplentes. Suponha que tenhamos um conjunto de dados com 20 anos de dados e, nos primeiros 15 desses anos, apenas sabemos se o empréstimo foi garantido ou não, mas nada sobre as características desse colateral. Nos últimos cinco anos, no entanto, podemos dividir as garantias em uma série de categorias que, espera-se, sejam um bom indicador da taxa de recuperação.
Dada essa configuração, desejo ajustar um modelo aos dados, determinar medidas como a significância estatística dos preditores e prever com o modelo.
Em qual estrutura de dados ausentes isso se encaixa? Existem considerações especiais relacionadas ao fato de que as variáveis explicativas mais detalhadas só se tornam disponíveis após um determinado momento, em vez de serem espalhadas pela amostra histórica?