Estou usando o Lasso para seleção de recursos em uma configuração dimensional relativamente baixa (n >> p). Depois de ajustar um modelo Lasso, quero usar as covariáveis com coeficientes diferentes de zero para ajustar um modelo sem penalidade. Estou fazendo isso porque quero estimativas imparciais que Lasso não pode me dar. Eu também gostaria de valores-p e intervalos de confiança para a estimativa imparcial.
Estou tendo problemas para encontrar literatura sobre esse tópico. A maior parte da literatura que encontro é sobre colocar intervalos de confiança nas estimativas de Lasso, não um modelo reformado.
Pelo que li, simplesmente reequipar um modelo usando todo o conjunto de dados leva a pequenos valores irrealisticamente pequenos de p-values / std. No momento, a divisão de amostras (no estilo de Wasserman e Roeder (2014) ou Meinshausen et al. (2009)) parece ser um bom curso de ação, mas estou procurando mais sugestões.
Alguém encontrou este problema? Nesse caso, você poderia fornecer algumas sugestões.