A regularização pode ser útil se estivermos interessados apenas na modelagem, não na previsão?

A regularização pode ser útil se estivermos interessados apenas em estimar (e interpretar) os parâmetros do modelo, e não em previsão ou previsão?

Vejo como a regularização / validação cruzada é extremamente útil se seu objetivo é fazer boas previsões sobre novos dados. Mas e se você estiver fazendo economia tradicional e tudo o que importa é estimar $\beta$ ? A validação cruzada também pode ser útil nesse contexto? A dificuldade que luta com conceptual é que pode, na verdade, de computação $\mathcal{L}\left(Y, \hat{Y}\right)$ em dados de testes, mas que nunca pode computar $\mathcal{L}\left(\beta, \hat{\beta}\right)$ porque o verdadeiro $\beta$ é por definição, nunca observado. (Tome como suposição a existência de um verdadeiro $\beta$ , ou seja, que conhecemos a família de modelos a partir da qual os dados foram gerados.)

$\mathcal{L}\left(\beta, \hat{\beta}\right) = \lVert \beta - \hat{\beta} \rVert$

Ficaria feliz em ver um exemplo numérico simples de um modelo de regressão linear, com coeficientes , onde a função de perda do pesquisador é, por exemplo, ou apenas . Como, na prática, alguém poderia usar a validação cruzada para melhorar a perda esperada nesses exemplos? $\beta \equiv (\beta_1, \beta_2, \ldots, \beta_k)$ $\lVert \beta - \hat{\beta} \rVert$ $(\beta_1 - \hat{\beta}_1)^2$

Edit : DJohnson me indicou https://www.cs.cornell.edu/home/kleinber/aer15-prediction.pdf , que é relevante para esta pergunta. Os autores escrevem que

As técnicas de aprendizado de máquina ... fornecem uma maneira disciplinada de prever que (i) usa os dados em si para decidir como fazer o trade-off de variação de viés e (ii) permite pesquisar um conjunto muito rico de variáveis e formas funcionais. Mas tudo tem um custo: é preciso sempre ter em mente que, porque eles são ajustados para eles não dão (sem muitas outras suposições) garantias muito úteis para . $\hat{Y}$ $\hat{Y}$ $\hat{\beta}$

Outro artigo relevante, novamente graças a DJohnson: http://arxiv.org/pdf/1504.01132v3.pdf . Este artigo aborda a questão com a qual eu estava lutando acima:

Um ... desafio fundamental para a aplicação de métodos de aprendizado de máquina, como árvores de regressão prontas para uso, para o problema de inferência causal é que as abordagens de regularização baseadas na validação cruzada geralmente dependem da observação da "verdade fundamental", ou seja, resultados reais em uma amostra de validação cruzada. No entanto, se nosso objetivo é minimizar o erro quadrático médio dos efeitos do tratamento, encontramos o que [11] chama de “problema fundamental da inferência causal”: o efeito causal não é observado em nenhuma unidade individual e, portanto, não diretamente tenha uma verdade básica. Abordamos isso propondo abordagens para a construção de estimativas imparciais do erro quadrático médio do efeito causal do tratamento.

— Adrian
fonte

A validação cruzada é apenas um método nos kits de ferramentas de mineração de dados e aprendizado de máquina. ML está vendo um uso crescente em Economia - veja o site de Susan Athey em Stanford (ela é uma acadêmica interessada na integração de técnicas de ML em economia) ou este artigo Problemas de Política de Previsão de Kleinberg, et al., Em uma versão não-gated aqui: cs. cornell.edu/home/kleinber/aer15-prediction.pdf

— Mike Hunter

Por favor, pessoal, desambiguem: ML para muitos sugere aprendizado de máquina e para muitos outros sugere probabilidade máxima. (Definição: você está no lado da aprendizagem de máquina da cerca se ML traduz-se automaticamente para você como aprendizado de máquina.)

— Nick Cox

@Aksakal Minha experiência é que a econometria tradicional, como é ensinada aos estudantes de graduação e pós-graduação, presta atenção praticamente zero à validação cruzada. Veja Hayashi, que é um livro clássico. Certamente, talvez a validação cruzada e a troca de desvios e variações sejam mencionadas em um curso especificamente sobre previsão, mas não no curso principal em que todos os alunos começam. Isso soa certo para você?

— Adrian

@ Adrian Vejo que as pessoas estão votando para fechar esta questão como muito ampla. Pode ser que sim, mas, a meu ver, você está basicamente perguntando: "O CV pode ser útil se estivermos interessados apenas em modelagem, não em previsão?" - se eu entendi direito, sua pergunta pode ser facilmente editada e simplificada, por isso é mais clara e certamente não muito ampla (até interessante!).

— Tim

@ Adrian, por isso é uma pergunta muito interessante! Receio que você tenha tornado as coisas abertamente complicadas e a referência à econometria não é crucial aqui (como é o mesmo com outras áreas em que os métodos estatísticos são usados). Recomendamos que você edite sua pergunta para simplificá-la.

— Tim

Sim, quando queremos estimativas tendenciosas de baixa variância. Eu particularmente gosto do post de gung aqui. Que problema os métodos de encolhimento resolvem? Permita-me colar a figura do gung aqui ...

insira a descrição da imagem aqui Se você verificar o gung do enredo feito, ficará claro por que precisamos de regularização / retração. No começo, sinto-me estranho por que precisamos de estimativas tendenciosas? Mas, olhando para essa figura, percebi, o modelo de baixa variação apresenta muitas vantagens: por exemplo, é mais "estável" no uso da produção.

— Haitao Du
fonte

Sim, mas como selecionamos o parâmetro de regularização? Quando o objetivo é minimizar o erro de previsão, podemos usar um conjunto de validação. Como podemos fazer uso de um conjunto de validação se nunca observamos os verdadeiros parâmetros do modelo?

— Adrian

Veja a citação sobre o "problema fundamental da inferência causal" na parte inferior da minha pergunta.

— Adrian

A validação cruzada pode ser útil se estivermos interessados apenas na modelagem (ou seja, na estimativa de parâmetros), não na previsão?

Sim pode. Por exemplo, outro dia eu estava usando a estimativa de importância de parâmetros através de Árvores de Decisão. Sempre que construo uma árvore, verifico o erro de validação cruzada. Tento diminuir o erro o máximo que puder, depois irei para a próxima etapa de estimar a importância dos parâmetros. É possível que, se a primeira árvore que você constrói for muito ruim e você não verifique o erro, você terá respostas menos precisas (se não erradas).

A principal razão pela qual acredito deve-se ao grande número de variáveis de controle que cada técnica possui. Mesmo pequenas alterações em uma variável de controle fornecerão um resultado diferente.

Como melhorar seu modelo depois de verificar o erro de validação cruzada? Bem, isso depende do seu modelo. Felizmente, depois de tentar algumas vezes, você terá uma idéia das variáveis de controle mais importantes e poderá manipulá-las para encontrar um erro baixo.

— PeyM87
fonte

A regularização pode ser útil se estivermos interessados ​​apenas na modelagem, não na previsão?

A regularização pode ser útil se estivermos interessados apenas na modelagem, não na previsão?