Estou tentando descobrir como controlar os parâmetros de suavização em um modelo mgcv: gam.
Eu tenho uma variável binomial que estou tentando modelar principalmente como uma função das coordenadas xey em uma grade fixa, além de outras variáveis com influências menores. No passado, eu construí um modelo de regressão local razoavelmente bom usando o pacote locfit e apenas os valores (x, y).
No entanto, quero tentar incorporar as outras variáveis no modelo, e parecia que os modelos aditivos generalizados (GAM) eram uma boa possibilidade. Depois de analisar os pacotes gam e mgcv, ambos com uma função GAM, optei pelo último, pois vários comentários nos tópicos da lista de discussão parecem recomendá-lo. Uma desvantagem é que ele não parece suportar uma regressão local mais suave como loess ou locfit.
Para começar, eu só queria tentar replicar aproximadamente o modelo locfit, usando apenas coordenadas (x, y). Tentei com produtos regulares e tensores:
my.gam.te <- gam(z ~ te(x, y), family=binomial(logit), data=my.data, scale = -1)
my.gam.s <- gam(z ~ s(x, y), family=binomial(logit), data=my.data, scale = -1)
No entanto, plotando as previsões do modelo, elas são muito mais suavizadas em comparação com o modelo locfit. Então, eu tenho tentado ajustar o modelo para não exagerar tanto. Tentei ajustar os parâmetros sp e k, mas não está claro para mim como eles afetam a suavização. No locfit, o parâmetro nn controla a extensão da vizinhança usada, com valores menores permitindo menos suavização e mais "oscilação", o que ajuda a capturar algumas áreas da grade nas quais a probabilidade de resultados binomiais muda rapidamente. Como eu configuraria o modelo gam para permitir que ele se comporte da mesma forma?