Ao selecionar um número apropriado de nós para um GAM, convém levar em consideração o número de dados e incrementos no eixo x.
E se tivermos 100 incrementos no eixo x com 1000 pontos de dados em cada incremento.
A informação aqui diz:
Se eles não forem fornecidos, os nós do spline serão colocados uniformemente nos valores covariáveis aos quais o termo se refere: Por exemplo, se ajustar 101 dados com um spline de 11 nós de x, haveria um nó a cada 10 (pedido) valor x.
Então, um começo básico deve ser de 9 nós neste exemplo? Apenas não tenho certeza de qual faixa de nós seria adequada para esse conjunto de dados, pois é possível ajustar números muito pequenos a muito grandes.
set.seed(1)
dat <- data.frame(y = rnorm(10000), x = 100)
library(ggplot)
ggplot(dat, aes(x = x, y = y)) +
geom_point(size= 0.5) +
stat_smooth(method = "gam",
formula = y ~ s(x, bs = "cs"),k=9, col = "black")
Se k = 25 fornecesse um ajuste útil, seria razoável para esses dados?
bs = "cs"
termo no spline faz?