Esta é essencialmente uma pergunta sobre terminologia matemática, não estatística, até onde eu sei.
De qualquer forma, o ponto é que as estatísticas não são uma função diferenciável da amostra, ou não são n− vezes continuamente função diferenciável da amostra.
Em outras palavras, é possível que a resposta da estatística a alterações na amostra não seja ideal ou seja abruptamente abrupta (daí a terminologia 'suave'), de maneira que funções lineares ou polinomiais dos dados, por exemplo, nunca poderia ter.
A página da Wikipedia sobre funções suaves provavelmente é desnecessariamente técnica em alguns momentos, mas esperamos que algumas das fotos e discussões ampliadas possam lhe dar alguma intuição sobre o que deve ser evocado pelo termo 'suavidade'.
Se uma determinada função é uma "função diferenciável dos momentos da amostra", pode ser uma função suave dos momentos da amostra, dependendo de qual sentido "suave" está sendo usado nesse contexto. Costumo ver "suave" usado para significar infinitas vezes continuamente diferenciáveis (por exemplo, polinômios ou funções lineares ou senos e cossenos), mas às vezes o termo pode ser usado em um sentido menos estrito, como menciona a página da Wikipedia.
De qualquer forma, você está certo de que se relaciona à diferenciabilidade - essa é a ideia principal.
Também vale a pena notar que existem funções que são contínuas, mas não "suaves" - a idéia é que, embora a continuidade seja em geral uma boa propriedade de regularidade, em muitos casos ela ainda permite muito comportamento patológico indesejável, enquanto esse comportamento patológico não pode ocorrem para funções suaves, porque são ainda mais agradáveis que as contínuas.
Exemplo: considere, por exemplo, o estimador LASSO com covariáveis ortonormais:
β^j=SNλ(β^OLSj)=β^OLSjmax⎧⎩⎨⎪⎪⎪⎪0,1−Nλ∣∣β^OLSj∣∣⎫⎭⎬⎪⎪⎪⎪,
que .β^OLS=(XTX)−1XTy=XTy
Primeiro, observamos que é linear nas coordenadas de e pois é linear em e , portanto (assumindo que ou representa a amostra) todas as são funções completamente suaves e não são a fonte da não suavidade. Em vez disso, qualquer não suavidade vem da função máxima encontrada na definição de , como tentarei convencê-lo abaixo.β^OLSjXyβ^OLSXyXyβ^OLSjmaxβ^j
Usamos a identidade (discutida e comprovada aqui ) para reescrever a expressão acima da seguinte maneira:max{x,y}=x+y+|x−y|2
β^j==β^OLSj2⎡⎣⎢⎢−⎛⎝⎜⎜Nλ∣∣β^OLSj∣∣−1⎞⎠⎟⎟+∣∣∣∣∣Nλ∣∣β^OLSj∣∣−1∣∣∣∣∣⎤⎦⎥⎥⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪0,β^OLSj⎛⎝⎜⎜1−Nλ∣∣β^OLSj∣∣⎞⎠⎟⎟,when Nλ∣∣β^OLS∣∣≥1when Nλ∣∣β^OLS∣∣≤1
Escrito neste formulário, é óbvio que temos pelo menos duas fontes possíveis para um comportamento não suave: (1) quando , fazendo com que um denominador desapareça, (2) e possíveis cúspides nos pontos em que: pois é claro que nesses pontos é a "colagem" de duas funções diferentes que, mesmo que eles tenham o mesmo valor nos pontos em queβ^OLSj=0
Nλ∣∣β^OLSj∣∣=1⟺Nλ=∣∣β^OLSj∣∣,
β^j(0 and β^OLSj(1−Nλ∣∣∣β^OLSj∣∣∣))Nλ=∣∣β^OLSj∣∣, podem não necessariamente "funcionar bem" juntos de forma que os derivativos da esquerda e da direita concordem com todos os . O exemplo mais básico de uma função para a qual isso não ocorre éno valor : a primeira derivada da esquerda é e a primeira derivada da direita é ; portanto, não é suave em . Eu suspeito que um fenômeno análogo provavelmente aconteça para a função nos pontos em que, fazendo com que não seja uma função suave de suas entradas.
n|x|x=0−11x=0β^jNλ=∣∣β^OLSj∣∣β^j
A função precisa ser suave apenas em relação aos argumentos de entrada para ser considerada suave. Presumivelmente, seus argumentos de entrada são a própria amostra ou algumas funções da amostra. Se é uma função das funções da amostra, é possível, por composição, obter uma nova função que pula o intermediário (ou seja, retorna as mesmas saídas de interesse e é diretamente uma função da amostra). Pela regra da cadeia esta função composto é lisa se e apenas se ambas as funções eβ^jgβ^jgβ^j∘gβ^~jβ^~j=β^j∘gβ^jg são suaves.