Quais são os exemplos da vida real de "modelos estatísticos não paramétricos"?


11

Estou lendo o artigo da Wikipedia sobre modelos estatísticos aqui e estou um pouco perplexo quanto ao significado de "modelos estatísticos não paramétricos", especificamente:

Um modelo estatístico não é paramétrico se o conjunto de parâmetros Θ for dimensional infinito. Um modelo estatístico é semiparamétrico se tiver parâmetros de dimensão finita e de dimensão infinita. Formalmente, se d é a dimensão de Θ e n é o número de amostras, os modelos semiparamétricos e não paramétricos têm como . Se como , o modelo será semiparamétrico; caso contrário, o modelo não é paramétrico.n d / n 0 n dnd/n0n

Entendo que, se a dimensão (entendo literalmente o número de parâmetros) de um modelo é finita, então este é um modelo paramétrico.

O que não faz sentido para mim é como podemos ter um modelo estatístico que possui um número infinito de parâmetros, de modo que podemos chamá-lo de "não paramétrico". Além disso, mesmo que fosse esse o caso, por que o "não-", se de fato há um número infinito de dimensões? Por fim, como estou falando disso de um aprendizado de máquina, há alguma diferença entre esse "modelo estatístico não paramétrico" e, por exemplo, "modelos de aprendizado de máquina não paramétricos"? Finalmente, o que poderiam ser alguns exemplos concretos de tais "modelos dimensionais infinitos não paramétricos"?


3
Usando outra página da Wiki ( en.wikipedia.org/wiki/… ): 'Modelos não paramétricos diferem dos modelos paramétricos, pois a estrutura do modelo não é especificada a priori, mas é determinada a partir dos dados. O termo não paramétrico não pretende implicar que esses modelos carecem de parâmetros completamente, mas que o número e a natureza dos parâmetros são flexíveis e não são previamente fixados. portanto, não paramétrico não está tendo um número infinito de parâmetros, mas um número desconhecido de parâmetros.
Riff

Tenho uma dúvida. Nos modelos não paramétricos, definimos a estrutura do modelo a priori. Por exemplo, nas Árvores de decisão (que é um modelo não paramétrico), definimos max_depth. Então, como você pode dizer que esse parâmetro é realmente aprendido / determinado a partir dos dados em si e não pré-determinado por nós?
Amarpreet Singh

Respostas:


4

Como Johnnyboycurtis respondeu, métodos não paramétricos são aqueles que não assumem a distribuição da população ou o tamanho da amostra para gerar um modelo.

Um modelo k-NN é um exemplo de modelo não paramétrico, pois não considera nenhuma suposição para desenvolver um modelo. Um Naive Bayes ou K-means é um exemplo de paramétrico, pois assume uma distribuição para a criação de um modelo.

Por exemplo, K-means assume o seguinte para desenvolver um modelo Todos os clusters são esféricos (iid Gaussian). Todos os eixos têm a mesma distribuição e, portanto, variação. Todos os clusters são de tamanho uniforme.

Quanto ao k-NN, ele usa o conjunto de treinamento completo para previsão. Ele calcula os vizinhos mais próximos a partir do ponto de teste para previsão. Ele não assume distribuição para criar um modelo.

Para mais informações:

  1. http://pages.cs.wisc.edu/~jerryzhu/cs731/stat.pdf
  2. /stats//a/133841/86202
  3. /stats//a/133694/86202

Você pode expandir isso, por favor? Por que KNN é um exemplo de não paramétrico e por que K-means pode ser? São esses detalhes que eu busco, especialmente exemplos de métodos não paramétricos e por que / como eles não assumem a distribuição da população. Obrigado!
Creatron

@Crtron Modifiquei a resposta para obter mais explicações.
precisa

3

Então, acho que você está perdendo alguns pontos. Primeiro, e mais importante,

Um método estatístico é chamado de não paramétrico se não assume a distribuição da população ou o tamanho da amostra.

Aqui está um tutorial simples (aplicado) sobre alguns modelos não paramétricos: http://www.r-tutor.com/elementary-statistics/non-parametric-methods

Um pesquisador pode decidir usar um modelo não paramétrico versus um modelo paramétrico, digamos, regressão não paramétrica versus regressão linear, é porque os dados violam as suposições mantidas pelo modelo paramétrico. Como você tem experiência em ML, presumo que você nunca aprendeu as suposições típicas do modelo de regressão linear. Aqui está uma referência: https://statistics.laerd.com/spss-tutorials/linear-regression-using-spss-statistics.php

A violação de suposições pode distorcer suas estimativas de parâmetros e, finalmente, aumentar o risco de conclusões inválidas. Um modelo não paramétrico é mais robusto para valores discrepantes, não lineares e não depende de muitas suposições de distribuição populacional; portanto, pode fornecer resultados dignos de confiança ao tentar fazer inferências ou previsões.

Para um tutorial rápido sobre regressão não paramétrica, recomendo estes slides: http://socserv.socsci.mcmaster.ca/jfox/Courses/Oxford-2005/slides-handout.pdf


Obrigado pelos links, vou passar por eles. Uma coisa, porém, é como devemos casar isso com o "número infinito de parâmetros" que compõem um modelo "não paramétrico"? Obrigado
Creatron

Não há citação para esse "número infinito de parâmetros", então não posso comentar. Eu nunca vi essa referência ao tópico do modelo estatístico não paramétrico, portanto, precisaria ver uma referência antes de poder fornecer uma resposta / interpretação. Por enquanto, eu me preocuparia com as suposições de modelos específicos versus um campo inteiro.
19616 Jon

O artigo da wikipedia citado na minha pergunta se refere à dimensionalidade infinita. Literalmente: "Um modelo estatístico não é paramétrico se o conjunto de parâmetros for de dimensão infinita." O que isto significa? É a isso que estou me referindo.
Creatron

Eu sei. Mas a Wikipedia não fornece uma citação para essa afirmação. Não pode confiar em algo sem uma referência.
Jon

3

Atualmente, estou fazendo um curso de aprendizado de máquina, onde usamos a seguinte definição de modelos não paramétricos: "Modelos não paramétricos crescem em complexidade com o tamanho dos dados".

Modelo paramétrico

Wd

f(x)=WTx

Modelos não paramétricos

f(x)=Eu=1nαEuk(xEu,x)
nαEuk(xEu,x)αEun

f(x)=sEugn(Eu=1nαEuyEuk(xEu,x)))

αEund

Peguei a função de regressão do kernel dos meus slides de aula e a função perceptron kernelizada da wikipedia: https://en.wikipedia.org/wiki/Kernel_method

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.