Por que o nome "kernel" nas estatísticas e ML?


21

Isso foi perguntado em outros sites SE no contexto de sistemas operacionais e álgebra linear, mas a mesma pergunta me incomoda em relação aos métodos de kernel usados ​​em estatística e aprendizado de máquina.

Costuma-se dizer que os kernels, por exemplo, na estimativa da densidade do kernel ou SVMs, representam algum tipo de similaridade, mas não entendo de onde vem o nome 'kernel' e qual é o simbolismo dele.

Então, qual é a etimologia dos kernels, no contexto de estatística e aprendizado de máquina?

Para ser claro, eu estou bem ciente do que é um kernel e das principais propriedades dele, apenas estou curioso sobre o nome, pois não vejo o que ele tem a ver com a semente ou o núcleo, como é definido principalmente em dicionários. Ou pelo menos não vejo um significado mais profundo do que "a parte essencial do método".

Respostas:


13

Você pode encontrar algumas informações sobre esse assunto consultando o site para saber os usos conhecidos mais antigos de algumas das palavras de matemática mantidas pelo matemático Jeff Miller. Você também pode encontrar informações sobre a etimologia da palavra "kernel" em fontes de dicionário padrão.

Escrevendo em francês, Fredholm (1903) usou a palavra "noyau" (núcleo) e Hilbert (1904) adotou esse termo, mas escreveu em alemão, produzindo a palavra alemã "kern" (núcleo). Esses termos foram usados ​​no contexto da escrita sobre equações integrais na análise funcional. Logo depois disso, Bôcher (1909), escrevendo em inglês, usa o termo "kernel" para se referir aos mesmos objetos. O termo então se espalha pela literatura em inglês sobre análise funcional, análise de Fourier e, mais tarde, probabilidade e estatística.

De acordo com o dicionário acima, esta palavra deriva do inglês antigo e do proto-germânico. Pode se referir a uma semente ou ao núcleo, centro ou essência de um objeto. A semelhança linguística entre o alemão "kern" e "kernel" parece dever-se a derivações históricas semelhantes. Alega-se que a palavra "núcleo" deriva de uma palavra proto-germânica hipotética (reconstruída) "kurną" (milho). Portanto, com base nessa história, parece que etimologicamente, a palavra "núcleo" se refere a uma semente, núcleo ou essência, e se baseia na anglicização de uma antiga palavra alemã para milho.

ATUALIZAÇÃO: Esta resposta foi editada fortemente para refletir novas informações que foram trazidas à minha atenção pelos usuários cbeleites e RM . Inicialmente, pensei que isso poderia ter sido uma anglicização recente da palavra "kern", mas as fontes do dicionário sugerem que a palavra "kernel" em inglês é muito antiga. Como não sou linguista, estou apenas apresentando informações das fontes acima.


Nunca ouvi falar de Maxime Bôcher. Em primeiro lugar, pensei que talvez fosse um erro de digitação para Salomon Bochner, que alguns anos depois era muito grande (um gigante) em grãos integrais, entre outras coisas.
22718 Mark L. Stone

A culpa é minha - não sei como digitar o o acentuado. Como você fez isso?
Restabeleça Monica

1
Copiei e colei da lista da Wikipedia.
22418 Mark L. Stone

1
Meu ponto de vista real era que eu sabia que Bochner era um gigante em núcleos, mas nunca ouvi falar de Bocher. Bochner era o orientador de tese de Samuel Karlin, de quem fiz um curso de Positividade Total (núcleos totalmente positivos, induzindo variações, transformações decrescentes e tudo o mais). jazz).
Mark L. Stone

1
Não tenho certeza se o kernel é uma versão anglicizada do Kern, pelo menos não no sentido de algo que aconteceu há pouco mais de 100 anos atrás. Eu sempre tomei como tradução: merriam-webster.com/dictionary/kernel definition 1 é chamado "Kern" em alemão. Por exemplo, para uma maçã, as sementes = Kerne, enquanto o núcleo = Kerngehäuse (literalmente alojamento da semente).
Cbeleites suporta Monica

13

Um kernel é usado várias vezes no Machine Learning e nas estatísticas. Alguns exemplos são:

  1. Em Máquinas de vetores de suporte, um kernel é uma função que mapeia os dados para um espaço de maior dimensão, onde o problema se torna linearmente solucionável (observe isto ).

  2. Estimativa de densidade do kernel

    A estimativa de densidade do kernel é uma maneira não paramétrica de estimar a função de densidade de probabilidade de uma variável aleatória.

Nesse contexto, um kernel é simplesmente uma função de ponderação usada na estimativa de densidade do kernel. O último link também tem mais alguns usos da palavra kernel nas estatísticas.

  1. Em Redes Neurais Convolucionais , um núcleo é uma pequena matriz usada para realizar a convolução entre a imagem e ela mesma. Veja aqui .

Em todos esses exemplos, um kernel é uma função matemática usada para algum tipo de transformação em seus dados. O núcleo é essencialmente a parte constante dessa transformação. Dependendo da escolha do kernel que usamos para cada transformação, podemos obter um efeito diferente dele.


5
βe-βxe-βx

7
O OP está procurando a etimologia dos kernels.
Franck Dernoncourt

2
O uso de "kernal" para se referir ao espaço nulo na álgebra linear tem alguma relação com algum desses usos no aprendizado de máquina?
syntonicC
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.