Perguntas com a marcação «machine-learning»

Os algoritmos de aprendizado de máquina constroem um modelo dos dados de treinamento. O termo "aprendizado de máquina" é vagamente definido; inclui o que também é chamado aprendizado estatístico, aprendizado reforçado, aprendizado não supervisionado etc. SEMPRE ADICIONE UM TAG MAIS ESPECÍFICO.


1
Os processos estocásticos, como o processo gaussiano / processo de Dirichlet, têm densidades? Caso contrário, como a regra de Bayes pode ser aplicada a eles?
O processo de Dirichlet e o processo gaussiano são frequentemente referidos como "distribuições sobre funções" ou "distribuições sobre distribuições". Nesse caso, posso falar significativamente sobre a densidade de uma função em um GP? Ou seja, o Processo Gaussiano ou o Dirichlet têm alguma noção de densidade de probabilidade? Se não, …



1
Por que os recursos aleatórios de Fourier não são negativos?
Os recursos aleatórios de Fourier fornecem aproximações às funções do kernel. Eles são usados ​​para vários métodos de kernel, como SVMs e processos gaussianos. Hoje, tentei usar a implementação do TensorFlow e obtive valores negativos para metade dos meus recursos. Pelo que entendi, isso não deveria acontecer. Então, voltei ao …




1
Existem aplicativos em que o SVM ainda é superior?
O algoritmo SVM é bastante antigo - foi desenvolvido nos anos 1960, mas era extremamente popular nos anos 1990 e 2000. É uma parte clássica (e bastante bonita) dos cursos de aprendizado de máquina. Hoje, parece que no processamento de mídia (imagens, som etc.) as redes neurais dominam completamente, enquanto …


2
O que é bucketização?
Eu tenho procurado uma explicação clara de "bucketização" no aprendizado de máquina sem sorte. O que eu entendo até agora é que a bucketização é semelhante à quantização no processamento de sinal digital, onde uma faixa de valores contínuos é substituída por um valor discreto. Isso está correto? Quais são …


3
Por que as pessoas gostam de dados suaves?
Devo usar o kernel exponencial ao quadrado (SE) para regressão de processo gaussiana. As vantagens deste kernel são: 1) simples: apenas 3 hiperparâmetros; 2) suave: esse núcleo é gaussiano. Por que as pessoas gostam tanto de 'suavidade'? Eu sei que o kernel gaussiano é infinitamente diferenciável, mas isso é tão …

2
Por que o PCA maximiza a variação total da projeção?
Christopher Bishop escreve em seu livro Pattern Recognition and Machine Learning uma prova de que cada componente principal consecutivo maximiza a variação da projeção para uma dimensão, depois que os dados foram projetados no espaço ortogonal aos componentes selecionados anteriormente. Outros mostram provas semelhantes. No entanto, isso prova apenas que …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.