Confira a seção 2.3.2 deste artigo de Chapelle e Zien. Eles têm uma boa heurística para selecionar um bom intervalo de pesquisa para do kernel RBF e C para o SVM. Eu citoσC
Para determinar bons valores dos demais parâmetros livres (por exemplo, por CV), é importante pesquisar na escala correta. Portanto, fixamos valores padrão para e σ que têm a ordem correta de magnitude. Em um problema da classe c , usamos o quantil 1 / c das distâncias aos pares D ρ i j de todos os pontos de dados como padrão para σ . O padrão para C é o inverso da variação empírica s 2 no espaço das feições, que pode ser calculado por s 2 = 1Cσc1 / cDρeu jσCs2
a partir de umnxnnúcleo matrizK.s2= 1n∑EuKeu eu- 1n2∑i , jKeu jn × nK
Em seguida, eles usam múltiplos (por exemplo, para k ∈ { - 2 , . . . , 2 } ) do valor padrão como intervalo de pesquisa em uma grade-pesquisar usando validação cruzada. Isso sempre funcionou muito bem para mim.2kk ∈ { - 2 , . . . , 2 }
É claro que dissemos @ciri, normalizar os dados etc. é sempre uma boa ideia.