Muitas vezes, você pode escrever um modelo que corresponda a uma função de perda (aqui vou falar sobre regressão SVM em vez de classificação SVM; é particularmente simples)
Por exemplo, em um modelo linear, se sua função de perda for , minimizando isso corresponderá à probabilidade máxima de f ∝ exp ( - a∑ig(εi)=∑ig(yi−x′iβ)= exp ( - af∝exp(−ag(ε)) . (Aqui eu tenho um núcleo linear)=exp(−ag(y−x′β))
Se bem me lembro, a regressão SVM tem uma função de perda como esta:
Isso corresponde a uma densidade que é uniforme no meio com caudas exponenciais (como vemos exponenciando seu negativo, ou algum múltiplo de seu negativo).
Há uma família de três parâmetros: localização do canto (limite de insensibilidade relativo) mais localização e escala.
É uma densidade interessante; se bem me lembro de olhar para essa distribuição específica há algumas décadas, um bom estimador de localização é a média de dois quantis simetricamente posicionados correspondentes a onde os cantos estão (por exemplo, o midhinge daria uma boa aproximação ao MLE para uma determinada escolha da constante na perda de SVM); um estimador semelhante para o parâmetro de escala seria baseado em sua diferença, enquanto o terceiro parâmetro corresponde basicamente a descobrir em que percentual os cantos estão (isso pode ser escolhido em vez de estimado, como costuma ser para SVM).
Portanto, pelo menos para a regressão SVM, parece bastante simples, pelo menos se estamos escolhendo obter nossos estimadores pela máxima probabilidade.
(Caso você esteja prestes a perguntar ... Não tenho referência a essa conexão específica com o SVM: acabei de resolver isso agora. É tão simples, no entanto, que dezenas de pessoas já resolveram isso antes de mim, sem dúvida não são referências para isso - eu apenas nunca vi nenhum).