Sim, em teoria, a extensão polinomial da regressão logística pode aproximar-se de qualquer limite arbitrário de classificação. Isso ocorre porque um polinômio pode aproximar qualquer função (pelo menos dos tipos úteis para problemas de classificação), e isso é comprovado pelo teorema de Stone-Weierstrass .
Se essa aproximação é prática para todas as formas de contorno é outra questão. Você pode procurar melhor outras funções básicas (por exemplo, séries de Fourier ou distância radial de pontos de exemplo) ou outras abordagens inteiramente (por exemplo, SVM) quando suspeitar de uma forma complexa de limite no espaço de recursos. O problema com o uso de polinômios de alta ordem é que o número de recursos polinomiais que você precisa usar aumenta exponencialmente com o grau do polinômio e o número de recursos originais.
Você pode criar um polinômio para classificar o XOR. 5 - 10 x y pode ser um começo se você usar - 1 e 1 como entradas binárias, isso mapeia a entrada ( x , y) para produzir da seguinte maneira:
( - 1 , - 1 ) : - 5( - 1 , 1 ) : 5( 1 , - 1 ) : 5( 1 , 1 ) : - 5
Passar isso para a função logística deve fornecer valores próximos o suficiente para 0 e 1.
Semelhante às suas duas áreas circulares, há uma curva simples de oito:
a (x2-y2- bx4+ c )
Onde a , b e csão constantes. Você pode obter duas áreas fechadas separadas definidas no seu classificador - em lados opostos doy eixo, escolhendo a , b e cadequadamente. Por exemplo, tentea = 1 , b = 0,05 , c = - 1 para obter uma função que se separa claramente em dois picos ao redor x = - 3 e x = 3:
O enredo mostrado é de uma ferramenta on-line no academo.org e é parax2-y2- 0,05x4- 1 > 0 - a classe positiva mostrada como valor 1 no gráfico acima e normalmente é onde 11 +e- z> 0,5 em regressão logística ou apenas z> 0
Um otimizador encontrará os melhores valores, você só precisará usar 1 ,x2,y2,x4 como seus termos de expansão (embora observe que esses termos específicos se limitam a corresponder à mesma forma básica refletida em todo o y eixo - na prática, você deseja ter vários termos até o polinômio de quarto grau para encontrar grupos disjuntos mais arbitrários em um classificador).
De fato, qualquer problema que você possa resolver com uma rede neural profunda - de qualquer profundidade - poderá resolver com uma estrutura plana usando regressão linear (para problemas de regressão) ou regressão logística (para problemas de classificação). É "apenas" uma questão de encontrar a expansão correta dos recursos. A diferença é que as redes neurais tentarão descobrir diretamente uma expansão de recursos em funcionamento, enquanto a engenharia de recursos usando polinômios ou qualquer outro esquema é um trabalho árduo e nem sempre é óbvio como começar: considere, por exemplo, como você pode criar aproximações polinomiais para quais sistemas neurais convolucionais redes fazem para imagens? Parece impossível. É provável que seja extremamente impraticável também. Mas existe.