Um coto de decisão é um modelo linear?


19

O stump de decisão é uma árvore de decisão com apenas uma divisão. Também pode ser escrito como uma função por partes.

Por exemplo, suponha que é um vetor e é o primeiro componente de , na configuração de regressão, algum coto de decisão pode serx 1 xxx1x

f(x)={3x125x1>2

Mas é um modelo linear? onde pode ser escrito como ? Essa pergunta pode parecer estranha, porque, como mencionado nas respostas e comentários, se traçarmos a função por partes, não será uma linha. Consulte a próxima seção para saber por que estou fazendo esta pergunta.f(x)=βTx


EDITAR:

  • A razão pela qual faço essa pergunta é que a regressão logística é um modelo linear (generalizado) e o limite de decisão é uma linha, também para o coto de decisão. Note, também temos a seguinte pergunta: Por que a regressão logística é um modelo linear? . Por outro lado, não parece verdade que o coto da decisão seja um modelo linear.

insira a descrição da imagem aqui

Aqui está um exemplo de aumento de coto de decisão na regressão com 2 recursos e 1 resposta contínua.

insira a descrição da imagem aqui


Por que você consideraria linear ..?
Tim

5
@ hxd1011 importante distinguir entre a fronteira de decisão ea função de decisão aqui
shadowtalker

Eu poderia chamá-lo de polinômio de 1000ª ordem, com todas as ordens de 1 a 1000 iguais a zero. Eu poderia chamá-lo de modelo de ordem zero (também conhecido como constante) e comunicaria de maneira mais sucinta os principais recursos. Uma árvore clássica é constante por partes. A árvore trivial, um tronco, é uma divisão única no espaço em que o modelo de um lado é constante e o outro é uma constante diferente. Não é globalmente constante, mas também não é poli1. A biblioteca "cubista" em R se encaixa nos modelos lineares (poli1) reais, em vez dos modelos constantes. Você pode tentar isso.
EngrStudent - Restabelece Monica

1
Se você desenhar uma linha no plano (digamos y = 0) e executar qualquer função , então g ( x , y ) = f ( x ) terá linhas de contorno que são linhas reais (paralelas ao eixo y ), mas não será uma função linear. f(x)g(x,y)=f(x)y
Matthew Drury

1
Esta é uma pergunta estranha. Você pode plotar a função do seu exemplo (que é igual a 3 para x <2 e 5 para x> 2)? Olhe para isso - é uma linha reta? Se não for uma linha reta, não será uma função linear.
Ameba diz Reinstate Monica

Respostas:


21

Não, a menos que você transforme os dados.

É um modelo linear se você transformar usando a função de indicador: x = I ( { x > 2 } ) = { 0x

x=I({x>2})={0x21x>2

Então f(x)=2x+3=(32)T(1x)

Edit: isso foi mencionado nos comentários, mas quero enfatizar aqui também. Qualquer função que particione os dados em duas partes pode ser transformada em um modelo linear desse formulário, com uma interceptação e uma única entrada (um indicador de qual "lado" da partição está o ponto de dados). É importante observar a diferença entre uma função de decisão e um limite de decisão .


"transformar" é complicado, eu acho rede neural (MLP) é não-linear, mas depois de transformar, é linear ..
Haitao Du

2
Ele é um modelo linear nos parâmetros. E é afim linear no manequim . x
Michael M

1
@MichaelM como é linear nos parâmetros? Presumo por "parâmetros" você quer dizer a escolha de x2
shadowtalker

1
@ hxd1011 a resposta é "não, a menos que você transformar os dados"
shadowtalker

2
Eu sugiro que você edite sua resposta para incluir "não, a menos que você transforme os dados" (do seu último comentário) nele. Atualmente, suas palavras de abertura são "É um modelo linear" e as pessoas podem ficar confusas.
Ameba diz Reinstate Monica

7

Respostas às suas perguntas:

  1. Um coto de decisão não é um modelo linear.
  2. O limite de decisão pode ser uma linha, mesmo que o modelo não seja linear. A regressão logística é um exemplo.
  3. O modelo aprimorado não precisa ser o mesmo tipo de modelo que o aluno básico. Se você pensar bem, seu exemplo de aumento, mais a questão à qual você vinculou, prova que o coto da decisão não é um modelo linear.

3

Essa resposta é mais detalhada do que o necessário para responder à pergunta. Espero provocar alguns comentários de verdadeiros especialistas.

Uma vez eu estava em uma sala do tribunal e o juiz perguntou (por boas razões no contexto), se chamamos o rabo de um cachorro de perna, isso significa que um cachorro tem cinco pernas? Então, o que é um modelo linear?

f1,f2,,fny=aificom a restrição importante de que os termos do erro são independentes e normalmente distribuídos. Com essa definição, não se pode dizer se o seu modelo é linear porque você não forneceu informações sobre o termo do erro. Se eliminar a restrição de termo de erro, ela é tautologicamente linear na função que você fornece ou na função que ssdecontrol fornece. No entanto, de maneira ingênua, no contexto desta questão, isso pode ser insatisfatório. Qualquer função pode ser considerada como a base de um linear nesse sentido. Isso ocorre porque qualquer espaço de funções pode ser transformado em um espaço vetorial de funções.

βf(x)=βTx

f(x+y)=f(x)+f(y)xyf(1.5)=3f(3)=5f(3)f(1.5)+f(1.5)f(x)=βTx


4
A linearidade não tem nada a ver com termos de erro. Tem a ver com o fato de que consiste em uma combinação linear dos parâmetros . Isso representa uma linha reta no espaço 2D (mas geralmente representa um plano).
Shadowtalker 23/08/16

f(x)=0f(x)=a0+i=1i=Naixi. No entanto, a função seria lineara0=0f(x+y)=f(x)+f(y)

se é isso que ele insiste, essa é a opinião dele e não um fato difícil. Tanto quanto sei, não existe uma definição rigorosa e aceita para um "modelo linear", nem existe uma em minha mente. Para mim, o fato de haver um termo de erro envolvido apenas transforma o modelo de um "modelo linear" para um "modelo linear estatístico". Não vejo nada inerentemente linear sobre seus termos, nem vejo algo inerentemente estatístico sobre modelos lineares.
shadowtalker

A OMI insistindo na presença de um termo de erro apenas descarta o que, digamos, a engenharia ou o físico podem considerar um "modelo linear" de um processo físico determinístico.
shadowtalker
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.