Qual é a diferença entre um recurso e um rótulo?


100

Estou seguindo um tutorial sobre noções básicas de aprendizado de máquina e é mencionado que algo pode ser um recurso ou um rótulo .

Pelo que eu sei, um recurso é uma propriedade dos dados que estão sendo usados. Não consigo descobrir o que é o rótulo, sei o significado da palavra, mas quero saber o que significa no contexto do aprendizado de máquina.


Os recursos são os campos usados ​​como entrada e os rótulos são usados ​​como saída. Como um exemplo simples, considere como prever se alguém deve vender um carro com base na quilometragem do carro, ano, etc. Sim / não é o rótulo, enquanto a quilometragem e o ano seriam as características.
amcneil206

Respostas:


200

Resumidamente, o recurso é uma entrada; etiqueta é produzida. Isso se aplica a problemas de classificação e regressão.

Um recurso é uma coluna dos dados em seu conjunto de entrada. Por exemplo, se você está tentando prever o tipo de animal de estimação que alguém escolherá, seus recursos de entrada podem incluir idade, região de origem, renda familiar, etc. O rótulo é a escolha final, como cachorro, peixe, iguana, pedra, etc.

Depois de treinar seu modelo, você fornecerá a ele conjuntos de novas entradas contendo esses recursos; ele retornará o "rótulo" previsto (tipo de animal de estimação) para aquela pessoa.


1
Portanto, [idade, região de residência, renda familiar] seriam "3 vetores de recursos". E em Keras, sua matriz NumPy para sua rede LSTM seria [amostras, intervalos de tempo, 3]?
naisanza de

1
@naisanza: essa é certamente uma possibilidade. Não estou familiarizado com Keras, mas esta organização de alto nível poderia certamente ser o início de uma implementação válida.
Prune de

característica e variável são a mesma coisa?
Debadatta

Eu gostaria de afirmar que "rótulo" também depende do contexto; por exemplo, para treinar um modelo, você usará dados "rotulados". Nesse caso, o rótulo é a verdade básica com a qual seus dados de saída são comparados.
N.Atanasov

Uau. ótima resposta, obrigado, isso esclarece muitas perguntas remanescentes sobre este espaço de tópico.
Andrew Ray

31

Característica:

Em Machine Learning, o recurso significa propriedade de seus dados de treinamento. Ou você pode dizer o nome de uma coluna no conjunto de dados de treinamento.

Suponha que este seja o seu conjunto de dados de treinamento

Height   Sex   Age
 61.5     M     20
 55.5     F     30
 64.5     M     41
 55.5     F     51
 .     .     .
 .     .     .
 .     .     .
 .     .     .

Então aqui Height, Sexe Agesão as características.

rótulo:

A saída que você obtém do seu modelo após o treinamento é chamada de rótulo.

Suponha que você alimentou o conjunto de dados acima para algum algoritmo e gere um modelo para prever o gênero como masculino ou feminino. No modelo acima, você passa recursos como age, heightetc.

Portanto, após a computação, ele retornará o gênero como Masculino ou Feminino. Isso é chamado de rótulo


5

Aí vem uma abordagem mais visual para explicar o conceito. Imagine que você queira classificar o animal mostrado em uma foto.

As possíveis classes de animais são, por exemplo, gatos ou pássaros. Nesse caso, o rótulo seria as possíveis associações de classe, por exemplo, gato ou pássaro, que seu algoritmo de aprendizado de máquina irá prever.

Os recursos são padrões, cores, formas que fazem parte de suas imagens, por exemplo, pele, penas, ou interpretação de nível mais baixo, valores de pixel.

Pássaro Etiqueta:
Características de pássaros : penas

Gato

Etiqueta:
Características do gato : Furr


5

Vejamos um exemplo em que queremos detectar o alfabeto usando fotos escritas à mão. Alimentamos essas imagens de amostra no programa e o programa classifica essas imagens com base nos recursos que elas possuem.

Um exemplo de característica neste contexto é: a letra 'C'pode ser pensada como um côncavo voltado para a direita.

Agora surge uma questão de como armazenar esses recursos. Precisamos nomeá-los. Aqui está o papel do rótulo que passa a existir. Um rótulo é dado a esses recursos para distingui- los de outros recursos.

Assim, obtemos rótulos como saída quando fornecidos com recursos como entrada .

Os rótulos não estão associados à aprendizagem não supervisionada.


4

Pré-requisito: estatísticas básicas e exposição ao ML (regressão linear)

Pode ser respondido em uma frase -

Eles são parecidos, mas sua definição muda de acordo com as necessidades.

Explicação

Deixe-me explicar minha declaração. Suponha que você tenha um conjunto de dados, para este propósito, considere exercise.csv. Cada coluna no conjunto de dados é chamada de recursos. Gênero, Idade, Altura, Freqüência Cardíaca, Temp. Corporal e Calorias podem ser uma entre as várias colunas. Cada coluna representa características ou propriedades distintas.

exercício.csv

User_ID  Gender Age  Height  Weight Duration    Heart_Rate  Body_Temp   Calories
14733363 male   68  190.0   94.0    29.0           105.0    40.8        231.0
14861698 female 20  166.0   60.0    14.0            94.0    40.3        66.0
11179863 male   69  179.0   79.0    5.0             88.0    38.7        26.0

Para solidificar o entendimento e esclarecer o quebra-cabeça, consideremos dois problemas diferentes (caso de previsão).

CASO 1: Neste caso, podemos considerar o uso de - Sexo, Altura e Peso para prever as calorias queimadas durante o exercício. Essa previsão (Y) Calorias aqui é um rótulo . Calorias é a coluna que você deseja prever usando vários recursos como - x1: Sexo, x2: Altura e x3: Peso .

CASO2: No segundo caso aqui, podemos querer prever a Heart_rate usando Gênero e Peso como um recurso. Aqui Heart_Rate é um rótulo predito usando recursos - x1: Gênero e x2: Peso .

Depois de compreender a explicação acima, você não será mais confundido com Rótulo e Recursos.


3

Um recurso brevemente explicado seria a entrada que você forneceu ao sistema e o rótulo seria a saída que você está esperando. Por exemplo, você alimentou muitos recursos de um cão, como altura, cor do pelo, etc., portanto, após o cálculo, ele retornará a raça do cão que você deseja saber.


0

Suponha que você queira prever o clima, então os recursos dados a você seriam dados climáticos históricos, clima atual, temperatura, velocidade do vento, etc. e os rótulos seriam meses. A combinação acima pode ajudá-lo a obter previsões.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.