Basta adicionar esse esclarecimento para que qualquer pessoa que role isso para baixo possa pelo menos acertar, pois há muitas respostas erradas votadas.
De Diansheng resposta e de JakeJ resposta obtê-lo direito.
Uma nova resposta postada por Shital Shah é uma resposta ainda melhor e mais completa.
Sim, logit
como uma função matemática em estatística, mas o logit
usado no contexto de redes neurais é diferente. Estatística logit
nem faz sentido aqui.
Não consegui encontrar uma definição formal em nenhum lugar, mas logit
basicamente significa:
As previsões brutas que saem da última camada da rede neural.
1. Este é o próprio tensor no qual você aplica a argmax
função para obter a classe prevista.
2. Esse é o próprio tensor que você alimenta na softmax
função para obter as probabilidades para as classes previstas.
Além disso, em um tutorial no site oficial do tensorflow:
Camada de Logits
A camada final em nossa rede neural é a camada de logits, que retornará os valores brutos para nossas previsões. Criamos uma camada densa com 10 neurônios (um para cada classe de destino de 0 a 9), com ativação linear (o padrão):
logits = tf.layers.dense(inputs=dropout, units=10)
Se você ainda está confuso, a situação é assim:
raw_predictions = neural_net(input_layer)
predicted_class_index_by_raw = argmax(raw_predictions)
probabilities = softmax(raw_predictions)
predicted_class_index_by_prob = argmax(probabilities)
onde predicted_class_index_by_raw
e predicted_class_index_by_prob
será igual.
Outro nome para raw_predictions
o código acima élogit
.
Quanto ao porquê logit
... não faço ideia. Desculpe.
[Editar: Veja esta resposta para as motivações históricas por trás do termo.]
Curiosidades
Embora, se você quiser, você pode aplicar estatística logit
para probabilities
que sair da softmax
função.
Se a probabilidade de uma determinada classe for p
,
então as chances de log dessa classe são L = logit(p)
.
Além disso, a probabilidade dessa classe pode ser recuperada como p = sigmoid(L)
, usando a sigmoid
função
Não é muito útil para calcular as probabilidades de log.