Eu estive pesquisando métodos de aprendizado semi-supervisionados e me deparei com o conceito de "pseudo-rotulagem".
Pelo que entendi, com a pseudo-rotulagem, você tem um conjunto de dados rotulados e um conjunto de dados não rotulados. Primeiro você treina um modelo apenas nos dados rotulados. Em seguida, você usa esses dados iniciais para classificar (anexar rótulos provisórios) os dados não rotulados. Em seguida, você alimenta os dados rotulados e não rotulados de volta ao treinamento do modelo, (re) ajustando-se aos rótulos conhecidos e aos previstos. (Itere esse processo, rotule novamente o modelo atualizado.)
Os benefícios reivindicados são que você pode usar as informações sobre a estrutura dos dados não rotulados para melhorar o modelo. Uma variação da figura a seguir é frequentemente mostrada, "demonstrando" que o processo pode estabelecer um limite de decisão mais complexo com base em onde estão os dados (não identificados).
Imagem do Wikimedia Commons por Techerin CC BY-SA 3.0
No entanto, não estou comprando exatamente essa explicação simplista. Ingenuamente, se o resultado original do treinamento somente com rótulo fosse o limite superior da decisão, os pseudo-rótulos seriam atribuídos com base nesse limite de decisão. O que quer dizer que a mão esquerda da curva superior seria branca pseudo-rotulada e a mão direita da curva inferior seria preta pseudo-rotulada. Você não obteria o bom limite de decisão curva após a reciclagem, pois os novos pseudo-rótulos simplesmente reforçariam o limite de decisão atual.
Ou, dito de outra forma, o atual limite de decisão somente rotulado teria precisão de previsão perfeita para os dados não rotulados (como é o que costumávamos fazer). Não há força motriz (nenhum gradiente) que nos faça mudar a localização desse limite de decisão simplesmente adicionando dados pseudo-rotulados.
Estou correto ao pensar que falta a explicação incorporada no diagrama? Ou há algo que estou perdendo? Caso contrário, qual é o benefício dos pseudo-rótulos, dado que o limite da decisão de pré-reciclagem tem precisão perfeita sobre os pseudo-rótulos?