Faça com que a etiqueta do usuário destaque objetos no vídeo que um classificador de última geração não pode resolver
Crie um classificador de vídeo de última geração. É possível treiná-lo nos dados de treinamento em vídeo do YouTube-8M do Google . Mas você também deseja alimentar continuamente o vídeo original.
Faça com que o classificador rotule o máximo de objetos possível. Faça com que isole quais objetos ele pode reconhecer como objetos, mas que não pode rotular.
Faça com que ele produza vídeos que descrevam os objetos. De preferência GIFs, que podem ser facilmente incorporados em formulários.
Para 100 deles, pergunte a 100 usuários qual é o objeto. Se 90% dos usuários concordarem com o nome de um objeto, adicione esse vídeo ao conjunto de captcha. Chame isso de conjunto pré-treinado.
Sempre que um usuário precisar se autenticar, mostre a ele um dos objetos destacados em um vídeo que não seja do conjunto pré-treinado . Se a imagem tiver menos de 100 exibições, grave a etiqueta e dê ao usuário outra do conjunto pré-treinado. Se eles acertarem, deixe-os passar, se não, dê-lhes outro do conjunto pré-treinado.
Quando o vídeo não pré-treinado tiver mais de 100 apresentações e mais de 90% dos usuários do captcha concordarem, adicione esse vídeo ao conjunto pós-treinado.
Com o tempo, remova lentamente o conjunto pré-treinado. Coloque as expirações em cada vídeo no conjunto pós-treinado e remova-as após a expiração, para que elas não sejam usadas muitas vezes.
Idealmente, esse processo melhoraria constantemente o classificador de vídeo, mantendo-o no estado da arte e um pouco à frente de outros classificadores. Talvez também pudesse favorecer palavras e objetos menos comuns e coisas mais esotéricas, de modo a especializar esse classificador contra outros classificadores.
O mesmo poderia ser feito para a rotulagem de imagens, mas a utilidade do classificador de vídeo provavelmente durará mais, dados os avanços na IA.
Estritamente falando, porém, com exceção de alguns truques quânticos, não existe um sistema captcha que um dia não seja resolvido por sistemas externos de IA.
(edit: oh, eu acabei de notar que você disse especificamente "captcha textual". Se é isso o que você quer dizer, então não, acho que a classificação do texto ainda tem muito mistério. Os computadores provavelmente podem extrair o texto das imagens melhor do que os humanos agora. Mas tecnicamente, a entrada no sistema captcha descrito acima é textual.)