Pelo que entendi, Captchas são textos que foram distorcidos pela aplicação de filtros, ruído e outros algoritmos miscelâneos. Portanto, para descobrir se a capacidade de leitura da pessoa é a de uma pessoa, você compara o que ela respondeu com a resposta conhecida.
Agora, lendo o ReCaptcha, ele diz que as palavras exibidas são aquelas que não podem ser traduzidas pelo OCR. Além disso, recaptcha está sendo usado para traduzir essas imagens. Como saber se você está realmente certo em sua leitura ou está apenas inventando coisas?
Se soubesse o que dizia, não seria usado no recaptcha como material de tradução. Se não souber o que o texto diz, como validará sua resposta?
Suponho que essa seja provavelmente uma análise baseada em probabilidade com grandes tamanhos de amostra antes de sinalizar qualquer coisa como traduzida.
Alguém sabe onde está a resposta para isso?