'Eugene Goostman' realmente passou no teste de Turing?


18

Dizem que 'Eugene Goostman', um programa de computador desenvolvido para simular um garoto de 13 anos, conseguiu convencer 33% dos juízes de que era humano e, assim, passou no Teste de Turing.

O programa de computador, também conhecido como chatbot, estava fingindo ser um garoto ucraniano de 13 anos para quem o inglês era uma segunda língua - algo muito diferente.

Para mim, Eugene soa exatamente como um chatbot medíocre deveria: repetitivo, sem sentido e cheio de não-sequências. Não sei como isso convenceu os juízes (que parecem pouco profissionais).

Muitas pessoas criticaram Eugene, como o professor Stevan Harnad, que disse "Não faz sentido" e "Não passamos no teste de Turing. Não estamos nem perto".

As opiniões são diferentes, mas eu realmente gostaria de saber se ele passou oficialmente no teste?

Também está sendo dito que:

Dois prêmios únicos que nunca foram concedidos. O 25K é oferecido para o primeiro chatterbot que os juízes não conseguem distinguir de um humano real e que podem convencer os juízes de que o humano é o programa de computador. US $ 100.000 é a recompensa pelo primeiro chatterbot que os juízes não conseguem distinguir de um ser humano real em um teste de Turing que inclui decifrar e entender textos, visuais e auditivos. Quando isso for alcançado, a competição anual terminará.

Isso significa que Eugene ganhou $ 25.000?


2
É muito importante que os juízes saibam que estão na situação.
Thorbjørn Ravn Andersen

3
2/3 dos juízes pensaram que esse 'bot' não era humano. Para mim, isso diz que a natureza artificial dessa interação foi aparente para mais do que a maioria dos juízes. Eu chamaria isso de uma falha clara. (E mesmo que "Eugene" "ganhe" - como uma pessoa artificial recebe dinheiro de verdade? BitCoin? :-)
Bob Jarvis - Restabelece Monica

Você pode fornecer uma amostra de conversa? Eu interajo com ucranianos diariamente e a maneira como eles falam inglês é facilmente reconhecível.
Stephan Bijzitter

Respostas:


18

Não existe um "teste oficial de Turing", portanto não existe o conceito de "oficialmente passar no teste". Turing descreveu uma metodologia que se pode usar para avaliar inteligências artificiais. Os organizadores do evento que Eugene Goostman venceu implementaram essa metodologia de uma maneira específica e o programa atendeu aos critérios escolhidos pelos organizadores. Nesse sentido, passou no teste.

Como não existe um "teste oficial de Turing", pode ser mais apropriado dizer que Eugene Goostman passou em um teste de Turing ou mesmo em um teste no estilo de Turing. É improvável que a mídia iria pegar em tais sutilezas, especialmente dada a fama de Turing e a idéia de " o teste de Turing" na consciência pública.


3
Além do que, Eugene Goostman seria lixo no jogo da imitação original de Turing ;-)
Steve Jessop

9

Eu acho que os prêmios a que você está se referindo são o Prêmio Loebner . De acordo com a página da Wikipedia (veja o link anterior), o vencedor de 2014 é 'Rose', de Bruce Wilcox. Esse programa não ganhou um dos prêmios únicos, mas recebeu US $ 4.000 em dinheiro. 'Eugene Goostman' competiu em 2005 e 2008, terminando em segundo nas duas vezes.

A competição 'Eugene Goostman' venceu foi organizada por Kevin Warwick, da Coventry University, para marcar 60 anos desde a morte de Alan Turing. Não conheço nenhum prêmio em dinheiro.

Confira a opinião de Ray Kurzweil sobre a competição e o programa em questão. Excerto:

O professor Warwick afirma que o teste foi "irrestrito". No entanto, ter o chatbot alegando ser uma criança de 13 anos e alguém para quem o inglês não é o primeiro idioma, é efetivamente uma restrição. Além disso, as interações foram limitadas a cinco minutos cada. Há uma alta probabilidade de enganar juízes ingênuos em um período tão curto de tempo.

Conversei com o chatbot Eugene Goostman e não fiquei impressionado. Eugene não acompanha a conversa, se repete palavra por palavra e frequentemente responde com não sequências típicas de chatbot.

Também achei este um bom comentário: WIRED - Aquele computador realmente conseguiu um F no teste de Turing


1
Também gostei do Wired, em particular "Em uma competição de 1991, um bot chamado PC Therapist conseguiu que cinco em cada dez juízes acreditassem que era humano". Também em relação ao limiar de enganação "especial"> 30%: "Portanto, o pai do teste de Turing não estava usando isso como um limiar de inteligência, ele estava simplesmente declarando sua previsão de onde achava que os computadores seriam cinco décadas no futuro. "
Fizz

10
Em resumo: o bot de Eugene "passou" neste teste não simulando a inteligência humana, mas simulando a estupidez humana.
duskwuff

2

Adicionando um link da Wikipedia para obter mais detalhes sobre o Teste de Turing "original" . Existem muitos testes chamados "Teste de Turing". A Wikipedia menciona "pelo menos três versões principais". O teste aprovado por Eugeene não é um desses 3. O teste aprovado por Eugeene não foi desenvolvido por Alan Turing, mas era um teste chamado teste de Turing, inspirado por Alan Turing, e o Eugeene passou nele.

A parte que menciona pelo menos três versões principais do teste de Turing:

Saul Traiger argumenta que existem pelo menos três versões principais do teste de Turing, duas das quais são oferecidas em "Computing Machinery and Intelligence" e uma que ele descreve como "Interpretação Padrão". Embora haja algum debate sobre se a "Interpretação Padrão" é a descrita por Turing ou, em vez disso, com base em uma leitura incorreta de seu artigo, essas três versões não são consideradas equivalentes e seus pontos fortes e fracos são distintos.

Versão 1

O jogo original de Turing descreveu um simples jogo de festa envolvendo três jogadores. O jogador A é um homem, o jogador B é uma mulher e o jogador C (que desempenha o papel de interrogador) é de ambos os sexos. No Jogo de Imitação, o jogador C é incapaz de ver o jogador A ou o jogador B e pode se comunicar com eles apenas através de anotações escritas. Ao fazer perguntas aos jogadores A e B, o jogador C tenta determinar qual dos dois é o homem e qual é a mulher. O papel do jogador A é induzir o interrogador a tomar a decisão errada, enquanto o jogador B tenta ajudar o interrogador a tomar a decisão certa.

Versão 2

A segunda versão apareceu mais tarde no artigo de Turing, em 1950. Semelhante ao Teste do Jogo Original de Imitação, o papel do jogador A é desempenhado por um computador. No entanto, o papel do jogador B é desempenhado por um homem e não por uma mulher. [...] Nesta versão, o jogador A (o computador) e o jogador B estão tentando induzir o interrogador a tomar uma decisão incorreta.

Versão 3

O entendimento comum diz que o objetivo do Teste de Turing não é especificamente determinar se um computador é capaz de enganar um interrogador, acreditando que ele é um humano, mas sim se um computador pode imitar um humano. Embora haja alguma disputa sobre se essa interpretação foi pretendida por Turing - Sterrett acredita que era e, portanto, confunde a segunda versão com esta, enquanto outras, como Traiger, não - isso levou ao que pode ser visto como o " interpretação padrão ". Nesta versão, o jogador A é um computador e o jogador B é uma pessoa de ambos os sexos. O papel do interrogador não é determinar quem é homem e qual é mulher, mas qual é um computador e qual é um ser humano. A questão fundamental da interpretação padrão é que o interrogador não pode diferenciar qual respondedor é humano e qual é a máquina. Há questões sobre a duração, mas a interpretação padrão geralmente considera essa limitação como algo que deve ser razoável.

Por outro lado, o teste aprovado pela Eugeene teve juízes humanos conversando com um chatbot por 5 minutos, após o que eles tiveram que decidir se era um bot ou não.


0

Sim, ganhou "um" Teste de Turing que seguiu a descrição original de Alan Turing o mais próximo possível.
No entanto, essa não foi a versão em dinheiro do prêmio de US $ 25.000 que é o Prêmio Loebner, cujas especificações diferem da descrição de Alan Turing.
Mais importante, Alan Turing nunca quis que isso fosse um teste genuíno , portanto o resultado não é uma prova de inteligência, se é isso que você realmente queria saber.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.