Detectar perguntas duplicadas
Era uma vez, havia um site de golfe. Tinha um problema: as pessoas publicavam perguntas semelhantes ou idênticas repetidas vezes. Você esteveselecionado recrutado forçado recrutado chantageado solicitado a automatizar o processo de decidir se uma pergunta é uma duplicata de uma existente, por qualquer meio necessário (consulte Regras).
Entrada
Seu programa deve aceitar um único URL como entrada. Pode-se supor que isso leve a uma pergunta no codegolf.stackexchange.com .
Saída
Pesquise no site perguntas semelhantes. Se você acha que a pergunta de entrada é uma duplicata de uma pergunta existente (ou vice-versa), imprima o URL da outra pergunta. Você pode gerar vários URLs, separados por novas linhas. No final da sua saída, emita end
(em uma linha separada).
Pontuação
- Se uma pergunta que você produz foi realmente marcada como uma duplicata da pergunta de entrada (ou vice-versa), você ganha 4 pontos. Este é um "palpite correto".
- Para cada falso positivo (também conhecido como "palpite incorreto"), você perde 2 pontos.
- Para cada pergunta que era realmente uma duplicata, mas não aparece na sua saída (também conhecida como "falta de palpite"), perca 1 ponto.
A pontuação mais alta depois de lidar com 32 perguntas de entrada vence. Essas 32 perguntas são uma "rodada". No início de cada rodada, as pontuações serão redefinidas para 0. Uma rodada será executada a cada poucos dias e o placar atualizado após cada rodada.
Regras
- Se as perguntas A e C forem fechadas como duplicatas de B, A contará como duplicata de C e vice-versa.
- No início de cada rodada, seu programa pode não possuir dados sobre perguntas (por exemplo, sem codificação ), exceto sobre como analisar o site.
- No entanto, você pode manter os dados em arquivos externos durante uma rodada.
- Nenhum dado pode ser mantido entre as rodadas.
- Sua saída deve ter uma nova linha à direita.
- Você não pode usar nenhum dado do site, exceto os resultados da pesquisa e o URL, título, tags e texto de uma pergunta , com ou sem formatação. Por exemplo, você não pode usar o texto "marcado como duplicado por foo, bar ..." que aparece nas perguntas duplicadas.
- Você pode recuperar esses dados diretamente do site, via data.SE ou pela API.
- Cada envio deve ter um nome.
- Cada envio deve ter uma numeração clara da versão.
- Se um envio não produzir saída após um prazo (a ser decidido; indique quanto tempo leva), ele será eliminado e perderá 8 pontos.