Portanto, apresentamos um exercício direto de codificação para novos candidatos com alguns requisitos bem definidos. Ocasionalmente, recebemos soluções que realmente não resolvem o problema em questão, mas são projetadas demais para solucionar um problema percebido - geralmente fora dos limites do exercício.
Agora, minha pergunta é: isso é um sinal de alerta?
EDIT: Muita discussão é baseada no teste que está sendo falho - o que é um ponto justo. Como descrevi em um comentário, a premissa básica do teste é mostrar como você pode ler os dados do arquivo de uma maneira sensata (e você ficaria surpreso com a variedade de abordagens que vemos) e como combinar as itens antes de calcular a latência entre as atualizações. Agora, para que isso funcione, certas suposições precisam ser feitas sobre os dados, e procuramos essas suposições, e também declaramos explicitamente que queremos ver a abordagem adotada (incluindo a abordagem OO etc.) Tudo isso em duas horas prazo.
IMHO, quando eu estava entrevistando, foi o exercício mais completo que me deparei.
O cenário específico sobre o qual estou pensando é onde um candidato, em vez de ler o arquivo, aceitou a entrada "rede" em um aplicativo multiencadeado, o que claramente não está no escopo.