"Latência" pode significar coisas diferentes. Geralmente, é um atraso de algum tipo - a latência do aplicativo é o tempo de reação de um aplicativo (da entrada à saída), a latência da rede, o atraso para obter um pacote do ponto A ao B e assim por diante.
"Tempo de ida e volta" é mais ou menos bem definido como o atraso da rede do ponto A ao B e vice-versa. Essa é a soma de todos os atrasos de codificação, enfileiramento, processamento, decodificação e propagação em ambas as direções. Essencialmente, é o atraso em que A pode estar esperando uma resposta de B para uma solicitação que requer muito pouco processamento.
Muitas vezes, o tempo de ida e volta é comparado ao tempo de ping entre A e B. O tempo de ping pode fornecer um bom valor para o RTT efetivo, mas também pode ser outra coisa, devido a possíveis diferenças de roteamento e processamento entre os pacotes ICMP usados por ping e aqueles para os pacotes de protocolo realmente usados.
No seu caso, "latência" significa um atraso artificial no servidor HTTP que é adicionado além dos atrasos já presentes. Portanto, se você tiver um tempo efetivo de ida e volta de 50 ms para o servidor e selecionar "200 ms de latência", poderá esperar uma resposta a uma solicitação dentro de 250 ms (mais a sobrecarga de processamento no servidor).