Ultimamente, tenho me perguntado como as GPUs calculam seno e cosseno, e o Google não me ajudou a encontrar uma resposta precisa.
Inicialmente, eu pensava que, para tornar os cálculos o mais rápido possível, a GPU usaria algum tipo de tabela de pesquisa. Mas então eu percebi que armazenar todos os valores de pecado em uma tabela com o dobro de [0, 2 * pi] seria enorme e, portanto, não seria uma opção válida.
A tabela pode ser reduzida em resolução e os valores ausentes para uma pesquisa podem ser lidos. Isso, no entanto, introduz um possível erro que pode se propagar para erros maiores e inaceitáveis ao executar o cálculo várias vezes.
Minha última idéia é que eles poderiam estar usando uma aproximação de Taylor, mas isso envolveria bastante aritmética, que pode ser muito lenta para uma GPU. Portanto, a pergunta é: o que as GPUs usam para calcular os senos? São tabelas de pesquisa, aproximações ou um híbrido de ambos? E possível, eles usam o mesmo método para outros cálculos como sqrt ()?