Ao ler o código-fonte de Lua , notei que Lua usa a macropara arredondar de a doublepara 32 bits int. Eu extraí o macro, e fica assim:
union i_cast {double d; int i[2]};
#define double2int(i, d, t) \
{volatile union i_cast u; u.d = (d) + 6755399441055744.0; \
(i) = (t)u.i[ENDIANLOC];}
Aqui ENDIANLOCé definido como endianness , 0para little endian, 1para big endian. Lua lida com cuidado com endianness. tsignifica o tipo inteiro, como intou unsigned int.
Eu fiz uma pequena pesquisa e há um formato mais simples macroque usa o mesmo pensamento:
#define double2int(i, d) \
{double t = ((d) + 6755399441055744.0); i = *((int *)(&t));}
Ou no estilo C ++:
inline int double2int(double d)
{
d += 6755399441055744.0;
return reinterpret_cast<int&>(d);
}
Esse truque pode funcionar em qualquer máquina usando o IEEE 754 (o que significa praticamente todas as máquinas atualmente). Funciona para números positivos e negativos, e o arredondamento segue a regra do banqueiro . (Isso não é surpreendente, pois segue a IEEE 754.)
Eu escrevi um pequeno programa para testá-lo:
int main()
{
double d = -12345678.9;
int i;
double2int(i, d)
printf("%d\n", i);
return 0;
}
E gera -12345679, conforme o esperado.
Gostaria de entrar em detalhes como isso macrofunciona. O número mágico 6755399441055744.0é realmente 2^51 + 2^52, ou 1.5 * 2^52, e 1.5em binário pode ser representado como 1.1. Quando qualquer número inteiro de 32 bits é adicionado a esse número mágico, perdi-me daqui. Como esse truque funciona?
PS: Isso está no código fonte de Lua, Llimits.h .
ATUALIZAÇÃO :
- Como o @Mysticial aponta, esse método não se limita a 32 bits
int, também pode ser expandido para 64 bitsintdesde que o número esteja no intervalo de 2 ^ 52. (Omacroprecisa de alguma modificação.) - Alguns materiais dizem que esse método não pode ser usado no Direct3D .
Ao trabalhar com o assembler da Microsoft para x86, há uma
macroescrita ainda mais rápidaassembly(isso também é extraído da fonte Lua):#define double2int(i,n) __asm {__asm fld n __asm fistp i}Existe um número mágico semelhante para um número de precisão único:
1.5 * 2 ^23
ftoi. Mas se você está falando sobre SSE, por que não usar apenas a instrução única CVTTSD2SI?
double -> int64estão realmente dentro do 2^52intervalo. Isso é particularmente comum ao executar convoluções inteiras usando FFTs de ponto flutuante.
