Ao ler o código-fonte de Lua , notei que Lua usa a macro
para arredondar de a double
para 32 bits int
. Eu extraí o macro
, e fica assim:
union i_cast {double d; int i[2]};
#define double2int(i, d, t) \
{volatile union i_cast u; u.d = (d) + 6755399441055744.0; \
(i) = (t)u.i[ENDIANLOC];}
Aqui ENDIANLOC
é definido como endianness , 0
para little endian, 1
para big endian. Lua lida com cuidado com endianness. t
significa o tipo inteiro, como int
ou unsigned int
.
Eu fiz uma pequena pesquisa e há um formato mais simples macro
que usa o mesmo pensamento:
#define double2int(i, d) \
{double t = ((d) + 6755399441055744.0); i = *((int *)(&t));}
Ou no estilo C ++:
inline int double2int(double d)
{
d += 6755399441055744.0;
return reinterpret_cast<int&>(d);
}
Esse truque pode funcionar em qualquer máquina usando o IEEE 754 (o que significa praticamente todas as máquinas atualmente). Funciona para números positivos e negativos, e o arredondamento segue a regra do banqueiro . (Isso não é surpreendente, pois segue a IEEE 754.)
Eu escrevi um pequeno programa para testá-lo:
int main()
{
double d = -12345678.9;
int i;
double2int(i, d)
printf("%d\n", i);
return 0;
}
E gera -12345679, conforme o esperado.
Gostaria de entrar em detalhes como isso macro
funciona. O número mágico 6755399441055744.0
é realmente 2^51 + 2^52
, ou 1.5 * 2^52
, e 1.5
em binário pode ser representado como 1.1
. Quando qualquer número inteiro de 32 bits é adicionado a esse número mágico, perdi-me daqui. Como esse truque funciona?
PS: Isso está no código fonte de Lua, Llimits.h .
ATUALIZAÇÃO :
- Como o @Mysticial aponta, esse método não se limita a 32 bits
int
, também pode ser expandido para 64 bitsint
desde que o número esteja no intervalo de 2 ^ 52. (Omacro
precisa de alguma modificação.) - Alguns materiais dizem que esse método não pode ser usado no Direct3D .
Ao trabalhar com o assembler da Microsoft para x86, há uma
macro
escrita ainda mais rápidaassembly
(isso também é extraído da fonte Lua):#define double2int(i,n) __asm {__asm fld n __asm fistp i}
Existe um número mágico semelhante para um número de precisão único:
1.5 * 2 ^23
ftoi
. Mas se você está falando sobre SSE, por que não usar apenas a instrução única CVTTSD2SI
?
double -> int64
estão realmente dentro do 2^52
intervalo. Isso é particularmente comum ao executar convoluções inteiras usando FFTs de ponto flutuante.