Desde que o artigo de Itzik Ben Gan foi escrito, o tamanho do cache codificado de 10 para IDENTITY
parece ter sido alterado. Dos comentários neste item de conexão
O tamanho da pré-alocação é baseado no tamanho do tipo de dados da coluna na qual a propriedade de identidade está definida. Para uma coluna inteira do SQL Server, o servidor pré-aloca identidades em intervalos de 1000 valores. Para o tipo de dados bigint, o servidor pré-aloca em intervalos de 10000 valores.
O livro de consulta T-SQL contém a tabela a seguir, mas enfatiza que esses valores não são documentados ou não são alterados.
+-----------------+-----------+
| DataType | CacheSize |
+-----------------+-----------+
| TinyInt | 10 |
| SmallInt | 100 |
| Int | 1,000 |
| BigInt, Numeric | 10,000 |
+-----------------+-----------+
O artigo aqui testa vários tamanhos de cache de sequência e insere tamanhos de lote e apresenta os seguintes resultados.
O que parece mostrar que as inserções grandes IDENTITY
são executadas SEQUENCE
. Porém, ele não testa o tamanho do cache 1.000 e esses resultados são apenas um teste. Analisando especificamente o tamanho do cache 1.000 com vários tamanhos de lote de inserções, obtive os seguintes resultados (tentando cada tamanho de lote 50 vezes e agregando os resultados como abaixo - sempre em µs).
+------------+-----------+-----------+-----------+-----------+-----------+-----------+
| | Sequence | Identity |
| Batch Size | Min | Max | Avg | Min | Max | Avg |
+------------+-----------+-----------+-----------+-----------+-----------+-----------+
| 10 | 2,994 | 7,004 | 4,002 | 3,001 | 7,005 | 4,022 |
| 100 | 3,997 | 5,005 | 4,218 | 4,001 | 5,010 | 4,238 |
| 1,000 | 6,001 | 19,013 | 7,221 | 5,982 | 8,006 | 6,709 |
| 10,000 | 26,999 | 33,022 | 28,645 | 24,015 | 34,022 | 26,114 |
| 100,000 | 189,126 | 293,340 | 205,968 | 165,109 | 234,156 | 173,391 |
| 1,000,000 | 2,208,952 | 2,344,689 | 2,269,297 | 2,058,377 | 2,191,465 | 2,098,552 |
+------------+-----------+-----------+-----------+-----------+-----------+-----------+
Para lotes maiores, a IDENTITY
versão geralmente parece mais rápida .
O livro TSQL Querying também explica por que IDENTITY
pode ter uma vantagem de desempenho sobre a sequência.
A IDENTITY
tabela é específica e SEQUENCE
não é. Se o desastre ocorreu no meio da inserção antes da liberação do buffer de log, não importa se a identidade recuperada é anterior, pois o processo de recuperação também desfaz a inserção, portanto, o SQL Server não força a liberação do buffer de log em todas as identidades. gravação em disco relacionada ao cache. No entanto, para Sequência, isso é imposto, pois o valor pode ser usado para qualquer finalidade - inclusive fora do banco de dados. Portanto, no exemplo acima, com um milhão de inserções e tamanho de cache de 1.000, esse é um milhar adicional de liberações de log.
Script para reproduzir
DECLARE @Results TABLE(
BatchCounter INT,
NumRows INT,
SequenceTime BIGINT,
IdTime BIGINT);
DECLARE @NumRows INT = 10,
@BatchCounter INT;
WHILE @NumRows <= 1000000
BEGIN
SET @BatchCounter = 0;
WHILE @BatchCounter <= 50
BEGIN
--Do inserts using Sequence
DECLARE @SequenceTimeStart DATETIME2(7) = SYSUTCDATETIME();
INSERT INTO dbo.t1_Seq1_cache_1000
(c1)
SELECT N
FROM [dbo].[TallyTable] (@NumRows)
OPTION (RECOMPILE);
DECLARE @SequenceTimeEnd DATETIME2(7) = SYSUTCDATETIME();
--Do inserts using IDENTITY
DECLARE @IdTimeStart DATETIME2(7) = SYSUTCDATETIME();
INSERT INTO dbo.t1_identity
(c1)
SELECT N
FROM [dbo].[TallyTable] (@NumRows)
OPTION (RECOMPILE);
DECLARE @IdTimeEnd DATETIME2(7) = SYSUTCDATETIME();
INSERT INTO @Results
SELECT @BatchCounter,
@NumRows,
DATEDIFF(MICROSECOND, @SequenceTimeStart, @SequenceTimeEnd) AS SequenceTime,
DATEDIFF(MICROSECOND, @IdTimeStart, @IdTimeEnd) AS IdTime;
TRUNCATE TABLE dbo.t1_identity;
TRUNCATE TABLE dbo.t1_Seq1_cache_1000;
SET @BatchCounter +=1;
END
SET @NumRows *= 10;
END
SELECT NumRows,
MIN(SequenceTime) AS MinSequenceTime,
MAX(SequenceTime) AS MaxSequenceTime,
AVG(SequenceTime) AS AvgSequenceTime,
MIN(IdTime) AS MinIdentityTime,
MAX(IdTime) AS MaxIdentityTime,
AVG(IdTime) AS AvgIdentityTime
FROM @Results
GROUP BY NumRows;