Estou testando inserções mínimas de log em diferentes cenários e pelo que li INSERT INTO SELECT em um heap com um índice não clusterizado usando TABLOCK e SQL Server 2016+ deve registrar minimamente, no entanto, no meu caso, ao fazer isso, estou obtendo log completo. Meu banco de dados está no modelo de recuperação simples e recebo inserções minimamente registradas em um heap sem índices e TABLOCK.
Estou usando um backup antigo do banco de dados Stack Overflow para testar e criei uma replicação da tabela Posts com o seguinte esquema ...
CREATE TABLE [dbo].[PostsDestination](
[Id] [int] NOT NULL,
[AcceptedAnswerId] [int] NULL,
[AnswerCount] [int] NULL,
[Body] [nvarchar](max) NOT NULL,
[ClosedDate] [datetime] NULL,
[CommentCount] [int] NULL,
[CommunityOwnedDate] [datetime] NULL,
[CreationDate] [datetime] NOT NULL,
[FavoriteCount] [int] NULL,
[LastActivityDate] [datetime] NOT NULL,
[LastEditDate] [datetime] NULL,
[LastEditorDisplayName] [nvarchar](40) NULL,
[LastEditorUserId] [int] NULL,
[OwnerUserId] [int] NULL,
[ParentId] [int] NULL,
[PostTypeId] [int] NOT NULL,
[Score] [int] NOT NULL,
[Tags] [nvarchar](150) NULL,
[Title] [nvarchar](250) NULL,
[ViewCount] [int] NOT NULL
)
CREATE NONCLUSTERED INDEX ndx_PostsDestination_Id ON PostsDestination(Id)
Em seguida, tento copiar a tabela de postagens para esta tabela ...
INSERT INTO PostsDestination WITH(TABLOCK)
SELECT * FROM Posts ORDER BY Id
Observando o fn_dblog e o uso do arquivo de log, vejo que não estou obtendo um log mínimo disso. Eu li que as versões anteriores a 2016 exigem que o sinalizador de rastreamento 610 registre minimamente em tabelas indexadas, também tentei definir isso, mas ainda assim não há alegria.
Acho que estou perdendo alguma coisa aqui?
EDIT - Mais informações
Para adicionar mais informações, estou usando o procedimento a seguir que escrevi para tentar detectar o mínimo de log, talvez tenha algo errado aqui ...
/*
Example Usage...
EXEC sp_GetLogUseStats
@Sql = '
INSERT INTO PostsDestination
SELECT TOP 500000 * FROM Posts ORDER BY Id ',
@Schema = 'dbo',
@Table = 'PostsDestination',
@ClearData = 1
*/
CREATE PROCEDURE [dbo].[sp_GetLogUseStats]
(
@Sql NVARCHAR(400),
@Schema NVARCHAR(20),
@Table NVARCHAR(200),
@ClearData BIT = 0
)
AS
IF @ClearData = 1
BEGIN
TRUNCATE TABLE PostsDestination
END
/*Checkpoint to clear log (Assuming Simple/Bulk Recovery Model*/
CHECKPOINT
/*Snapshot of logsize before query*/
CREATE TABLE #BeforeLogUsed(
[Db] NVARCHAR(100),
LogSize NVARCHAR(30),
Used NVARCHAR(50),
Status INT
)
INSERT INTO #BeforeLogUsed
EXEC('DBCC SQLPERF(logspace)')
/*Run Query*/
EXECUTE sp_executesql @SQL
/*Snapshot of logsize after query*/
CREATE TABLE #AfterLLogUsed(
[Db] NVARCHAR(100),
LogSize NVARCHAR(30),
Used NVARCHAR(50),
Status INT
)
INSERT INTO #AfterLLogUsed
EXEC('DBCC SQLPERF(logspace)')
/*Return before and after log size*/
SELECT
CAST(#AfterLLogUsed.Used AS DECIMAL(12,4)) - CAST(#BeforeLogUsed.Used AS DECIMAL(12,4)) AS LogSpaceUsersByInsert
FROM
#BeforeLogUsed
LEFT JOIN #AfterLLogUsed ON #AfterLLogUsed.Db = #BeforeLogUsed.Db
WHERE
#BeforeLogUsed.Db = DB_NAME()
/*Get list of affected indexes from insert query*/
SELECT
@Schema + '.' + so.name + '.' + si.name AS IndexName
INTO
#IndexNames
FROM
sys.indexes si
JOIN sys.objects so ON si.[object_id] = so.[object_id]
WHERE
si.name IS NOT NULL
AND so.name = @Table
/*Insert Record For Heap*/
INSERT INTO #IndexNames VALUES(@Schema + '.' + @Table)
/*Get log recrod sizes for heap and/or any indexes*/
SELECT
AllocUnitName,
[operation],
AVG([log record length]) AvgLogLength,
SUM([log record length]) TotalLogLength,
COUNT(*) Count
INTO #LogBreakdown
FROM
fn_dblog(null, null) fn
INNER JOIN #IndexNames ON #IndexNames.IndexName = allocunitname
GROUP BY
[Operation], AllocUnitName
ORDER BY AllocUnitName, operation
SELECT * FROM #LogBreakdown
SELECT AllocUnitName, SUM(TotalLogLength) TotalLogRecordLength
FROM #LogBreakdown
GROUP BY AllocUnitName
Inserindo em um heap sem índices e TABLOCK usando o seguinte código ...
EXEC sp_GetLogUseStats
@Sql = '
INSERT INTO PostsDestination
SELECT * FROM Posts ORDER BY Id ',
@Schema = 'dbo',
@Table = 'PostsDestination',
@ClearData = 1
Eu recebo esses resultados
Com um crescimento de 0,0024mb de arquivo de log, tamanhos muito pequenos de registros de log e muito poucos deles, fico feliz que isso esteja usando o log mínimo.
Se eu criar um índice não clusterizado no id ...
CREATE INDEX ndx_PostsDestination_Id ON PostsDestination(Id)
Em seguida, execute minha mesma inserção novamente ...
Não apenas não estou obtendo log mínimo no índice não clusterizado, como também o perdi no heap. Depois de fazer mais alguns testes, parece que, se eu criar um ID em cluster, ele registra minimamente, mas pelo que li 2016+, deve registrar minimamente em um heap com índice não agrupado quando o tablock é usado.
EDIÇÃO FINAL :
Eu relatei o comportamento à Microsoft no SQL Server UserVoice e atualizarei se eu receber uma resposta. Também escrevi todos os detalhes dos cenários mínimos de log em que não consegui trabalhar em https://gavindraper.com/2018/05/29/SQL-Server-Minimal-Logging-Inserts/