Preencha as datas ausentes com o valor dos dados da data anterior preenchida para o grupo


13

Imagine tickets de suporte técnico transferidos entre departamentos. Queremos saber o que é o departamento no final do dia para cada ticket para cada dia em que o ticket estiver aberto. A tabela contém o último departamento para cada ticket, para cada dia em que está aberto, no qual há uma alteração no departamento (incluindo uma linha para a data em que o ticket foi aberto inicialmente e a data em que foi fechado). A tabela de dados fica assim:

CREATE TABLE TicketAssigment (
    TicketId     INT NOT NULL,
    AssignedDate DATE NOT NULL,
    DepartmentId INT NOT NULL);

O que eu preciso é preencher as datas ausentes para cada TicketId, usando o DepartmentId da linha TicketAssigment anterior, ordenada por Data.

Se eu tiver linhas TicketAssigment como esta:

1, '1/1/2016', 123 -- Opened
1, '1,4,2016', 456 -- Transferred and closed
2, '1/1/2016', 25  -- Opened
2, '1/2/2016', 52  -- Transferred
2, '1/4/2016', 25  -- Transferred and closed

Eu quero esta saída:

1, '1/1/2016', 123
1, '1/2/2016', 123
1, '1/3/2016', 123
1, '1/4/2016', 456
2, '1/1/2016', 25
2, '1/2/2016', 52
2, '1/3/2016', 52
2, '1/4/2016', 25

Parece que pode estar perto do que eu preciso, mas não tive paciência para deixá-lo terminar, e o custo estimado do plano tem 6 dígitos:

SELECT  l.TicketId, c.Date, MIN(l.DepartmentId)
FROM    dbo.Calendar c 
        OUTER APPLY (SELECT TOP 1 TicketId, DepartmentId FROM TicketAssigment WHERE AssignedDate <= c.Date ORDER BY AssignedDate DESC) l
WHERE   c.Date <= (SELECT MAX(AssignedDate) FROM TicketAssigment)
GROUP   BY l.TicketId, c.Date
ORDER   BY l.TicketId, c.Date;

Suspeito que exista uma maneira de fazer isso usando o LAG e uma moldura de janela, mas ainda não o descobri. Qual é a maneira mais eficiente de atender aos requisitos?

Respostas:


14

Use LEAD()para obter a próxima linha na partição TicketId. Em seguida, junte-se a uma tabela Calendário para obter todas as datas entre eles.

WITH TAwithnext AS
(SELECT *, LEAD(AssignmentDate) OVER (PARTITION BY TicketID ORDER BY AssignmentDate) AS NextAssignmentDate
 FROM TicketAssignment
)
SELECT t.TicketID, c.Date, t.DepartmentID
FROM dbo.Calendar c
JOIN TAwithnext t
    ON c.Date BETWEEN t.AssignmentDate AND ISNULL(DATEADD(day,-1,t.NextAssignmentDate),t.AssignmentDate)
;

Todas as formas de obter uma tabela do Calendário ...


4

Essa é uma maneira rápida de fazer (não testei o desempenho ou a escalabilidade)

- criar tabela de calendário

-- borrowed from @Aaron's post http://sqlperformance.com/2013/01/t-sql-queries/generate-a-set-3 
CREATE TABLE dbo.Calendar(d DATE PRIMARY KEY);

INSERT dbo.Calendar(d) SELECT TOP (365)
 DATEADD(DAY, ROW_NUMBER() OVER (ORDER BY number)-1, '20160101')
 FROM [master].dbo.spt_values
 WHERE [type] = N'P' ORDER BY number;

--- crie sua tabela de teste

CREATE TABLE dbo.TicketAssigment (
    TicketId     INT NOT NULL,
    AssignedDate DATE NOT NULL,
    DepartmentId INT NOT NULL);

--  truncate table dbo.TicketAssigment;

insert into dbo.TicketAssigment values (1   ,   '1-1-2016'  ,   123 )
insert into dbo.TicketAssigment values (1   ,   '1-4-2016'  ,   456 )
insert into dbo.TicketAssigment values (2   ,   '1-1-2016'  ,   25  )
insert into dbo.TicketAssigment values (2   ,   '1-2-2016'  ,   52  )
insert into dbo.TicketAssigment values (2   ,   '1-4-2016'  ,   25  )

--- Consulta para obter a saída desejada

;with Cte as
(
  select TicketID, 
         min(AssignedDate) minAD, -- This is the min date
         max(AssignedDate) maxAD  -- This is the max date
  from TicketAssigment
  group by TicketID
)
select Cte.TicketID,
       c.d as AssignedDate,

       ( -- Get DeptID
       select top(1) T.departmentID
       from dbo.TicketAssigment as T
       where T.TicketID = cte.TicketID and
             T.AssignedDate <= c.d
       order by T.AssignedDate desc
       ) as DepartmentID
from Cte
  left outer join dbo.Calendar as c
      on c.d between Cte.minAD and Cte.maxAD
    order by Cte.TicketID

insira a descrição da imagem aqui


Obrigado por isso! O plano de execução estimado mostra um conjunto de resultados de 25 bilhões de linhas, portanto, vamos renegociar o requisito de relatório (que atualmente é relatado todos os dias para cada ticket do ano passado). Espero que possamos mostrar o último DepartmentId para cada ticket e mostrar os detalhes do DepartmentId por dia para um único ticket selecionado, mediante solicitação.
Mark Freeman
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.