Por que DELETE é muito mais lento que SELECT e DELETE por id?


12

Eu tenho uma tabela InnoDB bastante ocupada (200.000 linhas, acho que algo como dezenas de consultas por segundo). Devido a um erro, obtive 14 linhas com os mesmos endereços de e-mail inválidos e queria excluí-los.

Eu simplesmente tentei DELETE FROM table WHERE email='invalid address'e obtive o "Tempo limite de espera de bloqueio excedido" após cerca de 50 segundos. Isso não é muito surpreendente, pois a coluna da linha não está indexada.

No entanto, eu fiz SELECT id FROM table WHERE email='invalid address'e isso levou 1,25 segundos. A execução DELETE FROM table WHERE id in (...), copiando e colando os IDs do resultado SELECT, levou 0,02 segundos.

O que está acontecendo? Alguém pode explicar por que o DELETE com a condição é tão lento que atinge o tempo limite, mas executar SELECT e excluir pelo ID é tão rápido?

Obrigado.

EDIT: Por solicitação, postei a estrutura da tabela, além de alguns explainresultados. Devo também observar que não há chaves estrangeiras referentes a esta tabela.

No entanto, a situação parece direta para mim: tenho um campo não indexado contra o qual estou selecionando. Isso requer a digitalização de toda a tabela, mas não é muito grande. idé a chave primária, portanto, a exclusão por ID é muito rápida, como deveria ser.

mysql> show create table ThreadNotification2 \G
*************************** 1. row ***************************
       Table: ThreadNotification2
Create Table: CREATE TABLE `ThreadNotification2` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT,
  `alertId` bigint(20) DEFAULT NULL,
  `day` int(11) NOT NULL,
  `frequency` int(11) DEFAULT NULL,
  `hour` int(11) NOT NULL,
  `email` varchar(255) DEFAULT NULL,
  `highlightedTitle` longtext,
  `newReplies` bit(1) NOT NULL,
  `numReplies` int(11) NOT NULL,
  `postUrl` longtext,
  `sendTime` datetime DEFAULT NULL,
  `sent` bit(1) NOT NULL,
  `snippet` longtext,
  `label_id` bigint(20) DEFAULT NULL,
  `organization_id` bigint(20) DEFAULT NULL,
  `threadEntity_hash` varchar(255) DEFAULT NULL,
  `user_uid` bigint(20) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `FK3991E9D279251FE` (`organization_id`),
  KEY `FK3991E9D35FC0C96` (`label_id`),
  KEY `FK3991E9D3FFC22CB` (`user_uid`),
  KEY `FK3991E9D5376B351` (`threadEntity_hash`),
  KEY `scheduleSentReplies` (`day`,`frequency`,`hour`,`sent`,`numReplies`),
  KEY `sendTime` (`sendTime`),
  CONSTRAINT `FK3991E9D279251FE` FOREIGN KEY (`organization_id`) REFERENCES `Organization` (`id`),
  CONSTRAINT `FK3991E9D35FC0C96` FOREIGN KEY (`label_id`) REFERENCES `Label` (`id`),
  CONSTRAINT `FK3991E9D3FFC22CB` FOREIGN KEY (`user_uid`) REFERENCES `User` (`uid`),
  CONSTRAINT `FK3991E9D5376B351` FOREIGN KEY (`threadEntity_hash`) REFERENCES `ThreadEntity` (`hash`)
) ENGINE=InnoDB AUTO_INCREMENT=4461945 DEFAULT CHARSET=utf8
1 row in set (0.08 sec)

mysql> explain SELECT * FROM ThreadNotification2 WHERE email='invalid address';
+----+-------------+---------------------+------+---------------+------+---------+------+--------+-------------+
| id | select_type | table               | type | possible_keys | key  | key_len | ref  | rows   | Extra       |
+----+-------------+---------------------+------+---------------+------+---------+------+--------+-------------+
|  1 | SIMPLE      | ThreadNotification2 | ALL  | NULL          | NULL | NULL    | NULL | 197414 | Using where |
+----+-------------+---------------------+------+---------------+------+---------+------+--------+-------------+
1 row in set (0.03 sec)


mysql> explain select * from ThreadNotification2 where id in (3940042,3940237,3941132,3941255,3941362,3942535,3943064,3944134,3944228,3948122,3953081,3957876,3963849,3966951);
+----+-------------+---------------------+-------+---------------+---------+---------+------+------+-------------+
| id | select_type | table               | type  | possible_keys | key     | key_len | ref  | rows | Extra       |
+----+-------------+---------------------+-------+---------------+---------+---------+------+------+-------------+
|  1 | SIMPLE      | ThreadNotification2 | range | PRIMARY       | PRIMARY | 8       | NULL |   14 | Using where |
+----+-------------+---------------------+-------+---------------+---------+---------+------+------+-------------+
1 row in set (0.00 sec)



mysql> delete from ThreadNotification2 where email='invalid address';
ERROR 1205 (HY000): Lock wait timeout exceeded; try restarting transaction
mysql> select id from ThreadNotification2 where email='invalid address';
+---------+
| id      |
+---------+
| 3940042 |
| 3940237 |
| 3941132 |
| 3941255 |
| 3941362 |
| 3942535 |
| 3943064 |
| 3944134 |
| 3944228 |
| 3948122 |
| 3953081 |
| 3957876 |
| 3963849 |
| 3966951 |
+---------+
14 rows in set (1.25 sec)

mysql> delete from ThreadNotification2 where id in (3940042,3940237,3941132,3941255,3941362,3942535,3943064,3944134,3944228,3948122,3953081,3957876,3963849,3966951);
Query OK, 14 rows affected (0.02 sec)

2
Eu acho que você absolutamente deve postar um SHOW CREATE TABLEe provavelmente um EXPLAIN...também.
Radu Murzea

@SoboLAN realmente? Parece um cenário tão simples. Eu atualizei a pergunta.
itsadok

Sim, mas ... você estava certo em primeiro lugar. Se o campo emailé não indexados, então ambos DELETEe SELECTdeve funcionar igualmente lento. Ou: você diz que a tabela é consultada intensamente. Talvez quando você tentou o seu primeiro DELETEhavia mais alguém correndo um tempo muito longo operação nesses linhas ...
Radu Murzea

Outra explicar de DELETE FROM ThreadNotification2 WHERE email='invalid address';talvez ajudaria também ...
pconcepcion

@pconcepcion se você escrever EXPLAIN DELETE FROM...., não vai funcionar. Pelo que sei, ele funciona apenas em SELECTs.
Radu Murzea

Respostas:


6

Se o campo emailé não indexados, então ambos DELETEe SELECTdeve funcionar igualmente lento.

A única possibilidade em que consigo pensar é: você diz que a tabela é muito acessada. Talvez alguém tenha executado uma transação muito longa (envolvendo direta ou indiretamente essas linhas específicas) enquanto você estava tentando executar o DELETE.

Acho que talvez você deva inserir algumas linhas simuladas e tentar excluí-las. Faça isso 2 ou 3 vezes. Se houver uma grande diferença na duração do DELETE, então a carga do banco de dados é provavelmente o motivo.

PS: Faça isso apenas se as pessoas não ficarem aborrecidas com essas linhas simuladas: D.


2
Então, sua resposta é "Não sei por quê"?
Pacerier
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.