Minha função new_customer
é chamada várias vezes por segundo (mas apenas uma vez por sessão) por um aplicativo da web. A primeira coisa que faz é bloquear a customer
tabela (fazer uma "inserção se não existir" - uma simples variante de uma upsert
).
Meu entendimento dos documentos é que outras chamadas para new_customer
devem simplesmente enfileirar até que todas as chamadas anteriores sejam concluídas:
LOCK TABLE obtém um bloqueio no nível da tabela, aguardando, se necessário, que quaisquer bloqueios conflitantes sejam liberados.
Por que às vezes é um impasse?
definição:
create function new_customer(secret bytea) returns integer language sql
security definer set search_path = postgres,pg_temp as $$
lock customer in exclusive mode;
--
with w as ( insert into customer(customer_secret,customer_read_secret)
select secret,decode(md5(encode(secret, 'hex')),'hex')
where not exists(select * from customer where customer_secret=secret)
returning customer_id )
insert into collection(customer_id) select customer_id from w;
--
select customer_id from customer where customer_secret=secret;
$$;
erro do log:
2015-07-28 08:02:58 DETALHE DO BST: O processo 12380 aguarda ExclusiveLock na relação 16438 do banco de dados 12141; bloqueado pelo processo 12379. O processo 12379 aguarda ExclusiveLock na relação 16438 do banco de dados 12141; bloqueado pelo processo 12380. Processo 12380: selecione new_customer (decodifique ($ 1 :: text, 'hex')) Processo 12379: selecione new_customer (decodifique ($ 1 :: text, 'hex')) 2015-07-28 08:02:58 BST DICA: Consulte o log do servidor para obter detalhes da consulta. 2015-07-28 08:02:58 CONTEXTO BST: instrução "new_customer" da função SQL 1 2015-07-28 08:02:58 DECLARAÇÃO BST: selecione new_customer (decodificar ($ 1 :: texto, 'hex'))
relação:
postgres=# select relname from pg_class where oid=16438;
┌──────────┐
│ relname │
├──────────┤
│ customer │
└──────────┘
editar:
Consegui obter um caso de teste reproduzível simples. Para mim, isso parece um bug devido a algum tipo de condição de corrida.
esquema:
create table test( id serial primary key, val text );
create function f_test(v text) returns integer language sql security definer set search_path = postgres,pg_temp as $$
lock test in exclusive mode;
insert into test(val) select v where not exists(select * from test where val=v);
select id from test where val=v;
$$;
O script bash é executado simultaneamente em duas sessões do bash:
for i in {1..1000}; do psql postgres postgres -c "select f_test('blah')"; done
log de erros (geralmente um punhado de deadlocks nas 1000 chamadas):
2015-07-28 16:46:19 BST ERROR: deadlock detected
2015-07-28 16:46:19 BST DETAIL: Process 9394 waits for ExclusiveLock on relation 65605 of database 12141; blocked by process 9393.
Process 9393 waits for ExclusiveLock on relation 65605 of database 12141; blocked by process 9394.
Process 9394: select f_test('blah')
Process 9393: select f_test('blah')
2015-07-28 16:46:19 BST HINT: See server log for query details.
2015-07-28 16:46:19 BST CONTEXT: SQL function "f_test" statement 1
2015-07-28 16:46:19 BST STATEMENT: select f_test('blah')
editar 2:
O @ypercube sugeriu uma variante com lock table
a função fora:
for i in {1..1000}; do psql postgres postgres -c "begin; lock test in exclusive mode; select f_test('blah'); end"; done
Curiosamente, isso elimina os impasses.
customer
usado de uma maneira que agarra um bloqueio mais fraco? Então pode ser um problema de atualização do bloqueio.