Eu estou usando Fedora 15
com PostgreSQL 9.1.4
. O Fedora travou recentemente, após o qual:
Uma tentativa de iniciar o servidor PostgreSQL:
service postgresql-9.1 start
dá
Starting postgresql-9.1 (via systemctl): Job failed. See system logs and 'systemctl status' for details.
[FAILED]
Embora, o servidor inicie normalmente quando inicio o servidor pela primeira vez após a reinicialização do sistema .
Mas, uma tentativa de usar psql
fornece este erro:
psql: could not connect to server: No such file or directory
Is the server running locally and accepting
connections on Unix domain socket "/tmp/.s.PGSQL.5432"?
.s.PGSQL.5432
O arquivo não está presente em nenhum lugar do sistema. A locate .s.PGSQL.5432
não produz nada.
O log do sistema possui o seguinte:
Aug 14 17:31:58 localhost systemd[1]: postgresql-9.1.service: control process exited, code=exited status=1
Aug 14 17:31:58 localhost systemd[1]: Unit postgresql-9.1.service entered failed state.
UMA
systemctl status postgresql-9.1.service
dá
postgresql-9.1.service - SYSV: PostgreSQL database server.
Loaded: loaded (/etc/rc.d/init.d/postgresql-9.1)
Active: failed since Tue, 14 Aug 2012 17:31:58 +0530; 58s ago
Process: 2811 ExecStop=/etc/rc.d/init.d/postgresql-9.1 stop (code=exited, status=1/FAILURE)
Process: 12423 ExecStart=/etc/rc.d/init.d/postgresql-9.1 start (code=exited, status=1/FAILURE)
Main PID: 2551 (code=exited, status=1/FAILURE)
CGroup: name=systemd:/system/postgresql-9.1.service
Eu não havia alterado a configuração padrão do fsync, então acho que foi definido como on
. Eu estou em um disco rígido. O disco rígido travou.
Falha no disco rígido
A falha do disco rígido resultou na execução de um manual fsck
em um prompt e não em GUI. Com ele reparando gazilhões de inodes etc. Depois disso, reiniciei o sistema com um Ctrl+ Alt+ Delete.
O log do PostgreSQL possui:
LOG: database system was interrupted; last known up at 2012-08-14 17:31:57 IST
LOG: database system was not properly shut down; automatic recovery in progress
LOG: record with zero length at 0/41A4E58
LOG: redo is not required
FATAL: could not access status of transaction 1
DETAIL: Could not open file "pg_multixact/offsets/0000": No such file or directory.
LOG: startup process (PID 13016) exited with exit code 1
LOG: aborting startup due to startup process failure
Atualizar
A tentativa de iniciar o servidor após fazer uma cópia do /var/lib/pgsql
diretório no nível do sistema de arquivos e executar ./pg_resetxlog -f /var/lib/pgsql/9.1/data/
com o resultado xlog -f /var/lib/pgsql/9.1/data/
ainda gera:
LOG: database system was interrupted; last known up at 2012-08-14 18:46:36 IST
LOG: database system was not properly shut down; automatic recovery in progress
LOG: record with zero length at 0/6000078
LOG: redo is not required
FATAL: could not access status of transaction 1
DETAIL: Could not open file "pg_multixact/offsets/0000": No such file or directory.
LOG: startup process (PID 13766) exited with exit code 1
LOG: aborting startup due to startup process failure
pg_resetxlog
não fez nenhum bem, então você está em território divertido. Você tem um backup desse banco de dados antes da falha?
pg_multixact/offsets/0000
que Pg aceitaria ...