Login ssh lento - Ativação do org.freedesktop.login1 excedeu o tempo limite


39

Em um dos meus servidores, notei realmente um atraso nos logins SSH.

Conectando usando as opções ssh -vvv, o atraso ocorre em debug1: Entering interactive session.

extrato de conexão:

debug1: Authentication succeeded (publickey).
Authenticated to IP_REDACTED ([IP_REDACTED]:22).
debug1: channel 0: new [client-session]
debug3: ssh_session2_open: channel_new: 0
debug2: channel 0: send open
debug1: Requesting no-more-sessions@openssh.com
debug1: Entering interactive session.
debug2: callback start
debug2: fd 3 setting TCP_NODELAY
debug3: packet_set_tos: set IP_TOS 0x10
debug2: client_session2_setup: id 0
debug2: channel 0: request pty-req confirm 1

usando o método descrito aqui , gerei saída strace e notei a linha 14:09:53.676004 ppoll([{fd=5, events=POLLIN}], 1, {24, 999645000}, NULL, 8) = 1 ([{fd=5, revents=POLLIN}], left {0, 0}) <25.020764>que leva 25 segundos.

extrato da saída strace:

14:09:53.675567 clock_gettime(CLOCK_MONOTONIC, {4662549, 999741404}) = 0 <0.000024>
14:09:53.675651 recvmsg(5, {msg_name(0)=NULL, msg_iov(1)=[{"l\4\1\1\n\0\0\0\2\0\0\0\215\0\0\0\1\1o\0\25\0\0\0", 24}], msg_controll
en=0, msg_flags=MSG_CMSG_CLOEXEC}, MSG_DONTWAIT|MSG_NOSIGNAL|MSG_CMSG_CLOEXEC) = 24 <0.000024>
14:09:53.675744 recvmsg(5, {msg_name(0)=NULL, msg_iov(1)=[{"/org/freedesktop/DBus\0\0\0\2\1s\0\24\0\0\0"..., 146}], msg_controllen
=0, msg_flags=MSG_CMSG_CLOEXEC}, MSG_DONTWAIT|MSG_NOSIGNAL|MSG_CMSG_CLOEXEC) = 146 <0.000025>
14:09:53.675842 recvmsg(5, 0x7ffe0ff1dfa0, MSG_DONTWAIT|MSG_NOSIGNAL|MSG_CMSG_CLOEXEC) = -1 EAGAIN (Resource temporarily unavailab
le) <0.000023>
14:09:53.675925 clock_gettime(CLOCK_MONOTONIC, {4662550, 96075}) = 0 <0.000024>
14:09:53.676004 ppoll([{fd=5, events=POLLIN}], 1, {24, 999645000}, NULL, 8) = 1 ([{fd=5, revents=POLLIN}], left {0, 0}) <25.020764>
14:10:18.696865 recvmsg(5, {msg_name(0)=NULL, msg_iov(1)=[{"l\3\1\0013\0\0\0\3\0\0\0m\0\0\0\6\1s\0\5\0\0\0", 24}], msg_controllen=0,     msg_flags=MSG_CMSG_CLOEXEC}, MSG_DONTWAIT|MSG_NOSIGNAL|MSG_CMSG_CLOEXEC) = 24 <0.000017>
14:10:18.696944 recvmsg(5, {msg_name(0)=NULL, msg_iov(1)=[{":1.10\0\0\0\4\1s\0#\0\0\0org.freedesktop."..., 155}], msg_controllen=0, msg_flags=MSG_CMSG_CLOEXEC}, MSG_DONTWAIT|MSG_NOSIGNAL|MSG_CMSG_CLOEXEC) = 155 <0.000018>

Percebi uma entrada nos logs de autenticação no momento relevante:

Jul 21 14:10:18 click sshd[8165]: pam_systemd(sshd:session): Failed to create session: Activation of org.freedesktop.login1 timed out

Não sabendo o suficiente sobre o que está tentando pesquisar e por que agora está demorando 25 segundos nesse servidor em particular.

O journalctl -u systemd-logindcomando mostra

Jul 20 11:33:06 click systemd-logind[19415]: Failed to abandon session scope: Transport endpoint is not connected
Jul 21 05:04:54 myhost systemd[1]: Started Login Service.
Jul 21 12:15:30 myhost systemd[1]: Started Login Service.
Jul 21 12:17:04 myhost systemd[1]: Started Login Service.
Jul 21 12:49:55 myhost systemd[1]: Started Login Service.
Jul 21 13:57:05 myhost systemd[1]: Started Login Service.
Jul 21 13:58:49 myhost systemd[1]: Started Login Service.
Jul 21 14:01:55 myhost systemd[1]: Started Login Service.
Jul 21 14:08:32 myhost systemd[1]: Started Login Service.
Jul 21 14:09:53 myhost systemd[1]: Started Login Service.
Jul 21 14:19:08 myhost systemd[1]: Started Login Service.
Jul 21 14:21:26 myhost systemd[1]: Started Login Service.
Jul 21 14:22:37 myhost systemd[1]: Started Login Service.
Jul 21 14:25:20 myhost systemd[1]: Started Login Service.
Jul 21 14:30:27 myhost systemd[1]: Started Login Service.
Jul 21 15:02:56 myhost systemd[1]: Started Login Service.

A emissão do comando o systemctl restart systemd-logind.servicecorrige (por enquanto provavelmente).

O que é que Activation of org.freedesktop.login1ele menciona? Existe uma maneira de impedir que seja necessário reiniciar o logind no futuro? Espero que com o tempo eu tenha esse problema com o restante dos servidores que eu gerenciar.

Só notei que isso começou a acontecer em outro servidor.

$ sudo service systemd-logind status

● systemd-logind.service - Login Service
   Loaded: loaded (/lib/systemd/system/systemd-logind.service; static)
   Active: active (running) since Tue 2015-06-16 14:10:57 BST; 1 months 12 days ago
     Docs: man:systemd-logind.service(8)
           man:logind.conf(5)
           http://www.freedesktop.org/wiki/Software/systemd/logind
           http://www.freedesktop.org/wiki/Software/systemd/multiseat
 Main PID: 1701 (systemd-logind)
   Status: "Processing requests..."
   CGroup: /system.slice/systemd-logind.service
           └─1701 /lib/systemd/systemd-logind

Jul 28 13:16:21 myhost systemd[1]: Started Login Service.
Jul 28 13:16:47 myhost systemd[1]: Started Login Service.
Jul 28 16:09:23 myhost systemd[1]: Started Login Service.
Jul 28 16:09:49 myhost systemd[1]: Started Login Service.
Jul 28 16:10:15 myhost systemd[1]: Started Login Service.
Jul 28 16:10:41 myhost systemd[1]: Started Login Service.
Jul 28 22:50:19 myhost systemd[1]: Started Login Service.
Jul 29 05:00:15 myhost systemd[1]: Started Login Service.
Jul 29 11:00:20 myhost systemd[1]: Started Login Service.
Jul 29 11:09:56 myhost systemd[1]: Started Login Service.

EDIT - journalctlsaída expandida .

EDIT2 - adicionado status systemd-logind, conforme sugerido nos comentários, quando percebido isso iniciando em outro servidor.

ATUALIZAÇÃO - Isso está começando a acontecer com o resto dos meus servidores Jessie. Eu sou o único experimentando isso? Deve haver alguma correção além de reiniciar o systemd-logind, alguém tem alguma ideia?

Há um relatório de bug do Debian neste 770135 .


Seria útil ver a saída de systemcts status systemd-logindantes de reiniciar para ver o que havia de errado com ela (encerrada, com falha, seja qual for). ppollé apenas um mediador que aguarda resposta do systemd, para que você não possa culpá-lo.
Jakuje 21/07/2015

não existe systemctscomando
Alasdair

Desculpe. systemctlé claro
Jakuje

Eu pensei que era isso que você queria dizer, mas queria ter certeza. Não é a mesma saída que está disponível no comandojournalctl -u systemd-logind
Alasdair

deve mostrar o log, mas também o status do serviço em si.
Jakuje 21/07/2015

Respostas:


48

Isso acontece quando o dbus é reiniciado, mas o systemd-logind não é reiniciado. Faça o seguinte:

systemctl restart systemd-logind

A solução é a partir daqui: https://major.io/2015/07/27/very-slow-ssh-logins-on-fedora-22/


11
Já declarado em questão, o relatório de bug ainda não foi resolvido, mas obrigado por restaurá-lo.
Alasdair

Nota: isso também pode fornecer um "loop de login" no greet lightdm regular; mesma solução se aplica.
Unhammer

1

Usando:

systemctl restart systemd-logind

resolve o problema apenas temporariamente.

Uma solução alternativa é remover todos os .scopearquivos de um trabalho cron, conforme indicado aqui .

* 2,14 * * * root /bin/rm -f /run/systemd/system/*.scope

O relatório de erro relacionado ao systemd está aqui: Vazamento de unidades de escopo que diminuem a velocidade de "systemctl list-unit-files" e atrasam logins .

Parece que ele é na verdade um bug dbus: unix fd em voo contagem quebrado que é resolvido em dbus versão 1.11.10

Para uma correção permanente desse bug, basta aguardar que esta versão do dbus apareça na sua distribuição. Por enquanto, o Debian Stretch está no dbus 1.10.18, o Ubuntu 17.04 (Zesty) está na 1.10.10, o CentOS 7 está no dbus 1.6.12.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.