As respostas até agora se concentraram nos dados em si, o que faz sentido com o site em que ele está e as falhas nele.
Mas sou um epidemiologista computacional / matemático por inclinação, então também vou falar sobre o modelo em si um pouco, porque também é relevante para a discussão.
Na minha opinião, o maior problema com o jornal não são os dados do Google. Modelos matemáticos em epidemiologia lidam com dados confusos o tempo todo e, na minha opinião, os problemas com eles podem ser resolvidos com uma análise de sensibilidade bastante direta.
O maior problema, para mim, é que os pesquisadores "se condenaram ao sucesso" - algo que sempre deve ser evitado na pesquisa. Eles fazem isso no modelo que decidiram ajustar aos dados: um modelo SIR padrão.
Resumidamente, um modelo de SIR (que significa suscetível (S) infeccioso (I) recuperado (R)) é uma série de equações diferenciais que rastreiam os estados de saúde de uma população à medida que experimenta uma doença infecciosa. Os indivíduos infectados interagem com os indivíduos suscetíveis e os infectam e, com o tempo, passam para a categoria recuperada.
Isso produz uma curva que se parece com isso:
Bonito, não é? E sim, este é para uma epidemia de zumbis. Longa história.
Nesse caso, a linha vermelha é o que está sendo modelado como "usuários do Facebook". O problema é este:
No modelo básico de SIR, a classe I acabará, e inevitavelmente, assintoticamente se aproximar de zero .
Isso deve acontecer. Não importa se você está modelando zumbis, sarampo, Facebook ou Stack Exchange etc. Se você o modelar com um modelo SIR, a conclusão inevitável é que a população da classe infecciosa (I) cai para aproximadamente zero.
Existem extensões extremamente diretas no modelo SIR que tornam isso não verdade - você pode fazer com que as pessoas na classe recuperada (R) voltem a suscetíveis (S) (essencialmente, seriam pessoas que deixaram o Facebook mudando de "Eu sou nunca voltando "para" eu voltarei algum dia "), ou você pode ter novas pessoas na população (isso seria o pequeno Timmy e Claire recebendo seus primeiros computadores).
Infelizmente, os autores não se encaixavam nesses modelos. Este é, aliás, um problema generalizado na modelagem matemática. Um modelo estatístico é uma tentativa de descrever os padrões de variáveis e suas interações nos dados. Um modelo matemático é uma afirmação sobre a realidade . Você pode fazer com que um modelo SIR se encaixe em muitas coisas, mas sua escolha de um modelo SIR também é uma afirmação sobre o sistema. Ou seja, uma vez que atinge o pico, está indo para zero.
Aliás, as empresas de Internet usam modelos de retenção de usuários que se parecem muito com modelos epidêmicos, mas também são consideravelmente mais complexos do que o apresentado no artigo.