Encontrei este artigo que usa a detecção de anomalias de links para prever tópicos de tendências e achei incrivelmente intrigante: O artigo é "Descobrindo tópicos emergentes em fluxos sociais por meio da detecção de anomalias de links" .
Gostaria de replicá-lo em um conjunto de dados diferente, mas não estou familiarizado o suficiente com os métodos para saber como usá-los. Digamos que eu tenha uma série de instantâneos da rede de nós ao longo de um período de seis meses. Os nós têm uma distribuição de graus de cauda longa, com a maioria tendo apenas algumas conexões, mas algumas tendo muitas. Novos nós aparecem dentro desse período.
Como eu poderia implementar cálculos de probabilidade máxima normalizada com desconto sequencial usados no artigo para detectar links anômalos que eu acho que poderiam ser precursores de uma explosão? Existem outros métodos que seriam mais apropriados?
Eu pergunto teórica e praticamente. Se alguém pudesse me indicar uma maneira de implementar isso em python ou R, isso seria muito útil.
Alguém? Eu sei que vocês, pessoas inteligentes por aí, têm algumas ideias para uma resposta,