Eu sou novo no aprendizado de máquina, por isso estou tentando encontrar alguma literatura, mas nem sei ao certo para o Google. Meus dados têm o seguinte formato:
User A performs Action P
User B performs Action Q
User C performs Action R
...
User C performs Action X
User A performs Action Y
User B performs Action Z
...
Onde cada ação tem certas características (data, hora, cliente, etc). Existem cerca de 300 usuários e temos cerca de 20.000 ações.
Pergunta :
Quero descobrir se há alguma causalidade / correlação entre as ações do usuário. Por exemplo, "toda vez que o Usuário E executa a Ação T, 2 dias depois, o Usuário G realiza a Ação V". Entretanto, no meio do caminho, pode haver muitos outros usuários executando muitas outras ações, e é possível que não haja correlação encontrada. Também é possível que alguns usuários estejam correlacionados, mas outros sejam completamente independentes. Isso é algo que o aprendizado de máquina seria capaz de encontrar para mim? Existe um algoritmo específico ou um conjunto de algoritmos que poderia me ajudar?
Eu tenho lido sobre análise de associação e o algoritmo Apriori, mas acho que isso não me dará o que eu preciso, pois parece exigir conjuntos de dados conhecidos e bem delimitados como entrada, enquanto eu apenas tenho um longo fluxo de usuários aparentemente aleatórios ações. Qualquer sugestão sobre o que olhar seria muito apreciada!
P