Eu tenho um conjunto de dados de eventos que ocorreram durante o mesmo período de tempo. Cada evento tem um tipo (existem poucos tipos diferentes, menos de dez) e um local, representado como um ponto 2D.
Gostaria de verificar se há alguma correlação entre os tipos de eventos ou entre o tipo e o local. Por exemplo, talvez os eventos do tipo A geralmente não ocorram onde os eventos do tipo B ocorrem. Ou talvez em alguma área, haja principalmente eventos do tipo C.
Que tipo de ferramentas eu poderia usar para fazer isso? Sendo um novato em análise estatística, minha primeira ideia foi usar algum tipo de PCA (Principal Component Analysis) nesse conjunto de dados para ver se cada tipo de evento tinha seu próprio componente ou se alguns compartilhavam o mesmo (ou seja, estavam correlacionados)?
Devo mencionar que meu conjunto de dados é da ordem de 500.000 pontos , tornando as coisas um pouco mais difíceis de lidar.
EDIT: Como observado nas respostas abaixo e nos comentários, o caminho a seguir é modelar isso como um processo pontual marcado e, em seguida, usar R para fazer todo o trabalho pesado, conforme explicado em detalhes neste relatório do workshop: http: / /www.csiro.edu.au/resources/Spatial-Point-Patterns-in-R.html