Eu tenho um arquivo CSV com 4 milhões de bordas de uma rede direcionada representando pessoas se comunicando (por exemplo, John envia uma mensagem para Mary, Mary envia uma mensagem para Ann, John envia outra mensagem para Mary etc.). Eu gostaria de fazer duas coisas:
Encontre medidas de centralidade de grau, entre e (talvez) autovetor para cada pessoa.
Obtenha uma visualização da rede.
Eu gostaria de fazer isso na linha de comando em um servidor Linux, pois meu laptop não tem muita energia. Eu tenho R instalado nesse servidor e na biblioteca statnet. Encontrei este post de 2009 de alguém mais competente do que eu tentando fazer a mesma coisa e tendo problemas com ela. Então, eu queria saber se mais alguém tem alguma dica sobre como fazer isso, de preferência me dando um passo a passo, pois só sei carregar o arquivo CSV e nada mais.
Só para você ter uma idéia, é assim que meu arquivo CSV se parece:
$ head comments.csv
"src","dest"
"6493","139"
"406705","369798"
$ wc -l comments.csv
4210369 comments.csv