Algumas palavras sobre APIs de redes sociais. Há cerca de um ano, escrevi uma revisão das APIs de redes sociais populares para pesquisadores. Infelizmente, é em russo. Aqui está um resumo:
Twitter ( https://dev.twitter.com/docs/api/1.1 )
- quase todos os dados sobre tweets / textos e usuários estão disponíveis;
- falta de dados sociodemográficos;
- ótima API de streaming: útil para processamento de texto em tempo real;
- muitos wrappers para linguagens de programação;
- é possível obter estrutura de rede (conexões), mas é caro (uma solicitação por 1 minuto).
Facebook ( https://developers.facebook.com/docs/reference/api/ )
- limites de taxa: cerca de 1 solicitação por segundo;
- bem documentado, sandbox presente;
- API de gráfico FQL (semelhante a SQL) e «Rest Rest» regular;
- dados de amizade e características sociodemográficas presentes;
- muitos dados estão além do horizonte de eventos : apenas os dados de amigos e amigos de amigos estão mais ou menos completos, quase nada poderia ser investigado sobre usuários aleatórios;
- alguns erros estranhos da API e parece que ninguém se importa com isso (por exemplo, alguns recursos disponíveis no FQL, mas não no sinônimo da API do Graph).
Instagram ( http://instagram.com/developer/ )
- limites de taxa: 5000 solicitações por hora;
- API em tempo real (como a API de streaming para o Twitter, mas com fotos) - a conexão é um pouco complicada: são usados retornos de chamada;
- falta de dados sociodemográficos;
- fotos, filtros de dados disponíveis;
- imperfeições inesperadas (por exemplo, é possível coletar apenas 150 comentários para postar / foto).
Quadrangular ( https://developer.foursquare.com/overview/ )
- limites de taxa: 5000 solicitações por hora;
- reino dos dados geossociais :)
- bastante fechado de pesquisas por causa de questões de privacidade. Para coletar dados de check-ins, é necessário criar um analisador composto trabalhando com APIs 4sq, bit.ly e twitter de uma só vez;
- novamente: falta de dados sociodemográficos.
Google+ ( https://developers.google.com/+/api/latest/ )
- cerca de 5 solicitações por segundo (tente verificar);
- principais métodos: atividades e pessoas;
- como no Facebook, muitos dados pessoais de usuários aleatórios são ocultos;
- falta de dados de conexões do usuário.
E fora da competição: revi as redes sociais para leitores russos, e a rede número 1 aqui é vk.com . É traduzido para vários idiomas, mas popular apenas na Rússia e em outros países da CEI. Link para documentos da API: http://vk.com/dev/ . E do meu ponto de vista, é a melhor escolha para a pesquisa de mídia social caseira. Pelo menos na Rússia. É por isso:
- limites de taxa: 3 solicitações por segundo;
- texto público e dados de mídia disponíveis;
- dados sociodemográficos disponíveis: para o nível de disponibilidade aleatória do usuário, é de cerca de 60 a 70%;
- conexões entre usuários também estão disponíveis: quase todos os dados de amizade para usuários aleatórios estão disponíveis;
- alguns métodos especiais: por exemplo, existe um método para obter o status online / offline do usuário exato em tempo real, e pode-se criar um cronograma para o público.