O Facebook está chegando ao fim?


138

Recentemente, este artigo recebeu muita atenção (por exemplo, do WSJ ). Basicamente, os autores concluem que o Facebook perderá 80% de seus membros até 2017.

Eles baseiam suas alegações em uma extrapolação do modelo SIR , um modelo compartimental frequentemente usado em epidemiologia. Seus dados são extraídos das pesquisas do Google por "Facebook", e os autores usam o desaparecimento do Myspace para validar sua conclusão.

Pergunta, questão:

Os autores estão cometendo um erro de "correlação não implica causalidade"? Esse modelo e lógica podem ter funcionado para o Myspace, mas é válido para qualquer rede social?

Atualização : Facebook volta

De acordo com o princípio científico "correlação é igual a causação", nossa pesquisa demonstrou inequivocamente que Princeton pode estar em perigo de desaparecer completamente.

Realmente não achamos que Princeton ou o suprimento de ar do mundo chegará a lugar algum em breve. Adoramos Princeton (e o ar) ", e acrescentando um lembrete final de que" nem todas as pesquisas são criadas da mesma forma - e alguns métodos de análise levam a conclusões bem loucas.


26
Bem, o número de pesquisas no Facebook pode aumentar com base neste artigo. ;)
RobertF 23/01


15
@Glen O Sr. Develin parece ter esquecido completamente o objetivo do estudo. Em primeiro lugar, não é apenas prever uma tendência nas pesquisas, mas usá-las para validar e calibrar um modelo da conhecida família SIR, que é considerada um bom descritor de adoção e abandono de moda. Segundo, seus contra-exemplos "inteligentes" falham porque, ao contrário do Facebook, nem Princeton nem o ar são usados ​​principalmente online. Ele canta o canto da correlação-causa, mas a correlação está no MySpace e no Facebook, não nos dados históricos do Facebook. Além disso, há um conflito de interesses.
Superbest

6
A análise é explícita. O ponto de extrapolação como se nada mudasse é válido, como as duas respostas descreveram.
Glen

5
Isso não responde à pergunta, mas é apenas um monte de opiniões pessoais, totalmente não relacionadas às estatísticas.
Ziggystar

Respostas:


165

As respostas até agora se concentraram nos dados em si, o que faz sentido com o site em que ele está e as falhas nele.

Mas sou um epidemiologista computacional / matemático por inclinação, então também vou falar sobre o modelo em si um pouco, porque também é relevante para a discussão.

Na minha opinião, o maior problema com o jornal não são os dados do Google. Modelos matemáticos em epidemiologia lidam com dados confusos o tempo todo e, na minha opinião, os problemas com eles podem ser resolvidos com uma análise de sensibilidade bastante direta.

O maior problema, para mim, é que os pesquisadores "se condenaram ao sucesso" - algo que sempre deve ser evitado na pesquisa. Eles fazem isso no modelo que decidiram ajustar aos dados: um modelo SIR padrão.

Resumidamente, um modelo de SIR (que significa suscetível (S) infeccioso (I) recuperado (R)) é uma série de equações diferenciais que rastreiam os estados de saúde de uma população à medida que experimenta uma doença infecciosa. Os indivíduos infectados interagem com os indivíduos suscetíveis e os infectam e, com o tempo, passam para a categoria recuperada.

Isso produz uma curva que se parece com isso:

Digite a descrição da imagem aqui

Bonito, não é? E sim, este é para uma epidemia de zumbis. Longa história.

Nesse caso, a linha vermelha é o que está sendo modelado como "usuários do Facebook". O problema é este:

No modelo básico de SIR, a classe I acabará, e inevitavelmente, assintoticamente se aproximar de zero .

Isso deve acontecer. Não importa se você está modelando zumbis, sarampo, Facebook ou Stack Exchange etc. Se você o modelar com um modelo SIR, a conclusão inevitável é que a população da classe infecciosa (I) cai para aproximadamente zero.

Existem extensões extremamente diretas no modelo SIR que tornam isso não verdade - você pode fazer com que as pessoas na classe recuperada (R) voltem a suscetíveis (S) (essencialmente, seriam pessoas que deixaram o Facebook mudando de "Eu sou nunca voltando "para" eu voltarei algum dia "), ou você pode ter novas pessoas na população (isso seria o pequeno Timmy e Claire recebendo seus primeiros computadores).

Infelizmente, os autores não se encaixavam nesses modelos. Este é, aliás, um problema generalizado na modelagem matemática. Um modelo estatístico é uma tentativa de descrever os padrões de variáveis ​​e suas interações nos dados. Um modelo matemático é uma afirmação sobre a realidade . Você pode fazer com que um modelo SIR se encaixe em muitas coisas, mas sua escolha de um modelo SIR também é uma afirmação sobre o sistema. Ou seja, uma vez que atinge o pico, está indo para zero.

Aliás, as empresas de Internet usam modelos de retenção de usuários que se parecem muito com modelos epidêmicos, mas também são consideravelmente mais complexos do que o apresentado no artigo.


4
Sim, eu também senti falta de outros modelos. Não conheço modelos de epidemiologia, mas conheço os modelos de curva S usados ​​no marketing. Havia um artigo de revisão (Meade, Islam, Previsão Tecnológica - Seleção de Modelo, Estabilidade e Combinação de Modelos, Management Science, 1998, Vol. 44, n. 8), que listava 30 modelos diferentes. A maioria desses modelos possui raciocínio semelhante; em vez de suscetível, infecciosa e recuperada, eles usam os termos adotante precoce e imitador (ou similar). O modelo é então a solução para alguma equação diferencial.
Mvctas

1
Você dificilmente justifica falar sobre o modelo estatístico aqui no Cross Validated (CV) ... Você está sugerindo que não falar sobre o modelo é uma falha do próprio CV? De qualquer forma, o esclarecimento ajudaria se você realmente quisesse promover a conscientização ou criticar de maneira construtiva. Como alternativa, se é uma tangente que não vale a pena esclarecer, como vale a pena mencionar? Quanto à (inadvertida?) Sugestão de que os usuários do Facebook são zumbis ... Não tenho objeções. (Mesmo que eu sou um :)!
Nick Stauner

4
zumbis são incríveis! ... até que eles o mordam: P
Joe DF

13
(+1) Esta foi a minha queixa principal com o artigo deles. Eles assumiram um modelo que prediz necessariamente uma falha e, em seguida, validaram o modelo escolhendo um único site que exibisse o comportamento que estavam prevendo (MySpace). Os representantes significativos para esse tipo de modelo são o número de sites comparáveis ​​e eles o testaram em um.
cara,

11
@NickStauner Não, foi apenas uma observação de que a maioria das críticas aqui (e de fato, no resto das internets) estavam nos próprios dados. O que significa sentido, porque os dados em si são algo que a maioria dos usuários aqui poderia criticar facilmente, enquanto os detalhes reais do modelo não são algo que eu esperaria que "Estatístico médio / especialista em aprendizado de máquina" necessariamente encontrasse.
fomite

111

Minha principal preocupação com este documento é que ele se concentra principalmente nos resultados de pesquisa do Google. É um fato bem estabelecido que o uso de smartphones está aumentando ( Pew Internet , Brandwatch ) e as vendas tradicionais de computadores estão diminuindo (possivelmente apenas devido aos computadores antigos ainda estarem funcionando) ( Slate , ExtremeTech), à medida que mais pessoas usam smartphones para acessar a Internet. Considerando que existe um aplicativo nativo do Facebook para (pelo menos) iOS, Android, Blackberry e Windows Phone, não é surpresa que o número de consultas do Google para "facebook" tenha caído significativamente. Se os usuários não precisarem mais abrir um navegador e digitar incorretamente "facebook.com" na barra de URL, isso definitivamente afetaria negativamente o número de pesquisas. De fato, o número de usuários do FB que usam o aplicativo aumentou significativamente ( TechCrunch , Forbes ).

Penso que este estudo é apenas uma "correlação interessante e huh" que foi levada longe demais pelos meios de comunicação alarmistas; "Você sabia que o mundo está mudando? Que inesperado!"


3
Muito bem, como você disse, o uso de smartphones está em alta e o Facebook recebe uma quantidade enorme de visitas mensais de celulares / smartphones. Só porque as pessoas não estão pesquisando, não significa que causará uma diminuição no uso do Facebook, a maneira como as pessoas estão usando o Facebook está mudando / mudando. Eles não estão mais procurando, estão apenas clicando no ícone do telefone e acessando o site.
MCP_infiltrator

2
Eu estava prestes a responder o mesmo sobre pesquisas em smartphones e Google
syed mohsin

"Considerando que existe um aplicativo nativo do Facebook para (pelo menos) iOS, Android, Blackberry e Windows Phone, não é surpresa que o número de consultas do Google para" facebook "tenha caído significativamente" ... a pesquisa também é feita em smartphones , e existe uma coisa chamada marcador que é implementada em todos os navegadores.
Jeffrey Blattman

@ JeffreyBlattman "existe uma coisa chamada marcador que é implementada em todos os navegadores", exceto no Opera 15+. :)
landroni

2
Os marcadores @Adrian são a característica mais básica de um navegador e existem em todos os navegadores existentes desde o dia em que a Web foi ligada.
Jeffrey Blattman

61

Bem, este artigo estabelece o fato de que o número de pesquisas no Google no Facebook se encaixa perfeitamente em uma determinada curva. Portanto, na melhor das hipóteses, é possível prever que as pesquisas no Facebook diminuirão em 80%. O que pode ser viável, porque o Facebook pode se tornar tão onipresente que ninguém precisaria pesquisar sobre ele.

O problema com esse tipo de modelo é que eles assumem que nenhum outro fator pode influenciar a dinâmica da variável observada. É difícil justificar essa suposição ao lidar com dados relacionados a pessoas. Por exemplo, este modelo assume que o Facebook não pode fazer nada para combater a perda de seus usuários, o que é uma suposição muito questionável a ser feita.


3
E o primeiro parágrafo de mpiktas também é importante - os autores estão usando as consultas de pesquisa do Google como proxy para o número de contas do Facebook. Por que não ir diretamente aos dados da conta? Não é difícil encontrar: news.yahoo.com/number-active-users-facebook-over-230449748.html
RobertF

Embora para ser justo, representar graficamente os dados a partir do artigo acima mostra o número de usuários ativos foi de perto de um pico em 2013.
robertf

4
Outros fatores que não a dinâmica de infecção de paciente para paciente podem influenciar a disseminação da doença (como programas de saúde pública). Isso não impede que o modelo subjacente seja útil. Não acho que a data exata da morte do Facebook (que sem dúvida possa ser influenciada) seja tão interessante quanto a ideia / modelo de que as redes sociais se espalham como doenças.
David25272

3
@ david25272 Esse tipo de modelo é certamente útil, existe toda uma literatura em marketing referente às curvas S que utiliza abordagens semelhantes. Por exemplo, suspeito que o modelo Bass e suas contrapartes também possam se encaixar nos mesmos dados.
precisa saber é

15

O Google Trend, na minha opinião, não pode produzir um bom conjunto de dados para este caso de estudo. A tendência do Google mostra com que frequência um termo é pesquisado no Google, portanto há pelo menos dois motivos para levantar algumas dúvidas sobre a previsão:

  • Não sabemos se o usuário pesquisa no Google Facebook para fazer login ou se ele pesquisa informações sobre o Facebook.

O Facebook não é apenas um site, é um fenômeno, com muitos artigos, livros e um filme sobre o assunto e o Facebook Inc. em 18 de maio de 2012 começou a vender ações ao público e a negociar na NASDAQ. O Google Trend mostra os dois: as pesquisas no site e as pesquisas no "fenômeno". Coisas novas sempre têm um grande impacto na massa, a TV teve um grande impacto na massa agora ninguém escreve artigos sobre ela, mas ainda é um dos aparelhos mais usados.

  • A maioria dos usuários não pesquisa "facebook" no Google para fazer login

Com aplicativos móveis e Favoritos, um usuário com um conhecimento decente da pesquisa na Internet "facebook" no Google somente na primeira vez, em seguida, ele geralmente salva a página como favorito ou baixa o aplicativo. O gráfico abaixo é a tendência do Google para a Wikipedia , parece que não usaremos a Wikipedia no futuro. Obviamente, isso não é verdade, simplesmente não acessamos a wikipedia digitando "wikipedia", simplesmente pesquisamos e, em seguida, usamos a página da wikipedia ou usamos o marcador para acessá-la.

insira a descrição da imagem aqui


4
Não se esqueça do preenchimento automático no histórico do navegador na barra de endereços. Eu digito a letra "f" no Chrome ou Firefox e ela se completa automaticamente ao facebook.com como a primeira sugestão. Esse recurso está ativo há vários anos.
paul

4
Most users don't search "facebook" on Google to login... Eu aposto uma recompensa de 50 que esse é realmente o objetivo da maioria dessas pesquisas.
Evgeni Sergeev

2
@EvgeniSergeev Eu aposto com você também! sua hipótese não contradiz minha afirmação, acho que esse é o motivo dessas pesquisas, mas na verdade não é o método mais usado para acessar o facebook (e é isso que importa para o estudo) um fato simples é que, no ano passado, os usuários móveis do Facebook superou usuários de desktop
GM

13

Algumas questões básicas se destacam neste documento:

  • Ele pressupõe a correlação de consultas de mecanismos de pesquisa sobre uma crescente rede social com o aumento de membros. Isso pode ter se correlacionado no passado, mas pode não estar no futuro.

  • Existem muito poucas novas redes sociais grandes. Você quase pode contá-los em uma mão. Friendster, Myspace, Facebook, Google+. Além disso, o Stack Exchange, o Tumblr e o Twitter funcionam de maneira semelhante às redes sociais. Alguém está prevendo que o Twitter acabou? Muito pelo contrário, parece ter um grande impulso. Não há muita menção ou estudo de outros para ver se eles se encaixam. De uma maneira que estamos falando, existe uma tendência entre 5 a 7 pontos de dados? (O número de redes sociais.) São poucos dados para se concluir sobre o futuro.

  • O Facebook substituiu o Myspace. Essa foi a principal dinâmica. Não considera a idéia de que uma infecção está substituindo outra, tende a considerá-las separadamente. O que está substituindo o Facebook? Google+? Twitter? A interação e "deserção" dos clientes de uma "marca" ou "produto" para o outro é o fenômeno crítico nessa área.

  • As redes sociais coexistem. Pode-se ser membro de vários sites. É verdade que os membros tendem a preferir um ao outro.

  • Parece um modelo muito melhor é que há uma consolidação em andamento, como na economia, como automóveis, fabricantes de rádios, sites da Web etc. Como em qualquer nova tecnologia disruptiva, há muitos concorrentes no início e, em seguida, depois, o campo se estreita, eles tendem a se consolidar, há aquisições e fusões e algumas morrem na competição. Já vemos exemplos disso, por exemplo, o Yahoo comprando o Tumblr recentemente.

  • Um conceito semelhante pode ser o fato de as redes de televisão consolidarem e pertencerem a grandes conglomerados, por exemplo, grandes empresas de mídia que possuem muitos ativos de mídia. De fato, o Myspace foi comprado pela News Corporation.

  • O caminho a seguir é procurar mais analogias entre economia e infecções (biologia). As empresas que adquirem clientes de concorrentes e a adoção de produtos têm, de fato, muitos paralelos epidemiológicos. Existem fortes paralelos com as corridas evolucionárias da "rainha vermelha" [veja o livro Red Queen by Ridley ]. Pode haver conexões com um campo chamado bionômica .

  • Outro modelo básico são os produtos que competem entre si e têm várias "barreiras à entrada" para os clientes mudarem de uma marca para outra. É verdade que o custo da troca é muito baixo no ciberespaço. É semelhante a marcas de cervejas competindo por clientes, etc.

  • Em um modelo assintótico, é muito mais provável que uma rede aumente seus membros em direção a um máximo assintótico e então tenda ao platô . No início do platô, não será aparente que seja um platô.

Dito isso, acho que tem algumas idéias muito válidas e interessantes e provavelmente estimulará muito mais pesquisas. É inovador, pioneiro e só precisa ser ajustado um pouco em suas reivindicações. Estou encantado com o uso do Stack Exchange e da sabedoria / inteligência coletiva colaborativa que analisam este artigo. (Agora, se apenas os repórteres que pesquisam o assunto leem esta página inteira com atenção antes de preparar suas mordidas simplistas.)


2
entre terminologia. "barreiras à entrada" é usado para se referir a empresas que desejam lançar novos produtos e competir em uma nova área, conceito semelhante se aplica "do outro lado da transação" aos clientes que trocam de produto, mas talvez exista um termo diferente lá? de qualquer maneira, os autores precisam vincular suas idéias ao marketing, que de fato usa modelos mais "virais". também um conceito-chave nessa área [deveria ter mencionado isso acima] é a participação de mercado .
vzn

1
ps talvez uma questão muito mais relevante, apoiada por outras pesquisas recentes nessa área: o crescimento do facebook esteja chegando ao fim . o uso está baixo na demografia de adolescentes, por exemplo (o que é bastante notável porque seu aumento inicial foi devido a adolescentes). vários estudos / especialistas recentes confirmam isso. portanto, observar as mudanças demográficas dos grupos também é essencial para entender as tendências de uso de redes sociais. Além disso, o Facebook está tentando expandir internacionalmente depois de "saturação" em EUA e não as barreiras são coisas como menos redes de internet, celulares / computadores, etc ...
vzn

6

A questão não é "se", mas "quando".

Que isso acabe já está garantido. http://www.ted.com/talks/geoffrey_west_the_surprising_math_of_cities_and_corporations.html

Eu me ofendo com o uso do modelo SIR. Vem com suposições.

Uma das suposições é que, eventualmente, todo mundo está "recuperado". As infecções não são perpétuas, enquanto a adoção da tecnologia pode ser (considere o automóvel, por exemplo).

Se o negócio está fadado a morrer, então, ao passar pela morte, os relacionamentos entre suscetíveis, infectados e recuperados podem ser adequadamente modelados por um modelo SIR específico. Isso não significa que o modelo seja descritivo de qualquer estação do ano antes do final da vida útil. Não leva em conta outras forças - o contexto. O Facebook fazia parte do contexto do final do "Myspace" e, portanto, embora um SIR fosse apropriado para uso exclusivo do Myspace, não era para uso em redes sociais porque muitos usuários tinham contas em ambos e passaram a usar o domínio dominante no FB.

Eu vasculhei o modelo de zumbi, e mesmo através de alguns ajustes de SIR que não sejam zumbis, e um SIR de janela pontilhada e com tempo e população é mais apropriado lá. Não é um modelo universal e possui pontos fortes e fracos. Isso significa que o SIR é imperfeito mesmo para os sistemas que foram projetados para modelar. Essa imperfeição fundamental para o seu alvo sugere que, sem uso cuidadoso, a aplicação fora da área-alvo pode ser, ceteris paribus, mais problemática do que outro modelo.


2

Para responder sua pergunta

Esse modelo e lógica podem ter funcionado para o MySpace, mas é válido para qualquer rede social?

Provavelmente não. Os dados históricos só podem prever eventos futuros se o 'ambiente' for semelhante. Este documento assume que o total de usuários e consultas do Google é uma constante, o que, obviamente, não é. Agora, este artigo pode dizer mais sobre o Google do que sobre o Facebook.

No entanto, com base na rápida ascensão e queda de muitas outras redes sociais como o MySpace e outras, acho que podemos assumir com segurança que há uma grande chance de o Facebook não ser mais a rede social dominante em cinco anos.


As previsões não dependem inteiramente da semelhança ambiental (dependendo do que você entende por "ambiente", é claro). No entanto, sua resposta parece internamente inconsistente. Não é seguro supor que o futuro do Facebook se assemelhe aos cursos de outras redes sociais apenas com base nisso, muito menos em um período tão curto de tempo.
Nick Stauner

Minha previsão no futuro do Facebook é uma opinião para a qual eu uso um argumento. Minha opinião não é claramente baseada em estatísticas ou modelos. A previsão no artigo discutido aqui é baseada em estatísticas e modelos com referência histórica. Não vejo por que minha resposta é inconsistente internamente.
Nebu

1
O único argumento de apoio da sua opinião soa muito parecido com a lógica por trás do modelo que você critica por essa mesma lógica. Se o ambiente (geracional?) Não é semelhante o suficiente agora para quando o modelo se encaixa no Myspace, por que é semelhante o suficiente para basear qualquer opinião na história do Myspace? Além disso, o Facebook é realmente apenas outra rede social que se comportará como qualquer outra? É diferente o suficiente para a dúvida de várias maneiras, como são os tempos, então, novamente, não vejo como é seguro assumir que a chance de um destino semelhante é grande em um período de tempo tão curto .
Nick Stauner

1

Se dermos uma olhada no mapa das redes sociais, há alguns casos em que o modelo epidêmico se aplica.

http://vincos.it/world-map-of-social-networks/

O artigo pode ter outros exemplos (Friendster e Orkut são um bom exemplo de declinação massiva de seus usuários) e também levam em consideração o fato de que normalmente as pessoas migram para outra rede social que oferece serviços novos ou melhores .

O Facebook inova a maneira como as pessoas se comunicam. Comparando com o Orkut , um usuário precisava inserir o perfil de outra pessoa para ver suas atualizações. Por outro lado, no Facebook, os feeds estão agora em sua própria linha do tempo. Essa é uma grande mudança.

Esse modelo e lógica podem ter funcionado para o MySpace, mas é válido para qualquer rede social?

IMHO, as pessoas não saem da rede social. Eles migram, com base em um melhor serviço, funcionalidade ou experiência.

A questão é: haverá uma rede social melhor? Talvez o Google +.


2
Essa resposta não parece abordar as questões, que são (1) estatísticas: possivelmente correlação confusa com causalidade e (2) se um modelo preditivo pode ser aplicado universalmente. Se estou entendendo mal, talvez seja porque não é de todo aparente qual é o referente a "isso" na primeira frase.
whuber

2
@whuber Esta resposta diz que não há correlação desde que as pessoas ainda precisem de redes sociais. A menos que haja uma alternativa melhor ao Facebook (que o artigo da questão não leva em consideração), o Facebook será o rei. Estatisticamente, a necessidade de "rede social" cresceu apenas e as pessoas simplesmente migraram de uma rede social para outra. O uso das redes sociais só cresceu até agora.
precisa saber é o seguinte

2
@ Tiberiu-Ionuț Stan Seu comentário pode estar correto, mas consiste apenas em comentários não suportados sobre redes sociais; parece não conter nenhum raciocínio estatístico nem lançar uma luz adicional sobre a questão. Em particular, ainda não consigo ver nenhuma referência específica nessa resposta específica à correlação ou causação. Lembre-se, não estamos aqui para debater o futuro do Facebook ou a qualidade das redes sociais, mas fomos convidados a avaliar os argumentos estatísticos no artigo em questão.
whuber

@whuber Estou tentando avaliar os argumentos estatísticos do artigo, mostrando as razões por trás dos resultados. O artigo não leva em consideração outros OSNs e tendências emergentes, apenas números. Estou apenas adicionando informações. OMI é o mesmo que análise técnica e fundamental no mercado de ações (ambos estão ok). Estou tentando explicar os fatos por trás da mudança, não apenas números e gráficos.
edubriguenti
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.