Brexit: foi "deixar" estatisticamente significativo? [fechadas]

12

Fechado . Esta questão é baseada em opiniões . No momento, não está aceitando respostas.

Deseja melhorar esta pergunta? Atualize a pergunta para que ela possa ser respondida com fatos e citações editando esta postagem .

Fechado há 3 anos .

Neste post, fazemos uma pergunta sobre um fenômeno natural chamado de seres humanos que tentam encontrar uma decisão contando votos . O incidente específico de um fenômeno natural desse tipo é sobre o caso do Brexit .

Nota: a questão não é sobre política. O objetivo é tentar discutir esse fenômeno natural do ponto de vista estatístico, com base em observações.

A questão específica é:

Pergunta: O que significa o voto de $51.9\%$ Brexit para sair ? Por exemplo, significa que o público realmente quer sair da UE? Significa simplesmente que o público não tem certeza e precisa de mais tempo para pensar? Ou é outra coisa?

Suposição 1: não há erro no processo de votação.

statistical-significance voting-system

— homem das cavernas
fonte

14

Democracia não tem significado estatístico. O resultado de 51,9% significa que 51,9% dos que votaram, votaram em "deixar". Esta não é uma pesquisa de opinião. Quem não votou, votou (não) usando os pés. Interpretar 51,9% como "o público não tem certeza e precisa de mais tempo para pensar" está simplesmente mentindo com as estatísticas. O Brexit aconteceu com a probabilidade 1.

— Tim

7

Esse segmento é destinado a não ser estatístico, opinativo e possivelmente até polêmico. Não é adequado para este site, independentemente de quão popular possa ser. Temos uma sala de bate - papo preenchida por pessoas que ficariam felizes em se envolver ainda mais nessas conversas: confira!

— whuber

2

Eu acredito que a discussão atual é estatisticamente focada e é um bom exemplo de interpretação dos resultados da votação, conforme se aplica aos testes estatísticos.

— Minador

3

Você levanta uma questão importante: erro de medição de métricas de opinião pública, como pesquisas. Receio que a principal fonte de erro não seja do tamanho da amostra.

— Aksakal

4

IMHO, esta é uma pergunta não estatística, com uma camada fina de estatística adicionada para disfarçar esse fato. Na minha leitura, a suposição "não há erro no processo de votação" elimina todas as considerações estatísticas e necessariamente canaliza a discussão para o que "votar ... significa" em uma democracia. Isso é uma questão de ciência política e filosofia, não estatística.

— whuber

17

Concordo com o @Underminer que não há erro de amostragem, mas não porque a amostra é grande, mas porque não houve amostragem envolvida . Ninguém foi amostrado para votar. Obviamente, havia uma fração desprezível de pessoas que queriam votar, mas não conseguiram (por exemplo, sofrer um acidente de carro neste dia) ou que fizeram votos inválidos, mas essa é a única "amostra" aqui.

O resultado é exato, não há nenhum erro envolvido, pois toda a população participou da votação (alguns participaram por não participar). Algumas pessoas decidiram votar, outras não. Alguns decidiram votar em licença, outros não. Democracia não é sobre significância estatística, mas sobre o que realmente aconteceu . A votação não se destina a aprender sobre a opinião das pessoas, mas a tomar uma decisão. Na verdade, as pessoas às vezes não votam de acordo com o que pensam, mas para manifestar ou alcançar algo . Por exemplo, nas eleições, as pessoas podem votar não em seu candidato preferido, mas em seu segundo preferido, se acharem que ele tem maiores chances de ganhar.

— Tim
fonte

Considere o caso de uma área cinzenta onde a população votante não tem muita certeza sobre o que é bom para eles. Por exemplo, o caso de ter 2 candidatos quase igualmente bons. Nesse caso, acho que aqueles que votam, provavelmente diferem sistematicamente, pois acho que seus votos podem ter uma distribuição próxima de uma uniforme. Meu objetivo aqui não é redefinir a democracia (um tópico político), mas sim ver o que podemos dizer sobre se o Brexit era uma área cinzenta?

— homem das cavernas

2

@ caveman, não importa se eles têm certeza ou não, o que importa é como eles votaram, já que a votação é sobre votos reais. Certamente, algumas pessoas não tinham uma opinião clara, com algumas votando e outras não, mas isso também não importa, pois o que conta são os votos reais daqueles que votaram.

— Tim

Se eu entendi direito, seu argumento é sobre como a democracia interpreta os votos? Eu concordo com você. No entanto, não estou interpretando isso da maneira que os políticos fazem. Estou tentando usar a população para identificar se uma decisão é boa, ruim ou pouco clara. Este é um uso diferente da votação.

— homem das cavernas

2

O pessoal do @caveman muda de idéia o tempo todo, os psicólogos escreveram milhares de artigos sobre isso ... Sim, 51,9% não significa que exatamente 51,9% dos britânicos tenham 100% de certeza de deixar a UE. As pessoas podem ainda não ter certeza sobre a comparação de comprimentos de linhas ( en.wikipedia.org/wiki/Asch_conformity_experiments ) ...

— Tim

1

@Aksakal Não vou comentar sobre quem é elegível para votar e quem não é. Também não vou comentar o quão difícil pode ser obter as credenciais necessárias. Isso é política e, como tal, não está no tópico aqui. Do ponto de vista estatístico, cada eleitor elegível tem uma certa probabilidade de não votar. Essa probabilidade pode ser influenciada por certos fatores que podem ou não estar relacionados às suas preferências, mas cada eleitor elegível escolhe (não) exercer esse direito a seu critério.

— user3697176

9

51,9% é a porcentagem de eleitores que querem sair . Como o tamanho da amostra é tão grande (> 33 milhões), não há virtualmente nenhum erro de amostragem aleatória.

O teste de significância estatística tentaria determinar se a diferença de permanecer e sair poderia ser explicada apenas por um erro de amostragem aleatória, e a diferença certamente seria significativa (consulte a resposta do homem das cavernas).

O problema dessa abordagem é que a significância estatística pressupõe fortemente que a amostra é representativa de toda a população (toda a Grã-Bretanha), não apenas dos que votam.

A taxa de não resposta (aquelas que não votam) é de extrema importância para determinar se mais da metade de toda a Grã-Bretanha quer 'sair' e é difícil de medir. O viés de não resposta é criado quando subgrupos com menor probabilidade de votar têm visões sistematicamente diferentes. Com base nas pesquisas de saída, por exemplo, os millennials eram menos propensos a votar, mas mais propensos a votar para permanecer , o que influencia os resultados ao tentar representar a população de toda a Grã-Bretanha.

Por esse motivo, o teste de significância estatística no sentido tradicional é em grande parte inadequado .

Pressupostos: Precisamos definir alguns termos para que tudo isso faça sentido e evite discussões políticas sobre o que a votação está tentando realizar. Aqui estão as minhas definições:

População: todas as pessoas que vivem na Grã-Bretanha

Quadro de Amostragem: Toda pessoa elegível para votação capaz de votar

Metodologia de amostragem: resposta voluntária, o ato de votar está participando da pesquisa

Amostra: Os indivíduos que realmente votam

Nesta configuração, a proporção da amostra pode ser usada (para melhor ou para pior) para estimar a porcentagem de todas as pessoas que se inclinam para permanecer (ou sair ).

— Underminer
fonte

8

Você pergunta

O que significa o voto de 51,9% do Brexit para sair?

Isso significa que 51,9% dos eleitores votaram para sair.

Por exemplo, significa que o público realmente quer sair da UE? Significa simplesmente que o público não tem certeza e precisa de mais tempo para pensar? Ou é outra coisa?

Os votos compuseram votos "deixar" e $17\,421\,887$ votos "restantes", indicando $16\,146\,297$ eleitores elegíveis não votaram e aproximadamente milhões de habitantes não são eleitores elegíveis. Como nem a coleta de eleitores reais nem a coleta de eleitores elegíveis é "o público" e nem é uma amostra representativa (aleatória, imparcial, escolha um adjetivo relevante) do "público", o voto de 51,9% do Brexit não é relevante para o seu segundo e perguntas subsequentes. $12\,931\,353$ $18$

Talvez fosse possível construir um questionário que respondesse às suas perguntas. Parece que não foi o que aconteceu no referendo implementado.

— Eric Towers
fonte

1

Você poderia discutir o significado dos votos em relação aos eleitores (ou seja, não toda a população), além da conclusão superficial de que significa " 51,9% de votos votados "? Gostaria de saber qual é a extensão da informação que podemos extrair disso.

— homem das cavernas

4

Caveman, esse comentário, mais do que qualquer outro, demonstra que sua pergunta não é estatística. Como 51,9% (juntamente com o total de contagens) constituem todos os dados em evidência sobre os eleitores e não há incerteza (a menos que você queira contestar a precisão da contagem, que é uma questão separada), sua rejeição a essa resposta implica você está procurando conclusões não estatísticas .

— whuber

E se modelarmos o Brexit como um problema de classificação binária e considerarmos os eleitores como estimativas de classificadores que são membros de um conjunto. Nesse modelo, o objetivo não é identificar o que a maioria dos cidadãos deseja, mas o objetivo é identificar o classificador ideal a partir do espaço dos classificadores. Podemos então usar algumas medidas para testar a bondade desse conjunto de classificadores baseado em eleitores humanos. Por exemplo, podemos usar Perplexity ou algo mais adequado para esta tarefa de classificação binária em que a verdade básica é desconhecida (por exemplo, claramente não sabemos se deixar é melhor do que permanecer).

— 18716

@ caveman: Dado que a verdade básica é (corretamente) desconhecida, que métrica você usaria para "identificar o classificador ideal a partir do espaço dos classificadores"? Qualquer métrica codifica os vieses do analista que seleciona a métrica, exceto a métrica "reproduz o resultado da votação", cuja métrica você já sabe a resposta: 51,9% / 48,1%.

— Eric Towers

@EricTowers eu tenho tido isso para politics.stackexchange.com onde eu conversamos sobre diferentes métodos - politics.stackexchange.com/questions/11433/...

— homem das cavernas

2

TL; DR

Simulei uma população insegura abaixo (abaixo dos detalhes ) por vezes e depois medi a probabilidade de observar um voto de folga de nessa população simulada insegura . Isso me deu a probabilidade simulada de que uma população insegura possa obter um voto de licença de ou mais. $R=1000$ $\ge 51.9\%$ $51.9\%$

Essa probabilidade simulada de licença na população insegura é . $0$

Talvez redundante, mas eu também fiz o mesmo, mas com permanecem para medir a probabilidade de que tal não tem certeza população para obter uma voto permanecem . $\le 48.1\%$

Essa probabilidade simulada de permanecer na população insegura também é . $0$

Portanto, concluo que o voto do Brexit não é um efeito colateral barulhento de uma população insegura ou confusa . Parece haver uma razão sistemática que os leva a deixar a UE.

Carreguei o código do simulador aqui: https://github.com/Al-Caveman/Brexit

Detalhes

Dada a suposição 1 , as possíveis respostas (ou hipótese) são:

: $H_0$ O públiconãotemcerteza.
: $H_1$ O públicoquersaircomconfiança.

Nota: é impossível que o público queira permanecer com confiança porque descartamos erros de votação.

Para responder a essa pergunta (ou seja, $H_0$ ou $H_1$ ), tento medir:

A probabilidade de que uma população insegura possa atingir deixa voto. $\ge 51.9\%$
Ou, probabilidade de que uma população insegura possa atingir permanecem votando. $\le 1-51.9\%$

Se essa probabilidade for baixa o suficiente, podemos concluir que o público quer sair com confiança (ou seja, ). No entanto, se essa probabilidade for grande o suficiente, podemos concluir que o público não tem certeza sobre a decisão do Brexit (ou seja, ). $H_1$ $H_0$

Para medir essa probabilidade, precisamos conhecer a distribuição de uma população britânica insegura em um sistema de votação binário como o Brexit. Portanto, meu primeiro passo é simular essa distribuição seguindo a suposição abaixo:

Suposição 2: uma população composta por indivíduos inseguros terá um voto aleatório . Ou seja, toda resposta possível tem a mesma chance de ser escolhida.

Na minha opinião, essa suposição é justa / razoável.

Além disso, modelamos as licenças e permanecemos campanhas como dois processos distintos, como a seguir:

Processo com a saída $P_{\text{leave}}$ $O_{\text{leave}} = [l_1, l_2, \ldots, l_n]$ .
O processo com a saída . $P_{\text{remain}}$ $O_{\text{remain}} = [r_1, r_2, \ldots, r_n]$

Onde:

é a população total do Reino Unido (inclui os não eleitores). $n$
Para qualquer , . Um valor de saída significa que um eleitor votou não no processo em questão e significa que um eleitor votou sim no mesmo processo. $i \in \{1,2,\ldots,n\}$ $l_i,r_i \in \{0, 1\}$ $0$ $1$

sujeito à seguinte restrição:

Para qualquer , e não podem ser simultaneamente ao mesmo tempo. Ou seja, implica necessariamente que , e implica necessariamente que . Isto é devido ao fato de que um eleitor entre a população $i \in \{1,2,\ldots,n\}$ $l_i$ $r_i$ $1$ $l_i=1$ $r_i = 0$ $r_i=1$ $l_i=0$ $i$ não pode votar parasairepermanecerao mesmo tempo. $\{1,2,\ldots,n\}$

Por exemplo, se , significa que de uma população de , um votou sim para sair e dois votaram não para sair . $O_{\text{leave}} = [1,0,0]$ $3$

Da mesma forma, se $O_{\text{remain}} = [0,1,0]$ , it means that out of a population of $3$ , one has voted yes to remain and two have voted no to remain.

$O_{\text{leave}}[3] = O_{\text{remain}}[3] = 0$ ).

$33,568,184$ $51.9\%$ $100-51.9=48.1\%$ voted to remain). This means:

$n = 33,568,184$ .
$33,568,184 \times 0.519 = 17,421,887.496$ have voted yes to the leave campaign. I.e. $\sum_{i = 1}^{33, 568, 184} O_{leave} [i] = 17, 421, 887.496 \approx 17, 421, 887$ $\sum_{i=1}^{33,568,184}O_{\text{leave}}[i] = 17,421,887.496 \approx 17,421,887$
$33,568,184 \times (1-0.519) = 16,146,296.504$ have voted yes to the remain campaign. I.e. $\sum_{i = 1}^{33, 568, 184} O_{remain} [i] = 16, 146, 296.504 \approx 16, 146, 297$ $\sum_{i=1}^{33,568,184}O_{\text{remain}}[i] = 16,146,296.504 \approx 16,146,297$

Therefore, we define the output arrays as follows:

For all $i \in \{1,2,\ldots, 17421887\}$ , $O_{\text{leave}}[i] = 1$ .
For all $i \in \{17421887+1,17421887+2,\ldots, 33568184\}$ , $O_{\text{leave}}[i] = 0$ .
For all $i \in \{1,2,\ldots, 17421887\}$ , $O_{\text{remain}}[i] = 0$ .
For all $i \in \{17421887+1,17421887+2,\ldots, 33568184\}$ , $O_{\text{remain}}[i] = 1$ .
By Assumption 2, for all $i \in \{1,2,\ldots, 33568184\}$ , $O_{\text{unsure},m}[i] = C$ , where $C$ is a uniformly distributed random variable that takes values in $\{0,1\}$ (e.g. a fair coin toss), and $m$ is a number that identifies a particular random instantiation of $O_{\text{unsure},m}$ . In other words, the probability that two distinct random instantiations of $O_{\text{unsure},m}$ equal each other, i.e. $O_{\text{unsure},1} = O_{\text{unsure},2}$ , is $0.5^{33,568,184}$ .

Finally, we define the $p_{\text{leave}}$ value of the leave process as follows:

p_{leave} = \frac{1}{R} \sum_{m = 1}^{R} {\begin{cases} 1 & if (\sum_{i = 1}^{33, 568, 184} O_{leave} [i]) \leq (\sum_{i = 1}^{33, 568, 184} O_{unsure, m} [i]) \\ 0 & else \end{cases}

$p_{\text{leave}} = \frac{1}{R}\sum_{m=1}^R \begin{cases} 1 & \text{if } \Big(\sum_{i=1}^{33,568,184} O_{\text{leave}}[i]\Big) \le \Big(\sum_{i=1}^{33,568,184} O_{\text{unsure},m}[i]\Big)\\ 0 & \text{else} \end{cases}$ where

R

$R$ is total number of simulation rounds by which at each time a random instance of

O_{unsure, m}

$O_{\text{unsure},m}$ is defined.

Likewise, we define the $p_{\text{remain}}$ value of the remain process as follows:

p_{remain} = \frac{1}{R} \sum_{m = 1}^{R} {\begin{cases} 1 & if (\sum_{i = 1}^{33, 568, 184} O_{remain} [i]) \geq (\sum_{i = 1}^{33, 568, 184} O_{unsure, m} [i]) \\ 0 & else \end{cases}

$p_{\text{remain}} = \frac{1}{R}\sum_{m=1}^R \begin{cases} 1 & \text{if } \Big(\sum_{i=1}^{33,568,184} O_{\text{remain}}[i]\Big) \ge \Big(\sum_{i=1}^{33,568,184} O_{\text{unsure},m}[i]\Big)\\ 0 & \text{else} \end{cases}$

To answer that, I simulated the above in C using $R=1,000$ and the output is:

total leave votes: 17421887
total remain votes: 16146297
simulating p values............ ok
p value for leave: 0.000000
p value for remain: 0.000000

In other words:

$p_{\text{leave}} = 0$ .
$p_{\text{remain}} = 0$ .

— caveman
fonte

2

Perhaps more important in this case is the non-response rate (i.e. individuals who do no vote). The margin of error (or measure of statistical significance) only takes into account random sample error. Non-response bias is NOT included in this, and it is much more impactful than random sampling error with a poll with such a large sample size.

— Underminer

Here it says that UK has

46, 499, 537

$46,499,537$ eligible voters. Meaning

46, 499, 537 - (17421887 + 16146297) = 12, 931, 353

$46,499,537 - (17421887+16146297) = 12,931,353$ didn't vote. Any idea how to interpret such unvoting population? Source: en.wikipedia.org/wiki/…

— caveman

3

There is no statistically satisfactory way to deal with non-random missing data.

— Underminer

Those who haven't voted, could be composed of individuals that don't care about politics (e.g. no more trust). Alternatively, it such unvoters could be those who were not sure. Or, it could be a mixture of the two. What would happen if we assume that "all unvoters are unsure"? Would this be an upper bound for testing whether the current situation was one where the public was feeling that Brexit was a grey area?

— caveman

3

There is a confusion here about the nature & scope of statistics. You are attempting to create a process model of voting, & how that can inform the mechanisms & validity of governance & public decision making. This is a worthwhile task in Political Science. It is simply not statistics (although statistics is involved).

— gung - Reinstate Monica

1

You could ask a slightly different question: Assuming that 50% of a very large population voted "Yes", and you asked a random sample of size S, what is the probability that 51.9% of your sample responded "Yes", depending on the sample size?

The expected value of number of "Yes" votes is 0.5 S. The variance is 0.25 S. The standard definition is 0.5 $S^{1/2}$ . A deviation of the actual from the expected number of "Yes" votes more than 6.1 standard deviations has a chance of one in a billion.

We have this when 0.019 S (difference between 50% and 51.9%) is 6.1 * 0.5 * $S^{1/2}$ , or S = $(6.1 * 0.5 / 0.019)^2$ or S ≈ 25,800.

— gnasher729
fonte

0

Esta é outra solução usando um método analítico em vez de uma simulação.

Anteriormente, simulei uma população insegura para ser aquela em que seu voto é uma hipótese aleatória. Tão fora $n$ Para muitos eleitores, uma população insegura tenderia a votar em deixar ou permanecer por $0.5$ do tempo.

Para que uma população insegura obtenha exatamente $51.9\%$ voto em licença , é preciso haver $17,421,887$ 1s em $O_{\text{leave}}$ . A probabilidade disso é $0.5^{33,568,184}$ . Da mesma forma, a probabilidade de obter $17,421,887 + 1$ votos também é $0.5^{33,568,184}$ . Isso continua.

Essa é a probabilidade de obter $\ge 17,421,887$ votes:

\begin{aligned} \sum_{i = 17, 421, 887}^{33, 568, 184} {0.5}^{33, 568, 184} & = (33, 568, 184 - 17, 421, 887) \times {0.5}^{33, 568, 184} \\ = 8.39663381928984 \times 10^{-} 10105024 \\ \approx 0 \end{aligned}

$\begin{split} \sum_{i=17,421,887}^{33,568,184} 0.5^{33,568,184} &= (33,568,184-17,421,887) \times 0.5^{33,568,184}\\ &= 8.39663381928984×10^-10105024\\ &\approx 0\\ \end{split}$

( $8.39663381928984×10^-10105024$ calculated by Wolframalpha)

And this is the probability of having $\ge 51.9\%$ of an unsure population vote leave.

— caveman
fonte