Você seleciona aleatoriamente dois números inteiros distintos entre 1 e 100. Qual é a probabilidade de o número maior ser exatamente o dobro do número menor?

8

Recentemente, fiz um teste do HackerRank para uma posição de Ciência de Dados e entendi errado essa pergunta. Eu vim para 1/200. Aqui está como:

Existem 50 combinações que tornarão isso verdade. (ou seja, {1,2}, {2,4}, {3,6} ... {50,100}). A probabilidade de um número específico ser escolhido é 1/100. A probabilidade de que o conjunto específico seja escolhido é (1/100 * 1/100).

Uma vez que existem 50 conjuntos,

P=50*(1/100)*(1/100)=1/200

Obviamente, estou assumindo que 1 e 100 estão incluídos. Mas esta foi a resposta errada. Alguém pode me ajudar a entender meu erro?

probability combinatorics

— Jo Bennet
fonte

4

A chave do seu erro é a palavra "distinto".

— Matthew Drury

Ahh !! Então deveria ter sido 50 * (1/100) * (1/99)?

— JoBennet

4

Resolva-o para uma versão menor do problema, como substituir "100" por "3". Faça isso por uma enumeração exaustiva de todos os pares. Você deve ver rapidamente qual é a resposta correta para 100.

— whuber

7

Seu primeiro erro é que existem 50 resultados, na verdade existem 100 (editar: veja o comentário abaixo para esclarecimentos). Isso ocorre porque obter (1,2) e (2,1) é o resultado de dois resultados separados, mas em cada caso o número maior é exatamente o dobro do número menor.

Portanto, o total de maneiras possíveis de obter isso é realmente fornecido pelo conjunto:

{(1,2), (2,1), (2,4), (4,2), ..., (50.100), (100,50)}

Que é uma lista de 100 resultados possíveis.

O número total de resultados possíveis é $100 \times 99$

Como existem 100 números possíveis para escolher na primeira vez e, em seguida, 99 na segunda, pois eles devem ser distintos.

Portanto, a resposta é dada por:

$P = \frac{100}{100 \times 99} = \frac{1}{99}$

Usando o mesmo argumento, é fácil provar que a probabilidade para o caso mais geral de escolher números de onde é algum número par positivo, é dada por: $1, 2, ..., n$ $n$

$P = \frac{1}{n-1}$

— Patty
fonte

1

+1. Mas observe que o OP não cometeu um erro ao contar os resultados: ele estava contando pares não ordenados, o que fez corretamente, enquanto você conta pares ordenados. (Essa abordagem é válida: existem "resultados" favoráveis "de todos os , cuja proporção fornece uma resposta geral.) O problema pode ser melhor caracterizado como um erro na contagem do espaço de amostra de todos os números distintos não ordenados.

⌊ n / 2 ⌋

$\lfloor{n/2}\rfloor$

(\binom{n}{2}) = (n / 2) (n - 1)

$\binom{n}{2}=(n/2)(n-1)$

— whuber

6

O "Hacker" no nome do teste sugere que tentemos encontrar uma solução orientada à computação.

Vamos, portanto, começar com um programa para enumeração de força bruta de (a) casos "favoráveis" em que um número inteiro é duas vezes o outro e (b) todos os casos possíveis. A resposta seria então a proporção deles. Eu codifiquei uma solução geral. Sua entrada é um número inteiro positivo ne sua saída é a probabilidade.

n=100
all=favorable=0
for i=1 to n
    for j=1 to n
        if (i != j) all=all+1                  {1}
        if (j == 2*i) favorable = favorable+1  {2}
        if (i == 2*j) favorable = favorable+1  {3}
return(favorable / all)

(A prova de correção baseia-se no fato de que para qualquer número positivo .) $i \ne 2i$ $i$

Este programa requer testes e até incrementos para cada iteração do loop interno. Portanto, ele precisa entre cálculos de e cada vez que o loop interno é executado, ou a geral. Esse é desempenho de : OK para pequeno como , mas terrível uma vez que excede ou mais. $3$ $3$ $3n$ $6n$ $3n^2$ $6n^2$ $O(n^2)$ $n$ $n=100$ $n$ $10000$

Como hacker, uma das primeiras coisas que você deseja fazer é eliminar o desempenho quadrático, simplificando o loop interno (se possível). Para isso, passe sistematicamente pelas linhas do loop interno (conforme numerado) e observe o seguinte:

A linha 1 é executada quase uma vez para cada valor de ie, portanto, allé incrementada vezes. Consequentemente, para o cálculo de , o loop over pode ser substituído pelo incremento de . $n-1$ alljalln-1
A linha 2 é executada exatamente uma vez quando e, caso contrário, não é. Portanto, ele pode ser substituído pelo incremento de sempre que . $2i \le n$ all $1$ $2i \le n$
A linha 3 é executada uma vez que iseja uniforme.

Aqui está o programa transformado.

n=100
all=favorable=0
for i=1 to n
    all = all + (n-1)                      {1'}
    if (2*i <= n) favorable = favorable+1  {2'}
    if (even(i)) favorable = favorable+1   {3'}
return(favorable / all)

Podemos ir além e eliminar seu loop?

A linha 1 'é executada vezes. Portanto, é incrementado por . $n$ alln*(n-1)
A linha 2 'é executada apenas quando . Uma maneira de contar isso é (o maior número inteiro menor ou igual a ). $2i \le n$ $\lfloor n/2\rfloor$ $n/2$
A linha 3 'é executada apenas para valores pares de . Novamente, isso acontece vezes. $i$ $\lfloor n/2 \rfloor$

A segunda transformação do programa é:

n=100
all=favorable=0                     {0}
all = all + n * (n-1)               {1''}
favorable = favorable + floor(n/2)  {2''}
favorable = favorable + floor(n/2)  {3''}
return(favorable / all)

Isso já é uma tremenda conquista: um algoritmo foi reduzido a um algoritmo (que pode ser considerado uma "fórmula fechada" para a resposta). $O(n^2)$ $O(1)$

Finalmente, existem algumas transformações algébricas simples que podemos fazer rolando a inicialização (linha 0) para o primeiro uso de cada variável e combinando as linhas 2 '' e 3 '':

n=100
all = n * (n-1) 
favorable = 2 * floor(n/2) 
return(favorable / all)

Nesse ponto, um humano poderia executar o programa. Vamos fazer isso com : $n=100$

all = 100 * (100-1) = 100*99
favorable = 2 * floor(100/2) = 2*50 = 100
favorable/all = 100 / (100*99) = 1/99

A saída, portanto, é . $1/99$

Para resumir, um algoritmo de força bruta pode ser transformado sistematicamente usando regras simples de reescrita de programa em um programa elegante e elegante . $O(1)$

— whuber
fonte

2

Primeiro de tudo, você está amostrando sem substituição. Assim, existem 100 * 99 resultados diferentes, por exemplo, (1,1) não é um resultado válido.

Em segundo lugar, a ordem não importa. O maior deve ser exatamente duas vezes, não o segundo. Portanto, remova os pares simétricos.

Assim, 50 de (100) * 99/2 são positivos ou 1/99

— Possui QUIT - Anony-Mousse
fonte