P(Mi<Fj)>12i,jMii
É claro que outras interpretações da frase são possíveis (é isso que é ambiguidade, afinal) e algumas dessas outras possibilidades podem ser consistentes com o seu raciocínio.
[Também temos a questão de saber se estamos falando de amostras ou populações ... "a maioria dos homens [...] a maioria das mulheres" parece ser uma declaração da população (sobre uma população de tempos em potencial), mas apenas observamos os tempos que parecemos tratar como uma amostra, por isso devemos ter cuidado com a abrangência da reivindicação.]
P(Mi<Fj)>12M˜<F˜
[Não estou dizendo que você está errado ao pensar que a proporção de pares aleatórios de MF em que o homem era mais rápido que a mulher é superior a 1/2 - você quase certamente está correto. Só estou dizendo que você não pode contar comparando medianas. Nem você pode dizer isso olhando para a proporção em cada amostra acima ou abaixo da mediana da outra amostra. Você teria que fazer uma comparação diferente.]
12
Exemplo:
Conjunto de dados A:
1.58 2.10 16.64 17.34 18.74 19.90 1.53 2.78 16.48 17.53 18.57 19.05
1.64 2.01 16.79 17.10 18.14 19.70 1.25 2.73 16.19 17.76 18.82 19.08
1.42 2.56 16.73 17.01 18.86 19.98
Conjunto de dados B:
3.35 4.62 5.03 20.97 21.25 22.92 3.12 4.83 5.29 20.82 21.64 22.06
3.39 4.67 5.34 20.52 21.10 22.29 3.38 4.96 5.70 20.45 21.67 22.89
3.44 4.13 6.00 20.85 21.82 22.05
Conjunto de dados C:
6.63 7.92 8.15 9.97 23.34 24.70 6.40 7.54 8.24 9.37 23.33 24.26
6.18 7.74 8.63 9.62 23.07 24.80 6.54 7.37 8.37 9.09 23.22 24.16
6.57 7.58 8.81 9.08 23.43 24.45
(Os dados estão aqui , mas estão sendo usados para um propósito diferente - para minha lembrança eu mesmo os gerei)
Observe que a proporção de A <B é 2/3, a proporção de A <C é 5/9 e a proporção de B <C é 2/3. Ambos A vs B e B vs C são significativos no nível de 5%, mas podemos alcançar qualquer nível de significância simplesmente adicionando cópias suficientes das amostras. Podemos até evitar laços, duplicando as amostras, mas adicionando instabilidade suficientemente pequena (suficientemente menor que o menor espaço entre os pontos)
As medianas da amostra seguem na outra direção: mediana (A)> mediana (B)> mediana (C)
Novamente, poderíamos alcançar significância para algumas comparações de medianas - para qualquer nível de significância - repetindo as amostras.
Para relacioná-lo com o problema atual, imagine que A seja o "tempo das mulheres" e B seja o "tempo dos homens". Então o tempo médio dos homens é mais rápido, mas um homem escolhido aleatoriamente será 2/3 do tempo mais lento que uma mulher escolhida aleatoriamente.
Tomando nossa sugestão das amostras A e C, podemos gerar um conjunto maior de dados (em R) da seguinte maneira:
n <- 300
F <- c(runif(n/3,0,5),runif(n-n/3,15,20))
M <- c(runif(n-n/3,7.5,12.5),runif(n/3,22.5,27.5))
A mediana de F será em torno de 16,25, enquanto a mediana de M será em torno de 11,25, mas a proporção de casos em que F <M será de 5/9.
n13
P(F<med(M))=23P(M>med(F))=23med(M)<med(F)