Respondendo apenas à primeira de suas perguntas: "Quais testes você aplicaria para determinar se essa [sequência] é realmente aleatória?"
Que tal tratá-lo como uma série temporal e verificar autocorrelações? Aqui está um código R. Primeiro, alguns dados de teste (primeiros 1000 dígitos):
digits_string="1415926535897932384626433832795028841971693993751058209749445923078164062862089986280348253421170679821480865132823066470938446095505822317253594081284811174502841027019385211055596446229489549303819644288109756659334461284756482337867831652712019091456485669234603486104543266482133936072602491412737245870066063155881748815209209628292540917153643678925903600113305305488204665213841469519415116094330572703657595919530921861173819326117931051185480744623799627495673518857527248912279381830119491298336733624406566430860213949463952247371907021798609437027705392171762931767523846748184676694051320005681271452635608277857713427577896091736371787214684409012249534301465495853710507922796892589235420199561121290219608640344181598136297747713099605187072113499999983729780499510597317328160963185950244594553469083026425223082533446850352619311881710100031378387528865875332083814206171776691473035982534904287554687311595628638823537875937519577818577805321712268066130019278766111959092164201989"
digits=as.numeric(unlist(strsplit(digits_string,"")))
Verifique as contagens de cada dígito:
> table(digits)
digits
0 1 2 3 4 5 6 7 8 9
93 116 103 102 93 97 94 95 101 106
Em seguida, transforme-o em uma série temporal e execute o teste Box-Pierce:
d=as.ts( digits )
Box.test(d)
o que me diz:
X-squared = 1.2449, df = 1, p-value = 0.2645
Normalmente, você deseja que o valor-p seja menor que 0,05 para dizer que há correlações automáticas.
Corra acf(d)
para ver as correlações automáticas. Não incluí uma imagem aqui, pois é um gráfico sem graça, embora seja curioso que os maiores atrasos sejam 11 e 22. Corra acf(d,lag.max=40)
para mostrar que não há pico no atraso = 33, e que foi apenas coincidência!
PS Podemos comparar o desempenho desses 1000 dígitos de pi, fazendo os mesmos testes em números aleatórios reais.
probs=sapply(1:100,function(n){
digits=floor(runif(1000)*10)
bt=Box.test(ts(digits))
bt$p.value
})
Isso gera 1000 dígitos aleatórios, faz o teste e repete isso 100 vezes.
> summary(probs)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.006725 0.226800 0.469300 0.467100 0.709900 0.969900
> sd(probs)
[1] 0.2904346
Portanto, nosso resultado foi confortavelmente dentro do primeiro desvio padrão, e pi chia como um pato aleatório. Usei set.seed(1)
se você deseja reproduzir esses números exatos.