Nimrod: ~ 38.667 (580.000.000 / 15.000)
Esta resposta usa uma abordagem bastante simples. O código emprega uma peneira simples de número primo que armazena o número primo da menor potência primária em cada slot para números compostos (zero para números primos), depois usa a programação dinâmica para construir a função totiente no mesmo intervalo e depois soma os resultados. O programa gasta praticamente todo o tempo construindo a peneira e calcula a função totiente em uma fração do tempo. Parece que tudo se resume à construção de uma peneira eficiente (com a leve torção de que também é preciso extrair um fator primo para números compostos do resultado e manter o uso da memória em um nível razoável).
Atualização: Desempenho aprimorado, reduzindo o consumo de memória e melhorando o comportamento do cache. É possível reduzir de 5% a 10% mais o desempenho, mas o aumento na complexidade do código não vale a pena. Por fim, esse algoritmo exercita principalmente o gargalo de von Neumann de uma CPU, e há muito poucos ajustes algorítmicos que podem contornar isso.
Também atualizou o divisor de desempenho, pois o código C ++ não era para ser compilado com todas as otimizações ativadas e mais ninguém o fazia. :)
Atualização 2: operação de peneira otimizada para melhor acesso à memória. Agora, manipule primos pequenos em massa via memcpy () (~ 5% de aceleração) e pule múltiplos de 2, 3 e 5 ao peneirar primos maiores (~ 10% de aceleração).
Código C ++: 9,9 segundos (com g ++ 4,9)
Código Nimrod: 9,9 segundos (com -d: release, backend do gcc 4.9)
proc handleSmallPrimes(sieve: var openarray[int32], m: int) =
# Small primes are handled as a special case through what is ideally
# the system's highly optimized memcpy() routine.
let k = 2*3*5*7*11*13*17
var sp = newSeq[int32](k div 2)
for i in [3,5,7,11,13,17]:
for j in countup(i, k, 2*i):
sp[j div 2] = int32(i)
for i in countup(0, sieve.high, len(sp)):
if i + len(sp) <= len(sieve):
copyMem(addr(sieve[i]), addr(sp[0]), sizeof(int32)*len(sp))
else:
copyMem(addr(sieve[i]), addr(sp[0]), sizeof(int32)*(len(sieve)-i))
# Fixing up the numbers for values that are actually prime.
for i in [3,5,7,11,13,17]:
sieve[i div 2] = 0
proc constructSieve(m: int): seq[int32] =
result = newSeq[int32](m div 2 + 1)
handleSmallPrimes(result, m)
var i = 19
# Having handled small primes, we only consider candidates for
# composite numbers that are relatively prime with 31. This cuts
# their number almost in half.
let steps = [ 1, 7, 11, 13, 17, 19, 23, 29, 31 ]
var isteps: array[8, int]
while i * i <= m:
if result[i div 2] == 0:
for j in 0..7: isteps[j] = i*(steps[j+1]-steps[j])
var k = 1 # second entry in "steps mod 30" list.
var j = 7*i
while j <= m:
result[j div 2] = int32(i)
j += isteps[k]
k = (k + 1) and 7 # "mod 30" list has eight elements.
i += 2
proc calculateAndSumTotients(sieve: var openarray[int32], n: int): int =
result = 1
for i in 2'i32..int32(n):
var tot: int32
if (i and 1) == 0:
var m = i div 2
var pp: int32 = 2
while (m and 1) == 0:
pp *= 2
m = m div 2
if m == 1:
tot = pp div 2
else:
tot = (pp div 2) * sieve[m div 2]
elif sieve[i div 2] == 0: # prime?
tot = i - 1
sieve[i div 2] = tot
else:
# find and extract the first prime power pp.
# It's relatively prime with i/pp.
var p = sieve[i div 2]
var m = i div p
var pp = p
while m mod p == 0 and m != p:
pp *= p
m = m div p
if m == p: # is i a prime power?
tot = pp*(p-1)
else:
tot = sieve[pp div 2] * sieve[m div 2]
sieve[i div 2] = tot
result += tot
proc main(n: int) =
var sieve = constructSieve(n)
let totSum = calculateAndSumTotients(sieve, n)
echo totSum
main(580_000_000)