Às vezes, temos que usar loops, por exemplo, quando não sabemos quantas iterações precisamos para obter o resultado. Tome enquanto loops como um exemplo. Abaixo estão os métodos que você absolutamente deve evitar:
a=numeric(0)
b=1
system.time(
{
while(b<=1e5){
b=b+1
a<-c(a,pi)
}
}
)
# user system elapsed
# 13.2 0.0 13.2
a=numeric(0)
b=1
system.time(
{
while(b<=1e5){
b=b+1
a<-append(a,pi)
}
}
)
# user system elapsed
# 11.06 5.72 16.84
Eles são muito ineficientes porque R copia o vetor toda vez que ele anexa.
A maneira mais eficiente de acrescentar é usar o índice. Observe que desta vez eu deixo repetir 1e7 vezes, mas ainda é muito mais rápido que c
.
a=numeric(0)
system.time(
{
while(length(a)<1e7){
a[length(a)+1]=pi
}
}
)
# user system elapsed
# 5.71 0.39 6.12
Isso é aceitável. E podemos torná-lo um pouco mais rápido substituindo [
por [[
.
a=numeric(0)
system.time(
{
while(length(a)<1e7){
a[[length(a)+1]]=pi
}
}
)
# user system elapsed
# 5.29 0.38 5.69
Talvez você já tenha notado que isso length
pode consumir tempo. Se substituirmos length
por um contador:
a=numeric(0)
b=1
system.time(
{
while(b<=1e7){
a[[b]]=pi
b=b+1
}
}
)
# user system elapsed
# 3.35 0.41 3.76
Como outros usuários mencionaram, pré-alocar o vetor é muito útil. Mas isso é uma troca entre velocidade e uso de memória, se você não souber quantos ciclos precisa para obter o resultado.
a=rep(NaN,2*1e7)
b=1
system.time(
{
while(b<=1e7){
a[[b]]=pi
b=b+1
}
a=a[!is.na(a)]
}
)
# user system elapsed
# 1.57 0.06 1.63
Um método intermediário é adicionar gradualmente blocos de resultados.
a=numeric(0)
b=0
step_count=0
step=1e6
system.time(
{
repeat{
a_step=rep(NaN,step)
for(i in seq_len(step)){
b=b+1
a_step[[i]]=pi
if(b>=1e7){
a_step=a_step[1:i]
break
}
}
a[(step_count*step+1):b]=a_step
if(b>=1e7) break
step_count=step_count+1
}
}
)
#user system elapsed
#1.71 0.17 1.89
vector = values
; ou você pode fazer vector = vector + values. Mas eu posso estar entendendo mal o seu caso de uso