Soma ponderada dos últimos N números

Suponha que estamos recebendo números em um fluxo. Depois que cada número é recebido, uma soma ponderada dos últimos $N$ números precisa ser calculada, onde os pesos são sempre os mesmos, mas arbitrários.

Com que eficiência isso pode ser feito se tivermos permissão para manter uma estrutura de dados para ajudar no cálculo? Podemos fazer algo melhor que $\Theta(N)$ , ou seja, recalcular a soma cada vez que um número é recebido?

Por exemplo: Suponhamos que os pesos são $W= \langle w_1, w_2, w_3, w_4\rangle$ . Em um ponto que tem a lista dos últimos $N$ números $L_1= \langle a, b, c, d \rangle>$ , e a soma ponderada $S_1=w_1*a+w_2*b+w_3*c+w_4*d$ .

Quando um outro número, $e$ , é recebida, que actualizar a lista para obter $L_2= \langle b,c,d,e\rangle$ e é preciso calcular $S_2=w_1*b+w_2*c+w_3*d+w_4*e$ .

Consideração sobre o uso da FFT Um caso especial desse problema parece ser solucionável com eficiência, empregando a Transformada rápida de Fourier. Aqui, nós calcular as somas ponderadas em múltiplos de . Em outras palavras, nós recebemos números e só então podemos calcular as somas ponderadas correspondentes . Para fazer isso, precisamos de números anteriores (para os quais as somas já foram computadas) e novos números, no total de números . $S$ $N$ $N$ $N$ $N-1$ $N$ $2N-1$

Se esse vetor de números de entrada e o vetor de peso definem os coeficientes dos polinômios e , com os coeficientes em invertidos, vemos que o produto é um polinômio cujos coeficientes na frente de até são exatamente as somas ponderadas que buscamos. Estes podem ser calculados usando FFT em $W$ $P(x)$ $Q(x)$ $Q$ $P(x)\times Q(x)$ $x^{N-1}$ $x^{2N-2}$ , que nos dá uma média de por número de entrada. $\Theta(N*\log (N))$ $Θ(\log (N))$

No entanto, essa não é uma solução para o problema, conforme declarado, porque é necessário que a soma ponderada seja computada com eficiência cada vez que um novo número for recebido - não podemos atrasar o cálculo.

algorithms data-structures online-algorithms

— Ambroz Bizjak
fonte

Observe que você pode usar o LaTeX aqui.

— Raphael

As entradas são provenientes de alguma distribuição conhecida? Eles possuem propriedades matemáticas úteis? Se não o fizerem, é improvável que isso seja possível (a menos que alguém seja capaz de encontrar uma forma bem organizada e fechada que seja computável sublinear - eu certamente não consigo encontrar uma). Além disso, as aproximações estão OK? Esse pode ser um caminho a percorrer, se for útil para você.

— RDN

Os filtros FIR fazem isso, portanto seu design será relevante.

— Adriann

@RDN Coloquei esta questão como uma curiosidade, não tenho uma aplicação prática em mente.

— Ambroz Bizjak

Aqui está uma elaboração da sua abordagem. A cada iteração, usamos o algoritmo FFT para calcular valores da convolução no tempo , assumindo que os valores subsequentes sejam zero. Em outras palavras, estamos computando $m$ $m$ $O(n\log n)$ $m$ onde são os pesos (ou os pesos reversos), é a sequência de entrada, é o tempo atual e

\sum_{i = 0}^{n - 1} w_{i} a_{t - i + k}, 0 \leq k \leq m - 1,

$\sum_{i=0}^{n-1} w_i a_{t-i+k}, \quad 0 \leq k \leq m-1,$

w_{i}

$w_i$

n

$n$

a_{i}

$a_i$

t

$t$

para

a_{t^{'}} = 0

$a_{t'} = 0$

t^{'} > t

$t' > t$

Para cada um dos seguintes iterações, que são capazes de calcular a convolução necessário em tempo (o th iteração precisa de tempo ). Portanto, o tempo amortizado é . Isso é minimizado escolhendo $m$ $O(m)$ $i$ $O(i)$ $O(m) + O(n\log n/m)$ , que fornece um tempo de execução amortizado de $m = \sqrt{n\log n}$ . $O(\sqrt{n\log n})$

Podemos melhorar isso para o pior caso de tempo de execução de dividindo o cálculo em partes. Fix, e definir $O(\sqrt{n\log n})$ $m$ Cada depende apenas de entradas, portanto pode ser calculada no tempo . Além disso, dado para

b_{T, p, o} = \sum_{i = 0}^{m - 1} w_{p m + i} a_{T m - i + o}, C_{T, p} = b_{T, p, 0}, \dots, b_{T, p, m - 1} .

$b_{T,p,o} = \sum_{i=0}^{m-1} w_{pm+i} a_{Tm-i+o}, \quad C_{T,p} = b_{T,p,0}, \ldots, b_{T,p,m-1}.$

C_{T, p}

$C_{T,p}$

2 m

$2m$

O (m \log m)

$O(m\log m)$

C_{⌊ t / m ⌋ - p, p}

$C_{\lfloor t/m \rfloor-p,p}$

, podemos calcular a convolução no tempo

. Portanto, o plano é manter a lista

0 \leq p \leq n / m - 1

$0 \leq p \leq n/m-1$

O (n / m + m)

$O(n/m + m)$

Para cada período de

entradas, precisamos atualizar

delas. Cada atualização leva tempo

; portanto, se espalharmos essas atualizações uniformemente, cada entrada ocupará o trabalho

C_{⌊ t / m ⌋ - p, p}, 0 \leq p \leq n / m - 1.

$C_{\lfloor t/m \rfloor-p,p}, \quad 0 \leq p \leq n/m-1.$

m

$m$

n / m

$n/m$

O (m \log m)

$O(m\log m)$

O ((n / m^{2}) m \log m) = O ((n / m) \log m)

$O((n/m^2) m\log m) = O((n/m) \log m)$ . Juntamente com o cálculo da própria convolução, a complexidade do tempo por entrada é

O ((n / m) \log m + m)

$O((n/m)\log m + m)$

m = \sqrt{n \log n}

$m = \sqrt{n\log n}$

O (\sqrt{n \log n})

$O(\sqrt{n\log n})$

— Yuval Filmus
fonte

Solução maravilhosa, obrigado, eu não tinha muita certeza se isso poderia ser feito.

— precisa saber é o seguinte

E funciona! Implementação C: ideone.com/opuoMj

— Ambroz Bizjak

Meh, estava faltando o último trecho de código que na verdade faz com que o cálculo seja quebrado, corrigido aqui ideone.com/GRXMAZ .

— Ambroz Bizjak

Na minha máquina, esse algoritmo começa a ser mais rápido que o algoritmo simples, com cerca de 17.000 pesos. Para um pequeno número de pesos, é lento. Referência: ideone.com/b7erxu

— Ambroz Bizjak 21/03

Muito impressionante que você realmente implementou isso! Você provavelmente deseja otimizar

m

$m$ . A escolha

m = \sqrt{n \log n}

$m = \sqrt{n\log n}$ é apenas um guia aproximado e pode não ser o ideal. Você tentou executar o algoritmo com diferentes valores de

m

$m$ ?

— Yuval Filmus 22/03