1
IDF incremental (frequência inversa de documentos)
Em um aplicativo de mineração de texto, uma abordagem simples é usar a heurística para criar vetores como representações esparsas compactas dos documentos. Isso é bom para a configuração do lote, onde o corpus inteiro é conhecido a priori, pois o i d f requer o corpus inteirotf−idftf−idftf-idfidfidfidf idf(t)=log|D||{d:t∈d}|idf(t)=log|D||{d:t∈d}| \mathrm{idf}(t) …