Análise de palavras-chave do Microsoft Office [fechada]


0

Existe um software que fará a análise de palavras-chave em um lote de arquivos do Microsoft Word? Em outras palavras, eu simplesmente gostaria de uma contagem de palavras em todas as palavras usadas. O objetivo é identificar palavras-chave como base para a criação de uma taxonomia.


Isso é muito aberto: que tipo de análise você queria?
Clare Macrae

pergunta atualizada para ser mais específica.
mmcglynn

Duplicação possível de: superuser.com/questions/251324/…
fixer1234

Respostas:


1

Eu uso um script Python que usa o docx.py módulo (ver Aqui ) para ler arquivos do Word e processar as palavras individuais para uma tarefa relacionada. Os bits de chave estão no código a seguir (que apenas lê um arquivo .docx dado como o primeiro argumento de linha de comando, mas pode ser facilmente expandido para contar palavras em muitos arquivos:

from docx import *
import sys

try:
    document = opendocx(sys.argv[1])
except:
    print('Could not open '+sys.argv[1])
    exit()

## Fetch all the text out of the document       
paratextlist = getdocumenttext(document)    

count = {}
for line in paratextlist:
    for word in line.rstrip().split():
        count{word} = count.get(word,0) + 1

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.