Extrair texto de HTML usando Applescript


1

Eu estou olhando para extrair texto de um html usando Applescript, aqui está o código:

<div class="vk_bk vk_ans">3:27 PM</div> 

Quero extrair "15:27", que é o resultado que o Google fornece quando você pergunta o horário em Nova York. O Google sempre fornecerá um resultado direto entre essas tags e pretendo extraí-lo e depois extraído exportado para um arquivo .txt. Se vocês precisam de mais HTML, basta pesquisar o tempo em Nova York e inspecionar o elemento.

Todas as respostas são apreciadas.

Respostas:


0

Provavelmente é fácil extrair usando o sedcomando no terminal.

sed -E 's/<div class="vk_bk vk_ans">(.*)<\/div>/\1/g' filename

Isso retornará o texto entre <div class="vk_bk vk_ans">e </div>que existe no seu filename.


Copiei e colei todo o html em um arquivo .txt e digite o comando que você me disse no terminal que é: sed -E's / <div class = "vk_bk vk_ans"> (. *) <\ / Div> / \ 1 / g 'test.txt. mas recebo todo o html de volta depois de inserir o comando. Por favor ajude!
Alec Attie
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.