O que são ferramentas úteis de anotação (se houver)


9

Estou procurando ferramentas que ajudem a mim e à minha equipe a anotar conjuntos de treinamento. Eu trabalho em um ambiente com grandes conjuntos de dados, alguns dos quais são un ou semi-estruturados. Em muitos casos, existem registros que ajudam a encontrar uma verdade fundamentada. Em muitos casos, porém, é necessário um conjunto com curadoria, mesmo que fosse apenas para avaliação. Um fator complicador é que alguns dos dados não podem sair da premissa.

Queremos anotar uma tarefa de detecção de objetos, mas prevejo uma tarefa de segmentação de imagens, uma tarefa de classificação de texto e uma tarefa de detecção de sentimentos em um futuro próximo.

O que estou procurando é um sistema que possa ajudar um grupo a fazer uma anotação, de preferência de uma maneira que motive os anotadores, mostrando o progresso do grupo, o progresso individual relativo e, talvez, o acordo pessoal do anotador.


11
As ferramentas de anotação geralmente dependem da tarefa.
Franck Dernoncourt

Respostas:


2

Você pode experimentar o Prodigy por explosion.ai, criadores do spacy ou pirralho, uma alternativa de código aberto a ele. Você também pode consultar este post em qoura.


11
Tente usar a ferramenta de anotação EVA. github.com/Ericsson/eva , possui uma excelente função de rastreamento. você marca o objeto em apenas 1 quadro e os demais / muitos dos quadros são anotados automaticamente. Isso também possui o recurso de desbloqueio de bloqueio para ajudar a anotar um número mais rápido e maior de objetos em cada quadro. Isso suporta upload de vídeo ou conjuntos de dados de imagem.
Manish S

9

O Doccano é uma alternativa mais simples de código aberto ao Prodigy. Seu python nativo via Django. Eu achei adequado para implementações simples.



1

Tenho vindo a trabalhar com o SPACY extenstion na criação da Technische Universität Darmstadt. Parece muito bom até agora.


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.