Visite também: UnderLinux ·  VivaOLinux ·  LinuxSecurity ·  Dicas-L ·  NoticiasLinux ·  SoftwareLivre.org ·  [mais] ·  Efetividade ·  Linux in Brazil ·  Floripa  

Tesseract: OCR de qualidade no Linux


“Postei no meu blog, a minha experiência com um programa de reconhecimento de caracteres livre que está sendo mantido pelo Google: o Tesseract-OCR. Além de descrever como usar o Gimp para melhorar a taxa de reconhecimento, eu descrevo como implementei um dicionário em português, que melhora ainda mais o rendimento do programa. Para os menos ousados, um pacote com o dicionário está disponível para download.

Nos testes realizados, o Tesseract-OCR acertou mais de 99% dos caracteres (incluindo acentuados). Embora rode por linha de comando, é fácil e apresenta melhor desempenho que outros testados, com o gocr e o ocrad.”


Enviado por Thadeu Penna (thadeu·pennaΘgmail·com) - referência (profs.if.uff.br).

Comentários dos leitores

Os comentários abaixo são responsabilidade de seus autores e não são revisados ou aprovados pelo BR-Linux. Consulte os Termos de uso para informações adicionais. Esta notícia foi arquivada, não será possível incluir novos comentários.
Comentário de beto
Muito bom: Excelente artigo do blog do Thadeu Penna.
Testei o Tesseract e funcionou melhor que os teste que fiz no passado com programas comerciais pra outras plataformas.


--
sapere aude
hackuna matata
http://mayer.art.br/blogdobeto

Comentário de Manoel Pinho
Excelente: Excelente artigo !

É mais um que vou colocar nos bookmarks, junto com outro artigo (em inglês) muito bom que faz uma revisão do estado dos OCRs para linux

http://groundstate.ca/ocr
Comentário de Romeu
"Embora rode por linha de comando, é fácil": "Embora rode por linha de comando, é fácil"

Como assim "embora"? Difícil seria implementar algo útil que usasse esse software, tendo q abrir uma janela pra isso. Precisamos encarar mais de perto o paradigma KISS.
Comentário de Thadeu Penna
Romeu,: Romeu,

o que eu quero dizer é que este programa, na linha de comando, é fácil usar pois não precisa de um número absurdo de argumentos, como o mencoder, ffmpeg, etc. Linha de comando nem sempre é KISS.

Nos comentários do post, tem como ajustar o que foi escaneado, usando linha de comando. Creio que um programa pequeno que fizesse o ajuste e mostrasse um preview seria ainda KISS e útil.


--
Thadeu Penna
Prof.Associado - Instituto de Física - UFF
Linux User #50500 (counter.li.

BR-Linux.org
Linux® levado a sério desde 1996. Notícias, dicas e tutoriais em bom português sobre Linux e Código Aberto. "A página sobre software livre mais procurada no Brasil", segundo a Revista Isto É.
Expediente
Sobre o BR-Linux
Enviar notícia ou release
Contato, Termos de uso
FAQ, Newsletter, RSS
Banners e selos
Anunciar no BR-Linux
BR-Linux apóia
LinuxSecurity, Tempo Real
Suporte Livre, Drupal
Verdade Absoluta
Pandemonium
Efetividade, Floripa.net
sites da comunidade
Ajuda
Moderação
Flames: não responda!
Publicar seu texto
Computador para Todos
Notícias pré-2004
Tutoriais, HCL pré-2004