Visite também: Currículo ·  Efetividade BR-Mac

O que é LinuxDownload LinuxApostila LinuxEnviar notícia


OCR: Abbyy porta seu ‘Fine Reader Engine’ para Linux

Enviado por Rafael Peregrino da Silva (rperegrinoΘlinuxmagazine·com·br):

“A Abbyy, especialista em gerenciamento de documentos, lançou uma interface via linha de comando (CLI) do sistema de reconhecimento óptico de caracteres (OCR) Fine Reader Engine 8.0 para Linux.

A empresa descreve a interface CLI do Fine Reader Engine 8.0 como um aplicativo OCR pronto para o uso, sendo uma referência na conversão de documentos escaneados, PDFs e figuras, em arquivos editáveis nos quais pode-se realizar buscas. Graças à interface via linha de comando — e através dela — é possível integrar de maneira simples o aplicativo tanto a programas para desktop quanto para servidores, por exemplo através do uso de pipes.

Os documentos convertidos podem ser armazenados ao final do processo de conversão nos formatos RTF, HTML ou PDF. O Fine Reader Engine divide o processamento da conversão de documentos em várias etapas, começando pela preparação da imagem original, na qual o programa procura remover ruídos e variações/inversões de cores da imagem, que poderiam levar a erros no reconhecimento do texto. Em seguida, é detectada a posição da página e os elementos do documento são analisados. De acordo com o fabricante, o reconhecimento de caracteres funciona em 190 idiomas.

O Fine Reader Engine 8.0 para Linux já está disponível e o preço das licenças depende do número de páginas convertidas. Para 12.000 páginas por ano o preço é de € 150; para 120.000 páginas o preço sobe para € 1.000. Uma versão para testes também está disponível para quem se registrar no site do fabricante.” [referência: linuxmagazine.com.br]

Leia também: Tesseract OCR agora suporta oficialmente o português brasileiro.


• Publicado por Augusto Campos em 2010-03-12

Comentários dos leitores

Os comentários são responsabilidade de seus autores, e não são analisados ou aprovados pelo BR-Linux. Leia os Termos de uso do BR-Linux.

    André Caldas (usuário não registrado) em 12/03/2010 às 5:21 pm

    Para 12.000 páginas por ano o preço é de € 150; para 120.000 páginas o preço sobe para € 1.000.

    Anti-feature!! Eca!!
    http://en.wikipedia.org/wiki/Anti-feature
    http://www.fsf.org/blogs/community/antifeatures

    Clésio Luiz (usuário não registrado) em 12/03/2010 às 5:27 pm

    Eu testei uma versão no Windows e posso dizer que se trata de um software fenomenal. O índice de acertos beirava os 100% em todos os testes que fiz na época.

    Uma pena que as alternativas livres ainda não atingiram o seu patamar de eficiência e facilidade de uso.

    @Clésio Luiz, pois é. E o “pior” é que a soluções em OCR open source mantidos por empresas tais como o google, mas que ainda sim não tem uma qualidade muito boa.

    Mas boa iniciativa lançar uma versão para linux, mas pena a maneira como foi feita (não o fato de ser paga, mas como o colega acima disse, ser anti-feature). Se fosse open source, melhor ainda.

Este post é antigo (2010-03-12) e foi arquivado. O envio de novos comentários a este post já expirou.