OCR: Abbyy porta seu ‘Fine Reader Engine’ para Linux
Enviado por Rafael Peregrino da Silva (rperegrinoΘlinuxmagazine·com·br):
A empresa descreve a interface CLI do Fine Reader Engine 8.0 como um aplicativo OCR pronto para o uso, sendo uma referência na conversão de documentos escaneados, PDFs e figuras, em arquivos editáveis nos quais pode-se realizar buscas. Graças à interface via linha de comando — e através dela — é possível integrar de maneira simples o aplicativo tanto a programas para desktop quanto para servidores, por exemplo através do uso de pipes.
Os documentos convertidos podem ser armazenados ao final do processo de conversão nos formatos RTF, HTML ou PDF. O Fine Reader Engine divide o processamento da conversão de documentos em várias etapas, começando pela preparação da imagem original, na qual o programa procura remover ruídos e variações/inversões de cores da imagem, que poderiam levar a erros no reconhecimento do texto. Em seguida, é detectada a posição da página e os elementos do documento são analisados. De acordo com o fabricante, o reconhecimento de caracteres funciona em 190 idiomas.
O Fine Reader Engine 8.0 para Linux já está disponível e o preço das licenças depende do número de páginas convertidas. Para 12.000 páginas por ano o preço é de € 150; para 120.000 páginas o preço sobe para € 1.000. Uma versão para testes também está disponível para quem se registrar no site do fabricante.” [referência: linuxmagazine.com.br]
Leia também: Tesseract OCR agora suporta oficialmente o português brasileiro.
Anti-feature!! Eca!!
http://en.wikipedia.org/wiki/Anti-feature
http://www.fsf.org/blogs/community/antifeatures
Eu testei uma versão no Windows e posso dizer que se trata de um software fenomenal. O índice de acertos beirava os 100% em todos os testes que fiz na época.
Uma pena que as alternativas livres ainda não atingiram o seu patamar de eficiência e facilidade de uso.
@Clésio Luiz, pois é. E o “pior” é que a soluções em OCR open source mantidos por empresas tais como o google, mas que ainda sim não tem uma qualidade muito boa.
Mas boa iniciativa lançar uma versão para linux, mas pena a maneira como foi feita (não o fato de ser paga, mas como o colega acima disse, ser anti-feature). Se fosse open source, melhor ainda.