Visite também: UnderLinux ·  VivaOLinux ·  LinuxSecurity ·  Dicas-L ·  NoticiasLinux ·  SoftwareLivre.org ·  [mais] ·  Efetividade ·  Linux in Brazil ·  Floripa  

Google anuncia seu patrocínio do OCRopus, um OCR livre

OCR é a técnica usada para reconhecer texto a partir de imagens digitalizadas - por exemplo, para tornar editável uma página de um livro, capturada por um scanner. E o Google, que tem no OCR a base de alguns de seus serviços, anunciou que irá patrocinar o OCRopus, um OCR de código aberto, disponibilizado sob a licença Apache 2.0. A meta é produzir um sistema OCR de alta qualidade, adequado para conversão de documentos, bibliotecas eletrônicas, deficientes visuais, análise de documentos históricos e uso geral no desktop.

O Google convida a comunidade de código aberto a participar diretamente, adaptando o sistema a mais idiomas, criando uma aplicação para o desktop GNOME, e de diversas outras formas. Interessados podem procurar detalhes no anúncio oficial.

Saiba mais (google-code-updates.blogspot.com).

Comentários dos leitores

Os comentários abaixo são responsabilidade de seus autores e não são revisados ou aprovados pelo BR-Linux. Consulte os Termos de uso para informações adicionais. Esta notícia foi arquivada, não será possível incluir novos comentários.
Comentário de Clésio Luiz
Tomara que esse projeto vá em frente: Para vcs terem uma idéia, em matéria de OCR o Linux está muito mais desprovido do que em jogos (que são poucos e os bons menos ainda). Todos os programas que eu testei estão ainda em estágio embrionário, muito longe do uso prático no dia a dia e com taxa de acerto muito baixa. No Windows, o melhor que eu testei foi o Finereader, um programa queeu considero excepicional e que deve ser tomado como referencia nesse segmento. O condenado não errou uma letra nas veses em que pude testá-lo, sendo cheio de recusos e fácil de usar.
Comentário de hamacker
o engine do finereader: o engine do finereader existe para linux.
mas nínguem se interessa em utiliza-lo porque nínguem vê muitas chances num aplicativo fechado OCR para linux.
Comentário de Manoel Pinho
O Finereader realmente é: O Finereader realmente é excelente e como o hamacker falou eles vendem um SDK para linux, Mac e FreeBSD

http://www.abbyy.com/sdk/?param=59956

É realmente uma pena que eles nem se dêem ao trabalho de fazer uma GUI com Qt ou GTK+ para esses sistemas. Mesmo que vendessem pouco não seria tão caro assim desenvolver, já que o engine já é multiplataforma.

Fico realmente impressionado com a falta de visão das software-houses. Padronizam no windows e os clientes que se danem para comprar o windows e usá-lo, apesar de todos os seus problemas.
Comentário de leo.fontenelle
Tesseract: O Tesseract, que faz parte do OCRopus, foi mencionado recentemente no BR-Linux.org :)

Esse Google Summer of Code promete.
Comentário de brunoparente
O problema não é o: O problema não é o aplicativo ser fechado, mas sim o fato de que ninguém compra um programa OCR, pois os mesmos sempre acompanham os scanners. Meu scanner HP tem um ótimo OCR (não lembro qual o engine), mas só para Windows :(

Comentário de leo.fontenelle
OCR com o scanner: Concordo com você, o fato de um OCR acompanhar o scanner diminui muito a demanda por uma alternativa livre. Eu gostaria, no entanto, de levantar algumas ressalvas:
  • A maioria dos OCR não trabalha adequadamente com sistemas de escrita variados como o árabe, o cirílico, o coreano etc., e alguns nem reconhecem os acentos da língua portuguesa;

  • A maioria dos OCR é adequada para uso em computador pessoal com Windows, como você mencionou. Mas, e se você quiser digitalizar uma biblioteca, ou utilizar a tecnologia num dispositivo móvel, ou simplesmente quiser usar no Linux?

BR-Linux.org
Linux® levado a sério desde 1996. Notícias, dicas e tutoriais em bom português sobre Linux e Código Aberto. "A página sobre software livre mais procurada no Brasil", segundo a Revista Isto É.
Expediente
Sobre o BR-Linux
Enviar notícia ou release
Contato, Termos de uso
FAQ, Newsletter, RSS
Banners e selos
Anunciar no BR-Linux
BR-Linux apóia
LinuxSecurity, Tempo Real
Suporte Livre, Drupal
Verdade Absoluta
Pandemonium
Efetividade, Floripa.net
sites da comunidade
Ajuda
Moderação
Flames: não responda!
Publicar seu texto
Computador para Todos
Notícias pré-2004
Tutoriais, HCL pré-2004