OCR é a técnica usada para reconhecer texto a partir de imagens digitalizadas - por exemplo, para tornar editável uma página de um livro, capturada por um scanner. E o Google, que tem no OCR a base de alguns de seus serviços, anunciou que irá patrocinar o OCRopus, um OCR de código aberto, disponibilizado sob a licença Apache 2.0. A meta é produzir um sistema OCR de alta qualidade, adequado para conversão de documentos, bibliotecas eletrônicas, deficientes visuais, análise de documentos históricos e uso geral no desktop.
O Google convida a comunidade de código aberto a participar diretamente, adaptando o sistema a mais idiomas, criando uma aplicação para o desktop GNOME, e de diversas outras formas. Interessados podem procurar detalhes no anúncio oficial.
Saiba mais (google-code-updates.blogspot.com).