Thadeu Penna, que recentemente escreveu sobre
OCR de qualidade no Linux usando o Tesseract, deu mais notícias sobre o tema: o arquivo com as palavras e os arquivos de treinamento, que ele criou e disponibilizou no post anterior, foram aceitos na versão oficial do programa, a partir da sua versão 2.01. Assim, quem atualizar o Tesseract terá acesso ao suporte ao nosso idioma sem precisar fazer downloads adicionais.
Saiba mais (profs.if.uff.br).
Kudos para o Thadeu
Alan