“Este guia descreve como configurar o Tesseract OCR no Ubuntu 7.04. OCR é a técnica de converter em texto os caracteres de uma imagem de textos. O sistema resultante terá a capacidade de converter em arquivos-texto as imagens dos textos que você scannear.”
Um bom tutorial para usar o tesseract em idioma português:
http://tetrixbr.blogspot.com/2007/08/ocr-de-qualidade-no-linux.html
Me falta agora um bom OMR (Optical Music Recognition) livre.
--
--
sapere aude
hackuna matata
http://mayer.art.br/blogdobeto