O preenchimento de
captchas, imagens contendo texto propositalmente distorcido que deve ser digitado pelo usuário ao acessar diversos serviços on-line, é um desafio comum para pessoas com necessidades especiais, principalmente no caso dos deficientes visuais.
O reconhecimento de padrões necessário para preencher de forma automatizada a maioria dos modelos de captcha está ao alcance dos computadores modernos, mas de modo geral os PCs domésticos não têm velocidade suficiente para resolver o captcha com 98% de certeza em um tempo suficientemente curto para evitar o timeout da aplicação on-line.
Por esta razão, pesquisadores do Laboratório de Acessibilidade Avançada da UTERJ desenvolveram o Captcha@Home, um sistema distribuído (nos moldes do conhecido SETI@home) especializado em resolver captchas. A rede do Captcha@home atualmente conta com 320 CPUs participantes, sendo que durante a fase de testes, 42 deles atuam como
spiders, continuamente varrendo sites que usam captchas para obter aleatoriamente os gráficos que serão "quebrados" ou interpretados pelos demais integrantes da rede.
O Captcha@Home votou 822.439 vezes a favor de Flávia Viana
O sistema de reconhecimento de padrões foi desenvolvido inteiramente em software livre, com base no
Tesseract OCR e adição de técnicas de inteligência artificial. Durante a fase de testes, realizada nos 3 primeiros meses de 2007, foram empregados 42 computadores
spiders, simulando o comportamento de usuários comuns, acessando automaticamente formulários on-line, distribuindo os captchas aos outros nós da rede para decodificação, e em seguida enviando a resposta ao website em questão.
Enquanto isso, os demais computadores integrantes da rede Captcha@Home rodavam um software ativado automaticamente pelo seu protetor de tela, em que o PC passa a atuar como decodificador dos captchas enviados pelos demais nós que estão em modo de baixa demanda. A capacidade de processamento é geométrica: 64 nós em modo de alta demanda conseguem quebrar, em média, 29 captchas por minuto. Já quando há 256 nós operando simultaneamente, a capacidade aumenta para mais de 720 captchas por minuto.
Os testes do software foram realizados ao longo dos 4 últimos paredões do Big Brother Brasil 7, produzindo votos sempre contra a permanência do participante Diego, de modo a facilitar a contagem dos resultados a partir dos números oficiais divulgados pela emissora. O teste final ocorrerá nesta terça-feira, com a meta de gerar pelo menos 2 milhões de votos para a oponente do paulista Diego.
Saiba mais (bbb7.com).
--
http://vimmer.wordpress.com