Visite também: UnderLinux ·  VivaOLinux ·  Dicas-L ·  NoticiasLinux ·  SoftwareLivre.org ·  [mais] ·  Currículo ·  Efetividade

O que é LinuxDownload LinuxApostila LinuxEnviar notícia


Como escrever um corretor ortográfico em GAWK com apenas 15 linhas

“Ano passado, o Peter Norvig publicou em seu website um artigo que explica como escrever um corretor ortográfico, noticiado inclusive no Br-Linux.org.

Norvig utilizou um script em Python com 21 linhas para demonstrar o algoritmo. Agora o Tiago Peczenyj publicou (após algumas noites em claro) uma versão utilizando o bom e velho gawk com apenas 15 linhas.”

Enviado por Tiago Peczenyj (tiago·peczenyjΘgmail·com) – referência (peczenyj.blogspot.com).

• Publicado por Augusto Campos em 16/04/2008 às 10:00 am
• Link direto para este post: http://br-l.org/!1176
• Siga no Twitter: @brlinuxblog e @augustocc
• Mais posts do mesmo tema: Comunidade

Comentários dos leitores para “Como escrever um corretor ortográfico em GAWK com apenas 15 linhas”

Os comentários são responsabilidade de seus autores, e não são analisados ou aprovados pelo BR-Linux. Em algumas notícias os comentários são exibidos de forma paginada, com links abaixo do formulário de inserção de novo comentário. Leia os Termos de uso do BR-Linux.

  1. Vou esperar sair a versão de 14 linhas para usar :)

  2. Rael (usuário não registrado) em 16/04/2008 às 11:04 am

    É, sempre dá pra ir reduzindo. Mas eu reparei que ele colocou o fechamento dos escopos (as chaves } ) na mesma linha. Isso não vale :P (embora não tire o mérito dele, óbvio).

    Minha versão final em Java (http://www.raelcunha.com/spell-correct.php) ficou com 37 linhas, e a versão em Groovy com 23 linhas (embora essa seja não utilizável na prática, de tão lerda que ficou).

    Embora, otimizando a versão em Java, ganhe-se umas 10 linhas, mas 50% mais em desempenho (ainda não coloquei essa versão no site, o Felipe Farinon participou dessa otimização, mas também não publicou essa versão final).

  3. Tiago Peczenyj (usuário não registrado) em 16/04/2008 às 1:23 pm

    Uma pena que o mawk não tenha a função asorti, seria interessante ver a performance nele — via gawk demora quase o dobro do tempo do que a versão em python. O provavel motivo deve ser I/O + operações com Expressões Regulares, estou investigando. No fim das contas foi um bom exercicio :)

    Rael, publica a versão optimizada!!

O prazo para comentar neste post já expirou - visite a capa do site para posts mais recentes.