Notícia publicada por brain em julho 21, 2004 09:22 PM
| TrackBack
Luis Alberto Garcia Cipriano (lagc@cipsga.org.br) foi o primeiro a enviar a novidade, com link para a notícia do CIPSGA: "O Katatudo está contribuindo com a comunidade mundial de Software Livre liberando seu código fonte. É uma ação significativa, pois até hoje nenhum site de busca liberou seu código na Internet." Trecho do anúncio: "O sistema de busca foi concebido com uma versão modificada do mnoGoSearch, um poderoso software de busca, licenciado sob GPL e disponível na internet. Os desenvolvedores do KATATUDO fizeram várias modificações neste código, como otimizações e uma completa adaptação à língua portuguesa. Estas alterações são necessárias, pois cada idioma possui um jogo de palavras e a combinação destas palavras é que mostra eficiência em qualquer sistema de busca."
O Luis Alberto levantou (na própria discussão do CIPSGA) algumas questões sobre o assunto, que foram respondidas por ninguém menos que Christiano Anderson, nosso recente entrevistado, que é mantenedor do repositório de software livre do projeto GNU. Veja abaixo a resposta do Christiano, encaminhadaao BR-Linux pelo Luis.
Segue a resposta do Christiano:
Sim, estou em contato com o pessoal, na verdade estou colaborando com a abertura do código. Nos próximos dias deve entrar no ar um CVS com todas as alterações, arquivos de administração (muitos foram desenvolvidos dentro do Katatudo) e demais utilitários que foram feitos (como dicionario,etc). O que está no ar agora é o código do engine de busca, os addons entrarão em seguida, conforme vai sendo liberado.
O algoritmo foi *utilizado*, não *criado* pela equipe do Katatudo. O que a equipe está criando são ferramentas para trabalhar em cima
deste algoritmo e melhorando o dicionário em português, que contém todo o jogo de palavras que resultam a qualidade da busca. Conforme a notícia que foi citada no BRLinux, no link que você mencionou.
O Leonardo é o *criador do serviço Katatudo*, que utiliza o algoritmo do MNOGOSearch e está trabalhando em algumas melhoras que serão disponibilizadas através do CVS. A idéia também é oferecer mirror, hospedagem e estrutura para continuar o trabalho do MNOGoSearch.
Qualquer dúvida, pergunte. Estou junto com o pessoal com este
trabalho, até em muitas dúvidas que tinham em relação a GPL, o que pode, o que não pode, o que é considerada contribuição, alteração, redistribuição, etc.
Seria interessante desenvolverem um sistema de buscas que aceite expressões regulares. Acredito, entretanto, que esta idéia pode esbarrar em questões de eficiência, pela estrutura em que os dados são armazenados.
O Katatudo nada mais é que um wrapper pro Google.
No máximo um sistema de metabusca.
Reparem como as respostas são idênticas
Opa,
Achei que o comentário acima fosse só um rant aleatório, mas vejam:
http://www.google.com.br/search?q=br-linux&ie=UTF-8&hl=pt-BR&btnG=Pesquisa+Google&meta=lr%3Dlang_pt
http://www.katatudo.com.br/busca/resultado.php?q=br-linux&b=Buscar&onde=lr%3Dlang_pt
Ao longo das páginas vai acontecendo uma leve defasagem.
Estranho. Pode ser só coincidência. Quem sabe?
De todas as formas, o que de princípio achei estranho no Katatudo foi a falta de maiores links desde o início para fontes, o que foi usado, o que foi melhorado, etc. Parecia sempre que o emblema "100% Software Livre" estava sendo usado só para efeito promocional.
Na notícia aqui mesmo no br-linux, o Leonardo Cardoso, aparentemente diretor do servico, afirmava que o algoritmo era original. Bem, agora descobre-se que na verdade está sendo usado um outro projeto, que já existia há anos.
O katatudo aparentemente também estava ligado à Revista Copyleft:
http://www.revistacopyleft.com.br/index.php?option=content&task=view&id=12&Itemid=2
Estranhei de novo o tipo de enfoque "Vamos apresentar nossa tecnologia ao GNOME e integrar o Katatudo no GNOME". Pretensioso e a julgar pela ausência de repercussão de mais notícias eram só "boas intencões".
No mais, ainda aguardo maiores notícias. Afinal a idéia sempre me pareceu louvável também.
Abracos,
Luis Alberto.
Katatudo está muito mais para KDE do que para o Gnome. :-)
Pois bem,
Para saber o que tem de diferente, é só olhar o "diff" do katatudo e do MNOGOSearch para verificar o que foi mudado... alguem já fez isso?
Abraços
Opa, Marcus.
"Só colo meu primeiro comentário lá no CIPSGA:
Por coincidência o .tar.gz do sítio katatudo é exatamente do mesmo tamanho do disponível no sítio que eles indicam como base do software:
http://www.mnogosearch.org/download.html
:-/
Só muda o katatudo inserido no nome do arquivo...
Não entendi!"
Acho que nem precisa de diff, não. O algoritmo não foi alterado, apesar dos anúncios anteriores do servico exagerarem e darem a entender que era código novo.
Para mim, a resposta do Christiano Anderson já indica que o trabalho realmente realizado foi feito sobre esse algoritmo de busca. E esse código será liberado daqui a mais "alguns dias"...
Aí que está o problema. O Katatudo ainda não liberou seu código fonte, conforme o anúncio diz, isso é que me incomodou.
Abracos,
Luis Alberto.
Caramba.... eu não tava acreditando, mas fui tirar a prova, e comclusão:
Puro embuste!
O tar.gz disponibilizado pelo catatudo não tem nem um arquivo sequer diferente do mnogosearch! nem uma virgula!, isso comprovado pelo diff.
E realmente o katatudo não passa de um meta busca do Google. a unica diferença é que ele não mostra os arquivos .pdf e por isso começam a aparecer pequenas diferenças em relação ao google....
Um bom tete é a utilização de uma palávra genérica, como água, o que pode gerar inúmeros links diferentes, mas no katatudo é o mesmo que no google (claro que sem os arquivos .pdf e .doc da vida....)
Pô, cade os caras para se defederem? po?^será que esses caras prescisão de tanta auto afirmação assim?
a bem da verdade vos digo:
o katatudo nao eh um wrapper do google zorra nenhuma. Pesquisei waram lá e olha a pusta diferença:
web - http://www.google.com.br/search?hl=pt-BR&ie=UTF-8&q=waram&btnG=Pesquisar&meta=cr%3DcountryBR
br - http://www.google.com.br/search?hl=pt-BR&ie=UTF-8&q=waram&btnG=Pesquisar&meta=
pt - http://www.google.com.br/search?hl=pt-BR&ie=UTF-8&q=waram&btnG=Pesquisar&meta=lr%3Dlang_pt
http://www.katatudo.com.br/busca/resultado.php?q=waram&b=Buscar&onde=lr%3Dlang_pt
enfim... achei o troço bem decente
Grande Maratimba!
1. Nesse link de busca do katatudo que você indicou tem uma pista crucial! Perceba que está escrito no trecho mostrado das primeiras páginas: "Você é crawler11.googlebot.com"!
2. Veja agora este link para a busca do google em que ele busca só páginas em português sem esconder os resultados muito parecidos (?filter=0)
http://www.google.com.br/search?hl=pt-BR&ie=UTF-8&q=waram&btnG=Pesquisar&meta=lr%3Dlang_pt&filter=0
Abraços,
Luis Alberto.
Comentários desativados: Esta discussão é antiga e foi arquivada, não é mais possível enviar comentários adicionais.