Arquivos históricos do BR-Linux.org apresenta:

Katatudo anuncia disponibilização do código fonte de seu sistema de busca

Notícia publicada por brain em julho 21, 2004 09:22 PM | TrackBack


Luis Alberto Garcia Cipriano (lagc@cipsga.org.br) foi o primeiro a enviar a novidade, com link para a notícia do CIPSGA: "O Katatudo está contribuindo com a comunidade mundial de Software Livre liberando seu código fonte. É uma ação significativa, pois até hoje nenhum site de busca liberou seu código na Internet." Trecho do anúncio: "O sistema de busca foi concebido com uma versão modificada do mnoGoSearch, um poderoso software de busca, licenciado sob GPL e disponível na internet. Os desenvolvedores do KATATUDO fizeram várias modificações neste código, como otimizações e uma completa adaptação à língua portuguesa. Estas alterações são necessárias, pois cada idioma possui um jogo de palavras e a combinação destas palavras é que mostra eficiência em qualquer sistema de busca."

O Luis Alberto levantou (na própria discussão do CIPSGA) algumas questões sobre o assunto, que foram respondidas por ninguém menos que Christiano Anderson, nosso recente entrevistado, que é mantenedor do repositório de software livre do projeto GNU. Veja abaixo a resposta do Christiano, encaminhadaao BR-Linux pelo Luis.

Segue a resposta do Christiano:

Sim, estou em contato com o pessoal, na verdade estou colaborando com a abertura do código. Nos próximos dias deve entrar no ar um CVS com todas as alterações, arquivos de administração (muitos foram desenvolvidos dentro do Katatudo) e demais utilitários que foram feitos (como dicionario,etc). O que está no ar agora é o código do engine de busca, os addons entrarão em seguida, conforme vai sendo liberado.

O algoritmo foi *utilizado*, não *criado* pela equipe do Katatudo. O que a equipe está criando são ferramentas para trabalhar em cima
deste algoritmo e melhorando o dicionário em português, que contém todo o jogo de palavras que resultam a qualidade da busca. Conforme a notícia que foi citada no BRLinux, no link que você mencionou.

O Leonardo é o *criador do serviço Katatudo*, que utiliza o algoritmo do MNOGOSearch e está trabalhando em algumas melhoras que serão disponibilizadas através do CVS. A idéia também é oferecer mirror, hospedagem e estrutura para continuar o trabalho do MNOGoSearch.

Qualquer dúvida, pergunte. Estou junto com o pessoal com este
trabalho, até em muitas dúvidas que tinham em relação a GPL, o que pode, o que não pode, o que é considerada contribuição, alteração, redistribuição, etc.

 

Comentários dos leitores
(Termos de Uso)

» Douglas Augusto () em 22/07 02:38

Seria interessante desenvolverem um sistema de buscas que aceite expressões regulares. Acredito, entretanto, que esta idéia pode esbarrar em questões de eficiência, pela estrutura em que os dados são armazenados.


» Pedro () em 22/07 11:38

O Katatudo nada mais é que um wrapper pro Google.
No máximo um sistema de metabusca.

Reparem como as respostas são idênticas


» Luis Alberto Garcia Cipriano () em 22/07 14:57

Opa,

Achei que o comentário acima fosse só um rant aleatório, mas vejam:

http://www.google.com.br/search?q=br-linux&ie=UTF-8&hl=pt-BR&btnG=Pesquisa+Google&meta=lr%3Dlang_pt

http://www.katatudo.com.br/busca/resultado.php?q=br-linux&b=Buscar&onde=lr%3Dlang_pt

Ao longo das páginas vai acontecendo uma leve defasagem.

Estranho. Pode ser só coincidência. Quem sabe?

De todas as formas, o que de princípio achei estranho no Katatudo foi a falta de maiores links desde o início para fontes, o que foi usado, o que foi melhorado, etc. Parecia sempre que o emblema "100% Software Livre" estava sendo usado só para efeito promocional.

Na notícia aqui mesmo no br-linux, o Leonardo Cardoso, aparentemente diretor do servico, afirmava que o algoritmo era original. Bem, agora descobre-se que na verdade está sendo usado um outro projeto, que já existia há anos.

O katatudo aparentemente também estava ligado à Revista Copyleft:

http://www.revistacopyleft.com.br/index.php?option=content&task=view&id=12&Itemid=2

Estranhei de novo o tipo de enfoque "Vamos apresentar nossa tecnologia ao GNOME e integrar o Katatudo no GNOME". Pretensioso e a julgar pela ausência de repercussão de mais notícias eram só "boas intencões".

No mais, ainda aguardo maiores notícias. Afinal a idéia sempre me pareceu louvável também.

Abracos,

Luis Alberto.


» Incógnito () em 22/07 17:51

Katatudo está muito mais para KDE do que para o Gnome. :-)


» Marcus Grando () em 22/07 18:40

Pois bem,

Para saber o que tem de diferente, é só olhar o "diff" do katatudo e do MNOGOSearch para verificar o que foi mudado... alguem já fez isso?

Abraços


» Luis Alberto Garcia Cipriano () em 22/07 19:04

Opa, Marcus.

"Só colo meu primeiro comentário lá no CIPSGA:

Por coincidência o .tar.gz do sítio katatudo é exatamente do mesmo tamanho do disponível no sítio que eles indicam como base do software:

http://www.mnogosearch.org/download.html

:-/

Só muda o katatudo inserido no nome do arquivo...

Não entendi!"

Acho que nem precisa de diff, não. O algoritmo não foi alterado, apesar dos anúncios anteriores do servico exagerarem e darem a entender que era código novo.

Para mim, a resposta do Christiano Anderson já indica que o trabalho realmente realizado foi feito sobre esse algoritmo de busca. E esse código será liberado daqui a mais "alguns dias"...

Aí que está o problema. O Katatudo ainda não liberou seu código fonte, conforme o anúncio diz, isso é que me incomodou.

Abracos,

Luis Alberto.


» Cabral () em 22/07 21:29

Caramba.... eu não tava acreditando, mas fui tirar a prova, e comclusão:
Puro embuste!
O tar.gz disponibilizado pelo catatudo não tem nem um arquivo sequer diferente do mnogosearch! nem uma virgula!, isso comprovado pelo diff.
E realmente o katatudo não passa de um meta busca do Google. a unica diferença é que ele não mostra os arquivos .pdf e por isso começam a aparecer pequenas diferenças em relação ao google....
Um bom tete é a utilização de uma palávra genérica, como água, o que pode gerar inúmeros links diferentes, mas no katatudo é o mesmo que no google (claro que sem os arquivos .pdf e .doc da vida....)
Pô, cade os caras para se defederem? po?^será que esses caras prescisão de tanta auto afirmação assim?


» maratimba () em 27/07 15:24

a bem da verdade vos digo:

o katatudo nao eh um wrapper do google zorra nenhuma. Pesquisei waram lá e olha a pusta diferença:

web - http://www.google.com.br/search?hl=pt-BR&ie=UTF-8&q=waram&btnG=Pesquisar&meta=cr%3DcountryBR
br - http://www.google.com.br/search?hl=pt-BR&ie=UTF-8&q=waram&btnG=Pesquisar&meta=
pt - http://www.google.com.br/search?hl=pt-BR&ie=UTF-8&q=waram&btnG=Pesquisar&meta=lr%3Dlang_pt

http://www.katatudo.com.br/busca/resultado.php?q=waram&b=Buscar&onde=lr%3Dlang_pt

enfim... achei o troço bem decente


» Luis Alberto Garcia Cipriano () em 01/08 07:25

Grande Maratimba!

1. Nesse link de busca do katatudo que você indicou tem uma pista crucial! Perceba que está escrito no trecho mostrado das primeiras páginas: "Você é crawler11.googlebot.com"!

2. Veja agora este link para a busca do google em que ele busca só páginas em português sem esconder os resultados muito parecidos (?filter=0)

http://www.google.com.br/search?hl=pt-BR&ie=UTF-8&q=waram&btnG=Pesquisar&meta=lr%3Dlang_pt&filter=0

Abraços,

Luis Alberto.


Comentários desativados: Esta discussão é antiga e foi arquivada, não é mais possível enviar comentários adicionais.



O Arquivo Histórico do BR-Linux.org mantém no ar (sem alteração, exceto quanto à formatação, layout, tabela de caracteres, etc.) o acervo de notícias, artigos e outros textos publicados originalmente no site na segunda metade da década de 1990 e na primeira década do século XXI, que contam parte considerável a história do Linux e do Open Source no Brasil. Exceto quando indicado em contrário, a autoria dos textos é de Augusto Campos, e os termos de uso podem ser consultados na capa do BR-Linux.org. Considerando seu caráter de acervo, é provável que boa parte dos links estejam quebrados, e que as informações deste texto estejam desatualizadas.