Notícia publicada por brain em setembro 13, 2004 10:14 PM
| TrackBack
O leitor dafaca enviou este link para seu projeto e acrescentou: "Depois de um bom tempo trabalhando neste projeto, gostaria de anunciar o Pajé. Trata-se de um dicionário da nossa língua portuguesa, com mais de 130 mil verbetes. Ainda é uma versão experimental, mas já é funcional para o uso diário. Aqueles que se interessarem, poderão baixar a versão 0.01 no link acima, além de sugerir melhorias ou ajustes."
Atualização: Aparentemente a base de dados do dicionário foi reproduzida sem autorização do seu autor original. A página do projeto tem maiores detalhes. Recomenda-se aos interessados prosseguir com cautela.
Essa é uma das notícias que mais me alegraram ultimamente no universo Linux.
Estava ansioso por um dicionário "offline" da língua portuguesa para o Linux.
Parabéns aos autores pelo excelente projeto, de grande importância para todos nós falantes da língua portuguesa. ;)
s/"aos autores"/"ao autor"
Defaca,
Onde a base de verbetes foi coletada?
Já estou usando, muito bom !
Tambem já etou usando, ta de parabéns.
:o)
Nao gostei nao...
Quem plecisa de coletor oltoglafico ? Ninguém.
Show de bola!!
Também a tempos eu estava querendo um dicionário offline.
dafaca,
não há dúvida que faz muita falta um dicionário da língua portuguesa gratuito e acessível a todos, minha única preocupação é que o pajé esteja violando direitos autorais. Podes confirmar a fonte dos verbetes? Não é o Aurélio, é?
Como fica o direito autoral em relação a dicionarios. Por exemplo lá tem a palavra casa que significa moradia, habitação
Isto foi um exemplo, eu nao posso criar um dicionario e dizer que casa é moradia?
Alguém tem detalhes para esclarecer?
Pierre
Pierre,
em princípio não há problema, mas quando no teu dicionário casa é definida por:
Edifício (2) de um ou poucos andares, destinado, geralmente, a habitação; morada, vivenda, moradia, residência. [Aum.: casão, casarão, casaréu; dim.: casinha, casita, casucha, casebre, casinhola, casinholo, casinhota, casinhoto, podendo as cinco últimas formas ter caráter depreciativo.]
E palavra por palavra a definição é a mesma em outra obra, é possível que uma das partes POSSA estar ultrapassando a linha da legalidade.
existe algum dicionario que seaj de cominio publico?
nao sei se estou correto, mas uma obra e de dominio publico apos 20 anos apos a morte do autor.
realmente nao sei... mas jah ouvir falar nisso. alguns livros sao ate distribuidos pela internet e o caso do igler.com.br.
Sera que algum dicionario estaria nessa condicao?
caso o conteudo desse dicionario nao fira qq direito seria interecante fundilo ao wikitionary, que esta precisando de uma ajuda.
Por fim, Parabens pelo trabalho.
Perguntando mais uma vez, como muitos já fizeram acima: qual a fonte original dos verbetes? Qual a licença da base usada e se foi coletada de algum lugar, qual lugar é esse?
Da nossa lei de direitos autorais:
"Art. 7º São obras intelectuais protegidas as criações do espírito, expressas por qualquer meio ou fixadas em qualquer suporte, tangível ou intangível, conhecido ou que se invente no futuro, tais como:
(...)
XIII - as coletâneas ou compilações, antologias, enciclopédias, dicionários, bases de dados e outras obras, que, por sua seleção, organização ou disposição de seu conteúdo, constituam uma criação intelectual."
Realmente seria interessante saber da onde foi tirada a base de dados, e se essa operação foi feita de forma legal.
Fora isso, o programa é bem interessante.
Existe o projeto do Wikcionário, ainda está começando, porem se tiver o mesmo crescimento da Wikipédia logo poderemos ter um dicionário com bastantes verbetes disponivel sob GFDL:
http://pt.wiktionary.org/wiki/P%C3%A1gina_principal
Outra coisa, uma obra torna-se de domínio publico com 70 anos após a morte do autor:
http://www.planalto.gov.br/ccivil_03/Leis/L9610.htm
Vixe, ainda bem que o wrobal não parece estar metido nessa!
Mas cuidado, vocês estão dando idéia pra ele, daqui a pouco vai aparecer o Novo Dissionário da Limgua Portugeza, com a escrita idiossincrática do nosso Judas-mor.
alexandre_parente,
da lei de direito autoral: [ http://www.inpi.gov.br/legislacao/conteudo/leidirau.htm ]
Art. 41. Os direitos patrimoniais do autor perduram por setenta anos contados de 1° de janeiro do ano subseqüente ao de seu falecimento, obedecida a ordem sucessória da lei civil.
O pior é que o problema não se resume a isso. Um dicionário é uma obra em constante evolução e mesmo que o prazo fosse de apenas 20 anos e não 70 já podes imaginar o quão desatualizado seria. Principalmente tendo em consideração que é preciso esperar o autor morrer.
Sem desmerecimento ao trabalho do dafaca, já deves ter chegado a conclusão que a dificuldade maior está mesmo na criação do conteúdo do dicionário, vide wikitionary. Não há segredo e existem diversas maneiras para implementar a ordenação, agrupamento ou forma de pesquisa neste tipo de aplicação.
Kill,
Mas ninguém falou ou provou que o defaca tenha clonado os dados de alguma base.
Apenas o bogus, se interessou em saber qual a base dos verbetes.
O trabalho dele merece todos os elogios e como um projeto aberto, é bom ter a participação da comunidade para o engrandecimento e cuidar sobre a parte legal do software.
Achei bem válida este debate, pq é um detalhe importante.
Tomara que o amigo defaca, se pronuncia a respeito e com certeza a comunidade podera auxilia-lo a levar adiante este projeto.
Pierre
Gostaria de saber se posso usar essa base de dados para a criação de um dicionário online, aqui para a intranet da empresa onde eu trabalho. Seria bom saber de onde foi tirada a base para poder usar ela sem temores...
Olá, acabei de postar no site do proejto alguns esclarecimentos sobre o pajé e sobre as dúvidas lançadas aqui e no meu e-mail.
Aconselho a todos lerem e tirarem as conclusões.
http://planeta.terra.com.br/informatica/paje/
Li o esclarecimento... concordo com tudo que foi dito no entanto sabemos que isso pouco importa no mundo em que vivemos e que se foi retirado conteudo do aurelio e provavel que seja qualificado como violacao de direitos autorais.
Mesmo assim parabens pelo trabalho.
Um sugestao... podiamos pesquisar se ha algum dicionario da ligua portuguesa em dominio publico, mesmo ciente de que a lingua mude com o tempo alguns verbetes tem seu significado preservado. como casa, bola, bolacha etc etc.
Outra alternativa seria entrar em contato com cursos e projetos ligados a os cursos de letras do brasil.
A internet, principalmente no "mundo" open-source e frequentado por alunos e afins da area de extas e tecnologia, creio que muitas pessoas e cursos da area de liguas e humanas nao conhecem projetos como esse ou como o wikipedia. Taveis falte uma divulgacao desse trabalho nessa area..
Não creio que, mesmo sendo tirado do Aurélio, seja problema de direito autoral. O pessoal do Aurélio, com certeza, se utilizou do trabalho de terceiros para compor o dicionário. Acredito que, se não for copiado item por item, mas sim disposto sobre o que já é de domínio público (como o Aurélio faz), não há problema algum. Além do mais, apesar de ser justo a questão de direitos autorais, não deve ser, no meu entender, uma fobia. Senão, teremos medo até de utilizar outros dicionários, com medo de serem "piratas". Inclusive, a equipe do Aurélio, ao divulgar o novo dicionário eletrônico, informou alterações na maneira de se catalogar o conteúdo, de maneira que ficasse mais simples a sua utilização. Portanto, ninguém pode ser proprietário de todas as formas, concordam?
Da nossa lei de direitos autorais:
"Art. 7º São obras intelectuais protegidas as criações do espírito, expressas por qualquer meio ou fixadas em qualquer suporte, tangível ou intangível, conhecido ou que se invente no futuro, tais como:
(...)
XIII - as coletâneas ou compilações, antologias, enciclopédias, dicionários, bases de dados e outras obras, que, por sua seleção, organização ou disposição de seu conteúdo, constituam uma criação intelectual."
Eita, galera.
Violação dos direitos autorias é uma cópia fiel da obra de outra pessoa. Não é o puramente ler uma coisa em um lugar e, usando esse conhecimento, fazer outra coisa. O conhecimento não pode ser bloqueado.
Imagina só. Eu leio em uma revista que o Lula está bebendo demais, e resolvo escrever no meu jornal do colégio que o Lula bebe "socialmente", estou violando algum direito autoral??? mas estou copiando uma informação que achei em uma publicação. Tem certeza que não estou violando??? Claro que não!!!!
Violação de direitos autorais é CÓPIA. A idéia do "copiar e colar". Como o Augusto colocou, "sua seleção, organização ou disposição de seu conteúdo, constituam uma criação intelectual".
Se não fosse assim, não existiriam dicionários, porque o aurélio copiou do michaelis, que copiou do fulano, que copiou de não sei quem. E estariamos em uma eterna prisão por causa dos "direitos autorais".
Para pensar...
Constituição Brasileira, artigo quinto:
"XXII - é garantido o direito de propriedade;
XXIII - a propriedade atenderá a sua função social;"
"Eita, galera.
Violação dos direitos autorias é uma cópia fiel da obra de outra pessoa. Não é o puramente ler uma coisa em um lugar e, usando esse conhecimento, fazer outra coisa. O conhecimento não pode ser bloqueado."
Talvez seja ingenuidade minha, mas eu não acredito que ele tenha lido um dicionário inteiro, e, com o conhecimento adquirido, ele tenha escrito um novo dicionário.
o dicionario esta de parabens!! sempre que tiver atualizecoes, irei baixar minha cópia!
abraços!
:)
Eu,
Cópia fiel, como eu quis dizer, é a reprodução de uma parte da obra, não necessariamente a obra toda, mas tem que ser uma cópia. Fiel. As mesmas palavras, nos mesmos lugares.
Pensa bem se não fosse assim. Tudo o que você sabe hoje, você leu em um livro ou o seu professor leu em um livro. Todos os livros são protegidos por direitos autorais. Como você pode fazer um livro "novo" que não quebre direitos autorais??? Não pode. Como que os autores clamam para si o direito autoral se eles mesmos aprenderam em outras fontes???
Essa coisa de função social da propriedade é que, antes da criação servir ao criador, a criação deve servir a sociedade. O criador tem o direito de exclusividade sobre a sua criação apenas para ter algum retorno TEMPORÁRIO dela e, assim, ficar incentivado a criar mais. A propriedade não tem a função de enriquecimento fácil. Porque todos os direitos autorais um dia acabam??? "70 anos após a morte do autor"...
Outro exemplo. No caso dos medicamentos, são 5 anos apenas para que outros laboratórios também possam produzir o medicamento. Como existiriam os genéricos se não fosse assim???
Daniel Dantas,
eu sei o que é uma cópia fiel, e a proteção de propriedade intelectual não se aplica unicamente à cópias fiéis. Pense no caso de um programa de computador. Se eu pegar um código-fonte, acrescentar alguns "enteres" e mudar o nome de umas variáveis e relançar o programa, isso constituirá crime, mesmo que a cópia não seja fiel, com "as mesmas palavras, nos mesmos lugares".
De qualquer forma, não é isso que está sendo discutido aqui.
Eu acho que um dicionário não é algo que você escreva baseado em conhecimentos previamente adquiridos. Para escrever a base de dados de um dicionário seria necessária uma grande equipe, ou então muitos anos de trabalho.
Pelo o que eu saiba, não existe nenhuma base de dados pública de um dicionário da Língua Portuguesa. E eu também não acredito que o autor do programa tenha escrito a base de dados inteira com suas próprias mãos, ou com seu próprio teclado.
Desta forma, a conclusão óbvia, embora não necessariamente correta, é que a base de dados tenha sido copiada de algum outro lugar.
Caso isso seja verdade, o autor do programa precisaria de uma licença para utilizar e/ou redistribuir essa base de dados, e é isso que está sendo questionado.
Seria interessante que o autor explicasse a origem da base de dados. Caso contrário, a impressão que fica é que o programa é ilegal.
Daniel,
lamento te desapontar, mas diferente do que muita gente pensa, um dicionário é muito mais que uma coleção de sinônimos. Não raro a compilação de um dicionário é fruto de um trabalho de alguns anos, elaborado por equipes de lingüistas especializados e que exige observação do cotidiano e da língua utilizada por um povo ou comunidade. Por isso é que existem poucos e foste capaz de citar apenas dois: Aurélio e Michaelis.
Para esclarecer, direito autoral diz respeito a expressão original das idéias, não as idéias ou informação em si. Expressão original denota uma percepção sutil de valor adicionado. Neste caso específico de um dicionário, o valor não está na informação em si (sinônimos) mas na interpretação e explanações dadas pelo autor a cada palavra. Não é por acaso que a lei cita os dicionários entre as obras protegidas.
De maneira mais abrangente e para fácil compreensão, o fato histórico de que o dafaca infringiu direitos de autor é informação e não está ao abrigo do direito autoral. No entanto, a minha interpretação do acontecimento que eu torne expressão original é protegida por direitos de autor.
Para além disso, copiar e colar foi de certa forma o que aconteceu neste caso. Algumas mensagens acima eu citei a definição do verbete casa que aparece no pajé. Além desta, há outras 19 para o mesmo verbete. Alguém se habilita a fazer uma pesquisa ao Aurélio? O dafaca já esclareceu a origem da base de dados mas não por acaso eu chutei qual seria.
De qualquer maneira o que importa é que a intenção foi boa e não parece ter havido má fé. De mais valioso temos que referir a iniciativa do dafaca.
É, de fato a base de dados parece ter sido copiada do Aurélio. (estou consultando a versão impressa do mesmo)
Legal. O br-linux agora está distribuindo links para sites de Warez :)
É uma pena que não exista licença para o uso legítimo dessa base de dados. Poder-se-ia adicionar o suporte ao Português do Brasil ao dictd.
Desculpe, mas ou vocês não entenderam o esclarecimento ou não expliquei direito.
Não li o dicionário, seja ele qual for, para então, com o conhecimento adquirido fazer o pajé.
O que fiz foi juntar o maior numero possível de palavras usando a internet como fonte, e depois usar o dicionário Aurélio na versão eletrônica procurando pelas palavras que encontrei na internet.
Qualquer dos significados dos verbetes encontradas no pajé está exatamente igual ao dicionário Aurélio, mas isto não quer dizer que todos os verbetes no aurélio está contido também no pajé.
Sim, eu sei que este tipo de coisa é bastante polêmico.
Conforme expliquei não sei até onde este projeto viola os direitos autorais. Isto está bem claro na pagina.
Talvez tenha sido um erro ter pedido por Augusto postar o endereço aqui. Mas conforme já dito, não foi de má fé. Nem tenho intenção de criar contendas ou problemas com quem quer que seja.
Augusto, talvez seja melhor simplesmente remover esta notícia assim você não é acusado de nada.
Caro dafaca.
Não vejo motivos para estar tão preocupado. Pelo que pude perceber você somente criou uma ferramenta para coletar informações pertinentes a solução de um problema que enfrentava, e dessa forma obteve a maior quantidade possível de informações.
Interessa de onde essas informações vieram?
Ora! Se você necessita de significados de palavras que já existem, e que são usadas por milhões de pessoas, porque não utilizá-las?
Daqui há pouco irão argumentar que você precisará escrever um dicionário para poder utilizá-lo juntamente com o pajé?
Talvez, no intuito de demonstrar a eficácia do seu programa, você tenha pecado em distribuí-lo já com uma base de dados pronta. Creio que para satisfazer a todos seria necessário você retirá-lo, ou colocar o mínimo possível, mas dando aos insatisfeitos, ou artomentados com patentes e direitos autorais, o caminho das pedras, ou como se diz por aí a "receita de bolo" para que possam criar os seus próprio conjuntos de verbetes, seja lá de onde for, da Internet, do "Aurélio", Wikipedia...
Por favor, não fique constrangido com as críticas que aparentemente tentam diminuir o seu trabalho, e muito menos diminua-os, mas sim transforme-os em incentivo a novas soluções, e quem sabe a novos problemas a solucionar.
Uma idéia, um sistema de pesquisa a "problemas com patentes e direitos autorais". Aproveite e registre a idéia... ou será que alguém já fez isso? :P
CWagner, não estou preocupado nem constrangido.
Só não gosto de chegar aqui no br-linux e acabar por ler "Warez" e ainda por cima acusar o site de fazer apologia a pirataria ou o quer que seja. Por isto sugeri ao Augusto que simplesmente retire esta anúncio evitando possíveis problemas que eu possa causar.
O projeto continua lá, estou até preparando uma nova versão para corrigir uns problemas relatados e melhorar a formatação. Continuarei a trabalhar nele até que eu seja impedido de fato, e se isto acontecer darei um jeito de manter o projeto sem "violar direitos autorais".
Só acho que um dicionário é realmente algo valioso para que eu guardasse só para mim, e pelos comentários e os e-mails que tenho recebido, não sou o único a pensar assim.
Deixei claro que o conteúdo é igual ao do Aurélio, por isso não estou enganando, se está incomodando alguém, simplesmente não copie.
Agora, acho que vou parar de trabalhar na versão inglês, proque já estou ficando com dor de cabeça. :-)
dafaca,
Não desanime de forma alguma. Independente de eventualmente for constatado a violação de direitos autorais, o importante é que o arcabouço está construído, que vai desde a definição da estrutura de dados do dicionário (em XML) até a consulta e manipulação deste. Futuramente pode-se pensar em construir/enriquecer o dicionário, mesmo que tenha que ser feito do "zero". Então o Pajé cresceria junto com a base de dados, que certamente poderia aproveitar-se de dicionários livres, como o projeto do wiktionary.
Tem aquela idéia também, da inclusão das formas conjugadas dos verbos para consultas, que já seria um adicional/diferenciação em relação a versão eletrônica do Dicionário Aurélio. E isto, como comentado pelo e-mail é relativamente fácil de se fazer.
Não analisei a situação. Para mim parece que se foi publicado conteúdo proprietário sem autorização do autor original, houve infração do direito deste autor original.
Se fosse eu o responsável pela publicação dos dados, tiraria do ar até que o assunto fosse esclarecido, e consultaria o autor original para perguntar se ele autoriza o uso de sua obra desta forma. Remover a notícia daqui, agora que já foi publicada, não resolveria nada. Transformar este assunto em um bom exemplo de respeito aos direitos autorais (que, embora desta vez estejam agindo a favor da restrição do conhecimento, também são o fundamento das licenças livres) talvez ainda seja possível.
Na verdade, os direitos autorais que transformam a distribuição desse material em crime são os mesmos direitos autorais que impedem que a MS, ou qualquer outra empresa, peguem o código-fonte do Linux, ou qualquer outro software livre, e gere um produto não-livre a partir deles.
Achar que direitos autorais são necessariamente ruins, ou que só servem para enriquecer o Bill Gates é coisa de criança.
Ah, no meu dicionário Aurélio está escrito o seguinte: "Nenhuma parte desta obra pode ser apropriada e estocada em sistema de banco de dados, ou processo similar, em qualquer forma ou meios, seja eletrônico, seja mecânico, de fotocópia, gravação, etc., sem permissão dos detentores do copirraite." (eu juro que copyright está escrito copirraite mesmo)
Creio não existir nenhuma dúvida. Distribuir essa base de dados é ilegal, é Warez.
__Essa lei de direitos autorais é complicada, pois aborda definições da língua portuguesa, de expressões que usamos no dia-a-dia, assim se eu disser em meu dicionário:''banana:Fruta tropical coméstivel,ou expressão de sentido dúbio.''E o outro autor colocar a mesma definição, ele vai estar infringindo a lei, o que é um absurdo, pois ele não é o inventor da banana. . .
bebeto: se isso acontecer, ocorre uso legítimo da obra, não é uma infração. Mas se você catalogar 10.000 frutas brasileiras e publicar este catálogo sob uma licença restritiva (como é o caso do Aurélio), e alguém pegar esta base de dados (ou uma parte dela) sem tua autorização e publicar, divulgar, reprocessar, resumir, traduzir, inserir em um sistema informatizado, disponibilizar na web ou tirar outro proveito dela que não seja através do uso para o qual você (como autor original da obra) liberou, este alguém estará infringindo o teu direito - ainda que esteja fazendo isto sem ganhar nenhum tostão.
Olá, tirei o dicionário do site, deixei apenas uma mensagem explicando o motivo.
Estive conversando com um amigo advogado esta manhã e o mesmo me aconselhou a retirar a parte que viola os direitos autorais, e contactar os autores originais da obra para tentar um acordo que fosse de interesse para ambos.
Realmente não achei que estaria violando algo.
Talvez eu tenha sido mesmo inocente.
Fica aqui minhas sinceras desculpas.
Dafaca,
Não precisa pedir desculpas, acredito que todos aqui tem certeza das suas boas intenções, espero que os detentores do direito sobre a obra a liberem. Achei também interessante o grau de maturidade da comunidade.
O ideial seria distribuir o paje sem sua base de dados. O sistema teria o papel apenas de permitir o acesso a uma base de dados que seria adquiriada legalmente pelo usuario.
Nao estou aqui para agredir o paje ou coisa parecida, chamando seu trabalho de warez etc etc, mas acho que como a maioria aqui preocupado pq isso pode trazer compicacao ate mesmo para ele... ninguem quer ser processado :)
E nao eh necessario consultar a editora. em qq dicionario aurelio ele e bem claro quanto as suas restricoes de uso.
".... Nenhuma parte desta obra pode ser apropriada e estocada em sistemas de banco de dados, ou processo similar, em qualquer forma ou meio, seja eletronico, de fotocopia, gravacao, etc, sem a permição dos direitos do copirraite"
Dafaca,
Como já te disse o seu advogado, o produto em questão é realmente uma violação dos direitos autorais do Aurélio. Acontece que a fabricação de dicionários é algo que custa caro e que é objeto de intensas disputas de mercado (confira em http://www.abi.org.br/destaques.asp?id=329 )e,portanto, vc poderia sofrer dano$a$ consequencias por causa disso.
Por outro lado, você poderia ter buscado ajuda e/ou colaboração em outros lugares. Dê uma olhada no site do Nilc http://www.nilc.icmc.usp.br/ e veja se da pra fazer alguma coisa.
Comentários desativados: Esta discussão é antiga e foi arquivada, não é mais possível enviar comentários adicionais.