Sobre

Graffiti \Graf*fi"ti\, s.m.
desenhos ou palavras feitos
em locais públicos. 
Aqui eles têm a intenção de 
provocar papos sobre TI e afins.

O Graffiti mudou!

Visite a nova versão em pfvasconcellos.net

Provocação (graffiare) para este post, de Seth Godin:

Organizing the world's information is a laudable goal.
But we're only an inch down the road.

Seth fala dos mecanismos de busca, e sua ineficácia quando queremos fazer buscas "horizontais" - alternativas, sugestões, conjuntos lógicos. Seth não fala sobre a principal barreira para a implementação de buscas mais ricas: nossas informações são burras. Elas não se conhecem e não se explicam. Sim, estou (de novo!) falando de meta-dados, web semântica e afins. E o Seth acertou no diagnóstico: caminhamos só alguns centímetros nesta estrada de milhares de quilômetros.

Geralmente sou um otimista mas, neste caso, nada abala meu ceticismo. Vou dar alguns exemplos práticos:
  • Quando você ripa um CD, ele busca informações (nome da música, artista, álbum, ano...) em uma base de dados disponível na Web (CDDB, FreeDB...). Não raro, alguma informação vem incorreta. Na realidade, o próprio modelo do banco é falho (discos duplos são um pesadelo que, pelo que eu saiba, só o Amarok soube resolver). Estatística pessoal: de cada 10 CD's que ripo, uns 4 demandam correção de tags.
  • Músicas baixadas então, são um show de desinformação (particularmente aquelas compartilhadas por tupiniquins). Não raro, não há nenhuma tag preenchida.
  • Gosto do exemplo das músicas porque é o tipo de mídia que mais circula na Internet. Se as tags não estão legais, seu iPod ou qualquer media player fica, literalmente, perdidinho. E você também. Mostro o que estou ouvindo até aqui no Graffiti. O "dedo-duro" é a last.fm. Se as tags estão erradas, o serviço simplesmente recusa a faixa enviada. Mas vamos sair das músicas.
  • O MS Office e seu irmão legal, o OpenOffice, permitem a colocação de tags em todos os documentos. Chute: nem 5% dos usuários utilizam o recurso. Então, quando fazemos uma busca por determinado tipo de conteúdo, o mecanismo tem que ralar olhando "dentro" do documento.
  • 5% é um número otimista. Se 5% de todo o conteúdo disponibilizado na web estivesse devidamente classificado, já teríamos algumas buscas mais ricas.
  • Como eu disse em outra oportunidade, nunca haverá um esforço estruturado para "organizar" a web. A coisa acontecerá "de baixo para cima", de forma totalmente voluntária. Del.icio.us, Flickr, YouTube e outros serviços são os melhores exemplos.
  • Mas, saca só minha "nuvem de tags". Mesmo o chato e sistemático aqui conseguiu fazer uma bela zona. Tags são abandonadas. Algumas têm uma grafia só entendida pelo seu autor. Como é algo orgânico (humano) e totalmente livre, eu nunca terei uma "nuvem perfeita".
  • O que não será necessariamente um problema, no dia em que TODO MUNDO tiver sua "nuvem de tags". As ligações entre páginas e tags serão a principal variável dos mecanismos de buscas. Mas quanto TODO MUNDO terá sua "nuvem"?
  • As maiores interessadas deveriam ser as empresas. Alguém aí conhece alguma que tenha seu "del.icio.us" particular?
  • Sem um rico catálogo de meta-dados, falar em business intelligence, data mining e afins, é tão esperançoso quanto querer ganhar o mundial de Fórmula 1 com a Honda e o Rubinho.
.:.

Encerrei o post e pintou uma dúvida: por que o Google não gosta de tags? Uma suspeita: num mundo de informações "organizadinhas", o Google perde muito de seu apelo. Ou seja, a bagunça lhe interessa.

2 responses to "Todas as Informações do Mundo"

  1. O ultimo paragrafo, sobre o Google me fez refletir, é um fato que eu nunca havia pensado.

    Marco Gomes

  2. Oi Marco,

    Mas só pensei aquilo quando encerrei o post.. e, pensando de novo, faz cada vez mais sentido.

    []'s

    Paulo Vasconcellos

Leave a Reply