Organizando la blogosfera, en serio…

Es dificil clasificar un blog, salvo los de temática muy concreta: Marketing, Coches, Gadgets… la mayor parte de los blogs habría que archivarlos en Inclasificables.

Es dificil clasificar un blog, salvo los de temática muy concreta: Marketing, Coches, Gadgets… la mayor parte de los blogs habría que archivarlos en Inclasificables.

En muchas ocasiones ni sus propios autores saben de qué tratan sus blogs, citando a Pablo, el hombre bi-reto: “Si supiese de que va mi blog, sabría hacia donde dirigir mi vida”.Pero el que no te sepas definir a ti mismo es algo normal, normalmente las personas que te rodean sabrán mejor cómo eres (salvo tu familia). Muchos de tus lectores ya te han diseccionado y clasificado:
  • colocándote dentro de una carpeta concreta dentro de sus feeds (en la captura superior: etiquetas con fondo azul a la derecha).
  • otros te han guardado y etiquetado en delicious (etiquetas amarillas)
  • y tú mismo te has ido etiquetando cuando archivabas tus posts dentro de ciertas categorías, una información que si has utilizado correctamente el microformato adecuado algunos servicios como Technorati habrán capturado (etiquetas verdes).

Uniendo esa información y ponderándola con acuerdo al número de veces que se ha utilizado esa precisa etiqueta, podemos hacernos una idea de cuál es la temática de un blog. No obstante, las etiquetas tienen tres limitaciones importantes:1 – Se requiere un gran volumen de etiquetado (folksonomy) para poder obtener conclusiones mecanizadas acertadas, e incluso en sitios como Delicious donde hay miles de usuarios etiquetando, algunos blogs sólo han sido guardados un par de veces, por lo que confiar en que esas etiquetas son correctas sin una supervisión manual-humana es un poco arriesgado. Por cierto, que todos los sitios dados de alta en CompareBlogs están ya volcados en Delicious con todas nuestras etiquetas y otras tantas que hemos ido recuperando de varias fuentes.

2 – Algunas etiquetas en esencia significan lo mismo, pero eso de manera mecanizada no es sencillo deducirlo. Por poner un ejemplo sencillo: blog, blogs, weblogs, weblog, bitácora, blogger, bitácoras, blogging, blogosfera… son etiquetas muy populares cuando se clasifican blogs y todas ellas significan lo mismo: se deberían sumar, a la hora de valorar su peso dentro del volumen total de etiquetas utilizadas.

Para paliar con esto Delicious tiene los “tag bundles”, en esencia se trata de etiquetar etiquetas. Cuando le pregunté a Nacho Puell cómo lidiaban con esto en 11870.com me comentó que ellos generaban “clusters de etiquetas” y así es como lo hemos llamado nosotros también en CompareBlogs (abajo en azul los clusters, y el número de etiquetas que agrupa cada uno):

3 – La etiquetas no son jerárquicas -por definición-. Lo mires como lo mires, de manera mecanizada es difícil deducir una jerarquía de un etiquetado. Los directorios jerárquicos son mucho más exactos en ese aspecto, en TopMadrid nosotros utilizamos un directorio jerárquico para clasificar los establecimientos de los que escribimos, por ejemplo: Hogar y Jardín en Madrid > Muebles > Muebles de Baño.

Pero este sistema tiene muchas desventajas y genera verdaderos quebraderos de cabeza, por lo que para organizar los blogs estamos optando por un sistema híbrido: a los blogs se les etiqueta con información obtenida de distintas fuentes, a su vez esas etiquetas se agrupan en clusters de etiquetas y esos clusters se organizan jerárquicamente… Este sistema una vez lo hayamos testeado suficientemente nos gustaría poder exportarlo a TopMadrid y DolceCity.