Bye, bye CompareBlogs…

A veces es necesario poner un poquito de orden en tu vida y cerrar algunos capítulos para poder ir avanzando en otros.

A veces es necesario poner un poquito de orden en tu vida y cerrar algunos capítulos para poder ir avanzando en otros.

Es algo parecido a esas ex-novias que sigues viendo y que sin darte cuenta te impiden pasar página y emprender nuevas relaciones.

Con CompareBlogs aprendí muchísimo: de bases de datos, de xml, de feeds, de opml, de codificación de texto, de importación de datos, de creación de ficheros, de parseado, de apis, de blogs… tal vez lo más importante que aprendí es que sabía y sigo sabiendo muy poco (como la gran mayoría) pero que investigando y estudiando se puede conseguir salir de casi cualquier atolladero. 

Aprendemos cuando tenemos un problema que resolver.

Invertí muchas pero que muchas horas en él, pero llegado un punto deje de tener esas horas y se fue quedando viejuno. Los dos últimos agostos en los que he tenido un respiro intenté levantarlo de nuevo, tenía muchas ideas -algunas creo que buenas- pero o yo programo muy lento o el día no tiene suficientes horas (supongo que una mezcla de ambas)… en seguida se me echó encima septiembre y otra vez sin tiempo para nada que no de dinero.

Este fin de semana por fin me he decidido a hacer lo que llevaba rumiando desde hace meses: he abierto una nueva sección en mi blog »Blogosfera» y he volcado en ella todos los blogs de CompareBlogs clasificados (no todos) con acuerdo a su temática.

Me sigue interesando el tema de los blogs y voy a seguir escribiendo sobre ellos pero a partir de ahora voy a intentar no dispersarme e intentar concentrar todos mis experimentos dentro de FernandoPlaza.com, también intentaré compartir todas las pequeñas aplicaciones que programe y crea que puedan ser útiles para el resto: así devuelvo un poquito de todo lo que me ha dado Internet.

Blogosfera: Google PageRank vs Technorati Rank

Analizamos en este gráfico Google PageRank vs Technorati Rank en 384 blogs de CompareBlogs y vemos qué web se comportan de manera anómala. Datos actualizados con el nuevo PageRank a 28 de sept de 2008

Analizamos en este gráfico Google PageRank vs Technorati Rank en 384 blogs de CompareBlogs y vemos qué web se comportan de manera anómala. Datos actualizados con el nuevo PageRank a 28 de sept de 2008

Desde que estuve utilizando el API de Technorati sigo con bastante atención la evolución de mi (mediocre) posición en el ranking de Technorati con acuerdo a los blogs que me van enlazando. 

Aprovechando que hoy se ha actualizado el PageRank de Google se me ha ocurrido que sería interesante relacionar en un gráfico las dos magnitudes, echando mano de la base de datos de blogs de CompareBlogs.

Antes de nada decir que me sentiría mucho más cómodo si un analisis de este tipo lo hiciera gente que sabe más que yo sobre numeritos, ley de potencias y matemáticas en general como fernand0, JJ o rvr… pero ya se sabe que a falta de pan buenas son tortas y por si alguien se anima al final del artículo adjunto excels y csv con todos los datos.

Mi análisis personal

Evidentemente existe una relación entre las dos magnitudes, con muchos blogs que se comportan de la manera predecilble: cuanto mejor están posicionados en el ranking de Technorati mayor PageRank tienen.

No obstante hay algunas webs con resultados atípicos.

Dentro de aquellos blogs analizados con ranking por debajo de 1000, la mayor parte de ellos tiene Pagerank 7 y 8… los menos 6 y sólo vemos un punto discordante que corresponde a La Mate por un Yogur, que tiene a día de hoy Pagerank 4 y sin embargo tiene rank 47. También destaca Kirai con Pakerank 4 y con un muy buen 1645 ranking en Technorati.

También podemos encontrar un grupo de blogs discordantes con PageRank 8 y sin embargo no tan bien posicionados en el ranking de Technorati, son Instapundit, Eschaton y Blogger Buzz… y el que más se sale de la gráfica Librarian´Internet Index.

Bajando a blogs con Pagerank 7 y no tan bien posicionados en el rankig de Technorati tenemos a fernand0, Google Base Blog y Bambino.

Supongo que esto da para mucho análisis y alguna que otra conclusión.

Datos del experimento:

  • Datos con gráfica en Excel
  • Datos en formato CSV (sin gráfico)

Delicious PostLinks, para crear posts de enlaces recomendados

Delicious PostLinks es una pequeña herramienta que accede a tu feed público en Delicious y te genera el código para pegar en tus entradas de enlaces recomendados.

Delicious PostLinks es una pequeña herramienta que accede a tu feed público en Delicious y te genera el código para pegar en tus entradas de enlaces recomendados.

Aprovechando que hoy es el día de los Blogs, me gustaría compartir con vosotros una pequeña herramienta que he programado para crear mis posts de enlaces semanales, la he llamado Delicious PostLinks y está alojada en CompareBlogs:

¿Qué es y para qué sirve Delicious PostLinks?

Enlazar periódicamente entradas interesantes de otros blogs es un hábito muy recomendable y una práctica muy extendida entre algunos de mis bloggers favoritos: Javier de Loogic,  Antonio Ortiz de Error500, J.L. Orihuela de eCuadernoCarlos Blanco, Fernando Polo… etc.

Delicious PostLinks es una pequeña herramienta que accede a tu feed público en Delicious y te permite realizar pequeños cambios para poder publicar tu listado de enlaces recomendados en una manera fácil, rápida y sencilla.

¿Cómo funciona?

1 – El peso de todo el trabajo recae en Delicious de Yahoo!, si como yo, ya tienes cuenta perfecto! Si no tienes, necesitarás crearte una, te recomiendo que te instales el plugin para Internet Explorer o el de Firefox (que es aun mejor).

2 – Se trata de que según vayas revisando los blogs que lees, añadas a tu cuenta de Delicious los enlaces que luego te gustaría compartir con tus lectores de tu blog. Con los plugin es realmente sencillo y la única precaución que debes tener es la de guardar la URL de entrada concreta (permalink) y no la Home del blog o la URL de tu agregador.

 
3 – Al guardar el enlace, además de poderle asignar etiquetas puedes almacenar un fragmento del artículo que te ayude a recordar de qué trataba (también puedes redactar tú una pequeña descripción… pero se trata de tardar el menor tiempo posible, por eso yo siempre utilizo un fragmento del propio artículo).
4 – Guárdate en favoritos Delicious PostLinks: www.fernandoplaza.com/apps/delicious/ y así podrás acceder a ella rápidamente. Sustituye mi nombre de usuario en Delicious (fernandoplaza) por el tuyo y verás como aparecen tus últimos enlaces públicos, con el desplegable puedes ver hasta 15 enlaces.Si lo deseas puedes realizar un filtro de tus últimos enlaces por una o varias etiquetas, para ello tienes que intrucir en la casilla tu nombre de usuario y después de una «/» la etiquetas separadas por +. Por ejemplo: compareblogs/geek+linux
5 – Actualmente con Delicious PostLinks puedes: 
  • Eliminar enlaces que no quieras publicar: marca el checkbox de las entradas que quieras borrar, pulsa actualizar y desaparecerán (los enlaces no se borran de delicious).
  • Modificar el título y la descripción de un enlace: realiza todos los cambios que necesites en las entradas y después pulsa en actualizar, puedes cambiar el título o la descripción de varios enlaces al mismo tiempo.
  • Incluir el autor o el origen de la entrada: si no lo rellenas no pasa nada, algunos blogs incluyen el nombre del blog en el título de la entrada, queda mucho más claro mover esa información a su apartado correspondiente (algo que se puede hacer muy rápido seleccionando y arrastrando).
  • Previsualizar como quedará el resultado.
6 – Una vez que has terminado de hacer todos los cambios pulsa en «actualizar» Delicious PostLinks crea el código con la lista de enlaces, incluyendo en el title del enlace la descripción del enlace.
 7 – Crea tu entrada: Pulsa en «seleccionar todo para copiar», si usas Internet Explorer el código de la entrada pasará directamente a tu portapapeles, si estás en Firefox tendrás que utilizar el método tradicional (Ctrl+C o botón derecho del ratón: Copiar). Entra en tu sistema de publicación (Blogger, WordPress, Movable Type…) y pega el código dentro de tu entrada en la vista HTML. 


Espero que os resulte útil y que os ayude a ahorrar mucho tiempo… ese es el objetivo.

UTF-8, probado, probando… 漢音

Estamos migrando el charset de todos nuestro CMS a UTF-8 y con ello el de todos los blogs que gestionamos con él.

Estamos migrando el charset de todos nuestro CMS a UTF-8 y con ello el de todos los blogs que gestionamos con él.

Hasta el momento utilizábamos ISO-8859-1 (latin1), que para escribir en español va de maravilla, pero más allá de eso no da más de si y para CompareBlogs necesitamos más porque tenemos usuarios que han dado de alta blogs en muchos idiomas y cuando intentamos importar sus tags o cualquier otra información de las apis de delicious, technorati o bloglines nos encontramos con que muchas veces no podemos hacerlo porque el contenido ha sido escrito en griego, japonés o quién sabe.

El cambio lo intentamos hace ya bastante tiempo pero nos dimos de bruces con un impedimento que parecía insalvable, todo nuestro código está escrito en Vbscript y utilizamos ODBC para conectarnos a mySQL y el conector que había en ese momento (MySQL Connector/ODBC 3.51) no era compatible con UTF8. 

Por suerte desde principio de año ya está disponible el nuevo conector/ODBC 5.1  que parece que sí es compatible. Como siempre, las pruebas las está sufriendo este blog y vosotros que me leéis.. y cuando aquí todo vaya bien iremos realizando el cambio en el resto de webs.

El procedimiento ha sido el siguiente:

1 – Leer los siguientes artículos, para refrescar mis parcos conocimientos:

2 – Hacer una copia de seguridad de la base de datos de este blog, abrir el archivo resultante (.sql) con ultraEdit y guardarlo con otro nombre en formato utf-8. Modificar el charset en la sentencia CREATE TABLE, cambiando «latin1» por «utf8».

3 – Crear una base de datos nueva (en mySQL 4.1 o superior) e importar el archivo modificado. Ahora los datos de los que se alimenta la web deberían estar todos en UTF-8.

4 – Ahora hay que modificar el meta tag del charset y cambiarlo a utf-8. De esa manera le diremos al explorador que nos visite, que nuestra página está escrita en utf8.

Generando ficheros en formato UTF-8

Una de los problemas que me he encontrado es a la hora de generar los feeds, ya que hasta el momento los metía en una variable y luego el contenido de esa varible lo volcaba en un fichero de texto con FSO (FileSystemObject)

Set fso = CreateObject("Scripting.FileSystemObject")
Set myFile = fso.CreateTextFile(ruta_archivos & FOLDER_ATOMXML & "" & post_uri & ".xml", True)
myFile.Write(entry_v)
myFile.Close

Que funcionaba perfectamente, pero que para crear archivos UTF-8 no vale, por lo que lo hemos tenido que cambiar por algo como esto:

Set fsT = CreateObject("ADODB.Stream")
fsT.Type = 2   'Specify stream type - we want To save text/string data.
fsT.CharSet = "utf-8" 
fsT.Open
fsT.writetext entry_v
fsT.SaveToFile ruta_archivos & FOLDER_ATOMXML & "" & post_uri & ".xml", 2
fsT.close
set fsT= Nothing

Asi que os seguiré contando como va esta aventura, que supongo que me terminará dando más lata de la que pienso.

Organizando la blogosfera, en serio…

Es dificil clasificar un blog, salvo los de temática muy concreta: Marketing, Coches, Gadgets… la mayor parte de los blogs habría que archivarlos en Inclasificables.

Es dificil clasificar un blog, salvo los de temática muy concreta: Marketing, Coches, Gadgets… la mayor parte de los blogs habría que archivarlos en Inclasificables.


En muchas ocasiones ni sus propios autores saben de qué tratan sus blogs, citando a Pablo, el hombre bi-reto: «Si supiese de que va mi blog, sabría hacia donde dirigir mi vida».Pero el que no te sepas definir a ti mismo es algo normal, normalmente las personas que te rodean sabrán mejor cómo eres (salvo tu familia). Muchos de tus lectores ya te han diseccionado y clasificado:
  • colocándote dentro de una carpeta concreta dentro de sus feeds (en la captura superior: etiquetas con fondo azul a la derecha).
  • otros te han guardado y etiquetado en delicious (etiquetas amarillas)
  • y tú mismo te has ido etiquetando cuando archivabas tus posts dentro de ciertas categorías, una información que si has utilizado correctamente el microformato adecuado algunos servicios como Technorati habrán capturado (etiquetas verdes).

Uniendo esa información y ponderándola con acuerdo al número de veces que se ha utilizado esa precisa etiqueta, podemos hacernos una idea de cuál es la temática de un blog. No obstante, las etiquetas tienen tres limitaciones importantes:1 – Se requiere un gran volumen de etiquetado (folksonomy) para poder obtener conclusiones mecanizadas acertadas, e incluso en sitios como Delicious donde hay miles de usuarios etiquetando, algunos blogs sólo han sido guardados un par de veces, por lo que confiar en que esas etiquetas son correctas sin una supervisión manual-humana es un poco arriesgado. Por cierto, que todos los sitios dados de alta en CompareBlogs están ya volcados en Delicious con todas nuestras etiquetas y otras tantas que hemos ido recuperando de varias fuentes.

2 – Algunas etiquetas en esencia significan lo mismo, pero eso de manera mecanizada no es sencillo deducirlo. Por poner un ejemplo sencillo: blog, blogs, weblogs, weblog, bitácora, blogger, bitácoras, blogging, blogosfera… son etiquetas muy populares cuando se clasifican blogs y todas ellas significan lo mismo: se deberían sumar, a la hora de valorar su peso dentro del volumen total de etiquetas utilizadas.

Para paliar con esto Delicious tiene los «tag bundles», en esencia se trata de etiquetar etiquetas. Cuando le pregunté a Nacho Puell cómo lidiaban con esto en 11870.com me comentó que ellos generaban «clusters de etiquetas» y así es como lo hemos llamado nosotros también en CompareBlogs (abajo en azul los clusters, y el número de etiquetas que agrupa cada uno):

3 – La etiquetas no son jerárquicas -por definición-. Lo mires como lo mires, de manera mecanizada es difícil deducir una jerarquía de un etiquetado. Los directorios jerárquicos son mucho más exactos en ese aspecto, en TopMadrid nosotros utilizamos un directorio jerárquico para clasificar los establecimientos de los que escribimos, por ejemplo: Hogar y Jardín en Madrid > Muebles > Muebles de Baño.

Pero este sistema tiene muchas desventajas y genera verdaderos quebraderos de cabeza, por lo que para organizar los blogs estamos optando por un sistema híbrido: a los blogs se les etiqueta con información obtenida de distintas fuentes, a su vez esas etiquetas se agrupan en clusters de etiquetas y esos clusters se organizan jerárquicamente… Este sistema una vez lo hayamos testeado suficientemente nos gustaría poder exportarlo a TopMadrid y DolceCity.