El Lado Oscuro de la Fuerza… pierde fuerza

Seguimos con nuestras encuestas semanales y nos siguen sorprendiendo los resultados… los Jedi, ganan y Dark Vader con su mano tendida y seductora pierde… aunque no por mucho, apenas un 2%, y es que el mal y el bien han de estar equilibrados.

¿Qué más se puede decir? Pues mucho… porque tal y como os contábamos en nuestro primer podcast que ya os habéis empezado a descargar (¡gracias!… ahora sólo falta que participéis un poco dejando un comentario, panda de cabrones)… , como seguía diciendo uno de nuestros visitantes (humano, no robot) votó 38 veces a favor del Lado Oscuro… No sé en que cabeza cabe el votar 38 veces y tampoco que interés puede tener alguien en que el Lado Oscuro venza en una encuesta, pero es que el mal acecha en cualquier parte, incluso en un web con una relativa popularidad internacional como TopMadrid.

Para la próxima semana la pregunta creemos que también está a la altura «¿Invitarías a tu boda a Marilyn Manson?» (pincha y vota)… por el momento ya han votado 12… je, je

Robots, robots y más robots…


Ayer visitaron nuestra web 1400 humanos y 424 robots… al menos, eso dicen las estadísticas. Aunque realmente son algunos menos, lo que pasa es que como los robots (que van navegando por internet almacenando el contenido de las páginas, normalmente para luego incluirlos en los resultados de búsquedas) no aceptan cookies ni ids de sesión, cada vez que visitan una página es como si lo hicieran por primera vez.

Entre los más activos de ayer, Googlebot/2.1 que visitó unas 100 páginas, no obstante a parte de él, ayer fueron unos cuantos (orden alfabético), algunos con más hambre que otros:

  • ccubee/3.1
  • Googlebot/2.1 (+http://www.google.com/bot.html)
  • http://www.almaden.ibm.com/cs/crawler [fc12]
  • ia_archiver
  • Mediapartners-Google/2.1
  • Mozilla/2.0 (compatible; Ask Jeeves/Teoma)
  • Mozilla/3.0 (compatible)
  • Mozilla/4.0 (compatible; Cerberian Drtrs Version-3.2-Build-0)
  • Mozilla/4.0 (compatible; Cerberian Drtrs Version-3.2-Build-1)
  • Mozilla/4.0 (compatible; grub-client-2.6.0)
  • Mozilla/4.0 compatible ZyBorg/1.0
  • Mozilla/5.0 (compatible; Googlebot/2.1)
  • Mozilla/5.0 (compatible; Yahoo! Slurp)
  • msnbot/1.0
  • NutchCVS/0.06-dev (Nutch)
  • psbot/0.1
  • ScSpider/0.2
  • Seekbot/1.0
  • SurveyBot/2.3 (Whois Source)
  • Ultraknowledge Spider
  • WebIndexer/1-dev
  • Wget/1.8.1
  • Xerka MetaBot v1.0.0 [GaiaSoftwareticES]

Con respecto a nuestras Estadísticas para Medir la Utilidad de un Web es necesario eliminar estas visitas de los cómputos. En los primeros gráficos que aportamos (ver link anterior), no lo hicimos y formaban parte de los usuarios tipo E… en los próximos gráficos, que publicaremos en unos días, todas estas visitas ya no distorsionarán los resultados… eliminaremos completamente del gráfico los usuarios Tipo E (robots) y ya sólo nos quedarán usuarios tipo A, B, C y D, que corresponderán a nuestra primera clasificación de usuarios con acuerdo a la «supuesta» utilidad que conceden a nuestro web.

  • Tipo D – Usuarios para los que el web no es útil.
  • Tipo C – Relativamente Útil
  • Tipo B – Útil
  • Tipo A – Muy útil

Seguimiento de Visitantes: Cookies no habilitadas.

Este post es una continuación de:

I Verificando la Utilidad de tu Web
II Control de Calidad de un Sitio Web
III Estadisticas de Utilidad de un Web

En la imagen podemos ver un claro ejemplo de lo que ocurre cuando intentamos rastrear lo que hace un usuario cuyo navegador no soporta cookies o no las tiene habilitadas (enabled). Cada una de las cosas que hace constan como si las hicieran usuarios distintos (5 pasos, 5 registros… en lugar de todos los pasos recogidos en un único registro).

Como podéis observar hemos añadido un nuevo campo a la tabla: el código de agente, de esta manera podemos saber con cuál están visitando nuestra web y distinguir a los robots de los visitantes «humanos». En este caso el agente tiene el código 202 (numeración propia) que equivale a [Mozilla/5.0 (compatible; Konqueror/3.1; Linux 2.4.22-xfs; X11)].

Hemos tenido que cambiar la manera en que rastreamos para evitar este tipo de repeticiones, no obstante hay una limitación muy difícil de salvar: Si el browser de un usuario no soporta o no tiene habilitadas las cookies, en cuanto expire su sesión no tendremos manera de re-identificarlo… al menos nosotros no sabemos cómo. En cualquier caso para el tipo de estudio que estamos haciendo aquí ese error no va a tener muchas transcendencia.

Falta de tiempo o falta de orden y prioridades

Hace unos meses asistí a una jornadas de formación sobre Gestión por Objetivos organizadas por Schering-Plough. La excelente ponencia corrio a cargo de Eduardo de Salas de la consultora Mercuri International y fue muy interesante.

Eduardo de Salas nos contó como anécdota que en una ocasión, hace ya bastantes años, le comentaba a un jefe suyo que le faltaba tiempo, y éste le respondió algo asi como:

Sabes Eduardo, tu problema es que llamas «falta de tiempo» a lo que realmente es «falta de organización» (o algo parecido… planificación, prioritización)

Él nos contaba que se quedó un tanto contrariado ante tal comentario, pero que con el tiempo se ha ido dado cuenta de que aquel jefe suyo tenía toda la razón.

Todo esto me viene ahora a la memoria, varios meses después, porque últimamente quiero hacer un montón de cosas y me falta tiempo por todos los lados… es algo bastante frustrante. A veces te consigues concentrar en algo, pero de repente te asalta uno de esos temas urgentes que tienes que solucionar en el momento, y lo tienes que dejar todo… en fin, supongo que nos pasa a todos, pero es bastante frustrante. Por eso espero que el jefe de Eduardo, en mi caso, también tuviera razón…

Estadisticas de Utilidad de un Web (cont)


Seguimos con los primeros datos de nuestro estudio de la calidad del un web. Este post es una continuación de dos anteriores:

  1. Verificando la Utilidad de tu Web (cont)
  2. Control de calidad de un sitio web

Con los datos procedentes de cuatro días enteros, procedemos a analizar cuántos usuarios de cada tipo han visitado nuestra web (de A muy satisfecho a D muy poco satisfecho). Todo ello lo hacemos con el siguiente código simplificado:

Hay muchas cosas de esta clasificación que no se sostienen, por ejemplo, hemos clasificado aquí a un grupo de usuarios como de Tipo A, se supone que los mejores… pero como se puede ver en el código sólo se ha tenido en cuenta que la duración de su visita ha sido superior a «5 minutos»… con lo cual no es un criterio muy fiable.

Este primer intento nos ha servido para darnos cuenta (con datos) de que existe un grandísimo grupo de usuarios (entorno al 50%) cuya visita dura 0 (milisegundo), aquí los llamamos usuarios de Tipo E. Hacer cualquier valoración sobre este tipo de usuarios o incluirlos en nuestro estudio distorsionaría todo. Cuando incluyamos más datos en nuestro estudio sabremos más sobre estos usuarios…. Pero ya por lo pronto de un plumazo nos hemos quitado a la mitad de las visitantes diarios de nuestro web, ¿cómo contemplara la Oficina de Justificación de la Difusión (OJD) este tipo de visitas?.

El otro 50% lo forman usuarios A + B + C + D (usuarios reales). Los usurio Tipo D que son aquellos que en anteriores post llamamos usuarios insatisfechos son aquellos que no visitan ningun web recomendada ni ningún foto satélite (aquí ha existido un fallo porque no se estaban contabilizando las visitas a las fotos satélite… luego en principio son algunos menos de los que aquí aparecen). Es decir son usuarios que entran en el web y se van antes de cinco minutos sin hacer nada que quede contabilizado.

Los usuarios Tipo C sí que hacen click en una recomendacion (sólo en una), los consideramos relativamente satisfechos, también muy matizable por distintas razones que ya veremos.

Finalmente los usuarios Tipo B que visitan varios enlaces (>1) o varias páginas (>1) , pero cuya visita al web ha sido inferior a 5 minutos (porque si no serían Tipo A).

Conclusiones por el momento

No se puede sacar ninguna conclusión todavía, de hecho lo único que creo que es interesante es:

  1. Existencia de los usuarios Tipo E ¿qué son?
  2. Las proporciones son relativamente constante, es decir, las proporciones de cada tipo de usuario se mantienen y por tanto se podrá analizar su evolución.

Seguiremos con el estudio…