Capturando pantallazos de webs para obtener logotipos y thumbs

Gracias al API de bluga.net se pueden obtener pantallazos de cualquier web, incluidas las desarrolladas en Flash, a partir de las cuales obtener con facilidad los logos de los establecimientos.

Gracias al API de bluga.net se pueden obtener pantallazos de cualquier web, incluidas las desarrolladas en Flash, a partir de las cuales obtener con facilidad los logos de los establecimientos.

El otro día repasando un artículo antiguo de febrero de 2006 me asustó comprobar que ayer terminamos un desarrollo que ya teníamos en mente en esa fecha.

La idea es muy sencilla, en TopMadrid y DolceCity disponemos de una guía con las direcciones de los sitios de los que hablamos en el blog organizadas por categorías, por ejemplo: centros comerciales en Madrid

Como se puede ver en la imagen los sitios van acompañados de una pequeña imagen de 50 x 50 pixels con el logo de la empresa referenciada: ¿cómo se hacían esos logos? A manija, es decir, vas a la web del sitio, capturas pantalla, la pegas en tu editor de imagenes, recortas, guardar las imagen, la subes por FTP al servidor y actualizas el registro como que “ya tiene imagen”. 

El proceso realizado por mi a toda prisa podía llevar unos 5 minutos por imagen y por alguien con menos soltura de 5 a 10 minutos, vamos de 2 ó 3 euros por imagen sin contar el daño emocional de ver que llevas cinco y te quedan 3000.

Era un rollazo interminable y tedioso que no superó la prueba de escalabilidad a la que se sometieron todos los procesos cuando ampliamos el concepto de TopMadrid a nuevas ciudades con DolceCity. Lo tuvimos que interrumpir, pero claro, el atractivo de la página se resiente, asi que había que buscar una manera de hacer lo mismo mucho más rápido y lo hemos conseguido gracias al API de bluga.net webthumb y a un par de días de programación.


pulsa para ver más grande

Volvemos al tema de ahorro de tiempo: ahora conseguimos hacer entre 3 y 4 imágenes por minuto, lo cual reduce el coste de cada foto a unos cuantos céntimos de euro… y lo mejor de todo, es divertido (casi diría adictivo).

El proceso de captura viene a tardar cerca de un minuto entre que solicitas el pantallazo, bluga.net obtiene la captura, te hace un ping para avisarte de que ya la tiene y nuestro sistema descarga la foto en el servidor.

Dentro de nuestro programa los sitios que no tienen foto se colocan en una lista de espera, mientras que tú estás recortando un logotipo el sistema a través del API está solicitando la pantalla de los siguientes sitios, de tal manera que cuando avanzas ya todo esta listo para que puedas seguir trabajando sin interrupciones.

En la imagen de la derecha se puede ver que la caputura de operad-arte.es se ha solicitado pero todavía no está lista por lo que no se ha podido descargar… sin embargo la captura de hatostyle.com ya esta lista y sólo falta recortarla.

Las capturas se reciben a 1024×768 en formato png sin perdida y vienen a pesar cerca de media mega cada una. Utilizando los mismos componentes que para las thumbs se selecciona la parte donde está el logotipo de la empresa y a partir de esas posiciones se generan toda una serie de imágenes en formato jpeg:

Algo importante es que las pautas de corte se almacenan en la base de datos, de esta manera si en algún momento necesitamos hacer una nueva thumb con otras medidas o deseamos cambiar de formato (por ejemplo pasar a png), podemos rehacer el procedimiento en toda las imágenes ya procesadas, sin tener que revisarlas de nuevo.

En fin ya se sabe que los desarrollos de los que estas orgullosos hoy te avergüenzan pasados unos años… pero por el momento estamos encantados con el nuevo jueguecito.