Medición web: en el principio fueron los logs

La historia

En el principio de la medición de audiencia en internet fueron los hits usando los logs de los propios servidores de las páginas webs. Y fueron muchos. Pero los hombres vieron que no servían para entender la audiencia de un sitio. Y entonces llegaron las páginas vistas. Que ya eran mejores que los hits. Y la medición con herramientas de terceros, que eran menos manipulables que los logs. Pero enseguida se inventaron los refrescos automáticos de página, las galerías con múltiples fotos, a página cada una, y los articulos en paginados interminables de a párrafo cada uno. Y de nuevo hubo inflación. Y no se podía medir la audiencia real. Entonces llegaron los usuarios únicos. Con ellos se querían medir personas reales, de carne y hueso, con orejas y nariz. Pero las herramientas de medición censal que existían, basadas en tags y cookies, sólo medían navegadores únicos. Cada vez que un usuario abría otro navegador, borraba sus cookies o cambiaba de dispositivo, se convertía en un nuevo usuario. Y así el número de usuarios únicos del mercado subía y subía sin parar.

En paralelo se había empezado a usar paneles de audiencia, como en la tele. Sólo que internet es una realidad mucho más compleja y diversa que la tele. Y en vez de cientos de canales hay, literalmente, millones de sitios. Y los usuarios hacemos cosas muy raras. Como usar distintos navegadores, distintos sistemas operativos o distintos dispositivos. Y los paneles más o menos acertaban, a la baja, los usuarios únicos, pero patinaban fuertemente calculando las páginas vistas. Y claro, en tele también deben patinar, pero las teles no tienen medición censal propia y no lo saben. En internet todos sabemos cuántas páginas vistas hacemos. Y todos sabemos que los paneles puros patinan con esta métrica. Que, curiosamente, es la que se usa para contratar publicidad online (por mucho que los usuarios se usen para determinar qué sitios son más relevantes que otros).

Y entonces, apareció la medición híbrida. La medición híbrida (o unificada) consiste en usar lo mejor de cada una de las dos metodologías, la censal (tags y cookies) y la de panel (muestra representativa del mercado que instala software en su ordenador). Pero resulta que cada medidor la calculaba de una manera. Así que se hizo un concurso de mercado para decidir qué sistema de medición y que empresa proporcionaba una mejor medición. Y las reglas para dicho concurso las fijaron de común acuerdo compradores y vendedores de publicidad; anunciantes y agencias por un lado. Portales, medios tradicionales y medios nativos por otro. Sin olvidar a las teles y radios ni a las redes. Y del concurso salió vencedora comScore. Aunque con muchas mejoras por hacer, su sistema fue el que más convenció a la industria. Y en enero de 2012, pasó a ser el estándar de medición del mercado de internet español.

La explicación seria
Lo anterior, muy simplificado, es una breve historia de la evolución de la medición en internet hasta nuestros días. Espero que ayude algo a entender de qué va todo esto. Lo traigo a colación porque en breve vamos a cambiar en Weblogs SL la fuente de los datos de audiencia que venimos publicando ininterrumpidamente desde que empezamos Xataka en noviembre de 2004. Los datos que empezamos a publicar entonces eran del sistema interno que usábamos en la época (PHP-Stats). En febrero de 2006 empezamos a usar los datos de Market Intelligence de Nielsen, la herramienta de medición censal de Nielsen Online. Este es el sistema que hemos usado todos los meses hasta hoy. A partir de los datos de diciembre de 2012, que publicaremos en unos días, empezaremos a usar datos unificados (híbridos) de comScore. En realidad no son híbridos del todo, parte de los sitios todavía no tienen datos unificados y muestran sólo los del panel. Hemos decidido no esperar a los datos de enero (que serán más completos pero posiblemente aún no al 100%) porque queremos poder dar un mes datos con ambas metodologías y explicar las diferencias. Que las hay y son importantes. Voy a intentar adelantar algunas cosas aquí.

1. Metodología
Como ya adelantaba, el sistema que usábamos hasta ahora era el censal de Nielsen Online, Market Intelligence. Más precisamente, el dato que dábamos era el de audiencia mundial desduplicada (contando cada usuario que visita varias webs como un sólo usuario). A partir de diciembre daremos el dato unificado de MyMetrix de comScore. Es un dato elaborado en base al panel de audiencia de comScore (unos 20.000 panelistas) que, con algunas carencias que deben resolver, representa la población española usuaria de internet, y con direct, que es la herramienta de medición censal que usa comScore. En consecuencia pasamos de dar datos sobre navegadores únicos a dar datos sobre usuarios únicos.

2. Universo
Hasta ahora dábamos datos mundiales para el total y para cada sitio. A partir de ahora daremos datos mundiales y locales (sólo ip española).

3. ¿Qué sistemas hay y qué metricas dan?
En primer lugar tenemos los sistemas híbridos. El MyMetrix de comScore, que ahora es el estándar de mercado, y el Netview de Nielsen. En un segundo escalón estarían los páneles, las versiones sin hibridar de ambas herramientas. Luego tenemos los sistemas censales, Market Intelligence de Nielsen, Direct de comScore y el archiconocido y archiusado Google Analytics. En esta categoría entran también los datos de OJD, que aunque auditados por esta, se basaban hasta ahora en los datos de Market de Nielsen. Y también un cierto número de herramientas censales que son más de medición interna que de medición pública. Aquí tendríamos Site Census de Nielsen, Omniture, Xiti y unas cuantas más. Luego vienen otras herramientas con metodologías derivadas o menos fiables. La archiconocida Alexa (muy fácil de manipular), Quantcast (que usa datos de tags y también de operadores y que ofrece datos gratis para luego vender los datos de audiencia de tus sitios en adexchanges), Google Trends y Google Adplanner (estimados sobre datos internos de Google y en algunos casos sobre Google Analytics). El orden de fiabilidad, muy a grandes rasgos, es en el que los he presentado.

4. ¿Cambiarán los datos?
Sí, los datos de usuarios únicos mundiales de sistema híbrido son sustancialmente inferiores a los de navegadores únicos mundiales de medición censal. Esto no supone que nuestra audiencia (ni la de cualquier otro medio) se haya reducido. Simplemente antes estábamos contando navegadores no usuarios. Ojo porque esto es una práctica habitual. Cuando un medio publica su audiencia puede usar una u otra metodología. Hasta ahora, no había consenso de mercado sobre cuál era la que debía prevalecer. A partir de ahora sí lo hay. Aunque alguno tenga la tentación de usar otro sistema si el consensuado no le saca como a él le gustaría.

Por ejemplo, el dato que publicó hace unos días El País, es de comScore metodología híbrida, sólo IP española. Similar y comparable al que usaremos nosotros. Una pena que sólo lo hayan empezado a usar cuando se ponen por delante y no todos los meses vaya bien o mal. También es una pena que hagan comparativas teniendo en cuenta sólo medios tradicionales. Pero es el dato correcto y, efectivamente, El País es líder en audiencia española de medios informativos en diciembre de 2011.

El Mundo también se ha autoproclamado líder en audiencia en diciembre de 2011. En este caso usa varias fuentes: el dato censal de OJD, que a su vez usa datos de Market Intelligence de Nielsen con datos mundiales, no del mercado español, el panel de Nielsen puro y el panel de Nielsen híbrido. Sin entrar en otras consideraciones, extraña que escriban como si comscore no existiese o como si no hubiera ganado el concurso. Máxime cuando el grupo de El Mundo estuvo representado en ese proceso. También hacen una comparativa parcial, sólo con quien les interesa. En este caso ni 20minutos les vale como comparable.

Para terminar la foto, Vocento también se proclama líder en diciembre 2011. En este caso usa datos del panel híbrido de Nielsen, a nivel de compañía, no de medio e incluye a todos los grupos presentes. Una pena que los datos del panel híbrido de Nielsen sólo incluyen a los que son clientes del mismo. Esto es, faltan Google, Yahoo, Microsoft, Wikipedia… Si usando el unificado de comScore saliese el mismo resultado (Vocento todavía no ha unificado en comScore), este dato también sería correcto. Una cosa es ser líder como medio y otra ser líder como grupo.

¿Qué dato vale? Desde mi punto de vista, y entiendo que desde el de la mayor parte de la industria, el dato unificado (híbrido) de comScore para mercado español. El sistema entra en vigor en enero. Siendo benévolo, todavía en diciembre se puede discutir. No siéndolo, son excusas de mal perdedor.