Vía Alt1040 llego a una nota de David de Ugarte en la que ha hecho un rápido ejercicio de cálculo para llegar a la conclusión de que los datos de Alexa no valen para nada. En los comentarios de ese mismo post hay una interesante conversación entre David y Alvy sobre Alexa (para que luego David diga que los comentarios no valen para nada).
En esto tiendo a estar de acuerdo con Alvy. Alexa vale para comparar peras con peras: sitios similares de similar tamaño del mismo idioma y/o zona geográfica. El cálculo de David, además tiene varios fallos. Algunos que ya apunta Alvy en los comentarios (no cuenta bien subdominios ni sitios demasiado pequeños). Pero es que además, si miras, en Alexa explican que utilizan datos de tres meses y una especie de media entre páginas vistas y reach (que a su vez se obtiene de usuarios únicos y total de usuarios). Aún así, el gráfico que publica David me picaba, así que aprovechando que hay unos cuantos blogs grandecitos entre los de Weblogs SL y que los datos de tráfico de todos ellos son públicos, me he decidido a jugar un poco con ellos.
Siguiendo el consejo de Alvy he cogido por un lado todos los blogs que tienen ranking menor de 50.000 y me da este gráfico:
El gráfico muestra un R2, una correlación del 0,8346, que no está nada mal, especialmente teniendo en cuenta que no he replicado la fórmula exacta de cálculo sino que sólo he considerado la media de páginas vistas de los tres meses anteriores (e incluso los datos de tráfico son de febrero a abril y los del ranking en teoría los últimos 90 días, osea, un desfase de 11 días). Con una muestra escasa, de sólo ocho blogs, pero relativamente grandes, podemos concluir que sí existe cierta correlación, aunque no sea un ejercicio 100% ajustado.
Luego he mirado el resto de blogs a ver qué salía:
En este gráfico se ve claramente que los sitios más pequeños, o que simplemente tienen un ranking más elevado no correlacionan bien, aunque los más grandes de entre estos parece que se van alineando . Miré la correlación de los pequeños y es de apenas un 0,4354 (menos si quitamos los dos más grandes).
Conclusión
Si tu sitio tiene un ranking de menos de 50.000 no le hagas caso a Alexa. Si es de más, úsalo sólo para ver tendencias propias y para comparar con otros sitios de características parecidas y que estén en el mismo ámbito linguístico.
Por si alguien quiere los datos, aquí están:
Actualización:
Como comenta David Arranz, en realidad la mejor correlación no la da una recta, sino una ley de potencias, con un R2 del 0,853.

La relación entre ranking-páginas vistas no debería ajustar a una recta, sino a una curva logarítmica, hay una ley de potencias detrás de esa correlación, es la larga cola de los blogs…
En la segunda gráfica se ve más o menos el dibujo que debería seguir,…
Realmente interesante el estudio, y sobre todo saber que alrededor de «hasta el puesto #50.000» es donde resulta más o menos fiable para las comparaciones de tendencias al menos.
Tiene razón David Arranz con que sale, no una curva logarítmica sino una ley de potencias con R2 del 0,853.
Pero a efectos prácticos lo que vale es lo que dice Alvy, que a partir de ranking 50.000 ya vale la recta. Y también que con la fórmula del gráfico y el ranking puedes calcular con bastante seguridad el tráfico.
También tiene que ver mucho que el sitio sea fácil de navegar. El otro día Mike Davidson (de Newsvine) hizo un pequeño estudio sobre cómo podría quedar MySpace.com en Alexa haciéndolo un poco más fácil de usar: http://www.mikeindustries.com/blog/archive/2006/04/myspace-click-factory
Eso sí, el que haga que sus usuarios tengan que hacer clic en más páginas sólo para subir en Alexa puede pasarlo muy mal…
Alexa va de culo de hace años. Tampoco creo que sea una novedad. Menos mal que siempre hay advenedizos dispuestos a abrir los ojos a un secreto a voces.
Gran comentario constructivo Marcos.
Julio, el post, tanto el gráfico como la conclusión me parecen muy interesantes. Coincido en comparar «peras con peras» y sólo entre webs pertenecientes al mismo sector.
Pero hay algo que creo altera este caso. Los weblogs están enlazados entre ellos. Imagino que el tráfico originado por visitas directas de un blog a otro puede ser bastante alto, y eso entiendo que alteraría los resultados, al existir un porcentaje a tener en cuenta de usuarios comunes.
Un Saludo.
Me parece que podría encontrar muchos ejemplos de webs con un raking menor de 50.000 que se alejan bastante de esa recta. Por ejemplo mi web que tiene su ranking de Alexa es de 30.000 y no tiene muchas más de 1000 visitas diarias. Mejor ranking que motorpasión y muchas menos visitas.
Además como ya dijo David Ugarte influye mucho la procedencia de tus visitantes, sus hábitos y profesión. Creo que uno de los mejores usos de Alexa es para comparar una web con ella misma.
Fran,
No sé si te sigo. Lo que dices es verdad, pero entiendo que afecta a todos los blogs por igual.
Carlos, hay muchos factorers que influyen. Por ejemplo, si tú mismo tienes instalada la barra de alexa ya estás sesgando los resultados. En el gráfico que he incluído las condiciones de todos los blogs son muy similares.
Julio, como decimos vale para comparar «peras con peras». Depende del tipo de perfil de usuarios que los datos estén más o menos alterados. Como ejemplo, las webs que hablan de buscadores suelen tener mejor ranking de alexa que ninguna otra, el motivo es que el perfil de sus usuarios coincide con el perfil de los usuarios que tienen la barra de alexa instalada.
Centrándonos en los blogs de los que expones los datos. Un blog como xataka responde a un tipo de perfil de usuario que tiene la barra de alexa instalada en mayor media que otros de la lista, como pueden ser «bebés y más» o «blog de cine», donde un porcentaje menor de usuarios tendrá la barra instalada.
La cantidad de enlaces que hay entre esos blogs entiendo que hace que exista un «tráfico compartido» en los mismos: usuarios comunes.
Si el 100% de los usuarios de los blogs fuesen comunes los gráficos entiendo que serían casi perfectos. Pero eso no es así, cada usuario tiene un conjunto de usuarios variado, pero las intersecciones comunes entre cada uno, entiendo que alteran el estudio bastante.
De forma más sencilla, si Xataka envía 50 – 100 visitas a genciencia porque tiene un enlace destacado en la cabecera, y entiendo que esto es posible, está enviando un perfil de usuarios con más posibilidades de tener la barra de alexa instalada, y que es posible que no estén interesados en el blog.
Creo que lo mejor para esto sería coger webs aisladas, sectores diferentes, sin enlaces entre ellas.
Matemáticamente no estoy seguro como puede afectar, es una impresión basada en la observación de casos similares (web de buscadores que enlaza a otra no relacionada y sólo por esto el ranking de alexa de la web enlazada queda completamente alterado).
Un Saludo,
Fran,
Ok, ahora ya te sigo. Lo de las webs de buscadores totalmente cierto. El razonamiento de que habrá más usuarios de la barra de Alexa en Xataka que en Bebés y más es, en principio correcto. Pero en la práctica creo que los usuarios de la barra de Xataka son tan tan pocos, que los que vayan en los enlaces serán, como en el chiste, uno o ninguno.
Lo cual, por otra parte, no hace sino confirmar que el índice de Alexa está cogido con pinzas. Alguien proponía que lo hiciera Google con su barra. Pero es que ya tiene los datos de casi todo el mundo vía Analytics. Lo único que tendría que hacer sería hacer un ranking (opt-in para que no haya problemas de privacidad).
No tengo la barra de Alexa, tengo una extensión para FireFox llamada Search Status que hasta ahora creia que no enviaba nada pero parece que así es.
Por lo tanto, tienes razón en que estoy sesgando los resultados. Pero lo mismo le puede pasar a muchos webmasters, no? Además de poco fiables si son tan fácilmente manipulables…
Me sigue pareciendo que es necesario que una web se parezca mucho a otra para poderla comparar (en cuanto a temática, localización de los usuarios, el % de usuarios procedentes de buscadores y asiduos, etc)
Como comentario ilustrativo, os invito a registrar un dominio. Subir un pequeño texto. Y entrar todos los días un par de veces a ese dominio con la barra de alexa. No se lo digais a nadie, sólo entrar vosotros.
Estareis sin apenas esfuerzo sobre el puesto 1.000.000 en una semana y unos días.
Imaginaros una empresa con 30 trabajadores con la barra y entrando todo el rato en la web de la empresa para acceder posteriormente a la Intranet.
Se puede meter facilmente entre los 20.000 primeros sin apenas esfuerzo.
Podeis buscar miles de ejemplos.
Aquí va otro estudio sobre el «traffic Rank» de Alexa.El estudio se ha realizado sobre una muestra de 16 webs del mundo de la hosteleria. El área de cada globo representa el número de backlinks detectado por Alexa. El numero impreso encima los globos es el numero de días/100 desde que la web está online (valor tomado también de Alexa).
Cierto que las webs con más tráfico, más antiguas y con mas backlinks tienen mejor page rank, pero me veo incapaz de sacar una relación causa efecto significativo mediante un estudio analítico de covariazas entre estos factores.
http://www.masterasp.com/tmp/alexa.gif