|
HERRAMIENTA: GOOGLE PAGERANK
¿Qué es?
Desde que los buscadores empezaron a tener gran cantidad
de webs indexadas, hubo la necesidad de encontrar un sistema,
lo más objetivo posible, para posicionarlas dentro
de los resultados de una búsqueda. Una buena forma
de conseguirlo es midiendo la popularidad de una página,
de forma que las más populares aparecerán
mejor posicionadas. Partiendo de la base que los webmasters
sólo añaden links en sus webs de las páginas
que son realmente buenas o interesantes, se entiende que
una web es más importante cuantos más links
hacia ella haya en otras webs.
Google se ha basado en esta sencilla idea
para crear su PageRank (PR), representado por un número
entre 0 y 10, que mide la “popularidad” de una
web (cuanto mayor es el valor, más popular es). El
nombre proviene de uno de los fundadores de Google: Larry
Page.
Debemos tener en cuenta que no se trata
simplemente de contar el número de links de entrada
que tiene una web, sino que para Google la importancia de
todos los enlaces de entrada no es la misma: en térmimos
generales, es mejor que nos enlace una página con
PR alto que una con PR bajo (nuestro PR será alto
si nos enlazan páginas con PR alto).
Por lo tanto, la “importancia” de una página
viene dada por la “importancia” de las páginas
que enlazan hacia ella. A su vez, la “importancia”
de estas otras páginas, viene dada por la “importancia”
de las que enlazan hacia ella. Y así sucesivamente…
Según esta estructura ramificada, podemos decir que
el PageRank se basa en los enlaces de toda la Web y que
su potencial es infinito (siempre se puede aumentar, aunque
cueste trabajo).
¿Cómo conocer el PageRank de una web?
La Barra de Google nos muestra, en forma
de una pequeña barra de color verde, cuál
es el PR de una página cuando la visitamos.
Aunque seguramente no es la mejor forma
de conocer exactamente el PR de una web, debido a las propias
limitaciones de la barra, sí que es la mejor forma
de tener una idea bastante aproximada de cual es su valor.
Debemos tener en cuenta, por ejemplo, que muchas veces se
trata de una estimación de PR (cuando la página
no está indexada y existen otras muy similares) y
que la barra es una representación gráfica
de unos valores numéricos lineales (por ejemplo,
para la barra es lo mismo un valor de 15.627, que uno de
78.124).
| PR
entre... |
PR
que muestra la barra |
| 0,00000001 y 5 |
1 |
| 6 y 25 |
2 |
| 26 y 125 |
3 |
| 126 y 625 |
4 |
| 626 y 3.125 |
5 |
| 3.126 y 15.625 |
6 |
| 15.626 y 78.125 |
7 |
| 78.126 y 390.625 |
8 |
| 390.626 y 1.953.125 |
9 |
| 1.953.126 e infinito |
10 |
Otra forma de conocer el PR es mediante
el directorio de Google (http://directory.google.com),
aunque nos encontraremos con los mismos “problemas”
que la Google Bar.
El algoritmo
Aunque pueda parecer complicado llevar
la idea del PR a la práctica, Larry Page y Sergey
Brin, los fundadores de Google, consiguieron hacerlo mediante
un algoritmo relativamente sencillo. Cuando el PageRank
fue creado, se publicó su fórmula, pero desde
entonces no se ha vuelto a conocer. Seguramente se habrán
producido pequeñas variaciones, pero la base es la
siguiente:
PR(A) = (1-d) + d (PR(T1)/C(T1) + ... +
PR(Tn)/C(Tn))
PR(A) es el PR de la página A, PR (Ti) es el PR de
las páginas Ti que enlazan hacia A, C(Ti) es el número
de links de salida que hay en la página A y d es
un número entre 0 y 1.
El PR de una página T se pondera
con los links de salida (C(Ti)) de esa misma página.
Por lo tanto, cuantos más links de salida tenga,
menos se beneficiará la página A de un link
en T. Así pues, podemos observar que el PR viene
definido por la influencia individual de cada página
y que no todas afectan de la misma forma. Finalmente, la
suma de todos los PR ponderados se multiplica por d, un
valor entre 0 y 1.
|