|
HERRAMIENTA: GOOGLE PAGERANK
¿Qué es?
Desde que los buscadores empezaron a tener gran
cantidad de webs indexadas, hubo la necesidad de
encontrar un sistema, lo más objetivo posible, para
posicionarlas dentro de los resultados de una
búsqueda. Una buena forma de conseguirlo es midiendo
la popularidad de una página, de forma que las más
populares aparecerán mejor posicionadas. Partiendo
de la base que los webmasters sólo añaden links en
sus webs de las páginas que son realmente buenas o
interesantes, se entiende que una web es más
importante cuantos más links hacia ella haya en
otras webs.
Google se ha basado en esta
sencilla idea para crear su PageRank (PR),
representado por un número entre 0 y 10, que mide la
“popularidad” de una web (cuanto mayor es el valor,
más popular es). El nombre proviene de uno de los
fundadores de Google: Larry Page.
Debemos tener en cuenta que no se
trata simplemente de contar el número de links de
entrada que tiene una web, sino que para Google la
importancia de todos los enlaces de entrada no es la
misma: en térmimos generales, es mejor que nos
enlace una página con PR alto que una con PR bajo
(nuestro PR será alto si nos enlazan páginas con PR
alto).
Por lo tanto, la “importancia” de una página viene
dada por la “importancia” de las páginas que enlazan
hacia ella. A su vez, la “importancia” de estas
otras páginas, viene dada por la “importancia” de
las que enlazan hacia ella. Y así sucesivamente…
Según esta estructura ramificada, podemos decir que
el PageRank se basa en los enlaces de toda la Web y
que su potencial es infinito (siempre se puede
aumentar, aunque cueste trabajo).
¿Cómo conocer el PageRank de una web?
La Barra de Google nos muestra,
en forma de una pequeña barra de color verde, cuál
es el PR de una página cuando la visitamos.
Aunque seguramente no es la mejor
forma de conocer exactamente el PR de una web,
debido a las propias limitaciones de la barra, sí
que es la mejor forma de tener una idea bastante
aproximada de cual es su valor. Debemos tener en
cuenta, por ejemplo, que muchas veces se trata de
una estimación de PR (cuando la página no está
indexada y existen otras muy similares) y que la
barra es una representación gráfica de unos valores
numéricos lineales (por ejemplo, para la barra es lo
mismo un valor de 15.627, que uno de 78.124).
|
PR entre...
|
PR que muestra la barra
|
| 0,00000001 y 5 |
1
|
| 6 y 25 |
2
|
| 26 y 125 |
3
|
| 126 y 625 |
4
|
| 626 y 3.125 |
5
|
| 3.126 y 15.625 |
6
|
| 15.626 y 78.125 |
7
|
| 78.126 y 390.625 |
8
|
| 390.626 y 1.953.125 |
9
|
| 1.953.126 e infinito |
10
|
Otra forma de conocer el PR es
mediante el directorio de Google (http://directory.google.com),
aunque nos encontraremos con los mismos “problemas”
que la Google Bar.
El algoritmo
Aunque pueda parecer complicado
llevar la idea del PR a la práctica, Larry Page y
Sergey Brin, los fundadores de Google, consiguieron
hacerlo mediante un algoritmo relativamente
sencillo. Cuando el PageRank fue creado, se publicó
su fórmula, pero desde entonces no se ha vuelto a
conocer. Seguramente se habrán producido pequeñas
variaciones, pero la base es la siguiente:
PR(A) = (1-d) + d (PR(T1)/C(T1) +
... + PR(Tn)/C(Tn))
PR(A) es el PR de la página A, PR (Ti) es el PR de
las páginas Ti que enlazan hacia A, C(Ti) es el
número de links de salida que hay en la página A y d
es un número entre 0 y 1.
El PR de una página T se pondera
con los links de salida (C(Ti)) de esa misma página.
Por lo tanto, cuantos más links de salida tenga,
menos se beneficiará la página A de un link en T.
Así pues, podemos observar que el PR viene definido
por la influencia individual de cada página y que no
todas afectan de la misma forma. Finalmente, la suma
de todos los PR ponderados se multiplica por d, un
valor entre 0 y 1.
|