- PageRank es una marca registrada y patentada por Google el 9 de enero de 1999 que ampara una familia de algoritmos utilizados para asignar de forma numérica la relevancia de los documentos (o páginas web) indexados por un motor de búsqueda.
- Sus propiedades son muy discutidas por expertos en optimización de motores de búsqueda.
- El sistema PageRank es utilizado por el popular motor de búsqueda Google para ayudarle a determinar la importancia o relevancia de una página.
- Fue desarrollado por los fundadores de Google, Larry Page y Sergey Brin, en la Universidad de Stanford.
- El algoritmo inicial del PageRank[1] lo podemos encontrar en el documento original donde sus creadores presentaron el prototipo de Google:
- “The Anatomy of a Large-Scale Hypertextual Web Search Engine”:
- PR(A) = (1 − d) + d(PR(T1) / C(T1) + … + PR(Tn) / C(Tn)
- Donde PR(A) es el PageRank de la página A;PR(Ti) es el PageRank de las páginas Ti que enlazan a A,;
- C(Ti) es el número de enlaces salientes de la página Ti;
- y d es un factor variable que puede estar entre 0 y 1.
- PageRank confía en la naturaleza democrática de la web utilizando su vasta estructura de enlaces como un indicador del valor de una página en concreto.
- Google interpreta un enlace de una página A a una página B como un voto,
- de la página A, para la página B.
- Pero Google mira más allá del volumen de votos, o enlaces que una página recibe;
- también analiza la página que emite el voto.
- Los votos emitidos por las páginas consideradas “importantes” valen más, y ayudan a hacer a otras páginas “importantes”.
- Es decir, el puesto de una página es el resultado de una “votación” entre todas las demás páginas de la World Wide Web acerca del nivel de importancia que tiene esa página.
- Un hiperenlace a una página cuenta como un voto de apoyo.
- El PageRank de una página se define recursivamente y depende del número y PageRank de todas las páginas que la enlazan.
- Una página que está enlazada por muchas páginas con un PageRank alto consigue también un PageRank alto.
- Si no hay enlaces a una página web, no hay apoyo a esa página específica.
- El PageRank de la barra de Google va de 0 a 10.
- Diez es el máximo PageRank posible y son muy pocos los sitios que gozan de esta calificación,
- 1 es la calificación mínima que recibe un sitio normal,
- y cero significa que el sitio ha sido penalizado o aún no ha recibido una calificación de PageRank [2] .
- Parece ser una escala logarítmica.
- Los detalles exactos de esta escala son desconocidos.
- Una alternativa al algoritmo PageRank propuesto por Jon Kleinberg,
- es el algoritmo HITS.
- A continuación os adjunto un gráfico de Search Engine Land
- para que podais ver más claramente la estructura.
viernes, 4 de enero de 2008
La PageRanking de Google
Suscribirse a:
Enviar comentarios (Atom)
No hay comentarios:
Publicar un comentario