viernes, 4 de enero de 2008

La PageRanking de Google

  • PageRank es una marca registrada y patentada por Google el 9 de enero de 1999 que ampara una familia de algoritmos utilizados para asignar de forma numérica la relevancia de los documentos (o páginas web) indexados por un motor de búsqueda.
  • Sus propiedades son muy discutidas por expertos en optimización de motores de búsqueda.
  • El sistema PageRank es utilizado por el popular motor de búsqueda Google para ayudarle a determinar la importancia o relevancia de una página.
  • Fue desarrollado por los fundadores de Google, Larry Page y Sergey Brin, en la Universidad de Stanford.
  • El algoritmo inicial del PageRank[1] lo podemos encontrar en el documento original donde sus creadores presentaron el prototipo de Google:
  • “The Anatomy of a Large-Scale Hypertextual Web Search Engine”:
  • PR(A) = (1 − d) + d(PR(T1) / C(T1) + … + PR(Tn) / C(Tn)
  • Donde PR(A) es el PageRank de la página A;PR(Ti) es el PageRank de las páginas Ti que enlazan a A,;
  • C(Ti) es el número de enlaces salientes de la página Ti;
  • y d es un factor variable que puede estar entre 0 y 1.
  • PageRank confía en la naturaleza democrática de la web utilizando su vasta estructura de enlaces como un indicador del valor de una página en concreto.
  • Google interpreta un enlace de una página A a una página B como un voto,
  • de la página A, para la página B.
  • Pero Google mira más allá del volumen de votos, o enlaces que una página recibe;
  • también analiza la página que emite el voto.
  • Los votos emitidos por las páginas consideradas “importantes” valen más, y ayudan a hacer a otras páginas “importantes”.
  • Es decir, el puesto de una página es el resultado de una “votación” entre todas las demás páginas de la World Wide Web acerca del nivel de importancia que tiene esa página.
  • Un hiperenlace a una página cuenta como un voto de apoyo.
  • El PageRank de una página se define recursivamente y depende del número y PageRank de todas las páginas que la enlazan.
  • Una página que está enlazada por muchas páginas con un PageRank alto consigue también un PageRank alto.
  • Si no hay enlaces a una página web, no hay apoyo a esa página específica.
  • El PageRank de la barra de Google va de 0 a 10.
  • Diez es el máximo PageRank posible y son muy pocos los sitios que gozan de esta calificación,
  • 1 es la calificación mínima que recibe un sitio normal,
  • y cero significa que el sitio ha sido penalizado o aún no ha recibido una calificación de PageRank [2] .
  • Parece ser una escala logarítmica.
  • Los detalles exactos de esta escala son desconocidos.
  • Una alternativa al algoritmo PageRank propuesto por Jon Kleinberg,
  • es el algoritmo HITS.
  • A continuación os adjunto un gráfico de Search Engine Land
  • para que podais ver más claramente la estructura.

No hay comentarios: