PageRank

Da Wikipedia, a enciclopedia libre.
Ir á navegación Ir á busca
Esquema do sistema PageRank

PageRank é un algoritmo de análise que asigna un peso numérico a cada elemento dun conxunto de documentos conectados por medio de hipervínculos , por exemplo o conxunto de páxinas da World Wide Web, co obxectivo de cuantificar a importancia relativa do interior do propio conxunto. .

O algoritmo pódese aplicar a todos os conxuntos de obxectos ligados por citas e referencias mutuas. O peso numérico asignado a un determinado elemento E tamén se denomina "o PageRank de E", rubricado en PR (E). O algoritmo PageRank foi patentado ( patente estadounidense 6285999 ) pola Universidade de Stanford ; tamén é un termo que entrou de facto no léxico dos usuarios dos servizos ofrecidos polos motores de busca. O nome PageRank é unha marca comercial de Google e o seu nome débese a Larry Page [1] , un dos dous fundadores desa compañía.

En 2008, o vicepresidente de Google, Udi Manber, escribiu que PageRank é "a parte máis importante do algoritmo de clasificación de Google". [...] " PageRank segue a empregarse (nas avaliacións de clasificación de sitios web), pero pasou a formar parte dun sistema moito máis avanzado."

Hai tempo que PageRank xa non é o único parámetro co que o algoritmo de posicionamento de Google sitúa os sitios web dentro das súas Páxinas de resultados , aínda que segue sendo, segundo os investigadores, o principal [2] (hai que ter en conta que o estudo en cuestión é de 2013 ). Tamén debemos lembrar un dato aínda máis importante: o algoritmo tenta definir, non determinar, o "valor" dunha páxina web; de feito, en xeral, o algoritmo identifica unha correlación , polo que non se debe facer crer que a actividade do algoritmo xera unha relación causa-efecto ("a correlación non implica causalidade"). [3]

Elementos xerais

Literalmente traducible como o rango dunha páxina web (pero tamén un xogo de palabras ligado ao nome dun dos seus inventores, Larry Page ), PageRank pode remontarse facilmente ao concepto de popularidade propio das relacións sociais humanas e indica ou promete para indicar as páxinas ou sitios de maior relevancia en relación cos termos buscados. Os algoritmos que permiten indexar o material presente na rede tamén utilizan o grao de popularidade dunha páxina web para definir a súa posición nos resultados da busca.

Este método pódese describir como análogo a unhas eleccións nas que calquera que poida publicar unha páxina web ten dereito a voto e o voto exprésase a través das ligazóns da mesma. Os votos non todos teñen o mesmo peso: as páxinas web máis populares expresarán, cos seus enlaces , votos de maior valor.

Non obstante, a interpretación e definición da popularidade dun sitio non só están ligadas a estes votos , senón que tamén teñen en conta a relevancia do contido dunha páxina, así como das páxinas relacionadas, cos termos e criterios da busca. levado a cabo. Outro elemento importante que vincula un sitio á súa popularidade está relacionado coa difusión, a popularidade do tema tratado nel. Para temas non solicitados, os sitios alcanzan facilmente as primeiras posicións nas buscas, pero é igualmente probable que posúan e manteñan un rango que podería ser moi baixo. Todo isto permite, ou polo menos ten o propósito, realizar un control cruzado que garanta a validez dos resultados da busca.

Ver a popularidade dun sitio

Para obter información sobre, por exemplo, a notoriedade dunha páxina web en Google, é posible instalar a barra de ferramentas de Google no navegador ou utilizar servizos ofrecidos por terceiros capaces de determinar esta información e que se poden implementar nos sitios web. Para aumentar o rango de páxinas podes aproveitar algúns pequenos trucos. Un dos máis usados ​​é tratar de atraer a atención dos usuarios que estean interesados ​​en temas relacionados co noso sitio ou blog.

O obxectivo é conquistar aos usuarios que están realmente interesados ​​en seguir as nosas publicacións. Isto utilízase para confirmar unha das regras de Google: as ligazóns que poden apuntar a un sitio deben ser "naturais", é dicir, non requiridas nin xeradas polo intercambio de ligazóns nin de pago. Se Google nota que un sitio fai solicitudes que non respectan as regras do motor de busca, penalízao de inmediato, incluso prohibindo ao propietario que vai en contra das regras de conduta asinadas ao rexistrarse no servizo de buscadores [4] . Para tentar obter ligazóns naturais, é necesario propoñer temas que sempre se actualizan, non se copian, con ideas interesantes para os usuarios do servizo web.

Fórmula simplificada

O algoritmo completo para o cálculo de PageRank fai uso da teoría do proceso de Markov e está clasificado na verdadeira categoría de algoritmos de clasificación de análise de ligazóns . A partir da fórmula desenvolvida inicialmente polos fundadores de Google, Sergey Brin e Larry Page , é posible comprender como se distribúe PageRank entre páxinas:

Onde está:

  • PR [A] é o valor PageRank da páxina A que queremos calcular.
  • N é o número total de páxinas coñecidas.
  • n é o número de páxinas que conteñen polo menos unha ligazón a A. P k representa cada unha desas páxinas.
  • PR [P k ] son os valores de PageRank de cada páxina P k .
  • C [P k ] son o número total de ligazóns contidas na páxina que ofrece a ligazón.
  • d (factor de amortiguamento) é un factor decidido por Google e que na documentación orixinal asume un valor de 0,85. Google pode axustalo para decidir a porcentaxe de PageRank que debe pasar dunha páxina a outra e o valor mínimo de PageRank atribuído a cada páxina do arquivo.

Pola fórmula, polo tanto, é evidente que a medida que aumenta o número total de ligazóns dos sitios que apuntan a A, aumenta o PageRank.

Nota

  1. ^ Google Press Center: Fun Facts , en google.com , 24 de abril de 2009. Consultado o 4 de maio de 2015 (arquivado dende o orixinal o 24 de abril de 2009) .
  2. ^ Enquisas e datos de correlación dos factores de clasificación do motor de busca de 2013 - Moz , en moz.com . Consultado o 4 de maio de 2015 .
  3. Correlation and Causation , en wikiversity.org . Consultado o 27 de agosto de 2015 .
  4. ^ Isto suporía varios problemas relacionados co uso de servizos comerciais como a publicidade do propietario do sitio que tamén podería correr o risco de non estar incluído no circuíto de Google.

Elementos relacionados

Outros proxectos

Ligazóns externas