lunes, 9 de junio de 2008

PageRank de Google

Alien [blackhat4all@gmail.com]

Por suerte, vivimos en un mundo en el que prolifera la información. En las redes se puede encontrar todo tipo de información, solo es necesario saberla buscar.

Sin embargo, esta cada vez más creciente fuente de recursos se ha vuelto una verdadera tela de araña. Pero no de la que se suele ver en las películas de Spiderman, o la que se tatúa en los cuerpos de las personas. La red a la que me refiero es como la que ve en los techos de las casas, como la que teje una araña loca que no sabe si va a hacer una telaraña o un abrigo.

Buscar un contenido determinado en ese universo de posibilidades resultaría un verdadero infierno si no se cuenta con la ayuda de un software que permita indexar el contenido y hacer que lo que demoraría días aparezcan en cuestión de segundos.

En este caso, espero que coincidan conmigo en que el mega buscador por preferencia está en manos de Google, quien no solo nos muestra el contenido que estamos buscando y similares, sino que es capaz de ordenar la información haciendo que aparezca entre las primeras opciones la página que se supone sea la más accedida y por lo tanto la que mejor y más información brinda al respecto.

A este método de organización se le denomina PageRank, y será sobre el mismo que tratará este artículo.

La Web

En Internet coexisten millones de páginas las cuales se agrupan en distintos grupos. Algunas hablan sobre informática, otras sobre animales, otras sobre literatura… En fin, que tratar de generar un método que de a cada página un valor con el que pueda competir con el resto de la Web no es nada fácil.

Para que entiendan mejor el problema que se crea a la hora de asignar los valores, tomemos por ejemplo tres páginas nacionales:
Infomed
La página del Hospital Ameijeiras
El foro del Vanguardia
El joven club de las tunas

Las dos primeras son sobre medicina y las otras dos mayoritariamente sobre informática.

Como el Ameijeiras pertenece a la red de salud y en este caso el mayor exponente es Infomed, se supone que el valor asignado a esta página sea menor que el de Infomed. y por ser el foro del Vanguardia más visitado que el joven club de la tunas, este tendrá mayor valor. Visto de esta forma, al hacer una comparación entre los dos primeros o los dos segundos no habrá ninguna dificultad en saber cual está por encima del otro, pero si se busca un contenido que por casualidad esté en las cuatro páginas, ¿Cuál estaría en primer lugar?, ¿Quién quedaría de último?

Este tipo de problemas se presenta a menudo en la red. En este caso hemos simplificado el problema a tan solo 4 páginas y los criterios para escoger el de mayor puntuación se limitan tan solo a la cantidad de visitas que reciba cada página.

El PageRank de Google es mucho más complejo que esto, y los criterios para seleccionar la mejor página son muchos más. En este caso trataremos sobre uno en específico: Los vínculos.

Por lo general una página alojada en cualquier servidor es referenciada por otras, y esta a la vez señala a otras páginas más.

De forma similar se van pasando los valores de página a página.
Una web que tenga puntuación 10 y apunte hacia 5 direcciones, está donando 2 puntos a cada página a la que hace referencia, aumentando con esto el valor de las mismas.

De esta forma, lo más importante no es la cantidad de sitios que apuntan al nuestro, sino el valor de los mismos y la cantidad de link que tienen.

Nota: Aquí se puede ver como una página, referenciada por otras páginas de alto Pagerank, puede tener un valor superior incluso que las páginas que hacia ella apuntan.

Trampas en PageRank

Ya hemos hablado en otras ocasiones sobre algunas “cositas” que se pueden hacer para mejorar nuestra posición dentro del buscador hemos aclarado en todos los caso que los intentos fraudulentos por elevar nuestra posición pueden ser penados por el buscador, no obstante, siempre podemos tratar de sacar provecho de la situación.

Como dijimos anteriormente, nuestro sitio se beneficiará más según esté señalado por mejores webs. si queremos subir nuestra posición de una forma segura, una alternativa podría ser tratar de subir la posición de las páginas que hacia nuestro sitio apuntan.

Este efecto se puede lograr de una forma sencilla, sin muchas complicaciones y lo mejor: segura. Cualquier detección de fraude por parte de Google penalizará a la página que estamos tratando de beneficiar y no a la nuestra y, aunque a la larga nos afecta, pues perdemos varios puntos, nos mantendremos “en competencia”.

También podemos ayudar a otros a subir su posición si donamos todos nuestros puntos a esa otra página. Para esto bastará con tener un solo link en nuestro sitio, y ya con eso todos los tantos que nos sean asignados a nosotros serán transferidos hacia la página secundaría.

Si esta segunda página sigue propagando los votos hacia otra y esa otra a otra y esa… y luego a nosotros, eso puede ser interpretado como granja de vínculos, y con esto convertirse todas estas webs en candidatas segura a la eliminación, así que cuidado!!.

Dont’n do that

Los bot’s, que son los encargados de entrar a cada página y ver los vínculos que esta tiene, no leen la página, sino que analizan el código. De esa forma puede ser válido para ellos incluso el contenido que se encuentra enmarcado como comentario u oculto.

Esto puede ser aprovechado por ciertas personas para darles a sus página un valor adicional. Aunque no es común, se puede ver cierto virus cuya misión es entrar en servidores y colocar en medio de la página un link hacia un sitio determinado, con lo que estarían elevando esa web al infinito (y más allá.)



Artículos relacionados


No hay comentarios: