Hoy en día, no podríamos imaginar internet (ni nuestra vida) sin Google. Google es una de las plataformas más importantes y conocidas.
Su origen fue en 1996 en Standford, donde dos estudiantes llamados Larry Page y Sergey Brin construyeron un motor de búsqueda que utilizaba enlaces para determinar relevancia de cada página en la Web.
Inicialmente se llamó Backrub, pero poco después pasó a llamarse como ahora lo conocemos: Google. ¿De dónde proviene el nombre de Google? Proviene de un número ya mencionado, el Googol (10100), un número gigante que representa a la cantidad de información que pretende esta entidad organizar.
En agosto de 1998, Larry y Sergey obtuvieron un cheque de 100000 dólares de mano de Andy Bechtolsheim, lo cual les permitió construir oficialmente Google y crear su primera oficina en un garaje.
Rápidamente Google fue creciendo: incorporó ingenieros, un equipo de ventas y hasta al primer perro de la empresa Yoshka.
Cambiaron el garaje por la actual sede Googleplex en California y fueron evolucionando hasta convertirse en mucho más que un buscador. Gmail (correo electrónico), Youtube (vídeos) o Google Maps son ejemplos de plataformas que pertenecen a Google.
Pero, ¿cómo busca y prioriza Google unas páginas frente a otras? Las matemáticas tienen la respuesta.
El algoritmo de Google es el encargado de buscar, clasificar y ordenar los resultados más relevantes en base a las búsquedas. Los algoritmos que posee no son fijos, sino que van cambiando adaptándose a los usuarios, evitando spam y sin llegar a dejar a Google desactualizado.
El algoritmo Page Rank es uno de los más populares entre los algoritmos de búsqueda. Este algoritmo se basa en la idea de que se puede juzgar la importancia de una página web mediante las páginas que contienen un vínculo hacia la misma.
Antes que nada, debemos saber que un grafo es un conjunto de puntos (nodos) y líneas (aristas) que indican relación entre ellos. Los grafos pueden ser dirigidos, indicándonos quién sigue a quién.
Los nodos son las páginas web, y los vínculos entre ellas son los hipervínculos que dirigen al usuario desde una página hacia otras. Al empezar a buscar algo en la web, se comienza por una página web. De no encontrar lo que se busca en esa página, se puede comenzar de nuevo desde el buscador o navegar por la red siguiendo los hipervínculos presentes en la página en la que nos encontramos. Ahí es donde comenzaríamos a movernos entre los nodos mediante las aristas.
La elección de un vínculo de la página dependerá del número que esta disponga. En el grafo representado, de lapag.1 únicamente podríamos ir a la dos pero, sin embargo, de la tres podríamos ir a la 1 o a la 4.
Para poder sacar conclusiones es necesario pasarlo a una matriz, y para ello se realiza una tabla, con filas (nodos de partida) y columnas (nodos de llegada) que representa numéricamente el vínculo de cada página.
Una página no puede tener vínculo con ella misma: valor 0
Paginas 1->2 y 2->3 poseen un único vínculo entre ellas: valor 1
Página 3 posee 2 vínculos (con 1 y con 4): valor ½ , un vínculo de dos para cada página.
Página 4 no posee vinculos: valor 0
De este modo el grafo quedaría así:
Que pasado a matriz:
En la ultima fila, entraríamos en un callejón sin salida, por lo que imaginemos hilos virtuales que conecten 4 con 1 2 3 además de la posibilidad de quedarse en 4. Con esto, dejaríamos la tabla tal que así:
La tabla quedaría modificada ya que entra un factor en juego: probabilidad de seguir el vínculo de la página. Aplicando esta probabilidad (85%) y haciendo que cada fila siga sumando 1, de la matriz resultante nos puede aportar la información de que página es más importante.
Para ello aún nos quedarían unos cuantos cálculos matemáticos más, inventando una serie de valores desconocidos y resolviendo su valor. El valor resultando a estas incógnitas nos indicará el peso de cada página: el de mayor valor será la página de mayor relevancia
En Cuentos cuánticos lo explican paso a paso desde cómo llegar a la matriz hasta la resolución de las incógnitas.
Google, además de este método, tiene herramientas secretas. Revelar su fórmula facilitaría el trabajo a quienes intentan manipular las búsquedas de los usuarios. ya que no se conoce como asigna las probabilidades de visita asociadas a cada navegante.
En la vida real también entra en juego el dinero, pagando te puedes posicionar entre las primeras páginas de búsqueda.
Con todo esto podemos deducir que incluye multitud de enlaces, podríamos destacar en Google frente a otras páginas, pero no. Google no es una empresa simple ni poco inteligente y penalizan el linkspam. Además, en la actualidad los resultados de búsqueda son personalizados teniendo en cuenta búsquedas anteriores, es decir, dos personas indicando las mismas palabras cada uno en su cuenta de Google obtendrán páginas principales diferentes.
Muy bien, Joana :)
ResponderBorrar