Factores de relevancia SEO

Factores de relevancia para el SEO

Los buscadores como Google, Yandex o Baidu identifican determinadas señales como factores de relevancia para determinar qué contenidos son adecuados para una búsqueda y cuáles deberían ocupar las primeras posiciones en sus resultados.

Tradicionalmente, se ha hablado de factores de relevancia on-page, relacionados con el propio contenido y programación del sitio web, y factores de relevancia off-page, relacionados con su autoridad y popularidad.

En los últimos años, los buscadores han enriquecido estos factores básicos con señales de calidad a partir del análisis semántico de los contenidos, la personalización de los resultados, el análisis de la experiencia del usuario tras visitar distintos resultados alternativos o de la aplicación de técnicas de inteligencia artificial y aprendizaje automático.

Factores de relevancia on-page

Los buscadores se fijan especialmente en ciertos aspectos del contenido para clasificar las páginas que rastrean. Una página será unbuen resultado si responde a la intención de búsqueda del usuario. Por ejemplo, una página con un listado de pisos en Alicante será un buen resultado para un usuario que introdujo la consulta «pisos en Alicante».

Aunque los algoritmos de los buscadores son secretos y están en permanente evolución, las páginas mejor posicionadas suelen compartir determinados criterios:

  • Las palabras de la búsqueda se repiten más. Es decir, en el ejemplo anterior, probablemente la expresión «pisos en Alicante» se repite varias veces en la página. Es lo que llamamos densidad de palabra clave. Aunque parecería fácil suponer que cuanto más repitamos la palabra clave, mejor posición obtendremos, cuando el texto deja de sonar natural podemos ser penalizados por sobreoptimización (keyword spamming).
  • La palabra clave aparece pronto en la página.
  • Si la consulta es una frase de varias palabras, las páginas mejor posicionadas suelen incluirlas en el mismo orden y próximas unas a otras.
  • Si el contenido cuenta con un título, un encabezamiento principal y/o encabezamientos de subsecciones, la palabra clave suele aparecer en uno o varios de estos títulos o encabezamientos.
  • Si el contenido cuenta con alguna imagen, la palabra clave suele aparecer incluida como texto alternativo de la imagen (atributo alt).
  • La palabra clave y otras de su mismo campo semántico están presentes en el texto: sinónimos, reformulaciones, expresiones análogas, etc.
  • La palabra clave aparece en enlaces internos o externos que apuntan a la página.

Estos son algunos de los factores de relevancia básicos on-page. Además del propio contenido, la programación del sitio web, las plantillas html empleadas o la rapidez de descarga del servidor (que podemos probar con PageSpeed Insights) son también factores de relevancia on-page fácilmente optimizables, pues no necesitamos de la ayuda de otros para mejorarlos.

Aunque por sí solos no implican un posicionamiento mejor, aplicar el marcado de datos estructurados facilita la comprensión de nuestro contenido por parte de un buscador al añadir una capa semántica al código html. La definición de las características y atributos que podemos marcar de forma estructurada se recoge en el sitio web schema.org. A través de su buscador, podemos identificar los esquemas y propiedades más adecuados para cada tipo de contenido: noticias, contenidos de blog, productos, libros, recetas, vuelos, hoteles, etc.

En algunos casos, el marcado de datos estructurados propicia la inclusión de fragmentos enriquecidos en los resultados de Google, lo cual aporta una mayor visibilidad y probabilidad de lograr un click.

Una vez resueltos los problemas técnicos de un sitio web, la optimización se concentra en mejorar la relevancia de sus contenidos, analizando las consultas más populares, asegurándonos de incluirlas en las áreas más importantes de la página y mejorando la programación y velocidad de descarga de nuestro servidor.

Factores de relevancia off-page

Como los factores de relevancia on-page son fácilmente optimizables, las primeras técnicas de SEO black-hat abusaron de ellos para lograr mejores posiciones. Por ejemplo, incluyendo palabras clave en todos los encabezamientos, ocultándolas en contenido invisible para los usuarios o como texto alternativo de todas las imágenes.

Los creadores de Google, Larry Page y Sergey Brin, incorporaron al algoritmo de su buscador un método para contrastar y validar la calidad de los contenidos aplicando un método ampliamente utilizado en el mundo académico: registrar el número de citas obtenidas por un determinado estudio o artículo.

La forma de aplicarlo a la web fue calcular el valor de un contenido a partir del número y calidad de los enlaces que apuntan al mismo. Este componente del algoritmo, inicialmente denominado Rub my back se bautizó posteriormente como PageRank en honor a Larry Page.

Google fue el primer buscador que utilizó los enlaces entrantes como señales de calidad de un contenido. Estas señales son los denominados factores de relevancia off-page.

Aunque inicialmente todos los enlaces mejoraban en mayor o menor medida el posicionamiento de un contenido, el abuso en la creación artificial de enlaces con el único propósito de engañar a los buscadores los llevó a perfeccionar sus algoritmos para detectar cuándo los enlaces que apuntan a una página han podido ser obtenidos a cambio de un pago y no son, por tanto, una recomendación genuina. Actualizaciones del algoritmo de Google como Caffeine o Penguin tuvieron como objetivo detectar este tipo de técnicas black-hat y penalizarlas.

Las crecientes exigencias de calidad en los enlaces exigen una cierta coherencia temática entre las páginas de origen y destino. Asimismo, la valoración de la popularidad de un dominio se centra hoy en su autoridad temática. Es decir, sobre qué temas es relevante en función de la temática de los contenidos de los cuales ha obtenido enlaces.

A finales de 2012, Google dejó de actuar y publicar el valor del PageRank de cada dominio. Por ello, hoy recurrimos a otros indicadores para medir la popularidad y la autoridad de un determinado dominio, subdominio, ruta o URL. Algunos de los más comúnmente aceptados son el Trust Follow de Majestic o el Authority Score de SEMrush.

Factores del comportamiento post-búsqueda

Además de los factores on-page y off-page, en los últimos años los buscadores también emplean como indicios de relevancia determinadas señales relacionadas con la satisfacción del usuario con un determinado resultado de búsqueda.

Por ejemplo, si un usuario visita un resultado tras una búsqueda y el contenido no le resulta satisfactorio, es probable que vuelva a la página de resultados para buscar la respuesta para visitar otra página.

Llamamos a esto «click corto» o short-click, en relación al corto tiempo que el usuario navegó por el sitio web inicial. Y sospechamos que podría ser una de las señales empleadas por Google para identificar patrones comunes de los sitios web que no responden a la intención de búsqueda de los usuarios y «aprender» a partir de ellos.

Además de los click cortos, Google también podría estar utilizando datos de navegación como los que la mayoría de usuarios autorizan a compartir a través del navegador Google Chrome, por ejemlo.

La experiencia demuestra cómo el orden en que se muestra un determinado resultado se ve afectado por la intención de búsqueda de los usuarios y en qué medida el contenido presentado se adecúa y satisface sus necesidades.

No parece, pues, suficiente cumplir ciertos criterios de relevancia repetir un determinado número de veces la palabra clave o lograr un cierto número de enlaces. Google es capaz de detectar si un determinado enlace es empleado por los usuarios para visitar otro contenido o si dicho contenido realmente responde a la intención de búsqueda de los usuarios, y tiene en cuenta estos aspectos para su posicionamiento.

Factores relacionados con el contexto

El orden en que un buscador muestra sus resultados no es el mismo para todos los usuarios, es decir, no depende exclusivamente de los factores de relevancia que hemos visto hasta ahora. También se ve afectado por otros factores relacionados con el contexto:

  • Geolocalización del usuario: por ejemplo, google nos presentará resultados distintos si buscamos «restaurante» desde Madrid, Barcelona o París. Google entiende la intención de búsqueda local.
  • Actualidad: cuando buscamos un tema de actualidad, como información sobre un sorteo, un partido de fútbol o un accidente, Google detecta la necesidad de acceder a la última información disponible sobre el tema consultado. Por tanto, priorizará aquellos contenidos que se hayan actualizado más recientemente. Es lo que se denomina QDF, de Query deserves freshness y tiene un especial impacto en el SEO de medios online.
  • Personalización: Google almacena todas nuestras búsquedas y sitios visitados. Con esa información, construye un «historial de búsqueda» que afecta a los resultados de cada persona. También el dispositivo empleado (ordenador, tableta o móvil) o la conexión afectan a los resultados.

Inteligencia artificial y aprendizaje automático

En octubre de 2015, Google desveló su aplicación de procesos de inteligencia artificial como un complemento a su algoritmo de clasificación tradicional. Denominó a estos procesos RankBrain y según Google, consistía en la aplicación de inteligencia artificial y aprendizaje automático para interpretar búsquedas planteadas en lenguaje coloquial
o desconocidas hasta ese momento.

En 2018, Google desplegó un refinamiento adicional relacionado con su comprensión de las intenciones de búsqueda subyacentes a un conjunto de consultas concreto. Es lo que se denomina neural matching y lo define como un sistema de inteligencia artificial para entender la intención de búsqueda del usuario independientemente de la consulta concreta introducida en la búsqueda.

RankBrain ayuda a Google a relacionar mejor determinados contenidos con un concepto mientras que neural matching relaciona mejor las palabras con la intención de búsqueda. La evolución de Google en los últimos años parece indicar que cumplir con los factores de relevancia on-page y off-page clásicos seguiría siendo una condición necesaria para lograr la indexación y correcta clasificación de un contenido pero ya no suficiente para su posicionamiento en las primeras posiciones.

Qué es un algoritmo: así se combinan todos los factores

Cuando hablamos de buscadores mencionamos frecuentemente la palabra algoritmo pero, ¿qué es exactamente un algoritmo? Un algoritmo es un conjunto de operaciones matemáticas para encontrar la olución a un problema. Los buscadores emplean algoritmos para clasificar los contenidos, calcular la relevancia relativa de cada uno de ellos para una búsqueda determinada y ordenar los resultados.

El algoritmo puede incluir condiciones sencillas de comprender cómo atribuir una determinada puntuación en el cálculo de relevancia a un contenido si incluye una determinada palabra clave en el cuerpo de texto o en los encabezamientos hasta condiciones mucho más complejas. Cada uno de los factores de relevancia es ponderado y se juega con su peso relativo respecto a todos los demás para hallar un determinado valor de relevancia. Según Google, su algoritmo incluye más de doscientos factores de relevancia distintos y experimenta constantemente para mejorar el ratio de éxito del mismo al identificar el contenido más útil para una determinada intención de búsqueda.

Dado que un algoritmo, por muy complejo que sea, es un conjunto de operaciones matemáticas, hay corrientes del SEO que se han tratado de aplicar ingeniería inversa (reverse engineering) para así manipular los resultados. Google ha ido incorporando mejoras en su algoritmo, como Caffeine, Panda o Penguin, para detectar estas técnicas abusivas y neutralizarlas o incluso penalizarlas.

Aunque Google emplea inteligencia artificial para evolucionar su algoritmo y mejorar la forma en que clasifica y ordena los resultados, al final son las personas las que realmente deciden cuándo los resultados son de mejor calidad o no. Por ello, Google mide constantemente en qué medida los usuarios muestran indicios de satisfacción con los resultados ofrecidos en experimentos y tests con los que miden si un determinado cambio implica una mejora en dicho comportamiento.

Adicionalmente, Google cuenta con un equipo de calificadores de calidad de los resultados de búsqueda cuya tarea consiste en realizar búsquedas programadas, visitar los contenidos y evaluar en qué medida dichos contenidos satisfarían la necesidad que se deriva de dicha intención de búsqueda.