¿Qué son las entidades?

Hasta ahora, Google ha dependido de los enlaces y las palabras clave para que el contenido salga a la superficie en los resultados de búsqueda, evitando la idea de que el mundo tuviera una especie de orden gigantesco, una jerarquía y unos principios de organización más grandes que el lenguaje… pero lo cierto es que sí lo tiene: ¡las entidades!

Las entidades son ideas o conceptos universales que existen más allá del lenguaje. Tal y como Dave Davies las describe en su artículo Google’s patents on entity relationships, una entidad no solo es una persona, un lugar o una cosa: es eso y sus características. Estas características están conectadas mediante relaciones. Si lees una patente de Google, se refieren a las entidades como “nodos”, y a las relaciones como “edges”.

Teniendo eso en cuenta, el conocimiento de las entidades es un proceso a través del cual Google llega a entender y organizar las relaciones entre diferentes nodos y edges – o, más claramente, diferentes pensamientos, conceptos, ideas y cosas y sus descriptores que las modifican. Las organizan en una jerarquía de relaciones que es lo que nosotros vagamente conocemos como el Knowledge Graph de Google. De alguna forma está relacionado al conocimiento semántico, pero el conocimiento semántico se basa en el lenguaje y este es uno de los pasos que le preceden, más conceptual y universal.

Las entidades pueden describirse con palabras clave. También con fotos, sonidos, olores, sentimientos y conceptos. Piensa en el sonido de una estación de tren… evoca un concepto universal para cualquiera que lo oiga, sin necesidad de una palabra. Un índice unificado que se base en entidades, elimina la necesidad de Google de ordenar la montaña gigantesca de lenguas que hay en el mundo, en constante evolución junto con sus palabras clave.

El valor de las entidades puede ser complejo de entender, pero desde la perspectiva de la eficiencia en la búsqueda, es preciso insistir en él.

Internet ha cambiado el modo en el que entendemos el conocimiento; ahora, puede parecernos ilimitado, imperceptible e interminable… pero desde el punto de vista de un motor de búsqueda no es del todo así. Mientras el potencial del conocimiento puede ser infinito, el número de ideas que podemos describir, que se buscan en Internet y que se discuten con regularidad, es limitado. Hasta tal punto es limitado que solía caber en una enciclopedia o en una biblioteca.

Durante muchos años, las bibliotecas indexaban todo el conocimiento del que disponían y albergaban más información de la que cualquier humano puede leer en toda una vida. Es a esta limitación a la que debemos aproximarnos cuando intentemos entender las entidades desde el punto de vista de un motor de búsqueda.

Desde el punto de vista del motor de búsqueda

Es importante entender que los dominios pueden ser entidades, pero que a menudo tienen entidades más grandes detrás, como son las marcas. Indexar en base a entidades es lo que le va a permitir a Google agrupar todas las páginas web internacionales de una misma marca bajo una entidad, y mostrarle al usuario la adecuada bajo criterios de ubicación y lengua, tal y como John Mueller describe en el siguiente párrafo, extraído de un hilo de Ask Me Anything en Reddit:

El atributo rel-alternate-hreflang puede ser muy útil en webs internacionales, especialmente cuando tienes muchos países con el mismo idioma. No cambia los rankings, pero ayuda al usuario a obtener la URL correcta. Es solo cuestión de idiomas, a menudo podemos adivinar el idioma de la consulta y qué páginas de tu web encajan mejor. Si buscas zapatos azules en inglés (blue shoes) mostraremos la página en inglés y si la consulta es “blaue schuhe”, mostraremos la que está en alemán. Sin embargo, si alguien busca tu marca, el idioma de la consulta no se desvela. De la misma forma, si tienes páginas en el mismo idioma para diferentes países, entonces hreflang sí que es útil.

Antes de la indexación «Entity-First», la versión internacional adecuada de la web habría sido determinada por factores algorítmicos incluyendo enlaces, porque las páginas no estaban agrupadas bajo la marca y evaluadas como una entidad. Antes, costaba mucho trabajo obtener la versión ccTLD correcta de un site para clasificarse bien en diferentes países, incluso utilizando los ajustes de Search Console.

Con un poco de suerte, esto quedará resuelto.

Fotografía del artículo: @moroo
Visita el contenido original (en inglés).

Leave a Reply