¿Es correcto usar emojis en los metadatos?

Hoy te voy hablar sobre cómo Google usa NLP y Tokenización para entender el contenido que le estás entregando para ser indexado.

Este artículo nace como respuesta a las inquietudes de un buen amigo mío quien me preguntó si no había problema en colocar emojis sin espacios en los metadatos.

La respuesta corta es: no.

La respuesta larga es la tokenización y el Natural Language Processing que usa Google llamado BERT.

Vamos a profundizar ahora en esto con la respuesta larga.

¿Qué es el Natural Language Processing (NLP)?

Palabras más palabras menos lo podemos definir como el intento de las máquinas por entender el lenguaje humano.

Nosotros como seres humanos podemos comunicarnos con las máquinas gracias a los lenguajes de programación.

Hay diferentes tipos de lenguajes de programación:

Los de alto nivel: se caracterizan por ser fáciles de entender para los seres humanos. Por ejemplo: Python

Los de bajo nivel: no es un lenguaje de programación en concreto, es más un conjunto de ellos donde el más bajo es el código binario.

Hay lenguajes de programación llamados de nivel intermedio, pero para lo que nos ocupa nos basta con saber que el nivel más bajo al que un ser humano puede llegar para hablar con un ordenador es el código binario.

El código binario son conjuntos de ceros y unos que en secuencia se transforman en ordenes concretas para el ordenador.

Estás ordenes le dicen: si es 1 entonces hay voltaje y si es 0 entonces no hay voltaje.

Es así de simple.

Voltaje o no voltaje, esa es la base de las compuertas lógicas que hacen posible la computación.

¿Te das cuenta de algo en particular?

Es muy sencillo para nosotros llegar hasta el nivel más bajo con el que se puede hablar con una máquina.

Claro, nosotros las inventamos jeje.

El verdadero problema es cuando son ellas quienes intentan hablar con nosotros o entender que les hemos dicho sin usar un lenguaje de programación.

Inteligencia artificial y NLP

La inteligencia artificial ha hecho posible que las máquinas puedan entender qué les estamos diciendo aún cuando no estamos usando un lenguaje de programación.

Haz la prueba con Siri, Alexa o el Asistente de Google.

Puedes hablarles y estas inteligencias artificiales podrán entenderte.

Este último, el Asistente de Google es a quien le voy a dar más protagonismo de ahora en adelante, ya que es esta misma inteligencia artificial la que hace posible entender las búsquedas de los usuarios.

Google BERT y el NLP

Google BERT fue una actualización del algoritmo de Google que se creó pensando en beneficiar a los usuarios que hacen búsquedas ambiguas o que son demasiado específicas.

Estas búsquedas demasiado específicas también son llamadas «long tail«.

Lo que logró Google con esto fue comenzar a buscar palabras clave en contexto en lugar de hacer búsquedas basadas en coincidencia exacta.

Cambió el SEO para siempre y dio origen a lo que hoy conocemos como SEO semántico.

Lo que nadie advirtió es que sentaría las bases para lo que luego se llamó el «Google title update».

Un update muy peculiar donde Google ahora decide cuál es el título de tu página en los resultados de búsqueda basado en qué va a satisfacer mejor la intención de búsqueda del usuario.

Bien, ahora sabemos que Google no solo entiende las palabras clave en contexto, sino que también es capaz de crear el metatitulo según su criterio a partir de tu contenido.

Veamos ahora de qué va todo esto de la Tokenización.

¿Qué es la tokenización en NLP y cómo afecta esto al SEO?

Cuando «tokenizas» una cadena de texto la separas en todos sus componentes.

Así puedes separar precios, fechas, emojis y más caracteres aún cuando no existan espacios entre esos componentes que componen el texto.

Veamos de qué va esto y cómo afecta al SEO con un ejemplo práctico.

Digamos que tú deseas crear un artículo para rankear por esta keyword: las mejores cafeteras para casa 2022

Podrías diseñar una metatítulo de este estilo:

Las 10 mejores cafeteras para casa【2022】

Donde no hay espacio entre la palabra «casa» y el emoji «【» ya que el espacio que se muestra lo trae el mismo emoji.

Además de esto también se ha colado un «10» entre las palabras «las» y «mejores».

Si te preocupa que ahora Google no vaya a entender que tú la verdad estás tratando de rankear para «las mejores cafeteras para casa 2022» ya te digo yo que te preocupas por nada.

La técnica más básica de NLP es la tokenización y este metatítulo tokenizado luciría de la siguiente manera:

«Las»,

«10»,

«mejores»,

«cafeteras»,

«para»,

«casa»,

«【»,

«2022»,

«】»
Donde los espacios no figuran por ninguna parte y es extremadamente fácil para la inteligencia artificial entender que estás usando una combinación de números y letras para formar una palabra.

Donde el «10» es un número de cantidad, el «2022» es un número de fecha y los emojis se van a tomar por donde el Sol nunca les llega, porque no pertenecen a ningún idioma y no le dan sentido a la oración en caso de ser tomados en cuenta.

Así que ya sabes, usa emojis como si no hubiera un mañana que al final de todo a Google le suda la gallina joven que los uses o no, pero a los usuarios si les va a causar un efecto visual interesante que te aumente el CTR en las SERPs.

snell rojas

Soy Snell Rojas y vivo de hacer SEO

Me encanta escribir, investigar y cuando me llega la inspiración también dibujar. Soy licenciado en física de profesión, pero el SEO es mi verdadera pasión.

Si tienes alguna duda o pregunta me puedes escribir por tuiter (md o mención que da igual) igual en cuanto pueda te respondo.