Se ha desarrollado un descodificador basado en inteligencia artificial capaz de traducir la actividad cerebral en un flujo continuo de texto, en un avance que permite por primera vez leer los pensamientos de una persona de forma no invasiva.
El descodificador pudo reconstruir el habla con una precisión asombrosa mientras las personas escuchaban una historia -o incluso la imaginaban en silencio- utilizando únicamente datos de resonancia magnética funcional.
Los anteriores sistemas de descodificación del lenguaje requerían implantes quirúrgicos, y este último avance abre la perspectiva de nuevas formas de restablecer el habla en pacientes con dificultades para comunicarse a causa de un ictus o una enfermedad neuronal motora.
Una resonancia en tiempo real, el gran reto
El logro supera una limitación fundamental de la IRMf, y es que, aunque la técnica puede cartografiar la actividad cerebral en un lugar concreto con una resolución increíblemente alta, existe un desfase temporal inherente que hace imposible el seguimiento de la actividad en tiempo real.
Este desfase se debe a que los escáneres de IRMf miden la respuesta del flujo sanguíneo a la actividad cerebral, que alcanza su punto máximo y vuelve a la línea de base en unos 10 segundos, lo que significa que ni siquiera el escáner más potente puede mejorarlo.
Este duro límite ha obstaculizado la capacidad de interpretar la actividad cerebral en respuesta al habla natural, ya que ofrece un “batiburrillo de información” repartida en unos pocos segundos.

Sin embargo, la llegada de los grandes modelos lingüísticos -el tipo de IA que sustenta el ChatGPT de OpenAI- proporcionó una nueva vía de acceso.
Estos modelos son capaces de representar, en números, el significado semántico del habla, lo que permitió a los científicos observar qué patrones de actividad neuronal correspondían a cadenas de palabras con un significado concreto, en lugar de intentar leer la actividad palabra por palabra.
El proceso de aprendizaje fue intensivo: tres voluntarios tuvieron que permanecer tumbados en un escáner durante 16 horas cada uno, escuchando podcasts.
El descodificador se entrenó para relacionar la actividad cerebral con el significado utilizando un gran modelo lingüístico, el GPT-1, precursor del ChatGPT.
Representa ideas, no palabras exactas
Posteriormente, se escaneó a los mismos participantes escuchando una nueva historia o imaginando que contaban una historia y se utilizó el descodificador para generar texto a partir únicamente de la actividad cerebral.
Aproximadamente la mitad de las veces, el texto coincidía exactamente, y a veces con precisión, con el significado de las palabras originales.
“Nuestro sistema funciona a nivel de ideas, de semántica, de significado”, explica Huth. “Por eso lo que obtenemos no son las palabras exactas, sino lo esencial”.
Por ejemplo, cuando a un participante se le reprodujeron las palabras “Todavía no tengo el carné de conducir”, el descodificador las tradujo como “Todavía no ha empezado a aprender a conducir”.
El equipo espera ahora evaluar si la técnica podría aplicarse a otros sistemas de imagen cerebral más portátiles, como la espectroscopia funcional del infrarrojo cercano (fNIRS).
Algunos de los enlaces añadidos en el artículo forman parte de campañas de afiliación y pueden representar beneficios para Softonic.