ByteDance, la compañía propietaria de TikTok, presentó hoy iLLaDA, un nuevo modelo de lenguaje que toma un camino poco habitual dentro del sector: la difusión. Por los resultados que la propia empresa ha compartido, iLLaDA se mueve al nivel de Qwen2.5 en varias pruebas de referencia, así que entra de lleno entre los lanzamientos que más atención están concentrando ahora mismo.
Las cifras, de todos modos, no son lo más llamativo. La mayoría de los asistentes conversacionales actuales funciona prediciendo el siguiente fragmento de texto a partir de los anteriores. Es el método más extendido, pero también arrastra una limitación bastante evidente: si el comienzo de una respuesta se desvía, el resto suele levantarse sobre ese mismo error.
Eso es justo lo que iLLaDA busca corregir con un enfoque de difusión, una técnica muy conocida en generación de imagen y bastante menos establecida en texto.
Aquí la lógica cambia. En vez de construir una respuesta de forma secuencial, palabra por palabra, iLLaDA arranca con una salida incompleta o ruidosa y la va corrigiendo paso a paso hasta convertirla en un texto legible. En teoría, esa diferencia puede dar lugar a respuestas más flexibles, a una edición del contenido más natural y a nuevas maneras de acelerar el proceso.
La forma más simple de entender iLLaDA es imaginar un borrador que se reescribe varias veces: en cada iteración, iLLaDA elimina parte del “ruido” y afina mejor la salida, de modo que puede revisar el conjunto de la respuesta y no únicamente el siguiente paso inmediato.
La arquitectura de iLLaDA también llama la atención por otra razón. En lugar de reconstruir una frase completa desde cero, el sistema puede concentrarse en corregir o completar partes concretas, algo que tiene implicaciones bastante claras para productos de escritura, búsqueda o asistencia conversacional. Que ByteDance asegure haber alcanzado un nivel parecido al de Qwen2.5 importa porque, históricamente, este tipo de modelos lo ha tenido más complicado para igualar la calidad de los sistemas secuenciales en tareas generales.
Dicho eso, las pruebas de referencia cuentan solo una parte de la historia. Queda por ver cómo responde iLLaDA en escenarios reales, desde la velocidad y el coste de ejecución hasta la estabilidad de las respuestas y su capacidad para conservar el contexto en conversaciones largas.
Y luego está la cuestión del ecosistema: Qwen2.5 ya tiene una presencia importante entre desarrolladores y empresas, así que ByteDance va a tener que enseñar ventajas prácticas, no solo una arquitectura distinta. Aun así, el movimiento pesa porque apunta a algo más amplio: la carrera por la próxima generación de asistentes y herramientas de texto no pasa únicamente por hacer lo mismo un poco mejor. Todavía no está claro hasta qué punto esos resultados, al menos los que ByteDance ha compartido, aguantarán fuera del laboratorio.