OpenAI ha anunciado una importante actualización para los desarrolladores que utilizan su API. A partir de ahora, todos ellos tendrán acceso al modelo completo o1, reemplazando a la versión preliminar o1-preview. Con este cambio, junto con nuevas funciones, la compañía quiere facilitar la creación de asistentes personalizados y optimizar los recursos de desarrollo.
Entre las novedades destacan las “mensajes de desarrollador”, que permiten guiar el comportamiento de los chatbots (por ejemplo, “eres un asistente útil para profesionales de impuestos”), y un parámetro de “esfuerzo de razonamiento” que ajusta la complejidad de las consultas, ahorrando tiempo y dinero. Además, la API ahora acepta entradas visuales, como documentos escaneados.
Otro de los avances clave está relacionado con las llamadas a funciones internas, donde el modelo de OpenAI puede activar funciones predefinidas por los desarrolladores para responder consultas de manera más precisa. Además, destaca la mejora en los “outputs estructurados”, que emplean esquemas JSON para presentar información. Según OpenAI, el modelo o1 reduce en un 60 % los tokens utilizados para procesar respuestas en comparación con o1-preview, logrando resultados más rápidos y económicos, con una precisión que mejora entre un 25 y un 35 % en pruebas como LiveBench y AIME.

También se ha incorporado compatibilidad completa con WebRTC en las APIs de voz en tiempo real, lo que simplifica el desarrollo de interfaces de audio de OpenAI en aplicaciones de terceros, y reduciendo así el código necesario de 250 líneas a solo una docena.
OpenAI planea lanzar código WebRTC listo para usar en dispositivos como gafas inteligentes o cámaras, facilitando la implementación de asistentes contextuales. Además, los desarrolladores se beneficiarán de una reducción del 60 % en el coste de tokens de audio o1 y un 90 % en los tokens mini 4o.
Por último, OpenAI ha presentado un nuevo método de ajuste llamado “optimización directa de preferencias”. Este sistema permite a los desarrolladores afinar modelos proporcionando comparaciones de respuestas, en lugar de pares exactos de entrada/salida. El proceso aprende automáticamente las diferencias en estilo, formato o creatividad, haciendo el ajuste más intuitivo y efectivo. Aunque el acceso al modelo o1 comenzó este martes para los clientes de nivel 5, la versión o1 Pro, con un coste de 200 dólares al mes, estará disponible próximamente.