OpenAI ha comenzado a implementar las funcionalidades de vídeo en tiempo real para ChatGPT, una función que mostró hace siete meses. Durante un streaming del pasado jueves, la compañía presentó la capacidad de visión para el Modo de voz avanzado, que permite a los usuarios apuntar sus teléfonos a objetos para recibir respuestas inmediatas de la IA. Esta nueva función está disponible para los suscriptores de ChatGPT Plus, Team o Pro.
El Modo de voz avanzado con visión también puede analizar lo que se muestra en la pantalla del dispositivo mediante el uso compartido de pantalla. De esta forma, la herramienta es capaz de explicar menús de configuración o incluso ayudar con problemas matemáticos. Para usarla, los usuarios deben activar el modo de voz en la app de ChatGPT y luego seleccionar el icono de vídeo. El uso compartido de pantalla se activa a través del menú de tres puntos.
En su demostración, Greg Brockman, presidente de OpenAI, mostró cómo esta tecnología era capaz de reconocer dibujos en tiempo real. Sin embargo, la IA también cometió errores, como confundir una figura geométrica, evidenciando que todavía está lejos de ser perfecta.
Just in time for the holidays, video and screensharing are now starting to roll out in Advanced Voice in the ChatGPT mobile app. pic.twitter.com/HFHX2E33S8
— OpenAI (@OpenAI) December 12, 2024
Además del Modo de voz avanzado con visión, OpenAI lanzó el jueves un “Modo Santa”, que añade la voz de Papá Noel como opción predeterminada en ChatGPT. Este modo se encuentra junto al icono de copo de nieve en la aplicación.
La implementación de la función de visión para el Modo de voz avanzado comenzó el jueves y finalizará en una semana, según OpenAI. Sin embargo, no todos podrán acceder de inmediato; los suscriptores de ChatGPT Enterprise y Edu tendrán que esperar hasta enero, mientras que los usuarios de la Unión Europea, Suiza, Islandia, Noruega y Liechtenstein aún no tienen una fecha confirmada. Al mismo tiempo, los rivales de OpenAI continúan desarrollando capacidades similares. Google, por ejemplo, presentó esta semana Project Astra, su sistema de análisis de vídeo en tiempo real, a un grupo selecto de usuarios en Android.