Whisper, la herramienta de transcripción desarrollada por OpenAI y basada en inteligencia artificial, está mintiendo mucho. Demasiado. Según varios expertos en el ámbito tecnológico, esta herramienta es propensa a “alucinar”, es decir, inventar fragmentos de texto o frases enteras, pudiendo tener consecuencias nefastas en sectores como el hospitalario.
Suscríbete a la Newsletter de Softonic y recibe las últimas noticias en tech, juegos, entretenimiento en tu buzón de correo
Suscríbete (es GRATIS) ►Un grupo de investigadores y desarrolladores consultado por Associated Press explicó que Whisper, utilizada en múltiples ámbitos, tiende a generar transcripciones erróneas que incluyen contenido inventado e incluso comentarios racistas.
Esto se vuelve aún más problemático cuando su uso se extiende a ámbitos de alto riesgo, como la transcripción de consultas médicas, donde un fallo en la precisión podría afectar directamente a la salud de los pacientes. “Nadie quiere un diagnóstico erróneo”, declaró Alondra Nelson, exdirectora de la Oficina de Política Científica y Tecnológica de la Casa Blanca, quien considera que se debería exigir una mayor fiabilidad para este tipo de tecnologías.

El alcance del problema es considerable. Un reciente estudio detectó 187 alucinaciones en más de 13.000 fragmentos de audio claros, y en otro análisis, un investigador de la Universidad de Michigan encontró alucinaciones en 8 de cada 10 transcripciones inspeccionadas. Además, los errores no se limitan a fragmentos largos o de baja calidad; se producen también en audios cortos y bien grabados. Un ingeniero especializado en aprendizaje automático afirmó haber encontrado errores en la mitad de las 100 horas de transcripciones que analizó.
Estos fallos han provocado que expertos y defensores del uso ético de la inteligencia artificial soliciten que el gobierno estadounidense regule el uso de estas herramientas. Christian Vogler, un académico sordo de la Universidad de Gallaudet, señala que Whisper también se usa para subtitular vídeos para personas sordas, quienes son especialmente vulnerables a los errores de transcripción. Según los expertos, resolver estos bugs debería ser una prioridad para OpenAI antes de que Whisper se implemente en sistemas y aplicaciones que requieran una alta precisión en su funcionamiento.