La IA médica de Google destruye la referencia de GPT y supera a los médicos

Los investigadores admiten que queda mucho trabajo por hacer, pero las capacidades iniciales del modelo Med-Gemini son ciertamente prometedoras.

Med-Gemini for medical tasks

Google Research y el laboratorio de investigación de IA de Google, DeepMind, han detallado el impresionante alcance de Med-Gemini, una familia de modelos avanzados de IA especializados en medicina. Se trata de un enorme avance en el diagnóstico clínico con un enorme potencial en el mundo real.

ChatGPT DESCARGAR

Los médicos tratan a diario a multitud de pacientes, con necesidades que van de simples a muy complejas. Para prestar una atención eficaz, deben conocer el historial médico de cada paciente y mantenerse al día de los procedimientos y tratamientos más novedosos.

Y luego está la importantísima relación médico-paciente, basada en la empatía, la confianza y la comunicación. Para que una IA se acerque a un médico de la vida real, debe ser capaz de hacer todas estas cosas.

La IA ha llegado a la medicina de una manera eficaz

La intersección de la IA y la medicina ha despegado. Y es que Med-Gemini es algo más de lo que habíamos visto hasta ahora.

Los modelos Gemini de Google son una nueva generación de modelos de IA multimodal, es decir, que pueden procesar información de distintas modalidades, como texto, imágenes, vídeos y audio.

Los modelos son expertos en lenguaje y conversación, en comprender la información diversa para la que han sido entrenados y en lo que se denomina “razonamiento de contexto largo”, es decir, razonamiento a partir de grandes cantidades de datos, como horas de vídeo o decenas de horas de audio.

Med-Gemini tiene todas las ventajas de los modelos Gemini fundacionales, pero los ha perfeccionado. Los investigadores probaron estos ajustes centrados en la medicina e incluyeron sus resultados en el artículo.

Para llegar a un diagnóstico y formular un plan de tratamiento, los médicos deben combinar sus propios conocimientos médicos con una gran cantidad de información relevante: síntomas del paciente, historial médico, quirúrgico y social, resultados de laboratorio y de otras pruebas de investigación, y respuesta del paciente a tratamientos anteriores.

Los tratamientos son un “festín móvil” en el que se actualizan los existentes y se introducen otros nuevos. Todo ello influye en el razonamiento clínico del médico.

Por eso, con Med-Gemini, Google incluyó el acceso a búsquedas en la web para permitir un razonamiento clínico más avanzado. Al igual que muchos modelos de lenguaje extensos (LLM) centrados en la medicina, Med-Gemini se entrenó con MedQA, preguntas de opción múltiple representativas de las preguntas del US Medical License Exam (USMLE) diseñadas para poner a prueba los conocimientos médicos y el razonamiento en diversos escenarios.

Sin embargo, Google también desarrolló dos nuevos conjuntos de datos para su modelo. El primero, MedQA-R (Reasoning), amplía MedQA con explicaciones de razonamiento generadas sintéticamente denominadas “Chain-of-Thoughts” (CoTs). El segundo, MedQA-RS (Razonamiento y búsqueda), proporciona al modelo instrucciones para utilizar los resultados de las búsquedas web como contexto adicional para mejorar la precisión de las respuestas.

Si una pregunta médica conduce a una respuesta incierta, se pide al modelo que realice una búsqueda en Internet para obtener más información y resolver la incertidumbre.

Gemini de Google destrozó a GPT-4 de OpenAI

Med-Gemini se probó en 14 pruebas médicas de referencia y estableció un nuevo estado del arte (SoTA) en 10 de ellas, superando a la familia de modelos GPT-4 en todas aquellas en las que se pudo realizar una comparación.

En la prueba de referencia MedQA (USMLE), Med-Gemini alcanzó una precisión del 91,1% utilizando su estrategia de búsqueda guiada por la incertidumbre, superando al anterior LLM médico de Google, Med-PaLM 2, en un 4,5%.

¿Hacia dónde vamos? Los investigadores admiten que queda mucho trabajo por hacer, pero las capacidades iniciales del modelo Med-Gemini son ciertamente prometedoras. Y lo que es más importante, tienen previsto incorporar principios de IA responsable, como la privacidad y la equidad, en todo el proceso de desarrollo del modelo.

ChatGPT DESCARGAR

Según los investigadores, “las consideraciones de privacidad, en particular, deben basarse en las políticas y normativas sanitarias vigentes que regulan y protegen la información de los pacientes”.

Pero, en última instancia, Med-Gemini se ve como una herramienta para el bien.

Author: Chema Carvajal Sarabia

{ "de-DE": "Journalist, spezialisiert auf Technologie, Unterhaltung und Videospiele. Über das zu schreiben, was mich begeistert (Gadgets, Spiele und Filme), ermöglicht es mir, bei Verstand zu bleiben und mit einem Lächeln im Gesicht aufzuwachen, wenn der Wecker klingelt. PS: Das stimmt nicht 100% der Zeit.", "en-US": "Journalist specialized in technology, entertainment and video games. Writing about what I'm passionate about (gadgets, games and movies) allows me to stay sane and wake up with a smile on my face when the alarm clock goes off. PS: this is not true 100% of the time.", "es-ES": "Content Manager - Periodista especializado en tecnología, entretenimiento y videojuegos. Escribir sobre lo que me apasiona (cacharros, juegos y cine) me permite seguir cuerdo y despertarme con una sonrisa cuando suena el despertador. PD: esto no es cierto el 100 % de las veces.", "fr-FR": "Journaliste spécialisé dans la technologie, le divertissement et les jeux vidéo. Écrire sur ce qui me passionne (gadgets, jeux et films) me permet de rester sain d'esprit et de me réveiller avec le sourire aux lèvres quand le réveil sonne. PS : cela n'est pas vrai 100 % du temps.", "it-IT": "Giornalista specializzato in tecnologia, intrattenimento e videogiochi. Scrivere di ciò che mi appassiona (gadget, giochi e film) mi permette di mantenere la sanità mentale e di svegliarmi con un sorriso sul viso quando suona la sveglia. PS: questo non è vero al 100% del tempo.", "ja-JP": "", "nl-NL": "", "pl-PL": "", "pt-BR": "Jornalista especializado em tecnologia, entretenimento e videogames. Escrever sobre o que me apaixona (gadgets, jogos e filmes) me permite manter a sanidade e acordar com um sorriso no rosto quando o despertador toca. PS: isso não é verdade 100% do tempo.", "social": { "email": "chemacs91@gmail.com", "facebook": "", "twitter": "https://twitter.com/chematopetazo", "linkedin": "" } }