Google Research y el laboratorio de investigación de IA de Google, DeepMind, han detallado el impresionante alcance de Med-Gemini, una familia de modelos avanzados de IA especializados en medicina. Se trata de un enorme avance en el diagnóstico clínico con un enorme potencial en el mundo real.
Los médicos tratan a diario a multitud de pacientes, con necesidades que van de simples a muy complejas. Para prestar una atención eficaz, deben conocer el historial médico de cada paciente y mantenerse al día de los procedimientos y tratamientos más novedosos.
Y luego está la importantísima relación médico-paciente, basada en la empatía, la confianza y la comunicación. Para que una IA se acerque a un médico de la vida real, debe ser capaz de hacer todas estas cosas.
La IA ha llegado a la medicina de una manera eficaz
La intersección de la IA y la medicina ha despegado. Y es que Med-Gemini es algo más de lo que habíamos visto hasta ahora.
Los modelos Gemini de Google son una nueva generación de modelos de IA multimodal, es decir, que pueden procesar información de distintas modalidades, como texto, imágenes, vídeos y audio.
Los modelos son expertos en lenguaje y conversación, en comprender la información diversa para la que han sido entrenados y en lo que se denomina “razonamiento de contexto largo”, es decir, razonamiento a partir de grandes cantidades de datos, como horas de vídeo o decenas de horas de audio.
Med-Gemini tiene todas las ventajas de los modelos Gemini fundacionales, pero los ha perfeccionado. Los investigadores probaron estos ajustes centrados en la medicina e incluyeron sus resultados en el artículo.
Para llegar a un diagnóstico y formular un plan de tratamiento, los médicos deben combinar sus propios conocimientos médicos con una gran cantidad de información relevante: síntomas del paciente, historial médico, quirúrgico y social, resultados de laboratorio y de otras pruebas de investigación, y respuesta del paciente a tratamientos anteriores.
Los tratamientos son un “festín móvil” en el que se actualizan los existentes y se introducen otros nuevos. Todo ello influye en el razonamiento clínico del médico.
Por eso, con Med-Gemini, Google incluyó el acceso a búsquedas en la web para permitir un razonamiento clínico más avanzado. Al igual que muchos modelos de lenguaje extensos (LLM) centrados en la medicina, Med-Gemini se entrenó con MedQA, preguntas de opción múltiple representativas de las preguntas del US Medical License Exam (USMLE) diseñadas para poner a prueba los conocimientos médicos y el razonamiento en diversos escenarios.
Sin embargo, Google también desarrolló dos nuevos conjuntos de datos para su modelo. El primero, MedQA-R (Reasoning), amplía MedQA con explicaciones de razonamiento generadas sintéticamente denominadas “Chain-of-Thoughts” (CoTs). El segundo, MedQA-RS (Razonamiento y búsqueda), proporciona al modelo instrucciones para utilizar los resultados de las búsquedas web como contexto adicional para mejorar la precisión de las respuestas.
Si una pregunta médica conduce a una respuesta incierta, se pide al modelo que realice una búsqueda en Internet para obtener más información y resolver la incertidumbre.
Gemini de Google destrozó a GPT-4 de OpenAI
Med-Gemini se probó en 14 pruebas médicas de referencia y estableció un nuevo estado del arte (SoTA) en 10 de ellas, superando a la familia de modelos GPT-4 en todas aquellas en las que se pudo realizar una comparación.
En la prueba de referencia MedQA (USMLE), Med-Gemini alcanzó una precisión del 91,1% utilizando su estrategia de búsqueda guiada por la incertidumbre, superando al anterior LLM médico de Google, Med-PaLM 2, en un 4,5%.
¿Hacia dónde vamos? Los investigadores admiten que queda mucho trabajo por hacer, pero las capacidades iniciales del modelo Med-Gemini son ciertamente prometedoras. Y lo que es más importante, tienen previsto incorporar principios de IA responsable, como la privacidad y la equidad, en todo el proceso de desarrollo del modelo.
Según los investigadores, “las consideraciones de privacidad, en particular, deben basarse en las políticas y normativas sanitarias vigentes que regulan y protegen la información de los pacientes”.
Pero, en última instancia, Med-Gemini se ve como una herramienta para el bien.