La ciencia está siendo envenenada por la IA y no tiene solución

Los análisis lingüísticos y estadísticos de artículos científicos sugieren que la IA generativa puede haberse utilizado para redactar una cantidad ingente de literatura científica.

ChatGPT DESCARGAR

Dos trabajos académicos afirman que el análisis de la elección de palabras en el corpus de publicaciones científicas revela un uso cada vez mayor de la IA para redactar artículos de investigación.

Un estudio, publicado en marzo por Andrew Gray, del University College de Londres (Reino Unido), sugiere que el uno por ciento de todos los artículos publicados en 2023 fueron escritos, al menos parcialmente, por IA.

Un segundo estudio publicado en abril por un equipo de la Universidad de Stanford (EE.UU.) afirma que esta cifra podría oscilar entre el 6,3% y el 17,5%, dependiendo del tema.

?It's a new era for medical publishing. How should we address the use of generative AI (LLMs, chatbots, image creators) in scientific papers? ??

?️Let's look at the key takeaways from new ICMJE recommendations@RadiologyEditor @radiology_rsna https://t.co/jCunSueSU5
?1/ pic.twitter.com/kMI01zpbAx
— Domenico Mastrodicasa (@Mastrodicasa_MD) October 10, 2023

En ambos trabajos se buscaron ciertas palabras que los grandes modelos lingüísticos (LLM) utilizan habitualmente, como “intrincado”, “fundamental” y “meticulosamente”. Al rastrear el uso de esas palabras en la literatura científica y compararlo con palabras que no son especialmente favorecidas por la IA, los dos estudios afirman que pueden detectar una creciente dependencia del aprendizaje automático dentro de la comunidad de publicaciones científicas.

En el trabajo de Gray, el uso de palabras de control como “rojo”, “conclusión” y “después” cambió en un pequeño porcentaje de 2019 a 2023. Lo mismo ocurrió con otros adjetivos y adverbios determinados hasta 2023 (denominado año post-LLM por Gray).

En ese año, el uso de las palabras “meticuloso”, “encomiable” e “intrincado” aumentó un 59%, 83% y 117%, respectivamente, mientras que su prevalencia en la literatura científica apenas cambió entre 2019 y 2022. La palabra con el mayor aumento de prevalencia después de 2022 fue “meticulosamente”, un 137 por ciento.

El documento de Stanford encontró fenómenos similares, demostrando un aumento repentino para las palabras “reino”, “exhibir”, “intrincado2 y “fundamental”. Las dos primeras se utilizaron alrededor de un 80 por ciento más a menudo que en 2021 y 2022, mientras que las dos últimas se utilizaron alrededor de un 120 y casi un 160 por ciento más a menudo respectivamente.

ReviewerGPT? An Exploratory Study on Using Large Language Models for Paper Reviewing

Given the rapid ascent of large language models (LLMs), we study the question: (How) can large language models help in reviewing of scientific papers or proposals? We first conduct some pilot… pic.twitter.com/6HoUIaDzGG
— AK (@_akhaliq) June 2, 2023

Los investigadores también tuvieron en cuenta las estadísticas de uso de palabras en varias disciplinas científicas. Las ciencias de la computación y la ingeniería eléctrica se situaron a la cabeza en cuanto al uso del lenguaje preferido por la IA, mientras que las matemáticas, la física y los artículos publicados en la revista Nature solo experimentaron aumentos de entre el 5% y el 7,5%.

Los investigadores de Stanford también observaron que los autores que publican más preprints, trabajan en campos más saturados y escriben artículos más breves parecen utilizar la IA con más frecuencia. Su artículo sugiere que la falta general de tiempo y la necesidad de escribir tanto como sea posible fomentan el uso de los LLM, que pueden ayudar a aumentar la producción.

Usar la IA enfrenta a toda la comunidad científica

Utilizar la IA para ayudar en el proceso de investigación no es nada nuevo, y muchos científicos están abiertos a utilizarla para ajustar experimentos y lograr mejores resultados.

Sin embargo, el uso de la IA para escribir resúmenes y otras partes de los artículos es muy diferente, ya que la expectativa general es que los artículos científicos sean escritos por humanos reales, no por robots, y al menos un par de editores consideran que el uso de LLM para escribir artículos es una falta de ética científica.

El uso de modelos de IA puede ser muy arriesgado, ya que a menudo producen textos inexactos, que es precisamente lo que se supone que no debe hacer la literatura científica. Los modelos de IA pueden incluso falsificar citas, algo que ha metido en un lío infame a dos abogados de Nueva York por citar casos que ChatGPT había inventado.

ChatGPT DESCARGAR

“Hay que presionar a los autores que utilizan texto generado por LLM para que lo revelen o se lo piensen dos veces antes de hacerlo, por una cuestión de integridad básica de la investigación”, opinó Gray, del University College de Londres.

Los investigadores de Stanford también plantearon preocupaciones similares, escribiendo que el uso de IA generativa en la literatura científica podría crear «riesgos para la seguridad e independencia de la práctica científica».

Author: Chema Carvajal Sarabia

{ "de-DE": "Journalist, spezialisiert auf Technologie, Unterhaltung und Videospiele. Über das zu schreiben, was mich begeistert (Gadgets, Spiele und Filme), ermöglicht es mir, bei Verstand zu bleiben und mit einem Lächeln im Gesicht aufzuwachen, wenn der Wecker klingelt. PS: Das stimmt nicht 100% der Zeit.", "en-US": "Journalist specialized in technology, entertainment and video games. Writing about what I'm passionate about (gadgets, games and movies) allows me to stay sane and wake up with a smile on my face when the alarm clock goes off. PS: this is not true 100% of the time.", "es-ES": "Content Manager - Periodista especializado en tecnología, entretenimiento y videojuegos. Escribir sobre lo que me apasiona (cacharros, juegos y cine) me permite seguir cuerdo y despertarme con una sonrisa cuando suena el despertador. PD: esto no es cierto el 100 % de las veces.", "fr-FR": "Journaliste spécialisé dans la technologie, le divertissement et les jeux vidéo. Écrire sur ce qui me passionne (gadgets, jeux et films) me permet de rester sain d'esprit et de me réveiller avec le sourire aux lèvres quand le réveil sonne. PS : cela n'est pas vrai 100 % du temps.", "it-IT": "Giornalista specializzato in tecnologia, intrattenimento e videogiochi. Scrivere di ciò che mi appassiona (gadget, giochi e film) mi permette di mantenere la sanità mentale e di svegliarmi con un sorriso sul viso quando suona la sveglia. PS: questo non è vero al 100% del tempo.", "ja-JP": "", "nl-NL": "", "pl-PL": "", "pt-BR": "Jornalista especializado em tecnologia, entretenimento e videogames. Escrever sobre o que me apaixona (gadgets, jogos e filmes) me permite manter a sanidade e acordar com um sorriso no rosto quando o despertador toca. PS: isso não é verdade 100% do tempo.", "social": { "email": "chemacs91@gmail.com", "facebook": "", "twitter": "https://twitter.com/chematopetazo", "linkedin": "" } } View all posts by Chema Carvajal Sarabia