Introduction
Une nouvelle étude menée par des chercheurs de l'Harvard Medical School et du Beth Israel Deaconess Medical Center a montré que les modèles de langage de l'IA peuvent offrir des diagnostics plus précis que les médecins d'urgence dans certains cas. Les résultats de cette étude ont été publiés dans la revue Science.
Contexte Technique
Les chercheurs ont mené une série d'expériences pour comparer les performances des modèles de langage de l'IA d'OpenAI avec celles de médecins humains. Dans l'une de ces expériences, ils ont étudié 76 patients qui sont venus à l'urgence du Beth Israel, en comparant les diagnostics offerts par deux médecins avec ceux générés par les modèles o1 et 4o d'OpenAI. Les diagnostics ont été évalués par deux autres médecins qui ne savaient pas qui avait émis les diagnostics, les humains ou l'IA.
Les résultats ont montré que le modèle o1 d'OpenAI a offert des diagnostics exacts ou très proches dans 67% des cas de triage, contre 55% pour l'un des médecins et 50% pour l'autre. Les chercheurs ont souligné qu'ils n'ont pas prétraité les données, les modèles de l'IA ont donc été présentés avec les mêmes informations que celles disponibles dans les dossiers médicaux électroniques au moment de chaque diagnostic.
Analyse et Implications
Ces résultats suggèrent que les modèles de langage de l'IA pourraient être utilisés pour améliorer la précision des diagnostics dans les situations d'urgence. Cependant, les chercheurs ont souligné que les résultats de l'étude ne signifient pas que l'IA est prête à prendre des décisions de vie ou de mort dans les salles d'urgence. Ils ont également noté que les modèles de l'IA sont limités dans leur capacité à raisonner sur des entrées non textuelles.
Les implications de cette étude sont importantes, car elles soulignent le besoin urgent de tests prospectifs pour évaluer ces technologies dans des contextes de soins aux patients réels. De plus, les chercheurs ont souligné que les patients veulent encore que des humains les guident dans les décisions de vie ou de mort et dans les décisions de traitement difficiles.
Perspective
À l'avenir, il faudra surveiller de près les progrès de la recherche dans ce domaine, en particulier en ce qui concerne la mise en place d'un cadre formel pour la responsabilité des diagnostics de l'IA. Les limites de l'étude, notamment le fait que les modèles de l'IA n'ont été testés que sur des données textuelles, devront également être abordées dans les recherches futures.