Bien que l’intelligence artificielle de Google ait arrêté de recommander de manger des pierres ou d’encourager les utilisateurs à ajouter de la colle sur leur pizza, même les chatbots les plus avancés présentent encore des lacunes énormes quand il s’agit de donner des conseils médicaux.
Une nouvelle étude parue cette semaine dans le magazine JAMA Network Open a demandé à 21 modèles de langage avancés de simuler un médecin face à des symptômes réels qu’un patient pourrait évoquer.
Les résultats de cette étude sont préoccupants. Les modèles d’IA ont échoué plus de 80 % du temps lorsqu’ils étaient confrontés à des symptômes ambigus pouvant correspondre à plusieurs maladies. Même pour des cas plus simples, avec des résultats d’examen physique et des analyses, leur taux d’échec restait de 40 %. Contrairement aux médecins humains, les modèles de langage « tombent souvent rapidement sur une réponse unique », ce qui mène à des performances médiocres.
« Malgré des améliorations continues, les modèles de langage disponibles ne sont pas prêts pour une utilisation clinique sans supervision », a expliqué Marc Succi, auteur principal et responsable d’innovation à l’hôpital général du Massachusetts, lors d’une interview donnée. « Les diagnostics différentiels sont au cœur du raisonnement clinique, une aptitude que l’IA ne peut pas encore reproduire », a-t-il ajouté.
Dans un contexte réel, une IA qui tire rapidement des conclusions sans avoir tous les éléments pourrait causer de graves problèmes. Par exemple, si une personne s’adresse à un chatbot au sujet d’une éruption cutanée ou d’une toux subite, elle pourrait se voir donner des conseils trompeurs et potentiellement dangereux.
Ces résultats soulignent les risques significatifs d’une confiance excessive envers l’IA pour des conseils médicaux cruciaux. Une enquête récente du West Health-Gallup Center a révélé qu’un adulte américain sur quatre, soit environ 66 millions de personnes, se tourne déjà vers ChatGPT et d’autres chatbots pour des conseils médicaux.
Les répondants ont souvent déclaré qu’ils cherchaient des informations tant avant qu’après avoir consulté un professionnel de santé. Dans de nombreux cas, ils choisissent même de ne pas consulter un vrai médecin après avoir échangé avec un chatbot. Parmi ceux qui ont demandé des conseils à l’IA, 14 % — soit plus de neuf millions de personnes aux États-Unis — ont affirmé qu’ils n’avaient jamais consulté de médecin qu’ils auraient autrement vu sans cette technologie.
Selon l’enquête, 27 % des répondants cherchaient à éviter les frais d’une consultation médicale, tandis que 14 % ont déclaré ne pas pouvoir payer. Certains participants ont également mentionné un manque de temps ou d’accès à un médecin.
« L’intelligence artificielle modifie déjà la manière dont les Américains recherchent des informations sur la santé, prennent des décisions et interagissent avec les professionnels de santé, et les systèmes de santé doivent s’adapter », a déclaré Tim Lash, président du West Health Policy Center.
Ces deux études dressent un tableau alarmant de la situation actuelle des soins de santé aux États-Unis. Non seulement des millions d’Américains dépendent de l’IA pour des conseils médicaux, mais ils reçoivent fréquemment des informations erronées de la part de modèles qui hallucinent, et choisissent de ne pas se tourner vers des professionnels plus qualifiés.
Les experts critiquent déjà sévèrement les IA pour la distribution de conseils médicaux inappropriés, des systèmes de Google fournissant des informations dangereusement inexactes à des applications de transcription utilisées par des médecins inventant des médicaments inexistants.
Même quand les conseils fournis sont incorrects, l’IA donne aux patients un sentiment de confiance. Près de la moitié des participants à la dernière enquête ont déclaré que discuter avec un chatbot sur des problèmes médicaux les avait rendus plus confiants lors de leurs échanges avec des professionnels de la santé. De plus, 22 % ont mentionné que cela les avait aidés à identifier des problèmes plus tôt, et 19 % ont affirmé qu’ils avaient pu éviter des tests ou interventions inutiles.
Parallèlement, une large part des Américains reste méfiante vis-à-vis des conseils médicaux donnés par l’IA. Environ un tiers des participants ayant consulté des outils d’IA pour des problèmes de santé ont déclaré les considérer comme peu fiables. Un répondant sur dix a même indiqué que l’IA lui avait fourni des conseils potentiellement dangereux.
Il est évident que l’industrie de l’IA a un besoin urgent d’ encadrement réglementaire.
**Informations complémentaires sur l’IA et les conseils médicaux :** Les modèles d’IA avancés montrent des comportements étranges lorsqu’il s’agit de diagnostiquer des radiographies médicales.
FAQ
Quelle est la principale conclusion de l’étude sur l’IA en médecine ?
L’étude révèle que les modèles de langage avancés échouent souvent à fournir des conseils médicaux fiables, avec des taux d’échec dépassant 80 % pour des symptômes ambigus.
Pourquoi les gens se tournent-ils vers des chatbots pour des conseils médicaux ?
Les utilisateurs cherchent souvent à éviter des consultations coûteuses ou manquent de temps, ce qui les pousse à interagir avec des chatbots dans leur recherche d’informations.
Quels sont les risques associés à l’utilisation de l’IA pour des conseils médicaux ?
Un manque de contexte peut amener à des conclusions erronées, induisant des patients en erreur et les exposant à des conseils potentiellement dangereux.
Comment réagissent les professionnels de la santé face à l’utilisation de l’IA en soin ?
Beaucoup s’inquiètent des conséquences, soulignant que les modèles d’IA ne peuvent pas remplacer l’intuition et l’expérience humaine dans le diagnostic médical.
Que pourrait impliquer un encadrement réglementaire de l’IA ?
Un meilleur encadrement pourrait faciliter le développement d’outils d’IA plus sûrs et fiables, limitant les risques pour la santé publique.
