Alors qu’un trouble du spectre de l’autisme (TSA) concernerait 1 à 2 % de la population mondiale suivant les critères diagnostiques du DSM- 5, la compréhension de sa physiopathologie reste limitée. Au vu de l’absence actuelle de biomarqueurs convaincants, l’observation clinique demeure la clé du diagnostic de TSA. Des chercheurs québecois ont donc eu l’idée d’exploiter les comptes-rendus médicaux de plus de 1 000 patients (cas suspectés ou diagnostiqués), afin de mieux comprendre a posteriori quels avaient été les éléments les plus récurrents décelés par les praticiens pour poser le diagnostic.Pour réaliser cette analyse d’un grand volume de données textuelles, les chercheurs ont entraîné un grand modèle de langage (ou LLM, large language model), le modèle FlauBERT. Après avoir été préentraîné sur 489 millions de phrases de tous domaines (dont non médicaux), le LLM a été entraîné spécifiquement sur 4 272 comptes-rendus médicaux focalisés sur le TSA, pour prédire le diagnostic d’autisme en distinguant les cas confirmés des cas suspectés mais ensuite écartés. Ces comptes-rendus étaient issus d’examens menés en français chez 1 080 jeunes patients (âge moyen 7 ans, 21 % de filles), dont 429 ont reçu un diagnostic de TSA et 651 n’en ont pas reçu (suspicion écartée après l’examen d’un spécialiste). Pour être inclus dans cette cohorte d’entraînement, les patients devaient avoir au moins le compte-rendu du médecin référent pour suspicion de TSA et le compte-rendu de l’évaluation de TSA d’un spécialiste.En croisant les phrases des comptes-rendus analysés par le LLM avec les critères diagnostiques de TSA du DSM- 5, les chercheurs ont ainsi pu déterminer les symptômes du DSM- 5 les plus caractéristiques, dans la vraie vie, d’un diagnostic confirmé d’autisme. Leurs résultats, pour le moins surprenants, ont été publiés dans Cell.Ils révèlent que les déficits dans les interactions sociales, qui sont souvent perçus comme le signe le plus spécifique, sont en fait une caractéristique moins saillante des diagnostics confirmés que les comportements répétitifs et stéréotypés (notamment les mouvements de main, de doigts ou l’écholalie), les intérêts anormaux (lettres, nombres…) ou encore les réactions aux stimulations sensorielles. Ces résultats suggèrent une nécessaire révision des outils diagnostiques pour les TSA.

Références
Cell 2025;188(8):P2235-48. Stanley J, Rabot E, Reddy S, et al. Large language models deconstruct the clinical intuition behind diagnosing autism. PMID : 40147442