Alors qu’un trouble du spectre de l’autisme (TSA) concernerait 1 à 2 % de la population mondiale suivant les critères diagnostiques du DSM- 5, la compréhension de sa physiopathologie reste limitée. Au vu de l’absence actuelle de biomarqueurs convaincants, l’observation clinique demeure la clé du diagnostic de TSA. Des chercheurs québecois ont donc eu l’idée d’exploiter les fruits de l’observation clinique consignés dans les comptes rendus médicaux de plus de 1 000 patients (cas suspectés ou diagnostiqués), afin de mieux comprendre a posteriori quels avaient été les éléments les plus récurrents décelés par les praticiens pour poser le diagnostic de TSA.
Pour réaliser cette analyse d’un grand volume de données textuelles, les chercheurs ont entraîné un grand modèle de langage (ou LLM, de l’anglais large language model), le modèle FlauBERT (celui-ci est une adaptation à la langue française de l’architecture « BERT », qui a été le premier modèle de langage ayant réussi à comprendre efficacement le sens des mots dans leur contexte). Après avoir été pré-entraîné sur 489 millions de phrases de tous domaines (dont non médicaux), le LLM a été entraîné spécifiquement sur 4 272 comptes rendus médicaux focalisés sur le TSA, pour prédire le diagnostic d’autisme en distinguant les cas confirmés des cas suspectés et ensuite écartés.Ces comptes rendus étaient issus d’examens menés en français chez 1 080 jeunes patients (âge moyen = 7,0 ans, 21 % de filles), dont 429 ont reçu un diagnostic de TSA et 651 n’en ont pas reçu (suspicion écartée après l’examen d’un spécialiste). Pour être inclus dans cette cohorte d’entraînement, les patients devaient avoir au moins le compte rendu du médecin référent pour suspicion de TSA et le compte rendu de l’évaluation de TSA d’un spécialiste.
En croisant les phrases des comptes rendus analysés par le LLM avec les critères diagnostiques de TSA du DSM- 5, les chercheurs ont ainsi pu déterminer les symptômes du DSM- 5 les plus caractéristiques, dans la vraie vie, d’un diagnostic confirmé d’autisme. Leurs résultats, pour le moins surprenants, ont été publiés fin mars dans Cell.
Ils révèlent que les déficits dans les interactions sociales, qui sont souvent perçus a priori comme le signe le plus spécifique des TSA, sont en fait une caractéristique moins saillante des diagnostics confirmés que les comportements répétitifs et stéréotypés (notamment les mouvements de main, de doigts ou l’écholalie), les intérêts anormaux (lettres, nombres, alphabet…) ou encore les réactions aux stimulations sensorielles. Pour les auteurs, ces résultats suggèrent une nécessaire révision des outils diagnostiques communément utilisés dans le TSA.