Veuillez lire l’article « Combined Nivolumab and Ipilimumab or Monotherapy in Untreated Melanoma » :
Précision : les critères RECIST utilisés dans cette étude correspondent à des critères radiologiques fondés sur la mesure de lésions cibles afin d’évaluer la réponse tumorale (c’est-à-dire la diminution de volume) après un traitement.
Précision : les critères RECIST utilisés dans cette étude correspondent à des critères radiologiques fondés sur la mesure de lésions cibles afin d’évaluer la réponse tumorale (c’est-à-dire la diminution de volume) après un traitement.
Question 1 : Il s’agit d’une étude
Il s’agissait d’une étude interventionnelle et non observationnelle
À la fin de l’introduction : « randomized, double-blind, multicenter, phase 3 trial »
Une étude diagnostique vise à évaluer la performance d’un examen paraclinique, signe clinique
Question 2 : Le rationnel ayant poussé à la réalisation de cette étude est le suivant (une ou plusieurs réponses exactes)
« Recently, pembrolizumab was associated with longer progression-free survival and overall survival and higher response rate than those associated with ipilimumab… » dans l’introduction
Le but d’un essai contrôlé randomisé n’est pas d’éclaircir un mécanisme d’action (recherche fondamentale), mais de comparer l’efficacité d’un nouveau traitement au traitement de référence
Cette association a été testée dans le cadre d’un essai de phase II : dans l’introduction : « The results of a phase 2 study that compared combined nivolumab and ipilimumab with ipilimumab alone… ». La différence entre essai de phase II et essai de phase III est rappelée ci-dessous
Il ne s’agit pas de la première administration (cf. ci-dessus : essai de phase II avec l’association ou essai de phase III avec pembrolizumab) dans le mélanome métastatique
Il s’agissait d’une question de compréhension de texte, toutes les informations nécessaires étant citées dans l’introduction. On rappelle la différence entre les différentes phases d’essai :
Phase I : première administration à l’homme, évaluation de la toxicité.
- Chez volontaire sain.
- Sauf en oncologie : chez des patients sélectionnés.
- Permet d’évaluer la dose maximale du médicament tolérée chez l’homme et de faire des études de pharmacocinétique.
Phase II : mesure de l’efficacité du traitement.
- Au sein d’une cohorte de petite taille et homogène.
- Classiquement, pas de comparaison à un autre traitement, mais il existe des variantes.
Phase III : comparaison au traitement de référence.
- Au sein d’une cohorte représentative de la population ciblée par le traitement.
- Essai contrôlé randomisé de grande ampleur.
- Versus placebo s’il existe pas de traitement de référence.
À l’issue de l’essai de phase III, l’Agence nationale de sécurité du médicament (ANSM) peut, ou non, attribuer une autorisation de mise sur le marché (AMM) dans une indication précise.
Phase I : première administration à l’homme, évaluation de la toxicité.
- Chez volontaire sain.
- Sauf en oncologie : chez des patients sélectionnés.
- Permet d’évaluer la dose maximale du médicament tolérée chez l’homme et de faire des études de pharmacocinétique.
Phase II : mesure de l’efficacité du traitement.
- Au sein d’une cohorte de petite taille et homogène.
- Classiquement, pas de comparaison à un autre traitement, mais il existe des variantes.
Phase III : comparaison au traitement de référence.
- Au sein d’une cohorte représentative de la population ciblée par le traitement.
- Essai contrôlé randomisé de grande ampleur.
- Versus placebo s’il existe pas de traitement de référence.
À l’issue de l’essai de phase III, l’Agence nationale de sécurité du médicament (ANSM) peut, ou non, attribuer une autorisation de mise sur le marché (AMM) dans une indication précise.
Vous êtes praticien dans un centre participant à l’étude et vous demandez quel(s) patient(s) pourrai(-en)t participer à l’étude ?
Question 3 : Parmi les patients suivants, vous pouvez inclure
Il ne semble pas rencontrer de critères d’exclusion : son état général correspond à un PS1, inclus dans l’essai
Le mélanome oculaire était un critère d’exclusion
Il n’y avait pas de limite d’âge décrite, et les patients avec une maladie localement avancée et inopérable (stade III) étaient incluables dans l’étude
Attention ! Dans l’étude ne sont incluables que les patients en situation métastatique ou d’irrésécabilité. Ce traitement n’est pas évalué en situation adjuvante
Les métastases cérébrales devaient être « contrôlées », c’est-à-dire faire l’objet d’un traitement focal : chirurgie ou radiothérapie
Il s’agissait d’une question de compréhension des critères d’exclusion et d’inclusion.
Cela permettait notamment de comprendre que plus l’on met de critères, plus l’on exclut de patients, et moins la population étudiée ressemble à la population source. Par ailleurs, plus la population est sélectionnée, plus on a du mal à inclure des malades.
On rappelle également que les patients doivent rencontrer tous les critères d’inclusion et aucun critère d’exclusion.
Cela permettait notamment de comprendre que plus l’on met de critères, plus l’on exclut de patients, et moins la population étudiée ressemble à la population source. Par ailleurs, plus la population est sélectionnée, plus on a du mal à inclure des malades.
On rappelle également que les patients doivent rencontrer tous les critères d’inclusion et aucun critère d’exclusion.
Nous nous intéressons maintenant à la méthode de randomisation de cette étude.
Question 4 : Concernant la randomisation dans cet essai, on peut dire qu’elle est
Il s’agissait d’une répartition 1:1:1, donc d’une répartition équilibrée (autant de patients dans chaque groupe)
Il existait une stratification sur le statut PD-L1, le statut BRAF V600E et le stade métastatique
La randomisation était restreinte car stratifiée sur les 3 facteurs ci-dessus
Il existe 4 principales formes de randomisation restreinte (cf. ci-dessous), et la stratification est l’une d’elles
Correspond à un schéma dans lequel on randomise n patients dans le groupe A puis n patients dans le groupe B, et ainsi de suite. La taille des blocs doit être inconnue de l’investigateur (assignation secrète). Cela permet de limiter un éventuel effet temps
Cette question permettait de revoir les différents modèles de randomisation.
La randomisation permet d’attribuer à chaque patient au hasard le traitement A ou B, afin d’assurer des effectifs comparables au sein des deux groupes. Il existe deux types de randomisation :
- randomisation simple : dans laquelle la répartition des patients est purement aléatoire et non contrôlée ;
- randomisation restreinte : dans laquelle la répartition est aléatoire dans le cadre contraintes à respecter :
- randomisation par stratification : dans ce modèle, la contrainte imposée à la randomisation est la répartition équilibrée dans les deux groupes sur un facteur de stratification, souvent un facteur de confusion potentiel. Ici, par exemple, on stratifiait sur le statut mutationnel BRAF V600, un potentiel facteur de confusion, afin de s’assurer que les effectifs de patients mutés seront les mêmes dans les deux groupes : la comparabilité des deux groupes sur ce critère n’est donc pas le hasard.
Ce modèle permet également de faire des analyses en sous groupe de manière plus rigoureuse ;
- randomisation par blocs : je randomise les patients à un traitement par blocs. Si je prends un bloc de taille 4, par exemple, je randomiserai 4 patients dans le groupe A, puis 4 dans le groupe B, puis à nouveau dans le groupe A, etc. Cette méthode permet notamment de s’affranchir d’un effet temps : permet de garder comparable le nombre de patients inclus en février dans les deux groupes (épidémie de grippe et surmortalité…) par exemple. La taille des groupes peut être variable, mais doit rester inconnue de l’investigateur pour respecter l’assignation secrète : l’investigateur ne doit pas pouvoir deviner dans quel groupe sera randomisé son malade ;
- randomisation en cluster : on randomise les patients en groupes entiers (tous les patients de l’hôpital A recevront le traitement expérimental, et tous les patients de l’hôpital B le traitement de référence). Cela permet d’éviter des erreurs de délivrance, principalement, et donc la contamination entre les bras ;
- randomisation par minimisation : forme particulière de randomisation par stratification, poussée à l’extrême. À chaque nouveau patient, le statisticien choisit le groupe pour assurer la meilleure comparabilité entre les deux groupes. Surtout utile pour les petits effectifs.
La randomisation permet d’attribuer à chaque patient au hasard le traitement A ou B, afin d’assurer des effectifs comparables au sein des deux groupes. Il existe deux types de randomisation :
- randomisation simple : dans laquelle la répartition des patients est purement aléatoire et non contrôlée ;
- randomisation restreinte : dans laquelle la répartition est aléatoire dans le cadre contraintes à respecter :
- randomisation par stratification : dans ce modèle, la contrainte imposée à la randomisation est la répartition équilibrée dans les deux groupes sur un facteur de stratification, souvent un facteur de confusion potentiel. Ici, par exemple, on stratifiait sur le statut mutationnel BRAF V600, un potentiel facteur de confusion, afin de s’assurer que les effectifs de patients mutés seront les mêmes dans les deux groupes : la comparabilité des deux groupes sur ce critère n’est donc pas le hasard.
Ce modèle permet également de faire des analyses en sous groupe de manière plus rigoureuse ;
- randomisation par blocs : je randomise les patients à un traitement par blocs. Si je prends un bloc de taille 4, par exemple, je randomiserai 4 patients dans le groupe A, puis 4 dans le groupe B, puis à nouveau dans le groupe A, etc. Cette méthode permet notamment de s’affranchir d’un effet temps : permet de garder comparable le nombre de patients inclus en février dans les deux groupes (épidémie de grippe et surmortalité…) par exemple. La taille des groupes peut être variable, mais doit rester inconnue de l’investigateur pour respecter l’assignation secrète : l’investigateur ne doit pas pouvoir deviner dans quel groupe sera randomisé son malade ;
- randomisation en cluster : on randomise les patients en groupes entiers (tous les patients de l’hôpital A recevront le traitement expérimental, et tous les patients de l’hôpital B le traitement de référence). Cela permet d’éviter des erreurs de délivrance, principalement, et donc la contamination entre les bras ;
- randomisation par minimisation : forme particulière de randomisation par stratification, poussée à l’extrême. À chaque nouveau patient, le statisticien choisit le groupe pour assurer la meilleure comparabilité entre les deux groupes. Surtout utile pour les petits effectifs.
Question 5 : Concernant le critère de jugement principal dans cette étude
Deux critères de jugement principal sont analysés de manière séparée dans cet essai : la survie sans progression de la maladie (PFS pour progression-free survival en anglais) et la survie globale (toute cause). Il s’agit des 2 critères de jugement principal les plus répandus en oncologie
Un critère de jugement principal (CJP) composite combine plusieurs critères en un seul CJP. Par exemple : la survenue d’une embolie pulmonaire ou d’un décès toute cause est un CJP composite
La mesure de la progression ou régression de la maladie avec les critères RECIST correspond à une mesure d’images radiologiques (cf. « Précision », au début de la LCA)
Une mesure radiologique est facilement reproduite
La mortalité spécifique correspond à la mortalité due à la pathologie étudiée. Ce n’est pas le CJP ici
Un critère de bonne qualité est un critère :
- objectif : c’est-à-dire non subjectif (évaluation de la douleur, de la qualité de vie). Cela permet de minimiser les biais d’évaluation et donc d’augmenter la validité interne ;
- directement lié à l’objectif clinique : par opposition à un critère intermédiaire, dans lequel je substitue l’effet clinique recherché par un critère de jugement plus facile à mesurer et supposé corrélé à l’effet clinique. Par exemple, le fait de mesurer l’HbA1c pour un nouvel antidiabétique oral correspond à un critère intermédiaire, alors que le critère directement lié à l’objectif clinique serait la mortalité spécifique ;
- consensuel, pertinent, reproductible et défini a priori.
- objectif : c’est-à-dire non subjectif (évaluation de la douleur, de la qualité de vie). Cela permet de minimiser les biais d’évaluation et donc d’augmenter la validité interne ;
- directement lié à l’objectif clinique : par opposition à un critère intermédiaire, dans lequel je substitue l’effet clinique recherché par un critère de jugement plus facile à mesurer et supposé corrélé à l’effet clinique. Par exemple, le fait de mesurer l’HbA1c pour un nouvel antidiabétique oral correspond à un critère intermédiaire, alors que le critère directement lié à l’objectif clinique serait la mortalité spécifique ;
- consensuel, pertinent, reproductible et défini a priori.
Dans la partie Methods, il est écrit : “Patients were assessed for tumor response [...] at 12 weeks after randomization, then every 6 weeks for 49 weeks, and then every 12 weeks until progression or treatment discontinuation, whichever occurred later”.
Le plus souvent, en oncologie, on évalue l’efficacité d’un traitement tous les 3 mois.
Le plus souvent, en oncologie, on évalue l’efficacité d’un traitement tous les 3 mois.
Question 6 : L’augmentation du nombre d’évaluations scannographiques dans cet essai peut être responsable de
La multiplication des examens radiologiques permettra d’objectiver la progression tumorale plus rapidement après sa survenue. À l’inverse, l’espacement trop important entre 2 examens d’imagerie peut conduire à une surestimation de la PFS : par exemple si le maladie progresse réellement après 4 mois de traitement, mais qu’on ne le met en évidence qu’après 6 mois, on surestime de 2 mois la PFS
On augmente justement la précision du classement entre patients ayant rencontré le CJP et ne l’ayant pas encore rencontré
Si on évaluait le malade par un scanner toutes les 6 semaines dans l’étude, alors que dans mon centre je n’ai pas d’accès aussi facile à un scanner et ne peux en faire aussi fréquemment, alors cela diminue la validité externe
Toujours, dans le cas d’examens irradiants
Il s’agissait d’une question de compréhension : chaque élément de la méthode peut donner lieu à un biais.
On rappelle la différence entre validité interne et externe :
- la validité interne : correspond à la qualité méthodologique d’une étude. Elle augmente avec la comparabilité des groupes, le faible nombre de biais… ;
- la validité externe : correspond à l’applicabilité de l’étude à mes patients. Elle diminue avec la multiplication des critères d’inclusion et des critères d’exclusion. La question est donc : les résultats de cette étude, réalisée sur une population très sélectionnée, peut-elle s’appliquer à mon malade « tout-venant » ?
On rappelle la différence entre validité interne et externe :
- la validité interne : correspond à la qualité méthodologique d’une étude. Elle augmente avec la comparabilité des groupes, le faible nombre de biais… ;
- la validité externe : correspond à l’applicabilité de l’étude à mes patients. Elle diminue avec la multiplication des critères d’inclusion et des critères d’exclusion. La question est donc : les résultats de cette étude, réalisée sur une population très sélectionnée, peut-elle s’appliquer à mon malade « tout-venant » ?
Dans la partie Methods - Study Oversight, il est écrit : “Data were collected by the sponsor and analyzed in collaboration with all the authors”.
Question 7 : Concernant les différents intervenants dans un essai contrôlé randomisé
Ce rôle est celui de l’investigateur, et non du promoteur ! Ici, ce n’était donc pas au sponsor d’analyser les données
L’investigateur est en charge de la question scientifique et se doit de définir le protocole, c’est-à-dire le mode de réponse à la question posée
En effet, c’est le rôle majeur du promoteur : le financement et l’organisation logistique de l’essai
Comme toute la partie scientifique et médicale, le suivi des patients est de la responsabilité de l’investigateur
Cf. dans Methods - Study Oversight : “The trial was designed as a collaboration between the senior academic authors and the sponsor, Bristol-Myers Squibb”
Le promoteur est ici le laboratoire Bristol-Myers Squibb, producteur du nivolumab et de l’ipilimumab. Il finance cette étude dans le but de faire passer ces traitements en première ligne. Les investigateurs sont choisis par le promoteur et correspondent aux personnes citées dans l’en-tête : J. Larkin, V. Chiaron-Sileni…
Leurs rôles sont distincts :
- Le promoteur : rôle principalement logistique
o finance l’essai, fournit les médicaments ;
o contracte une assurance ;
o se charge d’obtenir toutes les autorisations nécessaires au lancement de l’étude ;
o désigne les investigateurs.
- Les investigateurs : rôle principalement scientifique
o correspondent aux auteurs de l’étude, c’est-à-dire les médecins en charge de l’étude ;
o rédigent le protocole ;
o responsables de l’inclusion et du suivi des malades ;
o produisent les résultats de l’essai ;
o absence de conflits d’intérêts avec le promoteur.
Leurs rôles sont distincts :
- Le promoteur : rôle principalement logistique
o finance l’essai, fournit les médicaments ;
o contracte une assurance ;
o se charge d’obtenir toutes les autorisations nécessaires au lancement de l’étude ;
o désigne les investigateurs.
- Les investigateurs : rôle principalement scientifique
o correspondent aux auteurs de l’étude, c’est-à-dire les médecins en charge de l’étude ;
o rédigent le protocole ;
o responsables de l’inclusion et du suivi des malades ;
o produisent les résultats de l’essai ;
o absence de conflits d’intérêts avec le promoteur.
Dans la partie Methods - Statistical Analysis, il est écrit : “A study sample of approximately 915 patients was planned”.
Question 8 : Le(s) élément(s) nécessaire(s) pour le calcul du nombre de sujets nécessaires (NSN) sont le(s) suivant(s)
La prévalence n’influe pas sur le nombre de sujets nécessaires, mais peut jouer un rôle sur la difficulté à recruter ce nombre établi a priori
La différence attendue est ici exprimée avec le Hazard Ratio (HR = 0,71), fondé sur l’essai de phase II ayant précédé cette étude
La puissance correspond à 1-β, le risque de deuxième espèce
Le nombre de sujets nécessaires (NSN) correspond au nombre de malades à inclure dans l’étude, calculé a priori, à l’aide :
- du risque alpha de première espèce (cf. question 9) ;
- du risque bêta de deuxième espèce ;
- taille de la différence à mettre en évidence : souvent à l’aide de l’essai de phase II ayant précédé l’étude. Plus la différence attendue est grande, moins le nombre de malades à inclure pour obtenir un résultat statistiquement significatif est important ;
- variance du critère de jugement principal ;
- dans certaines études, on doit aussi prendre en compte l’estimation du nombre de perdus de vue (études sur le sevrage, ou auprès de populations où un nombre important de perdus de vue est attendu).
- du risque alpha de première espèce (cf. question 9) ;
- du risque bêta de deuxième espèce ;
- taille de la différence à mettre en évidence : souvent à l’aide de l’essai de phase II ayant précédé l’étude. Plus la différence attendue est grande, moins le nombre de malades à inclure pour obtenir un résultat statistiquement significatif est important ;
- variance du critère de jugement principal ;
- dans certaines études, on doit aussi prendre en compte l’estimation du nombre de perdus de vue (études sur le sevrage, ou auprès de populations où un nombre important de perdus de vue est attendu).
Question 9 : En ce qui concerne le risque d’erreur a priori dans cette étude
Il était de 0,5 % ! Cf. dans Methods - Statistical Analysis: “at a type I error rate of 0,005”, soit 0,5 %
Le risque β de deuxième espèce correspond à 1 - puissance (cf. ci-dessous), soit 1 - 83 % = 17 %. La puissance correspond quant à elle à 1-β
Elle correspond au risque de conclure à une différence alors qu’elle n’existe pas (elle serait alors uniquement due au hasard dans l’échantillon)
Comme décrit ci-dessous, la puissance a priori est définie en fonction du risque de deuxième espèce
Le risque alpha de première espèce correspond à la probabilité de conclure à une différence alors qu’elle n’existe pas. Il était fixé à 0,5 % a priori, dans cette étude.
Le risque bêta de deuxième espèce correspond à la probabilité de ne pas conclure à une différence alors qu’elle existe vraiment.
La puissance correspond à la probabilité de conclure à une différence qui existe vraiment. Elle correspond à 1 - β et était ici fixée à 83 % : il existait 83 % de chance a priori que, si le traitement par nivolumab + ipilimumab était bien supérieur aux autres, l’étude soit positive.
Le risque bêta de deuxième espèce correspond à la probabilité de ne pas conclure à une différence alors qu’elle existe vraiment.
La puissance correspond à la probabilité de conclure à une différence qui existe vraiment. Elle correspond à 1 - β et était ici fixée à 83 % : il existait 83 % de chance a priori que, si le traitement par nivolumab + ipilimumab était bien supérieur aux autres, l’étude soit positive.
Question 10 : En ce qui concerne leTableau 1 (p. 5)
Il n’y a normalement pas de test statistique dans un Tableau 1 (comparabilité des groupes après randomisation) et on compare juste « visuellement » l’absence de différence majeure entre les groupes. La multiplication des tests statistiques peut être responsable de tests faussement significatifs
La randomisation ayant été stratifiée sur le statut BRAF, PDL1 et le stade métastatique, il n’y aura pas de différence sur ces éléments entre les groupes, et il ne s’agit pas d’un critère de qualité de la randomisation. En revanche, la comparabilité des autres éléments du Tableau 1 sont des témoins de la bonne qualité de la randomisation
Il existe certes numériquement une différence, mais elle n’est pas significative : on ne réalise normalement pas de test statistique sur un Tableau 1, même si, ici, ils avaient été réalisés et négatifs : “There were no significant between-group differences at baseline” sous le Tableauau
Il existe certes numériquement une différence, mais elle n’est pas significative : on ne réalise normalement pas de test statistique sur un Tableau 1, même si, ici, ils avaient été réalisés et négatifs : “There were no significant between-group differences at baseline” sous le Tableauau
Le biais lié à une mauvaise comparabilité des groupes est un biais de sélection
La comparabilité des groupes de traitement est cruciale pour la qualité d’une étude : si on la perd, on s’expose à un biais de sélection.
Elle doit être constante dans le temps :
- comparabilité initiale des groupes : assurée par la qualité de la randomisation. On la vérifie à l’aide du Tableau 1, sur lequel on ne réalise classiquement pas de test statistique pour les raisons sus-citées ;
- comparabilité en cours d’étude : respect du double aveugle pour éviter deux biais principaux :
o biais de suivi ;
o biais d’évaluation ;
- comparabilité au moment de l’analyse des résultats : analyse en ITT (intention de traiter) permet de s’assurer que la comparabilité initiale des groupes est respectée (cf. rappel question 12).
Elle doit être constante dans le temps :
- comparabilité initiale des groupes : assurée par la qualité de la randomisation. On la vérifie à l’aide du Tableau 1, sur lequel on ne réalise classiquement pas de test statistique pour les raisons sus-citées ;
- comparabilité en cours d’étude : respect du double aveugle pour éviter deux biais principaux :
o biais de suivi ;
o biais d’évaluation ;
- comparabilité au moment de l’analyse des résultats : analyse en ITT (intention de traiter) permet de s’assurer que la comparabilité initiale des groupes est respectée (cf. rappel question 12).
Dans la partie Results - Efficacy, les auteurs écrivent (p. 4) : “The hazard ratio for the comparison between the nivolumab-plus-ipilimumab group and the nivolumab group was 0.74 (95% CI, 0.60 to 0.92) ”
Question 11 : Concernant cette affirmation
L’intervalle de confiance ne croisait pas 1, et on pouvait donc conclure qu’il existait une supériorité (car HR < 1) significative du nivolumab + ipilimumab par rapport au nivolumab
Attention à bien comprendre le contexte de l’étude : on n’a pas les résultats de survie globale, non matures au moment de cette publication. L’événement « progression tumorale » arrive plus vite que l’événement « décès », et la survie globale met donc plus longtemps à atteindre le nombre d’événements nécessaires à une significativité
Le HR correspond à un ratio, il faut donc que son intervalle ne croise pas 1 pour être significatif, ce qui n’est pas le cas pour une différence.
On compare les ratios à 1 et les différences à 0. Ici, le HR étant inférieur à 1, il est en faveur du traitement par nivolumab + ipilimumab
Pour conclure à la significativité d’un résultat, il faut l’un des deux éléments suivants :
- une p-value < 0,05 : le « p » correspond à la probabilité que le résultat observé ne soit dû qu’au hasard. Si elle est inférieure à 5 % (ou 0,05), le résultat est considéré comme statistiquement significatif ;
- un intervalle de confiance à 95 % qui :
o ne croise pas 0 pour une différence : réduction de risque… ;
o ne croise pas 1 pour un rapport : odds-ratio, risque relatif, hazard-ratio.
Si l’intervalle de confiance à 95 % ne croise pas 0 ou 1 dans mon effectif, cela signifie que la vraie valeur a 95 % de ne pas être 0 ou 1, et donc le résultat est significatif.
Le Hazard Ratio (HR) correspond quant à lui à un rapport de cotes (comme un odds-ratio), mais dans le temps, dans le cadre d’une courbe de survie. Par exemple, le HR à 0,74 en faveur du groupe nivolumab-ipilimumab signifie que les malades ont 26 % de chance en moins de progresser au cours du temps.
- une p-value < 0,05 : le « p » correspond à la probabilité que le résultat observé ne soit dû qu’au hasard. Si elle est inférieure à 5 % (ou 0,05), le résultat est considéré comme statistiquement significatif ;
- un intervalle de confiance à 95 % qui :
o ne croise pas 0 pour une différence : réduction de risque… ;
o ne croise pas 1 pour un rapport : odds-ratio, risque relatif, hazard-ratio.
Si l’intervalle de confiance à 95 % ne croise pas 0 ou 1 dans mon effectif, cela signifie que la vraie valeur a 95 % de ne pas être 0 ou 1, et donc le résultat est significatif.
Le Hazard Ratio (HR) correspond quant à lui à un rapport de cotes (comme un odds-ratio), mais dans le temps, dans le cadre d’une courbe de survie. Par exemple, le HR à 0,74 en faveur du groupe nivolumab-ipilimumab signifie que les malades ont 26 % de chance en moins de progresser au cours du temps.
Question 12: En ce qui concerne laFigure 1 (p. 6)
Les courbes de Kaplan-Meier sont des courbes de survie
Les courbes de Kaplan-Meier sont des courbes de survie
Le waterfall plot représente la meilleure réponse au traitement (en ordonnée) de chaque malade (en abscisse), comme sur la figure 2
La courbe A correspond à la « Intention-to-Treat Population » : les patients sont analysés dans le groupe dans lequel ils ont été randomisés, et non en fonction du traitement effectivement reçu
La comparaison entre deux courbes de Kaplan-Meier se fait à l’aide d’un test du Log Rank
Explication Kaplan-Meier et comparaison via Log Rank + population en ITT.
La figure 1 correspond à une courbe de Kaplan-Meier : il s’agit du nom consacré d’une courbe de survie (ici, la survie sans progression).
On peut comparer deux courbes de Kaplan-Meier à l’aide du test du Log Rank. L’analyse multivariée (c’est-à-dire la correction de l’éventuelle covariance de certains paramètres dans cette étude) se fait à l’aide du modèle de Cox.
Il existe plusieurs moyens d’analyser la population finale en fonction du traitement reçu :
- analyse en intention de traiter : on analyse les patients dans le groupe où ils ont réellement été randomisés, quel que soit le traitement effectivement reçu. En d’autres termes, si un patient du groupe placebo reçoit le traitement expérimental, il sera tout de même analysé comme ayant reçu le placebo. Cela a deux avantages :
o diminution du biais d’attrition : c’est-à-dire de la perte de comparabilité initiale des deux groupes en cours d’étude ;
o plus proche des « conditions de la vie réelle » : on ne sait pas toujours si le patient va effectivement prendre son traitement… ;
- analyse en perprotocole : j’analyse les patients dans le groupe où ils ont été randomisés s’ils ont effectivement le traitement approprié ;
- analyse en traitement reçu : j’analyse les patients en fonction du traitement qu’ils ont effectivement reçu. En d’autres termes, si un patient du groupe A a reçu le traitement B, il sera analysé dans le groupe B.
La figure 1 correspond à une courbe de Kaplan-Meier : il s’agit du nom consacré d’une courbe de survie (ici, la survie sans progression).
On peut comparer deux courbes de Kaplan-Meier à l’aide du test du Log Rank. L’analyse multivariée (c’est-à-dire la correction de l’éventuelle covariance de certains paramètres dans cette étude) se fait à l’aide du modèle de Cox.
Il existe plusieurs moyens d’analyser la population finale en fonction du traitement reçu :
- analyse en intention de traiter : on analyse les patients dans le groupe où ils ont réellement été randomisés, quel que soit le traitement effectivement reçu. En d’autres termes, si un patient du groupe placebo reçoit le traitement expérimental, il sera tout de même analysé comme ayant reçu le placebo. Cela a deux avantages :
o diminution du biais d’attrition : c’est-à-dire de la perte de comparabilité initiale des deux groupes en cours d’étude ;
o plus proche des « conditions de la vie réelle » : on ne sait pas toujours si le patient va effectivement prendre son traitement… ;
- analyse en perprotocole : j’analyse les patients dans le groupe où ils ont été randomisés s’ils ont effectivement le traitement approprié ;
- analyse en traitement reçu : j’analyse les patients en fonction du traitement qu’ils ont effectivement reçu. En d’autres termes, si un patient du groupe A a reçu le traitement B, il sera analysé dans le groupe B.
Question 13 : En ce qui concerne le Tableau 2 (p. 7):
Ce chiffre est vrai pour le groupe nivolumab + ipilimumab
Dans le groupe nivolumab + ipilimumab, on avait 57,6 % de réponses (11,5 % de réponses complètes et 46,2 % de réponse partielle) et 13,1 % de maladie sTableau. Soit un total de 70,8 % de malades avec une maladie sTableau ou en diminution
Il n’y a pas de test statistique pour ce résultat. Le seul test statistique présenté dans ce Tableauau concerne le taux de réponse objective par rapport au groupe ipilimumab
Les deux intervalles de confiance à 95 % ne se croisaient pas (28,1-49,3 pour nivolumab seul et 52,0-63,2 pour l’association), ce qui permet d’affirmer qu’il existe moins de 5 % de chance que le taux de réponse des deux groupes soit le même : le résultat est statistiquement significatif
C’est la définition même du « p < 0,001 » pour « Objective Response » du groupe nivolumab + ipilimumab
Les auteurs écrivent dans la partie Results - Adverse Events : “One death due to toxic effects of the study drug was reported in the nivolumab group (neutropenia) and one in the ipilimumab group (cardiac arrest), but none were reported in the nivolumab-plus-ipilimumab group.”
Question 14 : En ce qui concerne cette phrase et le profil de sécurité des traitements expérimentaux de cette étude :
Il suffit de regarder le Tableau 3 pour se rendre compte de l’augmentation des effets indésirables dans le groupe nivolumab + ipilimumab : le profil de sécurité est bien moins bon !
Ces chiffres concernent les colites tous grades confondus. Les colites de grade 3 ou 4 représentaient quant à elles 7,7% des patients
Seuls les effets indésirables concernant plus de 10 % de la population dans l’un des groupes étaient présentés (cf. sous le Tableau 3 : “The treatment-related adverse events listed here were those reported in at leaast 10% of the patients in any of the three study groups”
Cf. dernière phrase de la partie Results : “As in prior studies, most endocrine events did not resolve”
Question 15 : En tant que praticien, et après avoir lu cette étude, quelle(s) conclusion(s) tirez-vous de cette étude ?
Les traitements expérimentaux présentés ici n’étaient pas comparés aux thérapies ciblant la mutation BRAF V600, comme le vémurafénib. On ne sait donc pas, à l’issue de cette étude, quel traitement doit être utilisé en priorité entre les anti-BRAF et la double immunothérapie. En pratique, les patients mutés BRAF seront d’abord traités par une thérapie ciblant BRAF, puis par une immunothérapie à progression
Ces résultats sont interpréTableaus tels quels, car il s’agit d’une stratification et d’une analyse prévue a priori. La médiane de survie sans progression était de 14 mois dans le groupe nivolumab comme nivolumab + ipilimumab, et il n’y a donc pas de bénéfice à la double immunothérapie chez les patients PDL1
Attention à ne pas perdre de vue le cadre de l’étude : il s’agissait seulement des patients naïfs de tout traitement. On ne sait pas quel est le bénéfice à ajouter de l’ipilimumab au nivolumab après un traitement de première ligne par ipilimumab. Toutefois, cette question devient moins pertinente après cette étude : les patients ne recevront normalement plus d’ipilimumab en monothérapie en première ligne
Avec une toxicité du traitement aussi importante, il est légitime de réfléchir au bénéfice attendu de la double association. Ainsi, bien souvent, chez des patients en mauvais état général, on préférera une monothérapie en première intention
Cette étude a eu un impact majeur dans la prise en charge du mélanome métastatique en première ligne :
- si mutation BRAF V600 : thérapie ciblée anti-BRAF, puis nivolumab-ipilimumab à progression ;
- si pas de mutation BRAF V600 : nivolumab-ipilimumab si bon état général et bonne réponse attendue (à cause du profil de toxicité), nivolumab en monothérapie sinon.
- si mutation BRAF V600 : thérapie ciblée anti-BRAF, puis nivolumab-ipilimumab à progression ;
- si pas de mutation BRAF V600 : nivolumab-ipilimumab si bon état général et bonne réponse attendue (à cause du profil de toxicité), nivolumab en monothérapie sinon.
Une étude transversale correspond à une photographie à un instant t dans le cadre d’études observationnelles. Ici, l’étude étant interventionnelle et ayant un suivi dans le temps, il ne pouvait pas s’agir d’une étude transversale.
Par ailleurs, attention à ne pas confondre les études prospectives et rétrospectives :
- dans une étude rétrospective : on inclut le patient a posteriori, c’est-à-dire qu’on va chercher dans le dossier médical du patient le traitement reçu et la réponse (ou l’exposition à un facteur et l’apparition d’une maladie, par exemple) après que ceux-ci aient eu lieu ;
- dans une étude prospective : on inclut le patient, puis on l’expose au traitement (ou on mesure son exposition à un facteur de risque dans des études observationnelles) et on mesure, en le suivant dans le temps, la réponse au traitement ou l’apparition d’une maladie.