Les courbes de survie et l’analyse de survie sont de plus en plus utilisées pour l’évaluation des médicaments.
Selon Medline, 10% des articles sur « human » avec les filtres human et clinical trial sont indexés « survival analysis » en 2013. Ce pourcentage est en augmentation constante depuis les années 70. Les analyses de survie dans les essais cliniques concernent principalement les anticancéreux et les médicaments de prévention cardio-vasculaire.
Les courbes de survie sont utilisables pour toute évaluation d’un produit sensé agir sur la survenue d’un événement unique en modifiant sa date de survenue et/ou sa probabilité de survenue (au cours du suivi).
Ces événements uniques sont le décès, la progression d’un déficit, l’atteinte d’un stade ou d’un seuil, une guérison, la survenue d’un premier épisode…Mais tout critère d’évaluation peut être transformé en critère analysable sur des courbes de survie.
L’utilisation des courbes de survie a de nombreux avantages pour celui qui veut obtenir un résultat positif pour son médicament ; en particulier ce type d’essai officialise les données manquantes
Et il y aura beaucoup de données manquantes car l’étude peut être (et sera) arrêtée à une date choisie par le sponsor de l’étude (date de point). Il n’est pas nécessaire d’attendre que tous les patients (restant vivants…) aient été suivis pendant une durée préétablie.
Ainsi, la date de point étant fixe et les patients étant inclus à des dates différentes, les patients sont suivis pendant des durées variables. Il y aura ceux qui :
- N’ont pas validé le critère évalué à la date de point
- Ont validé le critère évalué avant la date de point
- Sont sortis de l’essai avant la date de point sans avoir validé le critère évalué (perdus de vue ou survenue d’un événement empêchant la validation ultérieure du critère)
La durée de participation dans l’essai ne permet donc pas de distinguer ces trois groupes de patients.
L’analyse des courbes de survie nécessite la prise en compte des données censurées qu’il s’agisse des données manquantes liées aux perdus de vue ou celles des patients qui n’ont pas été suivis pendant la totalité de l’essai (quand il existe une « totalité »).
Ces analyses des courbes de suivi sont possibles si la probabilité de validation du critère par les patients du groupe 3 (après la sortie de l’essai) n’est pas différente de celle des autres patients restant dans l’essai. En d’autres termes, il ne faut pas que la sortie soit liée à l’évolution ultérieure du patient.
Et ça, il n’y a pas de moyen de le savoir puisque par définition les patients sont perdus de vue…
Comment bien profiter de cette caractéristique des essais basés sur une courbe de survie pour améliorer ses résultats ?
Pour augmenter la probabilité de mettre en évidence une différence significative en faveur d’un verum par rapport au placebo (ou produit A versus produit B), il faut (évidemment) sortir les patients à fort risque de valider le critère du groupe verum et les patients à faible risque du groupe placebo.
Il est préférable de sortir les patients du groupe placebo après une courte durée de participation car ils influenceront toutes les probabilités calculées ultérieurement en diminuant le dénominateur. Ceux du groupe verum doivent être conservés le plus longtemps possible avant le moment fatidique car il faut qu’ils augmentent le dénominateur sans augmenter le numérateur.
Facile, non ?
Il y a néanmoins quelques conditions mais elles sont assez aisées à remplir.
I. Il faut que le produit testé puisse rapidement être distingué du placebo par un effet indésirable immédiat et spécifique, permettant la levée de l’aveugle. C’est assez fréquent.
II. Il faut ensuite pouvoir prévoir le risque de valider le critère évalué pour certains patients. Généralement, c’est aussi possible car il y a toujours des facteurs de risque. Il y a ceux qui serviront de variables d’ajustement mais les ajustements peuvent minimiser l’impact des efforts destinés à biaiser l’essai et certaines analyses de contrôle réalisées pourraient se révéler étonnantes. Ce serait dommage, après tant d’efforts ! Il est préférable d’en choisir d’autres, si possible indépendants de ceux prédéfinis dans le protocole comme variables d’ajustement. On pourra s’aider pour définir les patients à risque de valider le critère et biaiser l’essai de deux stratégies simples et efficaces.
- Pour pouvoir choisir les patients à sortir, on utilisera un critère « à double détente » comme par exemple celui utilisé dans la sclérose en plaques : augmentation du handicap confirmée à 3 mois. Il est aussi possible de prévoir que la première validation du critère « à double détente » ne peut se faire qu’au moment d’une consultation prévue dans le protocole (et non entre deux visites prévues au protocole). Seuls les patients ayant validé la première étape peuvent valider la seconde ! il suffit de les sortir avant cette seconde validation.
- Une autre méthode consiste à arrêter l’étude au moment le plus opportun. L’avantage de cette méthode est d’éviter de créer des perdus de vue et de rendre plus difficile leur analyse puisque les patients qui favorisent l’essai ne sont pas considérés comme tels. C’est un avantage majeur des essais basés sur une courbe de survie.
III. Pour bien biaiser l’essai, il faut aussi bien évidemment centraliser rapidement toutes les informations, par exemple pour un comité de surveillance quelconque et si possible fournir aux investigateurs des conditions adéquates pour créer des conditions de sortie des patients en cours d’essai (critères de sortie subjectifs, demandes réitérées de consentement).
Et c’est alors que l’on peut bénéficier pleinement des avantages des courbes de survie !
La description des caractéristiques initiales des patients prendra en compte tous les patients, même ceux sortis pour favoriser un bon résultat !
L’analyse des patients sortis de l’essai est donc très rarement disponible car leur « impact» sur le résultat est potentiellement identique à celui des derniers patients inclus dans l’essai. Il n’y donc aucune raison de les exclure des analyses ; ce d’autant que cette analyse est celle en ITT, considérée comme le gold standard.
Comment savoir si un biais lié à des sorties choisies existe ?
Je considère que l’on dispose des données individuelles de l’essai. La quantité de données disponibles est le principal facteur de succès pour la recherche de biais. Sans ces données, on ne peut pas faire grand-chose.
Une des premières évaluations à faire est de comparer la date d’inclusion des patients et leur durée de suivi. Cela permet de définir avec précision les sorties d’essai. En fonction du pourcentage de sorties d’essai, on peut déjà définir un risque de biais. On vérifiera leur répartition entre les groupes comparés, en nombre et en durée de participation.
On regarde ensuite le degré de significativité. Plus il est proche de 5%, plus il a pu être tentant de biaiser l’essai.
On vérifie que la règle d’arrêt de l’essai était bien décrite dans le protocole et qu’elle a été respectée.
On s’assure que les investigateurs, les différents comités, les statisticiens n’avaient pas connaissance du résultat par groupe et que la règle d’arrêt n’était donc basée que sur un nombre total sur les deux groupes comparés.
Ensuite, il faut vérifier si les conditions de réalisation citées ci-dessus sont réunies.
- Possibilité de levée de l’aveugle
- Possibilité de prévoir l’évolution des patients
- Centralisation rapide de l’information et organisation d’un cursus de sortie des patients (même si le biais peut être réalisé sur site)
A ce stade, on a donc un risque de biais, une idée de la force tentatrice et une notion de sa possibilité de réalisation.
Maintenant, il faut évaluer l’impact du biais éventuel sur le résultat. C’est là que ça se complique et c’est donc un des avantages des courbes de survie pour celui qui veut un résultat positif !
Diverses analyses peuvent être réalisées pour rechercher une « anomalie » qui permettra de mieux appréhender le résultat de l’essai.
- On peut analyser les caractéristiques des patients sortis (ou avec une courte durée de suivi), mais avec des moyennes et des écart-types, il est difficile de trouver une différence significative sur, a priori, peu de patients. Et en plus, une différence significative sur ces caractéristiques n’est pas nécessaire pour influencer le résultat. Ne rien voir sur ces analyses n’élimine pas un biais et il est peu probable de voir quelque chose !…
- On peut aussi évaluer quel aurait pu être le devenir de chaque patient en regardant l’évolution des patients comparables mais cela reste aléatoire compte tenu de la connaissance partielle des facteurs pronostiques. Cette évaluation est néanmoins très intéressante dans le cas des critères à « double détente « .
- Les stratégies consistant à attribuer une évolution spécifique à tous les patients sortis sont très strictes. Il s’agit de considérer les sorties d’essai comme ayant validé ou non le critère afin de défavoriser au maximum le traitement évalué ou de considérer qu’ils ont tous validé le critère. Faire disparaitre une différence entre les groupes par cette stratégie est assez facile s’il y a beaucoup de perdus de vue.
- Pour appréhender l’impact des patients à courte durée de suivi, on peut aussi tenter une comparaison du type ITT versus PP ; juste pour voir si les patients sortis d’essai influencent le résultat et dans quel sens. L’analyse PP ne porte donc que sur les patients qui ont validé le critère ou ont été suivis pendant une durée déterminée ; il faut choisir le délai le plus long possible avant que de multiples sortis d’essais ne puissent biaiser l’essai. L’analyse ITT prend en compte tous les patients. La comparaison permet d’évaluer l’impact des patients n’ayant pas validé le critère et ayant été suivis pendant une durée plus courte que celle que l’on détermine pour l’analyse (par exemple, à 6 mois, à 1 an..). Malheureusement, Cette comparaison des analyses ITT et PP ne permet d’évaluer que l’impact des perdus de vue (PDV) et sortis d’essai (SE) sur le dénominateur des calculs des probabilités. Cette comparaison peut aider mais ne permet pas de visualiser la totalité des impacts des PDV et SE (en particulier si un patient est sorti car il risque de valider le critère, l’ impact qu’il aurait du avoir sur le numérateur ne sera pas vu). Donc ne rien voir n’élimine pas le biais.
En fait, pour voir cet impact des PDV et SE, il faut peut-être mettre de côté le critère analysé sur des courbes de survie et se reporter sur les critères secondaires d’efficacité basés sur une fréquence d’événements ou une évolution d’un critère chiffré, plus ou moins régulière au fil du temps.
L’avantage de ces critères est l’existence probable de données chiffrées pour tous les patients quelque soit leur durée de suivi.
On pourra alors comparer des analyses de l’efficacité sur ces critères secondaires à différents points de suivi : sur les patients suivis au moins 6 mois, 1 an, à 2 ans, ou sur les 50% des patients suivis le moins longtemps versus les 50% suivis le plus longtemps.
Ces dernières analyses permettent de comparer les résultats sur ce critère secondaire, différents regroupements des patients selon leur durée de suivi, on peut alors vérifier l’absence de biais liés à un plus long suivi des patients favorisant l’issue positive de l’essai.
Mais ne vous faites pas trop d’illusions, ces analyses ne peuvent être réalisées qu’avec les données individuelles, très difficiles à obtenir,
Si vous voyez des bizarreries, continuez à chercher, vous être sur la bonne piste !
Malheureusement, la plupart de ces analyses sont peu sensibles ou peu spécifiques pour mettre en évidence les biais
C’est un grand avantage des analyses de survie !
Ainsi pour qui veux biaiser un essai basé sur une courbe de survie, il y a des moyens d’agir.
Et ce n’est pas le seul intérêt des études basées sur une courbe de survie. Ce type d’étude justifie l’arrêt prématuré de l’essai et lui permet donc de bénéficier de tous les avantages des essais tronqués .
Pour jouer : un fichier avec une comparaison de courbes de survie pour voir ce qui permet d’obtenir une différence significative.
