Rappel : après la randomisation qui permet d’obtenir au début de l’essai des groupes similaires, l’aveugle permet de conserver au fil de l’essai une similarité de prise en charge des différents groupes et d’éliminer ce qui peut influencer le résultat de chaque groupe
La différence de résultat entre les groupes ne sera ainsi liée qu’à la différence d’effet « biologique propre» entre les thérapeutiques administrées. C’est idéalement ce que l’on veut connaître.
L’aveugle est simple, double, « entre les deux » ou triple. Ces termes (le troisième étant une proposition personnelle) s’appliquent au patient et aux médecins impliqués dans le suivi du patient.
Le simple aveugle signifie qu’un des deux sait, l’autre non (en général c’est le médecin qui sait).
Le double aveugle signifie qu’aucun ne sait.
« Entre les deux » signifie que le patient ne sait pas et qu’il y a deux médecins qui suivent le patient pendant l’essai : un des deux médecins (médecin évaluateur) réalisera les évaluations des critères d’efficacité, le second (médecin traitant) surveillera la tolérance, le bon suivi du traitement et gérera le patient. L’objectif est d’éviter que celui qui évalue l’évolution du patient soit au courant du traitement pris (grâce à des effets secondaires spécifiques par exemple)
Le triple aveugle est pour certain ce que j’ai appelé « l’entre deux » ou le fait que les analyses sont faites à l’aveugle.
Bien sûr, vous ne verrez jamais le terme « entre les deux » dans une publication. De même que vous verrez que très rarement la liste des personnes qui auront accès à une information globale en cours d’essai : données du médecin traitant et du médecin évaluateur (ou données de suivi et groupe du patient). Et pourtant, il y en a beaucoup, en premier lieu les statisticiens et les responsables des bases de données, dans certains cas des comités de validation ou de suivi. Si l’essai est tronqué, cela signifie qu’il existe une base commune analysée régulièrement. Si des analyses intermédiaires sont prévues, il y a forcément quelqu’un qui a la globalité des informations avant la fin de l’essai !
L’aveugle dans un essai clinique est important. De nombreuses méthodes existent pour l’obtenir.
On sait que les essais sans double aveugle sont plus souvent positifs que les essais en double aveugle… Les évaluations faites par un observateur qui n’est pas en aveugle sont plus souvent positives (i.e. favorables au traitement par rapport au placebo) que celles réalisées par un observateur en aveugle. Noseworthy avait déjà souligné la nécessité d’une évaluation à l’aveugle dans les essais sur la sclérose en plaques mais n’avait alors pas mis en évidence de différence selon que le patient connaissait ou non son traitement. Dans les études Tecfidera, les patients qui ont ressenti en début de traitement un effet indésirable spécifique (flushing) du médicament ont tiré un meilleur bénéfice du traitement.
Dans la note d’information fournie au patient au début de l’essai, il est obligatoirement fait mention des risques des médicaments. Donc dans les essais contre placebo, si le médicament a un effet indésirable spécifique survenant en début de traitement, il est facile pour le patient de connaitre le groupe auquel il a été attribué. S’il n’y a qu’un seul médecin, évaluateur et traitant, l’aveugle sera aussi levé pour le médecin. Si l’effet indésirable est biologique, le patient peut avoir plus de difficultés à identifier son groupe mais le médecin le reconnaitra.
Le patient pourra aussi reconnaitre le médicament pris si la méthode utilisée pour masquer la différence est inadéquate (en ouvrant les gélules par exemple).
Bien évidemment, il y a des essais pour lesquels le double aveugle annoncé a pu être conservé. L’important est de pouvoir déterminer les essais où il y a pu avoir une levée de l’aveugle et si cette levée de l’aveugle a modifié les résultats.
La première approche est de considérer que les essais cliniques qui évaluent des médicaments sur des critères objectifs sont moins à même d’être entachés par la levée de l’aveugle que ceux dont les critères d’évaluation sont basés sur des informations subjectives. On imagine mal effectivement que la force de conviction du médecin ou la puissance d’autosuggestion du patient puisse retarder le moment de sa mort. Pour d’autres critères, le caractère subjectif ou objectif est parfois difficile à établir. Certaines échelles (exemple de l’EDSS dans la sclérose en plaques) sont basées sur des critères subjectifs et plus ou moins objectifs. Une revue récente souligne les différences de résultats entre les observateurs en aveugle et en non-aveugle dans plusieurs pathologies mais sur des critères subjectifs.
Cependant, si la probabilité de survenue d’un critère objectif (par exemple la mort) varie selon des facteurs connus en début d‘essai, il est possible de sortir prématurément les patients d’un des groupes. Cela n’est pas à proprement dit un biais mais une fraude si les exclusions sont faites à dessein. Néanmoins la conséquence est la même : le résultat sera modifié. D’où l’importance de connaitre avec précision les sorties d’essai et de disposer du profil initial et de début d’essai de ces patients. Ces informations ne peuvent généralement être obtenues qu’en retournant aux données individuelles.
En pratique, que proposer pour vérifier l’impact d’une éventuelle levée de l’aveugle.
- Faire les vérifications d’usage sur le protocole, les évaluateurs, les méthodes d’obtention de l’aveugle, les situations permettant un regroupement des données d’efficacité et de tolérance (comités, analyse intermédiaires, arrêt prématuré de l’essai).
- Evaluer les perdus de vue : Comme d’habitude, juste pour évaluer si un biais d’attrition est possible et si les patients sortis de l’étude présentent des caractéristiques spécifiques. Si tel était le cas, on pourrait alors naviguer entre le biais et la fraude.
- Rechercher les éléments permettant de lever l’aveugle : Il s’agit principalement des événements indésirables spécifiques survenant en début d’essai, cliniques ou biologiques. Ces effets peuvent être de diverse nature : flushing, syndrome pseudo-grippal, douleur au site d’injection, toux et tous les autres. Il peut aussi s’agir d’effets cliniques ou biologiques liés à l’effet propre du produit. Si x% des patients sous traitement et y% des patients sous placebo présentent l’effet indésirable, la probabilité pour un patient présentant l’effet indésirable d’être sous traitement est de x/(x+y) (groupes égaux). L’opportunité de ce choix surviendra dans (x+y)/2 pourcentage des cas (exemple de deux groupes de taille égale). Il n’est pas inutile de regarder si certains éléments connus au début de l’essai (caractéristiques initiales ou de l’évolution immédiate des patients) permettent aussi de suspecter une évolution favorable ou défavorable des patients. Mais dans ce cas, on s’approche de la fraude…
- Poser la question aux patients et aux investigateurs : Dans certains essais sont prévus des questionnaires, soit pour les patients, soit pour les investigateurs afin de rechercher si les premiers ont deviné le traitement qu’ils ont pris et si les seconds ont deviné le traitement pris par chaque patient. On obtient alors des tableaux de contingence reliant le traitement effectivement reçu et le traitement supposé reçu. Le questionnaire peut être posé à plusieurs reprises au cours de l’essai. Le questionnaire repose sur une question à choix multiple de ce style: Certainement reçu le traitement A, Probablement reçu le traitement A, Ne sait pas, Probablement reçu le traitement B, Certainement reçu le traitement B. Certains questionnaires ne comportent que 3 questions ; dans certains cas, « ne sait pas » n’est pas proposé. Plusieurs méthodes statistiques (James’ blinding index et Bang’s Blinding index) sont décrits permettant de définir si l’aveugle « a marché » ou non. Une revue des méthodes est là. Selon la valeur des index, on peut ainsi avoir une idée de l’aveugle. Mais malheureusement, ces questionnaires sont peu décrits dans les essais. Il y a en plus un conflit d’intérêt lors de leur remplissage ; de la part du médecin qui « pourrit » l’essai s’il avoue qu’il savait quel traitement prenait chaque patient et de la part du patient qui n’ose avouer qu’il a réussi à percer un mystère que le médecin voulait lui cacher.
- Analyser les résultats d’efficacité en fonction des éléments observés aux deux précédents points : Si certains éléments (effet indésirable, modification de paramètres biologiques..) permettent de suspecter une levée de l’aveugle, il est aussi possible d’analyser l’efficacité du produit selon que le patient a ressenti l’effet en cause ou que l’effet biologique était notable ou plus faible. C’est ce qui a été fait dans les études sur Tecfidera par la FDA (mais ne figure pas dans les publications du NEJM). Ces recherches sont rarement réalisées et encore plus rarement publiées.
Maintenant qu’on a vu que l’aveugle de l’essai était bien-voyant, on fait quoi ?
On publie les résultats des analyses sur l’aveugle : c’est la moindre des choses.
Puis en fonction du critère, son objectivité en particulier et l’ampleur de la différence observée, on peut discuter le résultat et sa validité. Il serait intéressant de savoir, par exemple, si les résultats en IRM des études Tecfidera ont aussi été affectés par la levée de l’aveugle. Enfin et malheureusement, la levée de l’aveugle peut parfois ouvrir la porte à la fraude et il faut être vigilant sur tous les autres critères de validité de l’essai.
Ce serait bien si une vérification de l’aveugle était réalisée pour tous les essais.