C’est un axiome de base : les données masquées sont les plus importantes pour la recherche de biais.
Il y a quelques jours une étude épidémiologique sur l’association entre l’exposition à des toxiques et la survenue d’un hypospadias a été publiée. C’est une étude cas-contrôles donc c’est l’odds-ratio (OR) qui permet d’analyser les résultats.
L’argument principal de l’équipe pour justifier l’impact des toxiques est un graphique présentant un odds-ratio à 11. Le résultat n’est pas dans l’abstract mais l’argument est celui avancé par le Pr Sultan lors de sa venue à la TAC (France Inter http://www.franceinter.fr/player/reecouter?play=1108237 ; début à 4’ 26’’), interrogé par le Docteur Dupagne, Maitre des Statalacons.
Voici le graphique :
Malheureusement, les données permettant d’obtenir ce résultat ne sont pas indiquées.
C’est le « trou » dans les données.
J’ai d’abord été étonné par le fait que 1,84 x 5,98 = 11,00 soit un résultat très très proche du résultat global présenté (égalité possible en raison des arrondis). Cela semblait trop simple dans une analyse multivariée. Et en plus l’OR de 5,98 était très différent du 3,13, non ajusté, mentionné dans l’article pour l’exposition « occupational ».
En fait, c’est très simple, il suffit de calculer les OR de la manière suivante : E1 est l’exposition environnementale, E2 est l’exposition « occupational » (celle de la mère chez elle ou à son travail).
M+ | M- | |||
E2+ | E2- | E2+ | E2- | |
E1+ | a | b | c | d |
E1- | e | f | g | h |
Le 1,84 correspond à : bh/df, il est calculé chez les patients E2- C’est donc l’OR de l’exposition environnementale chez les patients n’ayant pas d’exposition « occupational »
Le 5,98 correspond à : ad/bc, il est calculé chez les patients E1+ qui ont une exposition environnementale ; c’est l’OR de l’exposition « occupational » chez les patients avec exposition environnementale
Le 10,99 correspond à : ah/cf, c’est l’OR de double exposition versus aucune exposition. Le calcul exclut les patients ayant une seule exposition,
Et bh/df x ad/bc = abdh/bcdf = ah/cf CQFD
Bien évidemment, en excluant les patients des cases bedg, on réduit le nombre de patients de l’analyse et l’intervalle de confiance augmente, comme me l’a fait remarquer Dominique Dupagne.
On obtient bien sûr aussi le même résultat quand on commence par analyser l’OR de E2 chez les patients E1-. Sa formule est eh/fg on le multiplie par L’OR de E1 chez les E2+ soit ag/ce. Le produit est ageh/fgce soit ah/cf. Le même que plus haut, c’est normal.
A partir des données disponibles dans la publication, j’ai recherché les données « brutes » qui auraient pu « coller » aux résultats du graphique. Je n’arrive pas à retrouver les chiffres exacts (je trouve 1,81 et 6,02 au lieu de 1,84 et 5,98) et les intervalles de confiance que je calcule sont plus « étroits ». Peut-être y a t-il des données manquantes… mais il n’y en a pas sur les données disponibles pour l’évaluation de chaque exposition… Néanmoins, je ne pense pas être très loin des données utilisées, même si je n’utilise pas une méthode multivariée pour calculer les OR. A noter que les variables de l’analyse multivariée ne sont pas précisées dans l’article.
Voici le tableau 2x2x2 que je suppose être le plus proche de celui qui a permis d’obtenir les OR du graphique. M+ sont les cas, M- sont les contrôles.
M+ | M- | |||
E2+ | E2- | E2+ | E2- | |
E1+ | 59 | 101 | 10 | 103 |
E1- | 61 | 79 | 43 | 146 |
Ce tableau permet de recalculer les autres odds-ratios (tous les calculs sont dans le fichier excel joint qui contient aussi les tableaux de la publication permettant de retrouver certaines données) et on s’aperçoit qu’il y a une interaction importante entre les deux expositions.

Les OR de E1 sont de 4,16 chez les E2+ et de 1,81 chez les E2- (OR ajusté de E1 = 2.14)
Ceux de E2 sont de 6,02 chez les E1+ et de 2,62 chez les E1-. (OR ajusté de E2 = 3,37)
Le résultat du test de l’interaction est p=0,06. Compte tenu de la faible sensibilité de ce test, on considère souvent que le seuil de significativité est de 0,1 voire plus.
Bon, on en fait quoi de cette interaction.
Je n’en sais rien. Mais c’est étonnant que l’auteur ne le précise pas dans la partie « résultat » puisque qu’elle justifie le résultat promu de 10,99. Le produit des deux OR ajustés (E1 : 2,14 et E2 : 3,37) ne donne que 7,21. Le 10,99 est la conséquence de cette interaction. Un effet synergique est discuté par les auteurs ; cette interaction serait la conséquence de « l’effet cocktail » des toxiques.
La différence de répartition des expositions entre les cas et les contrôles concerne principalement les E1+E2+ : 59 vs 10 et les E1-E2- : 79 vs 146 ; les autres chiffres ne changent pas beaucoup 61 vs 43 et 101 vs 103. Sur le tableau 2X2X2, ce sont les cases a,c,f et h qui comptent pour l’interaction comme on pouvait le prévoir sur le calcul plus haut.
A part l’effet synergique des deux expositions discuté dans l’article (effet cocktail), je n’ai pas d’autre explication à vous proposer
Sauf à être mauvaise langue….
Imaginons que la recherche d’expositions 13 ans après (les cas et les contrôles ont entre 0 et 12 ans) soit difficile mais qu’heureusement la recherche de l’exposition pour les cas ait déjà été faite lors du diagnostic initial. Le caractère prospectif de l’étude porterait dans ce cas sur des consultations de suivi et non sur des consultations de diagnostic initial. Cela s’appelle un biais d’information aboutissant à un biais de classement différentiel favorisant la connaissance des expositions chez les cas (La recherche des expositions par l’équipe de Montpellier remonte au siècle dernier).
Si les évaluations des expositions des cas et des contrôles sont survenues à des moments différents, on peut imaginer, en restant mauvaise langue bien sûr, que le chômage croissant a écarté de nombreuses mères d’une exposition professionnelle, ou que les gens travaillent près de chez eux (comme par exemple les agricultrices qui peuvent être facilement E1+E2+).
Les parents d’un enfant atteint d’hypospadias peuvent aussi être sensibilisés à la recherche de toxiques après une courte recherche sur internet et donc, s’en souvenir plus aisément.
On peut aussi imaginer, toujours en restant mauvaise langue, que les contrôles, hospitalisés en urgence pour certains (« The reasons for hospitalization were mainly acute appendicitis, idiopathic intussusception, minor abdominal trauma, and pyloric stenosis) habitent près de l’hôpital tandis que les cas venaient de la région, compte tenu d’une spécialisation du service hospitalier. Il y a moins de champs et d’usines dans le centre-ville de Montpellier qu’aux alentours, donc les cas ont plus de chance d’être proche de ces lieux d’exposition potentielle.
Il est dommage que toutes les données permettant de justifier le graphique mis en exergue ne figurent pas dans la publication ou dans les « supplementary material » (tant les chiffres bruts que les variables de l’analyse multivariée). La publication de ces données est conseillée par les différentes règles de publication (STROBE).
Cela laisse le champ libre à tous les doutes si on a l’esprit un peu taquin ; s’il y a des trous dans les données ; c’est flou, et si c’est flou, y a un loup.
Dommage car on a envie de croire qu’il y a des trucs pas bons pour la santé un peu partout.