Etudes & Biais

  • RSS
  • Accueil
  • A propos
  • Lecture critique
  • Plainte vs EMA
  • Liens
  • Contact

Chic ! Avec l’intelligence artificielle, on va avoir plein d’études biaisées.

Posted on 3 avril 2018 by Alexis in Article 4 Comments
  • Home
  • Article
  • Chic ! Avec l’intelligence artificielle, on va avoir plein d’études biaisées.

Dans le récent rapport de Monsieur le député Cédric Villani sur l’intelligence artificielle, il est fait mention dans les pages décrivant l’intérêt de l’IA en santé d’une enquête épidémiologique reliant la consommation d’alcool et la survenue d’une démence. Elle est présentée comme un exemple d’apport de l’intelligence artificielle pour améliorer les connaissances dans le domaine de la santé.  Plus de 38 millions de patients sont analysés.

Cette enquête analyse les données du Programme de Médicalisation des Systèmes d’Information. Elle a été publiée dans le Lancet Public Health et mise en ligne en février dernier. (http://dx.doi.org/10.1016/S2468-2667(18)30022-7).

Ses données concernent donc des patients hospitalisés en France.

Et c’est un problème car les caractéristiques des patients hospitalisés sont différentes de celles des patients de la population générale.

Pour faire « simple », les patients qui ont un motif d’hospitalisation sont surreprésentés à l’hôpital par rapport à ceux qui n’en ont pas !

Et plus vous avez de raisons de vous faire hospitaliser, plus vos caractéristiques seront surreprésentées chez les patients hospitalisés. On retrouve donc plus fréquemment à l’hôpital qu’en ville des patients qui ont deux, trois ou plus encore de raisons d’être hospitalisés.

La démence et les troubles consécutifs à la prise d’alcool étant des motifs possibles voire très fréquents d’hospitalisation, ces patients seront donc très probablement surreprésentés à l’hôpital.

C’est le biais de Berkson (Joseph 1899 -1982)

Un petit exemple chiffré pour deux maladies sans liaison dans la population générale

Maladies % dans la population générale

Probabilité d’hospitalisation

% relatifs dans la population hospitalisée

A et B

5%

20%

1%

A et non B

5%

5%

0.25%

Non A et B

5%

5%

0.25%

Non A et non B

5%

3%

0.15%

 

L’odd-ratio dans la population générale est de 1 (donc il n’y a pas de liaison entre la maladie A et la maladie B) et de 2.4 pour les patients hospitalisés (la liaison apparait chez les patients hospitalisé !). Cet odd-ratio, et donc la démonstration de la liaison entre les pathologies, chez les patients hospitalisés dépend de la probabilité d’être hospitalisé selon la ou les pathologies des patients.

Tous les hazard ratios de la publication sont ainsi influencés par la probabilité d’être hospitalisé pour chaque type de patient. Le résultat intéressant serait celui sur la population totale, hospitalisée ou non ; ce résultat ne peut évidemment pas être appréhendé à l’aide des données uniquement obtenues lors des hospitalisations.

Dans le cas particulier de cette étude, le recueil des patients sur 6 ans a permis d’obtenir environ 80% de la population Française des plus de 65 ans (et 50% de ceux de moins de 65 ans). Cela pourrait limiter l’impact potentiel du biais de Berkson. A contrario, la sélection, parfois très stricte des patients, réduisant leur nombre pour les analyses, peut le favoriser.

Ce biais de Berkson doit donc au minimum être discuté dans la publication.

Si les auteurs soulignent une liaison entre la prise d’alcool et une démence (dont une partie sont les démences consécutives à la prise d’alcool !), ils pourraient aussi souligner que l’obésité, l’hypertriglycéridémie et les cancers semblent protéger de la démence !

Pour les cancers, c’est probablement parce que les gens meurent avant de déclarer leur démence (exemple de biais de compétition) mais pour les deux autres caractéristiques soit il y a un autre biais soit il faut revoir les canons de la médecine préventive.

Spoiler : c’est en fait probablement la conséquence de l’utilisation de tous les facteurs de risque comme facteurs de confusion ; ceux qui ne sont que obèses ou que hyperlipémiques sans avoir les autres facteurs de risque analysés – infarctus, AVC, diabète, tabac…- s’en tirent plutôt bien… parmi ceux qui sont hospitalisés bien évidemment. Il y a en plus tous ceux qui ne sont pas hospitalisés qui vont à priori encore mieux.

 

C’est chouette l’intelligence artificielle!

 

Bon, en cadeau, je vous offre un petit biais de citation

Référence pour les biais

Alexis Clapin. Enquêtes médicales et évaluation des médicaments – de l’erreur involontaire à l’art de la fraude

Éditeur : desiris

 

Share

4 comments on “Chic ! Avec l’intelligence artificielle, on va avoir plein d’études biaisées.”

  1. Thomas Boulier dit :
    6 avril 2018 à 12:13

    Cedric Villani est un excellent mathématicien, mais son domaine d’application est la physique et il connaît sûrement moins les subtilités de la recherche médicale. L’article cité en exemple est mal choisi car l’apprentissage statistique basé sur les données massives ne ferait que des études de cohortes gigantesque, ce qui n’a qu’un intérêt très limité, du fait en autres des biais inhérents comme vous le soulignez bien.

    En revanche, l’apprentissage statistique a déjà de réels impacts ; voici deux études en diabétologie qui montre les 2 aspects (apprentissage supervisé ou non) de ce genre de méthode :
    – une première étude dans JAMA qui montre comment l’apprentissage profond (supervisé) peut interpréter de manière automatique un fond d’œil de retinopathie diabétique : https://jamanetwork.com/journals/jama/fullarticle/2588763?guestAccessKey=e95d1518-94df-41f3-a32c-f5ee30e7f3b1
    – une autre étude, parue dans le Lancet, utilise l’apprentissage non supervisé pour faire des clusters de patients diabétiques afin de mieux comprendre la variété des profils et des réponses aux traitements : http://www.thelancet.com/journals/landia/article/PIIS2213-8587(18)30051-2/fulltext

    Reply
    • Alexis dit :
      6 avril 2018 à 9:39

      Cher Monsieur,
      Merci de votre commentaire
      Pas besoin de défendre Monsieur Cédric Villani! C’est une personne remarquable et je pense qu’il n’a pas lu l’article ; s’il l’a lu, il faut le féliciter car lire des études médicales sans être de la partie, c’est faire preuve de courage. Cette étude est aussi peut-être la seule issue des données françaises…
      Concernant les études que vous citez, l’utilisation d’un grand nombre de données permets d’obtenir des informations parfois intéressantes (et parfois intéressées). Il faut analyser les données disponibles. C’est très bien à condition que les modalités d’analyse et tous les résultats soient clairement et complètement décrits.
      Une première étape pour améliorer la santé de nos concitoyens serait de rendre publiques les données individuelles (anonymisées) des essais cliniques pour avoir des médicaments correctement évalués et une meilleure connaissance des pathologies et des profils évolutifs.

      Reply
  2. Armand Jibot dit :
    28 juin 2018 à 11:12

    Bonjour,
    Il y a quelque chose qui m’échappe dans votre exemple, pourquoi le total de la colonne % dans la population générale ne fait pas 100% ? C’est mon âme de statisticien qui parle 😉

    Bonne journée

    Reply
    • Alexis dit :
      28 juin 2018 à 5:24

      Vous avez raison, il aurait été plus académique de prendre 25% pour chaque groupe dans la population générale. J’ai considéré que les 20% (4 x 5%) correspondaient à l’échantillon connu de la population générale. Cela ne change pas les odds-ratios. Il reste égal à 1 dans l’échantillon de la population et dépend des probabilités d’hospitalisation pour la population hospitalisée.
      Merci de l’intérêt porté à mon blog

      Reply

Leave a Reply Cancel reply

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Search

Commentaires récents

  • Alexis dans Lecture critique (3) : Analyse de la population incluse et ajustements.
  • FRG dans Lecture critique (3) : Analyse de la population incluse et ajustements.
  • Daniel Pérez dans La vérole et le bar-tabac
  • Azaïs dans Je viens de télécharger les analyses de la FDA sur Tecfidera ®
  • Alexis dans Chic ! Avec l’intelligence artificielle, on va avoir plein d’études biaisées.

Articles récents

  • Chic ! Avec l’intelligence artificielle, on va avoir plein d’études biaisées.

    3 avril 2018
  • Deux ans sans publication mais pour la bonne cause

    13 mars 2018
  • Quand il y a un « trou » (dans les données), c’est qu’y a un loup ! (Martine et Alexis)

    19 juin 2015
  • J’adore supputer, ce sera donc un peu moins sérieux… quoi que…

    21 mai 2015
  • Deux autres petits trucs qui rendent les odds-ratios un peu « odd ».

    14 mai 2015
  • Bon la dompéridone on n’y croit pas trop…et qu’est ce qui la différencie du mediator ?

    1 mai 2015
  • La vérole et le bar-tabac

    19 avril 2015
  • Domperidone

    14 avril 2015
  • Propensity scores, ou comment transformer une étude de suivi en un essai randomisé.

    3 avril 2015
  • The Will Rogers phenomenon, et petite digression sur le dépistage

    9 février 2015
  • Tiens, la National Academy Press publie un document sur les données des essais cliniques

    5 février 2015
  • Le monitoring nouveau des essais cliniques est sorti. Bonne ou mauvaise nouvelle pour les fraudeurs (et pour ceux qui les recherchent) ?

    30 janvier 2015
  • Faire une étude sur cohorte positive, fastoche !

    27 janvier 2015
  • Fraude et essai clinique biaisé. La détection des fraudes permet-elle d’exclure les essais cliniques biaisés ?

    6 janvier 2015
  • Les méta-analyses ne seraient-elles pas réellement intéressantes quand elles sont non-valides en raison d’une hétérogénéité ?

    5 décembre 2014
  • Lecture critique (12) Analyse des essais cliniques randomisés en double aveugle destinés à mettre en évidence une supériorité: récapitulatif

    20 novembre 2014
  • Finalement, il ne s’est rien passé à l’EMA ce jeudi 2 octobre.

    7 octobre 2014
  • Si on commence à critiquer les avis de l’EMA …

    28 février 2014
  • Les courbes de survie

    18 février 2014
  • Réponse de l’EMA à mon mail du 20 Novembre 2013 … et ma réponse

    9 février 2014
  • 20 novembre 2013 – 21 janvier 2014 : nouvelle plainte contre l’EMA

    21 janvier 2014
  • La FDA, ses analyses sélectives et l’Alemtuzumab

    6 janvier 2014
  • NNT

    18 décembre 2013
  • Incidence et Prévalence

    13 décembre 2013
  • Risque de sclérose en plaques avec les vaccins (ou autre produit)

    27 novembre 2013
  • Suite des relations avec l’EMA

    20 novembre 2013
  • A la recherche du bon critère d’évaluation

    18 octobre 2013
  • Evénements indésirables rares et loi de Poisson (ou loi binomiale)

    11 octobre 2013
  • Policy 0070 on publication and access to clinical-trial data

    3 septembre 2013
  • Lecture critique (11) : biais ou risque de biais,

    30 août 2013
  • Ô temps, suspends ton vol ! … de données valides

    16 juillet 2013
  • Individual Patient Data (IPD) : une nécessaire mise à disposition de la communité scientifique

    11 juillet 2013
  • P…. d’effet placebo !

    2 juillet 2013
  • Règles CONSORT pour les essais tronqués

    27 juin 2013
  • Lecture critique (10) : Les analyses de sous-groupes

    26 juin 2013
  • Alltrials pour les biais de publication… et les autres biais?

    19 juin 2013
  • Lecture critique (9) : L’aveugle dans les essais cliniques.

    10 juin 2013
  • Analyse critique (8) : La cohérence externe

    5 juin 2013
  • Je viens de télécharger les analyses de la FDA sur Tecfidera ®

    18 mai 2013
  • La puissance

    12 mai 2013

(c) 2013 Etudes & Biais -