000 04013cam a2200277 4500500
005 20250123102404.0
041 _afre
042 _adc
100 1 0 _aLegendre, Bruno
_eauthor
700 1 0 _a Cerasuolo, Damiano
_eauthor
700 1 0 _a Dejardin, Olivier
_eauthor
700 1 0 _a Boyer, Annabel
_eauthor
245 0 0 _aComment gérer les données manquantes ? Imputation multiple par équations chaînées : recommandations et explications pour la pratique clinique
260 _c2023.
500 _a23
520 _aLa présence de données manquantes, problème constant en recherche médicale, a plusieurs conséquences : une perte de puissance systématique, associée ou non à une diminution de la représentativité de l’échantillon analysé. Il existe trois types de données manquantes : 1) manquantes complètement au hasard (MCAR - missing completely at random) ; 2) manquantes au hasard (MAR - missing at random) ; 3) manquantes non au hasard (MNAR - missing not at random).L’imputation multiple par équations chaînées permet de prendre en charge correctement les données manquantes sous les hypothèses MCAR et MAR. Elle permet de simuler pour chaque donnée manquante j, un nombre m de valeurs simulées qui semblent plausibles au regard des autres variables. Un effet aléatoire est inclus dans cette simulation pour exprimer l’incertitude. Plusieurs jeux de données sont ainsi créés et analysés individuellement de façon identique. Ensuite, les estimateurs de chaque jeu de données sont regroupés pour obtenir un estimateur global. L’imputation multiple permet d’augmenter la puissance, de corriger certains biais et a l’avantage d’être applicable à de très nombreux types de variables. L’analyse en cas complets ne devrait plus être la norme.L’objectif de ce guide est d’aider le lecteur dans la réalisation d’une analyse avec des données imputées de manière multiple. Nous traitons ici les différents types de données manquantes, les approches historiques pour les gérer, puis nous détaillons la méthode d’imputation multiple par équations chaînées. Nous fournissons un exemple de code pour le package mice de R®.
520 _aThe presence of missing data, a constant problem in medical research, has several consequences: systematic loss of power, associated or not with a reduction in the representativeness of the sample analyzed. There are three types of missing data: 1) missing completely at random (MCAR); 2) missing at random (MAR); 3) missing not at random (MNAR). Multiple imputation by chained equations allows for the correct handling of missing data under the MCAR and MAR assumptions. It allows to simulate for each missing data j, a number m of simulated values which seem plausible with regard to the other variables. A random effect is included in this simulation to express the uncertainty. Several data sets are thus created and analyzed individually, in an identical way. Then the estimators of each data set are combined to obtain a global estimator. Multiple imputation increases power, corrects for some biases and has the advantage of being applicable to many types of variables. Complete case analysis should no longer be the norm. The objective of this guide is to help the reader in conducting an analysis with multiple imputed data. We cover the following points: the different types of missing data, the different historical approaches to handling them, and then we detail the multiple imputation method using chained equations. We provide a code example for the mice package of R®.
690 _aimputation multiple
690 _aépidémiologie
690 _adonnées manquantes
690 _aepidemiology
690 _amultiple imputation
690 _amissing data
786 0 _nNéphrologie & Thérapeutique | Volume 19 | 3 | 2023-03-26 | p. 171-179 | 1769-7255
856 4 1 _uhttps://shs.cairn.info/revue-nephrologie-et-therapeutique-2023-3-page-171?lang=fr&redirect-ssocas=7080
999 _c760752
_d760752