Des expériences peu reproductibles ? – Gènes de la réussite scolaire

Les études génétiques qui tentent de mettre en évidence les corrélations qui existent entre certaines variations de QI et les capacités cognitives générales d’un individu présentent certains problèmes de reproductibilité. Soit parce que certains tests récents n’arrivent pas à démontrer les mêmes résultats que certaines autres études antérieures, soit car les échantillons testés, de piètre qualité, ne permettent pas de produire un test qui a du sens.

Le schéma simplifié de ce genre d’étude est le suivant : On prend un échantillon de personnes dont l’ADN a été séquencé, puis on regarde les variations qui existent entre ces échantillons, ensuite on compare les scores d’intelligence des différentes personnes aux variations génétiques obtenues, enfin, on regarde statistiquement si certaines variations ont plus d’impact que d’autres sur le score.

Le but de l’étude (Chabris, 2012) était de remettre en évidence (car leur impact avait déjà été prouvé dans une étude antérieure) le rôle de la présence de 32 variations génétiques spécifiques dans l’estimation du facteur g d’une personne. Les acteurs de cette étude ont pris 3 échantillons de population. Le premier est composé de 5.571 personnes, le second comprenait les données sur les variations génétique de 1.759 personnes et enfin 2.241 personnes pour le dernier échantillon.

Parmi les 12 variations mises en avant par la Wisconsin longitudinal study, aucune n’a pu être reliée au facteur g de manière concluante. Un seul (nommé rs27660118) des 10 polymorphismes nucléotidiques (Single-Nucleoide Polymorphism en anglais), c’est à dire des variations d’une seule paire de bases, qu’avait découverts la Framingham Heart Study n’a pu être confirmé comme influant sur le facteur g. Enfin, aucun des 10 SNP mis en avant par les données du Swedish Twin Registry n’a démontré de corrélation significative avec le facteur g. Il s’est aussi avéré que le SNP rs27660118 atteignait lui un niveau suffisant pour conclure à une relation de cause à effet mais en faveur d’une baisse des capacités cognitives contrairement à ce qui était avancé jusque là.

Ainsi, ces études posent un problème de reproductibilité car les chercheurs n’ont pas réussi à obtenir les mêmes résultats que les études antérieures portant sur le même sujet mais avec des échantillons différents. Les chercheurs concluent sur deux hypothèses possibles qui seraient à l’origine des différences trouvées. Les échantillons utilisés par les chercheurs étaient beaucoup plus importants et donc leur étude est plus précise. Par conséquent le rapport de l’étude avance que ;

« Bayesian calculations imply that reported results from underpowered studies, even if statistically significant, are likely to be false positives. »

Les auteurs de ce papier appelaient donc à la prudence, soulignant que les premières études menées disposaient d’échantillons de petite taille. Les erreurs statistiques dues à l’étendue de l’échantillon auraient conduit à ces faux positifs. Un faux positif est le résultat d’une prise de décision dans un choix à deux possibilités (positif et négatif), déclaré positif, là où il est en réalité négatif. Le résultat peut être issu d’un test d’hypothèses, d’un algorithme de classification automatique, ou tout simplement d’un choix arbitraire.

Source de l’image : Wikipédia : polymorphisme nucléotidique