Comment l’information scientifique est vérifiée # 3 : la reproductibilité des expériences « Les scientifiques se plaignent d'une crise de la reproductibilité. De quoi s'agit-il exactement ? »
Un utilisateur d’Eurêkoi, service de réponses et recommandations à distance assuré par des bibliothécaires, s’intéresse à la reproductibilité des expériences scientifiques. Pourquoi, ce mécanisme de validation de la science fait-il problème aujourd’hui ?
La vérité, en sciences, se construit par l’expérimentation de la théorie étudiée, qui en constitue une mise à l’épreuve dans des conditions données, comme l’exposait déjà Claude Bernard dans son Introduction à l’étude de la médecine expérimentale. Or, un résultat obtenu une fois ne peut, de ce point de vue, avoir grande valeur ; il faut, pour en garantir la fiabilité, que l’expérience soit reproductible et qu’une nouvelle expérimentation parvienne aux mêmes conclusions. C’est pourquoi la vérité se définit en science comme « ce qui n’a pas (encore) été réfuté ». Or, cette reproductibilité de la recherche (de l’expérimentation en particulier) se heurte aujourd’hui à divers obstacles.
Les ressorts de la crise de la reproductibilité
« Reproductibilité » en science : de quoi s’agit-il ?
« La reproductibilité fait référence à la capacité d’un chercheur ou d’une équipe à reproduire les résultats d’une étude antérieure en s’appuyant sur les mêmes matériaux que ceux utilisés par le chercheur ou l’équipe initiale. Ce peut être la reproduction de l’expérience elle-même, mais aussi la réutilisation des données brutes pour reproduire de façon indépendante l’analyse statistique. La reproductibilité est une condition minimale nécessaire pour qu’une conclusion soit crédible et informative ».
« Une « règle d’or » des sciences de la nature est que les expériences scientifiques puissent être reproduites en tous temps et en tous lieux (Mesirov, 2010), et en effet, le fonctionnement des sciences de la nature impose que les résultats publiés aient une fiabilité et une généralité suffisantes pour que d’autres travaux puissent les prendre comme base. En conséquence, les parties « Matériels et méthodes » des articles scientifiques, appuyées par les « Matériels supplémentaires » (Supplemental Materials) ou les « Articles de données » (Data Paper) (Inra, 2017) sont conçus par les auteurs, et évalués par les rapporteurs, de sorte que n’importe qui puisse obtenir les mêmes résultats que ceux qu’annoncent les auteurs en suivant les Notes Académiques de l’Académie d’agriculture de France. »
Manque de confiance de la population dans l’activité scientifique :
Comment les Français perçoivent-ils la recherche scientifique ? Une étude d’opinion publiée en 2019 sur la confiance des Français dans la science dévoile qu’ils se montrent divisés sur les statuts des études scientifiques publiées en France : 45% les considèrent plutôt neutres et objectives, une courte majorité (55%), les considèrent plutôt orientées et les Français ont le sentiment qu’ils rencontrent fréquemment des contradictions dans les discours scientifiques sur un même sujet.
Mais pourquoi cette « crise » actuelle ?
Nature incertaine de la recherche scientifique :
« En 2005, John Ioannidis, professeur de médecine et chercheur à l’école de médecine de l’université Stanford, est l’un des premiers à faire état de la crise reproductibilité dans l’article suivant : Why Most Published Research Findings Are False. Il y expose, notamment que la nature incertaine de la recherche scientifique rend souvent difficile la détermination avec précision des causes de non-reproductibilité d’une expérience et ainsi rend improbable l’atteinte éventuelle d’un taux de validité des résultats de 100 % dans la littérature publiée »
Fraude scientifique, problème éthique et conflits d’intérêt :
« La recherche scientifique est fondée sur la confiance que chaque chercheur a en ses pairs. Une découverte scientifique ne se fait pas en l’espace d’une unique carrière par un unique chercheur, mais chacun apporte sa contribution à un ensemble de connaissances préétablies dans et par la littérature scientifique. Pour que le système fonctionne, il faut que ces connaissances soient fiables et reproductibles. C’est-à-dire que n’importe quel chercheur dans le monde soit capable d’obtenir les mêmes résultats en utilisant la même méthodologie, mais son propre matériel. Les études basées sur des observations uniques – éthologie, cosmologie – sont des cas particuliers. Mais en dehors de ces exceptions, il s’avère que de nombreux résultats figurant dans des publications scientifiques ne sont pas reproductibles. […]. Plusieurs raisons expliquent une non-reproductibilité des résultats : méthodologie bancale, analyses statistiques non appropriées, matériel intrinsèquement difficile à étudier. Mais il arrive aussi que des résultats soient volontairement erronés. Les actions de fraude qui vont à l’encontre d’un déroulement correct de la pratique scientifique ne sont pas très difficiles à circonscrire. Il s’agit des entorses délibérées, à caractère malveillant ou mensonger, à « l’objectité » et/ou à la « confiance collective » qui caractérisent la pratique scientifique. […] Celui qui invente des observations, les manipule ou les omet, enfreint d’un seul et même coup les deux contraintes : il falsifie la relation à l’objet et ment à ses collègues. »
Cette fraude scientifique peut également être due à un problème éthique :
« C’est peut-être un problème éthique : un manque d’honnêteté intellectuelle, notamment dans l’usage cavalier de certains verbes comme « prouver » ou « démontrer », suscité par une excessive pression à la publication. Ou une sorte de paresse rassurante conduisant à penser qu’il suffit d’avoir un résultat statistiquement significatif pour prétendre avoir fait œuvre de scientifique. (…) Dans la course actuelle à la publication pour la publication (…), les scientifiques auraient tendance à ne plus être trop regardants sur la rigueur de leurs calculs statistiques, et la solidité de leurs découvertes s’en ressentirait. »
L’activité scientifique est devenue une course de vitesse qui engendre des conflits d’intérêts
Cette course de vitesse est à mettre en lien avec le fameux slogan « publish or perish », qui résume la situation délicate des scientifiques.
« Pour obtenir un poste intéressant, des subsides, une fonction académique, les chercheurs sont obligés de publier un maximum d’articles et d’être cités le plus possible dans les journaux scientifiques. On oublie qu’une publication a comme but principal d’apporter de nouvelles informations. Si ce n’est pas le cas, elle est inutile, coûteuse et chronophage. Or, la pression subie par les universitaires les incite quelquefois à publier « n’importe quoi », à perdre leur temps à faire leur promotion (y compris avec l’autocitation) afin de monter dans les classements. »
« Publication : la course à l’échalote », par Nadine de Vos, site de l’Afis (Association française pour l’information scientifique), mise en ligne le 16/09/2011.
Actualité du problème
Les questionnements sur la reproductibilité de la science ne sont pas tout à fait nouveaux. Ils dateraient des années 1950, selon cet article du blog d’Hervé Maisonneuve (médecin de santé publique et consultant en santé publique) : « La crise de reproductibilité de la science remonte aux années 1950s », par Hervé Maisonneuve, sur redactionmedicale.fr, mis en ligne le 02/01/2017. Mais ce problème a pris une acuité particulière. L’analyse de Monya Baker de 2016, intitulée « 1,500 scientists lift the lid on reproducibility » (1500 scientifiques soulèvent le couvercle de la reproductibilité), portant sur 1500 articles scientifiques montre que plus de 70 % des chercheurs ont essayé et échoué à reproduire les expériences d’un autre scientifique, et plus de la moitié n’ont pas réussi à reproduire leurs propres expériences. D’autant que la crise Covid-19 a contribué à le porter sur le devant de la scène avec la révélation de participation de revues scientifiques reconnues à cette crise de reproductibilité :
« L’étude frauduleuse sur les effets de l’hydroxychloroquine, publiée par la revue scientifique The Lancet en mai 2020, a fait scandale. Cette affaire pose de nombreuses questions sur les procédés de contrôle des études scientifiques publiées dans les revues les plus réputées. Comment ces publications scientifiques fonctionnent-elles, sur quels critères de qualité sont-elles classées et sur quoi repose leur prestige ? »
Des solutions pour envisager une sortie de crise ?
Des propositions de scientifiques
Cadrage de l’activité par des règles de déontologie :
La Déclaration de Singapour sur l’intégrité en recherche, répertoriée dans les textes fondateurs sur le site Ouvrir la science (du Comité pour la science ouverte, CoSo) énonce 4 principes et 14 responsabilités pour une intégrité des recherches dont les principes 3 et 4 concernent la reproductibilité :
« La déclaration énonce 4 principes et 14 responsabilités à appliquer pour que les recherches soient menées de manière intègre quel que soit le pays et la discipline scientifique. »
Cette déclaration énonce dans ses principes 3 et 4 en particulier :
« 3. Méthodologie: Les chercheurs doivent utiliser des méthodes appropriées, baser leurs conclusions sur une analyse critique de leurs résultats et les communiquer objectivement et de manière complète. 4. Conservation des données: Les chercheurs doivent conserver les données brutes de manière transparente et précise de façon à permettre la vérification et la réplication de leurs travaux. »
Mise en place de modalités de recherche plus adaptées :
Le scientifique John PA Ioannidis propose, dans l’article mentionné ci-dessus, différentes voies d’amélioration de la situation :
« Des preuves plus puissantes, par exemple des études de grande envergure ou des méta-analyses à faible biais, peuvent être utiles, car elles se rapprochent de la référence « or » inconnue. […] Deuxièmement, la plupart des questions de recherche sont traitées par de nombreuses équipes, et il est trompeur de souligner les résultats statistiquement significatifs d’une seule équipe. Ce qui compte, c’est la totalité des preuves. Diminuer les préjugés grâce à des normes de recherche améliorées et à la réduction des préjugés peut également aider. […] Enfin, au lieu de rechercher la signification statistique, nous devrions améliorer notre compréhension de la plage de valeurs R – les cotes pré-étude – où les efforts de recherche opèrent.»
Voir aussi les propositions contenues dans « A manifesto for reproducible science » (Un manifeste pour la science reproductible) par Marcus Munafò, Brian Nosek, Dorothy Bishop et al., Nature Human Behavior, 10/01/2017. (Nombreuses références bibliographiques disponibles en fin document.).
Le site Ouvrir la science (août 2019) publie le compte rendu de la journée d’étude du 29 mars 2019, par Caroline Abela, Martine Courbin-Coulaud et Sabrina Granger. Les auteurs de ce compte rendu se focalisent sur les solutions proposées par les intervenants de la journée d’étude du 29 mars 2019« Repenser la robustesse et la fiabilité en recherche : les chercheurs face à la crise de la reproductibilité. » Y étaient abordées les notions de robustesse, de fiabilité et d’incertitude dans des domaines disciplinaires variés.
Les réponses institutionnelles
Sorbonne Université a mis en place une délégation à l’intégrité scientifique pour promouvoir une culture de l’intégrité scientifique et traiter les signalements de manquements.
« HEC Paris, l’Université d’Orléans et le CNRS lancent CASCaD (Certification Agency for Scientific Code and Data) seul laboratoire public au monde spécialisé dans la certification de la reproductibilité de la recherche scientifique. Cette initiative scientifique sans but lucratif permet aux chercheurs de prouver le caractère reproductible de leur recherche. […] Elle garantit que les résultats numériques […] présentés dans une publication scientifique […] sont reproductibles en utilisant un ensemble identifiable de ressources numériques (code et/ou données) mises à disposition par les auteurs de cette publication. »
Le Ministère de l’enseignement supérieur, de la recherche et de l’innovation, pour appliquer le Plan national pour la science ouverte de 2018, a mis en place un collège Données de la recherche, visant à « structurer et ouvrir les données de la recherche » pour rendre les données scientifiques F.A.I.R. (Findable, Accessible, Interoperable, Reusable). L’objectif de la science ouverte concernant les données est de « faire sortir la recherche financée sur fonds publics du cadre confiné des bases de données fermées. Elle réduit les efforts dupliqués dans la collecte, la création, le transfert et la réutilisation du matériel scientifique. Elle augmente ainsi l’efficacité de la recherche. » Ce faisant, cette structuration correcte et cette mise à disposition des données de recherche favorisent la reproductibilité.
Eurêkoi – Bibliothèque des sciences et de l’industrie et Bibliothèque publique d’information
XÉtant un service public, nous ne faisons aucun usage commercial des données collectées lors de votre navigation. Nous utilisons les cookies ou technologies similaires pour accéder uniquement à des données personnelles non sensibles stockées sur votre terminal, que nous traitons afin de réaliser des statistiques, mesurer les performances du site, ou permettre des accès à des ressources externes.
Vous pouvez à tout moment revenir sur vos choix en utilisant le lien "Personnaliser". En savoir plusRefuserAccepterPersonnaliser
Politique de confidentialité & cookies
Gestion de vos préférences sur les cookies
Ce site utilise des cookies pour améliorer votre expérience de navigation. Ces cookies sont classés en trois catégories : fonctionnel, statistiques et marketing.
Veuillez retrouver notre politique de gestions de données personnelles et de cookies : page "Informations sur les cookies" et page "Politique de confidentialité"
Ces cookies nous permettent de réaliser des statistiques de mesures d’audiences et de performances en analysant le volume et la source du trafic sur notre site. Ces cookies permettent également d’analyser de façon anonyme le comportement des visiteurs de notre site afin de mesurer et d'améliorer les performances de notre site et de nos campagnes en ligne.
Le recueil de votre consentement n’est pas requis, nous utilisons un logiciel d’analyse d’audience (Matomo) configuré selon les recommandations de la CNIL pour bénéficier de l’exemption de consentement.
https://www.cnil.fr/fr/cookies-et-autres-traceurs/regles/cookies-solutions-pour-les-outils-de-mesure-daudience
Cookie
Type
Durée
Description
_pk_id.*
13 mois
Ce cookie est installé par l'outil d'analyse Web Matomo.
Le cookie _pk_id est utilisé pour stocker des détails sur l'utilisateur tels que l'identifiant unique (ID).
Les cookies créés par Matomo commencent par : _pk_ref, _pk_cvar, _pk_id, _pk_ses.
Pour plus d'informations sur les cookies de Matomo : https://fr.matomo.org/faq/general/faq_146/
_pk_ses.*
30 minutes
Ce cookie est installé par l'outil d'analyse Web Matomo.
Ce cookie _pk_ses de courte durée est utilisé pour stocker temporairement les données de la visite.
Les cookies créés par Matomo commencent par : _pk_ref, _pk_cvar, _pk_id, _pk_ses.
Pour plus d'informations sur les cookies de Matomo : https://fr.matomo.org/faq/general/faq_146/
Les cookies fonctionnels aide à améliorer les performances de certaines fonctionnalités comme partager le contenu du site sur les réseaux sociaux, collecter des retour d'expérience, et autres fonctionnalités.
Cookie
Type
Durée
Description
bcookie
0
2 years
Ce cookie est installé par LinkedIn pour activer les fonctions de LinkedIn sur ce site.
cookielawinfo-checkbox-necessary
0
11 months
Ce cookie est défini par le plugin GDPR Cookie Consent. Les cookies sont utilisés pour stocker le consentement de l'utilisateur pour les cookies dans la catégorie «Nécessaire».
cookielawinfo-checkbox-non-necessary
0
11 months
Ce cookie est défini par le plugin GDPR Cookie Consent. Les cookies sont utilisés pour stocker le consentement de l'utilisateur pour les cookies dans la catégorie «Non nécessaire».
csrftoken
0
11 months
Ce cookie est associé à la plateforme de développement Web Django pour python. Utilisé pour aider à protéger le site Web contre les attaques de falsification de requêtes intersites
lidc
0
1 day
Ce cookie est défini par LinkedIn et utilisé pour le routage.
viewed_cookie_policy
0
11 months
Le cookie est défini par le plugin GDPR Cookie Consent et est utilisé pour stocker si l'utilisateur a consenti ou non à l'utilisation de cookies. Il ne stocke aucune donnée personnelle.
Les cookies analytiques sont utilisés pour comprendre comment les visiteurs interagissent avec le site. Ces cookies génèrent des informations mesurables sur le nombre de visiteurs, le taux de rebond, la source du trafic etc.
Cookie
Type
Durée
Description
everest_g_v2
0
1 year
Le cookie est défini sous le domaine eversttech.net. Le but du cookie est de mapper les clics sur d'autres événements sur le site Web du client.
GPS
0
30 minutes
Ce cookie est défini par Youtube et enregistre un identifiant unique pour suivre les utilisateurs en fonction de leur emplacement géographique
mc
0
1 year
Ce cookie est associé à Quantserve pour suivre de manière anonyme comment un utilisateur interagit avec le site Web.
MR
0
1 week
Ce cookie est utilisé pour mesurer l'utilisation du site Web à des fins d'analyse.
VISITOR_INFO1_LIVE
1
5 months
Ce cookie est défini par Youtube. Utilisé pour suivre les informations des vidéos YouTube intégrées sur un site Web.
YSC
1
Ces cookies sont définis par Youtube et sont utilisés pour suivre les vues des vidéos intégrées.
Les cookies publicitaires sont utilisés pour procurer une expérience optimale aux visiteurs du site avec des publicités et des campagnes marketing pertinentes. Ces cookies traquent les visiteurs à travers les sites et collectent leurs informations pour générer des publicités personnalisées.
Cookie
Type
Durée
Description
ATN
1
2 years
Ce cookie est installé par atdmt.com et stockent des données sur le comportement de l'utilisateur sur plusieurs sites Web. Les données sont ensuite utilisées pour diffuser des publicités pertinentes aux utilisateurs du site Web.
bito
0
1 year
bitoIsSecure
0
1 year
bscookie
1
2 years
chkChromeAb67Sec
0
2 months
CMID
0
1 year
CMPRO
0
2 months
CMPS
0
2 months
CMST
0
1 day
cref
0
1 year
damd
0
1 year
dc
0
9 years
dmvk
0
dmxId
0
9 months
fr
1
2 months
Le cookie est installé par Facebook pour montrer des publicités pertinentes aux utilisateurs et mesurer et améliorer les publicités. Le cookie suit également le comportement de l'utilisateur sur le Web sur les sites dotés d'un pixel Facebook ou d'un plugin social Facebook.
GED_PLAYLIST_ACTIVITY
0
glassbox-session-id
0
30 minutes
IDE
1
2 years
Utilisé par Google DoubleClick, ce cookie stocke des informations sur la façon dont l'utilisateur utilise le site Web et toute autre publicité avant de visiter le site Web. Ceci est utilisé pour présenter aux utilisateurs des publicités qui les concernent en fonction du profil de l'utilisateur.
KADUSERCOOKIE
0
2 months
KTPCACOOKIE
0
1 day
lang
0
Ce cookie est utilisé pour stocker les préférences linguistiques d'un utilisateur afin de diffuser du contenu dans cette langue stockée lors de sa prochaine visite sur le site Web.
lissc
0
1 year
li_sugr
0
2 months
matchbidswitch
0
1 month
MUID
0
1 year
Utilisé par Microsoft comme identifiant unique. Le cookie est défini par des scripts Microsoft intégrés. Le but de ce cookie est de synchroniser l'ID sur de nombreux domaines Microsoft différents pour permettre le suivi des utilisateurs.
pardot
0
Le cookie est défini lorsque le visiteur est connecté en tant qu'utilisateur Pardot.
personalization_id
0
2 years
Ce cookie est utilisé par Twitter pour intégrer les fonctionnalités de partage de ce média social. Il stocke également des informations sur la manière dont l'utilisateur utilise le site Web pour le suivi et le ciblage.
PUBMDCID
0
2 months
Ce cookie est défini par pubmatic.com. Le cookie stocke un identifiant utilisé pour afficher des publicités sur le navigateur des utilisateurs.
ROUTEID
0
ss
1
9 years
SyncRTB3
0
2 months
TDCPM
0
1 year
Le cookie est défini par le service CloudFlare pour stocker un identifiant unique afin d'identifier un appareil d'utilisateurs qui reviennent, qui est ensuite utilisé pour la publicité ciblée.
TDID
0
1 year
Le cookie est défini par le service CloudFlare pour stocker un identifiant unique afin d'identifier un appareil d'utilisateurs qui reviennent, qui est ensuite utilisé pour la publicité ciblée.
test_cookie
0
11 months
ts
1
1 year
tuuid
0
9 years
Ce cookie est défini par .bidswitch.net. Les cookies stockent un identifiant unique dans le but de déterminer les publicités que les utilisateurs ont vues si vous avez visité l'un des sites Web des annonceurs. Les informations sont utilisées pour déterminer quand et à quelle fréquence les utilisateurs verront une certaine bannière.
u
0
2 months
UserMatchHistory
0
1 month
usprivacy
0
1 year
ut
0
9 years
v1st
0
1 year
viewer_token
0
1 month
wfivefivec
0
1 year
_fbp
0
2 months
Ce cookie est défini par Facebook pour diffuser des publicités lorsqu'ils sont sur Facebook ou sur une plate-forme numérique alimentée par la publicité Facebook après avoir visité ce site Web.
Les champs signalés avec une étoile (*) sont obligatoires