Comment l’étude de deux corpus d’articles (issus d’Europresse et de Web of science) nous a-t-elle permis d’analyser cette controverse sur les risques liés au développement du cancer ?
Afin d’étudier ce sujet, nous avons constitué plusieurs corpus d’articles issus de la presse généraliste, de la presse scientifique, et également de recherches annexes liées aux résultats précédents : analyses d’interview, blogs de spécialistes sur les questions de santé, etc. Les principaux corpus ont été réalisés à l’aide de la base de données Europresse, pour la presse généraliste, et de la plateforme Web Of Science, pour la presse scientifique. Les articles d’Europresse ont ensuite été traités dans leur majorité grâce à l’outil Gargantext, et nous avons utilisé les outils proposés par Web Of Science pour analyser les articles scientifiques.
Corpus Europresse
- Méthodologie, constitution et analyse du corpus
Notre corpus « Europresse » regroupe 40 articles de presse en anglais et 71 articles en français. Il s’agit d’articles issus de la presse générale, et non pas scientifique, elle touche et concerne donc le grand public et traite plus des problèmes sociétaux causés par la controverse.
Nous avons donc utilisé différentes équations de recherches afin de constituer ces deux corpus. Les mots clés utilisés ont été choisi en fonction de leur occurrence dans les textes sources, à commencer par celui qui a « donné naissance » à la controverse. Nous avons repéré des expressions types qui nous ont permis de retrouver les articles qui citaient celui de Tomasetti et Vogelstein. Par ailleurs, nous avons effectué nos recherches principalement dans les articles publiés en 2015 et début 2016 pour bien cerner ceux qui traitent des résultats des deux américains.
Nous avons également fait une autre recherche qui excluait l’année 2015 pour vérifier si d’autres théories sur la prépondérance du hasard dans le développement de certains cancers avaient été faites, ou non dans les années antérieures.
Nous avons ensuite effectué plusieurs recherches afin de discerner les sources anglaises des sources francophones. Nous aurions pu étudier les répercussions de l’article de C. Tomasetti et B. Vogelstein dans d’autres langages, mais nous avons délibérément limité les recherches à l’anglais et le français.
Dans un premier temps nous nous sommes uniquement intéressés aux « échos » lancés par rapport à la publication de l’article source de la controverse, et passé le mois de décembre, nous avons alors trouvé l’article de Yusuf Hannun qui contredit complètement les assertions des deux américains dans la revue Nature. A partir de ce moment là, nous avons pu croiser nos recherches, et chercher les articles qui répondaient à celui de Y. Hannun.
cancer stem cell Tomasetti | depuis 1 an | Sources anglaises | 61 résultats | |||
cancer causes pollution environment health risk | depuis 1 an | Sources anglaises | 804 résultats | |||
Stony Brook cancer environment* | depuis 1 an | Sources anglaises | 45 résultats | |||
cancer « bad luck » Tomasetti** | depuis 1 an | Sources anglaises | 17 résultats | |||
cancer Yusuf Hannun | depuis 1 an | Sources anglaises | 26 résultats | |||
cancer « environmental causes » Tomasetti | depuis 1 an | Sources anglaises | 2 résultats |
TEXT= cancer& LEAD= hasard& LEAD= Tomasetti | 4 résultats | depuis 2 ans | Sources françaises | ||
TEXT= cancer& TEXT= pas de chance& LEAD= Tomasetti | 14 résultats | depuis 2 ans | Sources françaises | ||
TEXT= cancer& TEXT= Hannun& TEXT= Tomasetti& TEXT= hasard& TEXT= risques | 3 résultats | depuis 3 mois | Sources françaises | ||
TEXT= cancer& TEXT= Hannun | 6 résultats | depuis 1 an | Sources françaises |
*Stony Brook est l’université dans laquelle le docteur Hannun exerce en tant que chercheur. Il est le directeur du centre de cancérologie.
** L’expression « Bad Luck » est probablement la plus emblématique de l’article de C. Tomasetti et B. Vogelstein, elle a été reprise par de nombreux articles. En effet cette formule un peu « choc » transmet toute la stupeur des résultats controversés des deux américains.
Corpus Web Of Science
- Méthodologie, composition et analyses du corpus
Web Of Science, ou WOS est une plateforme qui permet l’accès à une très grande source de revues purement scientifiques. Il s’agit dans ce cas d’une presse très spécifique et assez complexe qui traite de domaines bien précis. Cette fois ci, le corpus étudié confirmera bien la théorie avancée par celui d’Europresse et s’intéressera plus, non pas aux problèmes sociétaux causés par la publication de l’article de C. Tomasetti et B. Vogelstein, mais plutôt à la démarche scientifique et aux conséquences de l’étude en question pour le monde scientifique. Ce corpus nous a également permis d’étudier les différentes « arènes de débats », c’est à dire les différents domaines scientifiques qui prennent part à la discussion. Les outils d’analyse de WOS nous ont permis de trier notre corpus en fonction des spécialités de chacune des revues afin de cerner quels ont été les champs de recherches le plus ciblés, et concernés par la publication de C. Tomasetti et B. Vogelstein.
Le corpus issu de Web of Science a été construit en recherchant les articles qui citent et font référence à celui publié par Tomasetti. La réponse scientifique est assez forte (123 articles), et en les triant, c’est à dire que nous avons retiré les articles techniques qui ne traitent pas du problème majeur de la controverse – à ce titre nous avons exclu tous les articles qui ne traitait que d’un cancer en particulier et qui ne citait C. Tomasetti que pour une remarque de son article qui ne concerne pas le sujet du débat – nous avons pu analyser ce corpus ce qui nous a permis dans un premier temps de cerner les différents domaines concernés par la discussion.
ANALYSES DES DOMAINES SCIENTIFIQUES CONCERNES :
Research Areas records % of 123
ONCOLOGY | 43 | 34.959 |
CELL BIOLOGY | 24 | 19.512 |
SCIENCE TECHNOLOGY OTHER TOPICS | 13 | 10.569 |
PUBLIC ENVIRONMENTAL OCCUPATIONAL HEALTH | 10 | 8.130 |
BIOCHEMISTRY MOLECULAR BIOLOGY | 10 | 8.130 |
LIFE SCIENCES BIOMEDICINE OTHER TOPICS | 7 | 5.691 |
RESEARCH EXPERIMENTAL MEDICINE | 5 | 4.065 |
GENERAL INTERNAL MEDICINE | 5 | 4.065 |
GENETICS HEREDITY | 4 | 3.252 |
BIOTECHNOLOGY APPLIED MICROBIOLOGY | 4 | 3.252 |
TOXICOLOGY | 3 | 2.439 |
PHARMACOLOGY PHARMACY | 3 | 2.439 |
HEMATOLOGY | 3 | 2.439 |
DEVELOPMENTAL BIOLOGY | 3 | 2.439 |
BIOPHYSICS | 3 | 2.439 |
VIROLOGY | 2 | 1.626 |
SURGERY | 2 | 1.626 |
PATHOLOGY | 2 | 1.626 |
NUTRITION DIETETICS | 2 | 1.626 |
MATHEMATICAL COMPUTATIONAL BIOLOGY | 2 | 1.626 |
GERIATRICS GERONTOLOGY | 2 | 1.626 |
EVOLUTIONARY BIOLOGY | 2 | 1.626 |
ENDOCRINOLOGY METABOLISM | 2 | 1.626 |
CHEMISTRY | 2 | 1.626 |
En tête apparaît sans grande surprise l’oncologie qui est le domaine central du débat (le cancer), et puis en deuxième celui de la biologie cellulaire, car rappelons que la théorie de C. Tomasetti et B. Vogelstein s’appuie en prenant en considération la multiplication des cellules souches, il apparaît donc logique que ce domaine soit principalement concerné par ce débat. Toutes les données à l’origines des résultats scientifiques publiés dans Science (et puis quelques mois plus tard dans Nature) tiennent de la biologie cellulaire. Un résultat intéressant est la place obtenue par le domaine « ENVIRONNEMENT SANTÉ PUBLIQUE » par rapport à d’autres domaines médicaux, ce qui traduit de l’importance des répercussions de l’étude sur la population. De plus, ce domaine est fortement lié à toutes sortes de considérations épidémiologiques, c’est à dire à l’étude d’échantillons de population, et c’est un facteurs à ne pas négliger lorsque le débat principal tient sur la proportion du facteur de hasard par rapport à d’autres facteurs environnementaux sur le risque de développer un cancer.