bannière

   

Outils statistiques

 

L'utilisation des outils statistiques n'a globalement pas été satisfaisante pour notre controverse et cela ne nous permet évidemment pas de présenter de carte lisible et exploitable pouvant éclairer la controverse et sa dynamique. Toutefois, il est possible, grâce à une approche méthodologique rigoureuse des outils proposés, notamment du Web of Science, de tenter de tirer des conclusions intéressantes de cet échec, c'est à dire du fait que la structure des données Web sur le sujet est peu compatible avec l'utilisation de ces outils.

 

WEB OF SCIENCE :

          Le principe vu par le statisticien : L'intérêt majeur de l'utilisation du Web of Science est qu'il cible précisément la composante scientifique de la controverse; en effet, à partir d'une large base de données de publications scientifiques et techniques on peut effectuer des recherches très fines concernant un sujet précis. Par ailleurs, si les articles eux-mêmes sont bien sûrs répertoriés ainsi que leurs résumés (voire parfois l'ensemble de leur contenu), les jeux de citations entre eux sont également fournis. Combien de fois un article donné a-t-il été cité? Par qui? Qui l'auteur cite-t-il? Le traitement de l'ensemble des articles trouvés autour d'un sujet permet donc de trouver les interconnexions entre auteurs et de les illustrer graphiquement grâce à certains logiciels spécialisés, comme Pajek. Moyennant certains algorithmes de traitement, on peut établir un lien direct entre proximité géographique et proximité intellectuelle et ainsi dégager les grands groupes d'acteurs ainsi que les théories adverses sur le sujet.

            Approche de notre sujet :

  • La démarche logique semblait être, en tout premier lieu, de faire la recherche la plus générale possible, avec pour simple mot-clef « bluefin tuna », appellation anglaise du thon rouge. Bien entendu, la quantité de résultats obtenus a été considérable (505 articles exactement). Nous avons toutefois tenté de réaliser une première approche du problème en réalisant une cartographie de l'ensemble des articles trouvés. Nous voulions ensuite identifier et isoler une zone bien précise qui aurait correspondu à notre sujet (grâce aux noms déjà obtenus par les journalistes par exemple), et ainsi situer le problème nous intéressant dans un contexte très global. Mais la quantité et la complexité de l'ensemble des données n'ont malheureusement pas été traitables par les ordinateurs que nous avions à disposition, qui ont rapidement saturé.
  • Nous avons donc naturellement sélectionné et ciblé les données qui nous intéressaient plus particulièrement dans tous les articles concernant le thon rouge, en regroupant ceux faisant intevenir les termes quotas, quota, endangered, threatened, threaten, fishery, farming et autres termes proches, pour aboutir à la quantité encore importante d'une centaine d'articles. Cette fois le traitement a fonctionné mais, étant donné le grand nombre d'auteurs, la carte n'était toujours pas lisible (cf doc1). Ce qui nous a inquiétés est que le passage à l'algorithme de Fruchterman Reingold, qui rapproche les auteurs par proximité intellectuelle, n'a rien donné non plus. Et, en zoomant, on se rend compte qu'il n'y a aucun lien entre les auteurs. En remontant aux articles eux-mêmes, nous nous sommes rendus compte que les citations étaient toujours d'un nombre extrêmement faible, et que lorsqu'elles n'étaient pas purement et simplement inexistantes, il s'agissait en fait la plupart du temps d'auteurs ayant publié plusieurs articles et se citant eux-mêmes. Nous avons toutefois tenté d'autres approches avant d'arriver à une conclusion catégorique.
  • doc 1

    Doc 1

  • Nous avons en effet travaillé sur des ensembles thématiques plus restreints, quitte à perdre en information, pour connaître chaque article plus en détail en lisant chaque résumé, puis élargir, compléter par de nouveaux articles, en effectuant le même type de recherche approfondie au sein des publications des auteurs dont le nom revient souvent. Nous pensions ainsi trouver des ensembles plus localisés, avec des interconnexions exploitables. Malheureusement, cette nouvelle méthode n'a pas non plus fonctionné (cf doc 2). 

doc 2

                   Doc 2

         Le seul résultat avec lequel nous avons trouvé quelques interconnexions concerne un groupe de chercheurs japonais, dont le centre est le professeur Y. Matsuda, affilié à la Kagoshima University, au Japon. Il a émis une théorie originale selon laquelle le rythme actuel de pêche ne menace pas directement le thon rouge, défendant par ailleurs l'idée que les modèles actuellement utilisés doivent intégrer une inertie de la masse des thons rouges beaucoup plus importante que celle habituellement utilisée. Mais les interconnexions n'étaient cette fois encore pas satisfaisantes et nous nous sommes rapidement rendus compte, après quelques recherches, que les acteurs identifiés ne correspondaient guère qu'à une équipe de recherche au sens élargi, autour du professeur Matsuda (cf doc3a et doc3b (traité en Fruchterman Reingold 2D, où le noyau de l'équipe de recherche est l'hexagone central)). Ces échecs nous ont au moins permis d'identifier plusieurs théories totalement différentes au sein de la communauté scientifique, et l'équipe de recherche de Matsuda se démarquait nettement de la plupart des autres, beaucoup plus alarmistes en général. Nous avons également noté que les divergences majeures entre scientifiques se situaient au niveau de la modélisation et des méthodes d'évaluation des masses thonières.

doc 3a doc 3b

                                            Doc 3a                                                                                 Doc 3b

Quelles conclusions tirer de ces difficultés rencontrées ?

         Les chercheurs publiant sur ce sujet travaillent manifestement de façon extrêmement indépendante, sans qu'il y ait de communication entre eux. Cela ne signifie pas qu'il n'y a pas controverse, puisqu'il existe des théories quasiment opposées sur le sujet; la dynamique de la controverse dans toute sa complexité, les débats et échanges directs se situent simplement à un autre niveau, notamment politique, et les scientifiques arrivent en bout de chaîne pour élaborer ou appuyer les différentes théories existantes.

ISSUE CRAWLER 

            Le principe vu par le statisticien : L'IssueCrawler permet, à partir de quelques adresses Web rentrées par l'utilisateur, de « ratisser » le Web en explorant les liens successifs rencontrés et d'établir une véritable cartographie Internet de la controverse.

            Traitement de notre sujet : Nos premières tentatives de Crawl utilisaient uniquement des adresses de sites techniques comme Google Scholar ou le Web of Science. Mais comme lors de notre précédente expérience, ceci n'a pas abouti. Les tentatives suivantes ont donc utilisé principalement des pages de liens de sites gouvernementaux et d'ONG comme Greenpeace ou WWF. Là aussi, nous nous sommes vus renvoyés au bout quelques jours un message d'erreur nous signalant l'échec du Crawl. L'interprétation de cet événement est ici beaucoup moins aisée que dans le cas du Web of Science, puisque nous ne maîtrisons quasiment rien du processus technique qui aboutit, dans les cas favorables, à une carte utilisable.

 Suite et fin: Sources