Un mouvement historique
Les RCT ont au cours du XXe siècle révolutionné la médecine en permettant d’évaluer solidement l’influence et l’impact de traitements par la formation de groupes tests et de groupes témoins. Ils ont émergé dans les politiques sociales aux États-Unis à la fin des années 1960 où ils ont été très à la mode jusqu’aux années 1980. Beaucoup d’argent a été dépensé dans des programmes de très grande envergure qui pouvaient concerner plusieurs dizaines de milliers de personnes. L’exemple le plus symptomatique est l’expérimentation menée dans les années 60 dans le Connecticut consistant à déterminer si l’impôt négatif allait entraîner ou non une baisse de l’offre de travail. Par la suite, l’intérêt porté a décliné pour deux raisons principales aux yeux d’un chercheur que nous avons interrogé et qui a souhaité rester anonyme[ref] :
-
il existe une « différence de temporalité entre le politique et le chercheur » puisque « le politique n’est souvent pas là pour vingt ans et veut donc des résultats rapides, à la différence du chercheur », ce qui peut toutefois être tempéré par l’importance du biais de publication (la perspective de la publication influence directement la façon dont est menée la recherche) ;
-
il y a eu des résultats décevants ou trop complexes qui ont participé à une certaine remise en question de la méthode.
Quoi qu’il en soit, il apparaît clairement qu’il s’agit initialement d’un mouvement anglo-saxon puisque quelques expérimentations ont aussi été menées au Royaume-Uni à cette époque. En France, il faut attendre le gouvernement Rocard pour que soit mis en place un conseil d’évaluation, actant de fait l’idée qu’il faut évaluer les politiques publiques mais les expérimentations ne sont à l’époque pas encore randomisées. Encore aujourd’hui, une différence de perception de l’évaluation sépare les pays anglo-saxons de pays comme la France. Florent Bédécarrats[ref] de l’AFD (division évaluations) souligne bien ce phénomène lorsqu’il précise que « dans les pays anglo-saxons, l’évaluation est une discipline à part entière, ce qui n’est pas le cas en France où il existe peut-être un ou deux masters, mais ils ne sont pas légion et ont parfois du mal à exister et à être reconnus ».
Un retour en grâce ?
Il est frappant de voir que dès que l’on s’intéresse à ce mouvement et à la galaxie d’acteurs qui gravitent autour de ces méthodes, deux éléments surgissent systématiquement, et sont d’ailleurs mis en avant par le J-PAL bien qu’il déplore la trop grande focalisation : Esther Duflo d’une part, qui a largement contribué à la médiatisation du sujet mais qui semble aujourd’hui victime plus ou moins volontaire d’une sorte de culte de la personnalité que déplore le J-PAL, et l’article publié en 2004 sur l’impact du traitement des enfants kenyans aux vermifuges dans la scolarisation qui apparaît comme un « mythe fondateur » du mouvement. Ces deux éléments ont largement contribué au regain d’intérêt pour les RCT dans l’évaluation des politiques sociales.
Ceux-là reviennent en force dans les pays en développement où ils sont de plus en plus utilisés. Partis dans les années 1960 des pays développés, on observe une tendance à y revenir, notamment par les évaluations de plus en plus nombreuses en Occident, y compris en France. Cette boucle (pays développés puis en développement puis développés de nouveau) révèle pour le chercheur interrogé[ref] que « d’une certaine façon, on fait là-bas ce qu’on n’oserait pas faire ici ; il ne faut cependant pas être caricatural : pas sur tout, pas tout le monde » Les enjeux éthiques commencent à affleurer. D’autre part, il fait le constat « qu’avec le consensus de Washington, on nous présentait des solutions, et là une méthode ; on passe d’un consensus de solutions à un consensus de méthodes » mais s’interroge immédiatement : « enfin, est-ce que c’est un consensus, je ne sais pas, c’est une vraie question », à rebours de la volonté d’Esther Duflo, du J-PAL et des tenants des RCT pour qui la méthode ne devrait pas faire débat parce qu’elle est objectivement non contestable.
Une méthode
L’aspect le plus novateur et séduisant apporté par ces chercheurs est sans conteste le recours systématique à une méthode. Il y a une volonté claire de se débarrasser des grandes théories préexistantes et des guerres de chapelle pour laisser la place à une méthode indiscutable et se réclamant héritière d’une scientificité certaine. Dans l’émission Ce soir ou jamais sur la télévision publique française où elle était invitée à l’occasion de la sortie de son livre Repenser la pauvreté, Esther Duflo formalise l’objectif de sa recherche en déclarant une guerre acharnée aux trois « i » que sont « l’idéologie, l’ignorance et l’inertie ». Le rejet de l’idéologie a déjà été évoqué par la volonté de faire table rase des grandes orientations du passé qui ont conduit les différentes politiques de développement à l’échelle mondiale. L’ignorance est une critique qui persiste continuellement en toile de fond puisqu’il était reproché aux organisations internationales de vouloir appliquer à tout prix des politiques dont on ne savait pas si elles produisaient de vrais résultats mais seulement fondées sur des théories abstraites coupées des réalités du terrain, d’où la volonté louable de vouloir bâtir un édifice de données issues directement de l’observation des expérimentations aléatoires. Florent Bédécarrats analyse cette guerre faite à l’ignorance en revenant sur « le rapport When Will We Ever Learn? du CGDEV (publié en 2006) qui explique ce que beaucoup de randomistas répètent : le fait qu’on gaspille de l’argent depuis des dizaines d’années sans savoir ce qui marche et ce qui ne marche pas ; Esther Duflo fait le parallèle avec l’évolution depuis le Moyen-Âge où l’on traitait les gens avec des sangsues jusqu’à l’âge de raison, avec derrière cette analogie l’idée que grâce aux nouvelles méthodes, on va pouvoir sortir du monde de l’ignorance ». Enfin, il s’agissait de se dégager de l’inertie de programmes de grande ampleur en évaluant localement et de façon très ciblée des questions très concrètes. L’idée qui sous-tend toute la démarche selon François Bourguignon[ref] est la cruelle réalisation qu’il n’existe pas de « recette universelle même si l’on a longtemps cherché une méthode implacable à appliquer », et il a bien fallu se rendre à l’évidence que cette recherche était vouée à l’échec pour la simple et bonne raison que one size does not fit all.
Il est intéressant de voir qu’aussi critiques soient certains acteurs sur l’état actuel de ce mouvement, tous considèrent l’idée de base bonne (ou en tout cas pas intrinsèquement mauvaise). Le chercheur interrogé[ref] reconnaît bien sincèrement que « la volonté initiale, et c’est le principal intérêt, s’appuie sur l’idée de randomisation qui vient de ce qui se faisait en médecine et avant ça en agronomie ; il y a derrière toute une histoire et une tradition scientifique de rendre des groupes comparables pour déterminer l’impact réellement d’un certain traitement, si bien que l’idée de départ est tout à fait louable et la motivation est très bonne à la base ». Comme il l’explique, l’un des nombreux points de débat ne se situerait donc pas tant dans la pertinence de la méthode en elle-même mais plutôt dans « sa volonté hégémonique depuis plusieurs années qui se traduit par une attaque méthodologique de ce que faisaient la Banque mondiale et les autres, avec une tendance de plus en plus offensive à faire de leur méthode l’étalon de ce qui doit être fait en matière de politiques publiques en revendiquant clairement une supériorité méthodologique ».
La critique qui apparaît ici est récurrente dans le milieu de l’économie du développement, à savoir que les RCT sont une bonne méthode, un outil efficace mais pas universel, dans le sens où il ne faut pas l’élever au rang de méthode absolue au détriment d’autres outils qui donnent des résultats différents ou tout aussi bons. Martin Ravaillon[ref], ancien directeur du département recherche de la Banque mondiale, s’inscrit pleinement dans ce type d’objection : « Randomization is one of the tools that can help; however, the important task of investigating what works and what does not in the fight against poverty cannot be monopolized by one method » (Martin Ravaillon [2009], Should the Randomistas Rule?). L’AFD conclut dans un article d’évaluation des RCT qu’ils ne sont utiles et efficaces que dans un nombre extrêmement réduit de cas, sous de très strictes conditions, et qu’il est illusoire de penser pouvoir en faire l’alpha et l’oméga de la recherche. Cette prise de distance ne doit pourtant pas effacer l’intérêt porté aux RCT qui présentent par bien des aspects des apports remarquables. Florent Bédécarrats l’exprime en ces termes : « Un bilan assez critique a été tiré et a été largement communiqué par l’AFD. L’agence a donc pris part non seulement à la promotion des RCT avec la chaire au Collège de France et la mise en place de deux évaluations, mais a aussi fait part de ses critiques par la suite ». La critique portée est la dénonciation d’une certaine volonté hégémonique des RCT qui se sont construits en opposition aux grands paradigmes dogmatiques et « s’étaient affichés comme une manière de les dépasser en rejetant l’idéologie au profit d’un empirisme objectif » et qui auraient aujourd’hui pris la place de ce qu’ils combattaient hier en aboutissant « au même phénomène de création d’un système auto-référentiel qui a tendance à s’auto-alimenter jusqu’à se caricaturer à l’extrême et à se retrouver face à ses contradictions ». Florent Bédécarrats met alors en lumière que ces dynamiques cycliques sont en fait des « schémas récurrents », des mouvements systémiques qui existaient déjà du temps des querelles théologiques et qui conduisent invariablement à « des guerres de chapelle et à un phénomène épuisant de polarisation méthodologique et épistémologique ». Quant aux économistes Barrett et Carter[ref], ils y voient une menace pour la diversité des champs de recherche : « The fact that RCTs are not appropriate for all questions is not a criticism of the methodology per se, but it becomes a serious problem when RCTs are seen as the way of knowing and applicability of the RCT method seems drive the research agenda in preference to the importance of the question being asked ». Esther Duflo semble consciente de ce type de dynamiques lorsqu’elle rappelle que le « discours public sur les problèmes de pauvreté a tendance à se polariser jusqu’à devenir caricatural et manichéen » ; en revanche, elle n’admet visiblement pas que les RCT aient fini par en faire partie intégrante. L’analyse des controverses permet à ce titre de prendre conscience des logiques sous-jacentes de construction d’un débat qui se mue en mouvements de balanciers jusqu’à risquer de combattre le dogmatisme par l’idéologie.
Des conditions géopolitiques favorables
Les différentes personnes interrogées et acteurs de la controverse ont souvent donné une interprétation personnelle des conditions d’émergence des RCT dans l’évaluation des politiques de développement et même si leurs points de vue divergent par moments, s’opposent souvent, leurs analyses se complètent et permettent d’élaborer un panorama convaincant du succès de ce courant.
Le chercheur que nous avons interrogé[ref] explique d’abord les raisons qui ont fait du monde anglo-saxon le berceau des RCT appliqués aux politiques sociales. Pour lui, le recours aux évaluations apparaît comme « bien plus naturel car il existe aux États-Unis une méfiance presque originelle vis-à-vis de la dépense publique car les dépenses fédérales ne vont pas de soi ». L’émergence des RCT serait selon lui fondamentalement dû à une perte de repères et de raisons quant à la question de « pourquoi dépense-t-on ? » et surtout « dépense-t-on bien ? ». Ces interrogations ne se posent qu’au sortir de la Seconde Guerre car avant « avec le New Deal, on dépense parce qu’on n’a pas le choix, pendant la guerre on dépense parce que c’est la guerre » et au lendemain de cette dernière il devient indispensable d’évaluer la pertinence des politiques publiques. Ilf Bencheikh[ref], directeur adjoint du J-PAL Europe, poursuit la réflexion et forme une analyse plus géopolitique de la situation. Au sortir de la guerre, le monde se polarise en deux blocs opposés. Les pays en développement, colonies ou pays nouvellement indépendants, ne sont dignes d’intérêt pour les grandes puissances que dans la mesure où ils leur permettent d’asseoir ou d’étendre leur sphère d’influence. Cette logique disparaît avec la chute de l’Union soviétique qui presque du jour au lendemain rend caduques les raisons d’influence. Il devient alors nécessaire de se poser la question des aides apportées aux pays en développement, de juger de leur utilité et de leur efficacité. C’est à ce moment-là qu’émergent les premières recherches utilisant les RCT.