La Statistique en Sociologie

La bibliothèque libre.
Aller à : navigation, rechercher


LA STATISTIQUE EN SOCIOLOGIE

Mon grand ami Simiand devait m'assister aujourd'hui, comme il y a deux ans, quand j'ai parlé ici de la loi en sociologie. Vous ne l'entendrez pas, et j'ai la grande tristesse de me présenter seul devant vous. Du moins m'inspirerai-je surtout, dans cet exposé, de ses réflexions originales sur la méthode statistique. Sa pensée nous appartient, elle appartient à l'avenir. S'il n'est plus là pour nous guider, du moins la route qu'il a tracée reste bien visible. Je voudrais vous faire partager ma conviction, fortifiée à l'épreuve, qu'il n'en est pas de plus directe ni de plus sûre. Bien que la statistique se soit appliquée progressivement à beaucoup de sciences de la nature inerte et organique, c'est dans le domaine des sciences sociales qu'elle a été d'abord dé-couverte ; population, ressources caractéristiques diverses des Étau, durée de la vie dans les différents groupes humains, naissances, mariages, rapport des naissances masculines et féminines : telles sont bien les objets qui ont sollicité d'abord la curiosité des statisticiens. Il y a tout lieu de croire que nous aurons le plus de chance de découvrir les caractères distinctifs de la recherche statistique en observant l'emploi qui en est fait en sociologie. Simiand a bien vu, je crois, qu'elle ne se confond pas avec les méthodes appliquées par les autres sciences, qu'elle en est ce-pendant l'équivalent quand il s'agit d'étudier les groupes, qu'elle les complète, et qu'elle est d'ailleurs le seul moyen de reconnaître les régularités sociales. Quelquefois, on la définit la science des moyennes. Par exemple, d'un certain nombre d'observations sur des individus, on dégagera une moyenne, qui donnera l'indice céphalique' d'une race. Il est vrai qu'un physicien peut aussi déterminer la densité d'un corps à l'aide d'une série d'observations particulières dont il calcule la moyenne. Par exemple il peut calculer la moyenne des densités d'un certain nombre de barres de fer. Il y a toutefois une différence entre les deux cas. Quant à la densité d'un corps, on conçoit qu'un instrument ou un observateur placé dans de meilleures conditions puisse l'établir par une constatation unique. Au contraire, quant à l'indice céphalique, il n'est pas possible de l'obtenir par une observation unique, sur un seul sujet. En effet, c'est un caractère qui n'est peut-être réalisé comme tel chez aucun des individus observés, mais qui s'applique à l'ensemble. Ainsi, la statistique s'applique aux faits qu'on détermine quantitativement au moyen d'un nombre plus ou moins grand de constatations individuelles, mais à des faits qui sont distincts de ces éléments individuels, et ne sont réalisés comme tels en aucun d'eux. En d'autres ternies, la statistique permet d'atteindre les caractères d'un groupe, qui ont une réalité pour le groupe tout entier, mais qu'on ne découvrirait dans aucun membre de ce groupe pris à part et isolément: par exemple, la durée moyenne de vie dans un groupe d'hommes, qui ne sera, en général, la durée de vie exacte d'aucun de ces hommes pris au hasard, est cependant une réalité, puisqu'on la retrouve identique, pour le même groupe à plusieurs époques successives, et, à la même époque, pour plusieurs groupes composés d'individus répartis de la même manière quant à l'âge. Il faut, il est vrai. que ces grouper présentent une certaine réalité, une certaine consistance, en tant que groupes. Tout comptage n'est pas une statistique. Un naturaliste ne s'amusera pas à calculer la taille moyenne des animaux d'une ménagerie, qui sont rassemblés en na même lieu pour des raisons de hasard ou de fantaisie. De même la moyenne de prix recueillis au hasard, prix de gros, de détail, salaires, prix de services, prix de loyers, n'est pas une statistique. En est une, au contraire, le calcul de la taille moyenne des animaux d'une espèce, ou des prix de gros dans un pays, et à une époque donnée. Mais il en est de même des séries considérées dans le temps. La moyenne de prix recueillis à dix ans, ou même à cinq ans de distance, n'est pas une statistique, tant qu'on ne sait pas s'il y a une liaison ou un rapport de ressemblance entre ces années an point de vue économique, et quels mouvements se sont produits de l'une à l'autre. La moyenne des prix recueillis pour toutes les annexe successives d'une période de hausse, on d'une période de baisse, l'accroissement annuel moyen des prix dans chacune de ces périodes, au contraire, est bien une statistique, car la série des années de chacune représente bien un groupe qui a une réalité, une consistance. Ensemble dans le temps, ensemble dans l'espace, supposant une organisation et une liaison entre les parties, et étudié en tant que tel : c'est bien là l'objet auquel s'applique la statistique. Cette définition, présentée par Simiand, est-elle cependant suffisante ? Elle s'applique à tout le défini. Ne s'applique-t-elle qu'au seul défini ? On lui objectera que, dans le monde vivant, les organismes, et, dans les organismes, les organes, constituent aussi des ensembles réels et consistants, groupes d'organes, groupes de cellules, et qu'on étudie en général leurs caractères par une méthode d'observation directe, qui n'est pas statistique. Mais c'est qu'il y a entre ces ensembles vivants, et les groupes sociaux, précisément une différence essentielle. Supposons que je prenne la température d'un sujet. Il suffit de la connaître pour une partie du corps, de l'intérieur du corps. Ou, encore, si j'étudie un tissu, je pourrai m'en tenir à une ou quelques cellules, et les observer au microscope. De même, l'examen direct des fonctions d'un organisme me permettra de connaître les fonctions de tous lès organismes de la même espèce. C'est qu'ici les ensembles considérés sont constitués de parties toutes semblables, et presque identiques. Il n'en est plus do même des groupes sociaux, et des phénomènes proprement sociaux dans ces groupes. Tendances, croyances et pensées collectives sont représentées inégalement, diversement, par chaque individu: chacun n'en présente qu'une partie ou qu'un aspect. C'est pourquoi il n'y a qu'un moyen d'atteindre l'état collectif : c'est de rassembler toutes ces parties, de les dénombrer intégrale-ment, de façon à ne négliger aucune d'entre elles, et d'en recomposer l'ensemble. Au fond, il n'y a d'ensembles réels que les groupes sociaux, précisément parce qu'ils sont constitués par des éléments différents. Tous les autres ensembles sont de. collections. Les espèces vivantes sont des collections d'organismes, les organes et tissus sont des collections de cellules, et l'organisme lui-même n'est qu'un individu. Les groupes sociaux sont plus encore, et autre chose.

Partons maintenant do cette notion de groupes et ensembles réels et consistants. C'est ici que les difficultés commencent. Il faut étudier de tels groupes. Mais ce ne sont pas des objets sensibles, avec des contours définis. Avant de les étudier, il faut d'abord les constituer. Comment les constituer, si on ne les a pas déjà étudiés ? On comprendra mieux la nature d'un tel cercle vicieux, si on se reporte à quelques exemples. La statistique officielle dispose d'ordinaire ses observations dans les cadres do l'espace et du temps, et elle no peut gué?e faire autrement. Quelquefois, ces cadres correspondent bien à des divisions sociales réelles, par exemple, les naissances et les morts distinguées par pays, ou par années. Mais la population d'un département n'est pas un groupe social. Une période quinquennale ou décennale n'est pas, d'ordinaire, une période sociale définie. Sans doute, il faut des points de repère. Qu'on observe une partie du ciel dans un télescope, une coupe dans un microscope, on conçoit que l'observateur détermine et divise le champ qu'il observe au moyen de réseaux de lignes également espacées, et qui se coupent à angle droit. Oui, mais alors, il déplace son appareil, de façon à ce que ces lignes embrassent l'ensemble on le détail qui l'intéresse, coïncident à peu près avec les limites réelles de l'objet étudié. Le statisticien, lui, ne modifie pas volontiers ses cadres. Il recense, par exemple, la population tous les cinq ans, tous les dix ans, du moins il indique suivant ces intervalles les chiffres do population, les prix, les salaires, alors que, peut-être, c'est à une des années intermédiaires que commence ou que finit un mouvement continu, que se produit une variation essentielle. Encore les statistiques officielles ne nous donnent-elles que ce qu'elles peuvent nous donner, et ont-elles réalisé d'ailleurs bien dos progrès à cet égard, puisqu'on con-naît le mouvement de la population, à présent, année par année, trimestre par trimestre, le mouvement des prix mois par mois. Mais que d'auteurs, travaillant sur ces statistiques, s'en tiennent à comparer des données prises à 10 ans, 20 ans, et même 50 ans de distance ! Quel savant groupe ses observations suivant de tels intervalles du calendrier ? C'est pourquoi Simiand énonçait le précepte qu'il faut étudier le phénomène en le suivant de façon ininterrompue, de son commence-ment jusqu'à son terme, de même qu'un botaniste ne s'en tiendra pas à observer une plante tous les premiers du mois, ou tous les dimanches, mais la suivra jour par jour de la germination à la floraison. On trouve, dans les annuaires statistiques, des tableaux qui indiquent comment se répartissent les mariages suivant l'écart d'âge entre les époux. Mais, en France, on s'en tient à comparer des combinaisons d'âge calculées ainsi : époux de 20 à 25 ans et épouses de 20 à 2.5 ans, époux de 25 à 30 ans et épouses de 20 à 25 ans. Or la première combinaison comprend dis cas où l'époux a 20 ans et l'épouse 20 ans (écart d'âge 0), d'autres où l'époux a 25 ans et l'épouse 20 ans (intervalle d'âge = 5 ans), et aussi des cas où l'époux est plus âgé que l'épouse, d'autres où l'épouse est plus âgée que l'époux, de 1, 2, 3, 4, et 5 ans. Ou réunit ainsi dans une même catégorie des mariages qui, du point de vue biologique, mais du point de vue social aussi, représentent des types d'union matrimoniale très différents. On pourrait, de mémo, se demander si les groupes d'âge, tels quo les constituent les statisticiens, ont bien une réalité sociale. Entendons-nous cependant. Quand nous disons qu'un animal a tel ou tel âge, d'abord nous hésitons peut-être à employer ce terme. Surtout, ce que nous signifions par là, c'est qu'il est arrivé à telle étape de son évolution biologique individuelle, et, si l'on veut, do l'évolution biologique naturelle d'un représentant de son espèce. Mais l'animal ne sait pas quel est son âge, et si les hommes n'étaient que des animaux, ils ne le sauraient pas plus. D'autre part, un individu humain isolé, privé de tout rapport avec ses semblables, et qui ne s'appuierait pas sur l'expérience sociale, ne saurait même pas qu'il doit mourir. Peut-être (si la mémoire suppose la vie en société) ne se rappellerait-il pas qu'il a été plus jeune qu'il n'est aujourd'hui. Quel sens pourrait avoir pour lui la notion d'âge ? C'est donc bien une no-tien sociale, établie par comparaison avec les divers membres du groupe. En tout cas, le degré de précision avec lequel elle s'impose à nous s'explique surtout par la coutume et les institutions. Un étudiant turc me disait que dans un pays, où l'état civil n'existe que depuis peu, la plupart des hommes ignorent leur âge, et, si on le leur demande, déclarent que cela ne les intéresse pas. Eu gros, ils distinguent les enfants, les adultes, et les vieillards, et se rangent dans une de ces catégories. Mais, si notre âge nous est en quelque sorte imposé par la société, il ne s'ensuit pas que les hommes ou les femmes d'un âge donné, exprimé en nombre d'années, constituent un groupe social défini. Comment en serait-il ainsi, puisque, d'abord, dans un tel groupe on no resterait que fort peu de temps, puisqu'à chaque année on monte d'un échelon, et qu'on passe sans cesse d'une catégorie à la suivante ? D'autre part, et bien qu'on ait proposé de former, par exemple, le parti des hommes de 40 ans, s'il y a des intérêts et préoccupations communes aux jeunes gens, aux adultes, aux gens plus âgés, il s'agit en réalité de groupes dont les membres ont des âges assez divers, et qui s'espacent sur un plus largo intervalle. Enfin, suivant l'époque, les coutumes, les institutions, la composition même de la population, on attache plus ou moins d'importance à ce caractère, et la jeunesse, l'âge adulte, la vieillesse sont définis par l'opinion de façon très différente. Autrefois, un Européen de 50 ans se croyait jeune pour entrer dans les affaires, en Amérique, alors qu'à cet âge, dans nos pays, on se retirait do son commerce, ou l'on prenait sa retraite. Peut-être, depuis la guerre précédente, est-ce l'inverse, et cela peut encore changer. Il y a donc beaucoup trop de rigueur arithmétique, une rigueur un peu artificielle et arbitraire, dans les présentations qu'on nous fait depuis longtemps de pyramides d'âge, constituées de couches d'égale hauteur, mais de moins en moins larges, dont chacune correspond à une catégorie d'âge, de 0 à 5 ans, de 5 à 10, etc., la moitié droite de la figure comprenant les femmes, la partie gauche, les hommes. Lorsqu'on superpose les doux projections de la pyramide des âges pour l'Allemagne, par exemple, et pour la France, on constate, comme ou pouvait s'y attendre, que la pyramide allemande a une base bien plus large, parce que la proportion dei enfants est plus élevée en ce pays, et. qu'à partir de 25 ans elle s'amincit, qu'elle déborde jusqu'à ce moment la projection de la pyramide française, très étroite à la base, mais qu'ensuite elle y est tout entière comprise, la proportion des âges plus élevée étant, en France, bien plus grande. C'est bien là une traduction exacte des données numériques. Mais quelle en est la portée, au point de vue sociologique ? Il faudrait savoir si la limite qui sépare. aux yeux de l'opinion, l'âge adulte de la jeunesse, la vieillesse de l'âge adulte, est la même dans les deux pays. On peut en douter, car, là où il y a beaucoup d'hommes âgés, ils se regardent peut-être comme plus jeunes qu'ils ne le sont à considérer leur âge, et là où il y a beaucoup de jeunes gens, comme un grand nombre d'entre eux occupent ou s'apprêtent à occuper des situations réservées ailleurs à des adultes, peut-être regardent-ils et les considère-t-on comme plus âgés qu'ils ne le sont, à tenir compte de leur âge en années. Inversement, si l'on tient compte de ce que, de ces deux pays, l'un est plus au nord, l'autre plus au sud, de ce qu'ils ont une composition ethnique différente, il se peut que les hommes soient plus précoces dans l'un, en France, par exemple, que dans l'autre : alors on y serait adulte plus tôt, on y entrerait plus tôt, aussi, dans la catégorie des vieillards si bien que la population française serait encore plus âgée, la population allemande plus jeune encore, qu'il ne parait résulter de ces figurations. Enfin comment ne pas tenir compte de la diversité des classes sociales, des professions, des milieux urbains et ruraux ? La pyramide des âges est-elle la même, dans un même pays, à la ville et à la campagne, dans l'industrie, le commerce, l'agriculture, les professions libérales, dans les classes aisées et dans les classes pauvres ? Remarquons qu'aux États-Unis, la proportion des adultes est à peu près aussi élevée qu'en France, non parce que la natalité y est aussi faible depuis longtemps, mais par suite de l'afflux des immigrants. Ce sont ces conditions diverses qu'il faudrait atteindre. C'est sur ces groupes différents que l'étude statistique devrait porter. De tout cela, les pyramides des âges nous donnent une idée aussi schématique et aussi pauvre que les pyramides d'Égypte des destinées des multitudes humaines qui ont eu la tâche de les construire. J'en dirai autant d'un autre procédé, d'une autre construction, du reste ingénieuse et utile à certains égards, que les statisticiens nous ont proposée récemment, en vue de mieux comparer un caractère tel que la mortalité, moyenne, d'un pays à un autre pays. Lorsqu'on observait que la mortalité, moyenne. ou encore la mortalité probable, disons le taux de mortalité, était beaucoup plus faible en Allemagne qu'en France, on pouvait être victime d'une illusion, et se figurer que la durée moyenne de la vie était, dans le même rapport, plus longue dans ce pays-là que dans celui-ci. Si l'on tient compte de ce que la composition de la population par âge n'est pas la même dans l'un et dans l'autre, alors il apparaît naturel qu'une population plus âgée paie un tribut plus élevé à la mort qu'une population plus jeune. Mais on a voulu écarter cette cause d'erreur, procéder comme en physique où on élimine, ou on maintient constant un facteur, pour mesurer l'action de l'autre. C'est pourquoi, ici, on a fait abstraction de la composition par âge. On aurait pu s'en tenir à comparer, d'un pays à l'autre, le taux de mortalité à égalité d'âge. Mais on a voulu aller plus loin, calculer toujours un seul taux de mortalité pour la population tout entière de chaque pays, rectifier cependant ce taux, en tenant compte de la répartition inégale par âge. Pour y parvenir, faisons choix d'une population-type, qui occupera, quant à cette répartition même, une position à peu près moyenne entre les autres. Soit la population suédoise. Appliquons alors, aux différentes catégories d'âge de cette population type, les taux de mortalité observés pour ces âges. par exemple, en France, puis en Allemagne. Calculons ensuite quel est le taux de mortalité global qui en résulte pour chacun de ces pays. On trouve alors que, tandis que le taux de mortalité simple, calculé suivant les anciennes méthodes, était plus élevé en France qu'en Allemagne, le roux de mortalité dit rectifié y est moins élevé. Mais quelle est la portée exacte de ce résultat ? La mon est-un fait biologique, mais c'est aussi un fait social. Elle peut varier, le taux de mortalité peut varier, non seulement pour la population tout entière, mais pour chaque catégorie d'âge, précisément, suivant la composition par âges de la population (qui résulte de certaines conditions sociales). Dans un pays où il y a peu d'enfants et beaucoup d'adultes, ceux-ci sont exposés à une concurrence moins forte de la part des jeunes : ils ont une existence plus tranquille et plus assurée. D'autre part, comme les enfants sont rares, on prend peut-être plus de soin d'eux, de leur développement physique, de leur santé. Si la composition par âges de la population en France était modifiée, rien ne prouve que les taux de mortalité par âge ne seraient pas plus élevés. Il n'est donc pas légitime de conserver les taux de mortalité par âge, et de modifier en même temps la composition de la population. Sans doute a-t-on voulu isoler ainsi l'aspect bio-logique de la mon, ne retenir que les facteurs qui déterminent la vitalité naturelle d'une population, en tenant compte, cependant, de l'état de la médecine et de l'hygiène dans chaque pays. Mais la mort, abstraction faite de la composition do la population par âges, dépend encore de beaucoup d'autres facteurs sociaux. La mort résulte do la vie, et la vie est conditionnée par la situation économique, par l'organisation de la famille, par les institutions et par les coutumes. C'est tout cela qu'il faudrait éliminer, ou, du moins, supposer uniforme dans tous les pays. Mais est-ce possible ? On se trouve amené ainsi à poser des problèmes bien paradoxaux. Combien de temps vivraient les Français si, restant Français, ils vivaient dans les mêmes conditions physiques et sociales que les Suédois ? Combien de temps vivraient les Allemands si, restant Allemands, ils vivaient dans les mêmes conditions que les Français ? Cela revient, comme l'observait Simiand à propos d'une comparaison économique récente entre les niveaux de vie dans les différents pays, à se demander comment vivrait un chameau, si, restant chameau, il était transporté dans les régions polaires, et comment vivrait un renne si, restant un renne, il était transporté dans le Sahara. En d'autres termes, tout se passe comme si, pour étudier les caractères démographiques d'un paya, il fallait partir d'une population qui n'est celle d'aucun pays, comme si l'on avait à faire à des hommes qui ne naissent, ne se marient, ne meurent dans aucune région définie de quelque manière, quant aux coutumes familiales, religieuses, juridiques, économiques. Mais, de même que l'homo economicus, un tel homo demographicus est une abstraction trop soigneusement détachée do la réalité pour nous apprendre quoi que ce soit surie réel. Bien entendu, nous ne contestons pas que cos procédés de représentation schématique, d'analyse et de simplification n'aient leur utilité. Ils nous procurent une connaissance plus claire des données dont nous disposons, et ils nous font découvrir entre elles bien des rapports que nous n'apercevions pas avant de les avoir ainsi élaborées. Toute la question est de savoir s'il vaut mieux éclairer ainsi au maximum des faits en somme assez gros et limités, ou en chercher d'autres. Cela, sans doute, n'exclut pas ceci, à condition qu'on ne se contente pas trop aisément, et qu'on ne s'imagine pas qu'on a expliqué la réalité, quand on lui a substitué une formule ou une figure avers la-quelle elle cadre à peu près. On risque alors de superposer aux groupes réels des groupes fictifs qui ne paraissent correspondre aux premiers que parce qu'ils ne sont que ces premiers en effet, mais privés d'une grande partie de leur contenu. Est-on bien sûr alors que ce qu'on a ainsi écarté pour des motifs de simplification n'était pas l'essentiel, ce sans quoi on ne peut comprendre et expliquer la réalité ? On a dit que la statistique était la science des moyennes et de, courbes. Ce n'est peut-être point là une définition suffisante. Il est exact eu tous cas que, par exemple, pour éliminer les variations saisonnières du chômage, il faut calculer des moyenne+ annuelles, et, pour les mettre en valeur, des moyennes mensuelles. Simiand voyait même là, en sociologie quantitative, l'équivalent de la méthode expérimentale. Mais ici, il faut prendre bien des précautions complémentaires, qui ne sont pas nécessaires en physique, parce qu'on est privé du moyen de contrôle qui s'offre au physicien, savoir la vérification matérielle. Si le physicien a éliminé des facteurs essentiels, le phénomène ne se produit pas. Ici, des chiffres se laissent toujours combiner avec des chiffres. Pour être assuré que ses moyennes ou ses indices correspondent à la réalité, qui est ici plus complexe qu'en physique, il faut que le statisticien calcule des valeurs typiques complexes aussi, par exemple des médianes, avec des quartiles, des déciles, et qu'il en calcule plusieurs de divers genres, qu'il multiplie les recoupements. Quant aux courbes, elles doivent suivre tous les replis du phénomène, le représenter dans toutes ses phases, mais aussi l'embrasser dans toute son étendue, et en toutes ses parties : c'est ainsi qu'on représentera les mouvements du salaire par plusieurs courbes, continues autant que possible, juxtaposées, aussi nombreuses qu'il y a de données correspondant à des groupes différents, agriculture, industrie, et diverses espèces et formes d'industrie, grandes villes, villes moyennes, petites villes. Cela exige un effort d'attention multiple, à la fois abstraite et concrète. Mais cette méthode empirique est la seule qui permette de rester en contact aussi étroit que possible avec la réalité. Le point de vue de beaucoup de statisticiens de formation mathématique est tout différent. Il s'exprime assez bien dans ces deux phrases, que j'emprunte à un ouvrage, d'ailleurs remarquable à bien des égards, de M. Gibrat, sur les inégalités économiques : Notre loi est essentiellement statistique. Elle ramène simplement les courbes des répartitions économiques à une courbe célèbre, la courbe en cloche, dite aussi de Gauss ou des erreurs. Est-ce bien vraiment l'idéal de la recherche statistique que de ramener les faits économiques et sociaux, leurs mouvements et leurs variations, à telle on telle courbe avec laquelle les mathématiciens sont familiers ? Certes, l'ingéniosité des algébristes et géomètres est grande. Ils disposent de nombreux pro-cédée d'ajustement, ils savent introduire dans leurs formules divers paramètres, si bien qu'en faisant les conventions nécessaires il est toujours possible de ramener les courbes observées à des courbes théoriques de forme connue. C'est ainsi que le statisticien anglais Udny Yule montrait, il y a quelques années, que les courbes de population observées dans trois pays aussi différents que l'Angleterre, la France et les États-Unis, pendant plus d'un siècle, pouvaient, au moyen de certains ajustements, se replacer exactement sur des sections différentes, ou se recouvrant en partie, d'une même courbe théorique qui était de forme parfaitement régulière et s'exprimait par une formule unique. Mais des courbes de ce genre ne nous apprennent rien sur le mécanisme interne des liaisons entre diverses séries de faits d'où résultent les mouvements dont elles nous donnent une représentation approchée : c'est cependant avec l'étude de ce jeu de liaisons que commence, et que commence seulement la recherche positive. Ou peut même craindre que les simplifications nécessaires pour l'établissement de ces courbes aient éliminé un grand nombre de particularités essentielles qui seules nous mettraient sur la voie de l'explication. Voici, par exemple, l'étude du mouvement des prix, qui a été poursuivie avec tant de soin dans beaucoup de pays depuis quelques décades. On avait remarqué de bonne heure qu'ils manifestaient des variations cycliques de courte durée, baisse, stagnation, puis hausse, séparées par des crises périodiques, à 5, 6, 7 ans d'intervalle. Il y avait là un mouvement régulier qui paraissait pouvoir se représenter par une courbe telle que celle qui exprime les oscillations périodiques d'un pendule, c'est-à-dire par une courbe sinusoïdale. On s'est attaché à cette figure assez simple, peut-être parce qu'elle évoquait l'idée de mouvements alternatifs et réguliers en deça et au delà d'un niveau moyen, d'une position d'équilibre. Cette représentation physico-mathématique s'est de plus en plus imposée, d'autant plus qu'elle permettait de ramener à un type simple et uniforme toute la série successive des variations. Sans doute on s'était bien aperçu qu'à travers ces oscillations, et de l'une à l'autre, il se produisait un changement d'autre nature, et de plus longue durée, tantôt eu hausse, tantôt en baisse, qui tantôt accentuait, tantôt atténuait ces oscillations, et qui y introduisait d'autres irrégularités encore. Mais, au lieu d'étudier ce changement en lui-même, on a cherché à l'éliminer, comme on transforme la pente d'une montagne en un plateau, en une ligne horizontale. On a dissocié, par la pensée, la pente, et les autres accidente (ici, les montées et descentes par rapport à la pente), et, d'abord, pour trouver la pente, on est parti de ces montées et descentes. On l'a déterminée, par la méthode des moindres carrés, ou autre-ment, et, ensuite, il n'en a plus été question. Il a été entendu que c'était là une variation secondaire, sans rapport avec les oscillations, sans action sur elles. Sans doute, dans le Cours de statistique de M. Aftalion, on nous dit : « Certaines théories ont déjà été échafaudées, suivant lesquelles le mouvement de longue durée des prix passerait lui aussi par un grand rythme alterné. » Mais l'auteur ajoute : a On peut avoir quelques doutes sur l'existence de ces grands cycles. On n'en signale jusqu'ici que deux et demi (depuis la fin du nue siècle), ce qui est trop peu pour permettre d'établir une régularité durable » (p. 95). A Simiand, au contraire, il apparaîtra qu'une ou deux répétitions suffisent pour établir la réalité de ces grand cycles. C'est qu'il les a observées dans leur mécanisme complexe, et que deux expériences peuvent suffire, quand elles mettent en jeu tout un ensemble complexe de nombreux facteurs mesurés avec précision. M. Aftalion, lui, s'en tient à la simple alternance de la hausse et de la baisse, à la courbe simplifiée, qui n'est pas. typique en effet lorsqu'elle ne répond qu'à un ou deux cas. Ainsi, toute l'attention se porte sur les mouvements cycliques de courte durée. Ils donnent naissance à une vaste littérature. On s'efforce d'en faire la théorie, en les isolant du mouvement complexe d'où ils sont extraits. Et on essaie de les expliquer en s'en tenant à eux seuls. C'est au contraire par une observation directe, étendue sur la durée de plus d'un siècle, et sans partir des variations cycliques courtes, que Simiand a établi l'existence de mouvements périodiques de longue durée, quant aux prix : bien plus, il n'en a compris la nature qu'à la condition de les replacer dans l'ensemble de l'évolution économique prise dans toute sa complexité, c'est-à-dire en réintroduisant dans l'objet étudié tout ce qu'on en avait écarté. Je ne sais pas encore exactement comment il expliquait les variations cycliques courtes, aux-quelles il a consacré son dernier coure du Collège de France. Mais ou je me trompe fort, ou c'est à la lumière des mouvements de longue durée, et en les y replaçant, qu'il en comprenait le mécanisme. Ce que je sais bien, en tous cas, c'est que, pour lui, ces variations cycliques ne se ramenaient pas à des oscillations en deçà et au delà d'une position d'équilibre, qu'il y voyait les phases successives d'une évolution organique et d'une sorte de progrès tel que chaque cycle ou chaque partie d'un cycle n'était pas la reproduction automatique dans le même sens (s'il s'agit d'un cycle complet), dans le sens inverse (s'il s'agit d'une moitié d'un cycle) du mouvement précédent. Ce n'était pas le retour périodique à un même équilibre, mais le passage d'un déséquilibre à un autre déséquilibre, ou, si l'on veut, d'un équilibre instable à un autre équilibre instable, différent du premier par là même que le premier s'était produit avant lui, l'avait préparé, et en était en quelque sorte la condition. D'un tel genre d'évolution, aucune représentation schématique simple ne pourrait nous donner quelque idée. C'est, à vrai dire, d'une toute autre façon qu'il faut concevoir l'utilisation des méthodes statistiques en sociologie quantitative. Elles ne nous apportent pas des théories, mais des instruments d'observation et de comparaison, à la fois précis et objectifs, et c'est dans cette direction qu'il faudra de plus en plus les développer. A ce point de vue, nous devons examiner, et sans entrer dans le détail technique, les procédés si souvent recommandés et appliqués, depuis quelque temps, sous le nom d'indice et coefficient de dépendance, coefficient de corrélation. Ils ont pour objet de substituer, à la comparaison visuelle des courbes empiriques, le calcul d'un nombre unique, compris par exemple entre - 1 et 1, +- 1 représentant le degré de correspondance maxima entre deux séries de faits, 0 l'absence de tout rapport, - 1 le degré d'opposition maxima (qui est d'ailleurs aussi un rapport de dépendance). L'avantage d'une telle méthode, c'est qu'à une appréciation subjective (qui peut varier d'un observateur à l'autre), et d'ailleurs qualitative, elle substitue un résultat objectif et précis. C'est de façon automatique que le calcul répondrait à cette question : y a-t-il dépendance entre ces deux séries, et quel est le degré de cette dépendance ? Il n'est plus nécessaire de considérer longuement les courbes, de faire preuve d'ingéniosité, d'intuition, de finesse, mais n'importe quel calculateur va opérer une sorte de triage entre les faits qui sont en rapport, et tous les autres. Travail de laboratoire, travail d'équipe, dont le rendement serait assuré. Mais, d'abord, il faut bien reconnaître que, sur la valeur même des divers coefficients, les mathématiciens ne sont pas d'accord, ou plutôt qu'ils paraissent s'être mis d'accord pour reconnaître qu'on n'a pas encore trouvé un coefficient do corrélation pleine-ment valable. A propos du coefficient de corrélation de Bravais-Galton, très souvent employé, M. Fréchet, tout récemment, après une enquête menée auprès de quelques-uns des statisticiens les plus connus par leur compétence mathématique, a proposé au dernier Congrès de l'Institut international de statistique une motion constatant « que le champ de validité de l'emploi du coefficient de corrélation est singulièrement plus étroit que beaucoup ne l'avaient d'abord supposé ; que la valeur du coefficient de corrélation, fût-elle égale à - 1, ou 1, ne saurait à elle seule garantir la causalité, laquelle doit être prouvée par des raisons d'un ordre différent. Mais ce qui nous parait surtout contestable, c'est le principe mémo sur lequel repose cette méthode. Il s'agit de mettre en lumière ce qu'on appelle, depuis Stuart Mill, les variations concomitantes dans deux séries. On ne s'en tient pas, d'ailleurs, à comparer les premières différences, ou les « variations adjacentes », c'est-à-dire les variations dans les termes qui se trouvent à côté les uns des autres : il est possible de tenir compte de la variation d'ensemble, par le calcul de l'écart de tous les termes de chaque série par rapport à leur moyenne dans chacune. On élimine, d'autre pan, la différence d'intensité des variations des deux séries, en divisant les écarts par l'écart quadratique moyen pour la série (ce que les Anglo-saxons appellent la standard déviation). L'attention se porte ainsi sur le sens général et l'importance relative des variations. Tout cela est fort bien. Mais, d'abord, comme on l'a souvent remarqué, quand deux séries varient ainsi en concomitance, il y a bien covariation, il ne s'ensuit pas qu'il y ait corrélation. Il y a peut-être une troisième série, en liaison séparée avec l'une et avec l'autre, qui est initiatrice des mouvements de l'une et de l'autre. J'ai trouvé, autrefois, qu'il y avait une covariation assez forte entre le nombre des suicides et les chiffres du commerce spécial à l'exportation en France, do 1870 à 1910 : c'est, peut-être, parce que les deux faits sont, l'un comme l'autre, en rapport avec le progrès industriel. D'autre part. et surtout, l'inconvénient principal d'une telle méthode, c'est qu'elle fait abstraction de l'ordre dans lequel les variations se succèdent dans le temps, qui est pourtant loin d'être négligeable. On pourrait déplacer en même temps deux variations concomitantes de ce genre, les reporter du milieu au début, à la fin, ou, encore, prendre l'ordre de succession inverse, commencer par la fin : le coefficient de covariation serait le même : pourtant l'enchaînement des faits serait tout autre, car nous sommes dans un domaine où les successions de phénomènes ne sont pas réversibles. Par exemple, on a constaté que, quand les prix augmentent, les salaires augmentent, mais quand les prix baissent, les salaires ne diminuent pas. Pour la même raison, si l'on ne fixe pas son attention sur l'ordre de succession, comment reconnaître quelle série de variations est la cause, et quelle d'entre elles est l'effet ? Sans doute on peut faite la comparaison entre des variations séparées d'une ou de deux années, et le décalage nécessaire indique alors quelle est la série de variations qui est antérieure, et qui est cause. C'est ainsi que les statisticiens de Harvard ont procédé sur leurs trois courbes du mouvement boursier, du mouvement des affaires, du mouvement de l'argent. Mais on sait que ces méthodes de prévision n'ont guère réussi que quand on les appliquait au passé. Au reste, il se produit, entre les séries, des actions et réactions réciproques : telle variation, cause à un moment, devient effet à un autre, par rapport aux variations de la série voisine ; de cela, nous ne pouvons être avertis que par une observation directe et continue qui suit Perdre même où les phénomènes se succèdent d'une année à l'autre. C'est dire qu'une méthode qui fait abstraction de cet ordre laisse peut-être échapper l'essentiel. Sans doute, c'est un objet essentiel de la méthode statistique que de rechercher les concomitances entre des séries de variations. Mais comprenons bien qu'une varia peut avoir une signification très différente, bien qu'elle reste la mémo quant au sens et à l'intensité, suivant la phase de l'évolution dans la-quelle elle se produit. Un accroissement des quantités de marchandises fabriquées peut avoir lieu en période de prospérité, parce que les débouchés augmentent et que les prix sont avantageux pour les fabricants. Mais il peut s'en produire, il s'en pro-duit aussi, comme l'a montré Simiand, en période de resserrement, précisément parce que les prix baissent, et que l'on essaie do retrouver, sur les quantités, ce qu'on perd, quant au prix unitaire. La covariation, dans ces cas, ne nous apprend rien c'est elle qui a besoin d'être interprétée. Ce serait déjà un progrès, en ce sens, que de suivre à la fois une comparaison entre deux séries à l'aide de plusieurs indices ou coefficients, par exemple un indice de dépendance qui porterait sur le détail des variations adjacentes, un indice de corrélation qui porterait sur l'ensemble, mais, aussi, de suivre ainsi une comparaison entre plus de deux séries observées à la fois, de suivre encore, à la fois, les variations suivant leur ordre et suivant leur intensité, à la fois le mouvement et sa vitesse. Certes, l'arsenal des mathématiques nous offre à cet égard une grande quantité de procédés divers, qui se peuvent adapter aux cas les plus variés et les plus compliqués. Mais, étant donné l'enchevêtrement des faits sociaux, ne risque-t-on pas de se perdre, dans la complexité des formules abstraites, et ne convient-il pas de fixer d'abord et de maintenir fixée son attention sur les courbes empiriques elles-mêmes, déjà assez multiples et variées pour qu'elles suffisent à absorber tout l'effort dont est capable l'observateur? L'instrument mathématique est puissant. Mais n'en obtiendra-pas un meilleur rendement, si l'on détermine d'abord, par milles méthodes, les liaisons qu'il importe d'éclairer, l'étendue et les limites du champ à explorer ? Ce serait une illusion, et qui serait grave de conséquences, de croire qu'on découvrira ces liaisons elles-mêmes, et ce champ, par calcul, en mesurant tout ce qui se présente, et de toutes les manières, sous tous les rapports. Comme les combinaisons possibles sont en nombre illimité, on ne les épuiserait jamais, et l'on n'arriverait jamais au but.

Si nous nous rappelons maintenant que la méthode statistique en sociologie doit s'appliquer à des ensembles ou à des groupes réels et découvrir leurs caractères, qui n'existent que pour l'ensemble, et ne se réalisent souvent dans aucun des individus ou même dans aucun des groupes partiels d'individus qu'on y peut distinguer ou découper, il apparaîtra que le danger, ici, c'est d'essayer de reconstruire l'ensemble en partant de telle ou telle de ses parties. Telle sera, par exemple, pour revenir à la démographie, l'interpolation qui, d'après une partie arbitrairement choisie (et le plus souvent d'après les dix ou vingt années écoulées, quelquefois d'après le mouvement de la population dans les deux ou trois années les plus récentes), détermine quelle sera la population de la France ou de tout autre pays, d'un continent, du monde tout entier, en l'année 1950, ou en l'an 2000. Mais c'est plutôt et seulement d'après la population suivie pendant une cinquantaine d'années qu'on pourra connaître exactement la nature des tendances démographiques pendant une petite partie de cette longue période. Ainsi encore, partant du taux de natalité et de mortalité actuels des femmes mariables et fécondables, dans notre population, on conclut qu'au lieu de 1000 femmes mariables, il n'y en aura plus que 900, 800, 600, dans un certain nombre de décades, comme si la question n'était pas précisément de savoir si, dans les décades à venir, ces taux do natalité et do mortalité ne changeront pas. Il se dépense un grand effort d'ingéniosité à de semblables élaborations, qui, en réalité, n'accroissent en rien notre connaissance, et ne parviennent qu'à nous représenter, peut-être d'une manière frappante, ce que nous savions déjà et qui ne vaut que pour la portion limitée du temps à laquelle de telles données se rapportent. Combien nous apprendrions davantage, si l'on s'attachait surtout à explorer des périodes plus anciennes, si l'on étendait l'observation dans l'espace, si l'on décomposait les ensembles globaux et confus que représentent les populations en groupes plus restreints, mais non arbitraires, en essayant de retrouver, par tâtonnements et recoupements, les articulations naturelles des sociétés. Je lis toujours, avec beaucoup de considération pour les savants qui en sont les auteurs, les articles de statistique mathématique qui paraissent dans des revues telles que Metron et Econometrica. Dois-je avouer que je suis toujours un peu étonné d'y voir si rarement affleurer la réalité positive, et de l'indifférence qu'on parait y témoigner d'ordinaire aux faits purs et simples, aux faits dans leur ampleur et leur détail, et dans leur extrême variété ? Il est bien vrai qu'il manque trop souvent aux démographes et aux historiens économistes ce minimum de culture mathématique sans lequel l'accumulation de faits n'est qu'une érudition un peu vaine. Mais combien la statistique mathématique nous rendrait plus de services, et combien elle progresserait dans ses applications aux sciences sociales, si ceux qui s'y consacrent étaient plus attentifs aux résultats contemporains de la science positive I Renan disait, à propos de la logique et dos mathématiques : Ce ne sont point des sciences à part et progressives : ce sont seulement des ensembles de notions immuables. Elles n'apprennent rien, mais elles fout bien analyser ce qu'on savait. No nions pas qu'il y ait des sciences de l'éternel et de l'immuable, mais mettons-les bien nettement hors de toute réalité. » Je ne prendrais pas à mon compte un tel jugement, qui ne souligne pas assez que les mathématiques ont en tous cas leur racine dans le réel, précisément puisqu'elles s'en sont détachées. Les mathématiques peuvent être un instrument d'une puissance incomparable, à condition qu'elles se règlent sur les progrès des sciences positives. Trop souvent, c'est l'inverse qui se produit. Il semble, par exemple, qu'on s'attache de préférence aux problèmes, pour lesquels la statistique mathématique nous présente les formules les mieux éprouvées et les plus commodes. Que dirions-nous cependant d'un médecin, appelé chez un malade qui souffre peut-être de troubles nerveux depuis longtemps, neurasthénique, ou cyclothymique, et qui s'en tiendrait à utiliser les instruments perfectionnés qu'il a apportés, thermomètre, appareils pour mesurer la pression, pour observer par radioscopie l'intérieur du corps ? Ne serait-il pas essentiel qu'au contraire il prenne d'abord, en l'interrogeant, une vue d'ensemble de l'évolution suivie par la maladie jusqu'à ce moment : et n'est-ce pas grâce à ce qu'il en apprendra que les observations précises, qu'il peut faire avec ses instruments, recevront tout leur sens ? En science sociale, en matière sociale aussi, c'est en adaptant la statistique mathématique aux problèmes que pose la recherche positive, en lui demandant surtout les moyens d'obtenir plus de précision dans nos mesures, et des moyens d'expression plus exacts, que nous aurons chance de progresser un peu. Quant aux explications, il y a tout lieu de penser qu'elles ne sauraient être du type mathématique, en un domaine de faits plus complexes assurément que ceux auxquels s'attache la biologie.

  • Sorbonne