Statistique et expérience (Simiand)/Chapitre V

La bibliothèque libre.

v

Conditions de constatation et d’élaboration des données élémentaires


Et d’abord la valeur de l’expérimentation de laboratoire repose, on le sait, sur ce que les constatations élémentaires dont elle constitue ses résultats sont faites dans des circonstances définies, suivant des méthodes et des procédés déterminés et par des hommes compétents ; — et encore sur ce que ces constatations élémentaires, faites dans un laboratoire par un certain savant, peuvent être à nouveau provoquées, vérifiées, contrôlées en expérience directe dans d’autres laboratoires par d’autres savants ; — et enfin sur ce que toute l’élaboration ultérieure de ces constatations élémentaires est effectuée suivant des méthodes éprouvées et connues, et par des hommes compétents.

Dans les divers domaines de l’expérimentation statistique, au contraire, il n’est que peu de cas (par exemple, certaines recherches de statistique biométrique, anthropologique, etc.) où toutes ces conditions soient actuellement ou même paraissent pouvoir être dans l’avenir pleinement satisfaites. Dans tous les autres cas, l’une ou l’autre ou plusieurs de ces conditions manquent aujourd’hui ou même durablement, et nous rencontrons donc assurément là une infériorité initiale.

S’ensuit-il qu’au lieu de s’efforcer, de s’ingénier à y remédier du mieux possible, on doive en prendre son parti, ou même la méconnaître, avec la désinvolture dont nous voyons tous les jours encore tant d’exemples ? S’ensuit-il qu’on doive se contenter de ce brocard de scepticisme commode que « toutes les statistiques se valent » ? S’ensuit-il qu’on ait le droit de se borner à prendre ici et là les premiers chiffres venus, mêlant des données de diverse nature ou de diverse qualité, comparant des résultats provenant de sources fort différentes en valeur ou en caractère ? S’ensuit-il qu’il soit légitime d’attribuer à une donnée partielle ou relative une portée générale ou sans condition ? S’ensuit-il que, pour attester de la valeur d’un chiffre, il suffise, ainsi qu’on s’en contente si souvent encore, de dire : « Ce chiffre est exact puisqu’il est officiel » ?

L’emploi ainsi pratiqué des données statistiques est encore trop fréquent dans le public, dans la presse et même dans des ouvrages de quelque réputation, pour que nous n’ayons encore à souvent répéter qu’il y a statistiques et statistiques, et qu’à la meilleure (comme, du reste, à la moins bonne) il ne faut demander et il ne faut faire dire que ce qu’elle dit, et de la façon et sous les conditions où elle le dit.

Mais, pour nous guider dans cette détermination nécessaire, apercevons que nous ne pouvons mieux faire, je crois, que nous reporter à ces conditions que nous venons de reconnaître à la bonne expérimentation de laboratoire. Observons que les meilleurs de nos travaux modernes dans les divers ordres de statistique (si telle ou telle raison, selon les cas, fait encore qu’ils n’atteignent pas entièrement à ces conditions) ont cependant ce caractère de tendre à s’en rapprocher de plus en plus : établissement des données élémentaires, sinon toujours par des spécialistes compétents, du moins alors dans des cadres et avec des précautions qui visent à un enregistrement aussi automatique que possible ; collection, réunion, élaboration dans des circonstances définies et surveillées, suivant des techniques et des méthodes étudiées et déterminées, présentation des résultats avec indication des conditions d’établissement, avec critique et appréciation de leur valeur et, par suite, de leur emploi possible.

Même lorsque nous ne disposons pas de statistiques de cette valeur, même lorsque, pour une raison ou pour une autre, l’établissement de statistiques nouvelles répondant à ces mêmes conditions est peu praticable ou impossible, même lorsque, par exemple, nous avons à étudier des faits passés et qu’il nous faut bien, vaille que vaille, nous servir de ce qui nous est donné sur eux ou sinon renoncer à les étudier, apercevons qu’un effort pour nous rapprocher de ces conditions meilleures nous conduit, dans beaucoup de cas, à une utilisation valable de ces données même imparfaites.

Dans beaucoup, de cas, en effet, il nous est possible de reconnaître, ou tout au moins de présumer avec assez de fondement, que dans telle série de données de même source, ou bien d’une observation à une autre de sources analogues et comparables, le mode d’établissement de ces données statistiques, s’il présente des imperfections, est du moins sensiblement le même ou de même valeur ; qu’il présente donc d’une donnée à l’autre les mêmes imperfections (j’emploie à dessein ce terme vague d’imperfection, car l’observation est générale).

Remarquons, d’autre part, que pour beaucoup de problèmes, non seulement il suffit, mais souvent même il est plus significatif d’étudier non pas les états absolus de l’objet étudié, mais la relation, la variation entre ces états.

Mais, s’il en est ainsi quant aux données et quant aux problèmes, ce n’est plus un obstacle à toute étude valable, que nos données statistiques présentent des imperfections : car, si ces imperfections sont ou peuvent être présumées sensiblement les mêmes d’une donnée à l’autre, la relation entre ces données imparfaites n’est pas imparfaite elle-même en tant que relation, mais, au contraire, exprime exactement la relation entre les états absolus auxquels ces données correspondent, puisque le coefficient d’imperfection (si je puis dire), étant constant, s’élimine évidemment dans le rapport des deux données.

Voilà donc un moyen d’utiliser avec validité et fondement nombre de statistiques bien imparfaites, un moyen de faire, avec une balance fausse, des pesées justes. L’art de l’expérimentateur statistique, ici, sera donc d’abord de poser les problèmes en termes relatifs, dégagés des valeurs absolues ; ensuite de se placer dans des cadres d’étude où la nature et la qualité des sources le fondent à invoquer le bénéfice de ce que nous pourrions appeler la présomption de l’erreur constante (erreur qui, du point de vue relatif, s’élimine). Et c’est ainsi que, dans tous les cas où cet accommodement est possible, l’expérience statistique se rapprochera au mieux des garanties offertes, à ce premier point de vue, par l’expérience de laboratoire.