L’informatisation rapide de la société exerce une influence
évidente sur les activités humaines aux plans individuels (les
mentalités) et social (la nature du travail). Les possibilités
que donne l’ordinateur de compiler, d’accéder, d’échanger
des informations considérables et d’effectuer des calculs totalement
hors de portée des chercheurs il y a quelques années exercent
aussi un impact très important sur la démarche scientifique,
que ce soit dans les sciences de la nature (sciences dures) ou dans les sciences
de l’homme (sciences molles). Cet impact se manifeste par la renaissance
d’une certaine forme de scientisme dont les effets se font sentir dans
les politiques menées par les pouvoirs publics.
La démarche scientifique dans les sciences de l’homme
et de la société.
La statistique appliquée rassemble des méthodes scientifiques
qui concernent la quasi totalité des sciences appliquées. Un
spécialiste de ces méthodes est amené à travailler
sur des données diverses et à aborder des problèmes qui
ne concernent plus seulement la statistique proprement dite, mais l’interprétation
des résultats qu’elle produit. Inversement, un chercheur en sciences
sociales a recours aux méthodes statistiques pour établir les
résultats numériques et les interpréter suivant les questions
qu’il se pose. L’exemple typique est l’interprétation
d’une relation statistique comme relation causale, ce que la statistique
ne peut jamais établir et qui relève d’un raisonnement
se situant dans un champ scientifique différent : c’est l’explication
de la relation statistique observée qui en donne éventuellement
l’interprétation causale.
Il existe donc deux démarches : la démarche statistique proprement
dite (observation par l’outil statistique) et la démarche interprétative
(interprétation des résultats de l’outil). Ces deux démarches
sont d’ailleurs classiques dans les sciences de la nature : l’observation
(d’un astre par exemple) fait appel à un outil scientifique (le
télescope). L’image obtenue doit en-suite être analysée
correctement.
Cette dualité est à l’origine d’erreurs nombreuses
soit dans la méthodologie utilisée soit dans le sens donné
aux résultats : « Si les bergers chaldéens avaient
eu nos puissants té-lescopes, ils n’auraient rien appris de la
science maîtresse » (Alain, 1932, p. 155). Ils n’auraient
pas su utiliser l’appareil d’une part, et n’auraient pu
comprendre les images obte-nues d’autre part. L’informatisation,
en rendant disponibles à la fois des données considéra-bles
et les outils nécessaires pour les analyser, place les chercheurs en
sciences sociales dans une situation un peu analogue à celle des bergers
: il leur faut maîtriser l’outil technique, – matériel
et logiciel – et passer du champ statistique dans lequel se trouvent
les résultats numé-riques au champ des sciences sociales qui
leur donnent du sens. Les difficultés actuelles résultent surtout
de la nouveauté et de la complexité des méthodes et de
l’intrication des démarches : il est bien difficile à
un même chercheur de mener de front ces deux démarches.
Généralisation de la démarche quantitative.
L’utilisation systématique de l’informatique impose la
numérisation des observations. Pour utiliser les techniques quantitatives,
il faut rendre l’information contenue dans les observations compatibles
avec les traitements numériques : on généralise la mesure
quantitative ou la catégorisation des comportements et des faits sociaux,
et on perd la part qualitative de ces observations. On évalue par exemple
le coût pour des parents de s’occuper de leurs enfants évaluant
le coût engendré par le recours à une personne extérieure
et en tenant compte du sa-laire que l’on aurait pu avoir (Lewis, 2001).
On mesure le temps consacré aux enfants par le père et par la
mère pour évaluer la façon dont chacun s’en occupe.
Le service fourni devient totalement anonyme, indépendant des liens
personnels entre les personnes concernées. La catégorisation
est une autre forme de quantification : l’information conservée
de chaque observation est réduite à celle du groupe dans laquelle
elle est classée.
La rapidité avec laquelle l’informatique s’est imposée
dans toutes les sciences appliquées explique la confiance illusoire
dans les résultats numériques produits par l’ordinateur
et l’adhésion parfois sans recul aux chiffres qui sont donnés.
S. J. Gould (1997) parle même de « l’anxiété
que suscitent les chiffres chez les commentateurs non scientifiques »
(p. 383). Selon P. Manent (2001) « [le discours scientifique] est
le seul contenu de pensée publiquement recevable » (p.19).
Cette adhésion accentue la recherche de paramètres quantitatifs,
tandis que le développement des banques de données laisse croire
que l’homme dispose de toutes les informations possibles sur l’objet
qu’il étudie.
On assiste donc actuellement à un renforcement du scientisme : de même
que le développement de la génétique donne à l’homme
l’illusion de la maîtrise de sa propre nature et même de
sa pensée, le développement de l’approche quantitative
des sciences sociales lui donne celle de la maîtrise de la société.
Cette première illusion n’est pas bien sûr partagée
par tout le monde, mais la conjonction de ces évolutions n’est
pas fortuite : c’est simplement le remplacement du modèle de
la physique mécanique, qui a conduit à la « domination
des grands paradigmes unitaires comme le fonctionnalisme, le marxisme ou le
structuralisme » (Dosse, 2001, p.681), par celui de la génétique
et de la théorie de l’information. Ce scientisme favorise le
développement de techniques quantitatives au détriment d’une
réflexion qualitative plus difficile à mener : « cette
suprématie de la statistique va trop souvent conduire à privilégier
l'instrument par rapport à l'objet. C'est alors la technologie qui
commande la problématique : on fera une analyse factorielle sur tel
ensemble de données plutôt que d'étudier tel problème
en utilisant l'analyse factorielle… » (Derivry, 1997). L’analyse
des données devient systématiquement exploratoire, sans modèle
préalable au détriment de l’analyse en facteurs communs
utilisée par exemple par Spearman au début du 20e siècle.
La masse de données disponibles fait confondre peu à peu la
réalité et le modèle ; cette confusion, sans grand effet
dans les sciences de la nature parce que les modèles représentent
beaucoup plus fidèlement la réalité observée et
qu’ils sont plus facilement réfutables, a des conséquences
importantes dans les politiques sociales lorsque les analyses prétendent
à la fois donner une image exacte des faits sociaux et des outils suffisants
pour régler les problèmes. Il s’agit en quelque sorte
d’un déterminisme social, dont la conséquence au plan
de la recherche apparaît immédiatement : c’est l’intervention
de l’Etat dans la recherche scientifique, beaucoup plus intéressé
par la résolution de problèmes sociaux que par des recherches
dont l’intérêt à court terme est loin d’être
évident. Cette intervention, caractérisée par exemple
par la création des IUFM pour analyser et résoudre les problèmes
du système éducatif, date, suivant Le Bras (2000), des années
1970, c’est-à-dire de l’époque de l’informatisation
de la société (rapport Nora S., Minc A., 1978).
La confusion de la réalité et du modèle résulte
donc d’une seconde illusion, qui consiste à croire que
les méthodes modernes de traitement de l’information donnent
les outils plus ou moins nécessaires et suffisants pour résoudre
les problèmes sociaux.
Intrication des démarches de modélisation et d’interprétation.
Ces méthodes quantitatives ne se bornent pas à des procédures
de calcul qu’il serait inutile, pour l’usager, de connaître,
ni à des outils dont l’interprétation serait relativement
simple. En astronomie, ce n’est pas l’astre lui-même qui
est observé, mais la lumière qu’il émet, et c’est
en analysant le spectre de cette lumière qu’on obtient des informations
sur la composition de l’atmosphère de l’astre. La situation
est analogue dans les sciences sociales : les deux démarches statistique
et interprétative interviennent simultanément dans la conception
intime du modèle et dans les interprétations de ses résultats.
Les hypothèses nécessaires au modèle sont d’autant
plus fortes et nécessaires que le concepteur du modèle ignore
la réalité. C’est l’ignorance d’une loi de
probabilité qui impose une hypothèse sur cette loi, l’ignorance
de la nature d’une relation qui amène à supposer qu’elle
est linéaire. Ces hypothèses, tout en étant indispensables,
perturbent évidemment l’image du fait social étudié.
Elles sont rarement explicitées en détail, et le contrôle
a posteriori du modèle ne montre jamais qu’il est vrai,
mais seulement qu’il est acceptable, même si on sait
qu’il est faux. Le modèle est en effet toujours faux,
en ce sens qu’il n’est finalement qu’une représentation
déformée de la réalité telle que le concepteur
du modèle l’appréhende.
Les modèles génèrent donc des artefacts. Imaginons par
exemple un questionnaire comportant vingt questions de cinq modalités
de réponse chacune. L’analyse des liaisons entre ces questions
prises deux par deux consiste à établir tous les tableaux croisés
possibles, soit cent quatre vingt dix ( = 20 x 19 / 2). En procédant
à un test d’indépendance du Ki2 sur chaque tableau, dix
liaisons en moyenne vont être considérées comme significatives
quand les vingt variables sont en réalité indépendantes.
C’est un artefact relativement connu. Mais on peut aussi se demander
combien de liaisons seront considérées comme non significatives,
alors que les variables sont liées. Comme on ne connaît pas la
réponse à cette question dans le cas du test du Ki2, cet artefact
est en général complètement négligé, et
par suite ignoré. Plus généralement, les artefacts sont
d’autant plus difficiles à détecter que les modèles
sont complexes. L’exemple du modèle linéaire est assez
typique : il suppose implicitement l’existence d’un effet propre
des variables explicatives sur la variable expliquée. Il devient dès
lors contradictoire de l’utiliser pour montrer l’existence d’un
tel effet.
Les difficultés méthodologiques sont donc nombreuses, et le
manque de personnel spécialiste du traitement de l’information
par ordinateur patent, en particulier au sein des laboratoires du CNRS et
des universités. L’exemple précédent montre concrètement
la nécessité d’un travail pluridisciplinaire, les deux
démarches ne pouvant guère être maîtrisées
par une même personne. L’existence d’un langage commun aux
différents spécialistes est évidemment indispensable
et impose à chacun de connaître la discipline de l’autre.
Le manque de personnel compétent n’est évidemment pas
sans conséquence et les limites des modèles sont fréquemment
dépassées. On exige d’eux des résultats même
s’ils n’ont pas été conçus pour cela, et
on les obtient parce que les calculs sont toujours possibles, même s’ils
n’ont pas de sens. Cela revient à la démarche suivante
dans les sciences de la na-ture : prévoir le résultat d’une
expérience dans des conditions de température et de pression
incompatibles. Dans ce dernier cas, l’erreur est décelée
par une simple expérience tandis que l’impossibilité de
procéder ainsi dans les sciences sociales rend indispensable une analyse
critique des conditions dans lesquelles les résultats sont établis.
Déconstruction des modèles.
L’explicitation des relations et des hypothèses d’un modèle
met en évidence les critères qui ont été utilisés
pour le concevoir. Ces critères ne sont pas nécessairement individuels,
ni conscients. Ils peuvent résulter de l’appréhension
collective du fait social étudié. Par exemple, la règle
proposée pour le dépistage de la trisomie 21 chez les femmes
enceintes dans la région de Marseille (Moatti et coll., 1993) montre
la perception sociale du handicap :
• on propose aux familles un dépistage lorsque le risque statistique
d’une fausse couche d’un enfant normal provoquée par le
geste médical (un prélèvement du liquide amniotique)
est inférieur ou égal au risque d’une naissance d’un
enfant trisomique.
• dans le cas où une anomalie génétique du fœtus
est détectée, on suggère une interruption de grossesse.
Le critère d’égalité des risques revient à
considérer de facto que les deux situations : perte d’un enfant
normal et naissance d’un enfant trisomique, sont équivalentes
en termes de coût économique et humain, et on émet implicitement
un jugement de valeur sur la vie d’un trisomique et d’un enfant
normal. L’eugénisme, typique de cette démarche, n’est
pas loin. Il existe d’ailleurs officiellement en France, par l’article
L2123-2 du code de la santé.
De la même façon, lorsqu’on compare le temps consacré
à un enfant par le père et par la mère, l’hypothèse
implicite est l’identité de leurs rôles. Cela revient à
émettre un jugement de valeur sur le fait et la façon de s’occuper
d’un enfant.
Enfin, la déconstruction des modèles permet de mettre en évidence
les idéologies scientifiques, c’est-à-dire l’utilisation
volontairement abusive des méthodes mathématiques pour donner
une apparence scientifique à une idéologie. L’exemple
le plus typique est celui des théories racistes de Murray et Herrnstein,
publiées dans leur ouvrage The bell curve et sévèrement
démolies par S.J. Gould dans La malmesure de l’homme.
Conséquences de la quantification généralisée.
La quantification des observations présente apparemment l’avantage
d’une certaine objectivité, d’une certaine indépendance
par rapport à l’observateur. Mais la classification, le choix
des indices restent une décision de l’expert : un enfant sera
classé parmi les enfants normaux, ayant un retard mental léger
ou moyen suivant son QI, mais ce QI reste déterminé par le psychologue.
L’objectivité par rapport à l’observateur ne peut
donc être qu’apparente. En outre, la définition des catégories
est effectuée par la société, dans le cas précédent
par le ministère de la santé. L’objectivité est
donc obtenue au prix d’une subjectivité sociale, collective,
qui peut apparaître dans le choix des mots, et dont des témoignages
sont la transformation des catégories débiles légers,
moyens et lourd, en retard mental léger et moyen, ou la disparition
de l’hystérie des pathologies psychiatriques recensées
dans la classification officielle de l’OMS (Blanchon, 2000).
La quantification présente en outre un grave inconvénient :
les nombres étant ordonnés, elle donne une hiérarchie.
La relation d’ordre qui existe sur les nombres devient une relation
d’ordre sur les faits mesurés ou les actions observées.
Examinons par exemple les loisirs : on peut mesurer le plaisir donné
par le vélo ou le golf par l’argent qu’on dépense
pour cela. Dès que l’on compare ces dépenses, la quantification
n’a plus de sens : le golf coûte évidemment plus cher que
le vélo, mais cela ne signifie pas que la pratique du golf apporte
plus de plaisir que celle du vélo.
Cette hiérarchie est systématiquement créée dans
toutes les techniques statistiques et se traduit en échelle collective
des valeurs. Suivant cette soi-disant échelle, il est « mieux
» d’être riche que pauvre, blanc que noir, ingénieur
qu’ouvrier, homme que femme etc, indépendamment des situations
personnelles. On sait que, suivant le théorème de Hume, on ne
peut inférer des conclusions normatives à partir de prémisses
descriptives. Il s’agit ici en quelque sorte de sa réciproque
: la modélisation quantitative d’un fait social ou d’un
comportement humain crée de facto une hiérarchie collective
des valeurs mises en jeu.
La tentation est grande de déterminer les injustices sociales en référence
à cette échelle collective qui n’a pourtant aucun sens
au plan individuel, et on peut se sentir dévalorisé par cette
échelle sociale, chercher à s’y conformer. Lorsque le
critère est discriminatif (par exemple, la race, le sexe, la religion),
l’inégalité est interprétée suivant cette
échelle collective en terme d’injustice sociale : c’est
le groupe qui est défavorisé aux yeux de lui-même et des
autres. C’est finalement une explication possible des revendications
communautaires.
Alors , statistique ou pas statistique ?
Une réponse est donnée par Tocqueville (1840, p.310) : «
Quand la statistique n’est pas fondée sur des calculs rigoureusement
vrais, elle égare au lieu de diriger. L’esprit se laisse prendre
aisément aux faux airs d’exactitude qu’elle conserve jusque
dans ses écarts, et il se repose sans trouble sur des erreurs qu’on
revêt à ses yeux des formes mathématiques de la vérité.
Abandonnons donc les chiffres, et tâchons de trouver nos preuves ailleurs.
».
Tocqueville compensait l’absence des banques de données et des
logiciels de traitement de l’information par ses capacités d’observation
et la puissance de sa pensée. Prenons garde à ne pas inverser
la démarche, à ne pas compenser l’absence de réflexion
par la puissance de l’ordinateur, et profitons au contraire au plan
intellectuel des possibilités immenses offertes par l’informatique.
Les banques de données, les moyens de calcul, les technologies de la
communication et de l’information doivent être utilisées
pour approfondir les analyses et non pour les faciliter.
BIBLIOGRAPHIE
Alain, 1932, Propos sur l’éducation, PUF, Paris, p.
155 (ed. 1976)
Blanchon Y.C., 2000, Eloge d’une soupçonnée, Réflexions
sur la disparition de l’hystérie dans les classifications des
troubles mentaux, L’Information Psychiatrique, vol. 76, n°6,
p.641-645.
Derivry D., 1997, Sociologie – les méthodes, Encyclopædia
Universalis.
Dosse F., 2001, Paul Ricœur, Les sens d’une vie, La Découverte,
Paris
Gould S.J., 1997, La mal-mesure de l’homme, Odile Jacob, Paris.
Herrnstein C., P. Murray, 1994, The bell curve, The Free Press, New
York.
Le Bras H., Les sciences sociales entre biologie et politique, La Recherche,
novembre 2000
Lewis J., 2001, Les femmes et le Workfare de Tony Blair, Esprit,
mars-avril, 174-186.
Manent P., 2001, Cours familier de philosophie politique, Gallimard,
Paris
Moatti J-P, C. Julian-Reynier, V. Séror, C. Le Gales, S. Aymé,
Evaluation économique et éthique médicale, Natures-Sciences-Sociétés,
vol.1, n°4 p. 300-308.
Nora S., Minc A., 1978, Rapport sur l'informatisation de la société,
Documentation française.
Tocqueville A., 1840, De la démocratie en Amérique,
tome I, Garnier Flammarion, Paris
Cette communication est inspirée des articles suivants, disponibles
sur le site internet :
http://iut86-fad.univ-poitiers.fr/StatPC/Articles/articles.htm
:
L’interprétation statistique, Mathématiques et Sciences
Humaines, n° 153, p.21-28, 2001.
L’argumentation statistique dans la politique sociale, Mathématiques
et Sciences Humaines, n° 156, p.33-42, 2002.
L’illusion du savoir, Science et Conscience, n° 7, p.29-33,
2002.
Politique sociale et cognitivisme, Science et Conscience, n°
9 p.66-69 et 10, p.65-68, 2003.
Enseignement et nouvelles technologies, Idées, n°137,
p.68-74, 2004.
Statistique et idéologies scientifiques, Idées, n°138,
2004.
La bulle providentielle, Sociétal, n°46, p.39-44, 2004.
Toutes choses égales par ailleurs (non publié).