CASSE DE L'INDUCTION
L'induction proprement cassée
par Tizan Enkalkul, 18-19 JUN 2016

Le problème
Résolution
Note autocritique
Contexte général
Vérification
Achèvement
Réserve
Contre-objection
Fausse déduction

* Le problème : La question qui m'est posée par un ami concerne l'induction (ou généralisation), que je déclare logiquement fautive. "J'ai 5 kilos de haricots dans un sac, j'en tire 500 grammes, ils sont tous rouges, est-ce que tous les haricots sont rouges ?". La question ne semble pas abordable en l'état car la réponse pourrait être totalement différente si un haricot pèse 250 grammes (n=2) ou 1 gramme (n=500), or la masse d'un haricot n'est pas fournie par l'énoncé de la question. Je dirais donc (avec par exemple 1 haricot = 5 grammes, n=100) : "j'ai mille haricots dans un sac, j'en tire cent, ils sont tous rouges, ai-je raison de dire inductivement que les mille sont tous rouges ?".

* Résolution : Le calcul de probabilité binômiale nous donne une indication : au vu de l'échantillon, la fréquence de non-rouge semble < 1/100 (moins que =1/100), on peut en déduire la probabilité d'en tirer zéro non-rouge sur les 900 restants. Comme il y a une inéquation, et qu'il ne faut pas se tromper de sens, on peut dire que la fréquence de non-rouges se situe entre 1/101 et 1/beaucoup, d'où une plage de valeurs estimées :

  Cette probabilité n'est donc pas du tout 100% et peut même s'avérer moins que 0,013%. Donc l'induction brute "100/100 rouges donc tous rouges" est dans l'absolu : invalide.

  Mais inversement, l'hypothèse "1/101 non-rouge" n'est pas aussi probable que "1/infini non rouge", en effet cette fréquence 1/101 avait davantage de chances de donner 1/100 non-rouge plutôt que 0/100 non rouge. Il convient de se demander ce qui aurait plutôt donné 0/100 non-rouge que 1/100.

  Donc l'induction "100/100 rouges donc 900/900 suivants rouges" a environ 99,8% de chances d'être fausse, d'après ce que l'on connaît (0/100 non-rouge).

  Sur le principe, il était même possible (quoique peu probable) que les 100 rouges soient suivis de 900 non-rouges. C'est vérifié par le calcul, aux limites éventuelles de l'outil.


  Idéalement, il conviendrait de tester 901 hypothèses, de 0 à 900 non-rouges parmi les 900 restants, et d'établir la probabilité de ces 901 hypothèses. Pour cela, nous allons employer le théorême de Bayes, sous hypothèse que les 100 premiers haricots sont un tirage au hasard et non une sélection particulière, orientée. (Dans l'absolu, on n'en sait rien, toute affirmation prétendant à la vérité est aveugle mensongère – et même en employant un moteur de hasard, rien n'est garanti puisqu'on est peut-être dans le rêve d'un Tout Puissant ou Moi endormi gouvernant sciemment le hasard apparent).
[Le théorème de Bayes, facile à démontrer, dit que p(H1/résu)=p(H1)*p(résu/H1)/somme des p(Hi)*p(résu/Hi)]
Aperçu du haut du tableau :

Aperçu graphique du résultat :

  Et ce calcul donne la probabilité 10% que 0 haricots soient non-rouges, donc que les 1000 haricots sont tous rouges. (Sous hypothèse de tirage au hasard) l'induction est fautive dans 90% des cas (en contexte d'équiprobabilité des cas).
  Ceci dit, la version scientiste de l'induction n'est pas le simplisme absolu "100/100 rouges donc tous rouges", elle est probabiliste : "100/100 rouges donc proportion de non rouge <1/100". Ici cela signifie : strictement moins de 10/1000, ce qui n'a qu'une probabilité de 64%. (Sous hypothèse de tirage au hasard) l'induction probabiliste est fautive dans 36% des cas (en contexte d'équiprobabilité des cas).

* Note autocritique : j'ai arrondi les probabilités obtenues car le mode de calcul binomial n'est qu'une approximation imparfaite ici. En effet, il conduit à se demander quel nombre de non-rouges seraient tirés d'une population infinie (ou avec remise), ce qui n'est pas exactement la situation ; mais sans la moulinette binomiale, faire le décompte de tous les cas et combinaisons serait (presque ?) infaisable.

* Contexte général : la démarche scientifique est basée sur l'induction (fautive), en effet si on suppute que E=mc² ou P=mg, c'est qu'il semble en avoir été ainsi par le passé et que l'on affirme en généralisant qu'il en sera de même pour le futur. Plus généralement, le quotidien et la prétendue Qualité/Rigueur sont gouvernées par l'induction : si votre yaourt est étiqueté "périmé" 21 jours après fabrication, c'est parce que les lots passés de yaourts ont été sains à cette date et qu'il est imaginé inductivement qu'il en sera de même pour les nouveaux lots. La casse de l'induction ruine presque cette civilisation entière, menteuse (mathématiquement et pas seulement au plan philosophique avec l'évacuation erronée de l'hypothèse du rêve par les Cartésiens).

* Vérification : A posteriori, on peut tester si une masse de haricot différente aurait effectivement conduit à des conclusions différentes. C'est effectivement le cas sur le détail des chiffres mais les conclusions sont exactement les mêmes (en remplaçant 99,987%;99,80%;90,4%;36,3% par 99,932%;99,44%;86,1%;13,4%)



  Mieux : avec un cas aussi simple, il deviendrait possible d'effectuer le calcul parfait sans recours aux approximations binomiales. (A suivre).

* Achèvement (20 JUN 2016) : Sans aucune imperfection binomiale, le décompte parfait pour le cas de 20 haricots ("de 250 grammes"... made in Tchernobyl) confirme la tendance (en remplaçant 99,932%;99,44%;86,1%;13,4% par 99,998%;99,44%;85,7%;12,4%)



  Donc : oui, l'induction (même probabiliste, même scientifique) se trompe, mathématiquement, pas seulement philosophiquement.

* Réserve (21 JUN 2016) : En fait, l'induction scientifique moderne tend à dissiper les absurdités passées, et une loi de dénombrement binomial est employée pour chiffrer l'incertitude sur la fréquence estimée.

  Donc, sans prétendre que l'échantillon 0/100 prouve <1/100 sur la population, on tend à dire (avec un risque alfa subjectif parachuté) que la conclusion est <7,4% sur la population, ce qui n'est plus aussi choquant/faux, mais les résistances sont grandes car l'élaboration de "lois" devient bien moins puissante.

* Contre-objection (24 JUN 2016) : Le fait d’envisager la loi beta binomiale (et son risque alfa admis) comme solution au problème de l’induction peut être questionné : si on réduit la population de mille à vingt, et l'échantillon de 100 à 2 (avec un « haricot » de 250g et non plus 5g), y a-t-il encore un sens à parler de probabilité 0,1% ?
  Le calcul brut donne ceci :

  Donc : avec 0 non-rouge tiré sur 2, le taux de non-rouge (avec risque <= 0,1%) pourrait atteindre 97,8%, mais… comme la population n’est que de 20 haricots, dont 18 non-tirés (seuls non-rouges potentiels) il faut en retenir que 100% (18/18) est rejeté mais 17/18=94,44…% est accepté. Ceci correspond à une confiance différente de 99,9% (en fait un peu moins de 99,4%, voir tâtonnement ci-dessous) et avoir prétendu à 99,9% (et potentiellement 99,999%) était erroné, avec le biais binomial du tirage à remise (ou population infinie). Certes en terme de confiance 99,383% ou 99,999%, c'est proche de 100%, mais inversement en terme de risque, il n'est pas du tout semblable de clamer 1 sur cent mille quand la situation vraie est 617 sur cent mille...

  Avec ou sans loi béta binomiale, l’induction scientifique est donc logiquement, mathématiquement, fautive…

* Fausse déduction (12 AOU 2016) : Mon ami qui m'avait branché (merci) sur l'induction et les haricots a, en discutant, rejeté mon doute (quant à "l'imminence d'une guerre mondiale à cause de l'ultra-libéralisme") avec l'argument-massue "ce n'est pas une induction, c'est une déduction : les mêmes causes produisent les mêmes effets". Je ne suis pas d'accord du tout, mais l'expliquer n'est pas simple/est intéressant (merci encore) :
  Titre : l'induction qui se prétend déduction. On a constaté que vingt cygnes blancs écrabouillent un cygne noir en 1939, et les analystes (pas moi, logicien plutôt que blablateux) ont conclu "la cause de cet écrabouillage est leur anormale différence de couleur", puis en 2016 nait un bébé cygne noir à nouveau et surgit alors la conclusion "il va être écrabouillé, ce n'est pas une induction mais une déduction : les mêmes causes produisent les mêmes effets". Or je ne suis pas d'accord, et la faute logique me semble venir des analystes au sujet de 1939 : au vu de 1 seul exemple, ils ont décrété par induction qu'il y a facteur causal, autrement dit que 1/1 prouve 100%=1000/1000 etc. Pour la relation couleur anormale/écrabouillage. C'est une induction fautive. Ensuite, une fois gobée leur prétendue "loi générale" (bâtie inductivement), ils ont beau jeu de dire que son application partielle au cas présent est une "déduction" du général au particulier, il n'empêche qu'ils ont eu logiquement tort de clamer avoir raison en imposant cette prétendue loi générale, extrapolée à tort de 1/1 à tous les cas.

Réserve épistémologique (14 AOU 2016) : J’ai conscience que ma démolition de la fausse-déduction sur une base purement logique peut être refusée par les scientifiques, au nom des axiomes réalistes auxquels ils croient (ou qu’ils croient « savoir », plus exactement) : « il y a des lois causales, qui déterminent le monde, elles sont d’application universelle, le tout est de les trouver, et pour cela 1 seul exemple (bien interprété) peut suffire ».
  Malheureusement pour eux, j’ai fait des études scientifiques, jusqu’au poste professionnel de technicien, et je peux les casser « de l’intérieur ». Puisqu’une de mes activités est la biologie moléculaire microbiologique, j’ai « appris » (que ce soit vrai ou non) que le micro-organisme Bacillus cereus cytotoxicus (découvert vers 1998-2013) est un Bacillus cereus à mutation énorme, avec délétion d’un millier de paires de bases nucléiques, faisant de lui (bien que restant un cereus, lignée fille des cereus standard) une bactérie avec de nombreux caractères phénotypiques (morphologiques, infectieux, etc.) distincts des cereus standards. Ceci dit, je reprends mes cygnes : peut-être que le cygne noir de 1939 était un mutant « énorme », ayant perdu à la fois la répression habituelle du caractère noir ancestral et le gène biochimique de la sociabilité (équivalent aviaire des phéromones mammifères). Alors, pour les oiseaux, le caractère capital de rejet écrabouilleur n’est pas la couleur de peau mais l’absence de phéromone rendant comme hostile ; au contraire, pour les chercheurs humains étasuniens des années 1960, confrontés aux émeutes raciales de la minorité noire, le facteur évident avait semblé être la couleur d’aspect induisant une forme de racisme. Sans le prouver aucunement, simple bla-bla à l’époque jugé convaincant, là-bas. Or le cygne noir de 2016, s’il a une autre mutation bien plus minime aboutissant au caractère noir ancestral aussi, peut avoir gardé la bonne phéromone dans son bagage génétique, et alors il ne sera nullement écrabouillé, et les « scientifiques » auront eu tort d’affirmer certain qu’il serait écrabouillé, s’étant trompé de cause pour le cas 1939, confondant possible et certain.
  Plus finement, on peut d’ailleurs envisager une conjonction de facteurs : il y aurait écrabouillage s’il y a à la fois couleur noire et manque de la phéromone, la couleur noire étant effectivement corrélée à l’écrabouillage mais n’étant pas suffisante seule à le provoquer.
  Même selon leur logique interne, les scientifiques (ayant tendance à la croyance aveugle) ont tout intérêt à écouter les objections des logiciens. (J’ai peut-être la chance d’avoir les deux cultures ou sensibilités, mais pour travailler scientifiquement, je dois bien souvent « oublier » ma sagesse logicienne, pour répondre comme cela est exigé, en ignorant les objections potentielles pouvant tout invalider).

Discussion (15 AOU 2016) : On me répond "il y a un lien de causalité : c'est parce que le marchand a commandé un sac de haricots rouges que le sac ne contient que des haricots rouges." Mais... dans le monde industriel, des fournisseurs de haricots sans doute aussi, le dogme réaliste est au contraire "le zéro défaut n'existe pas !". C'est peu connu a priori et sortant de l'école/université, j'ai été innocemment surpris par les textes qualité écrits par expérience, concernant les souches microbiennes "de référence" (= achetées sur catalogue à la collection internationale de référence): le texte dit quelque chose comme "l'identification est certaine, sauf s'il y a eu erreur dans l'étiquetage". Eh oui, ça arrive hélas : on commande un Escherichia coli et ils nous envoient une Klebsiella pneumoniae (marquée Escherichia coli)... Pourtant, la livraison n'est que la conséquence de la cause commande, oui mais ça ne marche pas du tout à 100,000% c'est juste que la livraison n'est pas totalement n'importe quoi et ressemble assez souvent à la commande (sinon, un énorme taux de réclamations – de clients osant le doute pour un cas moins criant que la couleur de haricot – conduirait à la banqueroute du fournisseur). Idem en sciences humaines (sociologiques ou historiques notamment) : qu'il y ait corrélation ne veut en rien dire qu'il y a lien mécanique à 100,000%. Dans un graphe sur la liaison entre caractères x et y, il peut y avoir un lien clair avec alignement en une droite (ou courbe) parfaite, ou bien indépendance en un nuage de points informe uniquement gouverné par le hasard, mais, entre ces deux extrêmes, il y a le vaste monde du lien partiel, avec tendance au rapprochement à un modèle mais toute une part d'aléa, d'exceptions. Affirmer "les mêmes causes génèrent les mêmes effets" oublie cela, pour une affirmation abrupte type 100,000% et c'est (une généralisation inductive) très contestable.

Discussion 2 (16 AOU 2016) :
« - Pour la guerre de 1939/45, je suis intéressé mais pas convaincu par tes objections. Le nouveau point que tu soulèves est effectivement intéressant: tu pointes que le raté entre commande et livraison est "rare" (ce que je reconnaissais, sans insister). Mais ma contre-objection est que, pour dire que c'est un "rare démenti à la loi générale", il faut un nombre grand d'observations, comme pour nos bactéries. Mais pour ta loi ultralibéralisme-->guerre mondiale, tu n'avais pas une foule d'exemples formant loi ou quasi-loi, tu n'as que 1 exemple. Ce qu'il y a, c'est que l'argumentaire "causal" te plaît tellement que tu induis de 1 exemple une loi universelle. Tu es en plein dans l'induction, là, et je la juge erronée en termes logiques.
- Toujours sur 39/45, tu sembles me rejoindre à moitié quand tu concèdes que les mêmes causes peuvent avoir un effet différent aujourd'hui. C'était je crois mon exemple de la conjonction cygne de couleur noire + ayant perdu la phéromone amicale. Peut-être que la guerre nait quand il y a ultralibéralisme + colère contre sanctions post-défaite jugées injustes, alors oui, l'ultra-libéralisme est un des facteurs de guerre mais pas suffisant à lui tout seul, et si on le retrouve isolé, la conséquence sera différente. Ceci dit, tu peux entièrement avoir raison sur une guerre future, réalistement, je démens seulement que c'est logiquement certain aujourd'hui. »