Euh, puis-je réinventer ou casser la procédure Lean Six Sigma ?
par l’ingénu technicien CME, 06/04/2015, pour JF ?

1/ Vous dites « six sigma » ?
2/ Un premier Mais…
3/ Extrapolation au Six Sigma
4/ Critique de 6 Sigma par l’autre bout
5/ La complète invalidation finale ?
6/ Conclusion ?
(dernier ajout)

   En tant qu’employé d’entreprise privée visant le progrès continuel, j’ai été informé que des cadres avaient été longuement formés à la très puissante stratégie Lean six Sigma, et en tant que technicien, j’ai eu à effectuer des masses colossales de mesures (plus que jamais, en 30 ans de carrière) pour fournir les bases expérimentales à l’une de ces analyses six Sigma. A mon niveau inférieur, il n’était bien sûr pas requis que je comprenne la stratégie globale, il ne s’agissait que d’exécuter des analyses pour chiffrer une inconnue (enfin, plutôt : inventer une analyse physico-chimique puis l’appliquer de manière répétée, mais sans comprendre les tenants et aboutissants, chacun son job, c’est bien normal).
   Simplement, comme je suis mathématicien amateur (après un 18/20 en Maths au Bac C 1981, même si, en dépression pour raison sentimentale, j’avais arrêté d’apprendre les leçons depuis 2 ans, pour préférer pleurer tous les soirs, et même si j’ai ensuite voulu devenir balayeur, de crottes de chien), je regarde ici ce que pourrait être cette stratégie « six sigma », et ça fait très peur, car avec mon intelligence critique maladive (rendue floue par les antipsychotiques ?), ça casse tout, ai-je l’impression.
   Ouille ! J’espère que c’est un malentendu et que le vrai six Sigma, c’est autre chose !

1/ Vous dites « six sigma » ?
   On ne m’a pas dit ce qu’on appelle Six Sigma, mais en cours élémentaire de statistiques, niveau Bac+1 dans les années 1980 (et c’est peut-être deux ans avant maintenant, tant c’est simple), on appelait Sigma (ou S) l’écart-type d’une distribution, c’est-à-dire la moyenne (quadratique) de la différence avec la moyenne. Et on nous clamait qu’un Monsieur Gauss (avec sa fameuse formule 1 sur racine de 2 pi, fois exponentielle de moins x moins mu au carré sur 2 Sigma) avait prouvé que 95% des valeurs sont situées dans ±2 Sigma (en chipotant sans arrondir : ±1,96 Sigma), et 99,73% se situaient dans ±3 Sigma pile. Autrement dit (ce qu’on ne disait pas) : « la très grande majorité d’une population est comprise dans 4 Sigma, et quasiment tout est compris dans 6 Sigma, donc 6 Sigma est une façon simple d’exprimer la population, à partir de la connaissance de l’écart-type. » Ça peut effectivement expliquer qu’il y ait des trucs super-célèbres parlant de Six Sigma, d’accord. (Je ne sais pas si c’est de ça qu’il s’agit, mais c’est ce que j’imagine).

2/ Un premier Mais…
   En rédigeant un protocole technique pour une application sur laquelle je ne travaille plus maintenant, j’avais ainsi proposé une estimation de l’erreur totale comme ±3 Sigma (avec Sigma comme écart-type de l’erreur, Sigma étant appelé Erreur aléatoire par le prestataire de mesure), mais des biostatisticiens professionnels m’ont dit la semaine dernière que non, la Pharmacopée Européenne affirme qu’on compte +2 Sigma sur la valeur absolue (s'appliquant du côté défavorable où penche l'erreur systématique sur la moyenne). Ah bon, c’est une autre façon, d’accord.
   J’avais demandé leur aide car, à l’occasion d’une révision du document que j’avais écrit, on revenait me demander mon avis, et j’autocritiquais (sans être sûr) mon propre ±3 Sigma. En effet, le Sigma est ici un écart-type mesuré sur un échantillon de 10 valeurs, pas l’écart-type vrai de l’infinie population possible. Et, à ce titre, je préférais maintenant corriger en appliquant le célèbre t de Student (fonction du nombre de valeurs moins une) que l’Epsilon de Gauss (pour nombre de valeurs tendant vers l’infini).
   Les biostatisticiens ont dit non, que c’était la valeur gaussienne qui était prise quand le nombre de valeurs est supérieur à 30 (et en pratique, les textes officiels ne requièrent même pas ce chiffre de 31 valeurs, mais ±2 Sigma est la convention générale.
   Pour voir, j’ai quand même fait le calcul avec Excel, qui donne maintenant toutes les valeurs voulues sans recours à un nombre immense de tables imprimées à la façon d’autrefois. Et… c’est troublant :

- Quand on respecte le commandement N>30, ce n’est pas que ±1,96 Sigma se mettent à contenir 95% des valeurs en arrondissant, on passe de 94,03% des valeurs à 94,07% des valeurs.
- Ce qu’il y a, c’est que quand on respecte le commandement N>=30, ±2 Sigma (sans aucun rapport avec un arrondi de ±1,96) se mettent à contenir 94,51% s’arrondissant à 95% au lieu de 94,47% s’arrondissant à 94%, on y voit plus clair !
- Mais, sur 10 valeurs, ±2 Sigma contient 92,34% qui ne s’arrondit pas du tout à 95%, hum. Les Pharmaciens ne sont certes pas mathématiciens, ils ne veulent pas qu’on les embête avec ce genre de détails. Alors ils font faux, ils en ont le pouvoir, éh : Bac+5 ou Bac+7, ils sont !

3/ Extrapolation au Six Sigma ?
   En dehors du protocole sur l’erreur totale avec mesure de 10 valeurs, les mesures chromatographiques que j’ai faites pour le projet dit Six Sigma portaient sur des séries de 15 réplications. J’examine donc ce qu’il en est pour 15-1 = 14 « degrés de liberté ». Et 6 Sigma ne contient pas 99,73%, mais 99,04%.
   Oh, ce n’est pas bien grave, en un sens : quand on trouvait (avec Gauss) 99,73% pour 6 Sigma, on ne disait pas « ah oui, 99,73% et pas 99,72% donc c’est bien toute la population », non, mais implicitement je crois « 95% ne faisait pas assez, et 99,73% là d’accord c’est sufisamment proche de 100% », et peut-être qu’on aurait pu le dire aussi bien en trouvant 99,04%, avec un critère implicite « davantage que 99% », et – effectivement – ça justifie qu’on m’ait fait passer des séries de 15 réplications et pas 14 (qui aurait donné 98,98% dans 6 Sigma, sans atteindre les 99%).
   J’espère simplement que la formation Six Sigma disait cela : Six Sigma contiennent plus de 99% des valeurs si on estime Sigma sur au moins 15 valeurs, sans du tout mentionner le chiffre 99,73% que je connaissais avec l’approche gaussienne élémentaire.

4/ Critique de 6 Sigma par l’autre bout
   Par ailleurs, et par simple intérêt personnel (avec en tête de « détruire le scandale des statistiques inductives », hum), j’ai acheté dans les années 1980 un gros livre de statistiques (d’un certain G.Saporta, parait-il célèbre en France), où j’ai trouvé des choses passionnantes, notamment les tests de normalité et l’incertitude d’écart-type. Je reviendrai sur les premiers au paragraphe suivant, mais la question concernant l’intervalle de confiance paraît tout de suite majeure ici : on dit que 99,73% des valeurs sont comprises dans 6 Sigma, mais quand Sigma n’est pas celui de la population, connu, mais une estimation sur 15 valeurs (le nombre 15 semblant choisi pour estimer cerner 99% des valeurs), quelle est l’incertitude à 99% sur cet écart-type ? ceci semblant intervenir sur l’intervalle de confiance chiffré à tant d’écart-type.
   Enfin, un chef biostatisticien m’avait donné une copie de rare table imprimée « incertitude sur l’écart-type » (de population normale) dans les années 1990, et ça discordait un petit peu de la formule du livre, mais j’ai trouvé l’erreur : un N à la place de N-1 dans la formule du livre, et en corrigeant ainsi, on retombait pile sur la table imprimée (tirée d’un autre livre, de référence).
   Pour 15 valeurs, qu’est-ce que ça donne à 99% ? (et, pour voir : pour 10 valeurs, qu’est-ce que ça donne à 95% ?)

(un écart-type mesuré à 1,00 sur 10 valeurs a 95% de chances d’être en vrai entre 0,69 et 1,82 ; un écart-type mesuré à 1,00 sur 15 valeurs a 99% de chances d’être en vrai entre 0,67 et 1,85).
   C’est troublant, et ça fait un peu plus vaciller le dogme du 6 Sigma prenant Sigma pour une valeur vraie indiscutable.
   Toutefois, je ne suis pas certain que cela se surajoute au choix du t à la place de Epsilon. En effet, la formule de calcul de l’incertitude sur Sigma fait intervenir un Ki², et il se trouve que j’ai démontré pour m’amuser (dans les années 1980) que le t de Student est simplement la racine carrée du F de Fisher-Snedecor dans le cas de 2 groupes seulement, et je crois bien que le F est (dans les détails donnés par Saporta) un ratio entre deux Ki². Donc… ce que ferait le t (qu’on m’a balancé sans démonstration, l’université Bio n’ayant pas l’esprit « Bac C » avec des profs de Maths démontrant intégralement ce qu’ils affirment) pourrait être de corriger l’epsilon par l’incertitude sur le Sigma. Ou bien ça se surajoute, je n’en sais rien, il faudrait que le professeur démontre ce qu’il dit. Mais si le professeur affirme six Sigma, c’est militaire ou dictatorial, idiot je dirais, pardon. Hum. (L’an passé ou il y a deux ans, j’ai découvert avec émerveillement comment démontrer pour un triangle rectangle que H²=A²+B², pourquoi le fait-on apprendre à l’école primaire et secondaire comme démontré au lieu de donner à voir sa logique et les limites de celles-ci ?).
   Pour essayer de comprendre l’impact de l'incertitude sur l'écart-type, je calcule :
   Quand on trouvait 1 comme écart-type sur 10 valeurs, avec confiance 95% il aurait fallu dire qu’il pouvait être 0,6878, donc quand on englobait ±2 écart-types (comptés 1), on était en fait à ±2/0,6878 soit ±2,91 écart-types vrais soit beaucoup plus de 95% en appliquant la loi normale. Et inversement, avec l’hypothèse maximale 1,8256, on était en fait à ±2/1,8256 soit ± 1,10 écart-types soit beaucoup moins de 95%. Le tableau complet donne ceci :

   D’une part, on obtient deux valeurs là on en cherchait une (faut-il prendre l’hypothèse la plus défavorable ? « worse case »…), d’autre part pour N=15, 6 Sigma est très loin de garantir englober 99% des valeurs (89% des valeurs sont incluses seulement, au pire avec confiance 99%).
   Ça semble bien être une (première ?) invalidation. Aïe.

5/ La complète invalidation finale ?
   Puisque le cours Saporta disait en clair que les chiffres de t et Epsilon ne sont valides que pour des distributions « normales », gaussiennes, la question du test de normalité paraît essentielle : si la distribution n’est pas normale, non seulement ce n’est pas 6 Sigma qui contient 99,73% des valeurs mais ce n’est pas non plus la correction à laquelle j’aboutissais plus haut, c’est simplement « inconnu », ouille…
   Hélas, par la logique pure, j’ai invalidé l’usage souhaité en routine des tests de normalité : s’ils permettent effectivement de rejeter l’hypothèse de normalité (en se fixant un risque d’erreur alfa comme l’on veut), ils ne sont pas du tout faits pour valider une normalité. Je l’ai prouvé : si l’on n’échoue pas à rejeter (la normalité) avec <5% de risque, on aurait sans doute échoué à rejeter en exigeant de ne rejeter qu’avec risque <0,0001%, et ça ne veut pas du tout dire que c’est validé avec risque <0,0001% puisqu’en tendant vers risque nul (de rejet à tort) on accepterait n’importe quoi, ce qui fait tendre le risque de se tromper vers 100% et pas du tout 0%. Paf, imparable.

6/ Conclusion ?
   Mais alors… Six Sigma, même en ne parlant que de 99,0% des valeurs d'après un échantillon de 15 valeurs, serait-il une escroquerie ? Mathématiquement, il me semble que Oui. Mais j’espère me tromper. Les cadres formés (à la récitation ?) sont censés être supérieurs et les exécutants autodidactes : inférieurs. C’est la règle, et il faut respecter les règles, ou démissionner, être à la rue, divorcer, se suicider… Non-non, d’accord pour le Six Sigma, même s’il risque d’être faux, même s’il est utilisé pour des produits industriels toxiques qui risquent de tuer, chut : il faut respecter les règles sociales, de dominance, ne pas oser réfléchir. « Non au risque ! » est une farce oratoire, il n’a jamais été question d’interdire les déplacements de loisirs en voiture ou moto, interdire le racisme israélite, non, bien sûr. Galilée s’est bien rétracté, après avoir osé dire que la Terre était ronde, cet hérétique anarchiste, on l’aurait brûlé sinon, il faut que je m’estime heureux, il faut que je rentre dans le rang. Oui-chef chef !
   Non, je « rigole » (ou je larmoie, masochiste ou malade – sous traitement, effectivement), il doit y avoir une autre explication, mathématiquement juste. Ou pas.

- - - - - - - - - - - - - - - - -

Ajout 01/06/2021 (après avoir été mis en invalidité psychiatrique début 2019, chassé du monde du travail – pour souffrance mentale, en fait inaptitude à vivre paisiblement la complicité de mensonges achetée par le salaire)
   J’ajouterai que l’écart-type estimé sur échantillon est faux, calculé avec formule célèbre que j’ai démontrée entièrement erronée. Tous les « il est prouvé que » dans la formation LeanSixSigma sont donc faux, mensongers, stupides appels à la crédulité, niveau mental inférieur à 6 ans (oui-oui, c’est réservé aux fiers cadres surpayés, faux supérieurs lamentables, sub-débiles et pas seulement immoraux accapareurs de part trop élevée de la masse salariale).
  Pire : l’écart-type d’après un échantillon ne peut même pas être calculé sans connaître l'effectif exact de la population et sans se poser la question si l’échantillon est un tirage avec remise ou sans remise, points dont les réponses déterminent la vraie formule de calcul, ce qu’oublie de dire le cours sans démonstration, professant l’erreur clamée vraie, mensonge professionnalisé, escroquerie caractérisée, grand banditisme.
   Voir mes sites http://www.kristofmeunier.fr/varians.htm et http://www.kristofmeunier.fr/LetterToRaisha.htm.