NTP et NPP+ : petite révolution du dénombrement NPP ?
par Christophe Meunier-Ditchon, technicien "16-16-16", mathématicien amateur
(invention personnelle domestique la nuit du 21/02/2005, professionnellement témoignée le 22/02/2005, transcrite en HTML le 26/09/2009+14/10/2009, mise en ligne le 13/09/2012)

  Sans rien changer à la pratique technique des dénombrements bactériens par technique NPP, il est possible de presque tripler la largeur de la gamme couverte (et presque doubler la sensibilité), par un simple accroissement de logique dans les tables d’interprétation.
  Ce n'est pas anecdotique : chaque jour dans le Monde (dans l'industrie alimentaire surtout), des dizaines de milliers de techniciens pratiquent des tests NPP (ou dérivés), des milliers de cadres biologistes approuvent des résultats NPP, des milliers de comptables facturent des prestations NPP d'analyse scientifique. La voie NPP (comptage de tubes positifs au lieu du plus classique comptage de colonies sur boîtes Petri) est choisie pour sa rapidité et sensibilité nettement meilleures, ou rejetée pour sa reproductibilité un peu moindre (sauf adaptation spéciale, genre "16/16/16 automatisé" par exemple, ce n'est pas le sujet ici). L'invention du NPP date de 1915, paraît-il, attendra-t-on 2015 pour une révision de ses grands principes ?

NPP : Nombre le Plus Probable (in English, MPN : Most Probable Number)
NTP : Nombres Très Possibles (in English, VPN : Very Possible Numbers)

Le principe du NPP
  Une fraction d’aliment, ou d'autre produit, peut positiver ou non un tube (présence ou absence de telle bactérie spécifiquement recherchée), alors on réalise 3 tels tubes avec (chacun) 1 gramme + 3 tubes avec 0,1g + 3 tubes avec 0,01g, on compte les tubes positifs Grands/Moyens/Petits, par exemple 3/1/0, et une table de probabilités indique la concentration (la plus probable correspondante) en bactéries/g.
  Pour établir cette table, toutes les concentrations possibles (à 2 chiffres significatifs) ont vu quantifiée leur probabilité de donner chaque combinaison de positivité (64 cas, depuis 0/0/0 jusqu'à 3/3/3) et la concentration ayant la plus grande probabilité de donner 3/1/0 est listée comme concentration la plus probable sachant ce résultat obtenu  ̶  avec des réserves pour les cas (comme 0/0/3) où le plus probable reste très peu probable, suggérant un artefact ou problème technique, d'où non-rendu de résultat.
  Si vous avez comme moi une tendance à la suspicion mathématique, vous aurez froncé les sourcils en notant dans ce qui précède une inversion dans les termes de la probabilité conditionnelle, mais - j'ai vérifié - c’est ici pleinement légitime (sous axiome d’équiprobabilité des concentrations a priori) :
[d'après la loi/évidence en fréquences ou probabilités : p(A sachant B) qu'on écrit p(A/B) est égal à p(A et B) / p(B) :]
p(concentration/combinaison) = p(combinaison/concentration) × p(combinaison) / p(concentration) = p(combinaison/concentration) × 1 / constante

Le problème du NPP au sens strict, création du NPP dégradé
  (On ne m'a jamais signalé cela, seulement parachuté des tables incompréhensibles, mais telle est mon interprétation logique)
  Si l’on suit à la lettre le principe NPP : aux extrémités du catalogue de possibilités surgissent des valeurs extrêmement douteuses : 0/0/0 conduit à conclure Zéro bactérie/g (alors que c’est peut-être aussi bien 0,000 000 001/g), 3/3/3 conduit à conclure Infinité de bactéries/g (alors que, selon la science actuelle, c’est forcément plutôt quelque chose comme 100 000 000/g).
  Ces extrêmes "mathématiquement purs" mais scientifiquement douteux ne sont pas acceptés. Donc ceci ne figure pas sur les tables dites NPP, qui correspondent donc en fait à un NPP dégradé : 3/3/3 (positifs sur 3/3/3 tubes testés) est déclaré conduire à une concentration strictement supérieure à la concentration de 3/3/2, et 0/0/0 (positifs sur 3/3/3 tubes testés) est déclaré conduire à une concentration strictement inférieure à la plus basse avec 1 seul tube positif.

Le problème du NPP dégradé, création du NPP+ amélioré
  Pour les 2 cas extrêmes, le NPP dégradé n’appliquant plus du tout la logique NPP mais signalant un groupe de possibles, je me suis demandé simplement : quel groupe de nombres possibles devrait-on rendre ? Est-ce de manière convaincante vraiment « n’importe quoi au delà » ?
  Exemple : 1/0/0 donne le NPP = 0,41 bactéries/g, et alors 0/0/0 donne le NPP dégradé < 0,41 bactéries/g… mais la question pertinente me semble être [même si l'autorité professorale m'a répondu que "les gens intelligents ne se posent pas cette question !"...] : la concentration 0,40 bactéries/g donne-t-elle plutôt 1/0/0 ou 0/0/0 ? Où se situe la limite en probabilité départageant « plutôt 1/0/0 » et « plutôt 0/0/0 » ? Cela fait chercher le NPP de la pseudo-combinaison 0,5/0/0 (cas virtuel ou même contrafactuel, selon une logique « what-if... », « et-si... », tout à fait "scientifique" - au sens épistémologique de ce terme, non au sens militaire des lycées et universités).
  [Madame, les gens intelligents se posent la question, cherchent une réponse quitte à démontrer l'erreur des prétendus experts, et puis trouvent la correction. Ce n'est ni l'autorité sociale ni le suivisme aveugle (d'adorateur en chef) qui font l'intelligence, mais l'esprit critique, la rigueur logique et la capacité créatrice. Désolé. Vous dominez socialement, non intellectuellement (au sens propre du mot, sens certes inemployé au sein de "L'Élite"...).]
  La réponse objective (selon moi, à supposer qu'autrui existe à confirmer ou corriger après débat contradictoire éventuel) est la suivante : 0/0/0 correspond à < 0,18 bactéries/g ("Nombres Très Possibles" NTP, plus précisément que < 0,40 "Nombres Possibles" NP) et 3/3/3 correspond à > 180 bactéries/g (NTP, plus précisément que > 120, NP).

Détail des calculs initiaux
  La table NPP standard est basée sur la loi de Poisson, outil préhistorique datant d’avant l’informatique, et dont la pertinence me parait douteuse. Je l’ai remplacée par (une idée à moi de) la loi binomiale - le recours à la loi de Poisson étant effectué avec pour seul justificatif (entendu, sans démonstration) : "de toute façon, quand on tend vers l'infini, la loi binomiale exacte converge vers la loi simplifiée de Poisson". Ma logique : un tube de 1 gramme, cela fait un milliard de milliardièmes de gramme (pouvant être bactériens ou stériles), et le cas de tube positif représente 100% des cas moins celui où zéro milliardième bactérien ont été tirés au sort sur le milliard de tests.
  Toutefois, le mot "milliard" ci-dessus était une illustration de principe, les professeurs disant qu'il y a environ 1E23 bactéries/g dans la biomasse des colonies... or les outils (domestiques) de calcul grand-public sont dépassés par des masses bactériennes de l’ordre de 1E-23g (inverse du « nombre de tests » pour moi), et la limite logicielle trouvée vers 1E-9g m'a paru satisfaisante au vu du rapprochement asymptotique constaté (1E-1/-2/-3/-4/–5/-7/-9 donnant sur un exemple les probabilités 0,65/0,634/0,6323/0,63214/0,632122/0,6321206/0,6321205 arrondissable à 0,632 sans chercher la limite à 1E-23 sur la 7e décimale... et une microlevure est bien plus lourde qu'un microcoque, trancher entre 1E-22 et 1E-24 n'est pas le problème).
  Evidemment se pose la question : pourquoi croire la loi binomiale ? Il me semble que c'est l’outil clairement adapté : à partir des formules p(A et B indépendants) = p(A) × p(B) et des « Cnp » sur le nombre de combinaisons de p parmi n, se calcule la probabilité de p tests positifs en n essais.
  Face à cela, le cours de Poisson parachute que si le volume M contient N bactéries, p(zéro bactérie dans V)=(1-V/M)^N. Il y a une logique à cela, me semble-t-il : chaque bactérie, indépendamment, a V/M probabilité de passer du grand volume M au petit volume V. Oui, mais ça voudrait dire que si V=M, il est impossible qu’un tube soit négatif, or c’est faux : si on a en moyenne 1 bactéries par cm³, cela ne prouve en rien qu’il est impossible d’avoir un cm³ inoccupé (avec 2 bactéries dans un autre cm³). Et il y a pire... si V > M, la formule donne n'importe quoi : si on a 3 bactéries/cm³, la probabilité d'avoir 2 cm³ sans bactérie serait négative (qu'est-ce que ça veut dire?), et puis... avec 2 bactéries/cm³, la probabilité d'avoir 3 cm³ sans bactérie dépasserait 100% (qu'est-ce que ça veut dire?). Et il ne résoudrait rien d'objecter que V < M est obligatoire pour employer cette formule : même en respectant cela, quand V tend vers M la propabilité de tube négatif tend vers zéro ce qui est faux. La loi de Poisson semble donc invalidée dans ces emplois, où la loi binomiale ne rencontre aucun problème. Toutefois, avec un décalage artificiel vers le bas, j'ai évité cet écueil, et Poisson (si j'y croyais) confirmerait pareillement l’intérêt majeur du NPP+/NTP, voir les chiffres avec formules ci-dessous, en cliquant sur l'image réduite.



Auto-objection n°1
  La table du cours rend, pour le poissonnien cas 1/0/0, le NPP 3,6 et non le 3,8 que j’ai calculé, donc il y a une erreur quelque part. Avant de reprendre mes calculs, j’ai examiné le cours de plus près. Toute la table officielle repose en fait sur une égalité, le cours disant p = (1- V/M)^N = e^(-N × V/M). Effectivement, avant l’ère de l’ordinateur (« préhistoire ») et avant même la calculette (« pré-préhistoire »), il n’y avait que la règle à calcul, et en ces temps anciens, une approximation valait mieux que rien. Mais la vraie formule de ce genre est B^N = e^[N×log(B en base e)], et je le prouve ci-dessous : la formule du cours est une faute impactant significativement les calculs NPP, pour de mauvaises raisons historiques n’étant plus du tout justifiées.



Auto-objection n°2
  Le calcul appliqué aux petits nombres, toutefois, indique que là où je pensais trouver 3,8 d’après mes calculs, l’erreur de formule fait trouver 4,1 – et non le 3,6 présent dans la table parachutée. A la réflexion, selon le principe NPP, il ne convenait pas de chercher (pour le cas 1/0/0 positifs sur 3/3/3 tubes) la probabilité la plus proche de 1/3 de positivité sur les grands puits, il fallait comptabiliser aussi la probabilité de zéro positif sur moyens et petits tubes. En faisant cela (ci-dessous), on démontre bien que la formule de la table est fausse, faisant trouver 3,6 là où il aurait fallu trouver 3,4. Donc mon 3,8 initial était faux, le 3,6 de la table semble faux aussi, le vrai chiffre pour 1/0/0 serait 3,4 – du moins sous logique Poissonnienne, sachant que l’exacte est binomiale…



Auto-objection n°3
  La table du cours ne classe pas le cas 0/0/0 comme juste-au-delà de 1/0/0 (NPP3,6) mais juste-au-delà de 0/0/1 (NPP3,0). Certes, j’avais omis ce cas 0/0/1, environ 100 fois moins probable que 1/0/0, et si c’est de ce côté-là que se situe le moindre NPP, il faudrait que je me réfère non pas à 0,5 grands puits positifs mais à 0,5 petits puits positifs, ou plus exactement (non à la combinaison 3/3/0,5 qui en découle normalement mais) au cas 0/0/0,5. Toutefois le principe de calcul ci-dessus employé était que 1/3 positif se calculait comme négatif-et-négatif-et-positif, or cela ne marche pas avec un demi-tube…
  Il importe toutefois de réaliser une lecture critique de la table. Celle-ci affirme que 0/0/1 et 0/1/0 correspondent au NPP 3,0 tandis que 1/0/0 correspond au NPP 3,6. J’en doute. Il me paraît évident que 3,0 (bactéries/g) aurait produit 1/0/0 cent fois plus souvent que 0/0/1. Le calcul le confirme : (enfin le 3,0 serait corrigé en 2,9 sans l‘erreur de formule déformant Poisson, mais la voie binomiale fait bien retomber sur 3,0) 0/0/1 ne ressemble pas du tout à du 3,0 mais parmi tous les candidats, eh bien 3,0 est le moins pire. Ce n’est pas vraiment du Nombre le Plus Probable mais du Nombre le Moins Improbable… Le critère ayant exclu l’immensément improbable 0/0/3 de la table pourrait donc pareillement exclure 0/0/1, si la probabilité inacceptable était normée à 1% au lieu de 0,5% ou 0,01%. Malgré tout, l’un peu moins improbable cas 0/1/0 a 8% de chances d’advenir avec 3,0 optimum, effectivement inférieur à 3,4, la critique de principe n’évacuant donc pas simplement le trouble. 8% pour 0/1/0 (au lieu de 92% pour 1/0/0) est très minoritaire, mais si on exigeait le caractère majoritaire pour être dans la table des résultats rendus, disparaîtraient pareillement 0/1/1, 0/2/0, 0/3/0, 2/3/1, 3/0/2 etc. (ne restant que 10 des 40 combinaisons tabulées sur 64 théoriques : 0/0/0-1/0/0-2/0/0-3/0/0-3/1/0-3/2/0-3/3/0-3/3/1-3/3/2-3/3/3 – pour les extrêmes (débattus) et la peu fine progression 3,6-9,2-23-43-93-240-460-1100). Le NPP y gagnerait autant en fiabilité qu’en impopularité (fréquentes non-réponses ?). Il pourrait s’appeler NcPP : Nombre crédible le Plus Probable, et n’intéresserait vraisemblablement personne.
  La pure logique NPP s’avère ainsi douteuse, à seuil arbitraire (0,01% ? 0,1% ? 1% ? 10% ? ou caractère majoritaire ?) comme compromis entre rendu non-ressemblant et échec de quantification, mais en valeurs extrêmes, la question des nombres très possibles NTP est plutôt rassurante : on ne cherche nullement « ce qui ressemble le plus même si ça ne ressemble presque pas du tout », mais « ce qui ressemble ». (Note : le souci de crédibilité n'est pas spécifique au principe NPP, il se retrouve en comptage sur boîte quand par exemple la dilution 1/10 donne 20 colonies et la dilution 1/100 : 200 colonies, au lieu de 2 environ).



Auto-objection n°4
  La loi binomiale (comme la loi de Poisson) concerne un "tirage avec remise" or si une bactérie est passée dans le premier tube, examiner le second tube se fait sans elle et non "en la remettant dans le liquide remplisseur". Je ne connais hélas pas de formule ou fonction donnant la probabilité en tirage très multiple sans remise. Une fausse solution consiste à dire que le 1g de chaque grand tube est un échantillon minime de la source, dont la concentration globale est à peine changée par ce prélèvement ; bof, la pureté mathématique est quand même perdue.

Auto-objection n°5
  Deux approches étaient disponibles, en principe, pour quantifier les cas ressemblant surtout à 0/0/0 (ou 3/3/3):
A/ Cas donnant davantage de 0/0/0 que de 1/0/0 (ou de 3/3/3 que de 3/3/2)
B/ Cas donnant davantage de 0/0/0 (ou de 3/3/3) que de toutes les autres combinaisons réunies
  Cela conduit à deux valeurs chiffrées potentiellement distinctes. Je préfère la manière A, davantage liée à la notion de "combinaison la plus probable". Il se trouve qu'elle donne des valeurs un peu plus extrêmes, ce qui va dans le sens aussi d'augmenter l'amplitude. Toutefois, ce principe d'ordre général n'est pas celui utilisé par les tables NPP car ce qui est rendu pour 0/0/1 avait bien davantage de chances de donner 1/0/0 que 0/0/1.

Résumé
Combinaisons
Concentrations
Tubes +
Grand/Moyen/Petit

    NPP strict    
NPP an-2010
   (NPP & NP)   
NcPP crédibilisé
  (NPP sans cas improbables)  
NPP+ an-2015?
           (NPP & NTP)           
NcPP+ crédibilisé
 (NPP+ sans cas improbables)  
0/0/0
0
< 3,0 (< 2,9)
< 3,6 (< 3,5)
< 1,8
< 1,8
0/0/1
3,0
3,0
-
3,0
-
1/0/0
3,6
3,6
3,6
3,6
3,6
… (59 cas)
… (59 cas)
… (35 cas)
… (6 cas)
… (35 cas)
… (6 cas)
3/3/2
1100
1100
1100
1100
1100
3/3/3
+ infini
> 1100 (> 1200)
> 1100 (> 1200)
> 1800
> 1800
(amplitude)
(infinie)
(1 à 367 = X)
(1 à 278 = X /1,32 = X - 24%)
(1 à 1000 = 2,72 X = X + 172%)
(1 à 1000 = 2,72 X = X + 172%)
(minimum)
( 0 )
(3,0 = Y)
(3,6 = 1,20 Y = Y + 20%)
(1,8 = Y /1,67 = Y - 40%)
(1,8 = Y /1,67 = Y - 40%)
  Avec quatre types de tubes (par exemple 3/3/3/3) ou avec un plus grand nombre de tubes (par exemple le fameux 16/16/16) ou avec des dilutions préalables (par exemple mise en suspension au 1/100) ou avec des baisses différentes entre types de tubes (par exemple 1g/0,01g/0,0001g) ou avec même une seule taille de tubes (par exemple positivité de 3000 tubes à 0,001g), les chiffres seraient tous changés, mais le principe reste le même :
  passer de NPP à NPP+ (c'est à dire de NP à NTP) élargit grandement l'amplitude, fait gagner en sensibilité (et en limite supérieure sans dilution).
  Le mode que je préfère est le NcPP+ mais j'imagine que si les concepteurs et utilisateurs ont préféré ne pas inventer le NcPP, ils préféreraient le NPP+, équivalent au NPP actuel en mieux.