Parabole des moindres carrés

Parabole optimale des moindres carrés
Equations utiles, source indéterminée (à ce jour)
Par Christophe Meunier, 11-13/01/2019

Contexte de ce site
  A mon travail (de dosage biologique d’antimicrobiens), au début des années 1990 nous avons remplacé les tracés approximatifs au « pistolet à courbes » (curvigraphe, cf. https://fr.wiktionary.org/wiki/curvigraphe ) sur papier semi-logarithmique par un calcul automatisé et optimal, sur ordinateur. J’étais simple utilisateur, mesureur, et j’ignore où les programmeurs ont trouvé les formules de calcul : la droite des moindres carrés est très célèbre, mais pas la courbe des moindres carrés. Ensuite, avec les réorganisations et changements informatiques, j’ai été amené à créer un tableur Excel faisant l’équivalent de l’ancien programme fermé, avec des compléments utiles : cas de 3 ou 5 points étalons au lieu de 4, basculement vers la droite des moindres carrés si la parabole optimale n’est pas monotone croissante (absurdité biologique pour un dosage d’antibiotique par diffusion, sans courbe en cloche effet-dose). Mais récemment, avec le rigorisme administratif dit Qualité, il m’a été demandé de citer la source bibliographique prouvant que ces formules employées (pour la parabole optimale) étaient incontestables. Je l’ignorais, et le service Biomathématiques qui avait eu l’information des décennies auparavant ne le savait plus du tout. Des recherches Internet n’ont pas permis de retrouver ces formules, et encore moins permis de citer la publication officielle les démontrant (ou les disant vraies avec renvoi bibliographique vers quelque part, même épuisé ou en Chinois).
   En conséquence, simplement pour fixer utilement les idées, pallier au manque Internet, je vais décrire ici les formules employées, qui marchent parfaitement, mais dont j’ignore la source. C'est long à remathématiser à partir des formules Excel, long à rédiger en Word-Equations, long à vérifier, et ce n'est pas mon métier, je fais donc ça hors temps de travail, à la maison en arrêt maladie.
   Si un visiteur Internet connait la réponse à la question « d’où ça vient ? », qu’il me la communique SVP à cmeunier27@free.fr, et je modifierai le site pour le citer (citer la source, et citer/remercier l’informateur s’il le souhaite).
----------------------------------------------------
Formules
   On cherche la courbe optimale (type parabole en première estimation, sans exponentielle ni sinusoïde) entre 4 points de mesure. Cela marche aussi avec 5 points ou 20 points, mais de l’autre côté, il sera inutile pour 3 points de passer par les moindres carrés, car par 3 points passe pile 1 et 1 seule parabole, assez facile à calculer (comme : par 2 points passe pile 1 et 1 seule droite, élémentaire à calculer).
  On a N=4 points de mesure avec Paramètre contrôlé Yi (Y1 à Y4, cases D3 à D6) et Lecture correspondante Xi (X1 à X4, cases C3 à C6). Puis, pour un inconnu, on va lire X (case C7) et on voudra en estimer le Y correspondant : Y = (A*X²) + (B*X) + C [parabole optimale = parabole des moindres carrés]. Tout en sachant la qualité d’ajustement entre courbe et points : coefficient de corrélation R (ou son carré R²), excellent si très proche de 1, très mauvais si proche de 0 ou même 0,7.

Mise en pratique (bleu = source numérique à saisir et ne pas protéger, rose = résultat principal, orangé = valeurs de courbe trouvées) :

Application (permettant de vérifier les saisies personnelles de formules) :

Note : dans ce tableur, il a finalement été noté Y’ pour « Y estimé sur courbe passant au mieux entre les points expérimentaux Y ». Cela n’a aucun rapport avec la notation Y’ = dérivée de Y en fonction de X, au sens différentiel dY/dX (comme la vitesse est la dérivée de la position en fonction du temps, comme l’accélération est la dérivée de la vitesse en fonction du temps), non, ici ce n’est qu’une estimation modélisée de Y, hors aléas expérimentaux (aléa de réplication, aléa biologique, etc.).