Analyser les résultats d'expérimentations grâce aux statistiques pour discerner les facteurs influents et trouver les causes racines

Minitab Blog Editor | 11/3/2020

Les Sujets: ANCOVA, Covariable, Plans d'expérience

La Ryder Cup, coupe du monde de golf au cours de laquelle s'affrontent les équipes européenne et américaine, vient de s'achever à Paris sur une victoire de l'équipe réunissant les meilleurs golfeurs d'Europe. Il est tout à fait plausible que les entraîneurs des joueurs de cette coupe aux enjeux considérables, rassemblant environ 300000 visiteurs pendant les trois jours de la compétition, aient testé plusieurs techniques de jeu et des clubs différents pour obtenir les meilleurs tirs. Ont-ils tenu compte des facteurs environnementaux comme le vent ? Ont-ils employé la technique des plans d'expériences, méthode statistique qui consiste à structurer les essais puis à analyser le plus finement possible les résultats afin de trouver le paramétrage idéal ?

Cet article originellement publié en anglais sur le Blog de Minitab sous le titre A (Golf) Course in Design of Experiments, a été traduit en français par un des formateurs Minitab. Il vous montre comment enrichir un plan d'expériences en intégrant des variables environnementales ou les caractéristiques des produits dans l'analyse

 

L'analyse de covariance (ANCOVA), une technique cruciale pour réussir vos plans d’expériences

Dans le cadre de ce plan d’expériences, nous avons cherché à maximiser la distance de tirs de balles de golf.

Pour cela, quatre facteurs expérimentaux ont été testés : la hauteur du tee (cheville pour surélever la balle au point de départ), la rigidité du club, la qualité de la balle et l’angle d’inclinaison du club. Un jeu complet d’essais a été généré.

 

Sculpture de tees à l'entrée du Golf National de Saint Quentin en Yvelines, près de Paris, en France

 

Sculpture de tees à l'entrée du Golf National de Saint Quentin en Yvelines, près de Paris, en France

Au cours des plans d’expériences, il arrive assez souvent que des variables de bruit indépendantes de la volonté des différents acteurs viennent influencer les résultats. Il pourrait s’agir du vent, de l’humidité dans l’air, de la température extérieure ou encore dans notre exemple, la vitesse du club ou la position du contact club / balle varient pour chaque tir et ont été mesurés.

Dans un contexte industriel, des variables liées à l’évolution de l’environnement (changements de températures, hygrométrie, poussière dans l’air etc…), mais aussi les caractéristiques initiales des pièces testées etc… pourraient avoir un impact sur la réponse étudiée.

Les covariables sont justement des variables de bruit continues que nous ne pouvons pas contrôler (alors que les facteurs sont contrôlables eux). Elles sont subies donc mais une caractéristique importante de ces variables de bruit est qu’elles sont mesurables. En étudiant la relation entre ces covariables et notre réponse, nous pouvons inclure les covariables dans le modèle et prévoir mathématiquement la distance de chaque tir en prenant aussi en compte l’effet de nos deux covariables : la vitesse du club et la position du contact club / balle.

Inclure les covariables dans l’analyse d’un plan, présente de nombreux avantages :

  • Tous les procédés ont des variables de bruit impossibles à contrôler qui contribuent à la variation globale des essais mais en incluant celles qui sont mesurables dans le modèle, nous pouvons réduire le bruit de fond associé aux covariables, ce qui permet d’obtenir une estimation plus précise des effets des facteurs contrôlables et d’améliorer l'ainsi exactitude du modèle parfois de façon considérable.
  • Cela réduit le niveau général de bruit lors de l'analyse finale en améliorant la puissance du test statistique et donc la capacité à détecter des effets des facteurs même faibles (ceci a pour conséquence une amélioration du R² du modèle).
  • Les covariables peuvent fausser les résultats à cause de biais potentiels sur l’estimation des effets des facteurs contrôlables. En les incluant dans le modèle, nous pouvons neutraliser et corriger leurs effets sur ces facteurs contrôlables (en supprimant l’impact des covariables sur les effets des facteurs étudiés).
  • Enfin, nous pouvons évaluer l’effet des covariables, certaines étant non significatives alors que d’autres pourraient s’avérer être tellement significatives que nous pourrions décider par la suite de les mettre sous contrôle.

Pour chaque essai, nous avons noté les valeurs des facteurs expérimentaux contrôlables, mais aussi des variables non-contrôlables mais mesurables (la vitesse du club, la position du point de contact club / balle par rapport au centre de la face du club). Notre analyse portera d'abord sur l'élimination de l'effet de ces variables de bruit afin d’étudier les effets de nos quatre facteurs contrôlables sans aucun biais.

Une ANCOVA est une analyse qui prend en compte les covariables. Voici deux exemples simples d’une ANCOVA :

  • Lorsque l'on compare la perte de poids de deux régimes, le pourcentage de graisse corporelle de chaque sujet au début de l'expérience est une covariable, car les kilos perdus seront plus élevés pour des personnes ayant un pourcentage initial élevé de graisse corporelle, ceci pour les deux régimes.
  • Lors de l’étude des effets des réglages de paramètres d’un processus d’un traitement de l’eau pour éliminer les matières solides des eaux usées, la « turbidité » / nébulosité de l’eau traitée dépend nécessairement de la turbidité de l’eau entrante, quel que soit le processus de traitement.

Le diagramme ci-dessous montre la distance de tir de deux golfeurs par rapport à la vitesse du club. La réponse autour de la ligne de régression varie en raison de la diversité des paramètres de facteurs expérimentaux utilisés pour chaque golfeur mais l’impact de la vitesse du club est bien visible au milieu de toute cette variabilité. L’équation de la ligne de régression pour la vitesse du club est la suivante :

Carry (en yards) = 109 + 1.055 * (Vitesse du club en Miles par heure)

 

Sculpture de tees à l'entrée du Golf National de Saint Quentin en Yvelines, près de Paris, en France

La vitesse moyenne du club est de 89,6 miles / h. L’ANCOVA ajuste chaque donnée d’environ 1,055 mètres pour chaque miles / h en plus ou en moins par rapport à cette moyenne. Lorsque la vitesse est supérieure à 89,6 miles / h cet effet sera retranché pour éliminer / neutraliser l’effet de la vitesse du club, alors que pour une vitesse inférieure à 89,6 miles / h, cet effet de la covariable sera ajouté pour obtenir le même objectif.

L'analyse finale portera donc sur les points de données ajustés / corrigées et non sur les valeurs de Carry d'origine. Ce faisant, nous pouvons mesurer les effets spécifiques de nos quatre variables d’entrée en corrigeant l’effet de la vitesse du club et la position du contact club / balle (les deux covariables).

 

Conclusion

Dans l'industrie, les plans d’expériences sont un outil très puissant pour la résolution de problèmes d'ingénierie, surtout lorsque les procédés sont complexes, avec des ressources limitées pour mener les essais, des experts métier qui soutiennent des théories divergentes ou encore une variabilité des mesures non négligeable même pour de simples répétitions d’essais.

Ainsi, le formateur Minitab Bruno Scibilia a utilisé une ANCOVA pour étudier les effets des réglages de paramètres d'un processus de polissage sur la planéité finale des tranches de silicium en prenant en compte la planéité des différentes tranches en entrée (une covariable).

Dans un autre contexte, une ANCOVA lui a permis d'estimer les effets de programmes pédagogiques différents sur les résultats d’élèves du secondaire, en prenant en compte les résultats scolaires antérieurs et les années de scolarité de leurs parents (des covariables). C'est une technique puissante qui nous permet de faire des comparaisons en évitant de fausser les résultats.

Cette analyse des covariables peut être effectuée dans Minitab à partir de la boîte de dialogue de l’analyse d’un plan factoriel en cliquant sur le bouton COVARIABLES et en double-cliquant sur les variables pour les sélectionner en tant que covariables.

Des cours sur les Plans d'expériences factoriels, Plans d'expériences en surface de réponse, Plans d'expériences appliqués et Formulation et plans de mélange sont proposés par les formateurs de la société Minitab en intra et en inter-entreprises.