Le Blog Minitab

Utilisation de la régression  pas-à-pas pour expliquer la consommation énergétique d'une usine

Rédigé par Minitab Blog Editor | 21 oct. 2022 16:31:18

Sous pression pour économiser de l'électricité, les entreprises industrielles se tournent vers l'analyse de données pour identifier les principales sources de consommation d'énergie. Pour réduire l'utilisation de l'énergie et économiser de l'argent, une solution potentielle consiste à analyser les données de consommation à chaque poste de l'usine.

L'ajustement de variables telles que la vitesse de la machine, le débit, la température ou l'équipement peut faire une grande différence pour un fabricant. La clé est d'être aussi efficace que possible tout en maintenant la qualité globale, et l'une des façons d'y parvenir est d'utiliser la régression par étapes.

À QUEL MOMENT PRÉCIS EST-IL APPROPRIÉ D'EFFECTUER UNE RÉGRESSION PAS-À-PAS ? 

La régression pas-à-pas est une analyse appropriée lorsque vous disposez de nombreuses variables et que vous souhaitez identifier un sous-ensemble utile de prédicteurs. Dans Minitab, la procédure de régression pas-à-pas standard ajoute et supprime des prédicteurs les uns après les autres. Minitab arrête son analyse lorsque toutes les variables non incluses dans le modèle présentent des valeurs de p supérieures à une valeur Alpha pour inclure spécifiée et que toutes les variables de ce modèle présentent des valeurs de p inférieures ou égales à une valeur Alpha pour exclure spécifiée. 

En plus de la méthode de régression standard, Minitab propose deux autres types de procédures pas-à-pas : 

Sélection ascendante :  Minitab commence son analyse sans aucun prédicteur dans le modèle, puis ajoute la variable la plus significative à chaque étape. Minitab arrête son analyse lorsque toutes les variables qui ne figurent pas dans le modèle présentent des valeurs de p supérieures à la valeur Alpha pour inclure spécifiée. 

Elimination descendante : Minitab commence son analyse avec l'ensemble des prédicteurs dans le modèle, puis supprime la variable la moins significative à chaque étape. Minitab arrête son analyse lorsque toutes les variables incluses dans le modèle présentent des valeurs de p inférieures ou égales à la valeur Alpha pour exclure spécifiée. 

EXEMPLE DE RÉGRESSION PAS-À-PAS 

Dans cet exemple de régression pas-à-pas utilisée pour identifier les principales sources de consommation d'énergie, les analystes de l'usine de fabrication ont pris en compte les variables de prédicteur suivantes : unités totales produites, durée totale de fonctionnement des équipements, taille de l'équipe, température extérieure moyenne, température extérieure minimale, température extérieure maximale, pourcentage d'ensoleillement et âge moyen des équipements. Il est toutefois important de noter que la régression pas-à-pas peut être particulièrement utile si vous disposez de plus d'une centaine de variables de prédicteur ! 

Les analystes avaient pour objectif de réduire ces variables à une liste composée des principaux prédicteurs de consommation énergétique. Pour générer un modèle final, ils ont sélectionné Stat > Régression > Pas à pas dans Minitab, puis rempli la boîte de dialogue en saisissant la réponse ‘Energie’ et la liste des prédicteurs ci-dessous. 

Cliquez sur Stepwise dans la boîte de dialogue et complétez la boîte de sous-dialogue comme indiqué ci-dessous.

Ils ont obtenu le modèle suivant qui comprenait les prédicteurs correspondant à la durée totale de fonctionnement des équipements, à la température maximale et à l'âge moyen des équipements. Minitab a retiré les autres variables, car leurs valeurs de p étaient supérieures à la valeur ‘Alpha pour inclure’. 

Pour accéder aux graphiques résiduels, sélectionnez CTRL E pour rappeler la dernière boîte de dialogue que vous avez remplie, cliquez sur Graphiques et dans la boîte de sous-dialogue, cochez Pareto et sous Graphiques résiduels, sélectionnez Quatre en un comme indiqué ci-dessous.

 

 

L'équation de régression ci-dessous indique que la consommation d'énergie augmente au fur et à mesure que la durée totale de fonctionnement des équipements, la température maximale et l'âge moyen des équipements augmentent : 

D'après la statistique t, c'est la durée totale de fonctionnement des équipements qui présente l'impact le plus important. Viennent ensuite la température maximale et l'âge moyen des équipements. 

Les analystes ont ainsi été en mesure de conclure que le recours intensif à la climatisation est à l'origine de l'augmentation considérable de la consommation d'énergie, qu'il serait possible de réduire en utilisant des équipements plus récents. L'usine pourrait par exemple limiter le fonctionnement des équipements pendant les heures de pointe où la climatisation est constamment utilisée et envisager d'acheter de nouveaux équipements avant l'été. 

PIÈGES DE LA RÉGRESSION PAS-À-PAS 

Si la régression pas-à-pas permet de tirer de nombreux enseignements, il convient d'éviter certains pièges potentiels : 

  • Lorsque deux variables indépendantes sont fortement corrélées, le modèle risque de n'en intégrer qu'une seule, même si les deux sont importantes. 
  • Dans la mesure où la procédure convient à de nombreux modèles, il est possible que le choix des modèles correspondant aux données soit purement le fruit du hasard. 
  • La régression pas-à-pas ne permet pas toujours de générer le modèle présentant la valeur R2 la plus élevée possible pour un nombre donné de prédicteurs. 
  • Des procédures automatiques ne peuvent pas tenir compte des connaissances spécifiques de l'analyste au sujet des données. Par conséquent, le modèle sélectionné risque parfois de ne pas être le plus pratique. 
  • La représentation graphique de chaque prédicteur par rapport à la réponse est souvent trompeuse, car les graphiques ne tiennent pas compte des autres prédicteurs du modèle. 

Si vous souhaitez manipuler cet ensemble de données vous-même, téléchargez les données sur Scribd. 

 

Vous souhaitez développer vos compétences en matière de régression et d'analyse de données afin de découvrir des opportunités d'amélioration, de réduction des coûts ou d'innovation ?