Sous pression pour économiser de l'électricité, les entreprises industrielles se tournent vers l'analyse de données pour identifier les principales sources de consommation d'énergie. Pour réduire l'utilisation de l'énergie et économiser de l'argent, une solution potentielle consiste à analyser les données de consommation à chaque poste de l'usine.
L'ajustement de variables telles que la vitesse de la machine, le débit, la température ou l'équipement peut faire une grande différence pour un fabricant. La clé est d'être aussi efficace que possible tout en maintenant la qualité globale, et l'une des façons d'y parvenir est d'utiliser la régression par étapes.
La régression pas-à-pas est une analyse appropriée lorsque vous disposez de nombreuses variables et que vous souhaitez identifier un sous-ensemble utile de prédicteurs. Dans Minitab, la procédure de régression pas-à-pas standard ajoute et supprime des prédicteurs les uns après les autres. Minitab arrête son analyse lorsque toutes les variables non incluses dans le modèle présentent des valeurs de p supérieures à une valeur Alpha pour inclure spécifiée et que toutes les variables de ce modèle présentent des valeurs de p inférieures ou égales à une valeur Alpha pour exclure spécifiée.
En plus de la méthode de régression standard, Minitab propose deux autres types de procédures pas-à-pas :
Sélection ascendante : Minitab commence son analyse sans aucun prédicteur dans le modèle, puis ajoute la variable la plus significative à chaque étape. Minitab arrête son analyse lorsque toutes les variables qui ne figurent pas dans le modèle présentent des valeurs de p supérieures à la valeur Alpha pour inclure spécifiée.
Elimination descendante : Minitab commence son analyse avec l'ensemble des prédicteurs dans le modèle, puis supprime la variable la moins significative à chaque étape. Minitab arrête son analyse lorsque toutes les variables incluses dans le modèle présentent des valeurs de p inférieures ou égales à la valeur Alpha pour exclure spécifiée.
Dans cet exemple de régression pas-à-pas utilisée pour identifier les principales sources de consommation d'énergie, les analystes de l'usine de fabrication ont pris en compte les variables de prédicteur suivantes : unités totales produites, durée totale de fonctionnement des équipements, taille de l'équipe, température extérieure moyenne, température extérieure minimale, température extérieure maximale, pourcentage d'ensoleillement et âge moyen des équipements. Il est toutefois important de noter que la régression pas-à-pas peut être particulièrement utile si vous disposez de plus d'une centaine de variables de prédicteur !
Les analystes avaient pour objectif de réduire ces variables à une liste composée des principaux prédicteurs de consommation énergétique. Pour générer un modèle final, ils ont sélectionné Stat > Régression > Pas à pas dans Minitab, puis rempli la boîte de dialogue en saisissant la réponse ‘Energie’ et la liste des prédicteurs ci-dessous.
Cliquez sur Stepwise dans la boîte de dialogue et complétez la boîte de sous-dialogue comme indiqué ci-dessous.
Ils ont obtenu le modèle suivant qui comprenait les prédicteurs correspondant à la durée totale de fonctionnement des équipements, à la température maximale et à l'âge moyen des équipements. Minitab a retiré les autres variables, car leurs valeurs de p étaient supérieures à la valeur ‘Alpha pour inclure’.
Pour accéder aux graphiques résiduels, sélectionnez CTRL E pour rappeler la dernière boîte de dialogue que vous avez remplie, cliquez sur Graphiques et dans la boîte de sous-dialogue, cochez Pareto et sous Graphiques résiduels, sélectionnez Quatre en un comme indiqué ci-dessous.
L'équation de régression ci-dessous indique que la consommation d'énergie augmente au fur et à mesure que la durée totale de fonctionnement des équipements, la température maximale et l'âge moyen des équipements augmentent :
D'après la statistique t, c'est la durée totale de fonctionnement des équipements qui présente l'impact le plus important. Viennent ensuite la température maximale et l'âge moyen des équipements.
Les analystes ont ainsi été en mesure de conclure que le recours intensif à la climatisation est à l'origine de l'augmentation considérable de la consommation d'énergie, qu'il serait possible de réduire en utilisant des équipements plus récents. L'usine pourrait par exemple limiter le fonctionnement des équipements pendant les heures de pointe où la climatisation est constamment utilisée et envisager d'acheter de nouveaux équipements avant l'été.
Si la régression pas-à-pas permet de tirer de nombreux enseignements, il convient d'éviter certains pièges potentiels :
Si vous souhaitez manipuler cet ensemble de données vous-même, téléchargez les données sur Scribd.