L’objectif est de montrer comment une analyse statistique multivariée, plus précisément dans cet article une analyse factorielle, peut être utilisée à l’aide du logiciel d’analyse statistique de données Minitab pour mieux comprendre des données sur le progrès social et le développement économique.
L'analyse factorielle est souvent considérée comme une technique statistique complexe et avancée. Par conséquent, l’auteur de cet article a volontairement choisi un exemple très simple et illustratif. Il est ainsi démontré que l’approche peut être très intuitive, facile à interpréter et accessible ; les calculs effectués sont évidemment très complexes mais ils sont gérés par Minitab.
Les données pour l'analyse factorielle
Des données récentes sur l'obésité, l'alphabétisation, l'espérance de vie, le PIB par habitant, l'accès à Internet et d'autres variables socio‐économiques ont été recueillies auprès de nombreuses sources, y compris l'Organisation Mondiale de la Santé (OMS), l'Economic Intelligence Unit, l'UNICEF, l’ONU, la CIA et d'autres institutions à travers le monde. Cinquante pays ont été couverts dans cette étude.
L'image suivante représente la partie supérieure du classement, soit les données de 19 pays sur 50:
Référence : The SOCIAL PROGRESS INDEX (association à but non lucratif basée aux Etats‐Unis) http://www.socialprogressimperative.org/data/spi
Toutes ces statistiques ont été résumées en trois indices principaux: les besoins humains fondamentaux « est‐ce que le pays couvre les besoins essentiels de sa population ? », le bien‐être « est‐ce que le pays améliore et soutient le bien‐être des communautés et des individus » et les opportunités « est‐ce que le pays offre à tous les individus la possibilité de réaliser leur potentiel ? ». Ces trois indices, regroupés, ont ensuite formé un indice global de progrès social. Sans surprise, des pays tels que la Suède, les Etats‐Unis, le Royaume‐Uni, l'Espagne et la Suisse sont très bien placés dans ce classement.
Nous désirons analyser la façon dont ces variables interagissent. Une relation lie‐t‐elle l'alphabétisation des adultes, la criminalité, l'accès à l'enseignement supérieur, le nombre de décès dus au SIDA ou à des maladies cardio‐vasculaires, etc… et la performance économique d'un pays mesurée ici par le PIB par habitant ? Nous attendons‐nous à ce que la richesse créée dans un pays soit une des conséquences de ses réalisations en termes de progrès social ? Ou l'inverse ? Est‐il suffisant de mettre en place de bonnes conditions en termes de besoins humains fondamentaux, de bien‐être, et d’opportunités de réalisations individuelles, pour générer de la croissance économique dans un pays ?
Les besoins humains fondamentaux, le bien‐être, l’indice d’opportunité et le PIB par habitant en 2011 (en parité de pouvoir d'achat: PPA) seront tous considérés comme des conséquences dans cette étude. Le graphique ci‐dessous illustre des informations plus détaillées sur l’élaboration des indices :
Référence : The SOCIAL PROGRESS INDEX http://www.socialprogressimperative.org/data/sp
Si vous souhaitez en savoir plus, vous trouverez ci‐dessous une liste des variables utilisées pour calculer
la valeur de l’indice «de Bien‐être» :
Référence : The SOCIAL PROGRESS INDEX http://www.socialprogressimperative.org/data/spi.
Pourquoi procéder à une analyse factorielle ?
Nous pouvons raisonnablement nous attendre à ce que ces variables soient corrélées. Ainsi, par exemple, les pays riches ont aussi tendance à atteindre des scores plus élevés en terme de progrès social. Nous désirons identifier les facteurs sous‐jacents, en somme les facteurs cachés derrière les variables mesurées, cela nous aidera à mieux comprendre la structure sous‐jacente de nos données.
Dans le domaine socio‐économique, l’analyse factorielle peut être utilisée pour regrouper de nombreuses variables fortement corrélées entre elles en quelques indices cohérents et homogènes comme les indices d’opportunités, de bien‐être et les besoins de base évoqués ci‐dessus, par exemple.
Dans l’industrie, l’analyse factorielle peut être utilisée pour analyser un grand nombre de variables afin d'évaluer les effets de certains facteurs sous‐jacent qui ne peuvent pas être mesurés directement, qui ne sont pas directement observables, lorsque ceux‐ci influencent certaines variables, elles, facilement mesurables.
Dans les deux cas, notre objectif est de résumer un grand nombre de variables en un nombre restreint de facteurs.
Pour effectuer une analyse factorielle dans Minitab, sélectionnez le sous‐menu > Stat > Multivarié >
Analyse factorielle :
Cliquez sur Graphiques pour sélectionner les graphiques que vous souhaitez créer:
Minitab fournit la représentation graphique suivante :
Le graphique révèle que le PIB par habitant et les opportunités de réalisation sont très liés. Les lignes suivent la même direction, ce qui signifie que ces deux éléments sont fortement corrélés.
Naturellement, plus d’opportunités de réaliser son potentiel réel, plus de droits et de choix personnels, une société plus inclusive, un meilleur accès à l'enseignement supérieur, sont clairement favorables à la création de richesse (PIB). «Besoins humains fondamentaux» et «Bien‐être» sont également positionnés à côté l’un de l'autre. Encore une fois, une même direction pour ces deux lignes signifie que ces deux indices sont fortement corrélés. Nous avons décidé de nommer l'association entre PIB et opportunités pour réaliser son plein potentiel : facteur de «développement économique», et l'association entre Besoins de base et Bien‐être sera nommée facteur de «développement humain» ; sachant toutefois que les intitulés choisis pourraient faire l’objet de longues discussions.
Ces deux ensembles de facteurs sont également corrélés l’un avec l'autre avec des directions à peu près semblables dans le graphique. Cela était prévisible puisque les pays riches ont aussi généralement tendance à atteindre des scores plus élevés en termes de progrès social : le premier facteur, l'axe horizontal du graphique est plus étroitement lié aux besoins de base et au bien‐être, facteur de «développement humain» ; alors que le deuxième facteur (axe vertical) est plus étroitement lié au PIB par habitant et aux opportunités («développement économique»).
Examinons maintenant la façon dont les pays sont positionnés en fonction de ces deux axes factoriels :
Les États‐Unis, le Canada et l'Australie sont très bien positionnés selon l'échelle du second facteur , soit le développement économique élevé ; tandis qu'un groupe de pays européens et asiatiques comme la Suède, Allemagne, Royaume‐Uni, Espagne, Japon est bien positionné par rapport à l'échelle du premier facteur, soit le développement humain élevé. La position idéale est située quelque part près du coin supérieur droit du graphique.
Le groupe des Etats‐Unis, du Canada et de l'Australie, communément appelé le «Nouveau Monde» tend donc à mettre davantage l'accent sur le développement économique et les opportunités personnelles, alors que le second groupe de pays européens et asiatiques avancés, notamment l’Allemagne, la France, la Suisse, la Corée du Sud ; communément appelé «Vieux Monde» tend à mettre davantage l'accent sur le facteur de développement humain.
Notez également la position spécifique des Émirats Arabes Unis, proches du groupe "Nouveau Monde", mais avec des caractéristiques encore plus prononcées comme le bon développement économique, avec un score élevé sur l'échelle du second facteur, mais un développement humain un peu plus faible avec un score relativement faible sur l'échelle du premier facteur par rapport à d'autres pays riches. Ceci est probablement dû à l'abondance des ressources naturelles.
Sur le graphique, un grand nombre de pays africains comme l’Éthiopie, le Mozambique, le Botswana, le Kenya, le Nigeria, entre autres, ont de faibles scores en termes de développement humain, soit le premier facteur. Un autre groupe, y compris la Chine, la Géorgie, l'Égypte, la Jordanie, situés dans le coin inférieur droit ont de faibles scores en termes de développement économique et d’opportunités, soit le second facteur. Sur la base de ces données, nous pourrions en conclure que les priorités en termes de développement, dans ces deux groupes de pays, devraient clairement être différentes.
Conclusion :
L’attention s’est concentrée sur les graphiques de l'analyse factorielle, parce qu'ils sont très intuitifs et faciles à interpréter. Dans cette étude, nous avons effectué une analyse factorielle très simple sur quatre variables seulement.
Chaque fois qu'un très grand nombre de résultats mesurés doit être analysé, l’analyse factorielle peut devenir un outil très puissant et utile, et pas seulement pour les spécialistes des sciences sociales.
La richesse créée dans un pays est‐elle une conséquence ou une cause de ses réalisations en termes de progrès social ? Quel facteur devrait intervenir en premier ? Cette analyse très brève ne permet pas de répondre à cette question, mais nous pouvons observer que ces variables interagissent entre elles et que chaque pays a un profil différent.