Accueil

Analyse en composantes principales avec Python

Mise en oeuvre à partir de deux exemples


Dossier à télécharger pour obtenir les fichiers codes et données

Chargement du fichier compressé de codes et de données [dossier: "ACP_py"]


Le programme complet d’analyse en composantes principales (ACP) présenté ici est conçu dans l’esprit de l’analyse exploratoire des données. On insiste ainsi sur le rôle fondamental, pour les interprétations, des variables supplémentaires (numériques ou nominales) et des individus supplémentaires.

Ce programme autonome ne se réfère pas à des programmes d’ACP existants. Il n’utilise que les trois bibliothèques python classiques NUMPY (pour le calcul vectoriel et matriciel), PANDAS (pour la gestion des tableaux de données) et MATPLOTLIB (pour les graphiques).


Voici un échantillon de références de sites développant l'analyse en composantes principales.
https://towardsdatascience.com/principal-component-analysis-pca-from-scratch-in-python-7f3e2a54
https://medium.com/swlh/principal-component-analysis-from-scratch-in-python-2f139c6420c9
https://www.datacamp.com/community/tutorials/principal-component-analysis-in-python
http://tutoriels-data-mining.blogspot.com/p/acp.html
http://eric.univ-lyon2.fr/~ricco/tanagra/fichiers/fr_Tanagra_ACP_Python.pdf
(ce dernier est le plus proche de l’esprit « Analyse des Données »)

  ACP: Deux exemples et code commenté

Les fichiers d’exemples sont des fichiers de données sémiométriques (notes de 1 à 7 données à des mots par des individus selon que ces mots sont désagréables ou agréables). Dans les exemples en vraies grandeurs, il y a 210 mots et parfois plusieurs milliers d’individus. Les ouvrages relatifs à la sémiométrie sont en libre chargement sur ce site.


Cliquez ci-dessous pour obtenir la présentation de l'ACP à partir de deux exemples

ACP: Présentation à partir de deux exemples, et code commenté  


Accueil