Página principal

Análisis de componentes principales con Python

Implementación a partir de dos ejemplos


Archivo para descargar para obtener el código y los archivos de datos

Cargando el código comprimido y el archivo de datos [carpeta: "PCA_py"]


El programa integral de análisis de componentes principales (PCA) que se presenta aquí está diseñado con el espíritu del análisis de datos exploratorios. Insistimos entonces en el papel fundamental, para las interpretaciones, de las variables adicionales (numéricas o nominales) y de los individuos adicionales.

Este programa independiente no se refiere a los programas PCA existentes. Solo utiliza las tres bibliotecas clásicas de Python NUMPY (para el cálculo de vectores y matrices), PANDAS (para administrar tablas de datos) y MATPLOTLIB (para gráficos).


Aquí hay una muestra de referencias de sitios que desarrollan análisis de componentes principales.
https://towardsdatascience.com/principal-component-analysis-pca-from-scratch-in-python-7f3e2a54
https://medium.com/swlh/principal-component-analysis-from-scratch-in-python-2f139c6420c9
https://www.datacamp.com/community/tutorials/principal-component-analysis-in-python
http://tutoriels-data-mining.blogspot.com/p/acp.html
http://eric.univ-lyon2.fr/~ricco/tanagra/fichiers/fr_Tanagra_ACP_Python.pdf
(este último es el más cercano al espíritu de "Análisis de datos")

  ACP: dos ejemplos y código comentado

Los archivos de ejemplo son archivos de datos semiométricos (puntuaciones de 1 a 7 otorgadas a las palabras por individuos dependiendo de si estas palabras son desagradables o agradables). En ejemplos de tamaño completo, hay 210 palabras y, a veces, varios miles de personas. Los trabajos relacionados con la semiometría se pueden descargar gratuitamente en este sitio.


Haga clic a continuación para obtener la presentación del ACP a partir de dos ejemplos

ACP: Presentación a partir de dos ejemplos y código comentado  



Página principal