Comments on: Comprende Principal Component Analysis

By: Jose M.

Jose M. — Mon, 20 Jul 2020 15:40:34 +0000

Buen artículo. Entonces se puede entender que, para este ejemplo, ¿PCA nos sirve sólo para ver si podemos encontrar alguna separación en nuestros datos reduciendo la dimensionalidad?

Si es así, entonces podría probar un clasificador con estas 5 componentes y evaluar. Ahora bien, si el clasificador es bueno y quisiera predecir una nueva instancia, este llegará con los 9 atributos (ingresos, g_comunes, etc.), ¿cómo logro pasar esos nuevos datos a 5 dimensiones nuevamente para probar el clasificador? ¿habría que hacer todo el proceso de nuevo?

Saludos

By: Na8

Na8 — Wed, 03 Jun 2020 10:24:18 +0000

In reply to MurruM. Hola, gracias por escribir!. Con PCA no podemos "volver" a las features iniciales porque están "entremezcladas". Si quieres evaluar las mejores características debes utilizar otras técnicas. Los modelos de árbol de sklearn tienen un atributo llamado "feature_importance" que te ayuda a elegir las mejores. O tienes algunos algoritmos como "SelectKBest" puedes ver un ejemplo de uso en el artículo de Naive Bayes pero aplica a cualquier modelo. Saludos!

By: MurruM

MurruM — Tue, 02 Jun 2020 17:47:57 +0000

Hola Ignacio, lo primero es que muchas gracias por compartir todo este conocimiento. Una pregunta rápida que no veo contestada en el texto de la entrada del Blog.
Indica que son 5 las columnas que llevan el 85% de la varianza explicada, pero ¿Cómo saber a qué características corresponde del dataframe? ¿Es decir, que columnas son las mejores que debo elegir?

Muchas gracias por anticipado.

By: petter

petter — Wed, 05 Feb 2020 00:13:33 +0000

disculpa, recien entiendo que esas columnas son columnas creadas por una combinacion de las variables originales, la cosa es como relacionamos los componentes a las variables originales. sabes como?

By: petter

petter — Sat, 01 Feb 2020 00:37:29 +0000

hola, una consulta eso de las 5 dimensiones que representan el 85% de la varianza, son necesariamente los 5 columnas del dataset? (ingresos,gastos comunes,pago_coche,pago_otros y ahorros)

By: kalopezs

kalopezs — Sun, 29 Sep 2019 04:08:18 +0000

Hola Juan, te quiero agradecer por tu esfuerzo en explicarnos lo relacionado al Machine Learning en español. He estado practicando con tu blog en estos últimos días y he aprendido bastante.

Comprendo que el PCA reduce la dimensión de las variables de entrada; pero ¿cómo puedo saber que variables exactamente son las componentes principales que dan la explicación al modelo?

Tengo ciertas dudas con respecto a la aplicación de la PCA en series temporales multivariadas embedding ¿si la aplico afecta a los valores del mes y el día?

By: Na8

Na8 — Fri, 01 Mar 2019 09:44:39 +0000

In reply to Karen.

Hola Karen, gracias por escribir!
Te comento, en las lineas
Xax=X_pca[:,0]
Yax=X_pca[:,1]
Lo que estoy haciendo es tomar “todos los valores” de las dimensiones 0 y 1 pues son las primeras y -en teoría- las mejores y las uso como variables X e Y para graficar. (También se podrían tomar más dimensiones, según sea conveniente)
Como etiquetas uso 0 => alquilar y 1 => comprar pero podrías usar los valores que a ti te interesen. Realmente se están usando como valores categóricos.
Por ejemplo para ti el valor 2 y 4 podrían significar perros y gatos… depende del problema que estés resolviendo.
Espero haberte ayudado! Saludos

By: Karen

Karen — Thu, 28 Feb 2019 18:48:29 +0000

Hola Juan Ignacio, muy buen blog, felicitaciones!
Tengo una duda respecto al query:

Los valores 0 y 1 a que hacen referencia según el ejemplo? Yo tengo un ejercicio pero tiene los valores 2 y 4 en vez de 0 y 1, se puede trabajar con esta información o hay que pasarlo a valores binarios?

Xax=X_pca[:,0]
Yax=X_pca[:,1]
labels=dataframe[‘comprar’].values
cdict={0:’red’,1:’green’}
labl={0:’Alquilar’,1:’Comprar’}
marker={0:’*’,1:’o’}
alpha={0:.3, 1:.5}

Gracias por el apoyo

By: Karen

Karen — Thu, 28 Feb 2019 18:37:59 +0000

Hola Leonardo, muy buen blog, felicitaciones!
Tengo una duda respecto al query:

Xax=X_pca[:,0]
Yax=X_pca[:,1]
labels=dataframe[‘comprar’].values
cdict={0:’red’,1:’green’}
labl={0:’Alquilar’,1:’Comprar’}
marker={0:’*’,1:’o’}
alpha={0:.3, 1:.5}

Gracias por el apoyo

By: Na8

Na8 — Fri, 09 Nov 2018 12:03:11 +0000

In reply to Leonardo. Hola Leonardo! Muy bueno el foro, desde aquí animo a todos a visitarlo y aprender sobre redes neuronales