Si es así, entonces podría probar un clasificador con estas 5 componentes y evaluar. Ahora bien, si el clasificador es bueno y quisiera predecir una nueva instancia, este llegará con los 9 atributos (ingresos, g_comunes, etc.), ¿cómo logro pasar esos nuevos datos a 5 dimensiones nuevamente para probar el clasificador? ¿habría que hacer todo el proceso de nuevo?
Saludos
]]>Hola, gracias por escribir!.
Con PCA no podemos “volver” a las features iniciales porque están “entremezcladas”.
Si quieres evaluar las mejores características debes utilizar otras técnicas. Los modelos de árbol de sklearn tienen un atributo llamado “feature_importance” que te ayuda a elegir las mejores. O tienes algunos algoritmos como “SelectKBest” puedes ver un ejemplo de uso en el artículo de Naive Bayes pero aplica a cualquier modelo.
Saludos!
Muchas gracias por anticipado.
]]>Comprendo que el PCA reduce la dimensión de las variables de entrada; pero ¿cómo puedo saber que variables exactamente son las componentes principales que dan la explicación al modelo?
Tengo ciertas dudas con respecto a la aplicación de la PCA en series temporales multivariadas embedding ¿si la aplico afecta a los valores del mes y el día?
]]>Hola Karen, gracias por escribir!
Te comento, en las lineas
Xax=X_pca[:,0]
Yax=X_pca[:,1]
Lo que estoy haciendo es tomar “todos los valores” de las dimensiones 0 y 1 pues son las primeras y -en teoría- las mejores y las uso como variables X e Y para graficar. (También se podrían tomar más dimensiones, según sea conveniente)
Como etiquetas uso 0 => alquilar y 1 => comprar pero podrías usar los valores que a ti te interesen. Realmente se están usando como valores categóricos.
Por ejemplo para ti el valor 2 y 4 podrían significar perros y gatos… depende del problema que estés resolviendo.
Espero haberte ayudado! Saludos
Los valores 0 y 1 a que hacen referencia según el ejemplo? Yo tengo un ejercicio pero tiene los valores 2 y 4 en vez de 0 y 1, se puede trabajar con esta información o hay que pasarlo a valores binarios?
Xax=X_pca[:,0]
Yax=X_pca[:,1]
labels=dataframe[‘comprar’].values
cdict={0:’red’,1:’green’}
labl={0:’Alquilar’,1:’Comprar’}
marker={0:’*’,1:’o’}
alpha={0:.3, 1:.5}
Gracias por el apoyo
]]>Los valores 0 y 1 a que hacen referencia según el ejemplo? Yo tengo un ejercicio pero tiene los valores 2 y 4 en vez de 0 y 1, se puede trabajar con esta información o hay que pasarlo a valores binarios?
Xax=X_pca[:,0]
Yax=X_pca[:,1]
labels=dataframe[‘comprar’].values
cdict={0:’red’,1:’green’}
labl={0:’Alquilar’,1:’Comprar’}
marker={0:’*’,1:’o’}
alpha={0:.3, 1:.5}
Gracias por el apoyo
]]>Hola Leonardo! Muy bueno el foro, desde aquí animo a todos a visitarlo y aprender sobre redes neuronales
]]>