prueba con un RANDOM_STATE=99 para que obtengas el valor mas alto del accuracy.
]]>Tienes razon men, no lo habia notado se debe de ajustar a los vaores de entrenamiento
]]>Cuando dices “Y ahora hacemos las predicciones -en realidad clasificación- utilizando nuestro «cross validation set», es decir del subconjunto que habíamos apartado. En este caso vemos que los aciertos fueron del 85% pero hay que tener en cuenta que el tamaño de datos era pequeño..”, no veo que escribas:
model.fit(X_train, Y_train)
¿No sería necesario antes de calcular las predicciones y su scoring? De esa manera el modelo no habría aprendido previamente de todo el data set cuando lo hemos hecho .fit() pero con todos los datos.
Gracias
]]>Hola iñaki, en este caso, ya vienen definidos los tipo de sistema operativo como 0,1 y 2 en el archivo csv de entrada. Si hubiéramos definido otros números serían esos. O si hubieran sido cadenas de texto o por ejemplo “a,b,c” habría que convertirlos a valores categóricos. Saludos y gracias por escribir!
]]>