Aprendizaje por Refuerzo
En este artículo aprenderemos qué es el aprendizaje por refuerzo, lo más novedoso y ambicioso a día de hoy en Inteligencia artificial, veremos cómo funciona, sus casos de uso y haremos un ejercicio práctico completo en Python: una máquina que aprenderá a jugar al pong sóla, sin conocer las reglas ni al entorno.
Nuestra Agenda
Los temas que veremos incluyen:
- ¿Qué es el Reinforcement Learning?
- Diferencias con los clásicos
- Componentes
- Casos de Uso
- Y los videojuegos?
- Cómo funciona el RL?
- premios y castigos
- fuerza bruta
- Q-Learning
- Ecuación de Bellman
- Explorar vs Explotar
- El juego del Pong en Python
- Clase Agente
- Clase Environment
- El juego
- La tabla de Políticas
- Conclusiones
- Recursos Adicionales
Comencemos!!
Seguir Leyendo