Descripción:
El presente trabajo de tesis presenta el desarrollo e implementación de un algoritmo basado en aprendizaje por refuerzo como controlador en un sistema de control, con la finalidad de realizar trayectorias definidas en 3 ejes (grados de libertad) de una pata robótica que pertenece a un robot hexápodo. Se propone la creación y desarrollo del ambiente basado en el modelo dinámico del sistema electromecánico, cálculo y aproximación de las trayectorias adecuadas y un análisis de los datos obtenidos mediante métricas de evaluación para medir el desempeño del algoritmo ante el sistema. Todo esto con el fin de observar principalmente las capacidades de cómputo del algoritmo, el comportamiento del sistema a lo largo del tiempo (observación de la toma de decisiones) y la viabilidad para trabajos futuros que permitan desarrollar esta línea de investigación para el desarrollo de controladores más robustos, con mayor precisión y que puedan ser aplicados a sistemas cada vez más complejos.