Descripción:
Los robots caminantes hexápodos son útiles en entornos con obstáculos comparables a su tamaño. Sin embargo, el problema de locomoción es complejo de resolver dada su alta dimensionalidad y los entornos desconocidos a los que estos robots son sometidos. El aprendizaje por refuerzo se adecúa naturalmente a resolver este problema. Estos algoritmos han alcanzado mucha popularidad al demostrar control equiparable al de un ser humano al resolver tareas específicas. Esta tesis presenta una revisión del desarrollo de robots hexápodos y el aprendizaje por refuerzo. Muestra la convergencia de estas dos líneas de investigación. Se discuten los algoritmos más populares del estado del arte que han resuelto este problema para algunas clases de robots caminantes y se desarrolla la implementación de un algoritmo de aprendizaje profundo por refuerzo que se aplica a todas las capas de la locomoción en un robot hexápodo simulado.