Programaci?n Din?mica y Aprendizaje por refuerzo-simulaci?n y aplicaci?n a sistemas electromec?nicos

Description: La programaci?n din?mica(DP) y el aprendizaje por refuerzo(RL) son t?cnicas que se utilizan en la b?squeda de soluciones en sistemas de decisi?n secuencial. Una gran parte de los algoritmos usados en el aprendizaje por refuerzo se fundamentan en la programaci?n din?mica, se considera que el aprendizaje por refuerzo es una extensi?n de la programaci?n din?mica que proporciona soluciones sin la necesidad de conocer el modelo de comportamiento del sistema. Se considera que el aprendizaje por refuerzo combina algunas caracter?sticas del control ?ptimo y del control adaptativo para el dise?o de controladores realimentados, es as? que los objetivos de la presente tesina por una parte son determinar el estado de arte, analizar e implementar algoritmos base de programaci?n din?mica y aprendizaje por refuerzo.Y por otra parte, buscar y determinar ?reas en las l?neas de investigaci?n actuales de la DP Y RL en las cuales se pueda realizar contribuciones en miras a desarrollar una tesis doctoral en este campo de la investigaci?n.

Topic: APRENDIZAJE POR REFUERZO
PROGRAMACI?N DIN?MICA
CONTROL ?PTIMO
INFORM?TICA INDUSTRIAL

Get full text: http://repositorio.educacionsuperior.gob.ec/handle/28000/2006