Programaci?n Din?mica y Aprendizaje por refuerzo-simulaci?n y aplicaci?n a sistemas electromec?nicos

 

Authors
D?az Iza, Henry Pa?l
Format
MasterThesis
Status
publishedVersion
Description

La programaci?n din?mica(DP) y el aprendizaje por refuerzo(RL) son t?cnicas que se utilizan en la b?squeda de soluciones en sistemas de decisi?n secuencial. Una gran parte de los algoritmos usados en el aprendizaje por refuerzo se fundamentan en la programaci?n din?mica, se considera que el aprendizaje por refuerzo es una extensi?n de la programaci?n din?mica que proporciona soluciones sin la necesidad de conocer el modelo de comportamiento del sistema. Se considera que el aprendizaje por refuerzo combina algunas caracter?sticas del control ?ptimo y del control adaptativo para el dise?o de controladores realimentados, es as? que los objetivos de la presente tesina por una parte son determinar el estado de arte, analizar e implementar algoritmos base de programaci?n din?mica y aprendizaje por refuerzo.Y por otra parte, buscar y determinar ?reas en las l?neas de investigaci?n actuales de la DP Y RL en las cuales se pueda realizar contribuciones en miras a desarrollar una tesis doctoral en este campo de la investigaci?n.

Publication Year
2015
Language
spa
Topic
APRENDIZAJE POR REFUERZO
PROGRAMACI?N DIN?MICA
CONTROL ?PTIMO
INFORM?TICA INDUSTRIAL
Repository
Repositorio SENESCYT
Get full text
http://repositorio.educacionsuperior.gob.ec/handle/28000/2006
Rights
openAccess
License