Learning Quadcopter Maneuvers with Concurrent Methods of Policy Optimization
This study presents an aerial robotic application of deep reinforcement learning that imparts an asynchronous learning framework and trust region policy optimization to a simulated quad-rotor helicopter (quadcopter) environment. In particular, we optimized a control policy asynchronously through int...
Gespeichert in:
Veröffentlicht in: | Journal of advanced computational intelligence and intelligent informatics 2017-07, Vol.21 (4), p.639-649 |
---|---|
Hauptverfasser: | , |
Format: | Artikel |
Sprache: | eng |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Schreiben Sie den ersten Kommentar!