LEARNED ESCAPE BEHAVIORS OF A MOBILE ROBOT
Described herein are systems, devices, and methods for controlling a mobile cleaning robot to escape from a stuck state using a learned robot escape behavior model. The model is trained using reinforcement learning at a cloud-computing device or networked devices. A mobile cleaning robot comprises a...
Gespeichert in:
Hauptverfasser: | , , , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Described herein are systems, devices, and methods for controlling a mobile cleaning robot to escape from a stuck state using a learned robot escape behavior model. The model is trained using reinforcement learning at a cloud-computing device or networked devices. A mobile cleaning robot comprises a drive system, a sensor circuit to collect sensor data associated with a detected stuck state, and a controller circuit that can receive the trained robot escape behavior model, and apply the sensor data associated with the detected stuck state to the trained robot escape behavior model to determine an escape policy. The drive system or one or more actuators of the mobile robot can remove the mobile robot from the stuck state according to the determined escape policy.
L'invention concerne des systèmes, des dispositifs et des procédés permettant de commander un robot de nettoyage mobile pour qu'il s'échappe d'un état bloqué à l'aide d'un modèle de comportement d'échappement de robot appris. Le modèle est entraîné à l'aide d'un apprentissage par renforcement au niveau d'un dispositif informatique en nuage ou de dispositifs mis en réseau. Le robot de nettoyage mobile comprend un système d'entraînement, un circuit de capteur pour collecter des données de capteur associées à un état bloqué détecté, et un circuit de commande qui peut recevoir le modèle de comportement d'échappement de robot entraîné et appliquer les données de capteur associées à l'état bloqué détecté au modèle de comportement d'échappement de robot entraîné pour déterminer une politique d'échappement. Le système d'entraînement ou un ou plusieurs actionneurs du robot mobile peuvent faire sortir le robot mobile de l'état bloqué conformément à la politique d'échappement déterminée. |
---|