System and method for on-line trajectory optimization based on automatic time warping
The present invention relates to a system and method for on-line trajectory optimization based on automatic time warping that enables simultaneous optimization of time warping for a reference operation together with a physics-based operation of a character, the present invention comprising: defining...
Gespeichert in:
Hauptverfasser: | , , |
---|---|
Format: | Patent |
Sprache: | eng ; kor |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | The present invention relates to a system and method for on-line trajectory optimization based on automatic time warping that enables simultaneous optimization of time warping for a reference operation together with a physics-based operation of a character, the present invention comprising: defining system dynamics taking into account a current operating state of the character and a sampling time; shaping an optimal control problem to track the reference operation on a current time window based on the system dynamics; decoding the optimal control problem through an iterative linear quadratic Gaussian (iLQG) to generate an optimal control policy consisting of an optimal control sequence, an optimal state sequence, and an optimal gain matrix sequence; calculating a feedback joint torque and a feedback sampling time increment for the current operating state and the sampling time based on the optimal control policy; and determining an external force applied to the character and considering the external force together with the feedback joint torque and the feedback sampling time increment to update the current operating state and the sampling time.
본 발명은 캐릭터의 물리 기반 동작과 함께 참조 동작에 대한 타임 워핑(time warping)을 동시에 최적화할 수 있도록 하는 자동 타임 워핑에 기반한 온라인 궤적 최적화 시스템 및 방법에 관한 것으로, 이는 캐릭터 현재 동작 상태 및 샘플링 시간을 고려한 시스템 동역학을 정의하는 단계; 상기 시스템 동역학에 기반하여 현재 시간 윈도우에 대한 참고 동작을 추적하기 위한 최적 제어 문제를 정형화하는 단계; iLQG(iterative Linear Quadratic Gaussian)를 통해 상기 최적 제어 문제를 해독하여, 최적 제어 시퀸스, 최적 상태 시퀀스 및 최적 이득 행렬 시퀀스로 구성되는 최적 제어 정책을 생성하는 단계; 상기 최적 제어 정책을 기반으로 상기 현재 동작 상태와 상기 샘플링 시간에 대한 피드백 관절 토크와 피드백 샘플링 시간 증분을 산출하는 단계; 및 상기 캐릭터에 인가되는 외력을 파악하고, 상기 외력을 상기 피드백 관절 토크 및 상기 피드백 샘플링 시간 증분과 함께 고려하여, 상기 현재 동작 상태와 상기 샘플링 시간을 갱신하는 단계를 포함할 수 있다. |
---|