本發(fā)明公開了基于深度強化學習的服務(wù)機器人人群感知導航方法及系統(tǒng),包括:獲取智能體的可觀測狀態(tài)和不可觀測狀態(tài);所述智能體,包括服務(wù)機器人和行人;根據(jù)智能體的可觀測狀態(tài)和不可觀測狀態(tài),找到服務(wù)機器人在每個時間步的最優(yōu)導航策略,以實現(xiàn)機器人在n個行人之間導航,并在沒有任何碰撞的情況下到達目標所在地;最優(yōu)導航策略以滿足最大化期望累積獎賞為目標;所述最優(yōu)導航策略包括服務(wù)機器人在每個時間步的動作指令,即在每個時間步服務(wù)機器人需實現(xiàn)的速度。本發(fā)明能夠有效預測行人的未來運動軌跡,進而提升機器人決策水平,實現(xiàn)機器人在人群環(huán)境中的可靠導航。
聲明:
“基于深度強化學習的服務(wù)機器人人群感知導航方法及系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)