本發(fā)明公開(kāi)了一種基于視覺(jué)的深度模仿強(qiáng)化學(xué)習(xí)駕駛策略訓(xùn)練方法,包括:構(gòu)建模仿學(xué)習(xí)網(wǎng)絡(luò);訓(xùn)練所述模仿學(xué)習(xí)網(wǎng)絡(luò);對(duì)訓(xùn)練完成的模仿學(xué)習(xí)網(wǎng)絡(luò)進(jìn)行網(wǎng)絡(luò)拆分,獲得感知模塊;構(gòu)建DDPG網(wǎng)絡(luò),獲得控制模塊;通過(guò)所述感知模塊和所述控制模塊,完成深度模仿強(qiáng)化學(xué)習(xí)模型的搭建;訓(xùn)練所述深度模仿強(qiáng)化學(xué)習(xí)模型。所述模仿學(xué)習(xí)網(wǎng)絡(luò)包括5個(gè)卷積層和四個(gè)全連接層,其中卷積層用于提取特征,全連接層用于轉(zhuǎn)向角、油門(mén)和剎車(chē)開(kāi)度的預(yù)測(cè);此外,深度模仿強(qiáng)化學(xué)習(xí)模型訓(xùn)練過(guò)程設(shè)置了獎(jiǎng)勵(lì)函數(shù),保證彎道行駛的舒適性和安全性。
聲明:
“基于視覺(jué)的深度模仿強(qiáng)化學(xué)習(xí)駕駛策略訓(xùn)練方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)