本發(fā)明屬于室內(nèi)定位技術(shù)領(lǐng)域,具體是涉及一種面向異構(gòu)環(huán)境的基于深度強(qiáng)化學(xué)習(xí)的軌跡定位方法。本發(fā)明充分利用了環(huán)境中的觀測(cè)和智能體自身的歷史動(dòng)態(tài)信息,以智能體的位置、環(huán)境中具有設(shè)備異構(gòu)性的RSS向量和過(guò)去n個(gè)時(shí)刻的歷史動(dòng)作為狀態(tài),用于動(dòng)作的選擇。再基于近場(chǎng)條件選擇強(qiáng)于RSS閾值對(duì)應(yīng)的APs,以構(gòu)成選定的APs集合,再根據(jù)集合的大小計(jì)算最終獎(jiǎng)賞值。依據(jù)MDP中設(shè)計(jì)的各要素對(duì)智能體的位置進(jìn)行估計(jì),并以獎(jiǎng)賞值為學(xué)習(xí)導(dǎo)向基于經(jīng)驗(yàn)重放機(jī)制和目標(biāo)網(wǎng)絡(luò)進(jìn)行深度強(qiáng)化學(xué)習(xí)算法的迭代訓(xùn)練。本發(fā)明基于路徑損耗模型得到具有設(shè)備異構(gòu)性的仿真RSS數(shù)據(jù),實(shí)驗(yàn)結(jié)果證明本發(fā)明所提方法能夠?qū)崿F(xiàn)較高的定位精度,并對(duì)處理異構(gòu)RSS數(shù)據(jù)也具有一定的魯棒性。
聲明:
“面向異構(gòu)環(huán)境的基于深度強(qiáng)化學(xué)習(xí)的軌跡定位方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)