本發(fā)明公開了一種基于多智能體強(qiáng)化學(xué)習(xí)和雙層策略分配的多區(qū)域熱電協(xié)調(diào)控制方法,包括:建立多區(qū)域熱電聯(lián)合系統(tǒng)數(shù)字孿生模型;創(chuàng)建多個(gè)區(qū)域智能體,并建立多個(gè)區(qū)域智能體間的通信機(jī)制;設(shè)計(jì)基于多智能體均衡學(xué)習(xí)算法的多區(qū)域均衡控制器,包括獎(jiǎng)勵(lì)函數(shù)、均衡選擇函數(shù)和資格跡的選取;通過多區(qū)域均衡控制器對(duì)各個(gè)區(qū)域進(jìn)行狀態(tài)估計(jì)、更新資格跡、獎(jiǎng)勵(lì)值觀測(cè)和更新狀態(tài)?動(dòng)作值函數(shù)操作后,再進(jìn)行多個(gè)區(qū)域部分信息的交互,在線尋求各區(qū)域最優(yōu)均衡總控制策略;將區(qū)域熱電聯(lián)合系統(tǒng)中每臺(tái)機(jī)組作為一個(gè)機(jī)組智能體,以各機(jī)組的爬升時(shí)間作為一致性變量,采用一致性算法將各區(qū)域總控制策略分配給各個(gè)機(jī)組,實(shí)現(xiàn)區(qū)域內(nèi)各機(jī)組之間的協(xié)調(diào)控制。
聲明:
“多智能體強(qiáng)化學(xué)習(xí)和雙層策略分配的多區(qū)域熱電協(xié)調(diào)控制方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)