本發(fā)明公開了一種多智能體強化學習滾動調(diào)度方法、裝置、設備及存儲介質,所述方法通過構建高比例新能源電力系統(tǒng)對應日內(nèi)有功的滾動調(diào)度模型;對滾動調(diào)度模型進行多智能體的去中心化部分可觀馬爾科爾夫決策過程建模,獲得多智能體調(diào)度架構;獲取多智能體調(diào)度架構的改進區(qū)域特征聚合圖的注意力網(wǎng)絡,并獲取支持時空多維特征聚合的多智能體強化學習算法,根據(jù)注意力網(wǎng)絡和多智能體強化學習算法構建基于多智能體強化學習的分布式日內(nèi)滾動調(diào)度算法的訓練架構,建模求解速度快,訓練過程簡單,符合電網(wǎng)調(diào)度實際應用場景,提高了多智能體強化學習滾動調(diào)度的準確性,提升了多智能體強化學習滾動調(diào)度的速度和效率。
聲明:
“多智能體強化學習滾動調(diào)度方法、裝置、設備及存儲介質” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)