本發(fā)明涉及一種基于強(qiáng)化學(xué)習(xí)的火電燃燒優(yōu)化方法,包括以下步驟:1)獲取火力發(fā)電燃燒過程中的相關(guān)變量,定義Mt={it,st,pt}為t時(shí)刻的數(shù)據(jù)信息;2)構(gòu)建預(yù)測網(wǎng)絡(luò),根據(jù)最近兩次歷史數(shù)據(jù)信息Mt?1、Mt以及下一時(shí)刻的可控輸入it+1預(yù)測下一時(shí)刻的中間狀態(tài)量st+1和性能指標(biāo)pt+1;3)定義St={Mt?2,Mt?1,it}為馬爾科夫決策問題在t時(shí)刻的狀態(tài),以輸入對(duì)應(yīng)的增量矢量作為馬爾科夫決策問題的動(dòng)作At,并且以前后狀態(tài)的線性加權(quán)綜合指標(biāo)KPI的增量ΔCIt作為馬爾科夫決策問題的獎(jiǎng)勵(lì)Rt,并定義狀態(tài)跳轉(zhuǎn);4)采用深度決定性策略梯度對(duì)馬爾科夫決策問題進(jìn)行求解。與現(xiàn)有技術(shù)相比,本發(fā)明具有泛化能力強(qiáng)、普遍適用性、快速響應(yīng)等優(yōu)點(diǎn)。
聲明:
“基于強(qiáng)化學(xué)習(xí)的火電燃燒優(yōu)化方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)