權利要求書: 1.基于多智能體TLBO算法的球磨機制粉優(yōu)化控制方法,包括:建立球磨機制粉控制模型;對基本TLBO算法進行改進,包括教學因子TF的改進,改進之后的教學因子如式(1):式(1)中,令TF最大值TFmax,TFi的初始值設計TF1=1,iter_max表示最大迭代次數(shù),iter表示當前迭代次數(shù);建立控制器的狀態(tài)空間模型,將改進的TLBO算法用于球磨機制粉系統(tǒng)控制器的參數(shù)優(yōu)化。2.根據(jù)權利要求1所述的球磨機制粉優(yōu)化控制方法,其特征在于:基本TLBO算法的改進還包括多智能體構造,構造過程如下:構造多智能體狀態(tài)空間函數(shù):在多智能體系統(tǒng)中當選取未經(jīng)過學習的學員表示為智能體的聯(lián)合狀態(tài)空間S=[s1,s2,…sn],式中:s1~sn是未經(jīng)過學習的學員的多智能體狀態(tài)空間;構造多智能體動作相位:使用聯(lián)合動作相位A=[a1,a2,…an]式中:a1~an為動作相位。3.根據(jù)權利要求2所述的球磨機制粉優(yōu)化控制方法,其特征在于:基本TLBO算法的改進還包括Stackelberg博弈均衡:選取最優(yōu)秀的學員作為領導者,目標函數(shù)為f領導者(x)f領導者(x)=max(U領導者智能體(s,[a1,…an]))式中:ωi(s,[a1,…an])學員群體中領導者智能體i的性能函數(shù),θi(s,[a1,…an])學員群體中領導者智能體i的損失函數(shù),n表示整個學員群體中領導者智能體的個數(shù);最優(yōu)化學員自身收益,目標函數(shù)為f跟隨者(x):f跟隨者(x)=max(U跟隨智能體(s,[a1,…an]))式中:φi(s,[a1,…an])學員群體中跟隨者智能體i的性能函數(shù), 學員群體中跟隨者智能體i的損失函數(shù),k整個學員群體中跟隨者智能體的個數(shù)。4.根據(jù)權利要求2或3所述的球磨機制粉優(yōu)化控制方法,其特征在于:基本TLBO算法的改進還包括改進“學”階段:多智能體TLBO算法依次選中每一個學員,然后挑選一個優(yōu)秀的學員作為比較,基于自學習的學習過程為:式(2)中:Xnew,i,表示第i個學員學習后的狀態(tài)值;Xold,i表示原來的狀態(tài)值;r1,r2表示[0,1]之間的隨機數(shù)。5.根據(jù)權利要求1~4任一項所述的球磨機制粉優(yōu)化控制方法,其特征在于:控制器的狀態(tài)空間模型為:使用TLBO算法多智能體學員對控制器Ka,Kb統(tǒng)一進行編碼:設計多智能體TLBO算法的適應度函
聲明:
“基于多智能體TLBO算法的球磨機制粉優(yōu)化控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)