本公開公開了一種信息推送方法、裝置、電子設(shè)備及計算機可讀存儲介質(zhì),其中,所述方法包括:當檢測到產(chǎn)生信息時,采集信息對應的特征數(shù)據(jù),根據(jù)特征數(shù)據(jù)生成當前狀態(tài),并根據(jù)推送信息生成第一當前動作;將當前狀態(tài)和第一當前動作輸入線上深度強化學習模型,以使線上深度強化學習模型根據(jù)當前狀態(tài)和第一當前動作獲取推送信息時對應的分值;若推送信息時對應的分值大于預設(shè)分值,則推送信息。本公開通過采集產(chǎn)生的信息對應的特征數(shù)據(jù),根據(jù)特征數(shù)據(jù)生成當前狀態(tài),并根據(jù)推送信息生成第一當前動作,將當前狀態(tài)和第一當前動作輸入線上深度強化學習模型,獲取推送信息時對應的分值,若推送信息時對應的分值大于預設(shè)分值,則推送信息,可以提高推送準確率,從而提高用戶對信息的點擊率。
聲明:
“信息推送方法及裝置” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)