本發(fā)明提供了一種多源異構(gòu)數(shù)據(jù)庫語義集成方法,包括如下步驟:①抽取實(shí)體:基于實(shí)體抽取模型從非結(jié)構(gòu)化文本中抽取領(lǐng)域相關(guān)實(shí)體并識別對應(yīng)類別;②概念匹配:根據(jù)對應(yīng)類別與知識圖譜中本體概念進(jìn)行匹配,得到同類別的候選實(shí)體集合;③鄰域匹配:根據(jù)相關(guān)實(shí)體的上下文信息得到對齊實(shí)體圖表示,根據(jù)候選實(shí)體集合在知識圖譜中的領(lǐng)域關(guān)系,得到候選實(shí)體圖表示;④對比決策:通過對對齊實(shí)體圖表示和候選實(shí)體圖表示進(jìn)行對比決策,得到最匹配候選實(shí)體排列作為匹配結(jié)果。本發(fā)明將深度強(qiáng)化學(xué)習(xí)技術(shù)與多源異構(gòu)數(shù)據(jù)庫語義集成相結(jié)合,建立不同形態(tài)下知識之間的語義映射關(guān)系,能更好支撐基于語義集成的語義檢索、智能問答等相關(guān)應(yīng)用。
聲明:
“多源異構(gòu)數(shù)據(jù)庫語義集成方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)