技術(shù)總結(jié)
本發(fā)明公開了一種通過深度卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行短文本間相似度計(jì)算的方法,目的在于,利用短文本中出現(xiàn)的每一個(gè)詞語計(jì)算短文本間的相似度,使相似度的值計(jì)算的更加準(zhǔn)確,所采用的技術(shù)方案為:1)把若干短文本表示成若干個(gè)矩陣,用相應(yīng)的詞向量依次替換文本中的每個(gè)單詞,得到一個(gè)有序的向量序列,視為一個(gè)矩陣;2)對(duì)兩個(gè)表示目標(biāo)短文本的矩陣生成其相似矩陣;通過對(duì)詞向量之間的余弦相似度進(jìn)行排列,得到其相似矩陣;3)把相似矩陣的行和列平鋪成相同維度;4)把相似矩陣降維成一個(gè)值作為相似度;對(duì)于所有同維度的相似矩陣,通過深度卷積神經(jīng)網(wǎng)絡(luò)對(duì)相似矩陣進(jìn)行訓(xùn)練降維,再通過多層感知機(jī)計(jì)算相似程度,來代表相似度的值。
技術(shù)研發(fā)人員:魏筆凡;郭朝彤;劉均;鄭慶華;吳蓓;鄭元浩;石磊;吳科煒
受保護(hù)的技術(shù)使用者:西安交通大學(xué)
文檔號(hào)碼:201611076255
技術(shù)研發(fā)日:2016.11.29
技術(shù)公布日:2017.05.31