技術(shù)總結(jié)
本發(fā)明公開(kāi)了一種基于隨機(jī)特征子空間的半監(jiān)督文本情感分類方法,包括:1獲取評(píng)論文本數(shù)據(jù)并進(jìn)行預(yù)處理,構(gòu)建全局特征集合;2將所有評(píng)論文本表示成向量形式;3標(biāo)注部分評(píng)論文本,獲得有標(biāo)記樣本集和未標(biāo)記樣本集;4計(jì)算全局特征集合中所有特征詞的特征權(quán)重;5構(gòu)建隨機(jī)子空間;6利用未標(biāo)記樣本進(jìn)行協(xié)同訓(xùn)練,最終得到Z個(gè)分類器;7利用主投票的方式對(duì)Z個(gè)分類器進(jìn)行集成,得到最終的集成分類器。本發(fā)明解決傳統(tǒng)協(xié)同訓(xùn)練算法訓(xùn)練過(guò)程中存在大量誤分的樣本,以及半監(jiān)督文本情感分類方法中各基分類器差異性小的問(wèn)題,從而提高文本情感分類方法的準(zhǔn)確性。
技術(shù)研發(fā)人員:王剛;孫二冬;李寧寧;程八一;何耀耀;汪洋;蔣軍;夏婷婷
受保護(hù)的技術(shù)使用者:合肥工業(yè)大學(xué)
文檔號(hào)碼:201510578418
技術(shù)研發(fā)日:2015.09.11
技術(shù)公布日:2016.11.30