本發(fā)明涉及互聯(lián)網(wǎng)
技術(shù)領(lǐng)域:
,特別涉及一種領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法及裝置。
背景技術(shù):
:隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,用戶在互聯(lián)網(wǎng)上分享的觀點數(shù)據(jù)越來越多。例如,用戶在購物網(wǎng)站發(fā)表的用戶評論、用戶針對某一產(chǎn)品的反饋意見等均為觀點數(shù)據(jù)。其中,用戶分享的觀點數(shù)據(jù)會涉及多個領(lǐng)域,如服裝領(lǐng)域、圖書領(lǐng)域等。為了便于研究或統(tǒng)計各個領(lǐng)域的觀點數(shù)據(jù),通常需要對各個領(lǐng)域的觀點數(shù)據(jù)進行分類。通常,在對某一個領(lǐng)域的觀點數(shù)據(jù)進行分類時,需要先標注該領(lǐng)域中的觀點數(shù)據(jù),并基于標注的觀點數(shù)據(jù)訓練分類器來實現(xiàn)。然而,由于互聯(lián)網(wǎng)中的觀點數(shù)據(jù)所涉及的領(lǐng)域很多,對每個領(lǐng)域的觀點數(shù)據(jù)均進行標注會浪費很多資源,而領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法,可以實現(xiàn)在對某些領(lǐng)域的觀點數(shù)據(jù)不進行標注的情況下,實現(xiàn)對這些領(lǐng)域的觀點數(shù)據(jù)進行分類。以采用SFA(SpectralFeatureAlignment,譜的特征隊列)算法實現(xiàn)領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類為例,相關(guān)技術(shù)在實現(xiàn)領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類時,首先任意選定一個源領(lǐng)域和目標領(lǐng)域,并確定源領(lǐng)域和目標領(lǐng)域的領(lǐng)域特定詞和領(lǐng)域獨立詞。其中,領(lǐng)域特定詞為一個領(lǐng)域所特有的詞,領(lǐng)域獨立詞為連接源領(lǐng)域和目標領(lǐng)域之間的橋梁。然后,在領(lǐng)域特定詞和領(lǐng)域獨立詞之間構(gòu)建一個雙向圖,該雙向圖用來表示領(lǐng)域特定詞和領(lǐng)域獨立詞之間的共現(xiàn)關(guān)系,進而采用SFA算法將雙向圖中聯(lián)系較多的領(lǐng)域特定詞和領(lǐng)域獨立詞分到一個簇中。由于這個簇能夠減小源領(lǐng)域和目標領(lǐng)域的領(lǐng)域特定詞之間的差距,因此,可根據(jù) 這個簇訓練一個分類器,進而通過訓練得到的分類器實現(xiàn)領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類。在實現(xiàn)本發(fā)明的過程中,發(fā)明人發(fā)現(xiàn)相關(guān)技術(shù)至少存在以下問題:相關(guān)技術(shù)在實現(xiàn)領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類時,由于選定的源領(lǐng)域和目標領(lǐng)域所涉及的所有詞并不一定能夠明確被劃分為領(lǐng)域特定詞或領(lǐng)域獨立詞,導致通過相關(guān)技術(shù)提出的領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)對觀點數(shù)據(jù)進行分類的分類結(jié)果并不精準。技術(shù)實現(xiàn)要素:為了解決現(xiàn)有技術(shù)的問題,本發(fā)明實施例提供了一種領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法及裝置。所述技術(shù)方案如下:第一方面,提供了一種領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法,所述方法包括:根據(jù)源領(lǐng)域的文檔與檢索詞之間的關(guān)系,確定源領(lǐng)域檢索詞矩陣;根據(jù)目標領(lǐng)域的文檔與檢索詞之間的關(guān)系,確定目標領(lǐng)域檢索詞矩陣;根據(jù)所述源領(lǐng)域檢索詞矩陣、源領(lǐng)域特定話題矩陣、所述源領(lǐng)域特定話題矩陣的系數(shù)矩陣及所述源領(lǐng)域與所述目標領(lǐng)域之間的樞紐矩陣,確定源領(lǐng)域目標函數(shù);根據(jù)所述目標領(lǐng)域檢索詞矩陣、目標領(lǐng)域特定話題矩陣、所述目標領(lǐng)域特定話題矩陣的系數(shù)矩陣及所述樞紐矩陣,確定目標領(lǐng)域目標函數(shù);根據(jù)所述源領(lǐng)域目標函數(shù)及所述目標領(lǐng)域目標函數(shù),確定總目標函數(shù);分別確定所述總目標函數(shù)中各個參數(shù)的目標值;根據(jù)所述各個參數(shù)的目標值及所述源領(lǐng)域中的已標注觀點數(shù)據(jù),訓練指定分類模型,通過訓練得到的指定分類模型對所述目標領(lǐng)域的觀點數(shù)據(jù)進行分類。第二方面,提供了一種領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類裝置,所述裝置包括:第一確定模塊,用于根據(jù)源領(lǐng)域的文檔與檢索詞之間的關(guān)系,確定源領(lǐng)域檢索詞矩陣;第二確定模塊,用于根據(jù)目標領(lǐng)域的文檔與檢索詞之間的關(guān)系,確定目標領(lǐng)域檢索詞矩陣;第三確定模塊,用于根據(jù)所述源領(lǐng)域檢索詞矩陣、源領(lǐng)域特定話題矩陣、所述源領(lǐng)域特定話題矩陣的系數(shù)矩陣及所述源領(lǐng)域與所述目標領(lǐng)域之間的樞紐矩陣,確定源領(lǐng)域目標函數(shù);第四確定模塊,用于根據(jù)所述目標領(lǐng)域檢索詞矩陣、目標領(lǐng)域特定話題矩陣、所述目標領(lǐng)域特定話題矩陣的系數(shù)矩陣及所述樞紐矩陣,確定目標領(lǐng)域目標函數(shù);第五確定模塊,用于根據(jù)所述源領(lǐng)域目標函數(shù)及所述目標領(lǐng)域目標函數(shù),確定總目標函數(shù);第六確定模塊,用于分別確定所述總目標函數(shù)中各個參數(shù)的目標值;訓練模塊,用于根據(jù)所述各個參數(shù)的目標值及所述源領(lǐng)域中的已標注觀點數(shù)據(jù),訓練指定分類模型;分類模塊,用于通過訓練得到的指定分類模型對所述目標領(lǐng)域的觀點數(shù)據(jù)進行分類。本發(fā)明實施例提供的技術(shù)方案帶來的有益效果是:由于確定的總目標函數(shù)與源領(lǐng)域特定話題矩陣、目標領(lǐng)域特定話題矩陣及表示源領(lǐng)域與目標領(lǐng)域之間的共享話題的樞紐矩陣有關(guān),從而提供一種借助源領(lǐng)域與目標領(lǐng)域之間的共享話題實現(xiàn)領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法。由于共享話題能夠減小源領(lǐng)域與目標領(lǐng)域之間的差異,使得通過該種領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法進行分類時,可以確保分類結(jié)果的準確性。附圖說明為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下, 還可以根據(jù)這些附圖獲得其他的附圖。圖1是本發(fā)明一實施例提供的一種領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法的流程圖;圖2是本發(fā)明另一實施例提供的一種領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法的流程圖;圖3是本發(fā)明另一實施例提供的一種收斂曲線;圖4是本發(fā)明另一實施例提供的一種針對每對領(lǐng)域的差異進行實驗得到的實驗結(jié)果圖;圖5是本發(fā)明另一實施例提供的一種領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類裝置的結(jié)構(gòu)示意圖;圖6是本發(fā)明另一實施例提供的一種服務(wù)器的結(jié)構(gòu)示意圖;圖7是本發(fā)明另一實施例提供的一種終端的結(jié)構(gòu)示意圖。具體實施方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖對本發(fā)明實施方式作進一步地詳細描述。隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,互聯(lián)網(wǎng)上分享的能夠標識用戶感情的觀點數(shù)據(jù)越來越多。例如,當用戶網(wǎng)購成功后,會在評論中發(fā)表對該次購買的商品的評價意見;當某一個用戶發(fā)表博客后,其他用戶對該用戶發(fā)表的內(nèi)容進行的評論等。其中,觀點數(shù)據(jù)可能為貶義的,也可能為褒義的;可能為主觀的,也可能為客觀的等。也就是說,觀點數(shù)據(jù)具有一定的情感極性,觀點數(shù)據(jù)的情感極性包括正向和負向等,研究觀點數(shù)據(jù)的情感極性的過程即為對觀點數(shù)據(jù)進行分類的過程。通過對觀點數(shù)據(jù)的情感極性進行研究,對于指導產(chǎn)品或服務(wù)等生產(chǎn)實踐具有重要的意義,因此,經(jīng)常需要對觀點數(shù)據(jù)進行分類。進一步地,由于互聯(lián)網(wǎng)上包括的觀點數(shù)據(jù)涉及多個不同的領(lǐng)域。為了便于對多個領(lǐng)域的觀點數(shù)據(jù)進行分類,通常會采用領(lǐng)域自適應(yīng)的分類方法。通過領(lǐng) 域自適應(yīng)的分類方法,可以實現(xiàn)在不對某個或某些領(lǐng)域的觀點數(shù)據(jù)進行標注的情況下,實現(xiàn)對這個或者這些領(lǐng)域的觀點數(shù)據(jù)進行分類。本發(fā)明實施例即提供的一種領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法。在本發(fā)明實施例中,源領(lǐng)域中包括一些已標注極性的已標注觀點數(shù)據(jù),而目標領(lǐng)域中可能未包括已標注觀點數(shù)據(jù),通過本發(fā)明實施例提供的方法,可以確定目標領(lǐng)域中任一觀點數(shù)據(jù)的情感極性,從而實現(xiàn)對目標領(lǐng)域的任一觀點數(shù)據(jù)進行分類,具體領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法詳見下述各個實施例:圖1是根據(jù)一示例性實施例提供的一種領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法的流程圖。參見圖1,本發(fā)明實施例提供的方法流程包括:101:根據(jù)源領(lǐng)域的文檔與檢索詞之間的關(guān)系,確定源領(lǐng)域檢索詞矩陣。102:根據(jù)目標領(lǐng)域的文檔與檢索詞之間的關(guān)系,確定目標領(lǐng)域檢索詞矩陣。103:根據(jù)源領(lǐng)域檢索詞矩陣、源領(lǐng)域特定話題矩陣、源領(lǐng)域特定話題矩陣的系數(shù)矩陣及源領(lǐng)域與目標領(lǐng)域之間的樞紐矩陣,確定源領(lǐng)域目標函數(shù)。104:根據(jù)目標領(lǐng)域檢索詞矩陣、目標領(lǐng)域特定話題矩陣、目標領(lǐng)域特定話題矩陣的系數(shù)矩陣及樞紐矩陣,確定目標領(lǐng)域目標函數(shù)。105:根據(jù)源領(lǐng)域目標函數(shù)及目標領(lǐng)域目標函數(shù),確定總目標函數(shù)。106:分別確定總目標函數(shù)中各個參數(shù)的目標值。107:根據(jù)各個參數(shù)的目標值及源領(lǐng)域中的已標注觀點數(shù)據(jù),訓練指定分類模型,通過訓練得到的指定分類模型對目標領(lǐng)域的觀點數(shù)據(jù)進行分類。本發(fā)明實施例提供的方法,由于確定的總目標函數(shù)與源領(lǐng)域特定話題矩陣、目標領(lǐng)域特定話題矩陣及表示源領(lǐng)域與目標領(lǐng)域之間的共享話題的樞紐矩陣有關(guān),從而提供一種借助源領(lǐng)域與目標領(lǐng)域之間的共享話題實現(xiàn)領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法。由于共享話題能夠減小源領(lǐng)域與目標領(lǐng)域之間的差異,使得通過該種領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法進行分類時,可以確保分類結(jié)果的準確性。在另一個實施例中,根據(jù)源領(lǐng)域檢索詞矩陣、源領(lǐng)域特定話題矩陣、源領(lǐng)域特定話題矩陣的系數(shù)矩陣及源領(lǐng)域與目標領(lǐng)域之間的樞紐矩陣,確定源領(lǐng)域目標函數(shù),包括:根據(jù)源領(lǐng)域檢索詞矩陣、源領(lǐng)域特定話題矩陣、源領(lǐng)域特定話題矩陣的系數(shù)矩陣及源領(lǐng)域與目標領(lǐng)域之間的樞紐矩陣,通過以下公式確定源領(lǐng)域目標函數(shù):Os=||Xs-[U0,Us]Vs||F2]]>式中,Os為源領(lǐng)域目標函數(shù),Xs為源領(lǐng)域檢索詞矩陣,U0為樞紐矩陣,Us為源領(lǐng)域特定話題矩陣,Vs為源領(lǐng)域特定話題矩陣的系數(shù)矩陣,表示費羅貝尼烏斯范數(shù);根據(jù)目標領(lǐng)域檢索詞矩陣、目標領(lǐng)域特定話題矩陣、目標領(lǐng)域特定話題矩陣的系數(shù)矩陣及樞紐矩陣,確定目標領(lǐng)域目標函數(shù),包括:根據(jù)目標領(lǐng)域檢索詞矩陣、目標領(lǐng)域特定話題矩陣、目標領(lǐng)域特定話題矩陣的系數(shù)矩陣及樞紐矩陣,通過以下公式確定目標領(lǐng)域目標函數(shù):Ot=||Xt-[U0,Ut]Vt||F2]]>式中,Ot為目標領(lǐng)域目標函數(shù),Xt為目標領(lǐng)域檢索詞矩陣,U0為樞紐矩陣,Ut為目標領(lǐng)域特定話題矩陣,Vt為目標領(lǐng)域特定話題矩陣的系數(shù)矩陣。在另一個實施例中,根據(jù)源領(lǐng)域目標函數(shù)及目標領(lǐng)域目標函數(shù),確定總目標函數(shù),包括:根據(jù)源領(lǐng)域目標函數(shù)及目標領(lǐng)域目標函數(shù),通過如下公式確定總目標函數(shù):Φ=λs||Xs-[U0,Us]Vs||F2+λt||Xt-[U0,Ut]Vt||F2+D(U0,Us,Ut,Us,Vt)]]>D(U0,Us,Ut,Vs,Vt)=α||U0TUs||F2+β||U0TUt||F2+γ||UsTUt||F2+Tr(AU0U0T)+Tr(AUsUST)+Tr(AUtUtT)+Tr(AVsVsT)+Tr(AVtVtT)]]>λs=||Xs||F-2]]>λt=||Xt||F-2]]>式中,Φ為總目標函數(shù),D(U0,Us,Ut,Vs,Vt)為一個正則項,α、β、γ為各個正則化參數(shù),Tr()為矩陣的跡,為通過拉格朗日數(shù)乘法在限制U0(i,j)≥0條件下得到的拉格朗日乘子矩陣,為通過拉格朗日數(shù)乘法在限制Us(i,j)≥0條件下得到的拉格朗日乘子矩陣,為通過拉格朗日數(shù)乘法在限制Ut(i,j)≥0條件下得到的拉格朗日乘子矩陣,為通過拉格朗日數(shù)乘法在限制Vs(i,j)≥0條件下得到的拉格朗日乘子矩陣,為通過拉格朗日數(shù)乘法在限制Vt(i,j)≥0條件下得到的拉格朗日乘子矩陣。在另一個實施例中,分別確定總目標函數(shù)中各個參數(shù)的目標值,包括:分別為各個參數(shù)隨機分配一個非負的值作為各個參數(shù)的初始值;根據(jù)各個參數(shù)的初始值,計算各個參數(shù)的收斂值,將各個參數(shù)的收斂值作為各個參數(shù)的目標值。在另一個實施例中,總目標函數(shù)中的各個參數(shù)包括U0、Us、Ut、Vs和Vt;根據(jù)各個參數(shù)的初始值,計算各個參數(shù)的收斂值,包括:根據(jù)U0的初始值,按照U0m=U0m-1[λsXsHsT+λtXtHtT][λsXs(r)HsT+λtXt(r)Ht+(αUsUsT+βUtUtT)U0]]]>對U0進行迭代計算,直至得到U0的收斂值式中,上一次迭代得到的U0的值,為根據(jù)迭代得到的U0的值,Hs為樞紐矩陣對源領(lǐng)域的系數(shù)矩陣,Ht為樞紐矩陣對目標領(lǐng)域的系數(shù)矩陣,r表示迭代次數(shù);根據(jù)Us的初始值,按照Usm=Usm-1[λsXsLsT][λsXs(r)LsT+(αU0U0T+γUtUtT)Us]]]>對Us進行迭代計算,直至得到Us的收斂值式中,上一次迭代得到的Us的值,為根據(jù)迭代得到的Us的值,Ls為源領(lǐng)域特定話題矩陣的系數(shù)矩陣,Lt為目標領(lǐng)域特定話題矩陣的系數(shù)矩陣;根據(jù)Ut的初始值,按照Utm=Utm-1[λtXtHtT][λtXt(r)HtT+(βU0U0T+γUsUsT)Ut]]]>對Ut進行 迭代計算,直至得到Ut的收斂值式中,上一次迭代得到的Ut的值,為根據(jù)迭代得到的Ut的值;根據(jù)Vs的初始值,按照對Vs進行迭代計算,直至得到Vs的收斂值式中,為上一次迭代得到的Vs的值,為根據(jù)迭代得到的Vs的值;根據(jù)Vt的初始值,按照對Vt進行迭代計算,直至得到Vt的收斂值式中,為上一次迭代得到的Vt的值,為根據(jù)迭代得到的Vt的值。結(jié)合圖1所對應(yīng)實施例的內(nèi)容,圖2是根據(jù)一示例性實施例提供的一種領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法的流程圖。參見圖2,本發(fā)明實施例提供的方法流程包括:201:根據(jù)源領(lǐng)域的文檔與檢索詞之間的關(guān)系,確定源領(lǐng)域檢索詞矩陣。其中,源領(lǐng)域包括一些已標注觀點數(shù)據(jù),還可能包括一些未標注觀點數(shù)據(jù),已標觀點數(shù)據(jù)可以為已標注文檔。對于任一已標注觀點數(shù)據(jù),所標注的數(shù)據(jù)能夠表明該觀點數(shù)據(jù)的情感極性為正向還是負向。例如,如果某一個已標注觀點數(shù)據(jù)為一個已標注文檔,并用“+1”和“-1”分別表示情感極性為正向和負向,如果該已標注文檔的標注數(shù)據(jù)為“+1”,則可以確定該已標注文檔的情感極性為正向。另外,關(guān)于源領(lǐng)域的類型,本發(fā)明實施例不作具體限定。例如,源領(lǐng)域可以為圖書領(lǐng)域、電子領(lǐng)域、服裝領(lǐng)域等。通常,每個領(lǐng)域會包括多個文檔,而每個文檔由至少一個檢索詞組成,因此,對于任一領(lǐng)域,可以通過檢索詞矩陣表示該領(lǐng)域的文檔與檢索詞之間的關(guān)系,從而實現(xiàn)標識該領(lǐng)域的特征。在本發(fā)明實施例中,為了確定源領(lǐng)域中文檔 與檢索詞之間的關(guān)系,以確定源領(lǐng)域的特征,設(shè)定源領(lǐng)域為Xs,源領(lǐng)域中包含的文檔數(shù)為ns個,每個文檔中包含的檢索詞的數(shù)量為m個,在此基礎(chǔ)上,源領(lǐng)域檢索詞矩陣可以表示為:Xs={x1(s),...,xns(s)}.]]>其中,源領(lǐng)域檢索詞矩陣Xs中的每個元素表示對應(yīng)檢索詞的權(quán)重。每個檢索詞的權(quán)重可以根據(jù)源領(lǐng)域的文檔與檢索詞之間的關(guān)系,通過TF-IDF算法求解得到。由于源領(lǐng)域中每個文檔中都包含m個檢索詞,因此,源領(lǐng)域的檢索詞矩陣還表示為即Xs∈Rm×ns.]]>另外,當任一觀點數(shù)據(jù)為文檔時,由于源領(lǐng)域中包含一定數(shù)量的已標注觀點數(shù)據(jù),即源領(lǐng)域中包括一定數(shù)量的已標注文檔,為了便于后續(xù)使用源領(lǐng)域中的已標注觀點數(shù)據(jù)訓練指定分類模型,對于源領(lǐng)域中的已標注文檔,可以通過一個文檔極性矩陣Ys表示各個已標注文檔的情感極性。具體地,Ys可以為一個ns×2的矩陣,ns為源領(lǐng)域中包含的文檔的數(shù)量,2表示文檔的情感極性種類有兩種:一種極性為正向,表示文檔表達的觀點為正向觀點,一種極性為負向,表示文檔表達的觀點為負向觀點。結(jié)合文檔極性矩陣的內(nèi)容,以源領(lǐng)域中的第i個文檔為例,若源領(lǐng)域的第i個文檔對應(yīng)文檔極性矩陣中的元素yi=1,則可確定源領(lǐng)域中第i個文檔的情感極性為正向,即該文檔表達的觀點為正向觀點;若源領(lǐng)域的第i個文檔對應(yīng)的極性矩陣中的元素yi=-1,則確定源領(lǐng)域中第i個文檔的情感極性為負向,即該文檔表達的觀點為負向觀點。當然,上述方式僅以“+1”和“-1”表示文檔的情感極性為例進行了舉例說明,然而,在具體實施時,還可采用其它數(shù)值表示文檔的情感極性,本實施例對此不作具體的限定。202:根據(jù)目標領(lǐng)域的文檔與檢索詞之間的關(guān)系,確定目標領(lǐng)域檢索詞矩陣。其中,目標領(lǐng)域可能未包括已標注觀點數(shù)據(jù)。另外,目標領(lǐng)域可以為圖書領(lǐng)域、電子領(lǐng)域、服裝領(lǐng)域等與源領(lǐng)域不同的領(lǐng)域,本實施例不對目標領(lǐng)域的類型作具體的限定。結(jié)合上述步驟201中的內(nèi)容,為了確定目標領(lǐng)域的文檔與 檢索詞之間的關(guān)系,以確定目標領(lǐng)域的特征,本發(fā)明實施例設(shè)定目標領(lǐng)域為Xt,目標領(lǐng)域中包含的文檔數(shù)為nt個,每個文檔中包含的檢索詞的數(shù)量為m個,則目標領(lǐng)域的檢索詞矩陣可以表示為:Xt={x1(t),...,xnt(t)}.]]>由于目標領(lǐng)域中每個文檔中都包含m個檢索詞,因此,目標領(lǐng)域的檢索詞矩陣還表示為即Xt∈Rm×nt.]]>需要說明的是,上述步驟201和步驟202僅以先確定源領(lǐng)域檢索詞矩陣,再確定目標領(lǐng)域檢索詞矩陣為例進行了說明。然而,在具體實施時,也可以先確定目標領(lǐng)域檢索詞矩陣,再確定源領(lǐng)域檢索詞矩陣;還可以同時確定源領(lǐng)域檢索詞矩陣和目標領(lǐng)域檢索詞矩陣。203:根據(jù)源領(lǐng)域檢索詞矩陣、源領(lǐng)域特定話題矩陣、源領(lǐng)域特定話題矩陣的系數(shù)矩陣及源領(lǐng)域與目標領(lǐng)域之間的樞紐矩陣,確定源領(lǐng)域目標函數(shù)。通常,對于不同類型的領(lǐng)域,往往會有一些領(lǐng)域特定話題。例如,對于電子產(chǎn)品領(lǐng)域,“耐用”和“亮度”即為其領(lǐng)域特定話題。源領(lǐng)域特定話題矩陣為由源領(lǐng)域的領(lǐng)域特定話題組成的矩陣。為了便于說明,本發(fā)明實施例假設(shè)源領(lǐng)域的領(lǐng)域特定話題的數(shù)量為ks,源領(lǐng)域特定話題矩陣為Us,則源領(lǐng)域特定話題矩陣可以表示為:Us=[u1(s),…,uk(s)]。由于源領(lǐng)域中的每個文檔中都包含m個檢索詞,因此,源領(lǐng)域特定話題矩陣還可以表示為即其中,源領(lǐng)域特定話題矩陣中的每一列表示源領(lǐng)域的一個特定話題。另外,源領(lǐng)域和目標領(lǐng)域通常還會包括一些共享話題,源領(lǐng)域和目標領(lǐng)域之間的共享話題為源領(lǐng)域和目標領(lǐng)域都會涉及的話題。例如,源領(lǐng)域為圖書領(lǐng)域,目標領(lǐng)域為服裝領(lǐng)域,“昂貴”、“便宜”等話題在源領(lǐng)域和目標領(lǐng)域都會涉及,因此,“昂貴”、“便宜”等話題可作為源領(lǐng)域與目標領(lǐng)域之間的共享話題。本發(fā)明 實施例通過樞紐矩陣表示源領(lǐng)域與目標領(lǐng)域之間的共享話題。具體地,為了便于說明,本發(fā)明實施例設(shè)定共享話題的數(shù)量為k0,源領(lǐng)域與目標領(lǐng)域之間的樞紐矩陣為U0,則源領(lǐng)域與目標領(lǐng)域之間的樞紐矩陣U0可以表示為:U0=[u1(0),...,uk0(0)].]]>由于源領(lǐng)域和目標領(lǐng)域中的每個文檔中都包含m個檢索詞,因此,樞紐矩陣還可以表示為即其中,樞紐矩陣中的每一列表示源領(lǐng)域和目標領(lǐng)域之間的一個共享話題。結(jié)合上述內(nèi)容,由于源領(lǐng)域特定話題矩陣及樞紐矩陣均為源領(lǐng)域所包括的話題,因此,源領(lǐng)域所包括的話題數(shù)量為k0+ks。另外,在本發(fā)明實施例中,源領(lǐng)域目標函數(shù)可以準確地表示源領(lǐng)域的特征,且源領(lǐng)域目標函數(shù)是后續(xù)步驟中進行領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)進行分類的重要依據(jù),因此,需要確定源領(lǐng)域目標函數(shù)。又由于源領(lǐng)域檢索詞矩陣、源領(lǐng)域特定話題矩陣及樞紐矩陣均可以用于表示源領(lǐng)域的特征,因此,可以根據(jù)源領(lǐng)域檢索詞矩陣、源領(lǐng)域特定話題矩陣、源領(lǐng)域特定話題矩陣的系數(shù)矩陣及源領(lǐng)域與目標領(lǐng)域之間的樞紐矩陣,確定源領(lǐng)域目標函數(shù)。具體地,可以根據(jù)源領(lǐng)域檢索詞矩陣、源領(lǐng)域特定話題矩陣、源領(lǐng)域特定話題矩陣的系數(shù)矩陣及源領(lǐng)域與目標領(lǐng)域之間的樞紐矩陣,通過以下公式確定源領(lǐng)域目標函數(shù):Os=||Xs-[U0,Us]Vs||F2---(1)]]>公式(1)中,Os為源領(lǐng)域目標函數(shù),Xs為源領(lǐng)域檢索詞矩陣,U0為樞紐矩陣,Us為源領(lǐng)域特定話題矩陣,Vs為源領(lǐng)域特定話題矩陣的系數(shù)矩陣,表示費羅貝尼烏斯范數(shù)。上述公式(1)可知,樞紐矩陣、源領(lǐng)域特定話題矩陣、源領(lǐng)域特定話題矩陣的系數(shù)矩陣及源領(lǐng)域檢索詞矩陣是確定源領(lǐng)域目標函數(shù)的關(guān)鍵,因此,在確 定源領(lǐng)域目標函數(shù)之前,需要先確定源領(lǐng)域特定話題矩陣、源領(lǐng)域特定話題矩陣的系數(shù)矩陣及樞紐矩陣。其中,源領(lǐng)域檢索詞矩陣與源領(lǐng)域特定話題矩陣、源領(lǐng)域特定話題矩陣的系數(shù)矩陣及樞紐矩陣之間具有一定的關(guān)系。下面將介紹一下源領(lǐng)域檢索詞矩陣與源領(lǐng)域特定話題矩陣、源領(lǐng)域特定話題矩陣的系數(shù)矩陣及樞紐矩陣之間的關(guān)系。具體地,結(jié)合公式(1),在理想情況下,源領(lǐng)域檢索詞矩陣Xs可以分解得到兩個矩陣,一個矩陣為源領(lǐng)域文檔話題矩陣Vs,一個矩陣為源領(lǐng)域條目話題矩陣Us'。其中,源領(lǐng)域條目話題矩陣Us'為一個m×(ks+k0)階矩陣,即源領(lǐng)域條目話題矩陣Us'中包含的矩陣包括但不限于樞紐矩陣U0和源領(lǐng)域特定話題矩陣Us。源領(lǐng)域文檔話題矩陣Vs為一個ns×(ks+k0)階矩陣,即矩陣中的每一行表示源領(lǐng)域中一個文檔。源領(lǐng)域文檔話題矩陣Vs又可以分解為矩陣Hs和矩陣Ls。其中,Hs為一個ns×k0階矩陣,為樞紐矩陣對源領(lǐng)域的系數(shù)矩陣,用于表示樞紐矩陣在源領(lǐng)域中的權(quán)重大??;Ls為一個ns×ks階矩陣,為源領(lǐng)域特定話題矩陣的系數(shù)矩陣。關(guān)于將源領(lǐng)域的檢索詞矩陣進行分解的方法,包括但不限于采用非負矩陣分解法將源領(lǐng)域檢索詞矩陣進行分解。其中,非負矩陣分解法為在矩陣中所有元素均為非負數(shù)約束條件之下的矩陣分解方法,非負矩陣分解法通過尋找低秩,將矩陣分解成若干個非負的矩陣。實際應(yīng)用中采用非負矩陣分解法分解矩陣的例子有很多,如采用非負矩陣分解數(shù)字圖像中的像素、文本分析中的單詞統(tǒng)計及股票價格等等。非負矩陣分解法的基本思想可以簡單描述為:對于任意給定的一個非負矩陣A,總能找到一個非負矩陣U和一個非負矩陣V,使得非負的矩陣A可以分解成非負矩陣U和V的乘積。利用非負矩陣分解法進行文本、圖像大規(guī)模數(shù)據(jù)的分析,較傳統(tǒng)的處理算法更能描述和刻畫潛在的語義信息。204:根據(jù)目標領(lǐng)域檢索詞矩陣、目標領(lǐng)域特定話題矩陣、目標領(lǐng)域特定話 題矩陣的系數(shù)矩陣及樞紐矩陣,確定目標領(lǐng)域目標函數(shù)。結(jié)合上述步驟203中的內(nèi)容,目標領(lǐng)域的領(lǐng)域特定話題為目標領(lǐng)域所特有的話題,目標領(lǐng)域特定話題矩陣為由目標領(lǐng)域的特定話題組成的矩陣。為了便于說明,本發(fā)明實施例假設(shè)目標領(lǐng)域的領(lǐng)域特定話題的數(shù)量為kt,目標領(lǐng)域特定話題矩陣為Ut,則目標領(lǐng)域特定話題矩陣Ut可以表示為:Ut=[u1(t),…,uk(t)]。由于目標領(lǐng)域中的每個文檔中都包含m個檢索詞,因此,目標領(lǐng)域特定話題矩陣還可以表示為即其中,目標領(lǐng)域特定話題矩陣中的每一列表示目標領(lǐng)域的一個特定話題。結(jié)合上述步驟203中的內(nèi)容,由于目標領(lǐng)域特定話題矩陣及樞紐矩陣均為源領(lǐng)域所包括的話題,因此,目標領(lǐng)域所包括的話題數(shù)量為k0+kt。另外,在本發(fā)明實施例中,目標領(lǐng)域目標函數(shù)可以很好地表示目標領(lǐng)域的特征,又由于目標領(lǐng)域目標函數(shù)是后續(xù)步驟中進行領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類的重要依據(jù),因此,需要確定目標領(lǐng)域目標函數(shù)。又由于目標領(lǐng)域檢索詞矩陣、目標領(lǐng)域特定話題矩陣及樞紐矩陣均可以用于表示目標領(lǐng)域的特征,因此,可以根據(jù)目標領(lǐng)域檢索詞矩陣、目標領(lǐng)域特定話題矩陣、目標領(lǐng)域特定話題矩陣的系數(shù)矩陣及樞紐矩陣,確定目標領(lǐng)域目標函數(shù)。具體地,可以根據(jù)目標領(lǐng)域檢索詞矩陣、目標領(lǐng)域特定話題矩陣、目標領(lǐng)域特定話題矩陣的系數(shù)矩陣及樞紐矩陣,通過以下公式確定目標領(lǐng)域目標函數(shù):Ot=||Xt-[U0,Ut]Vt||F2---(2)]]>公式(2)中,Ot為目標領(lǐng)域目標函數(shù),Xt為目標領(lǐng)域檢索詞矩陣,U0為樞紐矩陣,Ut為目標領(lǐng)域特定話題矩陣,Vt為目標領(lǐng)域特定話題矩陣的系數(shù)矩陣。進一步地,由上述公式(2)可知,樞紐矩陣及目標領(lǐng)域特定話題矩陣是確定目標領(lǐng)域目標函數(shù)的關(guān)鍵,因此,在確定目標領(lǐng)域目標函數(shù)之前,需要先確定樞紐矩陣、目標領(lǐng)域的領(lǐng)域特定話題矩陣。關(guān)于確定樞紐矩陣、目標領(lǐng)域的 領(lǐng)域特定話題矩陣及目標領(lǐng)域特定話題矩陣的系數(shù)矩陣的方法,包括但不限于將目標領(lǐng)域檢索詞矩陣進行分解得到。具體地,結(jié)合公式(2),在理想情況下,目標領(lǐng)域的檢索詞矩陣Xt可以分解得到兩個矩陣,一個矩陣為目標領(lǐng)域文檔話題矩陣Vt,一個矩陣為目標領(lǐng)域條目話題矩陣Ut'。其中,目標領(lǐng)域條目話題矩陣Ut'為一個m×(kt+k0)階矩陣,即目標領(lǐng)域條目話題矩陣Ut'中包含的矩陣包括但不限于樞紐矩陣U0和目標領(lǐng)域特定話題矩陣Ut。目標領(lǐng)域文檔話題矩陣Vt為一個nt×(kt+k0)階矩陣,即矩陣中的每一行表示目標領(lǐng)域中一個文檔。目標領(lǐng)域文檔話題矩陣Vt又可以分解為矩陣Ht和矩陣Lt,其中,Ht為一個nt×k0階矩陣,為樞紐矩陣對目標領(lǐng)域的系數(shù)矩陣,用于表示樞紐矩陣在目標領(lǐng)域中的權(quán)重大小;Lt為一個nt×k0階矩陣,為目標領(lǐng)域特定話題矩陣的系數(shù)矩陣。關(guān)于將目標領(lǐng)域的檢索詞矩陣進行分解的方法,包括但不限于采用非負矩陣分解法將目標領(lǐng)域的檢索詞矩陣進行分解。需要說明的是,本實施例不對上述步驟203和步驟204中執(zhí)行確定源領(lǐng)域目標函數(shù)和確定目標領(lǐng)域目標函數(shù)的先后順序進行限定,具體執(zhí)行時,既可以先確定源領(lǐng)域目標函數(shù),也可以先確定目標領(lǐng)域目標函數(shù),還可以同時確定源領(lǐng)域目標函數(shù)和目標領(lǐng)域目標函數(shù)。205:根據(jù)源領(lǐng)域目標函數(shù)及目標領(lǐng)域目標函數(shù),確定總目標函數(shù)。具體地,在確定總目標函數(shù)時,一個簡單直接的方式就是直接將源領(lǐng)域目標函數(shù)和目標領(lǐng)域目標函數(shù)相加得到。然而,這樣確定總目標函數(shù)時,有一個明顯的缺陷就是無法顯著區(qū)分源領(lǐng)域和目標領(lǐng)域各自的領(lǐng)域空間以及他們共有的領(lǐng)域空間,這將可能導致在獲取源領(lǐng)域的領(lǐng)域特定話題時,沒有限制條件約束其不獲取源領(lǐng)域與目標領(lǐng)域之間的共享話題;在獲取共享話題時,也沒有限制條件約束其不從源領(lǐng)域或目標領(lǐng)域的領(lǐng)域特定話題中獲取。為了克服上述缺陷,本發(fā)明實施例在確定總目標函數(shù)時,在源領(lǐng)域目標函數(shù)與目標領(lǐng)域目標函 數(shù)的基礎(chǔ)上增加了一個正則項。通過該正則項可以克服上述問題。結(jié)合上述內(nèi)容,可以根據(jù)源領(lǐng)域目標函數(shù)及目標領(lǐng)域目標函數(shù),通過如下公式確定總目標函數(shù):Φ=λs||Xs-[U0,Us]Vs||F2+λt||Xt-[U0,Ut]Vt||F2+D(U0,Us,Ut,Us,Vt)---(3)]]>D(U0,Us,Ut,Vs,Vt)=α||U0TUs||F2+β||U0TUt||F2+γ||UsTUt||F2+Tr(AU0U0T)+Tr(AUsUST)+Tr(AUtUtT)+Tr(AVsVsT)+Tr(AVtVtT)---(4)]]>λs=||Xs||F-2]]>λt=||Xt||F-2]]>公式(3)和公式(4)中,Φ為總目標函數(shù),D(U0,Us,Ut,Vs,Vt)為正則項,α、β、γ為各個正則化參數(shù),Tr()為矩陣的跡,為通過拉格朗日數(shù)乘法在限制U0(i,j)≥0條件下得到的拉格朗日乘子矩陣,為通過拉格朗日數(shù)乘法在限制Us(i,j)≥0條件下得到的拉格朗日乘子矩陣,為通過拉格朗日數(shù)乘法在限制Ut(i,j)≥0條件下得到的拉格朗日乘子矩陣,為通過拉格朗日數(shù)乘法在限制Vs(i,j)≥0條件下得到的拉格朗日乘子矩陣,為通過拉格朗日數(shù)乘法在限制Vt(i,j)≥0條件下得到的拉格朗日乘子矩陣,i,j分別表示U0、Us、Ut、Vs和Vt中的任一行和任一列。其中,α=a/(k0*ks),β=a/(k0*kt),γ=a/(ks*kt)。a可以通過交叉驗證法確定。關(guān)于a的具體數(shù)值,本發(fā)明實施例不作具體限定。206:分別為各個參數(shù)隨機分配一個非負的值作為各個參數(shù)的初始值,并根據(jù)各個參數(shù)的初始值,計算各個參數(shù)的收斂值,將各個參數(shù)的收斂值作為各個參數(shù)的目標值。該步驟為分別確定總目標函數(shù)中各個參數(shù)的目標值的具體實現(xiàn)方式。由步驟203和步驟204中的內(nèi)容可得,源領(lǐng)域特定話題矩陣、源領(lǐng)域特定話題矩陣的系數(shù)矩陣及樞紐矩陣可以通過對源領(lǐng)域檢索詞矩陣采用非負矩陣分解法分解 得到,目標領(lǐng)域特定話題矩陣、目標領(lǐng)域特定話題矩陣的系數(shù)矩陣及樞紐矩陣可以通過對目標領(lǐng)域檢索詞矩陣采用非負矩陣分解法分解得到。結(jié)合總目標函數(shù)的表達式,總目標函數(shù)中的各個參數(shù)包括樞紐矩陣U0、源領(lǐng)域特定話題矩陣Us、目標領(lǐng)域特定話題矩陣Ut、源領(lǐng)域特定話題矩陣的系數(shù)矩陣Vs和目標領(lǐng)域特定話題矩陣的系數(shù)矩陣Vt。然而,在通過對源領(lǐng)域檢索詞矩陣Xs和目標領(lǐng)域檢索詞矩陣Xt進行分解以得到各個參數(shù)時,不一定進行一次運算即可得到各個參數(shù)的最優(yōu)分解矩陣,而需要通過迭代計算確定各個參數(shù)的最優(yōu)值。因此,本發(fā)明實施例在確定總目標函數(shù)中各個參數(shù)的目標值時,可以先分別為各個參數(shù)隨機分配一個非負的值作為各個參數(shù)的初始值,并根據(jù)各個參數(shù)的初始值,采用一定的算法對各個參數(shù)進行迭代計算,以得到各個參數(shù)的收斂值,將各個參數(shù)的收斂值作為各個參數(shù)的目標值。其中,由于總目標函數(shù)中各個參數(shù)均為矩陣,因此,在為各個參數(shù)隨機分配一個非負的值時,為各個參數(shù)中的每個元素均隨機分配一個非負值。具體地,在進行迭代計算時,對于不同的參數(shù),迭代計算時所采用的具體算法也不一樣。下面將分別對計算各個參數(shù)的收斂值的方式進行介紹。1、計算樞紐矩陣U0的收斂值:首先,將U0看作未知參數(shù),Us、Ut、Vs和Vt看作已知參數(shù),則總目標函數(shù)Φ關(guān)于U0的一階導數(shù)用公式可以表示為:▿U0Φ=[λs(Xs(r)-Xs)HsT+λt(Xt(r)-Xt)LtT+(αUsUsT+βUtUtT)U0+AU0]---(5)]]>Xs(r)=[U0(r),Us(r)]Hs(r)]]>Xt(r)=[U0(r),Ut(r)]Ht(r)]]>接下來,采用KKT(Karush-Kuhn-Tucke,卡羅需-庫恩-塔克條件)條件和總目標函數(shù)Φ的梯度▽Φ對上述公式(5)進行限定,可以得到:[λs(Xs(r)-Xs)HsT+λt(Xt(r)-Xt)HtT+(αUsUsT+βUtUtT)U0](i,j)U0(i,j)=0---(6).]]>對該公式(6)進行計算,可以得到:U0m=U0m-1[λsXsHsT+λtXtHtT][λsXs(r)HsT+λtXt(r)Ht+(αUsUsT+βUtUtT)U0]---(7)]]>公式(7)中,上一次迭代得到的U0的值,為根據(jù)迭代得到的U0的值,Hs為樞紐矩陣對源領(lǐng)域的系數(shù)矩陣,表示樞紐矩陣在源領(lǐng)域中的權(quán)重大??;Ht為樞紐矩陣對目標領(lǐng)域的系數(shù)矩陣,表示樞紐矩陣在目標領(lǐng)域中的權(quán)重大小;r表示迭代次數(shù),即第r次迭代;表示矩陣點除運算。最后,使用上述公式(7)對U0進行迭代計算,直至得到U0的收斂值其中,在進行第一次迭代計算時,將為U0隨機分配的初始值作為2、計算源領(lǐng)域特定話題矩陣Us的收斂值:首先,將Us看作未知參數(shù),U0、Ut、Vs和Vt看作已知參數(shù),則總目標函數(shù)Φ關(guān)于Us的一階導數(shù)用公式可以表示為:▿UsΦ=2[λs(Xs(r)-Xs)LsT+(αU0U0T+γUtUtT)Us+AUs]]]>接下來,采用KKT條件和總目標函數(shù)Φ的梯度▽Φ對上述式子進行限定,可以得到:Usm=Usm-1[λsXsLsT][λsXs(r)LsT+(αU0U0T+γUtUtT)Us]---(8).]]>公式(8)中,上一次迭代得到的Us的值,為根據(jù)迭代得到的Us的值,Ls為源領(lǐng)域的領(lǐng)域特定話題矩陣的系數(shù)矩陣,Lt為目標領(lǐng)域的領(lǐng)域特定話題矩陣的系數(shù)矩陣。最后,使用上述公式(8)對Us進行迭代計算,直至得到Us的收斂值其中,在進行第一次迭代計算時,將為Us隨機分配的初始值作為3、計算目標領(lǐng)域特定話題矩陣Ut的收斂值:該過程的原理同上述1或2中計算樞紐矩陣U0的收斂值或計算源領(lǐng)域特定話題矩陣Us的收斂值中的原理一致,具體可參見上述1或2中的內(nèi)容。具體地,得到的Ut表達式為:Utm=Utm-1[λtXtHtT][λtXt(r)HtT+(βU0U0T+γUsUsT)Ut]---(9)]]>公式(9)中,上一次迭代得到的Ut的值,為根據(jù)迭代得到的Ut的值。在計算Ut的收斂值時,可以通過上述公式(9)不斷對Ut進行迭代計算,直至得到Ut的收斂值4、計算源領(lǐng)域特定話題矩陣的系數(shù)矩陣Vs的收斂值:該過程的原理同上述1或2中計算樞紐矩陣U0的收斂值或計算源領(lǐng)域特定話題矩陣Us的收斂值中的原理一致,具體可參見上述1或2中的內(nèi)容。具體地,得到的Vs表達式為:Vsm=Vsm-1[U‾sTXs][U‾sTU‾sVs]---(10)]]>公式(10)中,為上一次迭代得到的Vs的值,為根據(jù)迭代得到的Vs的值。具體地,在計算Vs的收斂值時,可以通過上述公式(10)對Vs不斷進行迭代計算,直至得到Vs的收斂值5、計算目標領(lǐng)域特定話題矩陣的系數(shù)矩陣Vt的收斂值:該過程的原理同上述1或2中計算樞紐矩陣U0的收斂值或計算源領(lǐng)域特定話題矩陣Us的收斂值中的原理一致,具體可參見上述1或2中的內(nèi)容。具體地, 得到的Vt表達式為:Vtm=Vtm-1[U‾tTXt][U‾tTU‾tVt]]]>公式(10)中,為上一次迭代得到的Vt的值,為根據(jù)迭代得到的Vt的值。在計算Vt的收斂值時,可以通過上述公式(10)不斷對Vt進行迭代計算,直至得到Vt的收斂值進一步地,為了確保能夠根據(jù)總目標函數(shù)中各個參數(shù)的收斂公式(公式(7)至公式(10))得到各個參數(shù)的收斂值,本發(fā)明實施例提供的方法在按照上述過程確定了各個參數(shù)的收斂公式之后,還將對各個參數(shù)的收斂公式進行了收斂性驗證。為了便于說明,下述將結(jié)合公式(8),以對源領(lǐng)域特定話題矩陣Us的收斂性進行驗證為例進行說明。對于其它參數(shù)的驗證原理同對Us的驗證原理一致,本發(fā)明實施例將不對驗證其它參數(shù)的收斂性的過程進行詳細闡述。具體地,在進行收斂性驗證之前,需要先引入一個定義、兩個引理和一個定理。定義1:假設(shè)F(X,X′)是Φ(X)的一個輔助函數(shù),且Φ(X)≤F(X,X′)當且僅當Φ(X)=F(X,X)時等式成立。引理1:假設(shè)F是Φ的一個輔助函數(shù),Φ是一個非增函數(shù),在此基礎(chǔ)上,有:X(r+1)=argminXF(X,X(r))]]>結(jié)合上述定義1可得:Φ(X(r+1))≤F(X(r+1),X(r))≤F(X(r),X(r))=Φ(X(r))。引理2:假設(shè)表示Φ中包括的所有之和,下述函數(shù)為的一個輔助函數(shù):F(Us,Us(r))=Φ(Us(r))+(Us-Us(r))▿Φ(Us(r))+12(Us-Us(r))2S(Us(r))]]>S(Us(r))=[λsXs(r)LsT+(αU0U0T+γUtUtT)Us(r)][Us(r)]]]>定理1:在上述公式(7)至(10)的基礎(chǔ)上,Φ(U0,Us,Ut,Vs,Vt)是一個非增函數(shù)。證明Us的收斂性如下:因為優(yōu)化總目標函數(shù)的目的是使用輔助函數(shù)最小化Φ(Us),因此,令并使用引理1和引理2,可以得到下述方程:Us(r+1)=Us(r)-[▿Φ(Us(r))/Φ(Us(r))]---(11)]]>而▿Φ(Us(r))=[λs(Xs(r)-Xs)HsT+αU0U0TUs(r)+γUtUtTUs(r)]---(12)]]>使用公式(12)替代引理2中的即可得到公式(8)。另外,在得到總目標函數(shù)中各個參數(shù)的收斂公式后,還可以進一步對各個參數(shù)的復雜度進行分析。在本發(fā)明實施例中,以O(shè)表示各個參數(shù)的復雜度。具體地,結(jié)合上述求解各個參數(shù)的收斂公式的過程可得:在每次迭代中,計算樞紐矩陣U0的復雜度為O(m×n×k0),其中,n=max(ns,nt)。同樣地,在每次迭代中,計算源領(lǐng)域特定話題矩陣Us和目標領(lǐng)域特定話題矩陣Ut的復雜度分別為O(m×ns×ks)和O(m×nt×kt)。在每次迭代中,計算源領(lǐng)域特定話題矩陣的系數(shù)矩陣Vs和目標領(lǐng)域特定話題矩陣的系數(shù)矩陣Vt的復雜度分別為O(m×ns×(k0+ks))和O(m×nt×(k0+kt))。由上述各個參數(shù)的復雜度計算公式可得,整個計算過程的復雜度取決于計算源領(lǐng)域特定話題矩陣的系數(shù)矩陣Vs和目標領(lǐng)域特定話題矩陣的系數(shù)矩陣Vt。需要說明的是,上述步驟206僅以通過公式(7)至(10)確定總目標函數(shù)中各個參數(shù)的目標值為例進行了說明,然而,在具體實施時,在確定總目標函 數(shù)中各個參數(shù)的目標值時,還可以基于交替最小二乘法、有效集法或投影梯度法等,本發(fā)明實施例不對確定各個參數(shù)的目標值的方式進行具體限定。207:根據(jù)各個參數(shù)的目標值及源領(lǐng)域中的已標注觀點數(shù)據(jù),訓練指定分類模型,通過指定分類模型對目標領(lǐng)域的觀點數(shù)據(jù)進行分類。通過上述步驟206可以得到總目標函數(shù)中各個參數(shù)的收斂值,而各個參數(shù)均為能夠標識源領(lǐng)域和目標領(lǐng)域特征的參數(shù),例如,Us為源領(lǐng)域特定話題矩陣,該參數(shù)能夠標識源領(lǐng)域所特有的話題;Ut為目標領(lǐng)域特定話題矩陣,該參數(shù)能夠標識目標領(lǐng)域所特有的話題;U0為樞紐矩陣,該參數(shù)能夠標識源領(lǐng)域和目標領(lǐng)域所共有的話題。也就是說,總目標函數(shù)中的各個參數(shù)能夠標識源領(lǐng)域和目標領(lǐng)域的特征,因此,在得到各個參數(shù)的收斂值之后,可以得到源領(lǐng)域和目標領(lǐng)域的特征。又由于源領(lǐng)域中包括一些已標注觀點數(shù)據(jù),而目標領(lǐng)域可能未包括已標注觀點數(shù)據(jù),因此,可以根據(jù)各個參數(shù)的目標值及源領(lǐng)域中的已標注觀點數(shù)據(jù),訓練指定分類模型,進而可以通過訓練得到的指定分類模型對目標領(lǐng)域的觀點數(shù)據(jù)進行分類。具體地,可以結(jié)合源領(lǐng)域特定話題矩陣Us的收斂值、目標領(lǐng)域特定話題矩陣Ut的收斂值及源領(lǐng)域中的已標注觀點數(shù)據(jù),訓練指定分類模型。關(guān)于根據(jù)總目標函數(shù)中各個參數(shù)的目標值及源領(lǐng)域中的已標注觀點數(shù)據(jù),訓練指定分類模型的過程,本發(fā)明實施例不進行詳細闡述,可以結(jié)合現(xiàn)有的模型訓練方法來實現(xiàn)。進一步地,當訓練得到分類模型后,如果后續(xù)需要對目標領(lǐng)域中的任一文檔進行分類,即需要確定該文檔的情感極性時,可以將該文檔輸入到該訓練得到的指定分類模型,并通過該訓練得到的指定分類模型的輸出確定該文檔的情感極性。具體地,當訓練得到的指定分類模型通過輸出“+1”和“-1”分別表示文檔的情感極性分別為正向和負向時,如果將任一文檔輸入到該訓練得到的指定分類模型中,當該訓練得到的指定分類模型輸出為“+1”,則可以確定該文檔的情 感極性為正向;當該訓練得到的指定分類模型輸出為“-1”,則可以確定該文檔的情感極性為負向。關(guān)于指定分類模型的具體形式,可以有很多種。例如,指定分類模型可以為SVM(SupportVectorMachine,支持向量機)等。需要說明的是,上述實施例僅以選取一個源領(lǐng)域和一個目標領(lǐng)域進行研究為例進行了說明。然而,在具體實施時,源領(lǐng)域和目標領(lǐng)域的數(shù)量也可以為其它數(shù)值??蛇x地,為了驗證通過上述步驟201至步驟207實現(xiàn)領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類時的準確性,本發(fā)明實施例還對上述步驟201至步驟207所提出的方法進行了實驗驗證。具體地,本發(fā)明實施例選取了四個領(lǐng)域進行了實驗驗證。其中,選取的四個領(lǐng)域分別為:圖書領(lǐng)域(B)、DVD(DigitalVersatileDisc,數(shù)字多功能光盤)s領(lǐng)域(D)、電子產(chǎn)品領(lǐng)域(E)、廚房用品領(lǐng)域(K)。在實驗過程中為上述四個領(lǐng)域中的每個觀點數(shù)據(jù)都分配一個觀點標簽。其中,分配的觀點數(shù)據(jù)的標簽為+1或-1。當為某一領(lǐng)域的任一觀點數(shù)據(jù)分配的觀點標簽為+1時,說明該觀點的情感極性為正向;當為某一觀點數(shù)據(jù)分配的觀點標簽為-1時,說明該觀點的情感極性為負向。其中,每個領(lǐng)域包括1000個正向觀點數(shù)據(jù)點和1000個負向觀點數(shù)據(jù),還有一些未標注觀點數(shù)據(jù)。在實現(xiàn)領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類任務(wù)中,能夠構(gòu)建的分類任務(wù)有12個,分別為:D→B,E→B,K→B,K→E,D→E,B→E,B→D,K→D,E→D,B→K,D→K,E→K。其中,箭頭前表示源領(lǐng)域,箭頭后表示目標領(lǐng)域。如表1所示,其示出了一種實驗數(shù)據(jù)的組成情況示意表。表1領(lǐng)域訓練數(shù)據(jù)測試數(shù)據(jù)未標注觀點的數(shù)據(jù)負向數(shù)據(jù)的比例圖書1600400446550%DVD1600400594550%電子產(chǎn)品1600400568150%廚房用品1600400358650%表1中所列的數(shù)據(jù)為選取的四個領(lǐng)域的觀點數(shù)據(jù),其中,每個領(lǐng)域中都包含著訓練數(shù)據(jù)、測試數(shù)據(jù)和未標注觀點的數(shù)據(jù),且每個領(lǐng)域中負向數(shù)據(jù)所占的比例均為每個領(lǐng)域數(shù)據(jù)的50%。由于在構(gòu)建的12個分類任務(wù)中,每個領(lǐng)域既可以是源領(lǐng)域也可以是目標領(lǐng)域,當所選領(lǐng)域作為源領(lǐng)域時,領(lǐng)域中的訓練數(shù)據(jù)用于構(gòu)建指定分類模型,當所選領(lǐng)域作為目標領(lǐng)域時,領(lǐng)域中的測試數(shù)據(jù)用于對訓練得到的指定分類模型進行測試。因此,為了保證實驗的準確性,本發(fā)明實施例中為各個領(lǐng)域設(shè)定相同數(shù)量的訓練數(shù)據(jù)及測試數(shù)據(jù),如表1所示,每個領(lǐng)域中的訓練數(shù)據(jù)為1600個,測試數(shù)據(jù)為400個。為了直觀地展現(xiàn)采用本實施例提供的方法在領(lǐng)域自適應(yīng)觀點數(shù)據(jù)分類中的優(yōu)越性,在選取了四個領(lǐng)域的觀點數(shù)據(jù)進行實驗時,還選取了基準算法(baseline)、SCL(StructuralCorrespondenceLearning,結(jié)構(gòu)對應(yīng)學習)、MCT(Multi-labelConsensusTraining,多標記共識培訓)、SFA(SpectralFeatureAlignment,譜的特征隊列)、SDA(StackedDenoisingAuto-encoders,每層去噪自動編碼)、CODA(Chenetal.[2011]proposedastate-Of-the-artDomainAdaptation)和PJNMF(LinkingHeterogeneousInputFeaturesviaPivotsviaJointNon-negativeMatrixFactor-ization,基于非負矩陣分解的通過樞紐連接不同輸入特征的算法),其中,PJNMF即為本發(fā)明實施例所提供的方法。如表2所示,其示出了一種通過各種不同的算法進行分類得到的分類結(jié)果示意表。表2任務(wù)基本法SCLMCTSFASDACODAPJNMFB→D76.41±0.3178.68±0.2678.92±0.2380.58±0.1881.12±0.1780.64±0.1681.85±0.17E→D71.95±0.1975.51±0.2772.67±0.3576.02±0.1276.63±0.2576.10±0.2377.35±0.20K→D73.35±0.2076.88±0.2974.05±0.2876.55±0.1676.85±0.2876.62±0.2178.62±0.28D→B73.8±0.2478.27±0.1875.67±0.3077.58±0.2378.22±0.3377.83±0.1779.27±0.25E→B72.14±0.2675.06±0.2172.90±0.2775.38±0.2775.50±0.1975.46±0.2576.30±0.22K→B71.25±0.1873.08±0.2474.01±0.3174.15±0.3474.47±0.2575.41±0.2275.87±0.23B→E71.75±0.3275.21±0.1875.62±0.2675.35±0.2675.77±0.2776.34±0.1876.28±0.27D→E72.38±0.2075.95±0.2576.82±0.3477.13±0.2377.65±0.2277.94±0.2077.86±0.24K→E83.35±0.1385.18±0.1584.24±0.2585.01±0.2384.65±0.3484.50±0.3285.92±0.32B→K74.44±0.3077.06±0.2178.31±0.2278.28±0.2578.54±0.2378.35±0.2679.15±0.29D→K75.11±0.3378.96±0.1980.57±0.2480.35±0.2980.77±0.3180.65±0.2481.26±0.33E→K85.11±0.1385.08±0.1685.33±0.2685.91±0.1987.25±0.2086.08±0.2786.37±0.21平均值75.09±0.2377.91±0.2077.43±0.2878.52±0.2378.95±0.2578.83±0.2379.68±0.25其中,表2中的數(shù)據(jù)采用“準確性±標準偏差”的數(shù)據(jù)形式,表2中的加粗數(shù)據(jù)表示采用這些算法得到的最好的實驗結(jié)果。由表2中的數(shù)據(jù)可得,本發(fā)明實施例提出的PJNMF方法在所有的12個任務(wù)中均表現(xiàn)良好,而且?guī)缀踉谒腥蝿?wù)中的分類結(jié)果均比其它算法所計算得到的分類結(jié)果好。進一步地,本發(fā)明實施例還對本發(fā)明實施例提供的方法的收斂性進行了分析,圖3示出了一種收斂曲線。該收斂曲線基于訓練數(shù)據(jù)、并采用本發(fā)明實施例提供的方法得到。圖3中的X軸表示迭代次數(shù),Y軸表示總目標函數(shù)的值。由圖3可得,采用本發(fā)明實施例提供的方法所得到的總目標函數(shù)能夠很快收斂,通常,當?shù)螖?shù)不超過200次時即可使該總目標函數(shù)收斂。另外,本發(fā)明實施例還進一步研究了源領(lǐng)域與目標領(lǐng)域之間的相似性。實驗表明,A-distance(A-距離)可以用于標識兩個領(lǐng)域之間的差別。假設(shè)A-distance=2(1-2ε),ε表示訓練得到的指定模型的基本誤差(例如,步驟207中訓練得到的SVM基本誤差。圖4示出了一種針對每對領(lǐng)域的差異進行實驗得到的實驗結(jié)果圖。圖4中的橫軸為使用詞袋數(shù)據(jù)求得的A-distance的值,縱軸為通過本發(fā)明實施例提供的PJNMF方法求得的A-distance的值。實驗結(jié)果表明,通過本發(fā)明實施例提供的方法,A-distance呈現(xiàn)增加的趨勢,進一步證明了通過本發(fā)明實施例提供的方法確定總目標函數(shù)中的各個參數(shù)時,能夠確保在獲取源領(lǐng)域或目標領(lǐng)域的領(lǐng)域特定話題時,僅在源領(lǐng)域或目標領(lǐng)域所特有的話題中獲 取,而不至于獲取到源領(lǐng)域和目標領(lǐng)域之間的共享話題;而在獲取樞紐話題時,僅在源領(lǐng)域和目標領(lǐng)域之間的共享話題中獲取,而不會從源領(lǐng)域的領(lǐng)域特定話題或目標領(lǐng)域的領(lǐng)域特定話題中獲取。本發(fā)明實施例提供的方法,由于確定的總目標函數(shù)與源領(lǐng)域特定話題矩陣、目標領(lǐng)域特定話題矩陣及表示源領(lǐng)域與目標領(lǐng)域之間的共享話題的樞紐矩陣有關(guān),從而提供一種借助源領(lǐng)域與目標領(lǐng)域之間的共享話題實現(xiàn)領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法。由于共享話題能夠減小源領(lǐng)域與目標領(lǐng)域之間的差異,使得通過該種領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法進行分類時,可以確保分類結(jié)果的準確性。圖5是根據(jù)一示例性實施例提供的一種領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類裝置的結(jié)構(gòu)示意圖,該領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類裝置可以用于執(zhí)行上述圖1或圖2所對應(yīng)實施例提供的領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法。參見圖5,該領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類裝置包括:第一確定模塊501,用于根據(jù)源領(lǐng)域的文檔與檢索詞之間的關(guān)系,確定源領(lǐng)域檢索詞矩陣;第二確定模塊502,用于根據(jù)目標領(lǐng)域的文檔與檢索詞之間的關(guān)系,確定目標領(lǐng)域檢索詞矩陣;第三確定模塊503,用于根據(jù)源領(lǐng)域檢索詞矩陣、源領(lǐng)域特定話題矩陣、源領(lǐng)域特定話題矩陣的系數(shù)矩陣及源領(lǐng)域與目標領(lǐng)域之間的樞紐矩陣,確定源領(lǐng)域目標函數(shù);第四確定模塊504,用于根據(jù)目標領(lǐng)域檢索詞矩陣、目標領(lǐng)域特定話題矩陣、目標領(lǐng)域特定話題矩陣的系數(shù)矩陣及樞紐矩陣,確定目標領(lǐng)域目標函數(shù);第五確定模塊505,用于根據(jù)源領(lǐng)域目標函數(shù)及目標領(lǐng)域目標函數(shù),確定總目標函數(shù);第六確定模塊506,用于分別確定總目標函數(shù)中各個參數(shù)的目標值;訓練模塊507,用于根據(jù)各個參數(shù)的目標值及源領(lǐng)域中的已標注觀點數(shù)據(jù),訓練指定分類模型;分類模塊508,用于通過訓練得到的指定分類模型對目標領(lǐng)域的觀點數(shù)據(jù)進行分類。本發(fā)明實施例提供的裝置,由于確定的總目標函數(shù)與源領(lǐng)域特定話題矩陣、目標領(lǐng)域特定話題矩陣及表示源領(lǐng)域與目標領(lǐng)域之間的共享話題的樞紐矩陣有關(guān),從而提供一種借助源領(lǐng)域與目標領(lǐng)域之間的共享話題實現(xiàn)領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法。由于共享話題能夠減小源領(lǐng)域與目標領(lǐng)域之間的差異,使得通過該種領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法進行分類時,可以確保分類結(jié)果的準確性。在另一個實施例中,第三確定模塊503,用于根據(jù)源領(lǐng)域檢索詞矩陣、源領(lǐng)域特定話題矩陣、源領(lǐng)域特定話題矩陣的系數(shù)矩陣及源領(lǐng)域與目標領(lǐng)域之間的樞紐矩陣,通過以下公式確定源領(lǐng)域目標函數(shù):Os=||Xs-[U0,Us]Vs||F2]]>式中,Os為源領(lǐng)域目標函數(shù),Xs為源領(lǐng)域檢索詞矩陣,U0為所述樞紐矩陣,Us為源領(lǐng)域特定話題矩陣,Vs為源領(lǐng)域特定話題矩陣的系數(shù)矩陣,表示費羅貝尼烏斯范數(shù);第四確定模塊504,用于根據(jù)目標領(lǐng)域檢索詞矩陣、目標領(lǐng)域特定話題矩陣、目標領(lǐng)域特定話題矩陣的系數(shù)矩陣及樞紐矩陣,通過以下公式確定目標領(lǐng)域目標函數(shù):Ot=||Xt-[U0,Ut]Vt||F2]]>式中,Ot為目標領(lǐng)域目標函數(shù),Xt為目標領(lǐng)域檢索詞矩陣,U0為樞紐矩陣,Ut為目標領(lǐng)域特定話題矩陣,Vt為目標領(lǐng)域特定話題矩陣的系數(shù)矩陣。在另一個實施例中,第五確定模塊505,用于根據(jù)源領(lǐng)域目標函數(shù)及目標領(lǐng)域目標函數(shù),通過如下公式確定總目標函數(shù):Φ=λs||Xs-[U0,Us]Vs||F2+λt||Xt-[U0,Ut]Vt||F2+D(U0,Us,Ut,Us,Vt)]]>D(U0,Us,Ut,Vs,Vt)=α||U0TUs||F2+β||U0TUt||F2+γ||UsTUt||F2+Tr(AU0U0T)+Tr(AUsUST)+Tr(AUtUtT)+Tr(AVsVsT)+Tr(AVtVtT)]]>λs=||Xs||F-2]]>λt=||Xt||F-2]]>式中,Φ為總目標函數(shù),D(U0,Us,Ut,Vs,Vt)為一個正則項,α、β、γ為各個正則化參數(shù),Tr()為矩陣的跡,為通過拉格朗日數(shù)乘法在限制U0(i,j)≥0條件下得到的拉格朗日乘子矩陣,為通過拉格朗日數(shù)乘法在限制Us(i,j)≥0條件下得到的拉格朗日乘子矩陣,為通過拉格朗日數(shù)乘法在限制Ut(i,j)≥0條件下得到的拉格朗日乘子矩陣,為通過拉格朗日數(shù)乘法在限制Vs(i,j)≥0條件下得到的拉格朗日乘子矩陣,為通過拉格朗日數(shù)乘法在限制Vt(i,j)≥0條件下得到的拉格朗日乘子矩陣。在另一個實施例中,第六確定模塊506包括:分配單元,用于分別為各個參數(shù)隨機分配一個非負的值作為各個參數(shù)的初始值;計算單元,用于根據(jù)各個參數(shù)的初始值,計算各個參數(shù)的收斂值,將各個參數(shù)的收斂值作為各個參數(shù)的目標值。在另一個實施例中,總目標函數(shù)中的各個參數(shù)包括U0、Us、Ut、Vs和Vt;計算單元用于:根據(jù)U0的初始值,按照U0m=U0m-1[λsXsHsT+λtXtHtT][λsXs(r)HsT+λtXt(r)Ht+(αUsUsT+βUtUtT)U0]]]>對U0進行迭代計算,直至得到U0的收斂值式中,上一次迭代得到的U0的值,為根據(jù)迭代得到的U0的值,Hs為樞紐矩陣對源領(lǐng)域的系數(shù)矩陣,Ht為樞紐矩陣對目標領(lǐng)域的系數(shù)矩陣,r表示迭代次數(shù);根據(jù)Us的初始值,按照Usm=Usm-1[λsXsLsT][λsXs(r)LsT+(αU0U0T+γUtUtT)Us]]]>對Us進行迭代計算,直至得到Us的收斂值式中,上一次迭代得到的Us的值,為根據(jù)迭代得到的Us的值,Ls為源領(lǐng)域特定話題矩陣的系數(shù)矩陣,Lt為目標領(lǐng)域特定話題矩陣的系數(shù)矩陣;根據(jù)Ut的初始值,按照Utm=Utm-1[λtXtHtT][λtXt(r)HtT+(βU0U0T+γUsUsT)Ut]]]>對Ut進行迭代計算,直至得到Ut的收斂值式中,上一次迭代得到的Ut的值,為根據(jù)迭代得到的Ut的值;根據(jù)Vs的初始值,按照對Vs進行迭代計算,直至得到Vs的收斂值式中,為上一次迭代得到的Vs的值,為根據(jù)迭代得到的Vs的值;根據(jù)Vt的初始值,按照對Vt進行迭代計算,直至得到Vt的收斂值式中,為上一次迭代得到的Vt的值,為根據(jù)迭代得到的Vt的值。圖6是根據(jù)一示例性實施例示出的一種服務(wù)器的結(jié)構(gòu)示意圖。該服務(wù)器可以用于執(zhí)行上述圖1或圖2所對應(yīng)實施例提供的領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法。參照圖6,服務(wù)器600包括處理組件622,其進一步包括一個或多個處理器,以及由存儲器632所代表的存儲器資源,用于存儲可由處理組件622的執(zhí)行的指令,例如應(yīng)用程序。存儲器632中存儲的應(yīng)用程序可以包括一個或一個以上的每一個對應(yīng)于一組指令的模塊。此外,處理組件622被配置為執(zhí)行指令,以 執(zhí)行上述圖1或圖2所對應(yīng)實施例提供的領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法。服務(wù)器600還可以包括一個電源組件626被配置為執(zhí)行服務(wù)器600的電源管理,一個有線或無線網(wǎng)絡(luò)接口650被配置為將服務(wù)器600連接到網(wǎng)絡(luò),和一個輸入輸出(I/O)接口658。服務(wù)器600可以操作基于存儲在存儲器632的操作系統(tǒng),例如WindowsServerTM,MacOSXTM,UnixTM,LinuxTM,F(xiàn)reeBSDTM或類似。其中,一個或者一個以上程序存儲于存儲器中,且經(jīng)配置以由一個或者一個以上處理器執(zhí)行,所述一個或者一個以上程序包含用于進行以下操作的指令:根據(jù)源領(lǐng)域的文檔與檢索詞之間的關(guān)系,確定源領(lǐng)域檢索詞矩陣;根據(jù)目標領(lǐng)域的文檔與檢索詞之間的關(guān)系,確定目標領(lǐng)域檢索詞矩陣;根據(jù)源領(lǐng)域檢索詞矩陣、源領(lǐng)域特定話題矩陣、源領(lǐng)域特定話題矩陣的系數(shù)矩陣及源領(lǐng)域與目標領(lǐng)域之間的樞紐矩陣,確定源領(lǐng)域目標函數(shù);根據(jù)目標領(lǐng)域檢索詞矩陣、目標領(lǐng)域特定話題矩陣、目標領(lǐng)域特定話題矩陣的系數(shù)矩陣及樞紐矩陣,確定目標領(lǐng)域目標函數(shù);根據(jù)源領(lǐng)域目標函數(shù)及目標領(lǐng)域目標函數(shù),確定總目標函數(shù);分別確定總目標函數(shù)中各個參數(shù)的目標值;根據(jù)各個參數(shù)的目標值及源領(lǐng)域中的已標注觀點數(shù)據(jù),訓練指定分類模型,通過訓練得到的指定分類模型對目標領(lǐng)域的觀點數(shù)據(jù)進行分類。假設(shè)上述為第一種可能的實施方式,則在第一種可能的實施方式作為基礎(chǔ)而提供的第二種可能的實施方式中,服務(wù)器的存儲器中,還包含用于執(zhí)行以下操作的指令:根據(jù)源領(lǐng)域檢索詞矩陣、源領(lǐng)域特定話題矩陣、源領(lǐng)域特定話題矩陣的系數(shù)矩陣及源領(lǐng)域與目標領(lǐng)域之間的樞紐矩陣,確定源領(lǐng)域目標函數(shù),包括:根據(jù)源領(lǐng)域檢索詞矩陣、源領(lǐng)域特定話題矩陣、源領(lǐng)域特定話題矩陣的系數(shù)矩陣及源領(lǐng)域與目標領(lǐng)域之間的樞紐矩陣,通過以下公式確定源領(lǐng)域目標函數(shù):Os=||Xs-[U0,Us]Vs||F2]]>式中,Os為源領(lǐng)域目標函數(shù),Xs為源領(lǐng)域檢索詞矩陣,U0為所述樞紐矩陣,Us為源領(lǐng)域特定話題矩陣,Vs為源領(lǐng)域特定話題矩陣的系數(shù)矩陣,表示費羅貝尼烏斯范數(shù);根據(jù)目標領(lǐng)域檢索詞矩陣、目標領(lǐng)域特定話題矩陣、目標領(lǐng)域特定話題矩陣的系數(shù)矩陣及樞紐矩陣,確定目標領(lǐng)域目標函數(shù),包括:根據(jù)目標領(lǐng)域檢索詞矩陣、目標領(lǐng)域特定話題矩陣、目標領(lǐng)域特定話題矩陣的系數(shù)矩陣及樞紐矩陣,通過以下公式確定目標領(lǐng)域目標函數(shù):Ot=||Xt-[U0,Ut]Vt||F2]]>式中,Ot為目標領(lǐng)域目標函數(shù),Xt為目標領(lǐng)域檢索詞矩陣,U0為樞紐矩陣,Ut為目標領(lǐng)域特定話題矩陣,Vt為目標領(lǐng)域特定話題矩陣的系數(shù)矩陣。在第二種可能的實施方式作為基礎(chǔ)而提供的第三種可能的實施方式中,服務(wù)器的存儲器中,還包含用于執(zhí)行以下操作的指令:根據(jù)源領(lǐng)域目標函數(shù)及目標領(lǐng)域目標函數(shù),確定總目標函數(shù),包括:根據(jù)源領(lǐng)域目標函數(shù)及目標領(lǐng)域目標函數(shù),通過如下公式確定總目標函數(shù):Φ=λs||Xs-[U0,Us]Vs||F2+λt||Xt-[U0,Ut]Vt||F2+D(U0,Us,Ut,Us,Vt)]]>D(U0,Us,Ut,Vs,Vt)=α||U0TUs||F2+β||U0TUt||F2+γ||UsTUt||F2+Tr(AU0U0T)+Tr(AUsUST)+Tr(AUtUtT)+Tr(AVsVsT)+Tr(AVtVtT)]]>λs=||Xs||F-2]]>λt=||Xt||F-2]]>式中,Φ為總目標函數(shù),D(U0,Us,Ut,Vs,Vt)為一個正則項,α、β、γ為各個正則化參數(shù),Tr()為矩陣的跡,為通過拉格朗日數(shù)乘法在限制U0(i,j)≥0條件下得到的拉格朗日乘子矩陣,為通過拉格朗日數(shù)乘法在限制Us(i,j)≥0條件下得到的拉格朗日乘子矩陣,為通過拉格朗日數(shù)乘法在限制Ut(i,j)≥0條件下得到的拉格朗日乘子矩陣,為通過拉格朗日數(shù)乘法在限制Vs(i,j)≥0 條件下得到的拉格朗日乘子矩陣,為通過拉格朗日數(shù)乘法在限制Vt(i,j)≥0條件下得到的拉格朗日乘子矩陣。在第一種或第三種可能的實施方式作為基礎(chǔ)而提供的第四種可能的實施方式中,服務(wù)器的存儲器中,還包含用于執(zhí)行以下操作的指令:分別確定總目標函數(shù)中各個參數(shù)的目標值,包括:分別為各個參數(shù)隨機分配一個非負的值作為各個參數(shù)的初始值;根據(jù)各個參數(shù)的初始值,計算各個參數(shù)的收斂值,將各個參數(shù)的收斂值作為各個參數(shù)的目標值。在第四種可能的實施方式作為基礎(chǔ)而提供的第五種可能的實施方式中,服務(wù)器的存儲器中,還包含用于執(zhí)行以下操作的指令:總目標函數(shù)中的各個參數(shù)包括U0、Us、Ut、Vs和Vt;根據(jù)各個參數(shù)的初始值,計算各個參數(shù)的收斂值,包括:根據(jù)U0的初始值,按照U0m=U0m-1[λsXsHsT+λtXtHtT][λsXs(r)HsT+λtXt(r)Ht+(αUsUsT+βUtUtT)U0]]]>對U0進行迭代計算,直至得到U0的收斂值式中,上一次迭代得到的U0的值,為根據(jù)迭代得到的U0的值,Hs為樞紐矩陣對源領(lǐng)域的系數(shù)矩陣,Ht為樞紐矩陣對目標領(lǐng)域的系數(shù)矩陣,r表示迭代次數(shù);根據(jù)Us的初始值,按照Usm=Usm-1[λsXsLsT][λsXs(r)LsT+(αU0U0T+γUtUtT)Us]]]>對Us進行迭代計算,直至得到Us的收斂值式中,上一次迭代得到的Us的值,為根據(jù)迭代得到的Us的值,Ls為源領(lǐng)域特定話題矩陣的系數(shù)矩陣,Lt為目標領(lǐng)域特定話題矩陣的系數(shù)矩陣;根據(jù)Ut的初始值,按照Utm=Utm-1[λtXtHtT][λtXt(r)HtT+(βU0U0T+γUsUsT)Ut]]]>對Ut進行迭代計算,直至得到Ut的收斂值式中,上一次迭代得到的Ut的值, 為根據(jù)迭代得到的Ut的值;根據(jù)Vs的初始值,按照對Vs進行迭代計算,直至得到Vs的收斂值式中,為上一次迭代得到的Vs的值,為根據(jù)迭代得到的Vs的值;根據(jù)Vt的初始值,按照對Vt進行迭代計算,直至得到Vt的收斂值式中,為上一次迭代得到的Vt的值,為根據(jù)迭代得到的Vt的值。本發(fā)明實施例提供的服務(wù)器,由于確定的總目標函數(shù)與源領(lǐng)域特定話題矩陣、目標領(lǐng)域特定話題矩陣及表示源領(lǐng)域與目標領(lǐng)域之間的共享話題的樞紐矩陣有關(guān),從而提供一種借助源領(lǐng)域與目標領(lǐng)域之間的共享話題實現(xiàn)領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法。由于共享話題能夠減小源領(lǐng)域與目標領(lǐng)域之間的差異,使得通過該種領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法進行分類時,可以確保分類結(jié)果的準確性。圖7是根據(jù)一示例性實施例提供的一種終端的結(jié)構(gòu)示意圖,該終端可以用于執(zhí)行上述圖1或圖2所對應(yīng)實施例提供的領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法。具體來講:終端700可以包括RF(RadioFrequency,射頻)電路110、包括有一個或一個以上計算機可讀存儲介質(zhì)的存儲器120、輸入單元130、顯示單元140、傳感器150、音頻電路160、WiFi(WirelessFidelity,無線保真)模塊170、包括有一個或者一個以上處理核心的處理器180、以及電源190等部件。本領(lǐng)域技術(shù)人員可以理解,圖7中示出的終端結(jié)構(gòu)并不構(gòu)成對終端的限定,可以包括比圖示更多或更少的部件,或者組合某些部件,或者不同的部件布置。其中:RF電路110可用于收發(fā)信息或通話過程中,信號的接收和發(fā)送,特別地,將基站的下行信息接收后,交由一個或者一個以上處理器180處理;另外,將涉及上行的數(shù)據(jù)發(fā)送給基站。通常,RF電路110包括但不限于天線、至少一個放大器、調(diào)諧器、一個或多個振蕩器、用戶身份模塊(SIM)卡、收發(fā)信機、耦合器、LNA(LowNoiseAmplifier,低噪聲放大器)、雙工器等。此外,RF電路110還可以通過無線通信與網(wǎng)絡(luò)和其他設(shè)備通信。所述無線通信可以使用任一通信標準或協(xié)議,包括但不限于GSM(GlobalSystemofMobilecommunication,全球移動通訊系統(tǒng))、GPRS(GeneralPacketRadioService,通用分組無線服務(wù))、CDMA(CodeDivisionMultipleAccess,碼分多址)、WCDMA(WidebandCodeDivisionMultipleAccess,寬帶碼分多址)、LTE(LongTermEvolution,長期演進)、電子郵件、SMS(ShortMessagingService,短消息服務(wù))等。存儲器120可用于存儲軟件程序以及模塊,處理器180通過運行存儲在存儲器120的軟件程序以及模塊,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理。存儲器120可主要包括存儲程序區(qū)和存儲數(shù)據(jù)區(qū),其中,存儲程序區(qū)可存儲操作系統(tǒng)、至少一個功能所需的應(yīng)用程序(比如聲音播放功能、圖像播放功能等)等;存儲數(shù)據(jù)區(qū)可存儲根據(jù)終端700的使用所創(chuàng)建的數(shù)據(jù)(比如音頻數(shù)據(jù)、電話本等)等。此外,存儲器120可以包括高速隨機存取存儲器,還可以包括非易失性存儲器,例如至少一個磁盤存儲器件、閃存器件、或其他易失性固態(tài)存儲器件。相應(yīng)地,存儲器120還可以包括存儲器控制器,以提供處理器180和輸入單元130對存儲器120的訪問。輸入單元130可用于接收輸入的數(shù)字或字符信息,以及產(chǎn)生與用戶設(shè)置以及功能控制有關(guān)的鍵盤、鼠標、操作桿、光學或者軌跡球信號輸入。具體地,輸入單元130可包括觸敏表面131以及其他輸入設(shè)備132。觸敏表面131,也稱為觸摸顯示屏或者觸控板,可收集用戶在其上或附近的觸摸操作(比如用戶使用手指、觸筆等任何適合的物體或附件在觸敏表面131上或在觸敏表面131附近的操作),并根據(jù)預先設(shè)定的程式驅(qū)動相應(yīng)的連接裝置。可選的,觸敏表面131 可包括觸摸檢測裝置和觸摸控制器兩個部分。其中,觸摸檢測裝置檢測用戶的觸摸方位,并檢測觸摸操作帶來的信號,將信號傳送給觸摸控制器;觸摸控制器從觸摸檢測裝置上接收觸摸信息,并將它轉(zhuǎn)換成觸點坐標,再送給處理器180,并能接收處理器180發(fā)來的命令并加以執(zhí)行。此外,可以采用電阻式、電容式、紅外線以及表面聲波等多種類型實現(xiàn)觸敏表面131。除了觸敏表面131,輸入單元130還可以包括其他輸入設(shè)備132。具體地,其他輸入設(shè)備132可以包括但不限于物理鍵盤、功能鍵(比如音量控制按鍵、開關(guān)按鍵等)、軌跡球、鼠標、操作桿等中的一種或多種。顯示單元140可用于顯示由用戶輸入的信息或提供給用戶的信息以及終端700的各種圖形用戶接口,這些圖形用戶接口可以由圖形、文本、圖標、視頻和其任意組合來構(gòu)成。顯示單元140可包括顯示面板141,可選的,可以采用LCD(LiquidCrystalDisplay,液晶顯示器)、OLED(OrganicLight-EmittingDiode,有機發(fā)光二極管)等形式來配置顯示面板141。進一步的,觸敏表面131可覆蓋顯示面板141,當觸敏表面131檢測到在其上或附近的觸摸操作后,傳送給處理器180以確定觸摸事件的類型,隨后處理器180根據(jù)觸摸事件的類型在顯示面板141上提供相應(yīng)的視覺輸出。雖然在圖7中,觸敏表面131與顯示面板141是作為兩個獨立的部件來實現(xiàn)輸入和輸入功能,但是在某些實施例中,可以將觸敏表面131與顯示面板141集成而實現(xiàn)輸入和輸出功能。終端700還可包括至少一種傳感器150,比如光傳感器、運動傳感器以及其他傳感器。具體地,光傳感器可包括環(huán)境光傳感器及接近傳感器,其中,環(huán)境光傳感器可根據(jù)環(huán)境光線的明暗來調(diào)節(jié)顯示面板141的亮度,接近傳感器可在終端700移動到耳邊時,關(guān)閉顯示面板141和/或背光。作為運動傳感器的一種,重力加速度傳感器可檢測各個方向上(一般為三軸)加速度的大小,靜止時可檢測出重力的大小及方向,可用于識別手機姿態(tài)的應(yīng)用(比如橫豎屏切換、相關(guān)游戲、磁力計姿態(tài)校準)、振動識別相關(guān)功能(比如計步器、敲擊)等;至于終端700還可配置的陀螺儀、氣壓計、濕度計、溫度計、紅外線傳感器等其他 傳感器,在此不再贅述。音頻電路160、揚聲器161,傳聲器162可提供用戶與終端700之間的音頻接口。音頻電路160可將接收到的音頻數(shù)據(jù)轉(zhuǎn)換后的電信號,傳輸?shù)綋P聲器161,由揚聲器161轉(zhuǎn)換為聲音信號輸出;另一方面,傳聲器162將收集的聲音信號轉(zhuǎn)換為電信號,由音頻電路160接收后轉(zhuǎn)換為音頻數(shù)據(jù),再將音頻數(shù)據(jù)輸出處理器180處理后,經(jīng)RF電路110以發(fā)送給比如另一終端,或者將音頻數(shù)據(jù)輸出至存儲器120以便進一步處理。音頻電路160還可能包括耳塞插孔,以提供外設(shè)耳機與終端700的通信。WiFi屬于短距離無線傳輸技術(shù),終端700通過WiFi模塊170可以幫助用戶收發(fā)電子郵件、瀏覽網(wǎng)頁和訪問流式媒體等,它為用戶提供了無線的寬帶互聯(lián)網(wǎng)訪問。雖然圖7示出了WiFi模塊170,但是可以理解的是,其并不屬于終端700的必須構(gòu)成,完全可以根據(jù)需要在不改變發(fā)明的本質(zhì)的范圍內(nèi)而省略。處理器180是終端700的控制中心,利用各種接口和線路連接整個手機的各個部分,通過運行或執(zhí)行存儲在存儲器120內(nèi)的軟件程序和/或模塊,以及調(diào)用存儲在存儲器120內(nèi)的數(shù)據(jù),執(zhí)行終端700的各種功能和處理數(shù)據(jù),從而對手機進行整體監(jiān)控??蛇x的,處理器180可包括一個或多個處理核心;優(yōu)選的,處理器180可集成應(yīng)用處理器和調(diào)制解調(diào)處理器,其中,應(yīng)用處理器主要處理操作系統(tǒng)、用戶界面和應(yīng)用程序等,調(diào)制解調(diào)處理器主要處理無線通信??梢岳斫獾氖?,上述調(diào)制解調(diào)處理器也可以不集成到處理器180中。終端700還包括給各個部件供電的電源190(比如電池),優(yōu)選的,電源可以通過電源管理系統(tǒng)與處理器180邏輯相連,從而通過電源管理系統(tǒng)實現(xiàn)管理充電、放電、以及功耗管理等功能。電源190還可以包括一個或一個以上的直流或交流電源、再充電系統(tǒng)、電源故障檢測電路、電源轉(zhuǎn)換器或者逆變器、電源狀態(tài)指示器等任意組件。盡管未示出,終端700還可以包括攝像頭、藍牙模塊等,在此不再贅述。具體在本實施例中,終端的顯示單元是觸摸屏顯示器,終端還包括有存儲器, 以及一個或者一個以上的程序,其中一個或者一個以上程序存儲于存儲器中,且經(jīng)配置以由一個或者一個以上處理器執(zhí)行。所述一個或者一個以上程序包含用于執(zhí)行以下操作的指令:根據(jù)源領(lǐng)域的文檔與檢索詞之間的關(guān)系,確定源領(lǐng)域檢索詞矩陣;根據(jù)目標領(lǐng)域的文檔與檢索詞之間的關(guān)系,確定目標領(lǐng)域檢索詞矩陣;根據(jù)源領(lǐng)域檢索詞矩陣、源領(lǐng)域特定話題矩陣、源領(lǐng)域特定話題矩陣的系數(shù)矩陣及源領(lǐng)域與目標領(lǐng)域之間的樞紐矩陣,確定源領(lǐng)域目標函數(shù);根據(jù)目標領(lǐng)域檢索詞矩陣、目標領(lǐng)域特定話題矩陣、目標領(lǐng)域特定話題矩陣的系數(shù)矩陣及樞紐矩陣,確定目標領(lǐng)域目標函數(shù);根據(jù)源領(lǐng)域目標函數(shù)及目標領(lǐng)域目標函數(shù),確定總目標函數(shù);分別確定總目標函數(shù)中各個參數(shù)的目標值;根據(jù)各個參數(shù)的目標值及源領(lǐng)域中的已標注觀點數(shù)據(jù),訓練指定分類模型,通過訓練得到的指定分類模型對目標領(lǐng)域的觀點數(shù)據(jù)進行分類。假設(shè)上述為第一種可能的實施方式,則在第一種可能的實施方式作為基礎(chǔ)而提供的第二種可能的實施方式中,終端的存儲器中,還包含用于執(zhí)行以下操作的指令:根據(jù)源領(lǐng)域檢索詞矩陣、源領(lǐng)域特定話題矩陣、源領(lǐng)域特定話題矩陣的系數(shù)矩陣及源領(lǐng)域與目標領(lǐng)域之間的樞紐矩陣,確定源領(lǐng)域目標函數(shù),包括:根據(jù)源領(lǐng)域檢索詞矩陣、源領(lǐng)域特定話題矩陣、源領(lǐng)域特定話題矩陣的系數(shù)矩陣及源領(lǐng)域與目標領(lǐng)域之間的樞紐矩陣,通過以下公式確定源領(lǐng)域目標函數(shù):Os=||Xs-[U0,Us]Vs||F2]]>式中,Os為源領(lǐng)域目標函數(shù),Xs為源領(lǐng)域檢索詞矩陣,U0為所述樞紐矩陣,Us為源領(lǐng)域特定話題矩陣,Vs為源領(lǐng)域特定話題矩陣的系數(shù)矩陣,表示費羅貝尼烏斯范數(shù);根據(jù)目標領(lǐng)域檢索詞矩陣、目標領(lǐng)域特定話題矩陣、目標領(lǐng)域特定話題矩 陣的系數(shù)矩陣及樞紐矩陣,確定目標領(lǐng)域目標函數(shù),包括:根據(jù)目標領(lǐng)域檢索詞矩陣、目標領(lǐng)域特定話題矩陣、目標領(lǐng)域特定話題矩陣的系數(shù)矩陣及樞紐矩陣,通過以下公式確定目標領(lǐng)域目標函數(shù):Ot=||Xt-[U0,Ut]Vt||F2]]>式中,Ot為目標領(lǐng)域目標函數(shù),Xt為目標領(lǐng)域檢索詞矩陣,U0為樞紐矩陣,Ut為目標領(lǐng)域特定話題矩陣,Vt為目標領(lǐng)域特定話題矩陣的系數(shù)矩陣。在第二種可能的實施方式作為基礎(chǔ)而提供的第三種可能的實施方式中,終端的存儲器中,還包含用于執(zhí)行以下操作的指令:根據(jù)源領(lǐng)域目標函數(shù)及目標領(lǐng)域目標函數(shù),確定總目標函數(shù),包括:根據(jù)源領(lǐng)域目標函數(shù)及目標領(lǐng)域目標函數(shù),通過如下公式確定總目標函數(shù):Φ=λs||Xs-[U0,Us]Vs||F2+λt||Xt-[U0,Ut]Vt||F2+D(U0,Us,Ut,Us,Vt)]]>D(U0,Us,Ut,Vs,Vt)=α||U0TUs||F2+β||U0TUt||F2+γ||UsTUt||F2+Tr(AU0U0T)+Tr(AUsUST)+Tr(AUtUtT)+Tr(AVsVsT)+Tr(AVtVtT)]]>λs=||Xs||F-2]]>λt=||Xt||F-2]]>式中,Φ為總目標函數(shù),D(U0,Us,Ut,Vs,Vt)為一個正則項,α、β、γ為各個正則化參數(shù),Tr()為矩陣的跡,為通過拉格朗日數(shù)乘法在限制U0(i,j)≥0條件下得到的拉格朗日乘子矩陣,為通過拉格朗日數(shù)乘法在限制Us(i,j)≥0條件下得到的拉格朗日乘子矩陣,為通過拉格朗日數(shù)乘法在限制Ut(i,j)≥0條件下得到的拉格朗日乘子矩陣,為通過拉格朗日數(shù)乘法在限制Vs(i,j)≥0條件下得到的拉格朗日乘子矩陣,為通過拉格朗日數(shù)乘法在限制Vt(i,j)≥0條件下得到的拉格朗日乘子矩陣。在第一種或第三種可能的實施方式作為基礎(chǔ)而提供的第四種可能的實施方式中,終端的存儲器中,還包含用于執(zhí)行以下操作的指令:分別確定總目標函數(shù)中各個參數(shù)的目標值,包括:分別為各個參數(shù)隨機分配一個非負的值作為各個參數(shù)的初始值;根據(jù)各個參數(shù)的初始值,計算各個參數(shù)的收斂值,將各個參數(shù)的收斂值作為各個參數(shù)的目標值。在第四種可能的實施方式作為基礎(chǔ)而提供的第五種可能的實施方式中,終端的存儲器中,還包含用于執(zhí)行以下操作的指令:總目標函數(shù)中的各個參數(shù)包括U0、Us、Ut、Vs和Vt;根據(jù)各個參數(shù)的初始值,計算各個參數(shù)的收斂值,包括:根據(jù)U0的初始值,按照U0m=U0m-1[λsXsHsT+λtXtHtT][λsXs(r)HsT+λtXt(r)Ht+(αUsUsT+βUtUtT)U0]]]>對U0進行迭代計算,直至得到U0的收斂值式中,上一次迭代得到的U0的值,為根據(jù)迭代得到的U0的值,Hs為樞紐矩陣對源領(lǐng)域的系數(shù)矩陣,Ht為樞紐矩陣對目標領(lǐng)域的系數(shù)矩陣,r表示迭代次數(shù);根據(jù)Us的初始值,按照Usm=Usm-1[λsXsLsT][λsXs(r)LsT+(αU0U0T+γUtUtT)Us]]]>對Us進行迭代計算,直至得到Us的收斂值式中,上一次迭代得到的Us的值,為根據(jù)迭代得到的Us的值,Ls為源領(lǐng)域特定話題矩陣的系數(shù)矩陣,Lt為目標領(lǐng)域特定話題矩陣的系數(shù)矩陣;根據(jù)Ut的初始值,按照Utm=Utm-1[λtXtHtT][λtXt(r)HtT+(βU0U0T+γUsUsT)Ut]]]>對Ut進行迭代計算,直至得到Ut的收斂值式中,上一次迭代得到的Ut的值,為根據(jù)迭代得到的Ut的值;根據(jù)Vs的初始值,按照對Vs進行迭代計算,直至得到Vs的收斂值式中,為上一次迭代得到的Vs的值,為根據(jù)迭代得到的Vs的值;根據(jù)Vt的初始值,按照對Vt進行迭代計算,直至得到Vt的收斂值式中,為上一次迭代得到的Vt的值,為根據(jù)迭代得到的Vt的值。本發(fā)明實施例提供的終端,由于確定的總目標函數(shù)與源領(lǐng)域特定話題矩陣、目標領(lǐng)域特定話題矩陣及表示源領(lǐng)域與目標領(lǐng)域之間的共享話題的樞紐矩陣有關(guān),從而提供一種借助源領(lǐng)域與目標領(lǐng)域之間的共享話題實現(xiàn)領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法。由于共享話題能夠減小源領(lǐng)域與目標領(lǐng)域之間的差異,使得通過該種領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法進行分類時,可以確保分類結(jié)果的準確性。本發(fā)明實施例提供了一種計算機可讀存儲介質(zhì),該計算機可讀存儲介質(zhì)可以是上述實施例中的存儲器中所包含的計算機可讀存儲介質(zhì);也可以是單獨存在,未裝配入終端中的計算機可讀存儲介質(zhì)。該計算機可讀存儲介質(zhì)存儲有一個或者一個以上程序,該一個或者一個以上程序被一個或者一個以上的處理器用來執(zhí)行領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法,該方法包括:根據(jù)源領(lǐng)域的文檔與檢索詞之間的關(guān)系,確定源領(lǐng)域檢索詞矩陣;根據(jù)目標領(lǐng)域的文檔與檢索詞之間的關(guān)系,確定目標領(lǐng)域檢索詞矩陣;根據(jù)源領(lǐng)域檢索詞矩陣、源領(lǐng)域特定話題矩陣、源領(lǐng)域特定話題矩陣的系數(shù)矩陣及源領(lǐng)域與目標領(lǐng)域之間的樞紐矩陣,確定源領(lǐng)域目標函數(shù);根據(jù)目標領(lǐng)域檢索詞矩陣、目標領(lǐng)域特定話題矩陣、目標領(lǐng)域特定話題矩陣的系數(shù)矩陣及樞紐矩陣,確定目標領(lǐng)域目標函數(shù);根據(jù)源領(lǐng)域目標函數(shù)及目標領(lǐng)域目標函數(shù),確定總目標函數(shù);分別確定總目標函數(shù)中各個參數(shù)的目標值;根據(jù)各個參數(shù)的目標值及源領(lǐng)域中的已標注觀點數(shù)據(jù),訓練指定分類模型, 通過訓練得到的指定分類模型對目標領(lǐng)域的觀點數(shù)據(jù)進行分類。假設(shè)上述為第一種可能的實施方式,則在第一種可能的實施方式作為基礎(chǔ)而提供的第二種可能的實施方式中,終端的存儲器中,還包含用于執(zhí)行以下操作的指令:根據(jù)源領(lǐng)域檢索詞矩陣、源領(lǐng)域特定話題矩陣、源領(lǐng)域特定話題矩陣的系數(shù)矩陣及源領(lǐng)域與目標領(lǐng)域之間的樞紐矩陣,確定源領(lǐng)域目標函數(shù),包括:根據(jù)源領(lǐng)域檢索詞矩陣、源領(lǐng)域特定話題矩陣、源領(lǐng)域特定話題矩陣的系數(shù)矩陣及源領(lǐng)域與目標領(lǐng)域之間的樞紐矩陣,通過以下公式確定源領(lǐng)域目標函數(shù):Os=||Xs-[U0,Us]Vs||F2]]>式中,Os為源領(lǐng)域目標函數(shù),Xs為源領(lǐng)域檢索詞矩陣,U0為所述樞紐矩陣,Us為源領(lǐng)域特定話題矩陣,Vs為源領(lǐng)域特定話題矩陣的系數(shù)矩陣,表示費羅貝尼烏斯范數(shù);根據(jù)目標領(lǐng)域檢索詞矩陣、目標領(lǐng)域特定話題矩陣、目標領(lǐng)域特定話題矩陣的系數(shù)矩陣及樞紐矩陣,確定目標領(lǐng)域目標函數(shù),包括:根據(jù)目標領(lǐng)域檢索詞矩陣、目標領(lǐng)域特定話題矩陣、目標領(lǐng)域特定話題矩陣的系數(shù)矩陣及樞紐矩陣,通過以下公式確定目標領(lǐng)域目標函數(shù):Ot=||Xt-[U0,Ut]Vt||F2]]>式中,Ot為目標領(lǐng)域目標函數(shù),Xt為目標領(lǐng)域檢索詞矩陣,U0為樞紐矩陣,Ut為目標領(lǐng)域特定話題矩陣,Vt為目標領(lǐng)域特定話題矩陣的系數(shù)矩陣。在第二種可能的實施方式作為基礎(chǔ)而提供的第三種可能的實施方式中,終端的存儲器中,還包含用于執(zhí)行以下操作的指令:根據(jù)源領(lǐng)域目標函數(shù)及目標領(lǐng)域目標函數(shù),確定總目標函數(shù),包括:根據(jù)源領(lǐng)域目標函數(shù)及目標領(lǐng)域目標函數(shù),通過如下公式確定總目標函數(shù):Φ=λs||Xs-[U0,Us]Vs||F2+λt||Xt-[U0,Ut]Vt||F2+D(U0,Us,Ut,Us,Vt)]]>D(U0,Us,Ut,Vs,Vt)=α||U0TUs||F2+β||U0TUt||F2+γ||UsTUt||F2+Tr(AU0U0T)+Tr(AUsUST)+Tr(AUtUtT)+Tr(AVsVsT)+Tr(AVtVtT)]]>λs=||Xs||F-2]]>λt=||Xt||F-2]]>式中,Φ為總目標函數(shù),D(U0,Us,Ut,Vs,Vt)為一個正則項,α、β、γ為各個正則化參數(shù),Tr()為矩陣的跡,為通過拉格朗日數(shù)乘法在限制U0(i,j)≥0條件下得到的拉格朗日乘子矩陣,為通過拉格朗日數(shù)乘法在限制Us(i,j)≥0條件下得到的拉格朗日乘子矩陣,為通過拉格朗日數(shù)乘法在限制Ut(i,j)≥0條件下得到的拉格朗日乘子矩陣,為通過拉格朗日數(shù)乘法在限制Vs(i,j)≥0條件下得到的拉格朗日乘子矩陣,為通過拉格朗日數(shù)乘法在限制Vt(i,j)≥0條件下得到的拉格朗日乘子矩陣。在第一種或第三種可能的實施方式作為基礎(chǔ)而提供的第四種可能的實施方式中,終端的存儲器中,還包含用于執(zhí)行以下操作的指令:分別確定總目標函數(shù)中各個參數(shù)的目標值,包括:分別為各個參數(shù)隨機分配一個非負的值作為各個參數(shù)的初始值;根據(jù)各個參數(shù)的初始值,計算各個參數(shù)的收斂值,將各個參數(shù)的收斂值作為各個參數(shù)的目標值。在第四種可能的實施方式作為基礎(chǔ)而提供的第五種可能的實施方式中,終端的存儲器中,還包含用于執(zhí)行以下操作的指令:總目標函數(shù)中的各個參數(shù)包括U0、Us、Ut、Vs和Vt;根據(jù)各個參數(shù)的初始值,計算各個參數(shù)的收斂值,包括:根據(jù)U0的初始值,按照U0m=U0m-1[λsXsHsT+λtXtHtT][λsXs(r)HsT+λtXt(r)Ht+(αUsUsT+βUtUtT)U0]]]>對U0進行迭代計算,直至得到U0的收斂值式中,上一次迭代得到的U0的值,為根據(jù)迭代得到的U0的值,Hs為樞紐矩陣對源領(lǐng)域的系數(shù)矩陣, Ht為樞紐矩陣對目標領(lǐng)域的系數(shù)矩陣,r表示迭代次數(shù);根據(jù)Us的初始值,按照Usm=Usm-1[λsXsLsT][λsXs(r)LsT+(αU0U0T+γUtUtT)Us]]]>對Us進行迭代計算,直至得到Us的收斂值式中,上一次迭代得到的Us的值,為根據(jù)迭代得到的Us的值,Ls為源領(lǐng)域特定話題矩陣的系數(shù)矩陣,Lt為目標領(lǐng)域特定話題矩陣的系數(shù)矩陣;根據(jù)Ut的初始值,按照Utm=Utm-1[λtXtHtT][λtXt(r)HtT+(βU0U0T+γUsUsT)Ut]]]>對Ut進行迭代計算,直至得到Ut的收斂值式中,上一次迭代得到的Ut的值,為根據(jù)迭代得到的Ut的值;根據(jù)Vs的初始值,按照對Vs進行迭代計算,直至得到Vs的收斂值式中,為上一次迭代得到的Vs的值,為根據(jù)迭代得到的Vs的值;根據(jù)Vt的初始值,按照對Vt進行迭代計算,直至得到Vt的收斂值式中,為上一次迭代得到的Vt的值,為根據(jù)迭代得到的Vt的值。本發(fā)明實施例提供的計算機可讀存儲介質(zhì),由于確定的總目標函數(shù)與源領(lǐng)域特定話題矩陣、目標領(lǐng)域特定話題矩陣及表示源領(lǐng)域與目標領(lǐng)域之間的共享話題的樞紐矩陣有關(guān),從而提供一種借助源領(lǐng)域與目標領(lǐng)域之間的共享話題實現(xiàn)領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法。由于共享話題能夠減小源領(lǐng)域與目標領(lǐng)域之間的差異,使得通過該種領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法進行分類時,可以確保分類結(jié)果的準確性。本發(fā)明實施例中提供了一種圖形用戶接口,該圖形用戶接口用在終端上,該終端包括觸摸屏顯示器、存儲器和用于執(zhí)行一個或者一個以上的程序的一個或者一個以上的處理器;該圖形用戶接口包括:根據(jù)源領(lǐng)域的文檔與檢索詞之間的關(guān)系,確定源領(lǐng)域檢索詞矩陣;根據(jù)目標領(lǐng)域的文檔與檢索詞之間的關(guān)系,確定目標領(lǐng)域檢索詞矩陣;根據(jù)所述源領(lǐng)域檢索詞矩陣、源領(lǐng)域特定話題矩陣、所述源領(lǐng)域特定話題矩陣的系數(shù)矩陣及所述源領(lǐng)域與所述目標領(lǐng)域之間的樞紐矩陣,確定源領(lǐng)域目標函數(shù);根據(jù)所述目標領(lǐng)域檢索詞矩陣、目標領(lǐng)域特定話題矩陣、所述目標領(lǐng)域特定話題矩陣的系數(shù)矩陣及所述樞紐矩陣,確定目標領(lǐng)域目標函數(shù);根據(jù)所述源領(lǐng)域目標函數(shù)及所述目標領(lǐng)域目標函數(shù),確定總目標函數(shù);分別確定所述總目標函數(shù)中各個參數(shù)的目標值;根據(jù)所述各個參數(shù)的目標值及所述源領(lǐng)域中的已標注觀點數(shù)據(jù),訓練指定分類模型,通過訓練得到的指定分類模型對所述目標領(lǐng)域的觀點數(shù)據(jù)進行分類。本發(fā)明實施例提供的圖形用戶接口,由于確定的總目標函數(shù)與源領(lǐng)域特定話題矩陣、目標領(lǐng)域特定話題矩陣及表示源領(lǐng)域與目標領(lǐng)域之間的共享話題的樞紐矩陣有關(guān),從而提供一種借助源領(lǐng)域與目標領(lǐng)域之間的共享話題實現(xiàn)領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法。由于共享話題能夠減小源領(lǐng)域與目標領(lǐng)域之間的差異,使得通過該種領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法進行分類時,可以確保分類結(jié)果的準確性。需要說明的是:上述實施例提供的領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類在進行領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類時,僅以上述各功能模塊的劃分進行舉例說明,實際應(yīng)用中,可以根據(jù)需要而將上述功能分配由不同的功能模塊完成,即將裝置的內(nèi)部結(jié)構(gòu)劃分成不同的功能模塊,以完成以上描述的全部或者部分功能。另外, 上述實施例提供的領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類裝置、服務(wù)器及終端與領(lǐng)域自適應(yīng)的觀點數(shù)據(jù)分類方法實施例屬于同一構(gòu)思,其具體實現(xiàn)過程詳見方法實施例,這里不再贅述。本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例的全部或部分步驟可以通過硬件來完成,也可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計算機可讀存儲介質(zhì)中,上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。以上所述僅為本發(fā)明的較佳實施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。當前第1頁1 2 3