本發(fā)明涉及信息數(shù)據(jù)處理技術(shù)領(lǐng)域,特別涉及一種旅游目的地中的數(shù)據(jù)語義關(guān)聯(lián)分析方法及系統(tǒng)。
背景技術(shù):
目前,旅游行業(yè)有很多信息服務(wù)商以及OTA,對(duì)外提供了許多景區(qū)的評(píng)論,門票信息,攻略信息等,形成了旅游方向的網(wǎng)絡(luò)輿情,但是這些信息目前采用了諸如打標(biāo)簽的方式進(jìn)行了數(shù)據(jù)分類?,F(xiàn)有技術(shù)無法獲得這些評(píng)論數(shù)據(jù)中內(nèi)在的信息關(guān)聯(lián),從而也無法從中提取出對(duì)景區(qū)發(fā)展有指導(dǎo)意義的數(shù)據(jù)。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本發(fā)明提出一種旅游目的地中的數(shù)據(jù)語義關(guān)聯(lián)分析方法及系統(tǒng)。
一種旅游目的地中的數(shù)據(jù)語義關(guān)聯(lián)分析方法,其包括如下步驟:
S1、對(duì)采集的用戶評(píng)論內(nèi)容的數(shù)據(jù)進(jìn)行基于句子的詞法分析;并對(duì)分析結(jié)果按照形容詞、名詞進(jìn)行數(shù)據(jù)歸類;
S2、建立批數(shù)據(jù)入庫統(tǒng)計(jì)表,數(shù)據(jù)統(tǒng)計(jì)表記錄基本處理算法是對(duì)每一句評(píng)論,建立熱詞分析;并對(duì)一批熱詞,進(jìn)行去重、歸并以及計(jì)數(shù);在計(jì)數(shù)完畢后,根據(jù)時(shí)間段內(nèi)的某個(gè)詞匯出現(xiàn)的頻率做降序排列,以獲得熱詞的分類排序,分類分為名詞、形容詞;得到最熱形容詞列表以及最熱名詞列表;獲取用戶的點(diǎn)擊信息,在為形容詞時(shí)跳轉(zhuǎn)到步驟S3,在為名詞時(shí)跳轉(zhuǎn)到步驟S4,在為與名詞相關(guān)的形容詞時(shí),跳轉(zhuǎn)到步驟S5,在為與形容詞相關(guān)的名詞時(shí),跳轉(zhuǎn)到步驟S6;
S3、根據(jù)最熱形容詞列表,進(jìn)行算法處理,獲得并顯示與該形容詞相關(guān)聯(lián)的名詞;
S4、根據(jù)最熱名詞列表,進(jìn)行算法處理,獲得并顯示與該名詞相關(guān)聯(lián)的形容詞;
S5、查找該名詞相關(guān)的評(píng)論內(nèi)容,并重復(fù)對(duì)每個(gè)評(píng)論內(nèi)容內(nèi)的所有詞匯進(jìn)行詞性和順序分解,將該名詞前面的最接近的形容詞放入關(guān)聯(lián)形容詞暫存表中,根據(jù)關(guān)聯(lián)形容詞暫存表獲得并顯示與該名詞關(guān)聯(lián)的形容詞的結(jié)果;
S6、查找該形容詞相關(guān)的評(píng)論內(nèi)容,并重復(fù)對(duì)每個(gè)評(píng)論內(nèi)容內(nèi)的所有詞匯進(jìn)行詞性和順序分解,將該形容詞前面的最接近的名詞放入關(guān)聯(lián)名詞暫存表中,根據(jù)關(guān)聯(lián)名詞暫存表獲得并顯示與該形容詞關(guān)聯(lián)的名詞的結(jié)果。
在本發(fā)明所述的旅游目的地中的數(shù)據(jù)語義關(guān)聯(lián)分析方法中,所述步驟S3包括:
S31、返回?fù)碛性撔稳菰~的所有評(píng)論內(nèi)容列表;
S32、獲得該形容詞后的最近的名詞,并記錄入名詞臨時(shí)表,并記錄名詞出現(xiàn)次數(shù);
S33、如果一個(gè)名詞在名詞臨時(shí)表中已經(jīng)出現(xiàn),則歸并該名詞,增加該名詞出現(xiàn)次數(shù);
S34、列出該名詞臨時(shí)表中的前預(yù)設(shè)位的名詞;這些名詞即為該形容詞的關(guān)聯(lián)熱詞。
在本發(fā)明所述的旅游目的地中的數(shù)據(jù)語義關(guān)聯(lián)分析方法中,所述步驟S4包括:
S41、返回?fù)碛性撁~的所有評(píng)論內(nèi)容列表;
S42、獲得該名詞前的所有形容詞,并記錄入形容詞臨時(shí)表,并記錄形容詞出現(xiàn)次數(shù);
S43、如果一個(gè)形容詞在形容詞臨時(shí)表出現(xiàn),則歸并該形容詞,增加該形容詞的出現(xiàn)次數(shù);
S44、列出該形容詞臨時(shí)表中的前預(yù)設(shè)位的形容詞;這些形容詞即為該名詞的關(guān)聯(lián)熱詞。
在本發(fā)明所述的旅游目的地中的數(shù)據(jù)語義關(guān)聯(lián)分析方法中,所述步驟S5包括:
S51、選定該名詞,查找包含該名詞的評(píng)論內(nèi)容;
S52、對(duì)每個(gè)評(píng)論內(nèi)容內(nèi)的所有詞匯進(jìn)行詞性和順序分解;
S53、對(duì)選定名詞在評(píng)論內(nèi)容中分解的詞性和順序進(jìn)行排序,確認(rèn)該名詞前面的最接近的形容詞;
S54、將找到的形容詞放入關(guān)聯(lián)形容詞暫存表,重復(fù)步驟S52直到所有包含該名詞的評(píng)論內(nèi)容全部處理完畢,某個(gè)形容詞在關(guān)聯(lián)形容詞暫存表中重復(fù)出現(xiàn)時(shí),在步驟S55中進(jìn)行統(tǒng)計(jì)排序;
S55、將形容詞的關(guān)聯(lián)形容詞暫存表中的數(shù)據(jù),按照出現(xiàn)次數(shù)進(jìn)行排序;排序結(jié)果就是同該名詞關(guān)聯(lián)的形容詞的結(jié)果。
在本發(fā)明所述的旅游目的地中的數(shù)據(jù)語義關(guān)聯(lián)分析方法中,所述步驟S6包括:
S61、選定該形容詞,查找包含該形容詞的評(píng)論內(nèi)容;
S62、對(duì)每個(gè)評(píng)論內(nèi)容內(nèi)的所有詞匯進(jìn)行詞性和順序分解;
S63、對(duì)選定形容詞在評(píng)論內(nèi)容中分解的詞性和順序進(jìn)行排序,確認(rèn)該形容詞前面的最接近的名詞;
S64、將找到的名詞放入關(guān)聯(lián)名詞暫存表,重復(fù)步驟S62直到所有包含該形容詞的評(píng)論內(nèi)容全部處理完畢,某個(gè)名詞在關(guān)聯(lián)名詞暫存表中重復(fù)出現(xiàn)時(shí),在步驟S65中進(jìn)行統(tǒng)計(jì)排序;
S65、將名詞的關(guān)聯(lián)名詞暫存表中的數(shù)據(jù),按照出現(xiàn)次數(shù)進(jìn)行排序;排序結(jié)果就是同該形容詞關(guān)聯(lián)的名詞的結(jié)果。
本發(fā)明還提供一種旅游目的地中的數(shù)據(jù)語義關(guān)聯(lián)分析系統(tǒng),其包括如下單元:
歸類單元,用于對(duì)采集的用戶評(píng)論內(nèi)容的數(shù)據(jù)進(jìn)行基于句子的詞法分析;并對(duì)分析結(jié)果按照形容詞、名詞進(jìn)行數(shù)據(jù)歸類;
統(tǒng)計(jì)分析跳轉(zhuǎn)單元,用于建立批數(shù)據(jù)入庫統(tǒng)計(jì)表,數(shù)據(jù)統(tǒng)計(jì)表記錄基本處理算法是對(duì)每一句評(píng)論,建立熱詞分析;并對(duì)一批熱詞,進(jìn)行去重、歸并以及計(jì)數(shù);在計(jì)數(shù)完畢后,根據(jù)時(shí)間段內(nèi)的某個(gè)詞匯出現(xiàn)的頻率做降序排列,以獲得熱詞的分類排序,分類分為名詞、形容詞;得到最熱形容詞列表以及最熱名詞列表;獲取用戶的點(diǎn)擊信息,在為形容詞時(shí)跳轉(zhuǎn)到第一處理單元,在為名詞時(shí)跳轉(zhuǎn)到第二處理單元,在為與名詞相關(guān)的形容詞時(shí),跳轉(zhuǎn)到第三處理單元,在為與形容詞相關(guān)的名詞時(shí),跳轉(zhuǎn)到第四處理單元;
第一處理單元,用于根據(jù)最熱形容詞列表,進(jìn)行算法處理,獲得并顯示與該形容詞相關(guān)聯(lián)的名詞;
第二處理單元,用于根據(jù)最熱名詞列表,進(jìn)行算法處理,獲得并顯示與該名詞相關(guān)聯(lián)的形容詞;
第三處理單元,用于查找該名詞相關(guān)的評(píng)論內(nèi)容,并重復(fù)對(duì)每個(gè)評(píng)論內(nèi)容內(nèi)的所有詞匯進(jìn)行詞性和順序分解,將該名詞前面的最接近的形容詞放入關(guān)聯(lián)形容詞暫存表中,根據(jù)關(guān)聯(lián)形容詞暫存表獲得并顯示與該名詞關(guān)聯(lián)的形容詞的結(jié)果;
第四處理單元,用于查找該形容詞相關(guān)的評(píng)論內(nèi)容,并重復(fù)對(duì)每個(gè)評(píng)論內(nèi)容內(nèi)的所有詞匯進(jìn)行詞性和順序分解,將該形容詞前面的最接近的名詞放入關(guān)聯(lián)名詞暫存表中,根據(jù)關(guān)聯(lián)名詞暫存表獲得并顯示與該形容詞關(guān)聯(lián)的名詞的結(jié)果。
在本發(fā)明所述的旅游目的地中的數(shù)據(jù)語義關(guān)聯(lián)分析系統(tǒng)中,所述第一處理單元包括:
第一返回子單元,用于返回?fù)碛性撔稳菰~的所有評(píng)論內(nèi)容列表;
第一記錄統(tǒng)計(jì)子單元,用于獲得該形容詞后的最近的名詞,并記錄入名詞臨時(shí)表,并記錄名詞出現(xiàn)次數(shù);
第一歸并子單元,用于在一個(gè)名詞在名詞臨時(shí)表中已經(jīng)出現(xiàn)時(shí),則歸并該名詞,增加該名詞出現(xiàn)次數(shù);
第一顯示子單元,用于列出該名詞臨時(shí)表中的前預(yù)設(shè)位的名詞;這些名詞即為該形容詞的關(guān)聯(lián)熱詞。
在本發(fā)明所述的旅游目的地中的數(shù)據(jù)語義關(guān)聯(lián)分析系統(tǒng)中,所述第二處理單元包括:
第二返回子單元,用于返回?fù)碛性撁~的所有評(píng)論內(nèi)容列表;
第二記錄統(tǒng)計(jì)子單元,用于獲得該名詞前的所有形容詞,并記錄入形容詞臨時(shí)表,并記錄形容詞出現(xiàn)次數(shù);
第二歸并子單元,用于在如果一個(gè)形容詞在形容詞臨時(shí)表出現(xiàn)時(shí),則歸并該形容詞,增加該形容詞的出現(xiàn)次數(shù);
第二顯示子單元,用于列出該形容詞臨時(shí)表中的前預(yù)設(shè)位的形容詞;這些形容詞即為該名詞的關(guān)聯(lián)熱詞。
在本發(fā)明所述的旅游目的地中的數(shù)據(jù)語義關(guān)聯(lián)分析系統(tǒng)中,所述第三處理單元包括:
第一查找子單元,用于選定該名詞,查找包含該名詞的評(píng)論內(nèi)容;
第一分解子單元,用于對(duì)每個(gè)評(píng)論內(nèi)容內(nèi)的所有詞匯進(jìn)行詞性和順序分解;
第一排序子單元,用于對(duì)選定名詞在評(píng)論內(nèi)容中分解的詞性和順序進(jìn)行排序,確認(rèn)該名詞前面的最接近的形容詞;
第一重復(fù)子單元,用于將找到的形容詞放入關(guān)聯(lián)形容詞暫存表,重復(fù)第一分解子單元直到所有包含該名詞的評(píng)論內(nèi)容全部處理完畢,某個(gè)形容詞在關(guān)聯(lián)形容詞暫存表中重復(fù)出現(xiàn)時(shí),在第三顯示子單元中進(jìn)行統(tǒng)計(jì)排序;
第三顯示子單元,用于將形容詞的關(guān)聯(lián)形容詞暫存表中的數(shù)據(jù),按照出現(xiàn)次數(shù)進(jìn)行排序;排序結(jié)果就是同該名詞關(guān)聯(lián)的形容詞的結(jié)果。
在本發(fā)明所述的旅游目的地中的數(shù)據(jù)語義關(guān)聯(lián)分析系統(tǒng)中,所述第四處理單元包括:
第二查找子單元,用于選定該形容詞,查找包含該形容詞的評(píng)論內(nèi)容;
第二分解子單元,用于對(duì)每個(gè)評(píng)論內(nèi)容內(nèi)的所有詞匯進(jìn)行詞性和順序分解;
第二排序子單元,用于對(duì)選定形容詞在評(píng)論內(nèi)容中分解的詞性和順序進(jìn)行排序,確認(rèn)該形容詞前面的最接近的名詞;
第二重復(fù)子單元,用于將找到的名詞放入關(guān)聯(lián)名詞暫存表,重復(fù)第二分解子單元直到所有包含該形容詞的評(píng)論內(nèi)容全部處理完畢,某個(gè)名詞在關(guān)聯(lián)名詞暫存表中重復(fù)出現(xiàn)時(shí),在第四顯示子單元進(jìn)行統(tǒng)計(jì)排序;
第四顯示子單元,用于將名詞的關(guān)聯(lián)名詞暫存表中的數(shù)據(jù),按照出現(xiàn)次數(shù)進(jìn)行排序;排序結(jié)果就是同該形容詞關(guān)聯(lián)的名詞的結(jié)果。
實(shí)施本發(fā)明提供的旅游目的地中的數(shù)據(jù)語義關(guān)聯(lián)分析方法及系統(tǒng)與現(xiàn)有技術(shù)相比具有以下有益效果:能夠通過用戶的對(duì)于旅游目的地大量網(wǎng)絡(luò)評(píng)論的內(nèi)容,分析出網(wǎng)絡(luò)輿情中的最熱名詞和形容詞,并且能夠計(jì)算和分析出最熱的前預(yù)設(shè)位(比如20位)個(gè)名詞和形容詞關(guān)聯(lián)的熱詞。從而獲得輿情最關(guān)注的情感和內(nèi)容集中在哪些方面。
同時(shí),本發(fā)明還提供了計(jì)算同某個(gè)名詞有關(guān)聯(lián)關(guān)系的形容詞的計(jì)算處理,以及同某個(gè)名詞有關(guān)聯(lián)關(guān)系的形容詞的計(jì)算處理和統(tǒng)計(jì)的處理方法,這樣用戶可以獲得和某個(gè)名詞以及某個(gè)形容詞之間的對(duì)應(yīng)關(guān)聯(lián)關(guān)系。
附圖說明
圖1是本發(fā)明實(shí)施例的旅游目的地中的數(shù)據(jù)語義關(guān)聯(lián)分析系統(tǒng)結(jié)構(gòu)框圖。
圖2是圖1中第一處理單元結(jié)構(gòu)框圖;
圖3是圖1中第二處理單元結(jié)構(gòu)框圖;
圖4是圖1中第三處理單元結(jié)構(gòu)框圖;
圖5是圖1中第四處理單元結(jié)構(gòu)框圖。
具體實(shí)施方式
一種旅游目的地中的數(shù)據(jù)語義關(guān)聯(lián)分析方法,其包括如下步驟:
S1、對(duì)采集的用戶評(píng)論內(nèi)容的數(shù)據(jù)進(jìn)行基于句子的詞法分析;并對(duì)分析結(jié)果按照形容詞、名詞進(jìn)行數(shù)據(jù)歸類;
S2、建立批數(shù)據(jù)入庫統(tǒng)計(jì)表,數(shù)據(jù)統(tǒng)計(jì)表記錄基本處理算法是對(duì)每一句評(píng)論,建立熱詞分析;并對(duì)一批熱詞,進(jìn)行去重、歸并以及計(jì)數(shù);在計(jì)數(shù)完畢后,根據(jù)時(shí)間段內(nèi)的某個(gè)詞匯出現(xiàn)的頻率做降序排列,以獲得熱詞的分類排序,分類分為名詞、形容詞;得到最熱形容詞列表以及最熱名詞列表;獲取用戶的點(diǎn)擊信息,在為形容詞時(shí)跳轉(zhuǎn)到步驟S3,在為名詞時(shí)跳轉(zhuǎn)到步驟S4,在為與名詞相關(guān)的形容詞時(shí),跳轉(zhuǎn)到步驟S5,在為與形容詞相關(guān)的名詞時(shí),跳轉(zhuǎn)到步驟S6;
S3、根據(jù)最熱形容詞列表,進(jìn)行算法處理,獲得并顯示與該形容詞相關(guān)聯(lián)的名詞;
S4、根據(jù)最熱名詞列表,進(jìn)行算法處理,獲得并顯示與該名詞相關(guān)聯(lián)的形容詞;
S5、查找該名詞相關(guān)的評(píng)論內(nèi)容,并重復(fù)對(duì)每個(gè)評(píng)論內(nèi)容內(nèi)的所有詞匯進(jìn)行詞性和順序分解,將該名詞前面的最接近的形容詞放入關(guān)聯(lián)形容詞暫存表中,根據(jù)關(guān)聯(lián)形容詞暫存表獲得并顯示與該名詞關(guān)聯(lián)的形容詞的結(jié)果;
S6、查找該形容詞相關(guān)的評(píng)論內(nèi)容,并重復(fù)對(duì)每個(gè)評(píng)論內(nèi)容內(nèi)的所有詞匯進(jìn)行詞性和順序分解,將該形容詞前面的最接近的名詞放入關(guān)聯(lián)名詞暫存表中,根據(jù)關(guān)聯(lián)名詞暫存表獲得并顯示與該形容詞關(guān)聯(lián)的名詞的結(jié)果。
在本發(fā)明所述的旅游目的地中的數(shù)據(jù)語義關(guān)聯(lián)分析方法中,所述步驟S3包括:
S31、返回?fù)碛性撔稳菰~的所有評(píng)論內(nèi)容列表;
S32、獲得該形容詞后的最近的名詞,并記錄入名詞臨時(shí)表,并記錄名詞出現(xiàn)次數(shù);
S33、如果一個(gè)名詞在名詞臨時(shí)表中已經(jīng)出現(xiàn),則歸并該名詞,增加該名詞出現(xiàn)次數(shù);
S34、列出該名詞臨時(shí)表中的前預(yù)設(shè)位的名詞;這些名詞即為該形容詞的關(guān)聯(lián)熱詞。
在本發(fā)明所述的旅游目的地中的數(shù)據(jù)語義關(guān)聯(lián)分析方法中,所述步驟S4包括:
S41、返回?fù)碛性撁~的所有評(píng)論內(nèi)容列表;
S42、獲得該名詞前的所有形容詞,并記錄入形容詞臨時(shí)表,并記錄形容詞出現(xiàn)次數(shù);
S43、如果一個(gè)形容詞在形容詞臨時(shí)表出現(xiàn),則歸并該形容詞,增加該形容詞的出現(xiàn)次數(shù);
S44、列出該形容詞臨時(shí)表中的前預(yù)設(shè)位的形容詞;這些形容詞即為該名詞的關(guān)聯(lián)熱詞。
在本發(fā)明所述的旅游目的地中的數(shù)據(jù)語義關(guān)聯(lián)分析方法中,所述步驟S5包括:
S51、選定該名詞,查找包含該名詞的評(píng)論內(nèi)容;
S52、對(duì)每個(gè)評(píng)論內(nèi)容內(nèi)的所有詞匯進(jìn)行詞性和順序分解;
S53、對(duì)選定名詞在評(píng)論內(nèi)容中分解的詞性和順序進(jìn)行排序,確認(rèn)該名詞前面的最接近的形容詞;
S54、將找到的形容詞放入關(guān)聯(lián)形容詞暫存表,重復(fù)步驟S52直到所有包含該名詞的評(píng)論內(nèi)容全部處理完畢,某個(gè)形容詞在關(guān)聯(lián)形容詞暫存表中重復(fù)出現(xiàn)時(shí),在步驟S55中進(jìn)行統(tǒng)計(jì)排序;
S55、將形容詞的關(guān)聯(lián)形容詞暫存表中的數(shù)據(jù),按照出現(xiàn)次數(shù)進(jìn)行排序;排序結(jié)果就是同該名詞關(guān)聯(lián)的形容詞的結(jié)果。
在本發(fā)明所述的旅游目的地中的數(shù)據(jù)語義關(guān)聯(lián)分析方法中,所述步驟S6包括:
S61、選定該形容詞,查找包含該形容詞的評(píng)論內(nèi)容;
S62、對(duì)每個(gè)評(píng)論內(nèi)容內(nèi)的所有詞匯進(jìn)行詞性和順序分解;
S63、對(duì)選定形容詞在評(píng)論內(nèi)容中分解的詞性和順序進(jìn)行排序,確認(rèn)該形容詞前面的最接近的名詞;
S64、將找到的名詞放入關(guān)聯(lián)名詞暫存表,重復(fù)步驟S62直到所有包含該形容詞的評(píng)論內(nèi)容全部處理完畢,某個(gè)名詞在關(guān)聯(lián)名詞暫存表中重復(fù)出現(xiàn)時(shí),在步驟S65中進(jìn)行統(tǒng)計(jì)排序;
S65、將名詞的關(guān)聯(lián)名詞暫存表中的數(shù)據(jù),按照出現(xiàn)次數(shù)進(jìn)行排序;排序結(jié)果就是同該形容詞關(guān)聯(lián)的名詞的結(jié)果。
如圖1所示,本發(fā)明還提供一種旅游目的地中的數(shù)據(jù)語義關(guān)聯(lián)分析系統(tǒng),其包括如下單元:
歸類單元,用于對(duì)采集的用戶評(píng)論內(nèi)容的數(shù)據(jù)進(jìn)行基于句子的詞法分析;并對(duì)分析結(jié)果按照形容詞、名詞進(jìn)行數(shù)據(jù)歸類;
統(tǒng)計(jì)分析跳轉(zhuǎn)單元,用于建立批數(shù)據(jù)入庫統(tǒng)計(jì)表,數(shù)據(jù)統(tǒng)計(jì)表記錄基本處理算法是對(duì)每一句評(píng)論,建立熱詞分析;并對(duì)一批熱詞,進(jìn)行去重、歸并以及計(jì)數(shù);在計(jì)數(shù)完畢后,根據(jù)時(shí)間段內(nèi)的某個(gè)詞匯出現(xiàn)的頻率做降序排列,以獲得熱詞的分類排序,分類分為名詞、形容詞;得到最熱形容詞列表以及最熱名詞列表;獲取用戶的點(diǎn)擊信息,在為形容詞時(shí)跳轉(zhuǎn)到第一處理單元,在為名詞時(shí)跳轉(zhuǎn)到第二處理單元,在為與名詞相關(guān)的形容詞時(shí),跳轉(zhuǎn)到第三處理單元,在為與形容詞相關(guān)的名詞時(shí),跳轉(zhuǎn)到第四處理單元;
第一處理單元,用于根據(jù)最熱形容詞列表,進(jìn)行算法處理,獲得并顯示與該形容詞相關(guān)聯(lián)的名詞;
第二處理單元,用于根據(jù)最熱名詞列表,進(jìn)行算法處理,獲得并顯示與該名詞相關(guān)聯(lián)的形容詞;
第三處理單元,用于查找該名詞相關(guān)的評(píng)論內(nèi)容,并重復(fù)對(duì)每個(gè)評(píng)論內(nèi)容內(nèi)的所有詞匯進(jìn)行詞性和順序分解,將該名詞前面的最接近的形容詞放入關(guān)聯(lián)形容詞暫存表中,根據(jù)關(guān)聯(lián)形容詞暫存表獲得并顯示與該名詞關(guān)聯(lián)的形容詞的結(jié)果;
第四處理單元,用于查找該形容詞相關(guān)的評(píng)論內(nèi)容,并重復(fù)對(duì)每個(gè)評(píng)論內(nèi)容內(nèi)的所有詞匯進(jìn)行詞性和順序分解,將該形容詞前面的最接近的名詞放入關(guān)聯(lián)名詞暫存表中,根據(jù)關(guān)聯(lián)名詞暫存表獲得并顯示與該形容詞關(guān)聯(lián)的名詞的結(jié)果。
如圖2所示,在本發(fā)明所述的旅游目的地中的數(shù)據(jù)語義關(guān)聯(lián)分析系統(tǒng)中,所述第一處理單元包括:
第一返回子單元,用于返回?fù)碛性撔稳菰~的所有評(píng)論內(nèi)容列表;
第一記錄統(tǒng)計(jì)子單元,用于獲得該形容詞后的最近的名詞,并記錄入名詞臨時(shí)表,并記錄名詞出現(xiàn)次數(shù);
第一歸并子單元,用于在一個(gè)名詞在名詞臨時(shí)表中已經(jīng)出現(xiàn)時(shí),則歸并該名詞,增加該名詞出現(xiàn)次數(shù);
第一顯示子單元,用于列出該名詞臨時(shí)表中的前預(yù)設(shè)位的名詞;這些名詞即為該形容詞的關(guān)聯(lián)熱詞。
如圖3所示,在本發(fā)明所述的旅游目的地中的數(shù)據(jù)語義關(guān)聯(lián)分析系統(tǒng)中,所述第二處理單元包括:
第二返回子單元,用于返回?fù)碛性撁~的所有評(píng)論內(nèi)容列表;
第二記錄統(tǒng)計(jì)子單元,用于獲得該名詞前的所有形容詞,并記錄入形容詞臨時(shí)表,并記錄形容詞出現(xiàn)次數(shù);
第二歸并子單元,用于在如果一個(gè)形容詞在形容詞臨時(shí)表出現(xiàn)時(shí),則歸并該形容詞,增加該形容詞的出現(xiàn)次數(shù);
第二顯示子單元,用于列出該形容詞臨時(shí)表中的前預(yù)設(shè)位的形容詞;這些形容詞即為該名詞的關(guān)聯(lián)熱詞。
如圖4所示,在本發(fā)明所述的旅游目的地中的數(shù)據(jù)語義關(guān)聯(lián)分析系統(tǒng)中,所述第三處理單元包括:
第一查找子單元,用于選定該名詞,查找包含該名詞的評(píng)論內(nèi)容;
第一分解子單元,用于對(duì)每個(gè)評(píng)論內(nèi)容內(nèi)的所有詞匯進(jìn)行詞性和順序分解;
第一排序子單元,用于對(duì)選定名詞在評(píng)論內(nèi)容中分解的詞性和順序進(jìn)行排序,確認(rèn)該名詞前面的最接近的形容詞;
第一重復(fù)子單元,用于將找到的形容詞放入關(guān)聯(lián)形容詞暫存表,重復(fù)第一分解子單元直到所有包含該名詞的評(píng)論內(nèi)容全部處理完畢,某個(gè)形容詞在關(guān)聯(lián)形容詞暫存表中重復(fù)出現(xiàn)時(shí),在第三顯示子單元中進(jìn)行統(tǒng)計(jì)排序;
第三顯示子單元,用于將形容詞的關(guān)聯(lián)形容詞暫存表中的數(shù)據(jù),按照出現(xiàn)次數(shù)進(jìn)行排序;排序結(jié)果就是同該名詞關(guān)聯(lián)的形容詞的結(jié)果。
如圖5所示,在本發(fā)明所述的旅游目的地中的數(shù)據(jù)語義關(guān)聯(lián)分析系統(tǒng)中,所述第四處理單元包括:
第二查找子單元,用于選定該形容詞,查找包含該形容詞的評(píng)論內(nèi)容;
第二分解子單元,用于對(duì)每個(gè)評(píng)論內(nèi)容內(nèi)的所有詞匯進(jìn)行詞性和順序分解;
第二排序子單元,用于對(duì)選定形容詞在評(píng)論內(nèi)容中分解的詞性和順序進(jìn)行排序,確認(rèn)該形容詞前面的最接近的名詞;
第二重復(fù)子單元,用于將找到的名詞放入關(guān)聯(lián)名詞暫存表,重復(fù)第二分解子單元直到所有包含該形容詞的評(píng)論內(nèi)容全部處理完畢,某個(gè)名詞在關(guān)聯(lián)名詞暫存表中重復(fù)出現(xiàn)時(shí),在第四顯示子單元進(jìn)行統(tǒng)計(jì)排序;
第四顯示子單元,用于將名詞的關(guān)聯(lián)名詞暫存表中的數(shù)據(jù),按照出現(xiàn)次數(shù)進(jìn)行排序;排序結(jié)果就是同該形容詞關(guān)聯(lián)的名詞的結(jié)果。
實(shí)施本發(fā)明提供的旅游目的地中的數(shù)據(jù)語義關(guān)聯(lián)分析方法及系統(tǒng)與現(xiàn)有技術(shù)相比具有以下有益效果:能夠通過用戶的對(duì)于旅游目的地大量網(wǎng)絡(luò)評(píng)論的內(nèi)容,分析出網(wǎng)絡(luò)輿情中的最熱名詞和形容詞,并且能夠計(jì)算和分析出最熱的前預(yù)設(shè)位(比如20位)個(gè)名詞和形容詞關(guān)聯(lián)的熱詞。從而獲得輿情最關(guān)注的情感和內(nèi)容集中在哪些方面。
同時(shí),本發(fā)明還提供了計(jì)算同某個(gè)名詞有關(guān)聯(lián)關(guān)系的形容詞的計(jì)算處理,以及同某個(gè)名詞有關(guān)聯(lián)關(guān)系的形容詞的計(jì)算處理和統(tǒng)計(jì)的處理方法,這樣用戶可以獲得和某個(gè)名詞以及某個(gè)形容詞之間的對(duì)應(yīng)關(guān)聯(lián)關(guān)系。
可以理解的是,對(duì)于本領(lǐng)域的普通技術(shù)人員來說,可以根據(jù)本發(fā)明的技術(shù)構(gòu)思做出其它各種相應(yīng)的改變與變形,而所有這些改變與變形都應(yīng)屬于本發(fā)明權(quán)利要求的保護(hù)范圍。