两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

保健食品關聯(lián)知識庫構(gòu)建方法和裝置制造方法

文檔序號:6626562閱讀:240來源:國知局
保健食品關聯(lián)知識庫構(gòu)建方法和裝置制造方法
【專利摘要】本發(fā)明實施例公開了一種保健食品關聯(lián)知識庫構(gòu)建方法和裝置。所述保健食品關聯(lián)知識庫構(gòu)建方法包括:利用預置的保健食品知識庫中保健食品的名稱關鍵詞檢索參考信息源;利用對所述參考信息源的檢索結(jié)果建立關于所述保健食品的描述語料庫;利用預先配置的疾病詞典對所述描述語料庫中所述保健食品的描述語料進行分詞;根據(jù)分詞結(jié)果,建立所述保健食品與所述描述語料中出現(xiàn)的疾病之間的關聯(lián)關系。本發(fā)明實施例提供的保健食品關聯(lián)知識庫構(gòu)建方法和裝置能夠向用戶提供關于保健食品的詳細信息。
【專利說明】保健食品關聯(lián)知識庫構(gòu)建方法和裝置

【技術(shù)領域】
[0001]本發(fā)明實施例涉及數(shù)據(jù)庫【技術(shù)領域】,尤其涉及一種保健食品關聯(lián)知識庫構(gòu)建方法和裝置。

【背景技術(shù)】
[0002]根據(jù)2005年國家食品藥品監(jiān)督管理局頒布的《保健食品注冊管理辦法(試行)》中對保健食品的定義,保健食品是指聲稱具有特定保健功能或者以補充維生素、礦物質(zhì)為目的的食品,即適宜于特定人群食用,具有調(diào)節(jié)機體功能,不以治療疾病為目的,并且對人體不產(chǎn)生任何急性、亞急性或者慢性危害的食品。根據(jù)保健食品的定義,我國保健食品分為兩類:一類是調(diào)節(jié)機體功能的保健食品。國家食品藥品監(jiān)督管理局公布的保健食品具有27種功能,有增強免疫力的功能、緩解體力疲勞的功能、輔助降血脂的功能、輔助降血糖的功能、輔助降血壓的功能、減肥動能等;另一類是營養(yǎng)補充劑,以補充一種或多種維生素、礦物質(zhì)而不以提供能量為目的的產(chǎn)品,其作用是補充膳食供給的不足,預防營養(yǎng)缺乏和降低發(fā)生某些慢性疾病的危險性,此類產(chǎn)品僅限于補充維生素和礦物質(zhì)。所以,保健食品首先是食品。但是,保健食品又與人們?nèi)粘J秤玫钠胀ㄊ称废鄥^(qū)別。它對人體有調(diào)節(jié)機體功能的作用,對醫(yī)治人體的疾病往往具有輔助作用。
[0003]普通消費者往往希望通過互聯(lián)網(wǎng)查詢到保健食品對哪些疾病能夠起到輔助醫(yī)治的效果。然而,消費者在搜索時,一般會搜索出大量信息,且準確性低,需要做大量的篩選工作,這使得消費者更難以選擇。


【發(fā)明內(nèi)容】

[0004]有鑒于此,本發(fā)明實施例提出一種保健食品關聯(lián)知識庫構(gòu)建方法和裝置,以便于提高消費者獲取保健食品信息的準確性和信息篩選效率。
[0005]第一方面,本發(fā)明實施例提供了一種保健食品關聯(lián)知識庫構(gòu)建方法,所述方法包括:
[0006]利用預置的保健食品知識庫中保健食品的名稱關鍵詞檢索參考信息源;
[0007]利用對所述參考信息源的檢索結(jié)果建立關于所述保健食品的描述語料庫;
[0008]利用預先配置的疾病詞典對所述描述語料庫中所述保健食品的描述語料進行分詞;
[0009]根據(jù)分詞結(jié)果,建立所述保健食品與所述描述語料中出現(xiàn)的疾病之間的關聯(lián)關系O
[0010]第二方面,本發(fā)明實施例提供了一種保健食品關聯(lián)知識庫構(gòu)建裝置,所述裝置包括:
[0011]參考信息檢索模塊,用于利用預置的保健食品知識庫中保健食品的名稱關鍵詞檢索參考信息源;
[0012]語料庫建立模塊,用于利用對所述參考信息源的檢索結(jié)果建立關于所述保健食品的描述語料庫;
[0013]語料分詞模塊,用于利用預先配置的疾病詞典對所述描述語料庫中所述保健食品的描述語料進行分詞;
[0014]關聯(lián)建立模塊,用于根據(jù)分詞結(jié)果,建立所述保健食品與所述描述語料中出現(xiàn)的疾病之間的關聯(lián)關系。
[0015]本發(fā)明實施例提供的保健食品關聯(lián)知識庫構(gòu)建方法和裝置通過建立保健食品與其具有輔助醫(yī)治效果的疾病之間的關聯(lián)關系,能夠?qū)Ρ=∈称返拇罅繑?shù)據(jù)進行統(tǒng)一處理,能夠提高關于保健食品信息的準確性,且減少了用戶的篩選操作,提高了用戶獲取保健食品信息的效率和便捷性。

【專利附圖】

【附圖說明】
[0016]通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本發(fā)明的其它特征、目的和優(yōu)點將會變得更明顯:
[0017]圖1是本發(fā)明第一實施例提供的保健食品關聯(lián)知識庫構(gòu)建方法的流程圖;
[0018]圖2是本發(fā)明第一實施例提供的互聯(lián)網(wǎng)上關于保健食品的參考信息的網(wǎng)頁的頁面圖;
[0019]圖3是本發(fā)明第一實施例提供的保健視頻關聯(lián)知識庫構(gòu)建方法中語料庫建立的流程圖;
[0020]圖4是本發(fā)明第二實施例提供的保健食品關聯(lián)知識庫構(gòu)建方法的流程圖;
[0021]圖5是本發(fā)明第二實施例提供的為描述語料庫中未收錄的保健食品建立關聯(lián)疾病的流程不意圖;
[0022]圖6是本發(fā)明第三實施例提供的保健食品關聯(lián)知識庫構(gòu)建方法的流程圖;
[0023]圖7是本發(fā)明第四實施例提供的保健食品關聯(lián)知識庫構(gòu)建裝置的結(jié)構(gòu)圖。

【具體實施方式】
[0024]下面結(jié)合附圖和實施例對本發(fā)明作進一步的詳細說明??梢岳斫獾氖?,此處所描述的具體實施例僅用于解釋本發(fā)明,而非對本發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關的部分而非全部內(nèi)容。
[0025]圖1至圖3示出了本發(fā)明的第一實施例。
[0026]圖1是本發(fā)明第一實施例提供的保健食品關聯(lián)知識庫構(gòu)建方法的流程圖。參見圖1,所述保健食品關聯(lián)知識庫構(gòu)建方法包括:
[0027]S110,利用預置的保健食品知識庫中保健食品的名稱關鍵詞檢索參考信息源。
[0028]所述保健食品知識庫是預置的關于保健食品的關鍵信息的數(shù)據(jù)庫。所述保健食品知識庫中按照不同的保健食品名稱存儲有保健食品的關鍵信息。所述保健食品的關鍵信息至少包括保健食品的名稱,還有可能包括保健食品的生產(chǎn)廠家、商標名稱、產(chǎn)品型號等信肩、O
[0029]所述參考信息源是存儲有關于保健食品的參考信息的信息源。所述參考信息源可以是互聯(lián)網(wǎng)上關于保健食品的參考信息的網(wǎng)頁,例如百度百科的網(wǎng)頁。圖2示出了的一個互聯(lián)網(wǎng)上關于保健食品的參考信息的網(wǎng)頁。參見圖2,所述網(wǎng)頁不僅提供了保健食品的名稱、生產(chǎn)廠家,還會提供保健食品的功能等更加詳細的信息。
[0030]在本實施例中,首先從預置的保健食品知識庫中獲取保健食品的名稱,然后利用所述保健食品的名稱對所述參考信息源進行檢索,以獲取關于所述保健食品的更多信息。優(yōu)選的,當選擇互聯(lián)網(wǎng)上關于保健食品的參考信息的網(wǎng)頁作為所述參考信息源時,可以通過搜索引擎檢索互聯(lián)網(wǎng)網(wǎng)頁,來實現(xiàn)對所述參考信息源的檢索。
[0031]S120,利用對所述參考信息源的檢索結(jié)果建立關于所述保健食品的描述語料庫。
[0032]對所述參考信息源進行檢索以后,獲取到了關于所述保健食品的更多信息。以獲取到的信息為基礎數(shù)據(jù),建立關于所述保健食品的描述語料庫。所述描述語料庫是對所述保健食品的詳細信息進行描述的數(shù)據(jù)庫,其中包含著不同保健食品的描述語料。而保健食品的描述語料會對保健食品的成分、功效等信息做詳盡的描述。
[0033]S130,利用預先配置的疾病詞典對所述描述語料庫中所述保健食品的描述語料進行分詞。
[0034]所述疾病詞典是預先配置的記錄不同疾病的名稱的數(shù)據(jù)字典。所述疾病詞典不僅會記錄一些常見疾病的疾病名稱,還會記錄一些不太常見的疾病的名稱。如果一個疾病在中文中有多個名稱,則所述疾病詞典會對該疾病的不同名稱分別進行記錄。
[0035]預先配置了記錄疾病名稱的疾病詞典以后,可以利用所述疾病詞典對所述描述語料庫中的描述語料進行分詞。對所述描述語料進行分詞就是將所述描述語料切分為以詞為單元的切分結(jié)果。然后可以通過與所述疾病詞典中收錄的疾病名稱進行比較,獲取到所述描述語料中包含的疾病名稱。
[0036]S140,根據(jù)分詞結(jié)果,建立所述保健食品與所述描述語料中出現(xiàn)的疾病之間的關聯(lián)關系。
[0037]如果在所述保健食品的描述語料中出現(xiàn)了一個疾病的疾病名稱,那么說明該保健食品對所述疾病的治療有輔助作用,因此應該建立所述保健食品與所述疾病之間的關聯(lián)關系O
[0038]示例的,建立所述保健食品與所述疾病之間的關聯(lián)關系可以將保健食品與同它有關聯(lián)關系的疾病按照它們之間的對應關系存入同一個數(shù)據(jù)表中。
[0039]圖3是本發(fā)明第一實施例提供的保健視頻關聯(lián)知識庫構(gòu)建方法中語料庫建立的流程圖。參見圖3,優(yōu)選的,利用對所述參考信息源的檢索結(jié)果建立關于所述保健食品的描述語料庫包括:
[0040]S121,根據(jù)所述參考信息源中的段落標題,對所述檢索結(jié)果進行過濾,以獲得有效的描述語料數(shù)據(jù)。
[0041]所述參考信息源中關于所述保健食品的描述語料通常以不同的段落組成,而且不同的段落通常有不同的標題。從所述描述語料的不同標題能夠得知所述參考信息源中該段落的大致內(nèi)容。
[0042]在不同的段落標題中,有一些段落標題所標明的段落通常與需要獲取的描述語料數(shù)據(jù)非常相關,而另一些段落標題所表明的段落則與需要獲取的描述語料數(shù)據(jù)不那么相關。把與需要獲取的描述語料數(shù)據(jù)非常相關的段落成為有效的描述語料數(shù)據(jù)。例如,以段落標題中包含“功效”或者“作用”的段落一般與需要獲取的描述語料數(shù)據(jù)十分相關,可以作為有效的描述語料數(shù)據(jù)。
[0043]可以將類似“功效”、“作用”這樣的關鍵詞作為標題關鍵詞對從所述參考信息源中獲取的數(shù)據(jù)進行過濾,從而得到有效的描述語料數(shù)據(jù)。
[0044]S122,將關于相同保健食品的有效的描述語料數(shù)據(jù)合并,從而建立關于所述保健食品的描述語料庫。
[0045]對所述從所述參考信息源中獲取的數(shù)據(jù)進行過濾以后,獲取到有效的描述語料數(shù)據(jù)可能包含若干數(shù)據(jù)段。將這些數(shù)據(jù)段進行合并,便可以建立關于所述保健視頻的描述語料庫。
[0046]具體的,對所述有效描述語料數(shù)據(jù)的合并可以是將表示不同數(shù)據(jù)段的字符串連接,以形成一個新的包含不同數(shù)據(jù)段內(nèi)容的字符串。
[0047]本實施例通過利用預置的保健食品知識庫中保健食品的名稱關鍵詞檢索參考信息源,利用對所述參考信息源的檢索結(jié)果建立關于所述保健食品的描述語料庫,利用預先配置的疾病詞典對所述描述語料庫中所述保健食品的描述語料進行分詞,根據(jù)分詞結(jié)果,建立所述保健食品與所述描述語料中出現(xiàn)的疾病之間的關聯(lián)關系,從而建立了保健食品與其具有輔助醫(yī)治效果的疾病之間的關聯(lián)關系,提高了用戶獲取保健食品信息的效率和便捷性。
[0048]圖4及圖5示出了本發(fā)明的第二實施例。
[0049]圖4是本發(fā)明第二實施例提供的保健食品關聯(lián)知識庫構(gòu)建方法的流程圖。所述保健食品關聯(lián)知識庫構(gòu)建方法以本發(fā)明第一實施例為基礎,進一步的,建立所述保健食品與所述描述預料中出現(xiàn)的疾病之間的關聯(lián)關系之后,還包括:根據(jù)保健食品的描述字段計算所述描述語料庫中已收錄的保健食品與未收錄的保健食品之間的相似度;若所述未收錄的保健食品與已收錄的保健食品之間的相似度高于預設的相似度閾值,則建立所述未收錄的保健食品同所述已收錄的保健食品相關聯(lián)的疾病之間的關聯(lián)關系。
[0050]參見圖4,所述保健食品關聯(lián)知識庫構(gòu)建方法包括:
[0051]S410,利用預置的保健食品知識庫中保健食品的名稱關鍵詞檢索參考信息源。
[0052]S420,利用對所述參考信息源的檢索結(jié)果建立關于所述保健食品的描述語料庫。
[0053]S430,利用預先配置的疾病詞典對所述描述語料庫中所述保健食品的描述語料進行分詞。
[0054]S440,根據(jù)分詞結(jié)果,建立所述保健食品與所述描述語料中出現(xiàn)的疾病之間的關聯(lián)關系。
[0055]S450,根據(jù)保健食品的描述字段計算所述描述語料庫中已收錄的保健食品與未收錄的保健食品之間的相似度。
[0056]所述保健食品的描述字段是在所述預置的保健食品知識庫中所述保健食品的描述字段。所述描述字段包括所述保健食品的名稱字段、功效字段以及成分字段。
[0057]所述參考信息源本身的收錄數(shù)據(jù)是不完整的,也就是說參考信息源本身有數(shù)據(jù)稀疏的問題,并不是所有的保健食品都能在所述參考信息源中找到相應的記錄。因此,在建立所述保健食品的描述語料庫以后,在所述預置的保健食品知識庫中的保健食品有的被收錄在所述描述語料庫中,有的沒有被收錄在所述描述語料庫中。而沒有被收錄在所述描述語料庫中的保健食品就無法與疾病數(shù)據(jù)建立關聯(lián)。
[0058]所述描述語料庫中未收錄的保健食品中,有一部分與已收錄的保健食品相同或者功效十分相似。為了能夠建立描述語料庫中未收錄的保健食品與疾病之間的關聯(lián),計算所述描述語料庫中未收錄的保健食品與已收錄的保健食品之間的相似度。
[0059]優(yōu)選的,可以將未收錄的保健食品的描述字段組成所述未收錄的保健食品的描述向量,并將已收錄的保健食品的描述字段組成所述已收錄的保健食品的描述向量。然后,根據(jù)二者的描述向量計算未收錄的保健食品與已收錄的保健食品之間的相似度。進一步的優(yōu)選的,所述未收錄的保健食品與已收錄的保健食品之間的相似度是余弦相似度。
[0060]計算所述未收錄的保健食品與已收錄的保健食品之間的余弦相似度的公式如下:
3,,、3,q./?
「00611 similarityia, b) ^ Y Wi.SimXai, b) = Y Wi.., ,1 ,, !,

i=l ' i=l \ai\bi\
[0062]其中,similarity表示保健食品a與保健食品b之間的相似度,表示保健食品a的描述向量中的第i個元素Ai表示保健食品b的描述向量中的第i個元素,Wi表示兩個描述向量中第i個元素之間的權(quán)重,SinKai, bj表示保健食品a和保健食品b的描述向量中第i個元素之間的相似度。
[0063]S460,若所述未收錄的保健食品與已收錄的保健食品之間的相似度高于預設的相似度閾值,則建立所述未收錄的保健食品同所述已收錄的保健食品相關聯(lián)的疾病之間的關聯(lián)關系。
[0064]可以預先設置已收錄保健食品與未收錄保健食品之間的相似度閾值,當計算得到的未收錄保健食品與已收錄保健食品之間的相似度高于該相似度閾值時,則認為所述未收錄保健食品與所述已收錄保健食品非常相似。因此,可以將所述已收錄保健食品的疾病關聯(lián)關系拷貝至所述未收錄保健食品,也就是加你所述未收錄的保健食品同所述已收錄的保健食品相關聯(lián)的疾病之間的關聯(lián)關系。
[0065]圖5示出了為描述語料庫中未收錄的保健食品建立關聯(lián)疾病的流程。參見圖5,已收錄的保健食品510在建立的數(shù)據(jù)庫中有與之相關聯(lián)的疾病512。而對于未收錄的保健食品520,由于在所述描述語料庫中沒有收錄關于它的相關數(shù)據(jù),并不能挖掘出與它有關聯(lián)關系的疾病數(shù)據(jù)。但是,已收錄的保健食品510和未收錄的保健食品520都有它們各自的描述向量511、521。利用它們的描述向量511、521計算二者之間的相似度,并且在二者之間的相似度高于預設的相似度閾值時將所述已收錄的保健食品510的關聯(lián)疾病數(shù)據(jù)512拷貝給所述未收錄的保健食品520,就完成了對未收錄的保健食品520的關聯(lián)疾病數(shù)據(jù)的挖掘522。
[0066]本實施例通過在建立所述保健食品與所述描述語料中出現(xiàn)的疾病之間的關聯(lián)關系之后,根據(jù)保健食品的描述字段計算所述描述語料庫中已收錄的保健食品與未收錄的保健食品之間的相似度,并且當所述未收錄的保健食品與已收錄的保健食品之間的相似度高于預設的相似度閾值時,建立所述未收錄的保健食品同所述已收錄的保健食品相關聯(lián)的疾病之間的關聯(lián)關系,完成了描述語料中未收錄的保健食品與疾病之間的關聯(lián),解決了參考信息源的數(shù)據(jù)稀疏問題。
[0067]圖6示出了本發(fā)明的第三實施例。
[0068]圖6是本發(fā)明第三實施例提供的保健食品關聯(lián)知識庫構(gòu)建方法的流程圖。所述保健食品關聯(lián)知識庫構(gòu)建方法以本發(fā)明第一實施例為基礎,進一步的,建立所述保健食品與所述描述預料中出現(xiàn)的疾病之間的關聯(lián)關系之后,還包括:利用所述保健食品對應的癥狀以及與所述保健食品之間有關聯(lián)關系的疾病的癥狀,計算所述保健食品同與之具有關聯(lián)關系的疾病之間的相似度,并根據(jù)所述保健食品與所述疾病之間的相似度對所述保健食品與所述疾病之間的關聯(lián)關系進行確認。
[0069]參見圖6,所述保健食品關聯(lián)知識庫構(gòu)建方法包括:
[0070]S610,利用預置的保健食品知識庫中保健食品的名稱關鍵詞檢索參考信息源。
[0071]S620,利用對所述參考信息源的檢索結(jié)果建立關于所述保健食品的描述語料庫。
[0072]S630,利用預先配置的疾病詞典對所述描述語料庫中所述保健食品的描述語料進行分詞。
[0073]S640,根據(jù)分詞結(jié)果,建立所述保健食品與所述描述語料中出現(xiàn)的疾病之間的關聯(lián)關系。
[0074]S650,利用所述保健食品對應的癥狀以及與所述保健食品之間有關聯(lián)關系的疾病的癥狀,計算所述保健食品同與之具有關聯(lián)關系的疾病之間的相似度,并根據(jù)所述保健食品與所述疾病之間的相似度對所述保健食品與所述疾病之間的關聯(lián)關系進行確認。
[0075]因為所述保健食品的描述語料可能出現(xiàn)數(shù)據(jù)不準確的情況,所以已經(jīng)建立的保健食品與疾病之間的關聯(lián)關系也可能會有數(shù)據(jù)不準確的情況出現(xiàn)。在本實施例中,建立了所述保健食品與所述疾病之間的關聯(lián)關系以后,對所建立的保健食品與疾病之間的關聯(lián)關系進行確認。
[0076]對所述保健食品與所述疾病之間的關聯(lián)關系的確認需要依據(jù)與它們相關的癥狀數(shù)據(jù)。假設疾病d和保健品h存在關聯(lián),疾病d對應的癥狀的集合為S1 = Isym1, sym2,…,symn},保健品h功效對應的癥狀集合為S2 = (Sym1, sym2,…,symm},通過計算SI和S2的相關性,得到疾病d和保健品h功效的相似度。
[0077]設S = S1 U S2為疾病和保健品功效對應的所有癥狀,所述疾病與所述保健品之間的相似度計算公式推導過程如下:
「 ?Σ M log + V h{i) log
[0078]n h , , ^ +h(i) zTd{i).c
Dn\d I I h) = --^" e 5 0
[0079]其中,d(i) = num⑴/num(S), num⑴為癥狀i在疾病d的描述文檔中出現(xiàn)的總次數(shù),num(S)為S中的所有癥狀在疾病d的描述文檔中出現(xiàn)的次數(shù)的和。類似的,h(i)=num⑴為癥狀i在保健品的描述文檔中出現(xiàn)的總次數(shù),num(S)為S中的所有癥狀在保健品h的描述文檔中出現(xiàn)的次數(shù)的和。
[0080]上述公式的計算結(jié)果,也就是D1Jd I |h)越大則疾病與保健品的相關度越低??梢愿鶕?jù)實際情況調(diào)整閾值,將相似度低于閾值的結(jié)果從構(gòu)建出的關聯(lián)中刪除,以確保準確率。
[0081]本實施例通過收集保健食品及疾病對應的癥狀數(shù)據(jù),根據(jù)所述保健食品對應的癥狀以及所述疾病對應的癥狀計算所述保健食品與所述疾病之間的相似度,并根據(jù)計算得到的所述保健食品與所述疾病之間的相似度對所述保健食品與所述疾病之間的關聯(lián)關系進行確認,從而保證了保健食品關聯(lián)知識庫中關聯(lián)關系的準確,提高了數(shù)據(jù)的可信度。
[0082]圖7示出了本發(fā)明的第四實施例。
[0083]圖7是本發(fā)明第四實施例提供的保健食品關聯(lián)知識庫構(gòu)建裝置的結(jié)構(gòu)圖。參見圖7,所述保健食品關聯(lián)知識庫構(gòu)建裝置包括:參考信息檢索模塊710、語料庫建立模塊720、語料分詞模塊730以及關聯(lián)建立模塊740。
[0084]所述參考信息檢索模塊710用于利用預置的保健食品知識庫中保健食品的名稱關鍵詞檢索參考信息源。
[0085]所述語料庫建立模塊720用于利用對所述參考信息源的檢索結(jié)果建立關于所述保健食品的描述語料庫。
[0086]所述語料分詞模塊730用于利用預先配置的疾病詞典對所述描述語料庫中所述保健食品的描述語料進行分詞。
[0087]所述關聯(lián)建立模塊740用于根據(jù)分詞結(jié)果,建立所述保健食品與所述描述語料中出現(xiàn)的疾病之間的關聯(lián)關系。
[0088]優(yōu)選的,所述保健食品關聯(lián)知識庫構(gòu)建裝置還包括:保健食品相似度計算模塊750以及關聯(lián)關系拷貝模塊760。
[0089]所述保健食品相似度計算模塊750用于在根據(jù)分詞結(jié)果,建立所述保健食品與所述描述預料中出現(xiàn)的疾病之間的關聯(lián)關系之后,根據(jù)保健食品的描述字段計算所述描述語料庫中已收錄的保健食品與未收錄的保健食品之間的相似度。
[0090]所述關聯(lián)關系拷貝模塊760用于在所述未收錄的保健食品與已收錄的保健食品之間的相似度高于預設的相似度閾值之時,則建立所述未收錄的保健食品同所述已收錄的保健食品相關聯(lián)的疾病之間的關聯(lián)關系。
[0091]優(yōu)選的,所述保健食品關聯(lián)知識庫構(gòu)建裝置還包括:關聯(lián)關系確認模塊770。
[0092]所述關聯(lián)關系確認模塊770用于在根據(jù)分詞結(jié)果,建立所述保健食品與所述描述預料中出現(xiàn)的疾病之間的關聯(lián)關系之后,利用所述保健食品對應的癥狀以及與所述保健食品之間有關聯(lián)關系的疾病的癥狀,計算所述保健食品同與之具有關聯(lián)關系的疾病之間的相似度,并根據(jù)所述保健食品與所述疾病之間的相似度對所述保健食品與所述疾病之間的關聯(lián)關系進行確認。
[0093]優(yōu)選的,所述語料庫建立模塊720包括:檢索結(jié)果過濾單元721以及數(shù)據(jù)合并單元722。
[0094]所述檢索結(jié)果過濾單元721用于根據(jù)所述參考信息源中的段落標題,對所述檢索結(jié)果進行過濾,以獲得有效的描述語料數(shù)據(jù)。
[0095]所述數(shù)據(jù)合并單元722用于將關于相同保健食品的有效的描述語料數(shù)據(jù)合并,從而建立關于所述保健食品的描述語料庫。
[0096]優(yōu)選的,所述保健食品的描述字段包括所述保健食品的名稱字段、功效字段以及成分字段。
[0097]優(yōu)選的,所述已收錄的保健食品與未收錄的保健食品之間的相似度包括所述已收錄的保健食品與未收錄的保健食品之間的余弦相似度。
[0098]上述本發(fā)明實施例序號僅僅為了描述,不代表實施例的優(yōu)劣。
[0099]本領域普通技術(shù)人員應該明白,上述的本發(fā)明的各模塊或各步驟可以用通用的計算裝置來實現(xiàn),它們可以集中在單個計算裝置上,或者分布在多個計算裝置所組成的網(wǎng)絡上,可選地,他們可以用計算機裝置可執(zhí)行的程序代碼來實現(xiàn),從而可以將它們存儲在存儲裝置中由計算裝置來執(zhí)行,或者將它們分別制作成各個集成電路模塊,或者將它們中的多個模塊或步驟制作成單個集成電路模塊來實現(xiàn)。這樣,本發(fā)明不限制于任何特定的硬件和軟件的結(jié)合。
[0100]本說明書中的各個實施例均采用遞進的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間的相同或相似的部分互相參見即可。
[0101]以上所述僅為本發(fā)明的優(yōu)選實施例,并不用于限制本發(fā)明,對于本領域技術(shù)人員而言,本發(fā)明可以有各種改動和變化。凡在本發(fā)明的精神和原理之內(nèi)所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內(nèi)。
【權(quán)利要求】
1.一種保健食品關聯(lián)知識庫構(gòu)建方法,其特征在于,包括: 利用預置的保健食品知識庫中保健食品的名稱關鍵詞檢索參考信息源; 利用對所述參考信息源的檢索結(jié)果建立關于所述保健食品的描述語料庫; 利用預先配置的疾病詞典對所述描述語料庫中所述保健食品的描述語料進行分詞; 根據(jù)分詞結(jié)果,建立所述保健食品與所述描述語料中出現(xiàn)的疾病之間的關聯(lián)關系。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在根據(jù)分詞結(jié)果,建立所述保健食品與所述描述預料中出現(xiàn)的疾病之間的關聯(lián)關系之后,還包括: 根據(jù)保健食品的描述字段計算所述描述語料庫中已收錄的保健食品與未收錄的保健食品之間的相似度; 若所述未收錄的保健食品與已收錄的保健食品之間的相似度高于預設的相似度閾值,則建立所述未收錄的保健食品同所述已收錄的保健食品相關聯(lián)的疾病之間的關聯(lián)關系。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,在根據(jù)分詞結(jié)果,建立所述保健食品與所述描述預料中出現(xiàn)的疾病之間的關聯(lián)關系之后,還包括: 利用所述保健食品對應的癥狀以及與所述保健食品之間有關聯(lián)關系的疾病的癥狀,計算所述保健食品同與之具有關聯(lián)關系的疾病之間的相似度,并根據(jù)所述保健食品與所述疾病之間的相似度對所述保健食品與所述疾病之間的關聯(lián)關系進行確認。
4.根據(jù)權(quán)利要求1-3任一所述的方法,其特征在于,利用對所述參考信息源的檢索結(jié)果建立關于所述保健食品的描述語料庫包括: 根據(jù)所述參考信息源中的段落標題,對所述檢索結(jié)果進行過濾,以獲得有效的描述語料數(shù)據(jù); 將關于相同保健食品的有效的描述語料數(shù)據(jù)合并,從而建立關于所述保健食品的描述語料庫。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述保健食品的描述字段包括所述保健食品的名稱字段、功效字段以及成分字段。
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述已收錄的保健食品與未收錄的保健食品之間的相似度包括所述已收錄的保健食品與未收錄的保健食品之間的余弦相似度。
7.一種保健食品關聯(lián)知識庫構(gòu)建裝置,其特征在于,包括: 參考信息檢索模塊,用于利用預置的保健食品知識庫中保健食品的名稱關鍵詞檢索參考信息源; 語料庫建立模塊,用于利用對所述參考信息源的檢索結(jié)果建立關于所述保健食品的描述語料庫; 語料分詞模塊,用于利用預先配置的疾病詞典對所述描述語料庫中所述保健食品的描述語料進行分詞; 關聯(lián)建立模塊,用于根據(jù)分詞結(jié)果,建立所述保健食品與所述描述語料中出現(xiàn)的疾病之間的關聯(lián)關系。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,還包括: 保健食品相似度計算模塊,用于在根據(jù)分詞結(jié)果,建立所述保健食品與所述描述預料中出現(xiàn)的疾病之間的關聯(lián)關系之后,根據(jù)保健食品的描述字段計算所述描述語料庫中已收錄的保健食品與未收錄的保健食品之間的相似度; 關聯(lián)關系拷貝模塊,用于在所述未收錄的保健食品與已收錄的保健食品之間的相似度高于預設的相似度閾值之時,則建立所述未收錄的保健食品同所述已收錄的保健食品相關聯(lián)的疾病之間的關聯(lián)關系。
9.根據(jù)權(quán)利要求7所述的裝置,其特征在于,還包括: 關聯(lián)關系確認模塊,用于在根據(jù)分詞結(jié)果,建立所述保健食品與所述描述預料中出現(xiàn)的疾病之間的關聯(lián)關系之后,利用所述保健食品對應的癥狀以及與所述保健食品之間有關聯(lián)關系的疾病的癥狀,計算所述保健食品同與之具有關聯(lián)關系的疾病之間的相似度,并根據(jù)所述保健食品與所述疾病之間的相似度對所述保健食品與所述疾病之間的關聯(lián)關系進行確認。
10.根據(jù)權(quán)利要求7-9任一所述的裝置,其特征在于,所述語料庫建立模塊包括: 檢索結(jié)果過濾單元,用于根據(jù)所述參考信息源中的段落標題,對所述檢索結(jié)果進行過濾,以獲得有效的描述語料數(shù)據(jù); 數(shù)據(jù)合并單元,用于將關于相同保健食品的有效的描述語料數(shù)據(jù)合并,從而建立關于所述保健食品的描述語料庫。
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述保健食品的描述字段包括所述保健食品的名稱字段、功效字段以及成分字段。
12.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述已收錄的保健食品與未收錄的保健食品之間的相似度包括所述已收錄的保健食品與未收錄的保健食品之間的余弦相似度。
【文檔編號】G06F17/30GK104239500SQ201410459501
【公開日】2014年12月24日 申請日期:2014年9月10日 優(yōu)先權(quán)日:2014年9月10日
【發(fā)明者】曾剛, 陸彬, 李岱峰, 伊凱 申請人:百度在線網(wǎng)絡技術(shù)(北京)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
墨竹工卡县| 团风县| 长宁区| 平罗县| 兴海县| 永和县| 祁阳县| 嵊泗县| 盐源县| 南皮县| 永济市| 连城县| 准格尔旗| 大连市| 桃江县| 萨迦县| 灌云县| 福安市| 汝南县| 仪征市| 阿巴嘎旗| 湖北省| 嘉峪关市| 新津县| 满城县| 股票| 社会| 凤庆县| 开平市| 安福县| 寻甸| 蓬安县| 乾安县| 北流市| 临漳县| 南开区| 敦煌市| 澄江县| 启东市| 固镇县| 青冈县|