專利名稱:一種用于識(shí)別同名信息實(shí)體的方法與設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種用于識(shí)別同名信息實(shí)體的方法與設(shè)備。
背景技術(shù):
現(xiàn)有技術(shù)采用一級(jí)區(qū)分的方式識(shí)別多個(gè)同名的信息實(shí)體,如在即時(shí)通信工具QQ 中輸入“貝貝”來(lái)查找名字為“貝貝”的網(wǎng)友,查詢結(jié)果列表中將列出使用“賬號(hào)”、“昵稱”、 “城市”組成的區(qū)分信息來(lái)識(shí)別的所有名字為“貝貝”的網(wǎng)友記錄,由此在同名網(wǎng)友數(shù)量很多的情況下,很可能導(dǎo)致各條同名網(wǎng)友記錄的可識(shí)別性差,用戶難于定位其希望查找的網(wǎng)友。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種用于識(shí)別同名信息實(shí)體的方法與設(shè)備。根據(jù)本發(fā)明的一個(gè)方面,提供一種用于識(shí)別同名信息實(shí)體的方法,其中,該方法包括以下步驟a獲取待識(shí)別多個(gè)同名信息實(shí)體的基本區(qū)分信息;b根據(jù)所述基本區(qū)分信息,識(shí)別具有不同所述基本區(qū)分信息的同名信息實(shí)體;c根據(jù)具有相同所述基本區(qū)分信息的同名信息實(shí)體,獲取所述同名信息實(shí)體的高級(jí)區(qū)分信息;d根據(jù)所述高級(jí)區(qū)分信息,識(shí)別具有不同所述高級(jí)區(qū)分信息的所述同名信息實(shí)體。根據(jù)本發(fā)明的一個(gè)方面,提供一種用于識(shí)別同名信息實(shí)體的設(shè)備,其中,該設(shè)備包括基本區(qū)分獲取裝置,用于獲取待識(shí)別多個(gè)同名信息實(shí)體的基本區(qū)分信息;基本區(qū)分識(shí)別裝置,用于根據(jù)所述基本區(qū)分信息,識(shí)別具有不同所述基本區(qū)分信息的同名信息實(shí)體;高級(jí)區(qū)分獲取裝置,用于根據(jù)具有相同所述基本區(qū)分信息的同名信息實(shí)體,獲取所述同名信息實(shí)體的高級(jí)區(qū)分信息;高級(jí)區(qū)分識(shí)別裝置,用于根據(jù)所述高級(jí)區(qū)分信息,識(shí)別具有不同所述高級(jí)區(qū)分信息的所述同名信息實(shí)體。與現(xiàn)有技術(shù)相比,本發(fā)明通過(guò)建立多級(jí)區(qū)分信息,逐級(jí)識(shí)別多個(gè)同名信息實(shí)體,從而提高同名信息實(shí)體的可識(shí)別性,提升用戶體驗(yàn)。
通過(guò)閱讀參照以下附圖所作的對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯圖1示出根據(jù)本發(fā)明一個(gè)方面用于識(shí)別同名信息實(shí)體的設(shè)備示意圖;圖2示出根據(jù)本發(fā)明另一個(gè)方面用于識(shí)別同名信息實(shí)體的的方法流程圖。
附圖中相同或相似的附圖標(biāo)記代表相同或相似的部件。
具體實(shí)施例方式下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)描述。圖1示出根據(jù)本發(fā)明一個(gè)方面用于識(shí)別同名信息實(shí)體的設(shè)備示意圖。信息實(shí)體識(shí)別設(shè)備1包括基本區(qū)分獲取裝置11、基本區(qū)分識(shí)別裝置12、高級(jí)區(qū)分獲取裝置13和高級(jí)區(qū)分識(shí)別裝置14。在此,信息實(shí)體識(shí)別設(shè)備1包括但不限于計(jì)算機(jī)、網(wǎng)絡(luò)主機(jī)、單個(gè)網(wǎng)絡(luò)服務(wù)器、多個(gè)網(wǎng)絡(luò)服務(wù)器集或多個(gè)服務(wù)器構(gòu)成的云。在此,云由基于云計(jì)算(Cloud Computing) 的大量計(jì)算機(jī)或網(wǎng)絡(luò)服務(wù)器構(gòu)成,其中,云計(jì)算是分布式計(jì)算的一種,由一群松散耦合的計(jì)算機(jī)集組成的一個(gè)超級(jí)虛擬計(jì)算機(jī)。具體地,基本區(qū)分獲取裝置11獲取待識(shí)別多個(gè)同名信息實(shí)體的基本區(qū)分信息。更具體地,基本區(qū)分獲取裝置11通過(guò)諸如對(duì)多個(gè)同名信息實(shí)體進(jìn)行分析,獲取該多個(gè)同名信息實(shí)體共有的預(yù)先定義的基礎(chǔ)屬性,并將該基礎(chǔ)屬性作為基本區(qū)分信息,或者通過(guò)約定的通信方式直接從信息實(shí)體識(shí)別設(shè)備1的其他部分或第三方設(shè)備讀取該基本區(qū)分信息。其中,上述信息實(shí)體意指具有結(jié)構(gòu)化或半結(jié)構(gòu)化特征的數(shù)據(jù),包括但不限于網(wǎng)絡(luò)百科中的詞條,電子商務(wù)網(wǎng)站中的商品信息,電子圖書館中的圖書條目,電子期刊網(wǎng)站中的期刊、論文信息等。在此,基本區(qū)分信息意指能夠用于區(qū)分同名信息實(shí)體的信息,包括但不限于信息實(shí)體的一個(gè)區(qū)分屬性、信息實(shí)體的多個(gè)區(qū)分屬性等。例如,假設(shè)信息實(shí)體為網(wǎng)絡(luò)百科中的詞條,基本區(qū)分獲取裝置11對(duì)多個(gè)名稱同為“星光大道”的詞條進(jìn)行分析,獲得其共有的預(yù)置屬性“分類”,并將該屬性作為基本區(qū)分信息。再如,基本區(qū)分獲取裝置11將該多個(gè)同名信息實(shí)體作為輸入?yún)?shù),通過(guò)調(diào)用設(shè)定的應(yīng)用編程接口(API)向第三方設(shè)備發(fā)送獲取該多個(gè)同名信息實(shí)體的基本區(qū)分信息的請(qǐng)求,并接收該第三方設(shè)備基于該請(qǐng)求返回的基本區(qū)分信息。本領(lǐng)域技術(shù)人員應(yīng)能理解上述獲取基本區(qū)分信息的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取基本區(qū)分信息的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。隨后,基本區(qū)分識(shí)別裝置12根據(jù)所述基本區(qū)分信息,識(shí)別具有不同所述基本區(qū)分信息的同名信息實(shí)體。具體地,基本區(qū)分識(shí)別裝置12根據(jù)基本區(qū)分獲取裝置11獲得的多個(gè)同名信息實(shí)體的基本區(qū)分信息,例如通過(guò)提取該區(qū)分信息中該些同名信息實(shí)體共有的一個(gè)或多個(gè)區(qū)分屬性,并比較該些同名信息實(shí)體中該區(qū)分屬性的屬性值,以識(shí)別具有不同基本區(qū)分信息的同名信息實(shí)體。例如,假設(shè)信息實(shí)體為網(wǎng)絡(luò)百科中的詞條,存在5個(gè)名稱同為 “星光大道”的詞條El、E2、E3、E4、E5,El代表中國(guó)中央電視臺(tái)的綜藝節(jié)目,E2代表臺(tái)灣中視臺(tái)的綜藝節(jié)目,E3代表歌手譚詠麟的一張音樂(lè)專輯,E4代表香港的一條海濱長(zhǎng)廊,E5代表美國(guó)好萊塢的一個(gè)人行道。基本區(qū)分識(shí)別裝置12遍歷基本區(qū)分獲取裝置11獲得的基本區(qū)分信息,獲得其中包含的一個(gè)區(qū)分屬性“分類”,通過(guò)比較該5個(gè)詞條中“分類”屬性的屬性值,獲得El與E2具有相同的分類“電視節(jié)目”,E4與E5具有相同的分類“道路”,而E3的分類為“音樂(lè)專輯”,從而識(shí)別出詞條E3。再如,假設(shè)信息實(shí)體為電子商務(wù)網(wǎng)站的商品,存在 4件商標(biāo)同為“雨虹”的商品,其中3件商品Cl,C2,C3為防水涂料,1件商品C4為挖掘機(jī), 基本區(qū)分獲取裝置11提供的基本區(qū)分信息包含兩個(gè)區(qū)分屬性“應(yīng)用領(lǐng)域”和“產(chǎn)地”,基本區(qū)分識(shí)別裝置12根據(jù)區(qū)分屬性“應(yīng)用領(lǐng)域”獲得Cl,C2,C3的屬性值都為“裝修”,C4的屬性值為“土建”,由此識(shí)別出商品C4,進(jìn)一步地,根據(jù)區(qū)分屬性“產(chǎn)地”獲得Cl,C3的屬性值都為“北京”,C2的屬性值為“上?!?,由此識(shí)別出商品C2。本領(lǐng)域技術(shù)人員應(yīng)能理解上述識(shí)別同名信息實(shí)體的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的識(shí)別同名信息實(shí)體的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。接著,高級(jí)區(qū)分獲取裝置13根據(jù)具有相同所述基本區(qū)分信息的同名信息實(shí)體,獲取所述同名信息實(shí)體的高級(jí)區(qū)分信息。具體地,高級(jí)區(qū)分獲取裝置13根據(jù)基本區(qū)分識(shí)別裝置12識(shí)別后的具有相同基本區(qū)分信息的同名信息實(shí)體,例如通過(guò)遍歷該同名信息實(shí)體中該基本區(qū)分信息所包含的屬性之外的其他共有屬性,獲取該屬性在信息實(shí)體中的權(quán)重,將權(quán)重較高的一個(gè)或多個(gè)屬性作為所述同名信息實(shí)體的高級(jí)區(qū)分信息。例如,根據(jù)基本區(qū)分識(shí)別裝置12識(shí)別后獲得的具有相同“分類”基本區(qū)分屬性的名稱同為“星光大道”的網(wǎng)絡(luò)百科詞條El與E2,E4與E5,其中El代表中國(guó)中央電視臺(tái)的綜藝節(jié)目,E2代表臺(tái)灣中視臺(tái)的綜藝節(jié)目,E4代表香港的一條海濱長(zhǎng)廊,E5代表美國(guó)好萊塢的一個(gè)人行道,高級(jí)區(qū)分獲取裝置13遍歷El與E2同名詞條中除“分類”屬性之外的其他屬性,如“主持人”、“導(dǎo)演”、 “制作單位”、“播出時(shí)間”,從該同名詞條中獲取該些屬性在詞條中的預(yù)置的權(quán)重,通過(guò)比較各屬性權(quán)重,獲得屬性“主持人”在詞條中的屬性權(quán)重最高,故此,將該屬性作為同名詞條El 與E2的高級(jí)區(qū)分信息,接著高級(jí)區(qū)分獲取裝置13遍歷E4與E5同名詞條中除“分類”屬性之外的其他屬性,如“長(zhǎng)度”、“走向”、“所在城市”、“所在國(guó)家”,從該同名詞條中獲取該些屬性在詞條中的預(yù)置的屬性權(quán)重,通過(guò)比較各屬性權(quán)重,獲得屬性“所在城市”在詞條中的屬性權(quán)重最高,故此,將該屬性作為同名詞條E4與E5的高級(jí)區(qū)分信息。再如,根據(jù)基本區(qū)分識(shí)別裝置12識(shí)別后獲得的具有相同“應(yīng)用領(lǐng)域”和“產(chǎn)地”區(qū)分屬性的商標(biāo)名稱均為“雨虹” 的電子商務(wù)網(wǎng)站的商品Cl與C3,其中Cl和C3均為防水涂料,高級(jí)區(qū)分獲取裝置13遍歷該同名商品中除“應(yīng)用領(lǐng)域”和“產(chǎn)地”基本區(qū)分屬性之外的其他屬性,如“規(guī)格”、“價(jià)格”、 “銷售量”,從該同名商品中獲取該些屬性在商品中的預(yù)置的權(quán)重,通過(guò)比較各屬性的權(quán)重, 獲得屬性“銷售量”和“價(jià)格”在信息實(shí)體中的屬性權(quán)重最高,故此,將該些屬性作為同名商品Cl與C3的高級(jí)區(qū)分信息。在此,高級(jí)區(qū)分信息意指能夠用于區(qū)分同名信息實(shí)體的信息, 包括但不限于信息實(shí)體的一個(gè)區(qū)分屬性、信息實(shí)體的多個(gè)區(qū)分屬性等。本領(lǐng)域技術(shù)人員應(yīng)能理解上述獲取高級(jí)區(qū)分信息的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取高級(jí)區(qū)分信息如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。接著,高級(jí)區(qū)分識(shí)別裝置14根據(jù)所述高級(jí)區(qū)分信息,識(shí)別具有不同所述高級(jí)區(qū)分信息的所述同名信息實(shí)體。具體地,高級(jí)區(qū)分識(shí)別裝置14根據(jù)高級(jí)區(qū)分獲取裝置13獲得的同名信息實(shí)體的高級(jí)區(qū)分信息,例如通過(guò)提取該區(qū)分信息中一個(gè)或多個(gè)區(qū)分屬性,并比較該些同名信息實(shí)體中該區(qū)分屬性的屬性值,以識(shí)別具有不同高級(jí)區(qū)分信息的同名信息實(shí)體。例如,假設(shè)基本區(qū)分識(shí)別裝置12獲取具有相同基本區(qū)分信息的同名詞條El與E2、E4 與E5,其中,El代表中國(guó)中央電視臺(tái)的綜藝節(jié)目,E3代表歌手譚詠麟的一張音樂(lè)專輯,E4 代表香港的一條海濱長(zhǎng)廊,E5代表美國(guó)好萊塢的一個(gè)人行道,根據(jù)高級(jí)區(qū)分獲取裝置13獲取的同名詞條El與E2、E4與E5的高級(jí)區(qū)分信息,高級(jí)區(qū)分識(shí)別裝置14遍歷El與E2的高級(jí)區(qū)分信息,獲得其中包含的區(qū)分屬性“主持人”,通過(guò)比較El的該屬性的屬性值“畢福劍” 與E2的該屬性的屬性值“陶晶瑩”,識(shí)別出詞條El與E2,接著,高級(jí)區(qū)分識(shí)別裝置14遍歷 E4與E5的高級(jí)區(qū)分信息,獲得其中包含的區(qū)分屬性“所在城市”,通過(guò)比較E4的該屬性的屬性值“香港”與E5的該屬性的屬性值“洛杉磯”,識(shí)別出詞條E4與E5。再如,假設(shè)基本區(qū)分識(shí)別裝置12獲取具有相同基本區(qū)分信息的同名商品Cl與C3,其中Cl和C3均為防水涂料,根據(jù)高級(jí)區(qū)分獲取裝置13獲取的同名詞條Cl與C3的高級(jí)區(qū)分信息,高級(jí)區(qū)分識(shí)別裝置14遍歷該高級(jí)區(qū)分信息,獲得其中包含的區(qū)分屬性“價(jià)格”和“銷售量”,比較Cl和C3的 “價(jià)格”屬性值,獲得其屬性值相等,然后,比較Cl和C3的“銷售量”屬性值,獲得二者的“銷售量”屬性值不同,從而識(shí)別出詞條Cl與C3。本領(lǐng)域技術(shù)人員應(yīng)能理解上述識(shí)別同名信息實(shí)體的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的識(shí)別同名信息實(shí)體的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。在此,本領(lǐng)域技術(shù)人員應(yīng)能理解本發(fā)明不限于采用二級(jí)區(qū)分信息進(jìn)行同名信息實(shí)體識(shí)別,采用多級(jí)區(qū)分信息進(jìn)行同名信息實(shí)體識(shí)別也在本發(fā)明的保護(hù)范圍內(nèi)。優(yōu)選地,基本區(qū)分獲取裝置11和基本區(qū)分識(shí)別裝置12和高級(jí)區(qū)分獲取裝置13和高級(jí)區(qū)分識(shí)別裝置14之間是持續(xù)不斷地工作。具體地,基本區(qū)分獲取裝置11獲取待識(shí)別多個(gè)同名信息實(shí)體的基本區(qū)分信息;隨后,基本區(qū)分識(shí)別裝置12根據(jù)所述基本區(qū)分信息, 識(shí)別具有不同所述基本區(qū)分信息的同名信息實(shí)體;接著,高級(jí)區(qū)分獲取裝置13根據(jù)具有相同所述基本區(qū)分信息的同名信息實(shí)體,獲取所述同名信息實(shí)體的高級(jí)區(qū)分信息;接著,高級(jí)區(qū)分識(shí)別裝置14根據(jù)所述高級(jí)區(qū)分信息,識(shí)別具有不同所述高級(jí)區(qū)分信息的所述同名信息實(shí)體。在此,本領(lǐng)域技術(shù)人員應(yīng)理解“持續(xù)”是指各裝置分別按照設(shè)定的或?qū)崟r(shí)調(diào)整的工作模式要求進(jìn)行基本區(qū)分信息的獲取、根據(jù)基本區(qū)分信息的同名信息實(shí)體的識(shí)別、高級(jí)區(qū)分信息的獲取及根據(jù)高級(jí)區(qū)分信息的同名信息實(shí)體的識(shí)別,直至基本區(qū)分獲取裝置11在較長(zhǎng)時(shí)間內(nèi)停止對(duì)基本區(qū)分信息的獲取。優(yōu)選地,所述高級(jí)區(qū)分獲取裝置13還包括高級(jí)屬性獲取單元(未示出)、相似距離獲取單元(未示出)和第一獲取單元(未示出),其中,高級(jí)屬性獲取單元根據(jù)具有相同所述基本區(qū)分信息的所述同名信息實(shí)體,獲取所述同名信息實(shí)體的高級(jí)屬性,相似距離獲取單元根據(jù)所述高級(jí)屬性,獲取所述高級(jí)屬性的相似距離,第一獲取單元根據(jù)所述相似距離,獲取所述同名信息實(shí)體的高級(jí)區(qū)分信息。具體地,高級(jí)屬性獲取單元根據(jù)基本區(qū)分識(shí)別裝置12獲得的具有相同基本區(qū)分信息的同名信息實(shí)體,例如通過(guò)查找與該基本區(qū)分信息中的基本區(qū)分屬性相對(duì)應(yīng)的子屬性,并將該子屬性作為該同名信息實(shí)體的高級(jí)屬性;接著, 相似距離獲取單元根據(jù)高級(jí)屬性獲取單元獲得的所有高級(jí)屬性,獲取每個(gè)高級(jí)屬性的相似距離,例如根據(jù)每個(gè)高級(jí)屬性被其他信息實(shí)體引用的次數(shù),計(jì)算各高級(jí)屬性的相似距離;隨后,第一獲取單元根據(jù)相似距離獲取單元獲得的相似距離,獲取所述同名信息實(shí)體的高級(jí)區(qū)分信息。在此,上述相似距離意指信息實(shí)體中某個(gè)屬性對(duì)具有該屬性的多個(gè)同名信息實(shí)體的區(qū)分程度,相似距離越大,則區(qū)分程度越高。例如,基本區(qū)分識(shí)別裝置12獲得具有相同“分類”基本區(qū)分屬性的名稱同為“宋佳”的信息實(shí)體El和E2,它們的“分類”屬性值為 “影視演員”,假設(shè)每個(gè)“分類”屬性都具有與其屬性值相對(duì)應(yīng)的預(yù)定義的子屬性,高級(jí)屬性獲取單元根據(jù)“影視演員”在分類屬性映射表中進(jìn)行匹配查詢,以獲得與該“分類”屬性值對(duì)應(yīng)的子屬性“出生日期”、“畢業(yè)院?!焙汀按碜髌贰保⑵渥鳛樵撏畔?shí)體的高級(jí)屬性;接著,相似距離獲取單元根據(jù)信息實(shí)體E1,在關(guān)聯(lián)數(shù)據(jù)庫(kù)中進(jìn)行匹配查詢,以獲得與El 關(guān)聯(lián)的其他信息實(shí)體,并通過(guò)查找改其他信息實(shí)體中與El相對(duì)應(yīng)的關(guān)聯(lián)屬性,確定該其他信息實(shí)體是否引用在高級(jí)屬性獲取單元中獲得的該3個(gè)高級(jí)屬性,并據(jù)此獲得El中的高級(jí)屬性“出生日期”的引用次數(shù)為0,“畢業(yè)院?!钡囊么螖?shù)為5,“代表作品”的引用次數(shù)為 20,接著,通過(guò)相同的操作,獲得E2中的高級(jí)屬性“出生日期”的引用次數(shù)為0,“畢業(yè)院校” 的引用次數(shù)為8,“代表作品”的引用次數(shù)為8,最后,根據(jù)屬性引用次數(shù)越多,相似距離越大的規(guī)則,獲得該3個(gè)高級(jí)屬性的相似距離為“代表作品” > “畢業(yè)院?!?> “出生日期”;隨后,第一獲取單元將相似距離最大的高級(jí)屬性“代表作品”作為同名信息實(shí)體El和E2的高級(jí)區(qū)分信息。在此,所述實(shí)施例中的分類屬性映射表可存儲(chǔ)在高級(jí)屬性獲取單元,也可按照約定的通信方式從信息實(shí)體識(shí)別設(shè)備1的其他部分或第三方設(shè)備獲取。在此,所述實(shí)施例中的關(guān)聯(lián)數(shù)據(jù)庫(kù)用于存儲(chǔ)信息實(shí)體之間的關(guān)聯(lián)關(guān)系,該關(guān)聯(lián)數(shù)據(jù)庫(kù)包括但不限于關(guān)系數(shù)據(jù)庫(kù),內(nèi)存存儲(chǔ)器,硬盤存儲(chǔ)器等。本領(lǐng)域技術(shù)人員應(yīng)能理解上述獲取高級(jí)屬性信息、獲取相似距離及獲取高級(jí)區(qū)分信息的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取高級(jí)屬性信息、獲取相似距離及獲取高級(jí)區(qū)分信息的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。更優(yōu)選地,相似距離獲取單元根據(jù)所述高級(jí)屬性的評(píng)價(jià)信息,獲取所述高級(jí)屬性的相似距離。具體地,相似距離獲取單元根據(jù)高級(jí)屬性獲取單元提供的高級(jí)屬性,獲得該屬性的評(píng)價(jià)信息,例如該屬性在與之對(duì)應(yīng)的基本區(qū)分屬性的所有子屬性中的權(quán)重,并根據(jù)該評(píng)價(jià)信息,獲取高級(jí)屬性的相似距離。例如,高級(jí)屬性獲取單元獲取與同名信息實(shí)體“少林寺”的基本區(qū)分屬性“分類”的屬性值“影視作品”相對(duì)應(yīng)的子屬性“主角”、“導(dǎo)演”和“發(fā)行方”作為該同名信息實(shí)體的高級(jí)屬性,接著,相似距離獲取單元獲取各高級(jí)屬性在“影視作品”分類中的權(quán)重,其中“主角”權(quán)重為0.8,“導(dǎo)演”權(quán)重為1,“發(fā)行方”權(quán)重為0. 1,據(jù)此, 獲得該各高級(jí)屬性的相似距離為“導(dǎo)演”> “主角”> “發(fā)行方”。本領(lǐng)域技術(shù)人員應(yīng)能理解上述獲取相似距離的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取相似距離的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。具體地,所述評(píng)價(jià)信息包括但不限于以下至少任一項(xiàng)-所述高級(jí)屬性在所述同名信息實(shí)體中的權(quán)重;-所述高級(jí)屬性被其他信息實(shí)體引用的次數(shù)。例如,若該評(píng)價(jià)信息包括該高級(jí)屬性在同名信息實(shí)體中的權(quán)重,則相似距離獲取單元根據(jù)該權(quán)重獲得該高級(jí)屬性的相似距離, 其中,高級(jí)屬性的權(quán)重越高,則該高級(jí)屬性的相似距離越大,反之,則越小。若該評(píng)價(jià)信息包括該被其他信息實(shí)體引用的次數(shù),則相似距離獲取單元根據(jù)該引用次數(shù)獲得該高級(jí)屬性的相似距離,其中,高級(jí)屬性被引用的次數(shù)越多,則該高級(jí)屬性的相似距離越大,反之,則越小。本領(lǐng)域技術(shù)人員應(yīng)能理解,上述各項(xiàng)評(píng)價(jià)信息不僅可以單獨(dú)用于相似距離獲取單元對(duì)高級(jí)屬性的相似距離進(jìn)行獲取,還可以將其中多項(xiàng)結(jié)合用于相似距離獲取單元對(duì)高級(jí)屬性的相似距離進(jìn)行獲取。本領(lǐng)域技術(shù)人員還應(yīng)能理解上述評(píng)價(jià)信息僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的評(píng)價(jià)信息如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。更優(yōu)選地,所述相似距離獲取單元還包括相似度獲取單元(未示出)和相似距離確定單元(未示出),其中,相似度獲取單元對(duì)各所述同名信息實(shí)體中相同高級(jí)屬性的屬性值進(jìn)行語(yǔ)義分析,以獲得所述屬性值之間的語(yǔ)義相似度;相似距離確定單元根據(jù)所述語(yǔ)義相似度來(lái)確定與所述屬性值相對(duì)應(yīng)的高級(jí)屬性的相似距離。具體地,相似度獲取單元根據(jù)高級(jí)屬性獲取單元提供的各同名信息實(shí)體的高級(jí)屬性,對(duì)相同高級(jí)屬性的屬性值進(jìn)行語(yǔ)義分析,以獲得所述屬性值之間的語(yǔ)義相似度,例如通過(guò)利用分詞算法對(duì)屬性值進(jìn)行分詞,并將分詞后的屬性值進(jìn)行比較,獲得該屬性值之間的語(yǔ)義相似度;接著,相似距離確定單元根據(jù)相似度獲取單元獲取的該高級(jí)屬性的屬性值的語(yǔ)義相似度來(lái)確定與該屬性值相對(duì)應(yīng)的高級(jí)屬性的相似距離,如屬性值的語(yǔ)義相似度越低,則與該屬性值對(duì)應(yīng)的高級(jí)屬性的相似距離就越大。在此,上述語(yǔ)義分析包括但不限于通過(guò)文本比較,機(jī)器學(xué)習(xí)及決策樹分析等方法實(shí)現(xiàn)。例如,假設(shè)名稱同為“星光大道”的信息實(shí)體El和E2的高級(jí)屬性包括“主持人”和 “制作單位”,在El中,“主持人”的屬性值為“畢福劍”,“制作單位”的屬性值為“中國(guó)中央電視臺(tái)”,而在E2中,“主持人”的屬性值為“陶晶瑩”,“制作單位”的屬性值為“臺(tái)灣中視電視臺(tái)”,相似度獲取單元利用正向最大匹配分詞算法對(duì)El和E2中高級(jí)屬性“主持人”的屬性值分別進(jìn)行分詞,獲得分詞結(jié)果為“畢/福/劍”和“陶/晶/瑩”,通過(guò)對(duì)兩個(gè)分詞結(jié)果進(jìn)行文本比較確定它們之間沒(méi)有相同的分詞,據(jù)此,獲得“主持人”屬性值的語(yǔ)義相似度為 0,然后,相似度獲取單元利用相同的方法對(duì)高級(jí)屬性“主持人”的屬性值分別進(jìn)行分詞,獲得分詞結(jié)果為“中國(guó)/中央/電視臺(tái)”和“臺(tái)灣/中視/電視臺(tái)”,通過(guò)對(duì)兩個(gè)分詞結(jié)果進(jìn)行文本比較確定在3個(gè)分詞中有1個(gè)分詞“電視臺(tái)”相等,據(jù)此,獲得“制作單位”屬性值的語(yǔ)義相似度為0. 33 ;接著,相似距離確定單元根據(jù)相似度獲取單元獲取的高級(jí)屬性“主持人” 和“制作單位”的屬性值的語(yǔ)義相似度,按照屬性值語(yǔ)義相似度越大,屬性的相似距離越小的規(guī)則,確定高級(jí)屬性的相似距離為“主持人”>“制作單位”。在此,所述實(shí)施例中的分詞算法包括但不限于正向最大匹配,反向最大匹配,雙向最大匹配,語(yǔ)言模型方法,最短路徑算法等等。本領(lǐng)域技術(shù)人員還應(yīng)能理解上述獲得語(yǔ)義相似度的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲得語(yǔ)義相似度的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。本領(lǐng)域技術(shù)人員還應(yīng)能理解上述確定相似距離的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的確定相似距離的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。更優(yōu)選地,所述基本區(qū)分信息和所述高級(jí)區(qū)分信息之一包括所述多個(gè)同名信息實(shí)體的至少一個(gè)屬性,其中,所述基本區(qū)分信息和所述高級(jí)區(qū)分信息所包括的所述屬性彼此不相同。具體地,基本區(qū)分獲取裝置11獲取的基本區(qū)分信息中包括多個(gè)同名信息實(shí)體中共有的一個(gè)或多個(gè)屬性,高級(jí)區(qū)分獲取裝置13獲取的高級(jí)區(qū)分信息中包括該多個(gè)同名信息實(shí)體中共有的一個(gè)或多個(gè)屬性,并且該基本區(qū)分信息和該高級(jí)區(qū)分信息所包括的屬性彼此不相同。在另一個(gè)優(yōu)選實(shí)施例中(參照?qǐng)D1),信息實(shí)體識(shí)別設(shè)備1還包括查詢裝置(未示出)和提供裝置(未示出),其中,查詢裝置獲取與用戶通過(guò)用戶設(shè)備提交的查詢信息相對(duì)應(yīng)的所述多個(gè)同名信息實(shí)體;提供裝置將識(shí)別后的所述多個(gè)同名信息實(shí)體提供給所述用戶設(shè)備。以下參照?qǐng)D1對(duì)該另一個(gè)實(shí)施例進(jìn)行詳細(xì)描述,其中,高級(jí)區(qū)分識(shí)別裝置14基于高級(jí)區(qū)分獲取裝置13獲取的多個(gè)同名信息實(shí)體的高級(jí)區(qū)分信息,識(shí)別具有不同該高級(jí)區(qū)分信息的該多個(gè)同名信息實(shí)體,其具體過(guò)程與前述參照?qǐng)D1所描述的實(shí)施例中高級(jí)區(qū)分識(shí)別裝置14所執(zhí)行的過(guò)程相同,為簡(jiǎn)明起見(jiàn),以引用方式包含于此,而不做贅述。具體地,查詢裝置獲取與用戶通過(guò)用戶設(shè)備提交的查詢信息相對(duì)應(yīng)的所述多個(gè)同名信息實(shí)體。更具體地,查詢裝置根據(jù)用戶通過(guò)用戶設(shè)備提交的查詢信息,例如通過(guò)在信息實(shí)體數(shù)據(jù)庫(kù)中進(jìn)行匹配查詢,以獲取與該查詢信息相對(duì)應(yīng)的多個(gè)同名信息實(shí)體。在此,該用戶設(shè)備可以是任何一種可與用戶通過(guò)鍵盤、鼠標(biāo)、遙控器、觸摸板、或聲控設(shè)備進(jìn)行人機(jī)交互的電子產(chǎn)品,包括但不限于計(jì)算機(jī)、智能手機(jī)、PDA、或I PTV等。例如,用戶通過(guò)鍵盤在用戶設(shè)備所顯示的輸入框內(nèi)輸入的查詢信息為“星光大道”,則該用戶設(shè)備通過(guò)網(wǎng)絡(luò)將該查詢信息“星光大道”發(fā)送至信息實(shí)體識(shí)別設(shè)備1,由此使查詢裝置獲取該用戶輸入的查詢信息,接著,查詢裝置根據(jù)該查詢信息在信息實(shí)體數(shù)據(jù)庫(kù)中進(jìn)行匹配查詢,獲得名稱同為“星光大道”的多個(gè)信息實(shí)體。用戶設(shè)備與信息實(shí)體識(shí)別設(shè)備1連接的網(wǎng)絡(luò)包括但不限于互聯(lián)網(wǎng)、廣域網(wǎng)、城域網(wǎng)、局域網(wǎng)、VPN網(wǎng)絡(luò)、無(wú)線自組織網(wǎng)絡(luò)(Ad Hoc網(wǎng)絡(luò))等。在此,上述信息實(shí)體數(shù)據(jù)庫(kù)用于存儲(chǔ)已存在的所有信息實(shí)體,該信息實(shí)體數(shù)據(jù)庫(kù)包括但不限于關(guān)系數(shù)據(jù)庫(kù),內(nèi)存存儲(chǔ)器,硬盤存儲(chǔ)器等。本領(lǐng)域技術(shù)人員應(yīng)能理解上述獲取同名信息實(shí)體的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取同名信息實(shí)體的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。提供裝置將識(shí)別后的所述多個(gè)同名信息實(shí)體提供給所述用戶設(shè)備。具體地,提供裝置根據(jù)高級(jí)區(qū)分識(shí)別裝置14提供的該識(shí)別后的多個(gè)同名信息實(shí)體,例如通過(guò)約定的通信協(xié)議,提供給用戶設(shè)備,并在用戶設(shè)備上基于基本區(qū)分信息和高級(jí)區(qū)分信息逐級(jí)展現(xiàn)該多個(gè)同名信息實(shí)體。例如,提供裝置將識(shí)別后的多個(gè)名稱同為“星光大道”的信息實(shí)體通過(guò)諸如http、https等預(yù)先約定的通信協(xié)議提供給用戶設(shè)備,并根據(jù)該同名信息實(shí)體的基本區(qū)分信息和高級(jí)區(qū)分信息逐級(jí)展現(xiàn)該多個(gè)同名信息實(shí)體在該用戶設(shè)備的顯示裝置上。本領(lǐng)域技術(shù)人員應(yīng)能理解上述提供同名信息實(shí)體的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的提供同名信息實(shí)體的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。優(yōu)選地,提供裝置根據(jù)用戶相關(guān)信息,對(duì)識(shí)別后的所述多個(gè)同名信息實(shí)體進(jìn)行排序,并將排序后的所述多個(gè)同名信息實(shí)體提供給所述用戶設(shè)備。具體地,提供裝置根據(jù)用戶相關(guān)信息,如用戶的偏好設(shè)置,對(duì)高級(jí)區(qū)分識(shí)別裝置14提供的識(shí)別后的多個(gè)同名信息實(shí)體進(jìn)行排序,然后將排序后的所述多個(gè)同名信息實(shí)體提供給所述用戶設(shè)備。例如,假設(shè)信息實(shí)體為網(wǎng)絡(luò)百科中的詞條,每個(gè)詞條都具有其所屬的分類,用戶的偏好設(shè)置為根據(jù)詞條的分類級(jí)別對(duì)多個(gè)同名詞條進(jìn)行排序,提供裝置根據(jù)該用戶偏好設(shè)置,對(duì)于識(shí)別后同名詞條E1、 E2和E3(E1的分類為一級(jí)分類“人物”,E2的分類為二級(jí)分類“藝術(shù)人物”,E3的分類為三級(jí)分類“歌手”)按照分類級(jí)別由低到高的順序進(jìn)行排序,獲得排序結(jié)果E3、E2、E1,并將該排序結(jié)果提供給用戶設(shè)備。本領(lǐng)域技術(shù)人員應(yīng)能理解上述提供同名信息實(shí)體的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的提供同名信息實(shí)體的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。具體地,所述用戶相關(guān)信息包括以下至少任一項(xiàng)-用戶的偏好設(shè)置;-用戶的歷史行為記錄。例如,若所述用戶相關(guān)信息包括用戶的偏好設(shè)置,提供裝置根據(jù)用戶的偏好設(shè)置, 對(duì)識(shí)別后的所述多個(gè)同名信息實(shí)體進(jìn)行排序。在此,用戶的偏好設(shè)置包括但不限于優(yōu)先排列累計(jì)訪問(wèn)次數(shù)較高的信息實(shí)體,優(yōu)先排列近期訪問(wèn)頻次較高的信息實(shí)體等。若所述用戶相關(guān)信息包括用戶的歷史行為記錄,提供裝置根據(jù)用戶的歷史行為記錄,例如通過(guò)對(duì)該歷史行為記錄進(jìn)行統(tǒng)計(jì)分析,獲得該用戶在歷史上累計(jì)搜索次數(shù)較多的信息實(shí)體,并賦予其高排列優(yōu)先級(jí),據(jù)此,對(duì)識(shí)別后的所述多個(gè)同名信息實(shí)體進(jìn)行排序。例如,存在識(shí)別后的3 個(gè)同名信息實(shí)體El、E2、E 3,提供裝置按照缺省的排序規(guī)則獲得該同名信息實(shí)體的排序依次為E3、E2、E1,然后,提供裝置通過(guò)對(duì)該歷史行為記錄進(jìn)行統(tǒng)計(jì)分析,獲得該用戶在歷史上累計(jì)搜索次數(shù)最多的前100個(gè)信息實(shí)體的集合,并將信息實(shí)體E1、E2、E3在該集合中進(jìn)行匹配查找,確定E2存在于該集合,并據(jù)此調(diào)整該同名信息實(shí)體的排列順序?yàn)镋2、E3、E1。信息實(shí)體識(shí)別設(shè)備1獲取用戶相關(guān)信息的方式包括但不限于根據(jù)用戶通過(guò)用戶設(shè)備登錄該識(shí)別設(shè)備的注冊(cè)信息中獲取,或根據(jù)在用戶通過(guò)用戶設(shè)備瀏覽網(wǎng)頁(yè)期間由用戶設(shè)備端或網(wǎng)絡(luò)端所記錄的或由用戶設(shè)備的cookies信息中提取的用戶歷史行為信息中獲取等等。本領(lǐng)域技術(shù)人員應(yīng)能理解上述用戶相關(guān)信息僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的用戶相關(guān)信息如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。圖2示出根據(jù)本發(fā)明另一個(gè)方面用于識(shí)別同名信息實(shí)體的的方法流程圖。在此, 信息實(shí)體識(shí)別設(shè)備1包括但不限于計(jì)算機(jī)、網(wǎng)絡(luò)主機(jī)、單個(gè)網(wǎng)絡(luò)服務(wù)器、多個(gè)網(wǎng)絡(luò)服務(wù)器集或多個(gè)服務(wù)器構(gòu)成的云。在此,云由基于云計(jì)算(Cloud Computing)的大量計(jì)算機(jī)或網(wǎng)絡(luò)服務(wù)器構(gòu)成,其中,云計(jì)算是分布式計(jì)算的一種,由一群松散耦合的計(jì)算機(jī)集組成的一個(gè)超級(jí)虛擬計(jì)算機(jī)。具體地,在步驟Sl中,信息實(shí)體識(shí)別設(shè)備1獲取待識(shí)別多個(gè)同名信息實(shí)體的基本區(qū)分信息。更具體地,在步驟Sl中,信息實(shí)體識(shí)別設(shè)備1通過(guò)諸如對(duì)多個(gè)同名信息實(shí)體進(jìn)行分析,獲取該多個(gè)同名信息實(shí)體共有的預(yù)先定義的基礎(chǔ)屬性,并將該基礎(chǔ)屬性作為基本區(qū)分信息,或者通過(guò)約定的通信方式直接從第三方設(shè)備讀取該基本區(qū)分信息。其中,上述信息實(shí)體意指具有結(jié)構(gòu)化或半結(jié)構(gòu)化特征的數(shù)據(jù),包括但不限于網(wǎng)絡(luò)百科中的詞條,電子商務(wù)網(wǎng)站中的商品信息,電子圖書館中的圖書條目,電子期刊網(wǎng)站中的期刊、論文信息等。在此,基本區(qū)分信息意指能夠用于區(qū)分同名信息實(shí)體的信息,包括但不限于信息實(shí)體的一個(gè)區(qū)分屬性、信息實(shí)體的多個(gè)區(qū)分屬性等。例如,假設(shè)信息實(shí)體為網(wǎng)絡(luò)百科中的詞條,在步驟 Sl中,信息實(shí)體識(shí)別設(shè)備1對(duì)多個(gè)名稱同為“星光大道”的詞條進(jìn)行分析,獲得其共有的預(yù)置屬性“分類”,并將該屬性作為基本區(qū)分信息。再如,在步驟Sl中,信息實(shí)體識(shí)別設(shè)備1將該多個(gè)同名信息實(shí)體作為輸入?yún)?shù),通過(guò)調(diào)用設(shè)定的應(yīng)用編程接口(API)向第三方設(shè)備發(fā)送獲取該多個(gè)同名信息實(shí)體的基本區(qū)分信息的請(qǐng)求,并接收該第三方設(shè)備基于該請(qǐng)求返回的基本區(qū)分信息。本領(lǐng)域技術(shù)人員應(yīng)能理解上述獲取基本區(qū)分信息的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取基本區(qū)分信息的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。隨后,在步驟S2中,信息實(shí)體識(shí)別設(shè)備1根據(jù)所述基本區(qū)分信息,識(shí)別具有不同所述基本區(qū)分信息的同名信息實(shí)體。具體地,在步驟S2中,信息實(shí)體識(shí)別設(shè)備1根據(jù)其在步驟Sl中獲得的多個(gè)同名信息實(shí)體的基本區(qū)分信息,例如通過(guò)提取該區(qū)分信息中該些同名信息實(shí)體共有的一個(gè)或多個(gè)區(qū)分屬性,并比較該些同名信息實(shí)體中該區(qū)分屬性的屬性值, 以識(shí)別具有不同基本區(qū)分信息的同名信息實(shí)體。例如,假設(shè)信息實(shí)體為網(wǎng)絡(luò)百科中的詞條, 存在5個(gè)名稱同為“星光大道”的詞條E1、E2、E3、E4、E5,El代表中國(guó)中央電視臺(tái)的綜藝節(jié)目,E2代表臺(tái)灣中視臺(tái)的綜藝節(jié)目,E3代表歌手譚詠麟的一張音樂(lè)專輯,E4代表香港的一條海濱長(zhǎng)廊,E5代表美國(guó)好萊塢的一個(gè)人行道。在步驟S2中,信息實(shí)體識(shí)別設(shè)備1遍歷其在步驟Sl中獲得的基本區(qū)分信息,獲得其中包含的一個(gè)區(qū)分屬性“分類”,通過(guò)比較該5個(gè)詞條中“分類”屬性的屬性值,獲得El與E2具有相同的分類“電視節(jié)目”,E4與E5具有相同的分類“道路”,而E3的分類為“音樂(lè)專輯”,從而識(shí)別出詞條E3。再如,假設(shè)信息實(shí)體為電子商務(wù)網(wǎng)站的商品,存在4件商標(biāo)同為“雨虹”的商品,其中3件商品C1,C2,C3為防水涂料,1件商品C4為挖掘機(jī),在步驟Sl中,信息實(shí)體識(shí)別設(shè)備1提供的基本區(qū)分信息包含兩個(gè)區(qū)分屬性“應(yīng)用領(lǐng)域”和“產(chǎn)地”,在步驟S2中,信息實(shí)體識(shí)別設(shè)備1根據(jù)區(qū)分屬性“應(yīng)用領(lǐng)域”獲得Cl,C2,C3的屬性值都為“裝修”,C4的屬性值為“土建”,由此識(shí)別出商品C4,進(jìn)一步地,根據(jù)區(qū)分屬性“產(chǎn)地”獲得Cl,C3的屬性值都為“北京”,C2的屬性值為“上?!保纱俗R(shí)別出商品C2。本領(lǐng)域技術(shù)人員應(yīng)能理解上述識(shí)別同名信息實(shí)體的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的識(shí)別同名信息實(shí)體的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。接著,在步驟S3中,信息實(shí)體識(shí)別設(shè)備1根據(jù)具有相同所述基本區(qū)分信息的同名信息實(shí)體,獲取所述同名信息實(shí)體的高級(jí)區(qū)分信息。具體地,在步驟S3中,信息實(shí)體識(shí)別設(shè)備1根據(jù)其在步驟S2中識(shí)別后的具有相同基本區(qū)分信息的同名信息實(shí)體,例如通過(guò)遍歷該同名信息實(shí)體中該基本區(qū)分信息所包含的屬性之外的其他共有屬性,獲取該屬性在信息實(shí)體中的權(quán)重,將權(quán)重較高的一個(gè)或多個(gè)屬性作為所述同名信息實(shí)體的高級(jí)區(qū)分信息。例如, 根據(jù)在步驟S2中識(shí)別后獲得的具有相同“分類”基本區(qū)分屬性的名稱同為“星光大道”的網(wǎng)絡(luò)百科詞條El與E2,E4與E5,其中El代表中國(guó)中央電視臺(tái)的綜藝節(jié)目,E2代表臺(tái)灣中視臺(tái)的綜藝節(jié)目,E4代表香港的一條海濱長(zhǎng)廊,E5代表美國(guó)好萊塢的一個(gè)人行道,在步驟S3 中,信息實(shí)體識(shí)別設(shè)備1遍歷El與E2同名詞條中除“分類”屬性之外的其他屬性,如“主持人”、“導(dǎo)演”、“制作單位”、“播出時(shí)間”,從該同名詞條中獲取該些屬性在詞條中的預(yù)置的權(quán)重,通過(guò)比較各屬性權(quán)重,獲得屬性“主持人”在詞條中的屬性權(quán)重最高,故此,將該屬性作為同名詞條El與E2的高級(jí)區(qū)分信息,接著信息實(shí)體識(shí)別設(shè)備1遍歷E4與E5同名詞條中除 “分類”屬性之外的其他屬性,如“長(zhǎng)度”、“走向”、“所在城市”、“所在國(guó)家”,從該同名詞條中獲取該些屬性在詞條中的預(yù)置的屬性權(quán)重,通過(guò)比較各屬性權(quán)重,獲得屬性“所在城市”在詞條中的屬性權(quán)重最高,故此,將該屬性作為同名詞條E4與E5的高級(jí)區(qū)分信息。再如,根據(jù)其在步驟S 2中識(shí)別后獲得的具有相同“應(yīng)用領(lǐng)域”和“產(chǎn)地”區(qū)分屬性的商標(biāo)名稱均為 “雨虹”的電子商務(wù)網(wǎng)站的商品Cl與C3,其中Cl和C3均為防水涂料,在步驟S3中,信息實(shí)體識(shí)別設(shè)備1遍歷該同名商品中除“應(yīng)用領(lǐng)域”和“產(chǎn)地”基本區(qū)分屬性之外的其他屬性,如 “規(guī)格”、“價(jià)格”、“銷售量”,從該同名商品中獲取該些屬性在商品中的預(yù)置的權(quán)重,通過(guò)比較各屬性的權(quán)重,獲得屬性“銷售量”和“價(jià)格”在信息實(shí)體中的屬性權(quán)重最高,故此,將該些屬性作為同名商品Cl與C3的高級(jí)區(qū)分信息。在此,高級(jí)區(qū)分信息意指能夠用于區(qū)分同名信息實(shí)體的信息,包括但不限于信息實(shí)體的一個(gè)區(qū)分屬性、信息實(shí)體的多個(gè)區(qū)分屬性等。本領(lǐng)域技術(shù)人員應(yīng)能理解上述獲取高級(jí)區(qū)分信息的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取高級(jí)區(qū)分信息如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。接著,在步驟S4中,信息實(shí)體識(shí)別設(shè)備1根據(jù)所述高級(jí)區(qū)分信息,識(shí)別具有不同所述高級(jí)區(qū)分信息的所述同名信息實(shí)體。具體地,在步驟S4中,信息實(shí)體識(shí)別設(shè)備1根據(jù)其在步驟S3中獲得的同名信息實(shí)體的高級(jí)區(qū)分信息,例如通過(guò)提取該區(qū)分信息中一個(gè)或多個(gè)區(qū)分屬性,并比較該些同名信息實(shí)體中該區(qū)分屬性的屬性值,以識(shí)別具有不同高級(jí)區(qū)分信息的同名信息實(shí)體。例如,假設(shè)在步驟S2中,信息實(shí)體識(shí)別設(shè)備1獲取具有相同基本區(qū)分信息的同名詞條El與E2、E4與E5,其中,El代表中國(guó)中央電視臺(tái)的綜藝節(jié)目,E3代表歌手譚詠麟的一張音樂(lè)專輯,E4代表香港的一條海濱長(zhǎng)廊,E5代表美國(guó)好萊塢的一個(gè)人行道,根據(jù)在步驟S3中獲取的同名詞條El與E2、E4與E5的高級(jí)區(qū)分信息,在步驟S4中,信息實(shí)體識(shí)別設(shè)備1遍歷El與E2的高級(jí)區(qū)分信息,獲得其中包含的區(qū)分屬性“主持人”,通過(guò)比較El的該屬性的屬性值“畢福劍”與E2的該屬性的屬性值“陶晶瑩”,識(shí)別出詞條El與 E2,接著,信息實(shí)體識(shí)別設(shè)備1遍歷E4與E5的高級(jí)區(qū)分信息,獲得其中包含的區(qū)分屬性“所在城市”,通過(guò)比較E4的該屬性的屬性值“香港”與E5的該屬性的屬性值“洛杉磯”,識(shí)別出詞條E4與E5。再如,假設(shè)在步驟S2中,信息實(shí)體識(shí)別設(shè)備1獲取具有相同基本區(qū)分信息的同名商品Cl與C3,其中Cl和C3均為防水涂料,根據(jù)在步驟S3中獲取的同名詞條Cl與 C3的高級(jí)區(qū)分信息,在步驟S4中,信息實(shí)體識(shí)別設(shè)備1遍歷該高級(jí)區(qū)分信息,獲得其中包含的區(qū)分屬性“價(jià)格”和“銷售量”,比較Cl和C3的“價(jià)格”屬性值,獲得其屬性值相等,然后,比較Cl和C3的“銷售量”屬性值,獲得二者的“銷售量”屬性值不同,從而識(shí)別出詞條 Cl與C3。本領(lǐng)域技術(shù)人員應(yīng)能理解上述識(shí)別同名信息實(shí)體的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的識(shí)別同名信息實(shí)體的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。在此,本領(lǐng)域技術(shù)人員應(yīng)能理解本發(fā)明不限于采用二級(jí)區(qū)分信息進(jìn)行同名信息實(shí)體識(shí)別,采用多級(jí)區(qū)分信息進(jìn)行同名信息實(shí)體識(shí)別也在本發(fā)明的保護(hù)范圍內(nèi)。優(yōu)選地,上述各個(gè)步驟之間是持續(xù)不斷工作的。具體地,在步驟Sl中,信息實(shí)體識(shí)別設(shè)備1獲取待識(shí)別多個(gè)同名信息實(shí)體的基本區(qū)分信息;隨后,在步驟S2中,信息實(shí)體識(shí)別設(shè)備1根據(jù)所述基本區(qū)分信息,識(shí)別具有不同所述基本區(qū)分信息的同名信息實(shí)體;接著,在步驟S3中,信息實(shí)體識(shí)別設(shè)備1根據(jù)具有相同所述基本區(qū)分信息的同名信息實(shí)體,獲取所述同名信息實(shí)體的高級(jí)區(qū)分信息;接著,在步驟S4中,信息實(shí)體識(shí)別設(shè)備1根據(jù)所述高級(jí)區(qū)分信息,識(shí)別具有不同所述高級(jí)區(qū)分信息的所述同名信息實(shí)體。在此,本領(lǐng)域技術(shù)人員應(yīng)理解“持續(xù)”是指各步驟分別按照設(shè)定的或?qū)崟r(shí)調(diào)整的工作模式要求進(jìn)行基本區(qū)分信息的獲取、根據(jù)基本區(qū)分信息的同名信息實(shí)體的識(shí)別、高級(jí)區(qū)分信息的獲取及根據(jù)高級(jí)區(qū)分信息的同名信息實(shí)體的識(shí)別,直至信息實(shí)體識(shí)別設(shè)備1在較長(zhǎng)時(shí)間內(nèi)停止對(duì)基本區(qū)分信息的獲取。優(yōu)選地,在所述步驟S3中還包括步驟S31(未示出)、步驟S32(未示出)和步驟 S33(未示出),其中,在步驟S31中,信息實(shí)體識(shí)別設(shè)備1根據(jù)具有相同所述基本區(qū)分信息的所述同名信息實(shí)體,獲取所述同名信息實(shí)體的高級(jí)屬性,在步驟S32中,信息實(shí)體識(shí)別設(shè)備1根據(jù)所述高級(jí)屬性,獲取所述高級(jí)屬性的相似距離,在步驟S33中,信息實(shí)體識(shí)別設(shè)備 1根據(jù)所述相似距離,獲取所述同名信息實(shí)體的高級(jí)區(qū)分信息。具體地,在步驟S31中,信息實(shí)體識(shí)別設(shè)備1根據(jù)其在步驟S2中獲得的具有相同基本區(qū)分信息的同名信息實(shí)體,例如通過(guò)查找與該基本區(qū)分信息中的基本區(qū)分屬性相對(duì)應(yīng)的子屬性,并將該子屬性作為該同名信息實(shí)體的高級(jí)屬性;接著,在步驟S32中,信息實(shí)體識(shí)別設(shè)備1根據(jù)其在步驟S31中獲得的所有高級(jí)屬性,獲取每個(gè)高級(jí)屬性的相似距離,例如根據(jù)每個(gè)高級(jí)屬性被其他信息實(shí)體引用的次數(shù),計(jì)算各高級(jí)屬性的相似距離;隨后,在步驟S33中,信息實(shí)體識(shí)別設(shè)備1根據(jù)其在步驟S32中獲得的相似距離,獲取所述同名信息實(shí)體的高級(jí)區(qū)分信息。在此,上述相似距離意指信息實(shí)體中某個(gè)屬性對(duì)具有該屬性的多個(gè)同名信息實(shí)體的區(qū)分程度,相似距離越大,則區(qū)分程度越高。例如,在步驟S2中,信息實(shí)體識(shí)別設(shè)備1獲得具有相同“分類”基本區(qū)分屬性的名稱同為“宋佳”的信息實(shí)體El和E2,它們的“分類”屬性值為“影視演員”,假設(shè)每個(gè)“分類”屬性都具有與其屬性值相對(duì)應(yīng)的預(yù)定義的子屬性,在步驟S31中,信息實(shí)體識(shí)別設(shè)備1根據(jù)“影視演員”在分類屬性映射表中進(jìn)行匹配查詢,以獲得與該“分類”屬性值對(duì)應(yīng)的子屬性“出生日期”、“畢業(yè)院?!薄焙汀按碜髌贰?,并將其作為該同名信息實(shí)體的高級(jí)屬性;接著,在步驟S32中,信息實(shí)體識(shí)別設(shè)備1根據(jù)信息實(shí)體E1,在關(guān)聯(lián)數(shù)據(jù)庫(kù)中進(jìn)行匹配查詢,以獲得與El關(guān)聯(lián)的其他信息實(shí)體,并通過(guò)查找改其他信息實(shí)體中與El相對(duì)應(yīng)的關(guān)聯(lián)屬性,確定該其他信息實(shí)體是否引用在步驟S31中獲得的該3個(gè)高級(jí)屬性,并據(jù)此獲得 El中的高級(jí)屬性“出生日期”的引用次數(shù)為0,“畢業(yè)院?!钡囊么螖?shù)為5,“代表作品”的引用次數(shù)為20,接著,通過(guò)相同的操作,獲得E2中的高級(jí)屬性“出生日期”的引用次數(shù)為0, “畢業(yè)院?!钡囊么螖?shù)為8,“代表作品”的引用次數(shù)為8,最后,根據(jù)屬性引用次數(shù)越多,相似距離越大的規(guī)則,獲得該3個(gè)高級(jí)屬性的相似距離為“代表作品” > “畢業(yè)院?!?> “出生日期”;隨后,在步驟S33中,信息實(shí)體識(shí)別設(shè)備1將相似距離最大的高級(jí)屬性“代表作品” 作為同名信息實(shí)體El和E2的高級(jí)區(qū)分信息。在此,所述實(shí)施例中的分類屬性映射表可存儲(chǔ)在信息實(shí)體識(shí)別設(shè)備1,也可按照約定的通信方式從第三方設(shè)備獲取。在此,所述實(shí)施例中的關(guān)聯(lián)數(shù)據(jù)庫(kù)用于存儲(chǔ)信息實(shí)體之間的關(guān)聯(lián)關(guān)系,該關(guān)聯(lián)數(shù)據(jù)庫(kù)包括但不限于關(guān)系數(shù)據(jù)庫(kù),內(nèi)存存儲(chǔ)器,硬盤存儲(chǔ)器等。本領(lǐng)域技術(shù)人員應(yīng)能理解上述獲取高級(jí)屬性信息、獲取相似距離及獲取高級(jí)區(qū)分信息的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取高級(jí)屬性信息、獲取相似距離及獲取高級(jí)區(qū)分信息的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。更優(yōu)選地,在步驟S32中,信息實(shí)體識(shí)別設(shè)備1根據(jù)所述高級(jí)屬性的評(píng)價(jià)信息,獲取所述高級(jí)屬性的相似距離。具體地,在步驟S32中,信息實(shí)體識(shí)別設(shè)備1根據(jù)其在步驟 S31中提供的高級(jí)屬性,獲得該屬性的評(píng)價(jià)信息,例如該屬性在與之對(duì)應(yīng)的基本區(qū)分屬性的所有子屬性中的權(quán)重,并根據(jù)該評(píng)價(jià)信息,獲取高級(jí)屬性的相似距離。例如,在步驟S31中, 信息實(shí)體識(shí)別設(shè)備1獲取與同名信息實(shí)體“少林寺”的基本區(qū)分屬性“分類”的屬性值“影視作品”相對(duì)應(yīng)的子屬性“主角”、“導(dǎo)演”和“發(fā)行方”作為該同名信息實(shí)體的高級(jí)屬性,接著,在步驟S32中,信息實(shí)體識(shí)別設(shè)備1獲取各高級(jí)屬性在“影視作品”分類中的權(quán)重,其中 “主角”權(quán)重為0. 8,“導(dǎo)演”權(quán)重為1,“發(fā)行方”權(quán)重為0. 1,據(jù)此,獲得該各高級(jí)屬性的相似距離為“導(dǎo)演”> “主角”> “發(fā)行方”。本領(lǐng)域技術(shù)人員應(yīng)能理解上述獲取相似距離的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取相似距離的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。具體地,所述評(píng)價(jià)信息包括但不限于以下至少任一項(xiàng)-所述高級(jí)屬性在所述同名信息實(shí)體中的權(quán)重;-所述高級(jí)屬性被其他信息實(shí)體引用的次數(shù)。例如,若該評(píng)價(jià)信息包括該高級(jí)屬性在同名信息實(shí)體中的權(quán)重,則在步驟S32中, 信息實(shí)體識(shí)別設(shè)備1根據(jù)該權(quán)重獲得該高級(jí)屬性的相似距離,其中,高級(jí)屬性的權(quán)重越高, 則該高級(jí)屬性的相似距離越大,反之,則越小。若該評(píng)價(jià)信息包括該被其他信息實(shí)體引用的次數(shù),則在步驟S32中,信息實(shí)體識(shí)別設(shè)備1根據(jù)該引用次數(shù)獲得該高級(jí)屬性的相似距離,其中,高級(jí)屬性被引用的次數(shù)越多,則該高級(jí)屬性的相似距離越大,反之,則越小。本領(lǐng)域技術(shù)人員應(yīng)能理解,上述各項(xiàng)評(píng)價(jià)信息不僅可以單獨(dú)用于信息實(shí)體識(shí)別設(shè)備1對(duì)高級(jí)屬性的相似距離進(jìn)行獲取,還可以將其中多項(xiàng)結(jié)合用于在步驟S32中,信息實(shí)體識(shí)別設(shè)備1對(duì)高級(jí)屬性的相似距離進(jìn)行獲取。本領(lǐng)域技術(shù)人員還應(yīng)能理解上述評(píng)價(jià)信息僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的評(píng)價(jià)信息如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。更優(yōu)選地,所述步驟S32還包括步驟S321(未示出)和步驟S322(未示出),其中, 在步驟S321中,信息實(shí)體識(shí)別設(shè)備1對(duì)各所述同名信息實(shí)體中相同高級(jí)屬性的屬性值進(jìn)行語(yǔ)義分析,以獲得所述屬性值之間的語(yǔ)義相似度;在步驟S322中,信息實(shí)體識(shí)別設(shè)備1根據(jù)所述語(yǔ)義相似度來(lái)確定與所述屬性值相對(duì)應(yīng)的高級(jí)屬性的相似距離。具體地,步驟S321 中,信息實(shí)體識(shí)別設(shè)備1根據(jù)其在步驟S31中提供的各同名信息實(shí)體的高級(jí)屬性,對(duì)相同高級(jí)屬性的屬性值進(jìn)行語(yǔ)義分析,以獲得所述屬性值之間的語(yǔ)義相似度,例如通過(guò)利用分詞算法對(duì)屬性值進(jìn)行分詞,并將分詞后的屬性值進(jìn)行比較,獲得該屬性值之間的語(yǔ)義相似度; 接著,在步驟S322中,信息實(shí)體識(shí)別設(shè)備1根據(jù)其在步驟S321中獲取的該高級(jí)屬性的屬性值的語(yǔ)義相似度來(lái)確定與該屬性值相對(duì)應(yīng)的高級(jí)屬性的相似距離,如屬性值的語(yǔ)義相似度越低,則與該屬性值對(duì)應(yīng)的高級(jí)屬性的相似距離就越大。在此,上述語(yǔ)義分析包括但不限于通過(guò)文本比較,機(jī)器學(xué)習(xí)及決策樹分析等方法實(shí)現(xiàn)。例如,假設(shè)名稱同為“星光大道”的信息實(shí)體El和E2的高級(jí)屬性包括“主持人”和“制作單位”,在El中,“主持人”的屬性值為“畢福劍”,“制作單位”的屬性值為“中國(guó)中央電視臺(tái)”,而在E2中,“主持人”的屬性值為“陶晶瑩”,“制作單位”的屬性值為“臺(tái)灣中視電視臺(tái)”,在步驟S321中,信息實(shí)體識(shí)別設(shè)備1利用正向最大匹配分詞算法對(duì)El和E2中高級(jí)屬性“主持人”的屬性值分別進(jìn)行分詞,獲得分詞結(jié)果為“畢/福/劍”和“陶/晶/瑩”,通過(guò)對(duì)兩個(gè)分詞結(jié)果進(jìn)行文本比較確定它們之間沒(méi)有相同的分詞,據(jù)此,獲得“主持人”屬性值的語(yǔ)義相似度為0,然后,信息實(shí)體識(shí)別設(shè)備1利用相同的方法對(duì)高級(jí)屬性“主持人”的屬性值分別進(jìn)行分詞,獲得分詞結(jié)果為“中國(guó)/中央 /電視臺(tái)”和“臺(tái)灣/中視/電視臺(tái)”,通過(guò)對(duì)兩個(gè)分詞結(jié)果進(jìn)行文本比較確定在3個(gè)分詞中有1個(gè)分詞“電視臺(tái)”相等,據(jù)此,獲得“制作單位”屬性值的語(yǔ)義相似度為0. 33 ;接著,在步驟S322中,信息實(shí)體識(shí)別設(shè)備1根據(jù)其在步驟S321中獲取高級(jí)屬性“主持人”和“制作單位”的屬性值的語(yǔ)義相似度,按照屬性值語(yǔ)義相似度越大,屬性的相似距離越小的規(guī)則,確定高級(jí)屬性的相似距離為“主持人” >“制作單位”。在此,所述實(shí)施例中的分詞算法包括但不限于正向最大匹配,反向最大匹配,雙向最大匹配,語(yǔ)言模型方法,最短路徑算法等等。 本領(lǐng)域技術(shù)人員還應(yīng)能理解上述獲得語(yǔ)義相似度的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲得語(yǔ)義相似度的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。本領(lǐng)域技術(shù)人員還應(yīng)能理解上述確定相似距離的方式僅為舉例, 其他現(xiàn)有的或今后可能出現(xiàn)的確定相似距離的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。更優(yōu)選地,所述基本區(qū)分信息和所述高級(jí)區(qū)分信息之一包括所述多個(gè)同名信息實(shí)體的至少一個(gè)屬性,其中,所述基本區(qū)分信息和所述高級(jí)區(qū)分信息所包括的所述屬性彼此不相同。具體地,在步驟Sl中,信息實(shí)體識(shí)別設(shè)備1獲取的基本區(qū)分信息中包括多個(gè)同名信息實(shí)體中共有的一個(gè)或多個(gè)屬性,在步驟S3中,信息實(shí)體識(shí)別設(shè)備1獲取的高級(jí)區(qū)分信息中包括該多個(gè)同名信息實(shí)體中共有的一個(gè)或多個(gè)屬性,并且該基本區(qū)分信息和該高級(jí)區(qū)分信息所包括的屬性彼此不相同。在另一個(gè)優(yōu)選實(shí)施例中(參照?qǐng)D2、,該過(guò)程還包括步驟S5 (未示出)和步驟S6 (未示出),其中,在步驟S5中,信息實(shí)體識(shí)別設(shè)備1獲取與用戶通過(guò)用戶設(shè)備提交的查詢信息相對(duì)應(yīng)的所述多個(gè)同名信息實(shí)體;在步驟S6中,信息實(shí)體識(shí)別設(shè)備1將識(shí)別后的所述多個(gè)同名信息實(shí)體提供給所述用戶設(shè)備。以下參照?qǐng)D2對(duì)該另一個(gè)實(shí)施例進(jìn)行詳細(xì)描述,其中, 在步驟S4中,信息實(shí)體識(shí)別設(shè)備1基于其在步驟S3中獲取的多個(gè)同名信息實(shí)體的高級(jí)區(qū)分信息,識(shí)別具有不同該高級(jí)區(qū)分信息的該多個(gè)同名信息實(shí)體,其具體過(guò)程與前述參照?qǐng)D2 所描述的實(shí)施例中信息實(shí)體識(shí)別設(shè)備1在步驟S4所執(zhí)行的過(guò)程相同,為簡(jiǎn)明起見(jiàn),以引用方式包含于此,而不做贅述。具體地,在步驟S5中,信息實(shí)體識(shí)別設(shè)備1獲取與用戶通過(guò)用戶設(shè)備提交的查詢信息相對(duì)應(yīng)的所述多個(gè)同名信息實(shí)體。更具體地,在步驟S5中,信息實(shí)體識(shí)別設(shè)備1根據(jù)用戶通過(guò)用戶設(shè)備提交的查詢信息,例如通過(guò)在信息實(shí)體數(shù)據(jù)庫(kù)中進(jìn)行匹配查詢,以獲取與該查詢信息相對(duì)應(yīng)的多個(gè)同名信息實(shí)體。在此,該用戶設(shè)備可以是任何一種可與用戶通過(guò)鍵盤、鼠標(biāo)、遙控器、觸摸板、或聲控設(shè)備進(jìn)行人機(jī)交互的電子產(chǎn)品,包括但不限于計(jì)算機(jī)、 智能手機(jī)、PDA、或IPTV等。例如,用戶通過(guò)鍵盤在用戶設(shè)備所顯示的輸入框內(nèi)輸入的查詢信息為“星光大道”,則該用戶設(shè)備通過(guò)網(wǎng)絡(luò)將該查詢信息“星光大道”發(fā)送至信息實(shí)體識(shí)別設(shè)備1,由此使信息實(shí)體識(shí)別設(shè)備1獲取該用戶輸入的查詢信息,接著,在步驟S5中,信息實(shí)體識(shí)別設(shè)備1根據(jù)該查詢信息在信息實(shí)體數(shù)據(jù)庫(kù)中進(jìn)行匹配查詢,獲得名稱同為“星光大道”的多個(gè)信息實(shí)體。用戶設(shè)備與信息實(shí)體識(shí)別設(shè)備1連接的網(wǎng)絡(luò)包括但不限于互聯(lián)網(wǎng)、廣域網(wǎng)、城域網(wǎng)、局域網(wǎng)、VPN網(wǎng)絡(luò)、無(wú)線自組織網(wǎng)絡(luò)(Ad Hoc網(wǎng)絡(luò))等。在此,上述信息實(shí)體數(shù)據(jù)庫(kù)用于存儲(chǔ)已存在的所有信息實(shí)體,該信息實(shí)體數(shù)據(jù)庫(kù)包括但不限于關(guān)系數(shù)據(jù)庫(kù),內(nèi)存存儲(chǔ)器,硬盤存儲(chǔ)器等。本領(lǐng)域技術(shù)人員應(yīng)能理解上述獲取同名信息實(shí)體的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取同名信息實(shí)體的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。在步驟S6中,信息實(shí)體識(shí)別設(shè)備1將識(shí)別后的所述多個(gè)同名信息實(shí)體提供給所述用戶設(shè)備。具體地,在步驟S6中,信息實(shí)體識(shí)別設(shè)備1根據(jù)其在步驟S4中提供的該識(shí)別后的多個(gè)同名信息實(shí)體,例如通過(guò)約定的通信協(xié)議,提供給用戶設(shè)備,并在用戶設(shè)備上基于基本區(qū)分信息和高級(jí)區(qū)分信息逐級(jí)展現(xiàn)該多個(gè)同名信息實(shí)體。例如,在步驟S6中,信息實(shí)體識(shí)別設(shè)備1將識(shí)別后的多個(gè)名稱同為“星光大道”的信息實(shí)體通過(guò)諸如http、https等預(yù)先約定的通信協(xié)議提供給用戶設(shè)備,并根據(jù)該同名信息實(shí)體的基本區(qū)分信息和高級(jí)區(qū)分信息逐級(jí)展現(xiàn)該多個(gè)同名信息實(shí)體在該用戶設(shè)備的顯示裝置上。本領(lǐng)域技術(shù)人員應(yīng)能理解上述提供同名信息實(shí)體的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的提供同名信息實(shí)體的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。優(yōu)選地,在步驟S6中,信息實(shí)體識(shí)別設(shè)備1根據(jù)用戶相關(guān)信息,對(duì)識(shí)別后的所述多個(gè)同名信息實(shí)體進(jìn)行排序,并將排序后的所述多個(gè)同名信息實(shí)體提供給所述用戶設(shè)備。具體地,在步驟S6中,信息實(shí)體識(shí)別設(shè)備1根據(jù)用戶相關(guān)信息,如用戶的偏好設(shè)置,對(duì)其在步驟S4中提供的識(shí)別后的多個(gè)同名信息實(shí)體進(jìn)行排序,然后將排序后的所述多個(gè)同名信息實(shí)體提供給所述用戶設(shè)備。例如,假設(shè)信息實(shí)體為網(wǎng)絡(luò)百科中的詞條,每個(gè)詞條都具有其所屬的分類,用戶的偏好設(shè)置為根據(jù)詞條的分類級(jí)別對(duì)多個(gè)同名詞條進(jìn)行排序,在步驟S6 中,信息實(shí)體識(shí)別設(shè)備1根據(jù)該用戶偏好設(shè)置,對(duì)于識(shí)別后同名詞條E1、E2和E3 (El的分類為一級(jí)分類“人物”,E2的分類為二級(jí)分類“藝術(shù)人物”,E3的分類為三級(jí)分類“歌手”)按照分類級(jí)別由低到高的順序進(jìn)行排序,獲得排序結(jié)果E3、E2、E1,并將該排序結(jié)果提供給用戶設(shè)備。本領(lǐng)域技術(shù)人員應(yīng)能理解上述提供同名信息實(shí)體的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的提供同名信息實(shí)體的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。具體地,所述用戶相關(guān)信息包括以下至少任一項(xiàng)-用戶的偏好設(shè)置;-用戶的歷史行為記錄。例如,若所述用戶相關(guān)信息包括用戶的偏好設(shè)置,在步驟S6中,信息實(shí)體識(shí)別設(shè)備1根據(jù)用戶的偏好設(shè)置,對(duì)識(shí)別后的所述多個(gè)同名信息實(shí)體進(jìn)行排序。在此,用戶的偏好設(shè)置包括但不限于優(yōu)先排列累計(jì)訪問(wèn)次數(shù)較高的信息實(shí)體,優(yōu)先排列近期訪問(wèn)頻次較高的信息實(shí)體等。若所述用戶相關(guān)信息包括用戶的歷史行為記錄,在步驟S6中,信息實(shí)體識(shí)別設(shè)備1根據(jù)用戶的歷史行為記錄,例如通過(guò)對(duì)該歷史行為記錄進(jìn)行統(tǒng)計(jì)分析,獲得該用戶在歷史上累計(jì)搜索次數(shù)較多的信息實(shí)體,并賦予其高排列優(yōu)先級(jí),據(jù)此,對(duì)識(shí)別后的所述多個(gè)同名信息實(shí)體進(jìn)行排序。例如,存在識(shí)別后的3個(gè)同名信息實(shí)體E1、E2、E3,在步驟S6中, 信息實(shí)體識(shí)別設(shè)備1按照缺省的排序規(guī)則獲得該同名信息實(shí)體的排序依次為E3、E2、E1,然后,信息實(shí)體識(shí)別設(shè)備1通過(guò)對(duì)該歷史行為記錄進(jìn)行統(tǒng)計(jì)分析,獲得該用戶在歷史上累計(jì)搜索次數(shù)最多的前100個(gè)信息實(shí)體的集合,并將信息實(shí)體E1、E2、E3在該集合中進(jìn)行匹配查找,確定E2存在于該集合,并據(jù)此調(diào)整該同名信息實(shí)體的排列順序?yàn)镋2、E3、E1。信息實(shí)體識(shí)別設(shè)備1獲取用戶相關(guān)信息的方式包括但不限于根據(jù)用戶通過(guò)用戶設(shè)備登錄該識(shí)別設(shè)備的注冊(cè)信息中獲取,或根據(jù)在用戶通過(guò)用戶設(shè)備瀏覽網(wǎng)頁(yè)期間由用戶設(shè)備端或網(wǎng)絡(luò)端所記錄的或由用戶設(shè)備的cookies信息中提取的用戶歷史行為信息中獲取等等。本領(lǐng)域技術(shù)人員應(yīng)能理解上述用戶相關(guān)信息僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的用戶相關(guān)信息如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。對(duì)于本領(lǐng)域技術(shù)人員而言,顯然本發(fā)明不限于上述示范性實(shí)施例的細(xì)節(jié),而且在不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實(shí)現(xiàn)本發(fā)明。因此,無(wú)論從哪一點(diǎn)來(lái)看,均應(yīng)將實(shí)施例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權(quán)利要求而不是上述說(shuō)明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化囊括在本發(fā)明內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標(biāo)記視為限制所涉及的權(quán)利要求。此外,顯然“包括” 一詞不排除其他單元或步驟,單數(shù)不排除復(fù)數(shù)。系統(tǒng)權(quán)利要求中陳述的多個(gè)單元或裝置也可以由一個(gè)單元或裝置通過(guò)軟件或者硬件來(lái)實(shí)現(xiàn)。第一,第二等詞語(yǔ)用來(lái)表示名稱,而并不表示任何特定的順序。
權(quán)利要求
1.一種由計(jì)算機(jī)實(shí)現(xiàn)的用于識(shí)別同名信息實(shí)體的方法,其中,該方法包括以下步驟 a獲取待識(shí)別多個(gè)同名信息實(shí)體的基本區(qū)分信息;b根據(jù)所述基本區(qū)分信息,識(shí)別具有不同所述基本區(qū)分信息的同名信息實(shí)體; c根據(jù)具有相同所述基本區(qū)分信息的同名信息實(shí)體,獲取所述同名信息實(shí)體的高級(jí)區(qū)分信息;d根據(jù)所述高級(jí)區(qū)分信息,識(shí)別具有不同所述高級(jí)區(qū)分信息的所述同名信息實(shí)體。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述步驟c還包括c 1根據(jù)具有相同所述基本區(qū)分信息的所述同名信息實(shí)體,獲取所述同名信息實(shí)體的高級(jí)屬性;c2根據(jù)所述高級(jí)屬性,獲取所述高級(jí)屬性的相似距離; c 3根據(jù)所述相似距離,獲取所述同名信息實(shí)體的高級(jí)區(qū)分信息。
3.根據(jù)權(quán)利要求2所述的方法,其中,所述步驟c2還包括-根據(jù)所述高級(jí)屬性的評(píng)價(jià)信息,獲取所述高級(jí)屬性的相似距離。
4.根據(jù)權(quán)利要求3所述的方法,其中,所述評(píng)價(jià)信息包括以下至少任一項(xiàng) -所述高級(jí)屬性在所述同名信息實(shí)體中的權(quán)重;-所述高級(jí)屬性被其他信息實(shí)體引用的次數(shù)。
5.根據(jù)權(quán)利要求2所述的方法,其中,所述步驟c2還包括-對(duì)各所述同名信息實(shí)體中相同高級(jí)屬性的屬性值進(jìn)行語(yǔ)義分析,以獲得所述屬性值之間的語(yǔ)義相似度;-根據(jù)所述語(yǔ)義相似度來(lái)確定與所述屬性值相對(duì)應(yīng)的高級(jí)屬性的相似距離。
6.根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的方法,其中,所述基本區(qū)分信息和所述高級(jí)區(qū)分信息之一包括所述多個(gè)同名信息實(shí)體的至少一個(gè)屬性,其中,所述基本區(qū)分信息和所述高級(jí)區(qū)分信息所包括的所述屬性彼此不相同。
7.根據(jù)權(quán)利要求1至6中任一項(xiàng)所述的方法,其中,該方法還包括-獲取與用戶通過(guò)用戶設(shè)備提交的查詢信息相對(duì)應(yīng)的所述多個(gè)同名信息實(shí)體; 其中,該方法還包括X將識(shí)別后的所述多個(gè)同名信息實(shí)體提供給所述用戶設(shè)備。
8.根據(jù)權(quán)利要求7所述的方法,其中,所述步驟X還包括-根據(jù)用戶相關(guān)信息,對(duì)識(shí)別后的所述多個(gè)同名信息實(shí)體進(jìn)行排序,并將排序后的所述多個(gè)同名信息實(shí)體提供給所述用戶設(shè)備。
9.根據(jù)權(quán)利要求8所述的方法,其中,所述用戶相關(guān)信息包括以下至少任一項(xiàng) -用戶的偏好設(shè)置;-用戶的歷史行為記錄。
10.一種用于識(shí)別同名信息實(shí)體的設(shè)備,其中,該設(shè)備包括基本區(qū)分獲取裝置,用于獲取待識(shí)別多個(gè)同名信息實(shí)體的基本區(qū)分信息; 基本區(qū)分識(shí)別裝置,用于根據(jù)所述基本區(qū)分信息,識(shí)別具有不同所述基本區(qū)分信息的同名信息實(shí)體;高級(jí)區(qū)分獲取裝置,用于根據(jù)具有相同所述基本區(qū)分信息的同名信息實(shí)體,獲取所述同名信息實(shí)體的高級(jí)區(qū)分信息;高級(jí)區(qū)分識(shí)別裝置,用于根據(jù)所述高級(jí)區(qū)分信息,識(shí)別具有不同所述高級(jí)區(qū)分信息的所述同名信息實(shí)體。
11.根據(jù)權(quán)利要求10所述的設(shè)備,其中,所述高級(jí)區(qū)分獲取裝置還包括高級(jí)屬性獲取單元,用于根據(jù)具有相同所述基本區(qū)分信息的所述同名信息實(shí)體,獲取所述同名信息實(shí)體的高級(jí)屬性;相似距離獲取單元,用于根據(jù)所述高級(jí)屬性,獲取所述高級(jí)屬性的相似距離;第一獲取單元,用于根據(jù)所述相似距離,獲取所述同名信息實(shí)體的高級(jí)區(qū)分信息。
12.根據(jù)權(quán)利要求11所述的設(shè)備,其中,所述相似距離獲取單元還用于根據(jù)所述高級(jí)屬性的評(píng)價(jià)信息,獲取所述高級(jí)屬性的相似距離。
13.根據(jù)權(quán)利要求12所述的設(shè)備,其中,所述評(píng)價(jià)信息包括以下至少任一項(xiàng)-所述高級(jí)屬性在所述同名信息實(shí)體中的權(quán)重;-所述高級(jí)屬性被其他信息實(shí)體引用的次數(shù)。
14.根據(jù)權(quán)利要求11所述的設(shè)備,其中,所述相似距離獲取單元還包括相似度獲取單元,用于對(duì)各所述同名信息實(shí)體中相同高級(jí)屬性的屬性值進(jìn)行語(yǔ)義分析,以獲得所述屬性值之間的語(yǔ)義相似度;相似距離確定單元,用于根據(jù)所述語(yǔ)義相似度來(lái)確定與所述屬性值相對(duì)應(yīng)的高級(jí)屬性的相似距離。
15.根據(jù)權(quán)利要求10至14中任一項(xiàng)所述的設(shè)備,其中,所述基本區(qū)分信息和所述高級(jí)區(qū)分信息之一包括所述多個(gè)同名信息實(shí)體的至少一個(gè)屬性,其中,所述基本區(qū)分信息和所述高級(jí)區(qū)分信息所包括的所述屬性彼此不相同。
16.根據(jù)權(quán)利要求10至15中任一項(xiàng)所述的設(shè)備,其中,該設(shè)備還包括查詢裝置,用于獲取與用戶通過(guò)用戶設(shè)備提交的查詢信息相對(duì)應(yīng)的所述多個(gè)同名信息實(shí)體;其中,該設(shè)備還包括提供裝置,用于將識(shí)別后的所述多個(gè)同名信息實(shí)體提供給所述用戶設(shè)備。
17.根據(jù)權(quán)利要求16所述的設(shè)備,其中,所述提供裝置還用于根據(jù)用戶相關(guān)信息,對(duì)識(shí)別后的所述多個(gè)同名信息實(shí)體進(jìn)行排序,并將排序后的所述多個(gè)同名信息實(shí)體提供給所述用戶設(shè)備。
18.根據(jù)權(quán)利要求17所述的設(shè)備,其中,所述用戶相關(guān)信息包括以下至少任一項(xiàng)-用戶的偏好設(shè)置;-用戶的歷史行為記錄。
全文摘要
本發(fā)明的目的是提供一種用于識(shí)別同名信息實(shí)體的方法與設(shè)備。其中,信息實(shí)體識(shí)別設(shè)備1獲取待識(shí)別多個(gè)同名信息實(shí)體的基本區(qū)分信息;根據(jù)所述基本區(qū)分信息,識(shí)別具有不同所述基本區(qū)分信息的同名信息實(shí)體;根據(jù)具有相同所述基本區(qū)分信息的同名信息實(shí)體,獲取所述同名信息實(shí)體的高級(jí)區(qū)分信息;根據(jù)所述高級(jí)區(qū)分信息,識(shí)別具有不同所述高級(jí)區(qū)分信息的所述同名信息實(shí)體。與現(xiàn)有技術(shù)相比,本發(fā)明通過(guò)建立多級(jí)區(qū)分信息,逐級(jí)識(shí)別多個(gè)同名信息實(shí)體,從而提高同名信息實(shí)體的可識(shí)別性,提升用戶體驗(yàn)。
文檔編號(hào)G06F17/30GK102214209SQ201110107228
公開(kāi)日2011年10月12日 申請(qǐng)日期2011年4月27日 優(yōu)先權(quán)日2011年4月27日
發(fā)明者嚴(yán)孫榮, 夏寅, 左莉, 張偉, 曹建棟, 李博, 李永強(qiáng), 王麗寶, 王京津, 王坤, 耿磊, 肖琦, 蘇上海, 陸海霞 申請(qǐng)人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司