两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

生成用于支持在線服務(wù)的資源的制作方法

文檔序號(hào):9620908閱讀:232來源:國(guó)知局
生成用于支持在線服務(wù)的資源的制作方法
【專利說明】生成用于支持在線服務(wù)的資源
[0001]相關(guān)申請(qǐng)
[0002]本申請(qǐng)要求2013年11月27日提交的美國(guó)臨時(shí)專利申請(qǐng)61/910,000的權(quán)益,通過引用將該臨時(shí)申請(qǐng)的全部?jī)?nèi)容并入本文中。
技術(shù)領(lǐng)域
[0003]本公開大體上涉及數(shù)據(jù)庫處理,并且更具體地,涉及具有被分為類別的概念的數(shù)據(jù)庫的處理以加權(quán)數(shù)據(jù)庫內(nèi)的概念的相似性。
【背景技術(shù)】
[0004]如果可以智能地處理用戶交互以為用戶進(jìn)行推薦,那么在線服務(wù)可以增加其受歡迎程度。例如,運(yùn)行在網(wǎng)頁服務(wù)器上的應(yīng)用可以基于其當(dāng)前使用而為用戶推薦其他網(wǎng)頁。在這方面,當(dāng)前存在大量的百科式數(shù)據(jù)庫,例如維基百科,其提供和概念相關(guān)的大量信息,概念例如“紐約”或“麥當(dāng)娜”等等。如果這種數(shù)據(jù)庫可以被自動(dòng)地分析以確定概念之間的關(guān)系,那么給用戶的推薦就更加準(zhǔn)確,這支持了用戶的交互和參與。
[0005]由于發(fā)現(xiàn)在線數(shù)據(jù)庫中的概念之間的關(guān)系是如此有價(jià)值,已經(jīng)花費(fèi)了不少的努力以試圖提供這種關(guān)系分析。但不幸地是,當(dāng)前的分析僅僅是針對(duì)特定數(shù)據(jù)庫在個(gè)案基礎(chǔ)上開發(fā)。這種應(yīng)用一般僅對(duì)于單種語言使用是有效的,并且難以或者不可能轉(zhuǎn)換成其他語言。因此,常規(guī)應(yīng)用中針對(duì)概念關(guān)系的資源的更新涉及大量的人工干預(yù)。
[0006]因此,現(xiàn)有技術(shù)中需要一種能夠處理數(shù)據(jù)庫以發(fā)現(xiàn)數(shù)據(jù)庫中的概念之間的關(guān)系的應(yīng)用。

【發(fā)明內(nèi)容】

[0007]—方面,提供了一種系統(tǒng)來分析按類別整理的概念的數(shù)據(jù)庫。該系統(tǒng)配置為執(zhí)行包括下列步驟的方法:為每個(gè)類別,計(jì)算第一概念的數(shù)量,第一概念的類別為直接包括第一概念的第一級(jí)類別;計(jì)算第二概念的數(shù)量,該第二概念的類別僅通過第二概念為類別中的轉(zhuǎn)而包括第二概念的其他類別的成員而包括第二概念;依此類推,直到計(jì)算第η概念的數(shù)量,其中,第η概念的類別是第η級(jí)類別,η為復(fù)數(shù)正整數(shù)。此外,該方法包括:對(duì)于每個(gè)類別,將類別分類為具有最高計(jì)數(shù)的級(jí)別;及最后,該方法包括:對(duì)于以各個(gè)級(jí)別分類的類另IJ,至少基于類別的概念的網(wǎng)頁排名,確定那些具有最重要概念的分類的類別,從而為每個(gè)具有最重要概念的級(jí)別確定一組分類的類別。
[0008]通過下述詳細(xì)說明,可以更好地理解本文公開的系統(tǒng)和方法的其他特征和優(yōu)勢(shì)。
【附圖說明】
[0009]圖1Α示出了根據(jù)本公開實(shí)施方式的用于系統(tǒng)的模塊的集合,該系統(tǒng)用于分析數(shù)據(jù)庫以確定其概念和類別之間的關(guān)系。
[0010]圖1Β示出了圖1Α的用于系統(tǒng)的其他模塊。
[0011]圖2示出了通過圖1A的系統(tǒng)分析的數(shù)據(jù)庫中的一組類別的循環(huán)。
[0012]圖3A示出了針對(duì)確定通過圖1A的系統(tǒng)分析的數(shù)據(jù)庫的類別等級(jí)的用于第一概念的計(jì)數(shù)過程。
[0013]圖3B示出了被應(yīng)用于另一概念的圖3A的計(jì)數(shù)過程。
[0014]圖4是根據(jù)本發(fā)明實(shí)施方式的用于分析概念按類別整理的數(shù)據(jù)庫的方法的流程圖。
[0015]圖5是示例性計(jì)算機(jī)系統(tǒng)的框圖,其可以配置成實(shí)施圖1A和1B的系統(tǒng)。
[0016]通過參閱下文的詳細(xì)說明將最佳地理解本發(fā)明的實(shí)施方式及其優(yōu)勢(shì)。應(yīng)該意識(shí)到,類似的附圖標(biāo)記用于標(biāo)識(shí)一個(gè)或多個(gè)附圖中的類似元件。
【具體實(shí)施方式】
[0017]下文列出的詳細(xì)說明連同附圖旨在描述各種配置,并且不意圖代表可以實(shí)踐本文描述的概念的僅有配置。為了提供對(duì)各種概念的透徹理解,詳細(xì)說明包括具體細(xì)節(jié)。然而,本領(lǐng)域技術(shù)人員顯而易見的是,這些概念可以在沒有這些具體細(xì)節(jié)的情況下實(shí)施。在一些例子中,為了避免模糊這些概念,公知的結(jié)構(gòu)和部件以框圖形式示出。
[0018]百科數(shù)據(jù)庫的用于提供額外在線資源的概念性分析與統(tǒng)計(jì)學(xué)方法不同。例如,托管商業(yè)網(wǎng)站的應(yīng)用通常會(huì)統(tǒng)計(jì)學(xué)地審查交易,從而一旦購(gòu)買了一件商品,應(yīng)用可以推薦購(gòu)買了相同商品的其他用戶也購(gòu)買的相關(guān)商品。但這種分析與商品本身以及其與相關(guān)商品的概念性關(guān)系是無關(guān)的。本文公開的系統(tǒng)和方法不僅使用用戶網(wǎng)頁瀏覽的過去行為,還分析數(shù)據(jù)庫以用數(shù)字表征數(shù)據(jù)庫中的概念的相互關(guān)聯(lián)性。在這種方式中,如果用戶正在閱讀具有給定概念的網(wǎng)頁,則具有相關(guān)概念的網(wǎng)頁可以被智能地推薦給用戶。
[0019]如本文所使用的,“概念”是具有與之相關(guān)的文本信息的數(shù)據(jù)庫實(shí)體,該文本信息會(huì)包括至數(shù)據(jù)庫中的其他概念的鏈接。概念的數(shù)據(jù)庫的一個(gè)實(shí)例是維基百科,其中,每個(gè)概念被表示為文章。這些文章被按類別整理。每個(gè)類別是相關(guān)文章的集合。盡管下述分析將致力于維基百科中的概念的分析,但應(yīng)該意識(shí)到,本文公開的分析可以廣泛地應(yīng)用到具有概念的其他數(shù)據(jù)庫,每個(gè)概念是可能包括至數(shù)據(jù)庫中的其他概念的鏈接的文本數(shù)據(jù)庫條目。概念的類比是電子表格數(shù)據(jù)庫中的記錄。通常,每項(xiàng)記錄是電子表格中包含多個(gè)字段的行。因此,與數(shù)據(jù)庫實(shí)體或“概念”相關(guān)的詞與電子表格數(shù)據(jù)庫的行(或記錄)的字段相似。
[0020]公開了一種系統(tǒng)以執(zhí)行本文公開的資源生成。該系統(tǒng)包括多個(gè)模塊。每個(gè)模塊可以由單個(gè)計(jì)算機(jī)或者計(jì)算機(jī)的集群來實(shí)施??蛇x地,可以利用ASIC或者配置的現(xiàn)場(chǎng)可編程門陣列來實(shí)施各個(gè)模塊。圖1A示出了示例性系統(tǒng)100的高級(jí)概覽。系統(tǒng)100運(yùn)行以從數(shù)據(jù)庫105生成資源。下述討論將假設(shè)數(shù)據(jù)庫105是維基百科數(shù)據(jù)庫,但是應(yīng)該意識(shí)到,系統(tǒng)100可以以同樣的方式來分析類似的數(shù)據(jù)庫。在維基百科中,某些文章并不專用于概念。例如,“New York”的因特網(wǎng)搜索將導(dǎo)向?qū)S糜陉P(guān)于紐約的狀況的文本文章的維基百科頁面。但相反,其他維基百科頁面是消除歧義的頁面。例如,術(shù)語“Madonna”是有歧義的,因?yàn)槠淇梢灾傅胤健⒘餍袠匪囆g(shù)家或者宗教人士。對(duì)于這種歧義的概念,維基百科可以提供“消除歧義頁面”,其列出了具有相同名字的各種概念。這種消除歧義的頁面本身不提供和一個(gè)概念與另一個(gè)概念之間的關(guān)系有關(guān)的信息,因此,系統(tǒng)100可以提供消除歧義頁面抽取器模塊110以識(shí)別表單120中的所有的維基百科消除歧義頁面或參考。
[0021]維基百科為每個(gè)分離的網(wǎng)頁或文章提供了參考編號(hào)。為了通過其參考編號(hào)識(shí)別所有的概念和類別,系統(tǒng)100可以包括頁分析器、抽取器、以及配置為生成概念表單125的過濾器模塊115。該概念表單125是維基百科中所有概念(也就是說,分離的網(wǎng)頁)的表單,包括消除歧義頁面。此外,模塊115生成維基百科的所有類別的表單。在這方面,維基百科表單中每個(gè)實(shí)質(zhì)的(非消除歧義頁面)列出了一個(gè)或多個(gè)類別。例如,用于“New York”的維基百科頁面表明該概念包括在六個(gè)維基百科類別中:前英殖民地、紐約、美國(guó)的州、中大西洋、美國(guó)東北部以及美國(guó)東海岸的州。如這種示例性類別組所示,概念也可以是獨(dú)立的“New York”概念和類別所示的類別。每個(gè)類別包括一個(gè)或多個(gè)概念,它們等同于維基百科中特定主題下的文本內(nèi)容的獨(dú)立的文章或網(wǎng)頁。
[0022]分析器、抽取器以及過濾器模塊115還生成概念參考映射140。在這方面,維基百科中的每個(gè)概念可以包括至其他維基百科概念的超鏈接。概念參考映射140列出了維基百科中每個(gè)概念對(duì)其他概念的所有這種參考。但是,注意到,一些超鏈接不涉及超鏈接中的文本參考所指示的概念。例如,上述的用于“New York”的維基百科頁面包括“人口第三多”,其并不導(dǎo)向“人口第三多”的概念,而是導(dǎo)向涉及“按人口統(tǒng)計(jì)的美國(guó)的州和地區(qū)的表單”的概念的頁面網(wǎng)頁。如本文所使用的,通過超鏈接(其以與相應(yīng)的概念不同的方式被表達(dá))從一個(gè)概念到另一概念的這些參考被表示為重新定向。模塊115還為每個(gè)概念生成概念重新定向映射,以列出概念可能具有的至其他概念的任何重新定向。如下文將進(jìn)一步解釋的,這些重新定向?yàn)榭捎糜谧R(shí)別相關(guān)概念的給定概念提供了和同義詞有關(guān)的額外信息。
[0023]概念參考映射140為每個(gè)概念識(shí)別包括消除歧義頁面在內(nèi)的所有參考的概念。由于已經(jīng)在表單120中識(shí)別了消除歧義頁面,消除歧義模塊145可以輕易地過濾概念參考映射140以形
當(dāng)前第1頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
永登县| 五家渠市| 富川| 安平县| 澎湖县| 江陵县| 平邑县| 铅山县| 射阳县| 贵州省| 和田县| 龙游县| 白城市| 肇东市| 大连市| 辽中县| 延吉市| 五寨县| 衡水市| 清涧县| 九寨沟县| 祁阳县| 噶尔县| 中卫市| 泾源县| 攀枝花市| 喀喇| 闽侯县| 商洛市| 仙游县| 红桥区| 孝义市| 泗洪县| 舟曲县| 水城县| 怀远县| 凤凰县| 衡南县| 乌拉特前旗| 三原县| 苏尼特右旗|