專利名稱:將實(shí)體與類別相關(guān)聯(lián)的制作方法
技術(shù)領(lǐng)域:
本文檔涉及信息處理。
背景技術(shù):
廣告主可以在多個不同平臺中的任何平臺上運(yùn)行廣告活動,所述多個不同平臺包括因特網(wǎng)、電視、無線電廣播以及廣告牌。在廣告活動中所使用的廣告可以覆蓋產(chǎn)品和服務(wù)的范圍,并且可以定向特定受眾或更一般地定向更大人群。例如,運(yùn)行網(wǎng)站的發(fā)布者可以向廣告主提供空間用于呈現(xiàn)廣告。呈現(xiàn)在網(wǎng)站上的廣告有時基于網(wǎng)站的內(nèi)容來選擇。
發(fā)明內(nèi)容
本發(fā)明涉及將實(shí)體與類別相關(guān)聯(lián)。在第一方面中,一種用于將實(shí)體與類別相關(guān)聯(lián)的計(jì)算機(jī)實(shí)現(xiàn)的方法包括為多個類別中的至少子集中的每一個確定概率值,所述概率值表示識別的實(shí)體屬于相應(yīng)類別的可能性并且使用關(guān)于實(shí)體的信息來確定。該方法包括為實(shí)體記錄多個類別中的一個類別,類別使用概率值和用于多個類別的規(guī)則集來識別。實(shí)施方式可以包括以下特征中的任何、全部特征或不包括以下特征。實(shí)體可以是被識別為加入在程序中的內(nèi)容提供者,在所述程序中內(nèi)容提供者提供待由至少一個發(fā)布者發(fā)布的內(nèi)容,以及概率值可以使用與內(nèi)容提供者相關(guān)聯(lián)的至少一個關(guān)鍵詞以及與內(nèi)容提供者相關(guān)聯(lián)的至少一個財(cái)務(wù)值來確定。確定概率值可以包括將至少一個關(guān)鍵詞至少映射到多個類別的子集;用至少一個財(cái)務(wù)值對至少子集賦予權(quán)重,其中財(cái)務(wù)值已被分配給對應(yīng)關(guān)鍵詞;以及選擇預(yù)定數(shù)量的類別作為子集。規(guī)則集可以基于訓(xùn)練數(shù)據(jù)。規(guī)則集可以包括決策樹,其被配置用于通過處理包括在決策樹中的多個決策中的至少部分來選擇多個類別中的一個。該方法可以進(jìn)一步包括使用訓(xùn)練數(shù)據(jù)來生成決策樹,其中訓(xùn)練數(shù)據(jù)包括實(shí)體到多個類別中的一個或多個的映射。生成決策樹可以進(jìn)一步包括使用有關(guān)實(shí)體的財(cái)務(wù)數(shù)據(jù)對映射賦予權(quán)重。對映射賦予權(quán)重可以進(jìn)一步包括基于與映射的至少子集相對應(yīng)的財(cái)務(wù)數(shù)據(jù)來過采樣(oversample)映射的所述子集。生成決策樹可以包括選擇用于決策樹的結(jié)構(gòu);確定決策樹的延伸區(qū)(extent),包括在選擇多個類別中的一個之前待進(jìn)行的多個決策中的決策數(shù)量;以及確定待在多個決策中使用的閾值??梢缘蓻Q策樹。內(nèi)容提供者可以從事于廣告,以及多個類別可以包括內(nèi)容提供者待與之匹配的垂直元(vertical)。生成決策樹可以進(jìn)一步包括識別垂直元中的至少一個,對于其概率值的確定具有將垂直元不恰當(dāng)?shù)胤峙浣o內(nèi)容提供者的傾向;以及選擇閾值中的至少一個,使得降低所述傾向。該方法可以進(jìn)一步包括基于已為實(shí)體識別的類別向用戶呈現(xiàn)信息。信息可以指示與類別相關(guān)聯(lián)的季節(jié)性。在第二方面中,一種計(jì)算機(jī)系統(tǒng)包括第一分類器,其為多個類別中的至少子集中的每一個類別確定概率值,所述概率值表示識別的實(shí)體屬于相應(yīng)類別的可能性并且使用關(guān)于實(shí)體的信息來確定。該系統(tǒng)包括第二分類器,其使用概率值和用于多個類別的規(guī)則集來為實(shí)體識別多個類別中的一個類別。實(shí)施方式可以包括以下特征中的任何、全部特征或不包括以下特征。規(guī)則集可以基于訓(xùn)練數(shù)據(jù)。第一分類器在確定概率值時可以考慮與實(shí)體有關(guān)的財(cái)務(wù)值。規(guī)則集可以包括決策樹,其被配置用于通過處理包括在決策樹中的多個決策中的至少部分來選擇多個類別中的一個,以及該計(jì)算機(jī)系統(tǒng)可以進(jìn)一步包括使用訓(xùn)練數(shù)據(jù)來生成決策樹的規(guī)則組件, 其中訓(xùn)練數(shù)據(jù)包括實(shí)體到多個類別中的一個或多個的映射。規(guī)則組件可以使用有關(guān)實(shí)體的財(cái)務(wù)數(shù)據(jù)對映射賦予權(quán)重,包括基于與映射的至少子集相對應(yīng)的財(cái)務(wù)數(shù)據(jù)來過采樣映射的所述子集。該系統(tǒng)可以進(jìn)一步包括前端組件,其基于第二分類器已為實(shí)體識別了類別向用戶呈現(xiàn)信息。在第三方面中,一種用于將內(nèi)容提供者與類別相關(guān)聯(lián)的計(jì)算機(jī)實(shí)現(xiàn)的方法包括將內(nèi)容提供者識別為加入在程序中,在所述程序中內(nèi)容提供者提供待由至少一個發(fā)布者發(fā)布的內(nèi)容。該方法進(jìn)一步包括接收有關(guān)內(nèi)容提供者的至少一個關(guān)鍵詞和有關(guān)關(guān)鍵詞的至少一個財(cái)務(wù)值。該方法進(jìn)一步包括接收多個類別,其中內(nèi)容提供者待與類別中的至少一個相關(guān)聯(lián)。該方法進(jìn)一步包括基于類別的名稱將至少一個關(guān)鍵詞映射到類別的子集。該方法進(jìn)一步包括將類別的至少子集中的每一個與概率值相關(guān)聯(lián),所述概率值表示內(nèi)容提供者應(yīng)當(dāng)與相應(yīng)類別相關(guān)聯(lián)的可能性,所述概率值使用財(cái)務(wù)值被賦予權(quán)重。該方法進(jìn)一步包括接收所生成的有關(guān)多個類別的規(guī)則集,所述規(guī)則集被配置用于在識別類別中的一個時使用。該方法進(jìn)一步包括使用規(guī)則集來處理有關(guān)內(nèi)容提供者的數(shù)據(jù),所述數(shù)據(jù)至少包括(i)類別的至少子集中的每一個的概率值;(ii)有關(guān)內(nèi)容提供者的財(cái)務(wù)數(shù)據(jù);(iii)內(nèi)容提供者與之相關(guān)聯(lián)的地理區(qū)域。該方法進(jìn)一步包括基于對數(shù)據(jù)的處理為內(nèi)容提供者選擇多個類別中的一個。該方法進(jìn)一步包括將內(nèi)容提供者與所選擇的類別相關(guān)聯(lián)。實(shí)施方式可以提供以下優(yōu)勢中的任何、全部優(yōu)勢或不提供以下優(yōu)勢??梢蕴峁┓殖深悇e的改進(jìn)的分類?;诟怕实姆诸惪梢员毁x予收益權(quán)重,以及可以由先前使用訓(xùn)練數(shù)據(jù)來訓(xùn)練的基于規(guī)則的分類進(jìn)行進(jìn)一步特定化。可以增加分類的靈活性。在附圖和下面的描述中闡述了一個或多個實(shí)施例的細(xì)節(jié)。其它特征和優(yōu)勢從描述和附圖、以及從權(quán)利要求將是顯而易見的。
圖1示出了可以為實(shí)體識別類別的示例系統(tǒng)。圖2示出了可以為實(shí)體識別類別的另一個示例系統(tǒng)。圖3示出了可以基于已為實(shí)體識別的類別來呈現(xiàn)信息的示例用戶界面。圖4示出了可以執(zhí)行來為實(shí)體識別類別的示例方法。圖5是可以結(jié)合在本文檔中描述的計(jì)算機(jī)實(shí)現(xiàn)的方法使用的計(jì)算系統(tǒng)的框圖。各附圖中相同的參考標(biāo)記指示相同的元素。
具體實(shí)施例方式圖1示出了可以為實(shí)體識別類別的示例系統(tǒng)100。多個實(shí)體可以在系統(tǒng)100中操作,例如實(shí)體可以是以下形式的諸如廣告主的內(nèi)容提供者和諸如網(wǎng)頁或其它內(nèi)容的所有者的內(nèi)容發(fā)布者。在一些實(shí)施方式中,內(nèi)容提供者可以操作一個或多個內(nèi)容提供者系統(tǒng) 102,以及內(nèi)容發(fā)布者可以操作一個或多個內(nèi)容發(fā)布者系統(tǒng)104??梢詫⑷魏畏N類的計(jì)算機(jī)設(shè)備、電子設(shè)備或系統(tǒng)包括在系統(tǒng)102和104中,諸如服務(wù)器計(jì)算機(jī)或個人計(jì)算機(jī)。系統(tǒng) 100中的組件可以使用諸如本地計(jì)算機(jī)網(wǎng)絡(luò)或因特網(wǎng)的任何種類的網(wǎng)絡(luò)106來相互通信。在一些實(shí)施方式中,系統(tǒng)100中的一個或多個實(shí)體可以參與事務(wù),在所述事務(wù)中內(nèi)容提供者提供待由至少一個發(fā)布者發(fā)布的內(nèi)容。例如,諸如廣告的內(nèi)容可以通過網(wǎng)絡(luò)106 從內(nèi)容提供者系統(tǒng)102分發(fā)用于以內(nèi)容發(fā)布者系統(tǒng)104中的一個或多個的名義發(fā)布。在一些實(shí)施方式中,內(nèi)容可以由諸如內(nèi)容分發(fā)者系統(tǒng)108(例如,廣告服務(wù)器)的第三方暫時或永久保持,并且可以從系統(tǒng)108分發(fā)用于發(fā)布。例如,當(dāng)用戶系統(tǒng)110向發(fā)布者系統(tǒng)104請求媒體內(nèi)容(例如,網(wǎng)頁)時,內(nèi)容分發(fā)者系統(tǒng)108可以將相關(guān)聯(lián)的內(nèi)容(例如,廣告)提供給用戶系統(tǒng)110用于連同所請求的內(nèi)容一起呈現(xiàn)。在下面將描述其中諸如系統(tǒng)100中的內(nèi)容提供者和/或內(nèi)容發(fā)布者的一個或多個實(shí)體可以使用類別目錄來進(jìn)行分類的示例。這樣的分類對涉及分類實(shí)體的任何人,例如管理在實(shí)體間分發(fā)內(nèi)容的個人,可以是有用的。系統(tǒng)100可以包括一個或多個分類器。在一些實(shí)施方式中,系統(tǒng)100包括概率分類器112和基于規(guī)則的分類器114。這些和其它組件的名稱在此被寬泛使用,而不是狹窄使用;例如,概率分類器112在其操作中可以使用一個或多個規(guī)則,以及基于規(guī)則的分類器 114在分類過程中可以確定或使用一個或多個概率。分類器112和114可以以任何形式,諸如使用軟件、硬件、固件或以上組合,來實(shí)現(xiàn)。在一些實(shí)施方式中,可以使用分類器112和114,以使諸如操作系統(tǒng)102的內(nèi)容提供者的所選擇的實(shí)體與諸如來自垂直元目錄116的垂直元的一個或多個類別相匹配。垂直元可以是指一個或多個業(yè)務(wù)分類,諸如有時在市場分析中使用來表示在共同領(lǐng)域中交易的企業(yè)和客戶的歸類詞語(例如,消費(fèi)電子垂直元或化妝品垂直元)??梢允褂闷渌诸悺8怕史诸惼?12可以為諸如內(nèi)容提供者的實(shí)體確定針對目錄116中的垂直元中的至少一個的概率值。概率可以表示內(nèi)容提供者屬于對應(yīng)垂直元的可能性。例如,概率分類器可以確定實(shí)體“Example Company, Inc.(示例公司)”應(yīng)當(dāng)被分類為屬于“抵押”垂直元的概率。概率可以使用有關(guān)實(shí)體的信息來確定。在一些實(shí)施方式中,概率分類器112可以確定多個概率值,諸如與目錄116中的垂直元的至少子集中的每一個相對應(yīng)的值?;谝?guī)則的分類器114可以為實(shí)體識別類別,諸如目錄116中的垂直元中的一個。 在一些實(shí)施方式中,基于規(guī)則的分類器114可以使用由概率分類器112確定的一個或多個概率和諸如決策樹118的規(guī)則集。例如,決策樹118可以包括多個決策,以及可以被配置用于通過處理決策中的至少部分來選擇目錄116中的多個垂直元中的一個。在一些實(shí)施方式中,系統(tǒng)100可以包括基于訓(xùn)練數(shù)據(jù)122來生成決策樹118或其它規(guī)則的規(guī)則組件120。在一些實(shí)施方式中,訓(xùn)練數(shù)據(jù)122可以包括實(shí)體到類別中的相應(yīng)類別一諸如目錄116中的垂直元一的映射??梢砸远喾N方式中的任何方式生成諸如決策樹118的規(guī)則集。在一些實(shí)施方式中,可以定義樹模型,并且然后可以基于訓(xùn)練數(shù)據(jù)122來生成樹。例如,可以選擇樹結(jié)構(gòu),諸如以定義樹應(yīng)當(dāng)包括多級二元決策。作為另一個示例,可以定義樹的延伸區(qū)(例如,決策樹何時應(yīng)當(dāng)結(jié)束),諸如在選擇多個類別中的一個之前待進(jìn)行的多個決策中的決策數(shù)量。在一些實(shí)施方式中,樹118中的一個或多個決策可以使用閾值。例如,可以將概率(例如,由概率分類器112確定的概率)與閾值進(jìn)行比較??梢允褂萌魏畏N類的迭代過程來生成決策樹 118的一個或多個方面。例如,樹118的結(jié)構(gòu)可以在初始迭代中選擇,并且針對諸如訓(xùn)練數(shù)據(jù)122的代表性數(shù)據(jù)測試,以及這樣的測試的結(jié)果可以用于在另一個迭代中生成樹118的另一個結(jié)構(gòu)。作為另一個示例,可以在初始迭代中確定閾值的第一集合,以及可以在一個或多個額外迭代中通過反饋過程對值中的至少一個進(jìn)行精化?;谝?guī)則的分類器114在系統(tǒng)100中可以用于一個或多個用途。在一些實(shí)施方式中,概率分類器112可能具有在一個或多個方面將實(shí)體錯誤分類的傾向。例如,分類器114 可能頻繁為實(shí)際上未參與娛樂業(yè)或僅僅參與較小程度的實(shí)體選擇“娛樂”垂直元。在概率確定中這樣的特性可以是概率分類器112如何被配置的人為結(jié)果,以及可以取決于多個因素,其可以使解決該問題困難或不現(xiàn)實(shí)。在一些實(shí)施方式中,可以將基于規(guī)則的分類器114 與概率分類器112結(jié)合使用。例如,可以選擇由基于規(guī)則的分類器114使用的規(guī)則集(例如,決策樹118)中的閾值中的至少一個,以降低或消除所討論的關(guān)于類別的傾向??梢詾榻o定實(shí)體,諸如為運(yùn)行系統(tǒng)102的內(nèi)容提供者,選擇至少一個類別(例如, 目錄116中的垂直元中的一個)。這樣的選擇可以用于一個或多個用途,諸如用來向用戶輸出相關(guān)信息。在一些實(shí)施方式中,系統(tǒng)100可以包括可以使用一個或多個類別選擇的前端組件124。例如,前端組件IM可以呈現(xiàn)與所選擇的類別有關(guān)的信息作為表征實(shí)體的方式。圖2示出了可以為實(shí)體識別類別的另一個示例系統(tǒng)200。在系統(tǒng)200中,可以識別關(guān)于實(shí)體的一個或多個信息部分,諸如與內(nèi)容提供者相關(guān)聯(lián)的關(guān)鍵詞202。在一些實(shí)施方式中,作為參加內(nèi)容分發(fā)程序的一部分,內(nèi)容提供者可以自識別關(guān)鍵詞。例如,廣告主可以向內(nèi)容分發(fā)者系統(tǒng)108(圖1)登記對一個或多個關(guān)鍵詞的出價,使得廣告主的廣告可以被考慮用于在與關(guān)鍵詞有關(guān)的語境下發(fā)布??梢宰R別有關(guān)實(shí)體的財(cái)務(wù)信息204。例如,這可以包括收益數(shù)據(jù),諸如有關(guān)廣告主花費(fèi)在特定關(guān)鍵詞上的金額的信息。系統(tǒng)200可以包括基礎(chǔ)分類器206。在一些實(shí)施方式中,基礎(chǔ)分類器可以被配置為使用諸如垂直元目錄116(圖1)的類別集來對諸如內(nèi)容提供者或內(nèi)容分發(fā)活動的實(shí)體進(jìn)行分類。在一些實(shí)施方式中,基礎(chǔ)分類器206可以將關(guān)鍵詞202映射到部分或全部垂直元,并且選擇預(yù)定數(shù)量的垂直元。例如,諸如通過選擇具有最大權(quán)重的那些垂直元,垂直元中的三個可以被選擇為最能代表實(shí)體?;A(chǔ)分類器206可以將用于特定實(shí)體的多個關(guān)鍵詞映射到相應(yīng)垂直元??梢院喜殛P(guān)鍵詞選擇的相應(yīng)垂直元(例如,可以求其相應(yīng)概率的平均值)以形成實(shí)體的單一歸類。 在一些實(shí)施方式中,可以基于財(cái)務(wù)數(shù)據(jù)204,諸如基于花費(fèi)在各個關(guān)鍵詞上的金額,來對為實(shí)體選擇的垂直元賦予權(quán)重。例如,在計(jì)算分類時,可以給予關(guān)于對內(nèi)容提供者的或分發(fā)活動的花費(fèi)的相對較大部分負(fù)責(zé)的關(guān)鍵詞的垂直元相對較大的權(quán)重。在一些實(shí)施方式中,基礎(chǔ)分類器206可以包括概率分類器112(圖1)。在一些實(shí)施方式中,基礎(chǔ)分類器206的輸出可以包括一個或多個賦予權(quán)重的垂直元208,諸如與權(quán)重(例如在0和1之間的數(shù)字)相關(guān)聯(lián)的至少一個分類器詞語(例如,垂直元名稱)。
系統(tǒng)200可以包括賦予花費(fèi)權(quán)重規(guī)則組件210。在一些實(shí)施方式中,組件210可以提供用于定義若干類別之間,諸如在三個賦予收益權(quán)重的垂直元之間,的主類別的策略。例如,關(guān)于系統(tǒng)200中的其它組件,組件210可以作為離線程序運(yùn)行,諸如以由Mattworks公司開發(fā)的MATLAB環(huán)境中的程序的形式。賦予花費(fèi)權(quán)重規(guī)則組件210可以被配置用于多維特征空間上的多類分類。在一些實(shí)施方式中,η維特征可以用于映射到任何m維。例如,垂直元目錄116可以包括30個垂直元。作為另一個示例,可以識別額外特征,包括但不限于實(shí)體的季度花費(fèi)、實(shí)體的總花費(fèi)、 用于實(shí)體的關(guān)鍵詞的數(shù)量以及實(shí)體的促銷國家。因此,34維特征空間(即,n = 34)可以用于成為任何30維(即,m = 30)的分類。在一些實(shí)施方式中,特征維中的一個或多個,諸如實(shí)體國家,可以是分類的。例如,可以給預(yù)定數(shù)量的最高位國家(例如,九個國家)每一個分配一個類,以及可以將剩余國家聚組在公有類中。在一些實(shí)施方式中,特征維中的一個或多個可以是離散或連續(xù)變量。例如,關(guān)鍵詞計(jì)數(shù)可以是離散變量和/或總花費(fèi)可以是連續(xù)變量。在一些實(shí)施方式中,賦予花費(fèi)權(quán)重規(guī)則組件210可以包括基于規(guī)則的分類器(圖 1)。例如,組件210可以使用部分或全部訓(xùn)練數(shù)據(jù)122來定義適當(dāng)策略。在一些實(shí)施方式中,賦予花費(fèi)權(quán)重規(guī)則組件210可以在新的或經(jīng)修改的訓(xùn)練數(shù)據(jù)集變得可用時,諸如在人類分類者將一個或多個實(shí)體映射到了垂直元目錄116時,被觸發(fā)。賦予花費(fèi)權(quán)重規(guī)則組件210可以輸出可以在為實(shí)體選擇類別時使用的規(guī)則集 212。在一些實(shí)施方式中,該規(guī)則集可以包括決策樹。例如,組件210可以使決策樹分裂并且生長以優(yōu)化給定實(shí)體是特定類別的成員的已確定概率。作為另一個示例,訓(xùn)練數(shù)據(jù)122(圖 1)可以用于修剪決策樹,諸如以避免過擬合。在一些實(shí)施方式中,可以使用諸如“分類回歸樹”(CART)的特征。在這樣的實(shí)施方式中,賦予花費(fèi)權(quán)重規(guī)則組件210可以包括或基于CART分類器。例如,可以用定制的修剪程序(例如,停止規(guī)則)構(gòu)建CART模型。作為另一個示例,可以使用十折交叉驗(yàn)證(10-fold cross validation)來計(jì)算CART模型的誤差估計(jì)。在一些實(shí)施方式中,規(guī)則集212包括一維規(guī)則的分類決策樹,其用于將賦予收益權(quán)重的垂直元(例如,三個)集映射到用于實(shí)體的一個垂直元中。例如,這可以在系統(tǒng)200 中提供更大歸納能力的益處,諸如以允許從基礎(chǔ)分類器206修剪“壞的垂直元”和/或其它
系統(tǒng)誤差。在生成規(guī)則集212時,可以考慮財(cái)務(wù)數(shù)據(jù)。在一些實(shí)施方式中,可以在構(gòu)建CART模型時復(fù)制數(shù)據(jù),諸如以使復(fù)制量與花費(fèi)金額成比例。例如,可能過采樣與相對較高的總花費(fèi)和/或季度花費(fèi)水平相對應(yīng)的數(shù)據(jù)。作為另一個示例,可能對與相對較低的總花費(fèi)和/或季度花費(fèi)水平相對應(yīng)的數(shù)據(jù)采樣不足。在一些實(shí)施方式中,基于收益的額外訓(xùn)練數(shù)據(jù)點(diǎn)可能易于使最終輸出(例如,對一個或多個類別的選擇)偏向于較高花費(fèi)實(shí)體(例如,內(nèi)容提供者),并且提高有關(guān)這些實(shí)體的精確性。下面在附錄I中展現(xiàn)了規(guī)則集212—在此為決策樹一的示例。系統(tǒng)100可以包括主垂直元分類器214。在一些實(shí)施方式中,分類器可以將賦予收益權(quán)重的類別集(例如,賦予權(quán)重的垂直元208)靜態(tài)地映射到用于實(shí)體的單個主垂直元中。例如,分類器214可以使用規(guī)則集212 (諸如通過加載由組件210生成的CART分類樹)來從基礎(chǔ)分類器206選擇賦予權(quán)重的類別中的一個。圖3示出了可以基于已為實(shí)體識別的類別來呈現(xiàn)信息的示例用戶界面300。在一些實(shí)施方式中,前端組件124(圖1)可以諸如向系統(tǒng)100中的動作者生成用戶界面300。在一些實(shí)施方式中,用戶界面300可以用于管理客戶關(guān)系,諸如用于監(jiān)視和/或跟蹤諸如廣告活動的內(nèi)容分發(fā)程序中的參與者。用戶界面300可以包括“名稱”區(qū)域302,其中可以呈現(xiàn)一個或多個實(shí)體的標(biāo)識符,諸如廣告主和/或另一個內(nèi)容提供者的名稱。用戶界面300可以包括“垂直元”區(qū)域304,其中可以指示為實(shí)體識別的類別,諸如來自目錄116的垂直元。 用戶界面300可以包括呈現(xiàn)與分配給實(shí)體的類別有關(guān)的信息的一個或多個區(qū)域,諸如“季節(jié)性”區(qū)域306。例如,從事特定垂直元的公司(例如,稅務(wù)籌劃顧問或鮮花零售商)在其業(yè)務(wù)和/或其它活動中可能具有季節(jié)性發(fā)生波動。在一些實(shí)施方式中,可以向用戶輸出這樣的季節(jié)性(例如,“該實(shí)體的業(yè)務(wù)在情人節(jié)附近可能達(dá)到最高峰”的信息)。在一些實(shí)施方式中,可以在沒有明確指示所選擇的垂直元的情況下輸出相關(guān)信息(例如,季節(jié)性區(qū)域 306)。用戶界面300可以包括“搜索”控件308,通過其用戶可以使用一個或多個標(biāo)準(zhǔn)來搜索實(shí)體,以及可以通過將信息填充在區(qū)域302-306中的一個或多個中來呈現(xiàn)這樣的搜索的結(jié)果。用戶界面300可以包括“聯(lián)系”控件310,通過其用戶可以發(fā)起與一個或多個實(shí)體的聯(lián)系,諸如經(jīng)由電子郵件或電話。例如,當(dāng)看見了季節(jié)性區(qū)域306中的信息時,諸如銷售代表的用戶可以聯(lián)系實(shí)體以確保其有關(guān)旺季的需求得到滿足。圖4示出了可以執(zhí)行來為實(shí)體識別類別的示例方法400。方法400可以由例如系統(tǒng)100和/或200中、執(zhí)行存儲在計(jì)算機(jī)可讀介質(zhì)中的指令的處理器來執(zhí)行。在一些實(shí)施方式中,可以以另一種順序執(zhí)行步驟中的一個或多個;作為另一個示例,可以執(zhí)行更多或更少步驟。步驟410包括為多個類別中的至少子集中的每一個確定概率值。概率值可以表示識別的實(shí)體屬于相應(yīng)類別的可能性并且可以使用關(guān)于實(shí)體的信息來確定。例如,概率分類器112和/或基礎(chǔ)分類器可以為諸如內(nèi)容提供者或內(nèi)容發(fā)布者的特定實(shí)體生成賦予權(quán)重的垂直元208。子集可以包括一個或多個類別。步驟420包括為實(shí)體記錄多個類別中的一個,類別使用概率值和基于例如訓(xùn)練數(shù)據(jù)的用于多個類別的規(guī)則集來識別。例如,基于規(guī)則的分類器114和/或主垂直元分類器 214可以從目錄116選擇一個垂直元來與特定實(shí)體相關(guān)聯(lián)。步驟430包括基于為實(shí)體對類別的識別來呈現(xiàn)信息。例如,前端組件IM可以生成可以呈現(xiàn)季節(jié)性區(qū)域306的用戶界面300。圖5是通用計(jì)算機(jī)系統(tǒng)500的示意圖。根據(jù)一個實(shí)施方式,系統(tǒng)500可以用于結(jié)合先前描述的任何計(jì)算機(jī)實(shí)現(xiàn)的方法描述的操作。系統(tǒng)500包括處理器510、存儲器520、 存儲設(shè)備530和輸入/輸出設(shè)備M0。組件510、520、530和MO中的每一個使用系統(tǒng)總線 550互連。處理器510能夠處理用于在系統(tǒng)500內(nèi)執(zhí)行的指令。在一個實(shí)施方式中,處理器 510是單線程處理器。在另一個實(shí)施方式中,處理器510是多線程處理器。處理器510能夠處理存儲在存儲器520中或存儲設(shè)備530上的指令以在輸入/輸出設(shè)備540上顯示用于用戶界面的圖形信息。存儲器520存儲系統(tǒng)500內(nèi)的信息。在一個實(shí)施方式中,存儲器520是計(jì)算機(jī)可讀介質(zhì)。在一個實(shí)施方式中,存儲器520是易失性存儲器單元。在另一個實(shí)施方式中,存儲器520是非易失性存儲器單元。
存儲設(shè)備530能夠?yàn)橄到y(tǒng)500提供海量存儲。在一個實(shí)施方式中,存儲設(shè)備530 是計(jì)算機(jī)可讀介質(zhì)。在各種不同的實(shí)施方式中,存儲設(shè)備530可以是軟盤設(shè)備、硬盤設(shè)備、 光盤設(shè)備或帶設(shè)備。輸入/輸出設(shè)備540為系統(tǒng)500提供輸入/輸出操作。在一個實(shí)施方式中,輸入/ 輸出設(shè)備540包括鍵盤和/或指示設(shè)備。在另一個實(shí)施方式中,輸入/輸出設(shè)備540包括用于顯示圖形用戶界面的顯示單元??梢栽跀?shù)字電子電路中,或者在計(jì)算機(jī)硬件、固件、軟件或者在它們的組合中實(shí)現(xiàn)所描述的特征??梢栽谟行蔚匕ㄔ谛畔⑤d體中一例如,在機(jī)器可讀存儲設(shè)備或傳播信號中一的、用于可編程處理器執(zhí)行的計(jì)算機(jī)程序產(chǎn)品中實(shí)現(xiàn)裝置;以及可以由執(zhí)行指令程序來執(zhí)行所描述的實(shí)施方式的功能的可編程處理器通過操作輸入數(shù)據(jù)并且生成輸出來執(zhí)行方法步驟??梢栽诎ㄖ辽僖粋€可編程處理器的可編程系統(tǒng)上可執(zhí)行的一個或多個計(jì)算機(jī)程序中有利地實(shí)現(xiàn)所描述的特征,所述至少一個可編程處理器被耦接以從數(shù)據(jù)存儲系統(tǒng)、 至少一個輸入設(shè)備和至少一個輸出設(shè)備接收數(shù)據(jù)和指令以及將數(shù)據(jù)和指令傳送到數(shù)據(jù)存儲系統(tǒng)、至少一個輸入設(shè)備和至少一個輸出設(shè)備。計(jì)算機(jī)程序是可以在計(jì)算機(jī)中直接或間接使用來執(zhí)行某一動作或引起某一結(jié)果的指令集。計(jì)算機(jī)程序可以以任何形式的編程語言編寫,所述編程語言包括編譯或解釋語言,并且其可以以任何形式部署,包括作為獨(dú)立程序或作為模塊、組件、子程序或適于在計(jì)算環(huán)境中使用的其它單元。用于執(zhí)行指令程序的適當(dāng)處理器包括例如通用和專用微處理器兩者,以及任何種類的計(jì)算機(jī)的唯一處理器或多個處理器中的一個。通常,處理器將從只讀存儲器或隨機(jī)存取存儲器或兩者接收指令和數(shù)據(jù)。計(jì)算機(jī)的主要元件是用于執(zhí)行指令的處理器和用于存儲指令和數(shù)據(jù)的一個或多個存儲器。通常,計(jì)算機(jī)還包括用于存儲數(shù)據(jù)文件的一個或多個海量存儲設(shè)備,或可操作地耦接以與所述一個或多個海量存儲設(shè)備通信;這樣的設(shè)備包括磁盤,諸如內(nèi)部硬盤和可移動盤;磁光盤;以及光盤。適于有形地包括計(jì)算機(jī)程序指令和數(shù)據(jù)的存儲設(shè)備包括所有形式的非易失性存儲器,包括例如半導(dǎo)體存儲器設(shè)備,例如EPR0M、 EEPROM和閃存設(shè)備;磁盤,諸如內(nèi)部硬盤和可移動盤;磁光盤;以及⑶-ROM和DVD-ROM盤。 處理器和存儲器可以由ASIC (專用集成電路)補(bǔ)充,或合并入ASIC。為了提供與用戶的交互,可以在具有下述的計(jì)算機(jī)上實(shí)現(xiàn)特征用于向用戶顯示信息的顯示設(shè)備,例如CRT(陰極射線管)或LCD(液晶顯示)監(jiān)視器,以及用戶通過其可以向計(jì)算機(jī)提供輸入的鍵盤和指示設(shè)備,例如鼠標(biāo)或跟蹤球??梢栽诎ㄖT如數(shù)據(jù)服務(wù)器的后端組件、或者包括諸如應(yīng)用服務(wù)器或因特網(wǎng)服務(wù)器的中間件組件、或者包括諸如具有圖形用戶界面或因特網(wǎng)瀏覽器的客戶端計(jì)算機(jī)的前端組件、或者它們的任何組合的計(jì)算機(jī)系統(tǒng)中實(shí)現(xiàn)特征。系統(tǒng)的組件可以通過諸如通信網(wǎng)絡(luò)的任何形式或介質(zhì)的數(shù)字?jǐn)?shù)據(jù)通信連接。通信網(wǎng)絡(luò)的示例例如包括LAN、WAN以及形成因特網(wǎng)的計(jì)算機(jī)和網(wǎng)絡(luò)。計(jì)算機(jī)系統(tǒng)可以包括客戶端和服務(wù)器??蛻舳撕头?wù)器通常彼此遠(yuǎn)離并且典型地通過諸如所描述的網(wǎng)絡(luò)之一的網(wǎng)絡(luò)交互??蛻舳撕头?wù)器的關(guān)系依靠在各個計(jì)算機(jī)上運(yùn)行并且彼此具有客戶端-服務(wù)器關(guān)系的計(jì)算機(jī)程序產(chǎn)生。已經(jīng)描述了多個實(shí)施例。然而,將理解的是,在不背離本公開的精神和范圍的情況下,可以進(jìn)行各種修改。因此,其它實(shí)施例在權(quán)利要求的范圍內(nèi)。
附錄 ICART模型描述和輸出自變量Xl 國家(例如,根據(jù)國家代碼)x2 關(guān)鍵詞計(jì)數(shù)x3 總花費(fèi)(USD)x4 季度花費(fèi)(USD)x5 x34 從最小到最大排序的用于垂直元的收益權(quán)重(例如,分類器112或206 的輸出)
Id x5 x6 x7 x8 x9 xlO xll xl2 xl3 xl4 垂直 2 3 4 5 7 8 11 12 13 14
元
Id xl5 xl6 xll xl8 xl9 x20 x21 x22 x23 x24 垂直 15 16 18 19 20 29 44 45 47 52
元
Id x25 x26 x27 x28 x29 x30 x31 x32 x33 x34 垂直 66 67 71 174 285 299 397 439 533 570
元CART 輸出用于分類的決策樹1 if x26 < 0. 156561 then node 2 else node 32 if x9 < 0. 370092 then node 4 else node 53 if x26 < 0. 657022 then node 6 else node 74 if xl7 < 0. 495845 then node 8 else node 95 if x9 < 0. 823663 then node 10 else node 116 if xl5 < 0.0685697 then node 12 else node 137 if x21 < 0.0848807 then node 14 else node 158 if x8 < 0. 521697 then node 16 else node 179 if xl7 < 0. 736217 then node 18 else node 1910 if x23 < 0.498586 then node 20 else node 2111 class = 712 if x20 < 0. 257736 then node 22 else node 2313 if x20 < 0. 0258419 then node 24 else node 2514 class = 67
15if x2 < 7168.5 then node 26 else node 27
16if x24 < 0.354713 then node 28 else node 29
17if x8 < 0. 716763 then node 30 else node 31
18if x2 < 80663 then node 32 else node 33
19if xl7 < 0. 925121 then node 34 else node 35
20if xl8 < 0. 213272 then node 36 else node 37
21 class = 47
22
23
24
if xl2 < 0, if xl in{l if x29 < 0,
335248 then node 38 else node 39 3 4 6}then node 40 else node 41 230442 then node 42 else node 43
25class = 29
26class = 44
27class = 52
28if xll < 0. 331887 then node 44 else node 45
29class = 52
30if x2 < 7057. 5 then node 46 else node 47
31class = 5
32if x7 < 0. 0829784 then node 48 else node 49
33if xl = 1 then node 50 else node 51
34if x2 < 77348 then node 52 else node 53
35class = 18
36ifx20 < 0. 371657 then node 54 else node 55
37if x3 < 3. 85033e+06 then node 56 else node 57
38if xl9 < 0.330368 then node 58 else node 59
39class = 12
40class = 29
41class = 67
42class = 67
43class = 285
44if x23 < 0. 57222 then node 60 else node 61
45if x7 < 0.114347 then node 62 else node 63
46if xl3 < 0.330393 then node 64 else node 65
47if x7 < 0.255785 then node 66 else node 67
48if xl in{l 2 3 7 8 10}then node 68 else node 69
49class = 4
50class = 11
51class = 285
52class = 18
53class = 200118]54class = 70119]55class = 290120]56class = 70121]57class = 190122]58if x21 < 0.203319 then node 70 else node 710123]59class = 200124]60if x3 < 4. 08266e+07 then node 72 else node 730125]61if x23 < 0.730036 then node 74 else node 750126]62if xll < 0.537014 then node 76 else node 770127]63if xl in{l2 8 10}then node 78 else node 790128]64if x24 < 0.10869 then node 80 else node 810129]65if x2 < 1310 then node 82 else node 830130]66if xl in{l2 5 7}then node 84 else node 850131]67class = 40132]68class = 180133]69if x2 < 39894 then node 86 else node 870134]70if xl3 < 0.193039 then node 88 else node 890135]71class = 440136]72if x22 < 0.442255 then node 90 else node 910137]73class = 50138]74if xl2 < 0.179846 then node 92 else node 930139]75class = 470140]76if x27 < 0.189842 then node 94 else node 950141]77class = 110142]78class = 40143]79class = 110144]80class = 50145]81if xl in{l3 6 8 10}then node 96 else node 970146]82class = 130147]83class = 50148]84if x32 < 0.117921 then node 98 else node 990149]85class = 50150]86if x21 < 0.268462 then node 100 else node 1010151]87class = 520152]88if xl7 < 0.209712 then node 102 else node 1030153]89class = 130154]90if x7 < 0.35475 then node 104 else node 1050155]91if x22 < 0711517 then node 106 else node 1070156]92if x2 < 105 then node 108 else node 109
93 class = 1294 if x4 < 368742 then node 110 else node 11195 class = 7196 class = 597 class = 5298 class = 1999 class = 18100 class = 18101 class = 44102 if x23 < 0. 262412 then node 112 else node 113103 class = 18104 if xl8 < 0.513483 then node 114 else node 115105 class = 4106 if x21 < 0.210351 then node 116 else node 117107 class = 45108 class = 18109 class = 47110 if xl2 < 0. 433287 then node 118 else node 119111 class = 11112 if x7 < 0. 569093 then node 120 else node 121113 class = 47114 if x20 < 0.473106 then node 122 else node 123115 if x22 < 0.158422 then node 124 else node 125116 if x6< 0.0777122 then node 126 else node 127117 if x21 < 0.470751 then node 128 else node 129118 if x3 < 1.47723e+06 then node 130 else node 131119 if x3 < 5. 20398e+06 then node 132 else node 133120 if xl4 < 0.396659 then node 134 else node 135121 class = 4122 if xl2 < 0.470398 then node 136 else node 137123 if xl7 < 0. 306859 then node 138 else node 139124 if xl8 < 0.824979 then node 140 else node 141125 class = 19126 class = 45127 if x3 < 1. 93593e+06 then node 142 else node 143128 if x3 < 1. 44848e+06 then node 144 else node 145129 class = 45130 class = 11131 class = 8
132if xl in{l4 5 6 8}then node 146 else node 147
133class = 11
134if xll < 0.09162 then node 148 else node 149
135class = 14
136if x21 < 0.385516 then node 150 else node 151
137if xl2 < 0.821368 then node 152 else node 153
138class = 29
139class = 18
140if x4 < 104730 then node 154 else node 155
141if x27 < 0.019163 then node 156 else node 157
142class = 2
143class = 29
144if x4 < 2953.45 then node 158 else node 159
145class = 44
146class = 12
147ifx3 < 361231 then node 160 else node 161
148if x9 < 0.384375 then node 162 else node 163
149class = 11
150if xl4 < 0.452462 then node 164 else node 165
151class = 44
152if x7 < 0.—59118 then node 166 else node 167
153class = 12
154if x3 < 1. 58799e+06 then node 168 else node 169
155class = 19
156class = 19
157class = 13
158class = 44
159class = 45
160if x2 < 653 then node 170 else node 171
161class = 11
162if x24 < 0262085 then node 172 else node 173
163class = 7
164if xl3 < 032757 then node 174 else node 175
165if x30 < 028577 then node 176 else node 177
166if xl8 < 0247799 then node 178 else node 179
167class = 4
168if xl3 < 000967496 then node 180 else node 181
169class = 18
170class = 11
171class = 12
172if x8 < 0. 281417 then node 182 else node 183
173class = 52
174if x30 < 0. 258444 then node 184 else node 185
175if xl3 < 0.779286 then node 186 else node 187
176class = 14
177class = 299
178if xll < 0. 0620939 then node 188 else node 189
179class = 19
180ifxl9 < 0. 123657 then node 190 else node 191
181class = 13
182class = 67
183class = 5
184ifx33 < 0. 118834 then node 192 else node 193
185if xl in{l 2 3 5 6 7 8}then node 194 else node
186if x33 < 0. 326535 then node 196 else node 197
187class = 13
188if xl7 < 0. 114527 then node 198 else node 199
189if xl2 < 0. 640493 then node 200 else node 201
190class = 19
191class = 20
192if xlO < 0. 508978 then node 202 else node 203
193if x33 < 0. 544036 then node 204 else node 205
194if xl3 < 0. 0837794 then node 206 else node 207
195if x30 < 0.620821 then node 208 else node 209
196if x32 < 0. 085737 then node 210 else node 211
197class = 533
198class = 12
199if x4 < 34722. 4 then node 212 else node 213
200class = 11
201class = 12
202if x32 < 0. 33374 then node 214 else node 215
203class = 8
204if x8 < 0. 00714825 then node 216 else node 217
205class = 533
206if xl5 < 0. 248854 then node 218 else node 219
207if x3 < 709455 then node 220 else node 221
208class = 2
209if x30 < 0. 818431 then node 222 else node 223
16210class = 13
211class = 439
212class = 18
213class = 12
214if x27 < 0.445613 then node 224 else node 225
215if x30 < 0. 0232432 then node 226 else node 227
216class = 533 217class = 5
218class = 299
219if xl in{1 2 3 5 7 8}then node 228 else node 229
220class = 299
221class = 13
222class = 299
223class = 2
224if xl9 < 0. 0842646 then node 230 else node 231
225class = 71
226class = 439
227class = 2
228class = 299
229class = 52
230if xl5 < 0.792343 then node 232 else node 233
231if x3 < 1. 43634e+06 then node 234 else node 235
232if x34 < 0. 432739 then node 236 else node 237
233if x20 < 0. 00676158 then node 238 else node 239
234if x4 < 142308 then node 240 else node 241
235if x3 < 2. 28536e+06 then node 242 else node 243
236if x6 < 0. 343384 then node 244 else node 245
237class = 570
238if x26 < 2. 31392e_13 then node 246 else node 247
239class = 29
240class = 20
241class = 18
242if x4 < 177429 then node 248 else node 249
243class = 7
244if x25 < 0. 735451 then node 250 else node 251
245if xl4 < 0.037943 then node 252 else node 253
246if x4 < 44870.6 then node 254 else node 255
247if xl in{l 3 4 7 10}then node 256 else node 257
248class = 47
CN 102216925 A
說明書14/18頁249 if Xl = 1 then node 258 else node 259250 if x29 < 0. 376623 then node 260 else node 261251 class = 66252 if x6 < 0. 904535 then node 262 else node 263253 if x2 < 782 then node 264 else node 265254 if xl7 < 0.0111276 then node 266 else node 267255 class = 15256 class = 67257 class = 15258 class = 45259 class = 18260 if x9 < 0.127178 then node 268 else node 269261 if x29 < 0. 720004 then node 270 else node 271262 if x8 < 0.0786027 then node 272 else node 273263 if x4 < 224146 then node 274 else node 275264 class = 3265 class = 2266 class = 15267 class = 2268 if x20 < 0. 107796 then node 276 else node 277269 if x3 < 2. 68169e+06 then node 278 else node 279270 if xl4 < 0.0382579 then node 280 else node 281271 class = 285272 if x30 < 0. 0283009 then node 282 else node 283273 if x24 < 0. 0668307 then node 284 else node 285274 if xl9 < 0.0325977 then node 286 else node 287275 class = 2276 if xl6 < 0. 487338 then node 288 else node 289277 if xl5 < 0. 486436 then node 290 else node 291278 if x9 < 0.366797 then node 292 else node 293279 class = 13280 if xll < 0.0434011 then node 294 else node 295281 class = 14282 if x3 < 1.79108e+06 then node 296 else node 297283 class = 2284 if Xl in{l 2 4 5 7}then node 298 else node 299285 class = 52286 class = 3287 class = 52
288 if xl7 < 0. 188053 then node 300 else node 301289 class = 16290 if x23 < 0. 249635 then node 302 else node 303291 class = 29292 class = 7293 class = 45294 class = 285295 class = 11296 if x25 < 0. 0849167 then node 304 else node 305297 if x6 < 0. 816804 then node 306 else node 307298 class = 5299 class = 3300 if x3 < 5. 75773e+06 then node 308 else node 309301 if x23 < 0. 367225 then node 310 else node 311302 if xl5 < 0. 0297698 then node 312 else node 313303 if xl = 4 then node 314 else node 315304 if x24 < 0.0109364 then node 316 else node 317305 class = 66306 class = 3307 class = 2308 if xl8 < 0. 358197 then node 318 else node 319309 class = 45310 if xl4 < 0. 30828 then node 320 else node 321311 if xl in{l 2 4 10}then node 322 else node 323312 class = 4313 if xl in{l 2 3 4 6 8}then node 324 else node 325314 class = 47315 class = 15316 if x7 < 0. 0529852 then node 326 else node 327317 class = 52318 if x8 < 0. 250055 then node 328 else node 329319 class = 19320 if x34 < 0.299071 then node 330 else node 331321 class = 14322 class = 47323 class = 14324 if xl in{l 8}then node 332 else node 333325 class = 533326 if xl8 < 0.346103 then node 334 else node 335327class=4328if xl2 < 0. 00523925 then node 336 else node 337329if x3 < 1.54296e+06 then node 338 else node 339330class=18331class=570332class=29333class=19334if x34 < 0. 24078 then node 340 else node 341335class=19336if x24 < 0. 0618855 then node 342 else node 343337if x7 < 0. 269018 then node 344 else node 345338if xlin{l 5 6 10}then node 346 else node 347339class=18340if x6 < 0. 744853 then node 348 else node 349341class=570342if x25 < 0.725171 then node 350 else node 351343class=52344if xll < 0.145951 then node 352 else node 353345class=4346class=5347if x7< 0. 074593 then node 354 else node 355348if xlin{1 2 3 7 8 9 10}then node 356 else node 349class=3350if x3< 312875 then node 358 else node 359351class=7352if x4< 40808. 4 then node 360 else node 361353class=11354if xlin{2 3 4 8}then node 362 else node 363355class=4356if x3< 602261 then node 364 else node 365357class=16358if x28 < 0.99751 then node 366 else node 367359if xlO < 0. 204898 then node 368 else node 369360class=12361class=15362if x3< 579398 then node 370 else node 371363class=13364if xlin{1 2 3 8 9}then node 372 else node 373365class=533
366if x25 < 0.389004 then node 374 else node375
367class = 174
368class = 15
369class = 8
370if x2 < 95then node 376 else node 377
371class = 67
372if x3 < 56290.8 then node 378 else node 379
373class = 2
374if x21 < 0.073466 then node 380 else node381
375class = 66
376class = 12
377class = 5
378class = 3
379class = 18
380if xl5 < 0.329107 then node 382 else node383
381class = 44
382class = 14
383class = 1權(quán)利要求
1.一種用于將實(shí)體與類別相關(guān)聯(lián)的計(jì)算機(jī)實(shí)現(xiàn)的方法,所述方法包括為多個類別中的至少子集中的每一個確定概率值,所述概率值表示識別的實(shí)體屬于相應(yīng)類別的可能性并且使用關(guān)于所述實(shí)體的信息來確定;以及為所述實(shí)體記錄所述多個類別中的一個類別,所述類別使用所述概率值和用于所述多個類別的規(guī)則集來識別。
2.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述實(shí)體是被識別為加入在程序中的內(nèi)容提供者,在所述程序中所述內(nèi)容提供者提供待由至少一個發(fā)布者發(fā)布的內(nèi)容,以及其中所述概率值使用與所述內(nèi)容提供者相關(guān)聯(lián)的至少一個關(guān)鍵詞以及與所述內(nèi)容提供者相關(guān)聯(lián)的至少一個財(cái)務(wù)值來確定。
3.根據(jù)權(quán)利要求2所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中確定所述概率值包括 將所述至少一個關(guān)鍵詞至少映射到所述多個類別的所述子集;用所述至少一個財(cái)務(wù)值對至少所述子集賦予權(quán)重,其中所述財(cái)務(wù)值已被分配給對應(yīng)關(guān)鍵詞;以及選擇預(yù)定數(shù)量的所述類別作為所述子集。
4.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述規(guī)則集基于訓(xùn)練數(shù)據(jù)。
5.根據(jù)權(quán)利要求4所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述規(guī)則集包括決策樹,所述決策樹被配置用于通過處理包括在所述決策樹中的多個決策中的至少部分來選擇所述多個類別中的一個。
6.根據(jù)權(quán)利要求5所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括使用所述訓(xùn)練數(shù)據(jù)來生成所述決策樹,其中所述訓(xùn)練數(shù)據(jù)包括實(shí)體到所述多個類別中的一個或多個的映射。
7.根據(jù)權(quán)利要求6所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中生成所述決策樹進(jìn)一步包括 使用有關(guān)所述實(shí)體的財(cái)務(wù)數(shù)據(jù)對所述映射賦予權(quán)重。
8.根據(jù)權(quán)利要求7所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中對所述映射賦予權(quán)重進(jìn)一步包括 基于與所述映射的至少子集相對應(yīng)的所述財(cái)務(wù)數(shù)據(jù)來過采樣所述映射的所述子集。
9.根據(jù)權(quán)利要求5所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中生成所述決策樹包括 選擇用于所述決策樹的結(jié)構(gòu);確定所述決策樹的延伸區(qū),包括在選擇所述多個類別中的所述一個之前待進(jìn)行的所述多個決策中的決策數(shù)量;以及確定待在所述多個決策中使用的閾值。
10.根據(jù)權(quán)利要求8所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述決策樹被迭代生成。
11.根據(jù)權(quán)利要求6所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述內(nèi)容提供者從事于廣告,以及其中所述多個類別包括所述內(nèi)容提供者待與之匹配的垂直元。
12.根據(jù)權(quán)利要求10所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中生成所述決策樹進(jìn)一步包括識別所述垂直元中的至少一個,對于所述至少一個垂直元所述概率值的所述確定具有將所述垂直元不恰當(dāng)?shù)胤峙浣o所述內(nèi)容提供者的傾向;以及選擇所述閾值中的至少一個,使得降低所述傾向。
13.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括 基于已為所述實(shí)體識別的所述類別向用戶呈現(xiàn)信息。
14.根據(jù)權(quán)利要求12所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述信息指示與所述類別相關(guān)聯(lián)的季節(jié)性。
15.一種計(jì)算機(jī)系統(tǒng),包括第一分類器,所述第一分類器為多個類別中的至少子集中的每一個類別確定概率值, 所述概率值表示識別的實(shí)體屬于相應(yīng)類別的可能性并且使用關(guān)于所述實(shí)體的信息來確定; 以及第二分類器,所述第二分類器使用所述概率值和用于所述多個類別的規(guī)則集來為所述實(shí)體識別所述多個類別中的一個類別。
16.根據(jù)權(quán)利要求14所述的計(jì)算機(jī)系統(tǒng),其中所述規(guī)則集基于訓(xùn)練數(shù)據(jù)。
17.根據(jù)權(quán)利要求16所述的計(jì)算機(jī)系統(tǒng),其中所述規(guī)則集包括決策樹,所述決策樹被配置用于通過處理包括在所述決策樹中的多個決策中的至少部分來選擇所述多個類別中的一個,所述計(jì)算機(jī)系統(tǒng)進(jìn)一步包括規(guī)則組件,所述規(guī)則組件使用所述訓(xùn)練數(shù)據(jù)來生成所述決策樹,其中所述訓(xùn)練數(shù)據(jù)包括實(shí)體到所述多個類別中的一個或多個的映射。
18.根據(jù)權(quán)利要求17所述的計(jì)算機(jī)系統(tǒng),其中所述規(guī)則組件使用有關(guān)所述實(shí)體的財(cái)務(wù)數(shù)據(jù)對所述映射賦予權(quán)重,包括基于與所述映射的至少子集相對應(yīng)的所述財(cái)務(wù)數(shù)據(jù)來過采樣所述映射的所述子集。
19.根據(jù)權(quán)利要求14所述的計(jì)算機(jī)系統(tǒng),進(jìn)一步包括前端組件,所述前端組件基于所述第二分類器已為所述實(shí)體識別了所述類別而向用戶呈現(xiàn)信息。
20.一種用于將內(nèi)容提供者與類別相關(guān)聯(lián)的計(jì)算機(jī)實(shí)現(xiàn)的方法,所述方法包括將內(nèi)容提供者識別為加入在程序中,在所述程序中所述內(nèi)容提供者提供待由至少一個發(fā)布者發(fā)布的內(nèi)容;接收有關(guān)所述內(nèi)容提供者的至少一個關(guān)鍵詞和有關(guān)所述關(guān)鍵詞的至少一個財(cái)務(wù)值;接收多個類別,其中所述內(nèi)容提供者待與所述類別中的至少一個相關(guān)聯(lián);基于所述類別的名稱將所述至少一個關(guān)鍵詞映射到所述類別的子集;將所述類別的至少所述子集中的每一個與概率值相關(guān)聯(lián),所述概率值表示所述內(nèi)容提供者應(yīng)當(dāng)與相應(yīng)類別相關(guān)聯(lián)的可能性,所述概率值使用所述財(cái)務(wù)值被賦予權(quán)重;接收所生成的有關(guān)所述多個類別的規(guī)則集,所述規(guī)則集被配置用于在識別所述類別中的一個時使用;使用所述規(guī)則集來處理有關(guān)所述內(nèi)容提供者的數(shù)據(jù),所述數(shù)據(jù)至少包括(i)所述類別的至少所述子集中的每一個的所述概率值;(ii)有關(guān)所述內(nèi)容提供者的財(cái)務(wù)數(shù)據(jù); (iii)所述內(nèi)容提供者與之相關(guān)聯(lián)的地理區(qū)域;基于對所述數(shù)據(jù)的所述處理為所述內(nèi)容提供者選擇所述多個類別中的一個;以及將所述內(nèi)容提供者與所選擇的類別相關(guān)聯(lián)。
全文摘要
除其它所公開的主題外,一種用于將實(shí)體與類別相關(guān)聯(lián)的計(jì)算機(jī)實(shí)現(xiàn)的方法包括為多個類別中的至少子集中的每一個確定概率值,所述概率值表示識別的實(shí)體屬于相應(yīng)類別的可能性并且使用關(guān)于實(shí)體的信息來確定。該方法包括使用概率值和基于訓(xùn)練數(shù)據(jù)的用于多個類別的規(guī)則集來為實(shí)體識別多個類別中的一個。
文檔編號G06F17/40GK102216925SQ200980145280
公開日2011年10月12日 申請日期2009年9月14日 優(yōu)先權(quán)日2008年9月15日
發(fā)明者崔賢影, 武慶, 維維克·拉古納坦, 裴忠順 申請人:谷歌公司