两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

搜索結(jié)果排序方法及系統(tǒng)、搜索結(jié)果排序優(yōu)化方法及系統(tǒng)的制作方法

文檔序號:6487125閱讀:229來源:國知局
搜索結(jié)果排序方法及系統(tǒng)、搜索結(jié)果排序優(yōu)化方法及系統(tǒng)的制作方法
【專利摘要】本申請?zhí)峁┝艘环N搜索結(jié)果排序方法,包括獲取原始特征集合;基于歷史交易數(shù)據(jù)從原始特征集合提取有效特征,有效特征指能夠?qū)λ阉鹘Y(jié)果的排序產(chǎn)生影響的特征;基于歷史交易數(shù)據(jù)確定各有效特征的初始權(quán)重,并利用歷史交易數(shù)據(jù)和預(yù)定訓(xùn)練模型對初始權(quán)重進(jìn)行訓(xùn)練得到最終權(quán)重;基于最終權(quán)重對搜索結(jié)果進(jìn)行排序。本申請還提供了一種實(shí)現(xiàn)前述方法的搜索結(jié)果排序系統(tǒng),以及對前述方法進(jìn)行優(yōu)化的搜索結(jié)果排序優(yōu)化方法及系統(tǒng)。本申請的搜索結(jié)果排序方法及系統(tǒng)、搜索結(jié)果排序優(yōu)化方法及系統(tǒng),能夠保證排序結(jié)果的客觀性和準(zhǔn)確性,避免用戶因?yàn)榕判蚪Y(jié)果不準(zhǔn)確而額外的向服務(wù)器發(fā)送新搜索請求,從而可以減少服務(wù)器的負(fù)擔(dān)以及減少數(shù)據(jù)的傳輸量。
【專利說明】搜索結(jié)果排序方法及系統(tǒng)、搜索結(jié)果排序優(yōu)化方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本申請涉及計(jì)算機(jī)數(shù)據(jù)處理【技術(shù)領(lǐng)域】,特別是涉及一種搜索結(jié)果排序方法及系統(tǒng)、搜索結(jié)果排序優(yōu)化方法及系統(tǒng)。
【背景技術(shù)】
[0002]隨著電子商務(wù)的發(fā)展,越來越多的用戶選擇在電子商務(wù)網(wǎng)站進(jìn)行商品的購買。一般情況下一個電子商務(wù)網(wǎng)站,通常擁有千萬甚至幾億的產(chǎn)品,用戶要在繁多的產(chǎn)品中找到自己需要的,利用關(guān)鍵詞進(jìn)行搜索是常見的一種方法。所謂搜索,即用戶輸入關(guān)鍵詞,網(wǎng)站返回與關(guān)鍵詞相關(guān)的搜索結(jié)果供用戶篩選。
[0003]在很多情況下,一個關(guān)鍵詞可能會有較大數(shù)量的搜索結(jié)果,那么搜索結(jié)果在展示必然需要按照一定的順序排列,如何對這些搜索結(jié)果進(jìn)行排序需要網(wǎng)站進(jìn)行綜合考慮。例如,可以根據(jù)搜索結(jié)果與關(guān)鍵詞的相關(guān)性、搜索結(jié)果在之前的點(diǎn)擊率、成交情況等等。對于電子商務(wù)網(wǎng)站來說,其主要目的是提高商品的銷售量,因此,其在對搜索結(jié)果進(jìn)行排序時除了考慮相關(guān)性,還需要考慮搜索結(jié)果的可成交性,例如成交轉(zhuǎn)化率、好評率等等。
[0004]目前,常見的電子商務(wù)網(wǎng)站對搜索結(jié)果進(jìn)行排序時,相關(guān)性和可成交性預(yù)測主要通過人工對歷史數(shù)據(jù)進(jìn)行分析并根據(jù)經(jīng)驗(yàn)來確定搜索結(jié)果(即具體商品)的特征和權(quán)重,并根據(jù)一定公式計(jì)算得到。其中,商品特征是指能夠影響商品可成交性的因素,例如銷售量、好評率、成交轉(zhuǎn)化率等等。因?yàn)樵诖_定特征和權(quán)重時憑經(jīng)驗(yàn)設(shè)定,較為盲目和主觀,往往會與實(shí)際情況出現(xiàn)誤差。因此,其返回的排序后的搜索結(jié)果可能與用戶期望會出現(xiàn)較大的差異,用戶期望的搜索結(jié)果可能被排在靠后的位置,因?yàn)樗阉鹘Y(jié)果數(shù)量通常較大,為了減少數(shù)據(jù)傳輸量,服務(wù)器通常會分段返回排序后的搜索結(jié)果,先返回部分結(jié)果,若用戶提交請求,則再返回部分結(jié)果。當(dāng)排序后的搜索結(jié)果與用戶期望出現(xiàn)較大差異時,那么用戶則可能不斷的請求查看剩余搜索結(jié)果或者重新通過客戶端向服務(wù)器提交新的搜索請求來獲取其所期望的搜索結(jié)果。那么就會增加服務(wù)器的數(shù)據(jù)傳輸量,那么這無疑會增加服務(wù)器的負(fù)載,占用大量的網(wǎng)絡(luò)資源,甚至可能造成網(wǎng)絡(luò)堵塞。同時也說明服務(wù)器返回的排序后的搜索結(jié)果中有大量的無關(guān)數(shù)據(jù),這部分?jǐn)?shù)據(jù)的傳輸無疑是對服務(wù)器資源和網(wǎng)絡(luò)資源的浪費(fèi)和不必要的占用。

【發(fā)明內(nèi)容】

[0005]本申請?zhí)峁┮环N搜索結(jié)果排序方法及系統(tǒng)、搜索結(jié)果排序優(yōu)化方法及系統(tǒng),能夠解決搜索結(jié)果與用戶預(yù)期不同,用戶通過客戶端反復(fù)的發(fā)送搜索請求而導(dǎo)致的服務(wù)器負(fù)擔(dān)增加以及網(wǎng)絡(luò)堵塞的問題。
[0006]為了解決上述問題,本申請公開了一種搜索結(jié)果排序方法,包括以下步驟:
[0007]獲取原始特征集合,所述原始特征包括預(yù)先設(shè)定的可能對搜索結(jié)果的排序產(chǎn)生影響的特征;
[0008]基于歷史交易數(shù)據(jù)從原始特征集合提取有效特征,所述有效特征指根據(jù)歷史交易數(shù)據(jù)確定的能夠?qū)λ阉鹘Y(jié)果的排序產(chǎn)生影響的特征;
[0009]基于歷史交易數(shù)據(jù)確定各有效特征的初始權(quán)重,并利用歷史交易數(shù)據(jù)和預(yù)定訓(xùn)練模型對初始權(quán)重進(jìn)行訓(xùn)練得到最終權(quán)重;
[0010]基于所述有效特征的最終權(quán)重對搜索結(jié)果進(jìn)行排序。
[0011]進(jìn)一步地,所述基于歷史交易數(shù)據(jù)從原始特征集合提取有效特征包括:
[0012]基于歷史交易數(shù)據(jù)選取兩組測試產(chǎn)品,其中一組為有成交記錄的產(chǎn)品,另外一組為沒有成交記錄的產(chǎn)品;
[0013]從歷史交易數(shù)據(jù)中分別提取所述兩組測試產(chǎn)品在一定時間段內(nèi)的相關(guān)數(shù)據(jù),并利用所述相關(guān)數(shù)據(jù)計(jì)算兩組測試產(chǎn)品各原始特征的特征值;
[0014]比較所述兩組測試產(chǎn)品相同原始特征的特征值的差值,若超過閾值,則選取所述原始特征為有效特征。
[0015]進(jìn)一步地,所述基于歷史交易數(shù)據(jù)從原始特征集合提取有效特征包括:
[0016]從歷史交易數(shù)據(jù)中提取預(yù)定時間段內(nèi)的交易數(shù)據(jù),計(jì)算該預(yù)定時間段內(nèi)各產(chǎn)品的成交轉(zhuǎn)化率;
[0017]選取成交轉(zhuǎn)化率差值大于閾值的兩組產(chǎn)品作為測試產(chǎn)品;
[0018]從歷史交易數(shù)據(jù)中提取所述兩組測試產(chǎn)品在所述預(yù)定時間段之后的一定時間段內(nèi)的交易數(shù)據(jù),并計(jì)算兩組測試產(chǎn)品的原始特征集合中各原始特征的特征值;
[0019]比較所述兩組測試產(chǎn)品相同原始特征的特征值的差值,若超過閾值,則選取所述原始特征為有效特征。
[0020]進(jìn)一步地,所述基于歷史交易數(shù)據(jù)確定各有效特征的初始權(quán)重,并利用歷史交易數(shù)據(jù)和訓(xùn)練模型對初始權(quán)重進(jìn)行訓(xùn)練得到最終權(quán)重包括:
[0021]確定有效特征的初始權(quán)重;
[0022]將歷史交易數(shù)據(jù)和初始權(quán)重代入預(yù)定訓(xùn)練模型中,計(jì)算理論數(shù)據(jù);
[0023]比較理論數(shù)據(jù)與實(shí)際數(shù)據(jù),若二者差異在預(yù)定范圍內(nèi),則確定該初始權(quán)重為有效特征的最終權(quán)重,反之,則返回確定有效特征的初始權(quán)重這一步驟。
[0024]進(jìn)一步地,所述基于所述有效特征的最終權(quán)重對搜索結(jié)果進(jìn)行排序包括:
[0025]確定搜索結(jié)果的實(shí)際有效特征值;
[0026]基于有效特征的最終權(quán)重和實(shí)際有效特征值計(jì)算搜索結(jié)果的預(yù)測成交轉(zhuǎn)化率;
[0027]按照預(yù)測成交轉(zhuǎn)化率對搜索結(jié)果進(jìn)行排序。
[0028]本申請還公開了一種搜索結(jié)果排序優(yōu)化方法,包括以下步驟:
[0029]分別獲取搜索結(jié)果的有效特征的各組備選權(quán)重值;
[0030]分別采用各備選權(quán)重值計(jì)算某一預(yù)定時間點(diǎn)的搜索結(jié)果的理論排序分?jǐn)?shù),并根據(jù)理論排序分?jǐn)?shù)對搜索結(jié)果進(jìn)行排序得到各組排序結(jié)果;
[0031]分別獲取各組排序結(jié)果排在前面預(yù)定數(shù)量的搜索結(jié)果,并獲取所述搜索結(jié)果在所述預(yù)定時間點(diǎn)以后的交易數(shù)據(jù);
[0032]根據(jù)所述交易數(shù)據(jù)計(jì)算各組排序結(jié)果中排在前面預(yù)定數(shù)量的搜索結(jié)果的實(shí)際排序分?jǐn)?shù);
[0033]選取實(shí)際排序分?jǐn)?shù)最高的一組排序結(jié)果所對應(yīng)的備選權(quán)重值作為有效特征的最終權(quán)重值。[0034]進(jìn)一步地,所述理論排序分?jǐn)?shù)為單一特征預(yù)測值或者特征組合的預(yù)測值,所述實(shí)際排序分?jǐn)?shù)為與所述理論排序分?jǐn)?shù)對應(yīng)的單一特征實(shí)際值或者特征組合的實(shí)際值。
[0035]進(jìn)一步地,所述理論排序分?jǐn)?shù)為預(yù)測成交轉(zhuǎn)化率,所述實(shí)際排序分?jǐn)?shù)為實(shí)際成交轉(zhuǎn)化率;或者
[0036]所述理論排序分?jǐn)?shù)為預(yù)測好評率,所述實(shí)際排序分?jǐn)?shù)為實(shí)際好評率。
[0037]進(jìn)一步地,所述選取實(shí)際排序分?jǐn)?shù)最高的一組排序結(jié)果所對應(yīng)的備選權(quán)重值作為有效特征的最終權(quán)重值包括:
[0038]選取實(shí)際排序分?jǐn)?shù)總和或平均值最高的一組排序結(jié)果所對應(yīng)的備選權(quán)重值作為有效特征的最終權(quán)重值。
[0039]本申請還公開了一種搜索結(jié)果排序優(yōu)化方法,包括以下步驟:
[0040]獲取某一預(yù)定時間點(diǎn)根據(jù)搜索結(jié)果的理論排序分?jǐn)?shù)進(jìn)行排序的排序結(jié)果,所述理論排序分?jǐn)?shù)根據(jù)有效特征的最終權(quán)重和各搜索結(jié)果的實(shí)際有效特征值得到;
[0041]獲取所述排序結(jié)果中排列在前面預(yù)定數(shù)量的搜索結(jié)果在所述預(yù)定時間點(diǎn)后的交易數(shù)據(jù),并根據(jù)所述交易數(shù)據(jù)計(jì)算所述搜索結(jié)果的實(shí)際排序分?jǐn)?shù);
[0042]比較所述實(shí)際排序分?jǐn)?shù)和理論排序分?jǐn)?shù),若兩者差值大于閾值,則優(yōu)化所述有效特征的最終權(quán)重。
[0043]進(jìn)一步地,所述理論排序分?jǐn)?shù)為預(yù)測成交轉(zhuǎn)化率,所述實(shí)際排序分?jǐn)?shù)為實(shí)際成交轉(zhuǎn)化率;或者
[0044]所述理論排序分?jǐn)?shù)為預(yù)測好評率,所述實(shí)際排序分?jǐn)?shù)為實(shí)際好評率。
[0045]本申請還公開了一種搜索結(jié)果排序系統(tǒng),包括:
[0046]原始特征集合獲取模塊,用于獲取原始特征集合,所述原始特征包括預(yù)先設(shè)定的可能對搜索結(jié)果的排序產(chǎn)生影響的特征;
[0047]有效特征提取模塊,用于基于歷史交易數(shù)據(jù)從原始特征集合提取有效特征,所述有效特征指根據(jù)歷史交易數(shù)據(jù)確定的能夠?qū)λ阉鹘Y(jié)果的排序產(chǎn)生影響的特征;
[0048]有效特征權(quán)重確定模塊,用于基于歷史交易數(shù)據(jù)確定各有效特征的初始權(quán)重,并利用歷史交易數(shù)據(jù)和預(yù)定訓(xùn)練模型對初始權(quán)重進(jìn)行訓(xùn)練得到最終權(quán)重;
[0049]排序模塊,用于基于所述有效特征的最終權(quán)重對搜索結(jié)果進(jìn)行排序。
[0050]進(jìn)一步地,所述有效特征提取模塊包括:
[0051]測試產(chǎn)品選取子模塊,用于基于歷史交易數(shù)據(jù)選取兩組測試產(chǎn)品,其中一組為有成交記錄的產(chǎn)品,另外一組為沒有成交記錄的產(chǎn)品;
[0052]特征值計(jì)算子模塊,用于從歷史交易數(shù)據(jù)中分別提取所述兩組測試產(chǎn)品在一定時間段內(nèi)的相關(guān)數(shù)據(jù),并利用所述相關(guān)數(shù)據(jù)計(jì)算兩組測試產(chǎn)品各原始特征的特征值;
[0053]比較子模塊,用于比較所述兩組測試產(chǎn)品相同原始特征的特征值的差值,若超過閾值,則選取所述原始特征為有效特征。
[0054]本申請還公開了一種搜索結(jié)果排序優(yōu)化系統(tǒng),包括:
[0055]備選權(quán)重值獲取模塊,用于分別獲取搜索結(jié)果的有效特征的各組備選權(quán)重值;
[0056]理論排序分?jǐn)?shù)計(jì)算模塊,用于分別采用各備選權(quán)重值計(jì)算某一預(yù)定時間點(diǎn)的搜索結(jié)果的理論排序分?jǐn)?shù),并根據(jù)理論排序分?jǐn)?shù)對搜索結(jié)果進(jìn)行排序得到各組排序結(jié)果;
[0057]交易數(shù)據(jù)獲取模塊,用于分別獲取各組排序結(jié)果排在前面預(yù)定數(shù)量的搜索結(jié)果,并獲取所述搜索結(jié)果在所述預(yù)定時間點(diǎn)以后的交易數(shù)據(jù);
[0058]實(shí)際排序分?jǐn)?shù)計(jì)算模塊,用于根據(jù)所述交易數(shù)據(jù)計(jì)算各組排序結(jié)果中排在前面預(yù)定數(shù)量的搜索結(jié)果的實(shí)際排序分?jǐn)?shù);
[0059]最終權(quán)重確定模塊,用于選取實(shí)際排序分?jǐn)?shù)最高的一組排序結(jié)果所對應(yīng)的備選權(quán)重值作為有效特征的最終權(quán)重值。
[0060]本申請還公開了一種搜索結(jié)果排序優(yōu)化系統(tǒng),包括:
[0061]理論排序分?jǐn)?shù)計(jì)算模塊,用于獲取某一預(yù)定時間點(diǎn)根據(jù)搜索結(jié)果的理論排序分?jǐn)?shù)進(jìn)行排序的排序結(jié)果,所述理論排序分?jǐn)?shù)根據(jù)有效特征的最終權(quán)重和各搜索結(jié)果的實(shí)際有效特征值得到;
[0062]實(shí)際排序分?jǐn)?shù)計(jì)算模塊,用于獲取所述排序結(jié)果中排列在前面預(yù)定數(shù)量的搜索結(jié)果在所述預(yù)定時間點(diǎn)后的交易數(shù)據(jù),并根據(jù)所述交易數(shù)據(jù)計(jì)算所述搜索結(jié)果的實(shí)際排序分?jǐn)?shù);
[0063]優(yōu)化模塊,用于比較所述實(shí)際排序分?jǐn)?shù)和理論排序分?jǐn)?shù),若兩者差值大于閾值,則優(yōu)化所述有效特征的最終權(quán)重。
[0064]與現(xiàn)有技術(shù)相比,本申請包括以下優(yōu)點(diǎn):
[0065]本申請的搜索結(jié)果排序方法及系統(tǒng)通過歷史交易數(shù)據(jù)來選取影響排序結(jié)果的有效特征,并結(jié)合歷史交易數(shù)據(jù)來確定有效特征的最終權(quán)重,最終利用這些權(quán)重對搜索結(jié)果進(jìn)行排序。在這個過程中,除了會依照歷史交易數(shù)據(jù)確定出各有效特征和初始權(quán)重,還會利用歷史交易數(shù)據(jù)對初始權(quán)重進(jìn)行訓(xùn)練,從而得到一個優(yōu)化后的最終權(quán)重,保證了最終權(quán)重的客觀性和準(zhǔn)確度,從而提高了排序結(jié)果的客觀性和準(zhǔn)確性,避免了用戶因?yàn)榕判虿粶?zhǔn)確,無法得到預(yù)期的搜索結(jié)果而不斷的請求獲取剩余數(shù)據(jù)或者通過客戶端重新向服務(wù)器發(fā)送新的搜索請求,從而減少了服務(wù)器的負(fù)擔(dān)和對網(wǎng)絡(luò)資源的占用,同時減少了數(shù)據(jù)的傳輸量。
[0066]另外,在選取有效特征的過程中,首先依照歷史交易數(shù)據(jù)選取出成交率高和低的兩組對比度較高的測試產(chǎn)品來作為測試依據(jù)。并依照歷史交易數(shù)據(jù)對兩組測試產(chǎn)品的特征值分別進(jìn)行計(jì)算后,比較兩組產(chǎn)品在相同原始特征的特征值上的差異的方式來確定特征對于產(chǎn)品成交率的影響,從而準(zhǔn)確的選取出有效特征,提高了排序的準(zhǔn)確性。
[0067]本申請的搜索結(jié)果排序優(yōu)化方法及系統(tǒng)中,通過利用某一時間點(diǎn)以及該時間點(diǎn)以后的交易數(shù)據(jù)來確定最優(yōu)的權(quán)重值或者對已經(jīng)確定的權(quán)重值進(jìn)行優(yōu)化方式,也即借助于真實(shí)的歷史交易數(shù)據(jù)來確定相對優(yōu)化的搜索結(jié)果的排序方式或者對現(xiàn)有的搜索結(jié)果的排序方式進(jìn)行優(yōu)化,可以使排序結(jié)果更為客觀準(zhǔn)確,同樣也可以避免用戶因?yàn)榕判虿粶?zhǔn)確,無法得到預(yù)期的搜索結(jié)果而不斷的請求獲取剩余數(shù)據(jù)或者通過客戶端重新向服務(wù)器發(fā)送新的搜索請求,從而減少了服務(wù)器的負(fù)擔(dān)和對網(wǎng)絡(luò)資源的占用,同時減少了數(shù)據(jù)的傳輸量。
[0068]當(dāng)然,實(shí)施本申請的任一產(chǎn)品不一定需要同時達(dá)到以上所述的所有優(yōu)點(diǎn)。
【專利附圖】

【附圖說明】
[0069]圖1是本申請的搜索結(jié)果排序方法實(shí)施例一的流程圖;
[0070]圖2是本申請的搜索結(jié)果排序優(yōu)化方法實(shí)施例一的流程圖;
[0071]圖3是本申請的搜索結(jié)果排序優(yōu)化實(shí)例的兩組排序結(jié)果示意圖;
[0072]圖4是本申請的搜索結(jié)果排序優(yōu)化方法實(shí)施例二的流程圖;[0073]圖5是本申請的搜索結(jié)果排序系統(tǒng)實(shí)施例一的結(jié)構(gòu)示意圖;
[0074]圖6是本申請的搜索結(jié)果排序優(yōu)化系統(tǒng)實(shí)施例一的結(jié)構(gòu)示意圖;
[0075]圖7是本申請的搜索結(jié)果排序優(yōu)化系統(tǒng)實(shí)施例二的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0076]為使本申請的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和【具體實(shí)施方式】對本申請作進(jìn)一步詳細(xì)的說明。
[0077]參照圖1,示出本申請的一種搜索結(jié)果排序方法實(shí)施例一,包括以下步驟:
[0078]步驟101,獲取原始特征集合,所述原始特征包括預(yù)先設(shè)定的可能對搜索結(jié)果的排序產(chǎn)生影響的特征。
[0079]原始特征集合可以根據(jù)歷史交易數(shù)據(jù)或者經(jīng)驗(yàn)確定。一般情況下,原始特征集合所包含的特征有交易量、成交轉(zhuǎn)化率、好評率、發(fā)貨速度、圖片文字質(zhì)量、交易金額等等。
[0080]其中,搜索結(jié)果的原始特征集合可以預(yù)先設(shè)定好,當(dāng)需要時可以直接從服務(wù)器或者其他數(shù)據(jù)庫中獲取,也可以通過實(shí)時從服務(wù)器或數(shù)據(jù)庫中獲取歷史交易數(shù)據(jù),并通過實(shí)時分析的方法提取。
[0081]步驟102,基于歷史交易數(shù)據(jù)從原始特征集合提取有效特征,所述有效特征指根據(jù)歷史交易數(shù)據(jù)確定的能夠?qū)λ阉鹘Y(jié)果的排序產(chǎn)生影響的特征。
[0082]歷史交易數(shù)據(jù)可以直接從服務(wù)器中讀取,基于歷史交易數(shù)據(jù)從原始特征集合提取有效特征具體包括以下步驟:
[0083]基于歷史交易數(shù)據(jù)選取兩組測試產(chǎn)品,其中一組為有成交記錄的產(chǎn)品,另外一組為沒有成交記錄的產(chǎn)品。
[0084]從歷史交易數(shù)據(jù)中分別提取所述兩組測試產(chǎn)品在一定時間段內(nèi)的相關(guān)數(shù)據(jù),并利用所述相關(guān)數(shù)據(jù)計(jì)算兩組測試產(chǎn)品各原始特征的特征值;
[0085]比較所述兩組測試產(chǎn)品相同原始特征的特征值的差值,若超過閾值,則選取所述原始特征為有效特征。
[0086]相關(guān)數(shù)據(jù)用于計(jì)算原始特征集合中各特征的具體數(shù)值。特征不同,其所需要的相關(guān)數(shù)據(jù)也并不相同,具體的相關(guān)數(shù)據(jù)可以根據(jù)具體需要來確定。例如,對于交易量這一特征來說,其所需要的數(shù)據(jù)為預(yù)定時間段內(nèi)成交的筆數(shù),那么相關(guān)數(shù)據(jù)即為成交筆數(shù)。又如,對于好評率來說,其所需要的原始數(shù)據(jù)為預(yù)定時間段內(nèi)的評價總數(shù)和好評數(shù),那么相關(guān)數(shù)據(jù)即為評價總數(shù)和好評數(shù)。
[0087]其中,原始特征集合中各原始特征的特征值的計(jì)算公式可以根據(jù)實(shí)際情況來確定,優(yōu)選考慮如何有效的表示出該特征。例如,對于交易量這一特征來說,若直接用交易量的數(shù)值來表示其特征值,那么其理論數(shù)值可以是O到任意一個自然數(shù)。但是在具體取值時,單單比較數(shù)值的差異往往無法說明問題。例如,對于交易量分別為O和I這兩種情況,此時二者交易量的特征值相差1,但是對應(yīng)的卻是是否有交易這兩種差異較大的情況。而,對于交易量分別為100和101這兩種情況,這個差別只能說明交易數(shù)量相差I(lǐng)。為此,可以針對該特征重新設(shè)定計(jì)算公式,即不單純以交易量數(shù)值作為特征值,而是將交易量作為參數(shù),計(jì)算出一個最終的特征值。例如,假設(shè)交易量為n,可以采用1-1/ (1+n),對應(yīng)的,O筆交易的特征值為0,I筆的特征值為0.5,而100筆為0.9901,而101筆為0.9902。此種方式,可以更有效的表示出交易量的變化差異。同理,對于其他特征也可以采用類似的處理方式,只要能夠有效的表示出特征即可,本申請對比并不限制。
[0088]可以理解,前述步驟中選取兩組測試產(chǎn)品時的標(biāo)準(zhǔn)為是否有成交記錄,為了增加兩組測試產(chǎn)品的對比性以及增加選取產(chǎn)品的范圍,提高結(jié)果的準(zhǔn)確性,優(yōu)選地,選取的兩組測試產(chǎn)品中,一組為成交記錄高于第一閾值的產(chǎn)品,另外一組為沒有成交記錄或者低于第二閾值的產(chǎn)品。其中,第一閾值和第二閾值可以根據(jù)實(shí)際情況來設(shè)定,可以將第一閾值設(shè)置得盡可能高,第二閾值設(shè)置得盡可能低,從而保證兩組測試產(chǎn)品具有更大的差異性,從而便于后續(xù)準(zhǔn)確的提取有效特征。
[0089]可以理解,測試產(chǎn)品的選取除了依照成交記錄這一歷史交易數(shù)據(jù),還可以依照某些特征來進(jìn)行。優(yōu)選地,因?yàn)楸旧暾埖闹饕康氖菍﹄娮由虅?wù)網(wǎng)站中的搜索結(jié)果進(jìn)行排序,并盡可能將符合用戶期望的搜索結(jié)果排在前面,從而增加產(chǎn)品被購買的幾率,避免用戶反復(fù)的通過客戶端向服務(wù)器發(fā)送搜索請求來獲取其所期望的搜索結(jié)果。也即,本申請?jiān)谂判驎r除了相關(guān)性之外,會優(yōu)先考慮產(chǎn)品的成交轉(zhuǎn)化率,即某個產(chǎn)品在搜索結(jié)果中出現(xiàn)后被購買的概率,這一特征為對排序結(jié)果有較大權(quán)重的特征。一般來說,若一個產(chǎn)品在搜索結(jié)果中出現(xiàn)后,被購買的概率越大,那么對于有相同搜索請求的用戶來說,其購買該產(chǎn)品的概率也會增加。因此,在選取測試產(chǎn)品時,還可以依照成交轉(zhuǎn)化率來進(jìn)行,具體采用如下方式:
[0090]從歷史交易數(shù)據(jù)中提取預(yù)定時間段內(nèi)的交易數(shù)據(jù),計(jì)算該預(yù)定時間段內(nèi)各產(chǎn)品的成交轉(zhuǎn)化率;
[0091]選取成交轉(zhuǎn)化率差值大于閾值的兩組產(chǎn)品作為測試產(chǎn)品;
[0092]從歷史交易數(shù)據(jù)中提取所述兩組測試產(chǎn)品在所述預(yù)定時間段之后的一定時間段內(nèi)的交易數(shù)據(jù),并計(jì)算兩組測試產(chǎn)品的原始特征集合中各原始特征的特征值;
[0093]比較所述兩組測試產(chǎn)品相同原始特征的特征值的差值,若超過閾值,則選取所述原始特征為有效特征。
[0094]預(yù)定時間段的長度可以根據(jù)實(shí)際需要設(shè)定,為了節(jié)省計(jì)算時間、減少計(jì)算量,可以設(shè)置較短的長度;為了提供結(jié)果的準(zhǔn)確性或者系統(tǒng)計(jì)算能力足夠強(qiáng)大,則可以設(shè)置較長的長度,例如,可以是一天、三天、十天、三十天或者其他長度,本申請對此并不限制。預(yù)定時間段內(nèi)之后的一定時間段的長度也可以根據(jù)實(shí)際需要來設(shè)定。優(yōu)選地,為了保證計(jì)算結(jié)果的匹配性,可以設(shè)定為與預(yù)定時間段具有相同的長度。
[0095]此過程中,首先根據(jù)預(yù)定時間段內(nèi)的成交轉(zhuǎn)化率,將成交轉(zhuǎn)化率差值較大的兩組產(chǎn)品選取為測試產(chǎn)品。在具體實(shí)現(xiàn)時,可以設(shè)定第一轉(zhuǎn)化值和第二轉(zhuǎn)化值,二者的差值為閾值,若一組產(chǎn)品的成交轉(zhuǎn)化率高于第一轉(zhuǎn)化值,一組產(chǎn)品的成交轉(zhuǎn)化率低于第二轉(zhuǎn)化值,那么就可以選取該兩組產(chǎn)品作為測試產(chǎn)品。然后利用預(yù)定時間段內(nèi)之后的一定時間段內(nèi),該兩組測試產(chǎn)品的交易數(shù)據(jù)來計(jì)算兩組測試產(chǎn)品的原始特征集合中各原始特征的特征值。若兩組測試產(chǎn)品的同一原始特征的特征值差值較大,例如超過設(shè)定的閾值,那么就可以將該原始特征作為有效特征。因?yàn)檫x取的是成交轉(zhuǎn)化率差異明顯的兩組測試產(chǎn)品,若某個原始特征特征值的差值越大,則說明該原始特征對于產(chǎn)品是否成交的影響越大。通過此種方式對原始特征進(jìn)行篩選,提取出相關(guān)的有效特征,從而使排序結(jié)果更為準(zhǔn)確。
[0096]采用前述幾種方法進(jìn)行有效特征選取時主要依賴于成交對比度較高的兩組測試產(chǎn)品(例如,一組為有成交記錄的產(chǎn)品,另一組為沒有成交記錄的產(chǎn)品;或者一組為成交轉(zhuǎn)化率高的產(chǎn)品,另一組為成交轉(zhuǎn)化率低的產(chǎn)品),如果某一特征對于產(chǎn)品的成交有較大影響,那么通過交易數(shù)據(jù)所計(jì)算的特征值的差異也會較大。如果某一特征對于產(chǎn)品的成交影響很小或者幾乎沒有影響,那么成交對比度較高的兩組產(chǎn)品的該特征值的差異也會很小或者幾乎沒有。因此,通過此種方法可以更好的篩選出有效特征,從而提高后續(xù)搜索結(jié)果排序的準(zhǔn)確性。
[0097]可以理解,對于測試產(chǎn)品的選取還可以參照其他特征,例如,若排序結(jié)果更偏重于好評度,則可以選取好評度差異較大的兩組產(chǎn)品作為測試產(chǎn)品,然后采用前述相類似的方式,計(jì)算兩組測試產(chǎn)品的原始特征的特征值,選取特征值差異較大的原始特征作為有效特征。同樣,排序結(jié)果更偏重于交易量,則可以選取交易量差異較大的兩組產(chǎn)品作為測試產(chǎn)品。具體選取可以采用前述方法類似的過程進(jìn)行,在此不再贅述。
[0098]步驟103,基于歷史交易數(shù)據(jù)確定各有效特征的初始權(quán)重,并利用歷史交易數(shù)據(jù)和預(yù)定訓(xùn)練模型對初始權(quán)重進(jìn)行訓(xùn)練得到最終權(quán)重。
[0099]各有效特征的初始權(quán)重和最終權(quán)重都可以通過模型訓(xùn)練的方式來確定,可以理解,初始權(quán)重也可以根據(jù)經(jīng)驗(yàn)設(shè)定。以多維線性模型為例,首先可以通過多維線性擬合的方式,確定各有效特征的初始權(quán)重,然后將這些初始權(quán)重代入計(jì)算公式中與歷史交易數(shù)據(jù)結(jié)合計(jì)算出理論數(shù)據(jù),將理論數(shù)據(jù)與實(shí)際數(shù)據(jù)比較,差異越小,則說明初始權(quán)重確定得越準(zhǔn)確。若差異在預(yù)定范圍內(nèi),則選用該初始權(quán)重作為有效特征的最終權(quán)重,反之,則重新確定初始權(quán)重并采用前述方法計(jì)算直到差異縮小到預(yù)定范圍內(nèi)。
[0100]以產(chǎn)品的成交情況為例,首選,根據(jù)初始權(quán)重和歷史交易數(shù)據(jù)計(jì)算出產(chǎn)品的理論成交情況,最后,將計(jì)算出的理論成交情況與實(shí)際成交情況比較,差異越小,則說明初始權(quán)重確定得越準(zhǔn)確,則可以將初始權(quán)重作為有效特征的最終權(quán)重,反之,則需要重新確定權(quán)重,直到確定的權(quán)重值使理論成交情況與實(shí)際成交情況的差異達(dá)到最小值或者在預(yù)定范圍內(nèi)。具體訓(xùn)練時,成交情況可以用成交轉(zhuǎn)化率或者是否成交來表示??梢岳斫?,因?yàn)槟P陀?xùn)練可以通過較多的機(jī)器學(xué)習(xí)的方法來進(jìn)行,本申請對此并不詳述。
[0101]步驟104,基于所述有效特征的最終權(quán)重對搜索結(jié)果進(jìn)行排序。
[0102]優(yōu)選地,基于有效特征的最終權(quán)重對搜索結(jié)果進(jìn)行排序包括:
[0103]確定搜索結(jié)果的實(shí)際有效特征值;
[0104]基于有效特征的最終權(quán)重和實(shí)際有效特征值計(jì)算搜索結(jié)果的預(yù)測成交轉(zhuǎn)化率;
[0105]按照預(yù)測成交轉(zhuǎn)化率對搜索結(jié)果進(jìn)行排序。
[0106]可以理解,此處的排序參考的主要因素為搜索結(jié)果的預(yù)測成交轉(zhuǎn)化率。在實(shí)際應(yīng)用中,還可以根據(jù)其他因素來排序,例如,搜索結(jié)果的好評率等等,排序參考的主要因素可以根據(jù)不同的排序目的來確定,當(dāng)排序目的不同時,其參考的主要因素也可以不同,排序結(jié)果也可以相應(yīng)的變化。但是,排序時無論參考的主要因素如何變化,都可以參照前述方法來計(jì)算各搜索結(jié)果的排序分?jǐn)?shù),并進(jìn)行排序。
[0107]下面結(jié)合具體實(shí)例對前述方法進(jìn)行詳細(xì)的說明。假設(shè),提取的原始特征集合中包含的特征為交易量、成交轉(zhuǎn)化率、好評率、發(fā)貨速度以及圖片文字質(zhì)量五個。
[0108]提取有效特征的過程為:
[0109]根據(jù)如下表1,假設(shè)預(yù)定時間段為30天,可以確定需要獲取的歷史交易數(shù)據(jù)包括成交筆數(shù)、曝光數(shù)、好評數(shù)、總評價數(shù)、發(fā)貨天數(shù)、圖片數(shù)以及文字?jǐn)?shù)。在獲取了這些歷史交易數(shù)據(jù)之后,便可以依照計(jì)算方法進(jìn)行計(jì)算,確定各原始特征的特征值。
[0110]表1特征值計(jì)算方法和原始數(shù)據(jù)
[0111]
【權(quán)利要求】
1.一種搜索結(jié)果排序方法,其特征在于,包括以下步驟: 獲取原始特征集合,所述原始特征包括預(yù)先設(shè)定的可能對搜索結(jié)果的排序產(chǎn)生影響的特征; 基于歷史交易數(shù)據(jù)從原始特征集合提取有效特征,所述有效特征指根據(jù)歷史交易數(shù)據(jù)確定的能夠?qū)λ阉鹘Y(jié)果的排序產(chǎn)生影響的特征; 基于歷史交易數(shù)據(jù)確定各有效特征的初始權(quán)重,并利用歷史交易數(shù)據(jù)和預(yù)定訓(xùn)練模型對初始權(quán)重進(jìn)行訓(xùn)練得到最終權(quán)重; 基于所述有效特征的最終權(quán)重對搜索結(jié)果進(jìn)行排序。
2.如權(quán)利要求1所述的搜索結(jié)果排序方法,其特征在于,所述基于歷史交易數(shù)據(jù)從原始特征集合提取有效特征包括: 基于歷史交易數(shù)據(jù)選取兩組測試產(chǎn)品,其中一組為有成交記錄的產(chǎn)品,另外一組為沒有成交記錄的產(chǎn)品; 從歷史交易數(shù)據(jù)中分別提取所述兩組測試產(chǎn)品在一定時間段內(nèi)的相關(guān)數(shù)據(jù),并利用所述相關(guān)數(shù)據(jù)計(jì)算兩組測試產(chǎn)品各原始特征的特征值; 比較所述兩組測試產(chǎn)品相同原始特征的特征值的差值,若超過閾值,則選取所述原始特征為有效特征。
3.如權(quán)利要求1所述的搜索結(jié)果排序方法,其特征在于,所述基于歷史交易數(shù)據(jù)從原始特征集合提取有效特征包括: 從歷史交易數(shù)據(jù)中提取預(yù)定時 間段內(nèi)的交易數(shù)據(jù),計(jì)算該預(yù)定時間段內(nèi)各產(chǎn)品的成交轉(zhuǎn)化率; 選取成交轉(zhuǎn)化率差值大于閾值的兩組產(chǎn)品作為測試產(chǎn)品; 從歷史交易數(shù)據(jù)中提取所述兩組測試產(chǎn)品在所述預(yù)定時間段之后的一定時間段內(nèi)的交易數(shù)據(jù),并計(jì)算兩組測試產(chǎn)品的原始特征集合中各原始特征的特征值; 比較所述兩組測試產(chǎn)品相同原始特征的特征值的差值,若超過閾值,則選取所述原始特征為有效特征。
4.如權(quán)利要求1所述的搜索結(jié)果排序方法,其特征在于,所述基于歷史交易數(shù)據(jù)確定各有效特征的初始權(quán)重,并利用歷史交易數(shù)據(jù)和訓(xùn)練模型對初始權(quán)重進(jìn)行訓(xùn)練得到最終權(quán)重包括: 確定有效特征的初始權(quán)重; 將歷史交易數(shù)據(jù)和初始權(quán)重代入預(yù)定訓(xùn)練模型中,計(jì)算理論數(shù)據(jù); 比較理論數(shù)據(jù)與實(shí)際數(shù)據(jù),若二者差異在預(yù)定范圍內(nèi),則確定該初始權(quán)重為有效特征的最終權(quán)重,反之,則返回確定有效特征的初始權(quán)重這一步驟。
5.如權(quán)利要求1所述的搜索結(jié)果排序方法,其特征在于,所述基于所述有效特征的最終權(quán)重對搜索結(jié)果進(jìn)行排序包括: 確定搜索結(jié)果的實(shí)際有效特征值; 基于有效特征的最終權(quán)重和實(shí)際有效特征值計(jì)算搜索結(jié)果的預(yù)測成交轉(zhuǎn)化率; 按照預(yù)測成交轉(zhuǎn)化率對搜索結(jié)果進(jìn)行排序。
6.一種搜索結(jié)果排序優(yōu)化方法,其特征在于,包括以下步驟: 分別獲取搜索結(jié)果的有效特征的各組備選權(quán)重值;分別采用各備選權(quán)重值計(jì)算某一預(yù)定時間點(diǎn)的搜索結(jié)果的理論排序分?jǐn)?shù),并根據(jù)理論排序分?jǐn)?shù)對搜索結(jié)果進(jìn)行排序得到各組排序結(jié)果; 分別獲取各組排序結(jié)果排在前面預(yù)定數(shù)量的搜索結(jié)果,并獲取所述搜索結(jié)果在所述預(yù)定時間點(diǎn)以后的交易數(shù)據(jù); 根據(jù)所述交易數(shù)據(jù)計(jì)算各組排序結(jié)果中排在前面預(yù)定數(shù)量的搜索結(jié)果的實(shí)際排序分?jǐn)?shù); 選取實(shí)際排序分?jǐn)?shù)最高的一組排序結(jié)果所對應(yīng)的備選權(quán)重值作為有效特征的最終權(quán)重值。
7.如權(quán)利要求6所述的搜索結(jié)果排序優(yōu)化方法,其特征在于,所述理論排序分?jǐn)?shù)為單一特征預(yù)測值或者特征組合的預(yù)測值,所述實(shí)際排序分?jǐn)?shù)為與所述理論排序分?jǐn)?shù)對應(yīng)的單一特征實(shí)際值或者特征組合的實(shí)際值。
8.如權(quán)利要求7所述的搜索結(jié)果排序優(yōu)化方法,其特征在于,所述理論排序分?jǐn)?shù)為預(yù)測成交轉(zhuǎn)化率,所述實(shí)際排序分?jǐn)?shù)為實(shí)際成交轉(zhuǎn)化率;或者 所述理論排序分?jǐn)?shù)為預(yù)測好評率,所述實(shí)際排序分?jǐn)?shù)為實(shí)際好評率。
9.如權(quán)利要求6至8任一項(xiàng)所述的搜索結(jié)果排序優(yōu)化方法,其特征在于,所述選取實(shí)際排序分?jǐn)?shù)最高的一組排序結(jié)果所對應(yīng)的備選權(quán)重值作為有效特征的最終權(quán)重值包括: 選取實(shí)際排序分?jǐn)?shù)總和或平均值最高的一組排序結(jié)果所對應(yīng)的備選權(quán)重值作為有效特征的最終權(quán)重值。
10.一種搜索結(jié)果排序優(yōu)化方法,其特征在于,包括以下步驟: 獲取某一預(yù)定時間點(diǎn)根據(jù)搜索結(jié)果的理論排序分?jǐn)?shù)進(jìn)行排序的排序結(jié)果,所述理論排序分?jǐn)?shù)根據(jù)有效特征的最終權(quán)重和各搜索結(jié)果的實(shí)際有效特征值得到; 獲取所述排序結(jié)果中排列在前面預(yù)定數(shù)量的搜索結(jié)果在所述預(yù)定時間點(diǎn)后的交易數(shù)據(jù),并根據(jù)所述交易數(shù)據(jù)計(jì)算所述搜索結(jié)果的實(shí)際排序分?jǐn)?shù); 比較所述實(shí)際排序分?jǐn)?shù)和理論排序分?jǐn)?shù),若兩者差值大于閾值,則優(yōu)化所述有效特征的最終權(quán)重。
11.如權(quán)利要求10所述的搜索結(jié)果排序優(yōu)化方法,其特征在于,所述理論排序分?jǐn)?shù)為預(yù)測成交轉(zhuǎn)化率,所述實(shí)際排序分?jǐn)?shù)為實(shí)際成交轉(zhuǎn)化率;或者 所述理論排序分?jǐn)?shù)為預(yù)測好評率,所述實(shí)際排序分?jǐn)?shù)為實(shí)際好評率。
12.一種搜索結(jié)果排序系統(tǒng),其特征在于,包括: 原始特征集合獲取模塊,用于獲取原始特征集合,所述原始特征包括預(yù)先設(shè)定的可能對搜索結(jié)果的排序產(chǎn)生影響的特征; 有效特征提取模塊,用于基于歷史交易數(shù)據(jù)從原始特征集合提取有效特征,所述有效特征指根據(jù)歷史交易數(shù)據(jù)確定的能夠?qū)λ阉鹘Y(jié)果的排序產(chǎn)生影響的特征; 有效特征權(quán)重確定模塊,用于基于歷史交易數(shù)據(jù)確定各有效特征的初始權(quán)重,并利用歷史交易數(shù)據(jù)和預(yù)定訓(xùn)練模型對初始權(quán)重進(jìn)行訓(xùn)練得到最終權(quán)重; 排序模塊,用于基于所述有效特征的最終權(quán)重對搜索結(jié)果進(jìn)行排序。
13.如權(quán)利要求12所述的搜索結(jié)果排序系統(tǒng),其特征在于,所述有效特征提取模塊包括: 測試產(chǎn)品選取子模塊,用于基于歷史交易數(shù)據(jù)選取兩組測試產(chǎn)品,其中一組為有成交記錄的產(chǎn)品,另外一組為沒有成交記錄的產(chǎn)品; 特征值計(jì)算子模塊,用于從歷史交易數(shù)據(jù)中分別提取所述兩組測試產(chǎn)品在一定時間段內(nèi)的相關(guān)數(shù)據(jù),并利用所述相關(guān)數(shù)據(jù)計(jì)算兩組測試產(chǎn)品各原始特征的特征值; 比較子模塊,用于比較所述兩組測試產(chǎn)品相同原始特征的特征值的差值,若超過閾值,則選取所述原始特征為有效特征。
14.一種搜索結(jié)果排序優(yōu)化系統(tǒng),其特征在于,包括: 備選權(quán)重值獲取模塊,用于分別獲取搜索結(jié)果的有效特征的各組備選權(quán)重值; 理論排序分?jǐn)?shù)計(jì)算模塊,用于分別采用各備選權(quán)重值計(jì)算某一預(yù)定時間點(diǎn)的搜索結(jié)果的理論排序分?jǐn)?shù),并根據(jù)理論排序分?jǐn)?shù)對搜索結(jié)果進(jìn)行排序得到各組排序結(jié)果; 交易數(shù)據(jù)獲取模塊,用于分別獲取各組排序結(jié)果排在前面預(yù)定數(shù)量的搜索結(jié)果,并獲取所述搜索結(jié)果在所述預(yù)定時間點(diǎn)以后的交易數(shù)據(jù); 實(shí)際排序分?jǐn)?shù)計(jì)算模塊,用于根據(jù)所述交易數(shù)據(jù)計(jì)算各組排序結(jié)果中排在前面預(yù)定數(shù)量的搜索結(jié)果的實(shí)際排序分?jǐn)?shù); 最終權(quán)重確定模塊,用于選取實(shí)際排序分?jǐn)?shù)最高的一組排序結(jié)果所對應(yīng)的備選權(quán)重值作為有效特征的最終權(quán)重值。
15.一種搜索結(jié)果排序優(yōu)化系統(tǒng),其特征在于,包括: 理論排序分?jǐn)?shù)計(jì)算模塊,用于獲取某一預(yù)定時間點(diǎn)根據(jù)搜索結(jié)果的理論排序分?jǐn)?shù)進(jìn)行排序的排序結(jié)果,所述理論排序分?jǐn)?shù)根據(jù)有效特征的最終權(quán)重和各搜索結(jié)果的實(shí)際有效特征值得到; 實(shí)際排序分?jǐn)?shù)計(jì)算模塊,用于獲取所述排序結(jié)果中排列在前面預(yù)定數(shù)量的搜索結(jié)果在所述預(yù)定時間點(diǎn)后的交易數(shù)據(jù),并根據(jù)所述交易數(shù)據(jù)計(jì)算所述搜索結(jié)果的實(shí)際排序分?jǐn)?shù);優(yōu)化模塊,用于比較所述實(shí)際排序分?jǐn)?shù)和理論排序分?jǐn)?shù),若兩者差值大于閾值,則優(yōu)化所述有效特征的最終權(quán)重。
【文檔編號】G06F17/30GK103577413SQ201210254425
【公開日】2014年2月12日 申請日期:2012年7月20日 優(yōu)先權(quán)日:2012年7月20日
【發(fā)明者】林鋒, 湯佳宇 申請人:阿里巴巴集團(tuán)控股有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
玛纳斯县| 习水县| 和龙市| 菏泽市| 灌阳县| 临夏市| 东明县| 南丹县| 淮滨县| 且末县| 临漳县| 蓬莱市| 神农架林区| 小金县| 松滋市| 皮山县| 彭阳县| 通许县| 巴楚县| 郸城县| 开平市| 邹平县| 广汉市| 凤山县| 张家口市| 大理市| 天柱县| 科技| 尼木县| 景谷| 自治县| 泸州市| 娱乐| 河曲县| 桐柏县| 沙田区| 六枝特区| 金阳县| 买车| 共和县| 陕西省|