两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

數(shù)據(jù)存儲及檢索的制作方法

文檔序號:6656229閱讀:243來源:國知局
專利名稱:數(shù)據(jù)存儲及檢索的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)存儲和檢索處理,以及利用計算機來執(zhí)行所述處理的手段。
背景技術(shù)
數(shù)據(jù)檢索通常使用被稱為“瀏覽器”或“搜索引擎”的搜索工具。為了有效地進行數(shù)據(jù)檢索,需要提供簡單的用戶界面,同時在后臺使用高度復(fù)雜的信息檢索技術(shù)。理想的系統(tǒng)應(yīng)使用戶能夠利用單一而簡單的搜索字段檢索到他需要的所有信息而沒有“誤檢(false drop)”(盡管滿足搜索條件但與用戶無關(guān)的數(shù)據(jù)項)。實際上,這是不可能實現(xiàn)的,因為必須在以下兩者之間找到平衡充分精確地定義搜索條件從而使檢索到的所有信息都相關(guān);或者足夠?qū)挼囟x搜索條件以便檢索到所有相關(guān)信息。大多數(shù)搜索引擎都具有在最初的條件設(shè)定得太窄或太寬時改進搜索的措施。
在搜索被定義得太寬的情況下,結(jié)果列表的導(dǎo)航本身就是個重要任務(wù)??捎捎脩魜砀倪M搜索,這本質(zhì)上是對由最初的搜索結(jié)果限定的更有限的數(shù)據(jù)庫重復(fù)進行該處理。然而,這樣做不可避免地會存在丟失某些不符合該更加受限的搜索條件的數(shù)據(jù)的風(fēng)險。因此理想的是,用戶可以檢查最初的搜索結(jié)果。這可以通過對結(jié)果進行排列的結(jié)構(gòu)而方便地進行,該結(jié)構(gòu)優(yōu)選地在結(jié)果列表中的頭幾個條目內(nèi)提供用戶最有可能需要的數(shù)據(jù)。
已知多種用于根據(jù)其可能相關(guān)性對搜索結(jié)果進行排序的方法。可以根據(jù)各個檢索項目中的、搜索中所用的搜索詞條之間的關(guān)系對數(shù)據(jù)項進行排序。例如,可以將其中兩個關(guān)鍵詞在文中彼此相鄰出現(xiàn)的數(shù)據(jù)項排在其中相同的兩個關(guān)鍵詞分開較遠(yuǎn)出現(xiàn)的數(shù)據(jù)項目之上。其他方法包括按照數(shù)據(jù)項被訪問的次數(shù)的順序來排列這些數(shù)據(jù)項,或者某些其他普及性措施,例如“Google”(RTM)搜索引擎所用的方法,該方法利用了對每一獨立站點所做的引用(超鏈接)的次數(shù)。
Google所用的另一種方法是將被認(rèn)為與已經(jīng)列出的另一條目非常相似的條目列入下一級,從而提高在頭幾個條目中出現(xiàn)的數(shù)據(jù)項的多樣性。然而,該排序方法假設(shè)所顯示的數(shù)據(jù)項與下一級的數(shù)據(jù)項之間的差異對于用戶的具體目的來說并不重要。
所有這些普及性措施對大多數(shù)用戶來說都提高了在頭幾個條目中找到他們所尋找的數(shù)據(jù)項的可能性。然而,對于那些尋找平常不太需要的數(shù)據(jù)項的用戶(盡管是少數(shù))來說很少會成功。
已經(jīng)作出了各種嘗試,以利用用戶的進一步輸入來改善結(jié)果,例如通過搜索處理期間的對話,或者通過參考預(yù)先存儲的用戶簡檔。然而,這些技術(shù)并不分析被搜索數(shù)據(jù)的性質(zhì),而是需要用戶進一步的輸入。
對于大小受限的數(shù)據(jù)集,特別是數(shù)據(jù)采集受控的數(shù)據(jù)集來說,通常以分級結(jié)構(gòu)來組織數(shù)據(jù),從而允許將搜索約束在該結(jié)構(gòu)的給定級或?qū)?。一個示例為國際專利分類關(guān)鍵字,其用于輔助從在過去的大約150年內(nèi)以各種語言公開的數(shù)百萬份專利說明書中檢索信息。然而,使用諸如相關(guān)加權(quán)算法的傳統(tǒng)信息檢索技術(shù)為每個查詢存儲整個數(shù)據(jù)集會使計算過于復(fù)雜,而不能在合理時間內(nèi)給出搜索結(jié)果。此外,傳統(tǒng)的分級結(jié)構(gòu)需要做出最初假設(shè),然而給定的單獨搜索可能需要找到存在于該結(jié)構(gòu)的不同分支上但是以與所用結(jié)構(gòu)不相關(guān)的方式相關(guān)的數(shù)據(jù)項。例如,如果分級結(jié)構(gòu)是基于應(yīng)用的,則在數(shù)據(jù)庫的截然不同的部分中可能出現(xiàn)因具有相同起源(制造商)、成分或組成部分而相關(guān)的數(shù)據(jù)項。

發(fā)明內(nèi)容
根據(jù)本發(fā)明,提供了一種用于構(gòu)造數(shù)據(jù)倉庫(data repository)的處理,該處理包括以下步驟定義一組元數(shù)據(jù)值;定義每一對元數(shù)據(jù)值之間的相關(guān)性值;
將所述元數(shù)據(jù)值中的一個或更多個賦給要由所述倉庫存儲的多個數(shù)據(jù)項中的每一個;以及提供用于對根據(jù)數(shù)據(jù)項被賦予的元數(shù)據(jù)值和所述元數(shù)據(jù)值彼此的相關(guān)性進行了分組的數(shù)據(jù)項進行檢索的手段。
本發(fā)明延及根據(jù)這些原理進行了排序的數(shù)據(jù)倉庫,更具體地說,延及以下數(shù)據(jù)倉庫,該數(shù)據(jù)倉庫具有用于存儲數(shù)據(jù)項和相關(guān)聯(lián)的元數(shù)據(jù)值的手段,以及用于存儲在每一對元數(shù)據(jù)值之間定義的相關(guān)聯(lián)的相關(guān)性值的手段,并且包括用于檢索所述數(shù)據(jù)項及其被賦予的元數(shù)據(jù)值的手段,以及用于呈現(xiàn)根據(jù)數(shù)據(jù)項被賦予的元數(shù)據(jù)值和所述元數(shù)據(jù)值彼此的相關(guān)性進行了分組的數(shù)據(jù)項的手段。
根據(jù)本發(fā)明,還提供了一種用于從如上所述構(gòu)造的倉庫中檢索數(shù)據(jù)的處理,該處理包括以下步驟對具有一個或更多個預(yù)定特征的數(shù)據(jù)項進行搜索;識別與符合搜索條件的數(shù)據(jù)項最相關(guān)的元數(shù)據(jù)值;按照其他元數(shù)據(jù)值與該第一值的相關(guān)性的順序?qū)ζ渌獢?shù)據(jù)值進行分級;以及根據(jù)數(shù)據(jù)項的相關(guān)聯(lián)的元數(shù)據(jù)值的分級來呈現(xiàn)數(shù)據(jù)項。
本發(fā)明可用于具有分級結(jié)構(gòu)的數(shù)據(jù)集,尤其是太大而不能窮盡搜索但是對于實現(xiàn)數(shù)據(jù)采集足夠小的分級結(jié)構(gòu)。根據(jù)本發(fā)明進行操作的系統(tǒng)對按等級分類的數(shù)據(jù)進行重新排序,并將其呈現(xiàn)給操作者以便快速而直觀地進行瀏覽。通過定義了可能相關(guān)性度量(measure of likeliness ofrelevance)的“模糊邏輯”處理對要呈現(xiàn)的數(shù)據(jù)進行預(yù)處理,然后相應(yīng)地對數(shù)據(jù)進行排序。這使得能夠根據(jù)相關(guān)聯(lián)的元數(shù)據(jù)對數(shù)據(jù)進行分組,每個組都按照其對于搜索者的可能相關(guān)性的順序進行了排序。并不是過濾掉被搜索引擎識別為相關(guān)可能性較小的信息,而是完整地提供數(shù)據(jù)集,不過要進行重新排序使得最相關(guān)的數(shù)據(jù)首先出現(xiàn)。因此,盡管不具有所選擇元數(shù)據(jù)分類的數(shù)據(jù)項也被列在搜索結(jié)果中,但是根據(jù)由搜索定義并分配給數(shù)據(jù)項的元數(shù)據(jù)類之間的相關(guān)性而對這些數(shù)據(jù)項賦予低等級。所述相關(guān)性可以被定義為虛擬空間中的距離,如圖2所示。該虛擬空間可以具有表示元數(shù)據(jù)之間的關(guān)系所必需的數(shù)量的維度,每一維度都涉及屬性,并且該維度中的每個元數(shù)據(jù)項的坐標(biāo)都是通過各個數(shù)據(jù)項與該屬性的相關(guān)性來定義的??梢园凑斩喾N方式來定義這些屬性。例如,可以按照各個類中所用的關(guān)鍵字的應(yīng)用的重疊來對這些屬性進行定義,這些關(guān)鍵字或者是有意插入的,或者是出現(xiàn)在文檔的自然語言中。根據(jù)數(shù)據(jù)的特性,表示相關(guān)性的其他有用的元數(shù)據(jù)屬性可以包括原作者(authorship)、同義詞(來自相同或不同的語言)、創(chuàng)建日期等。
本發(fā)明能夠使計算機的處理數(shù)據(jù)結(jié)構(gòu)和動態(tài)重排序的能力與操作者的利用認(rèn)知推理來瀏覽數(shù)據(jù)的能力相結(jié)合。搜索者能夠識別可能感興趣的數(shù)據(jù)項組,使得能夠更容易地確定哪些數(shù)據(jù)項值得考慮。例如,如果作為搜索結(jié)果,觀察到許多具有特定元數(shù)據(jù)詞條的數(shù)據(jù)項與它們的等級可能暗示的相關(guān)性不大,則它們被組在一起的事實使得用戶能夠容易地識別并忽略通過該搜索詞條成組的所有數(shù)據(jù)項。
從計算的角度來看,本發(fā)明使得該系統(tǒng)能夠預(yù)計算出兩個集合之間的距離(這里稱為各分類之間的“語義差異”),并保持在特定查詢的情況下以低成本對它們進行重新排序的能力。
在優(yōu)選設(shè)置中,元數(shù)據(jù)與搜索結(jié)果一起顯示。因此,用戶可以使元數(shù)據(jù)與搜索處理相關(guān)聯(lián),使它們能積累分類法(classification taxonomy)經(jīng)驗,從而在當(dāng)前搜索的進展和臨近的未來搜索中都起到輔助作用。


現(xiàn)在將參照附圖以示例的方式描述本發(fā)明的實施例,附圖中圖1是適于實現(xiàn)本發(fā)明的計算機系統(tǒng)的總體結(jié)構(gòu)的示意圖;圖2示出了通過各個元數(shù)據(jù)分類對各個其他元數(shù)據(jù)分類進行的相對加權(quán);圖3是使用元數(shù)據(jù)的分類的表示;圖4是表示搜索處理的流程圖;圖5是示出搜索結(jié)果的截屏圖。
具體實施例方式
圖1示出了可在其上運行實現(xiàn)本發(fā)明的軟件的計算機的典型架構(gòu)。各個計算機均包括中央處理單元(CPU)10,用于執(zhí)行計算機程序并管理和控制計算機的操作。CPU 10通過總線11與多個裝置相連,這些裝置包括第一存儲裝置12(例如,用于存儲系統(tǒng)和應(yīng)用程序的硬盤驅(qū)動器)、第二存儲裝置13(例如,用于從可移動存儲介質(zhì)讀取數(shù)據(jù)和/或向其寫入數(shù)據(jù)的軟盤驅(qū)動器或CD/DVD驅(qū)動器),以及包括ROM 14和RAM 15在內(nèi)的存儲器裝置。該計算機還包括用于與網(wǎng)絡(luò)相連的網(wǎng)卡16。該計算機還可包括用戶輸入/輸出裝置,例如顯示器20以及通過輸入/輸出端口19與總線11相連的鼠標(biāo)17和鍵盤18。普通技術(shù)人員應(yīng)該理解,該架構(gòu)并非限制性的,而僅僅是典型計算機架構(gòu)的示例。該計算機還可以是分布式系統(tǒng),包括通過其各自的接口端口16進行通信的多臺計算機,使得用戶可以利用其自己的用戶接口裝置17、18、20來訪問存儲在一臺計算機上的程序和其他數(shù)據(jù)。還應(yīng)該理解,所述計算機包括使其能實現(xiàn)其用途的所有必要的操作系統(tǒng)和應(yīng)用軟件。
應(yīng)用了本發(fā)明的數(shù)據(jù)集具有包含元數(shù)據(jù)的分級數(shù)據(jù)結(jié)構(gòu)??衫帽倔w論(也就是數(shù)據(jù)的概念化說明)來提供所述元數(shù)據(jù),但是更傳統(tǒng)的分級數(shù)據(jù)結(jié)構(gòu)可能也適于該任務(wù),例如圖3中代表性示出的分級標(biāo)記分類法(hierarchical labeled taxonomy)。各個分類(21,22)具有子類(節(jié)點)311、312、313和321、322以及分配給這些節(jié)點的各個文檔400、401、402…411。所述數(shù)據(jù)項包含關(guān)鍵字??梢允褂米詣臃椒◤臄?shù)據(jù)項中提取關(guān)鍵字,從而使位于分級結(jié)構(gòu)的各個級上的元素都被元數(shù)據(jù)占據(jù)。作為另一種選擇,可以使用其中準(zhǔn)確度很重要的人工方法。
于是,各個元數(shù)據(jù)分類21、22等被分配到多維空間中的某一位置。因此,給定一個分類,能按照在該空間中相對于第一分類的接近度對其他所有分類進行測量和排序。
圖2示出了選擇給定的分類如何影響對剩余分類的排序。對于各個分類21、22…27,確定了與其他分類的一組關(guān)系,這里將結(jié)果顯示為標(biāo)尺上的標(biāo)記,因此標(biāo)記217表示分類21與27之間的相關(guān)性。(當(dāng)然,該值對于分類27相對于分類21的相關(guān)性和分類21相對于分類27的相關(guān)性來說都是相同的)。可以看出對于第一分類21(“互聯(lián)網(wǎng)”),分類23(“銷售”)的得分高于分類26(“結(jié)算”),如它們各自的標(biāo)記213、216所示,因此當(dāng)分類21被選擇為最相關(guān)時,將以該順序針對相關(guān)性對分類23進行排序。相反,當(dāng)選擇“手續(xù)(procedure)”(分類27)時,“結(jié)算”的等級高于“銷售”,如它們各自的標(biāo)記(267,237)所示。
要對數(shù)據(jù)進行搜索時,用戶首先定義搜索條件(步驟41,還參見圖5)。為了在數(shù)據(jù)庫中進行搜索,可以指定一個元數(shù)據(jù)分類,例如“互聯(lián)網(wǎng)(Internet)”(21)。這可以按照傳統(tǒng)方式通過從諸如圖5中所示的屏幕上菜單中選擇詞條來進行。作為另一種選擇,可以指定關(guān)鍵字或其他搜索詞條。搜索處理器識別與這些條件的匹配,并且搜索處理返回數(shù)據(jù)結(jié)構(gòu)中最匹配該搜索詞條的節(jié)點,或者優(yōu)選地返回與這種節(jié)點相關(guān)聯(lián)的文檔的列表(步驟42)。接著根據(jù)分配到最匹配所述搜索詞條的數(shù)據(jù)項的類別來選擇主要分類(步驟43)。具體地說,該分類是被分配了通過搜索而選擇的最大數(shù)量的數(shù)據(jù)項的分類。如圖5所示,在數(shù)據(jù)分級顯示中首先顯示出該分類21(步驟46)。接著基于所選分類的屬性,利用“模糊匹配”技術(shù)來確定排列所有其他分類的順序。該處理利用諸如tf.idf(用于去除“停用”詞并計算出各個詞的統(tǒng)計重要性的索引;該值用作每一個被索引詞的相關(guān)加權(quán))的基于矢量的度量來評估各個分類與用戶查詢的相關(guān)性(步驟44)。
排序可能會受到查詢本身中所指定的詞條的影響??梢詼y出詞與分類的相關(guān)程度。例如,短語“寬帶保證(broadband promise)”可能會使“互聯(lián)網(wǎng)”分類21由于與詞“寬帶”的高度相關(guān)性而被選擇為最相關(guān)的分類。然后,可以利用由不需要用戶查詢的模糊重新分級處理給出的值來對其他分類進行分級(步驟45)。還可看到該查詢與其他分類的相關(guān)程度。在該示例中,由于新的廣告運動(advertisement campaign),用戶可能會認(rèn)為“運動(Campaigns)”分類22與查詢相關(guān)??梢酝ㄟ^對整個數(shù)據(jù)結(jié)構(gòu)進行重新分級來解決該臨時相關(guān)性。因此,重新分級將以下兩個值考慮在內(nèi)來測量兩個分類之間的距離1)預(yù)處理分級;2)基于用戶查詢的分級。
本實施例提供了由搜索引擎檢索到的數(shù)據(jù)的多種視圖(view),從而允許以看起來最適于用戶的任何方式通過各種直觀手段進行瀏覽。如圖5所示,根據(jù)分級結(jié)構(gòu)(21-27)、關(guān)鍵字列表(51-51)和文檔列表(400、401、402等)來呈現(xiàn)數(shù)據(jù)。通過識別各分類中的關(guān)鍵字以及用于該分類的標(biāo)簽和元數(shù)據(jù),用戶可以理解在最初查詢中所用的詞是如何在這些分類中使用的。因而,例如,根據(jù)查詢上下文,“寬帶”和“故障”是可能會出現(xiàn)在分類“互聯(lián)網(wǎng)”中的關(guān)鍵字,還可能是出現(xiàn)在分類“手續(xù)”中的關(guān)鍵字,并且根據(jù)相應(yīng)的上下文,用戶可以決定要研究哪一個分類。
該畫面(圖5)在左側(cè)欄的頂部示出了被識別為最相關(guān)的分類(21)。在圖2中所見的相互依賴性基于矢量比較??梢杂檬噶縼肀硎疚臋n,其中元素為關(guān)鍵字。通過算法(tf.idf是標(biāo)準(zhǔn))對這些關(guān)鍵字進行加權(quán)。因此,能夠測量任意兩個文檔或文檔集之間的距離。元數(shù)據(jù)的添加使得可以對該統(tǒng)計方法的任何誤解進行糾正。模糊集(Fuzzy Set)對所有分類之間的相互依賴性進行建模。有益的是,以更容易理解的方式來表示所有這些彼此相關(guān)的分類;圖2有助于對這些關(guān)系進行可視化。
在中間欄中顯示了與分級結(jié)構(gòu)中的該分類相關(guān)聯(lián)的元數(shù)據(jù)(關(guān)鍵字)51。這對于操作者來說是認(rèn)知信息,用于表示查詢詞條在所選分類的語境下的含義。
在頂部分類21的下方,按照其他分類22、23、24、25、26、27和對應(yīng)關(guān)鍵字52、53、54、55、56、57與第一選擇分類21的相關(guān)性的順序列出了該其他分類22、23、24、25、26、27和對應(yīng)關(guān)鍵字52、53、54、55、56、57。根據(jù)本發(fā)明,根據(jù)被搜索結(jié)果識別為最接近用戶的搜索要求的分類21與其他分類22、23、24、25、26、27等中的每一個之間的相關(guān)性,得出第一欄中所呈現(xiàn)的分級結(jié)構(gòu)。在該示例中,“互聯(lián)網(wǎng)”(21)已被識別為主要分類,并且如圖2所示,“運動”(22)被示為具有最高加權(quán)(最大近似度)的分類,并因此列在第二位。
該顯示還使得可以顯示分級數(shù)據(jù)。在圖5中,三個分類311、312、313在欄1的“互聯(lián)網(wǎng)”(21)下方縮進。這些子分類按照與主分類相同的方式來分級,首先列出與搜索查詢最相關(guān)的子分類311,然后按照與該第一子分類的相關(guān)性的順序列出其他子分類312、313。對于主分類顯示與這些子分類相關(guān)的元數(shù)據(jù)。
“模糊邏輯”技術(shù)使用戶能夠識別分類法中的概念之間的相互依賴性,并能通過查看關(guān)鍵字51、52等而得到該查詢在不同分類的語境中的含意,來提取相關(guān)的語義信息。這使得用戶能夠利用肯定和否定關(guān)鍵字來進行復(fù)雜的查詢。在最初查詢41中人工輸入這些關(guān)鍵字,不過搜索引擎隨后可以建議操作者選擇更多的關(guān)鍵字51、52等,以便對查詢進行改進。關(guān)鍵字51、52反映了分類的語義含意。它們可以僅僅與查詢同義或在語境上相關(guān)。該元數(shù)據(jù)還可以通過提供補充詞匯而影響搜索結(jié)果。
為瀏覽這些關(guān)鍵字,用戶在“語義”列表(51,52,...,57)中選擇相關(guān)的關(guān)鍵字(步驟47)。這造成了分類法的重新排序(重復(fù)步驟42至46),以反映所選關(guān)鍵字的語義重要性??梢赃M行諸如產(chǎn)品名稱的更具體的關(guān)鍵字選擇。這將返回所檢索文檔(在數(shù)據(jù)分類中)的所有可能位置。
關(guān)鍵字51與所選分類21相關(guān),但是可以不與返回該分類的最初查詢相關(guān)。與該查詢相關(guān)的關(guān)鍵字可以通過高亮來標(biāo)識,或者通過關(guān)鍵字出現(xiàn)的順序來標(biāo)識。
用戶還可以通過分類本身21、311、312、313、22等進行“瀏覽”。該系統(tǒng)監(jiān)測用戶的活動(步驟48),使得能夠從用戶所選的分類導(dǎo)出原始查詢的意義。然后反饋該信息,以對該檢索特有的語義信息進行加權(quán),從而使得能夠識別其他潛在的匹配。
圖5中的第三欄顯示出針對用戶所選的一個或更多個分類21、22等或者子分類311、312等的搜索的結(jié)果400、401等,這些結(jié)果按照與分類本身被列出的相同順序來排列。由于在任何給定的分類或子分類中通常存在多個文檔400、401、402,所以該列表會比其他欄中的分類21至27、子分類311至313以及關(guān)鍵字51至57的列表長很多,為了能看到完整的列表而設(shè)置了滾動條99??梢蕴峁┲T如顏色編碼或背景陰影的手段來區(qū)別屬于不同分類或子分類311、312的文檔400至403、404至406的組,從而輔助用戶瀏覽各個文檔。
可由用戶來改進初始查詢(步驟47),用戶從中間欄中選擇一些語境關(guān)鍵字52。當(dāng)相關(guān)聯(lián)分類的順序發(fā)生改變時,該查詢會觸發(fā)結(jié)果的重新分級(步驟42至45)。因而,語境關(guān)鍵字的選擇使得用戶能夠明白在各分類下保存有什么信息,并將該知識用于以后的查詢。
在選擇和研究了文檔后,還為用戶提供了預(yù)防措施(provision),從而通過提供“更多相似內(nèi)容”或“錯誤主題”反饋機制來提供反饋(步驟57)。系統(tǒng)可利用這樣的反饋來提高或降低給定分類的等級。
舉一個具體示例,關(guān)鍵字“valve(閥、真空管、電子管)”可以出現(xiàn)在諸如電子、壓力傳感器、泵、引擎或液壓系統(tǒng)的不同語境中。用戶可以根據(jù)該文檔的技術(shù)領(lǐng)域是否與其所關(guān)注的領(lǐng)域相關(guān),來選擇對呈現(xiàn)給他的各個文檔給出肯定反饋還是否定反饋,而無需確認(rèn)限制太多的關(guān)鍵字。這將意味著詞“valve”不是用于進行重新分級的較好的詞,因此應(yīng)當(dāng)忽略;在用戶反饋時,可以對整個數(shù)據(jù)等級進行重新分級以更好地對預(yù)期的查詢進行建模。
如本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解的那樣,可以在適于存儲或傳輸并可被適合的計算機輸入裝置(例如,CD-ROM、可光學(xué)讀取的標(biāo)記、磁性介質(zhì)、穿孔卡或帶)讀取的任何載體上或在電磁或光信號上實施用于實現(xiàn)本發(fā)明的任何或全部軟件,從而可以將所述程序加載到一個或更多個通用計算機上,或者可以利用合適的傳輸介質(zhì)通過計算機網(wǎng)絡(luò)下載。
權(quán)利要求
1.一種數(shù)據(jù)倉庫,該數(shù)據(jù)倉庫具有用于存儲數(shù)據(jù)項和相關(guān)聯(lián)的元數(shù)據(jù)值的手段,以及用于存儲在每一對元數(shù)據(jù)值之間定義的相關(guān)聯(lián)的相關(guān)性值的手段,并且包括用于檢索所述數(shù)據(jù)項及其被賦予的元數(shù)據(jù)值的手段,以及用于呈現(xiàn)根據(jù)所述數(shù)據(jù)項被賦予的元數(shù)據(jù)值和所述元數(shù)據(jù)值彼此的相關(guān)性進行了分組的所述數(shù)據(jù)項的手段。
2.一種用于構(gòu)造數(shù)據(jù)倉庫的處理,該處理包括以下步驟定義一組元數(shù)據(jù)值;定義每一對元數(shù)據(jù)值之間的相關(guān)性值;將所述元數(shù)據(jù)值中的一個或更多個賦給要由所述倉庫存儲的多個數(shù)據(jù)項中的每一個;以及提供用于對根據(jù)所述數(shù)據(jù)項被賦予的元數(shù)據(jù)值和所述元數(shù)據(jù)值彼此的相關(guān)性進行了分組的所述數(shù)據(jù)項進行檢索的手段。
3.一種用于從根據(jù)權(quán)利要求1或2構(gòu)造的倉庫中檢索數(shù)據(jù)的處理,該處理包括以下步驟對具有一個或更多個預(yù)定特征的數(shù)據(jù)項進行搜索;識別與符合搜索條件的數(shù)據(jù)項最相關(guān)的元數(shù)據(jù)值;按照其他元數(shù)據(jù)值與該第一值的相關(guān)性的順序?qū)ζ渌獢?shù)據(jù)值進行分級;以及根據(jù)所述數(shù)據(jù)項的相關(guān)聯(lián)的元數(shù)據(jù)值的分級來呈現(xiàn)所述數(shù)據(jù)項。
4.根據(jù)權(quán)利要求3所述的處理,其中通過在所述查詢本身中指定的詞條來確定所述最相關(guān)的元數(shù)據(jù)值的選擇。
5.根據(jù)權(quán)利要求3或4所述的處理,其中所述查詢指定所述元數(shù)據(jù)值中的一個或更多個。
6.根據(jù)權(quán)利要求3、4或5所述的處理,其中與搜索結(jié)果一起顯示所述元數(shù)據(jù)。
7.根據(jù)權(quán)利要求6所述的處理,其中識別用戶檢索出的數(shù)據(jù)項,并根據(jù)檢索出的數(shù)據(jù)項進行所述元數(shù)據(jù)值的重新排序。
8.一種或一套計算機程序,所述計算機程序和一臺或更多臺計算機一起使用,以提供如權(quán)利要求1所述的裝置,或者執(zhí)行如權(quán)利要求2至7中的任意一項所述的方法。
全文摘要
本發(fā)明公開了數(shù)據(jù)存儲及檢索。數(shù)據(jù)倉庫存儲數(shù)據(jù)項和相關(guān)聯(lián)的元數(shù)據(jù)值(21,22,...,27)以及在每一對元數(shù)據(jù)值之間定義的相關(guān)聯(lián)的相關(guān)性值(212、217、227等)。為了檢索數(shù)據(jù),識別“最相關(guān)”的元數(shù)據(jù)值(21),并且首先檢索與該元數(shù)據(jù)值相關(guān)聯(lián)的數(shù)據(jù)項。根據(jù)其他數(shù)據(jù)項的相關(guān)聯(lián)的元數(shù)據(jù)值(27)與所選元數(shù)據(jù)值(21)的相關(guān)性值(217)來對其他數(shù)據(jù)項進行分級。
文檔編號G06F17/30GK1969276SQ200580020283
公開日2007年5月23日 申請日期2005年6月10日 優(yōu)先權(quán)日2004年6月25日
發(fā)明者格里·迪卡泰爾, 貝南·阿斯文 申請人:英國電訊有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
泾川县| 邵武市| 兰考县| 阿拉尔市| 东丽区| 县级市| 日土县| 朔州市| 汽车| 霍邱县| 奉化市| 改则县| 黄龙县| 漠河县| 乐都县| 霍邱县| 临泉县| 水富县| 修武县| 万山特区| 太谷县| 建昌县| 安徽省| 安达市| 民乐县| 贵德县| 青海省| 南宫市| 英山县| 金沙县| 易门县| 崇文区| 英吉沙县| 仁寿县| 惠州市| 上虞市| 黄冈市| 泾阳县| 安顺市| 合作市| 永州市|