两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

跨語言檢索請求的轉(zhuǎn)換及跨語言信息檢索方法和系統(tǒng)的制作方法

文檔序號:6574675閱讀:241來源:國知局
專利名稱:跨語言檢索請求的轉(zhuǎn)換及跨語言信息檢索方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及信息處理技術(shù),具體地,涉及跨語言檢索請求的轉(zhuǎn)換方法 和裝置以及跨語言信息檢索方法和系統(tǒng)。
背景技術(shù)
隨著網(wǎng)絡(luò)的普及,網(wǎng)絡(luò)上的信息資源日益豐富且用戶對于網(wǎng)^fT息資 源的需求也在遲漸提高.但是,在網(wǎng)^ff息資源日益豐富的同時(shí),卻又存 在著阻礙這些資源為用戶所廣泛共享的一個(gè)主要障礙一多語種問題。其原 因在于,目前網(wǎng)絡(luò)用戶獲得網(wǎng)絡(luò)信息資源的 一個(gè)主要途徑是通過信息檢索 系統(tǒng),但傳統(tǒng)的倌息檢索系統(tǒng)主要是針對于單一語種的文檔集而實(shí)現(xiàn)的. 也就是說,傳統(tǒng)的信息檢索系統(tǒng)一般允許用戶選擇某一語種作為查詢語言, 但僅向用戶返田符合其查詢條件的、與該查詢語言相同的語種的文檔。目前,由于用戶需要查詢多語種文本的情形已變得越來越普遍,所以, 為了滿足人們對于不同語種的網(wǎng)絡(luò)信息資源的共享需求,跨語言信息檢索 技術(shù)正在受到廣泛的關(guān)注及普遍的應(yīng)用??缯Z言信息檢索技術(shù)是結(jié)合了傳統(tǒng)文本信息檢索技術(shù)和機(jī)器翻譯 (machinetranslation, MT)技術(shù)的一門熱點(diǎn)技術(shù)。^"言信息檢索系統(tǒng) 使得用戶能夠以其選定的源語言提交檢索請求,而對目標(biāo)語言的文檔進(jìn)行 檢索。具體地,在i^言信息檢索系統(tǒng)中,廣泛地使用基于機(jī)器翻譯系統(tǒng) 的查詢翻譯方法來實(shí)現(xiàn)上ilJ^語言的信息檢索。也就是說,跨語言信息檢 索系統(tǒng)首先利用基于機(jī)器翻譯系統(tǒng)的查詢翻譯方法自動(dòng)地將用戶的檢索請 求從其源語言翻譯到目標(biāo)語言,從而得到該檢索請求的目標(biāo)語言譯文,然后再根據(jù)該目標(biāo)語言譯文來構(gòu)造與該檢索請求對應(yīng)的目標(biāo)語言檢索請求, 從而使該跨語言信息檢索系統(tǒng)能夠利用該目標(biāo)語言檢索式對符合查詢^ 的目標(biāo)語言的文檔進(jìn)行單語檢索。但是,在以往的跨語言信息檢索系統(tǒng)中,通常都直接使用單個(gè)機(jī)器翻 譯系統(tǒng)來生成檢索請求的目標(biāo)語言譯文、進(jìn)而構(gòu)造檢索式,從而這樣的跨求譯文的質(zhì)量.從而,當(dāng)機(jī)器翻譯系統(tǒng)的譯文質(zhì)量較差時(shí),直接使用該機(jī) 器翻譯系統(tǒng)所生成的檢索請求的譯文來構(gòu)造檢索式,通常也會使得跨語言 信息檢索系統(tǒng)得到質(zhì)重較差的檢索結(jié)果。因此,需要設(shè)計(jì)出一種新的跨語言檢索請求的轉(zhuǎn)換技術(shù)以及跨語言信 息檢索技術(shù),來提高跨語言信息檢索系統(tǒng)的檢索性能。發(fā)明內(nèi)容本發(fā)明正是鑒于上述現(xiàn)有技術(shù)中的問題而提出的,其目的在于提供一 種跨語言檢索請求的轉(zhuǎn)換方法和裝置以及跨語言信息檢索方法和系統(tǒng),以 便通過融合多個(gè)機(jī)器翻譯系統(tǒng)所生成的^言檢索請求的譯文來構(gòu)造檢索 式,從而提高跨語言信息檢索系統(tǒng)的檢索性能。根據(jù)本發(fā)明的一個(gè)方面,提供一種跨語言檢索請求的轉(zhuǎn)換方法,包括 利用多個(gè)不同的機(jī)器翻譯系統(tǒng)分別對上^語言檢索請求進(jìn)行從源語言到目標(biāo)語言的翻譯,以得到該跨語言檢索請求的多個(gè)目標(biāo)語言譯文;以及以上i2lif語言檢索請求的上述多個(gè)目標(biāo)語言譯文為基礎(chǔ),構(gòu)造與該跨語言檢索請求對應(yīng)的目標(biāo)語言檢索請求。根據(jù)本發(fā)明的另一個(gè)方面,提供一種跨語言信息檢索方法,包括從檢索用戶處獲得料言檢索請求;利用上述的種言檢索請求的轉(zhuǎn)換方法對上述跨語言檢索請求進(jìn)行從源語言到目標(biāo)語言的轉(zhuǎn)換,以生成與該w言檢索請求對應(yīng)的目標(biāo)語言檢索請求;以及根據(jù)上述目標(biāo)語言檢索請求從 信息源檢索滿足條件的目標(biāo)語言文檔。根據(jù)本發(fā)明的另一個(gè)方面,提供一種跨語言檢索請求的轉(zhuǎn)換裝置,包括多個(gè)機(jī)器翻譯塊,其分別對上i4J^語言檢索請求進(jìn)行從源語言到目 標(biāo)語言的翻譯,以得到該跨語言檢索請求的多個(gè)目標(biāo)語言譯文;以及目標(biāo) 語言檢索請求構(gòu)造模塊,其以上iii^語言檢索請求的上述多個(gè)目標(biāo)語言譯 文為基礎(chǔ),構(gòu)造與該跨語言檢索請求對應(yīng)的目標(biāo)語言檢索請求。根據(jù)本發(fā)明的另一個(gè)方面,提供一種降洽言信息檢索系統(tǒng),包括用 戶模塊,其從檢索用戶處獲得跨語言檢索請求,并向檢索用戶呈現(xiàn)該# 言信息檢索系統(tǒng)的檢索結(jié)果;上述的跨語言檢索請求的轉(zhuǎn)換裝置,其對上 述跨語言檢索請求進(jìn)行從源語言到目標(biāo)語言的轉(zhuǎn)換,以生成與該#言檢 索請求對應(yīng)的每標(biāo)語言檢索請求;以及檢索模塊,其根據(jù)上述目標(biāo)語言檢 索請求從信息源檢索滿足條件的目標(biāo)語言文檔。


相信通過以下結(jié)合附困對本發(fā)明具體實(shí)施方式
的說明,能夠使人們更 好地了解本發(fā)明上述的特點(diǎn)、優(yōu)點(diǎn)和目的。困1是根振本發(fā)明實(shí)施例的跨語言信息檢索方法的流程圖;困2是根振本發(fā)明實(shí)施例的跨語言檢索請求的轉(zhuǎn)換方法的流程圖;圖3是根振本發(fā)明實(shí)施例的跨語言信息檢索系統(tǒng)的方框圖;以及圖4是M本發(fā)明實(shí)施例的跨語言檢索請求的轉(zhuǎn)換裝置的方框圖。
具體實(shí)施方式
在對本發(fā)明的各個(gè)優(yōu)選實(shí)施例進(jìn)行詳細(xì)描述之前,首先對現(xiàn)有的跨語 言信息檢索系統(tǒng)進(jìn)行簡單介紹。現(xiàn)有的i^if言信息檢索系統(tǒng)可以是在傳統(tǒng)的信息檢索系統(tǒng)的M上增加了對檢索請求在不同語言之間的翻譯等功能之后的信息檢索系統(tǒng),也可 以是重新枸造的具有上述功能的新的信息檢索系統(tǒng)。也就是說, 一個(gè)現(xiàn)有的跨語言信息檢索系統(tǒng)不僅涉及到信息檢索的技術(shù)領(lǐng)域,而且還涉及到機(jī)器翻譯的技術(shù)領(lǐng)域。具體地,融合這兩個(gè)領(lǐng)域的技術(shù),現(xiàn)有的跨浩言信息檢索系統(tǒng)進(jìn)行信息檢索的主要過程如下用戶向、該跨語言信息檢索系統(tǒng)提交檢索請求,從而形成一個(gè)源語言的檢索式;該 系統(tǒng)利用一個(gè)機(jī)器翻譯系統(tǒng)對該源語言的檢索式進(jìn)行語言識別,并在識別 出語種后,對其進(jìn)行詞法分析和結(jié)構(gòu)分析,然后將分析后的源語言的檢索 式翻譯成某一種或某幾種目標(biāo)語言,從而生成相應(yīng)目標(biāo)語言的檢索式;最 后,所生成的各相應(yīng)目標(biāo)語言檢索式被提交給該系統(tǒng)中的檢索部分,以便 從信息源的備相應(yīng)目標(biāo)語言的文檔中檢索符合*的信息。其中,在檢索請求被翻譯為多種目標(biāo)語言的情況下,該#言信息檢 索系統(tǒng)所得到的檢索結(jié)果中含有這多種目標(biāo)語言的符合條件的信息。此外,需要指出的是,跨語言信息檢索并不包括這樣的情況檢索請 求中包括不同語種的檢索詞,但信息檢索系統(tǒng)并不具有在進(jìn)行檢索之前識 別檢索請求的語種進(jìn)而將其翻譯為另一語種的功能,即使該系統(tǒng)檢索得到 的檢索結(jié)果中包括了上述各語種的信息。舉例來說,如果在某一不具有檢 索請求的翻譯功能的信息檢索系統(tǒng)中輸入檢索請求"知識發(fā)現(xiàn)knowledge" 并選擇所有語種,則在進(jìn)行檢索時(shí),只要內(nèi)容中既包括"知識發(fā)現(xiàn)"又包 括"knowledge",那么任何這樣的文檔都會被檢索出來,而不管該文檔中 的其他部分是中文的、英文的還是日文的。但是,由于該信息檢索系統(tǒng)在 檢索過程中并不識別檢索請求的語種也未進(jìn)行檢索請求的語種轉(zhuǎn)換,從而 所實(shí)現(xiàn)的也不是利用源語言對目標(biāo)語言文檔進(jìn)行的檢索,所以這不是真正 的跨語言信息檢索。本發(fā)明所討論的跨語言信息檢索是利用某一語種(源語言)的檢索請 求對另一或另一些不同語種(目標(biāo)語言)的信息進(jìn)行檢索的情況。 下面就結(jié)合附圖對本發(fā)明的各個(gè)優(yōu)選實(shí)施例進(jìn)行詳細(xì)的說明。 圖l是根椐本發(fā)明實(shí)施例的跨語言信息檢索方法的流程圖。 如圖l所示,首先,在步驟105,檢索用戶利用源語言輸入跨語言檢 索請求,并提交給跨語言信息檢索系統(tǒng)。在本實(shí)施例中,用戶輸入跨語言檢索請求所使用的源語言可以是該跨語言信息檢索系統(tǒng)所能夠支持的任何 語言,例如中文等。此外,用戶所輸入的跨語言檢索請求可以是用戶感興 趣的內(nèi)容中包括的單字、詞語或術(shù)語,或者是與文檔密切相關(guān)且能獨(dú)立區(qū)分的屬性等,也就是說,所有與欲檢索文檔相關(guān)的內(nèi)容都可以作為冷浯言 檢索請求。需要說明的是,對跨語言檢索請求的支持是基于跨語言信息檢 索系統(tǒng)的數(shù)據(jù)庫容量及匹配邏輯來實(shí)現(xiàn)的,并且由于其不是本發(fā)明的特征 所在,所以本發(fā)明對此步驟沒有特別的限定。接著,在步驟110,對上i^語言檢索請求進(jìn)行從源語言到目標(biāo)語言 的轉(zhuǎn)換,以獲得與該跨語言檢索請求對應(yīng)的目標(biāo)語言檢索請求。以下,結(jié)合圖2對上面圖1的步驟110中跨語言檢索請求從源語言到 目標(biāo)語言的轉(zhuǎn)換方法進(jìn)行詳細(xì)描述。困2是示出根據(jù)本發(fā)明實(shí)施例的跨語言檢索請求的轉(zhuǎn)換方法的流程 圖。在本實(shí)施例中,為了簡單起見,僅討論將上述跨語言檢索請求從源語 言轉(zhuǎn)換為一種目標(biāo)語言以便從該目標(biāo)語言的信息中檢索符合條件的文檔的 情況。在此情況下,該目標(biāo)語言可以是用戶在提交該跨語言檢索請求時(shí)所 選定的語種,也可以是未經(jīng)用戶選擇而由該奪浯言信息檢索系統(tǒng)所默認(rèn)的 語種,例如英文等.如圖2所示,首先,在步驟205,利用多個(gè)不同的機(jī)器翻譯系統(tǒng)對上 述跨語言檢索箭求進(jìn)行從源語言到目標(biāo)語言的翻譯。具體地,在本步驟中,利用上述多個(gè)不同的機(jī)器翻譯系統(tǒng)中的每一個(gè) 將上iiJ^語言檢索請求從源語言翻譯為指定的目標(biāo)語言,以得到該跨語言 檢索請求的指定目標(biāo)語言的一個(gè)譯文.從而,在本步驟中,利用這多個(gè)不 同的機(jī)器翻譯系統(tǒng)可得到該跨語言檢索請求的多個(gè)目標(biāo)語言譯文,在本步驟中,對于每一個(gè)機(jī)器翻譯系統(tǒng)來說,其對上^語言檢索請求的翻譯過程均涉及到對該跨語言檢索請求的多種自然語言處理,具體地, 每一個(gè)機(jī)器翻譯系統(tǒng)的處理過程主要包括源語言分析、從源語言到目標(biāo)語 言的轉(zhuǎn)換、目標(biāo)語言的生成等。其中,源語言分析又可以分為詞法分析、 詞性標(biāo)注與句法分析、語義分析、語用和語境分析等不同的分析層次。再 者,源語言和目標(biāo)語言之間的轉(zhuǎn)換是機(jī)器翻譯的核心技術(shù),可利用大目 雙語(或多語)語料庫及其標(biāo)注等翻譯知識為基礎(chǔ)來具體實(shí)現(xiàn)。并且由于 本發(fā)明的特征在于下面所描述的如何融合這多個(gè)不同的機(jī)器翻譯系統(tǒng)所生成的上iwrr檢索請求的多個(gè)目標(biāo)語言譯文,而并非具體的機(jī)器翻譯過 程本身,所以本發(fā)明對于各機(jī)器翻譯系統(tǒng)的具體實(shí)現(xiàn)及其工作過程并沒有特別的限制,并且只要能夠?qū)崿F(xiàn)跨語言檢索請求的從源語言到指定目標(biāo)語 言的翻譯,本發(fā)明可使用任何現(xiàn)在已知或?qū)砜芍臋C(jī)器翻譯系統(tǒng)來實(shí)現(xiàn)。此外,需JH兌明的是,在本步驟中,對于這多個(gè)不同的機(jī)器翻譯系統(tǒng) 的啟用順序并沒有特別的限制。可以按順序依次啟用這些機(jī)器翻譯系統(tǒng)對 上^j^言檢索請求進(jìn)^譯,也可以同時(shí)地啟用這些機(jī)器翻譯系統(tǒng)對該 跨語言檢索請求進(jìn)行翻譯。接著,在步驟210,獲得上述多個(gè)不同的機(jī)器翻譯系統(tǒng)中的每一個(gè)的譯文質(zhì)量得分。具體地,在本實(shí)施例中,這多個(gè)不同的機(jī)器翻譯系統(tǒng)中的 每一個(gè)的譯文質(zhì)量得分是通過預(yù)先離線針對該機(jī)器翻譯系統(tǒng)進(jìn)*文質(zhì)量 的評測而得到的。關(guān)于譯文質(zhì)量的評測,可以根據(jù)由用戶來選擇測試集并制定分?jǐn)?shù)等級的人工評測方式來實(shí)現(xiàn),也可以根據(jù)利用NIST的Scoring Software自動(dòng)打分工具等的自動(dòng)評測方式來實(shí)現(xiàn)。并且,由于譯文質(zhì)量的 評測是本領(lǐng)域中的通用技術(shù)并且其也不是本發(fā)明的特征所在,所以本發(fā)明 對此步驟沒有特別的限制。此外,需要說明的是,在本實(shí)施例中,是預(yù)先為各機(jī)器翻譯系統(tǒng)生成 譯文質(zhì)量得分而在以后對跨語言檢索請求進(jìn)行轉(zhuǎn)換的過程中直接來使用 的。但在其他實(shí)施例中,本步驟也可以這樣來實(shí)現(xiàn)首先判斷上述各機(jī)器 翻譯系統(tǒng)是否已具有針對該機(jī)器翻譯系統(tǒng)所評測的譯文質(zhì)量得分,若具有, 則直接獲得其譯文質(zhì)量得分;若某一機(jī)器翻譯系統(tǒng)不具有譯文質(zhì)量得分, 則針對該機(jī)器翻譯系統(tǒng)進(jìn)辨i^t量的評測,以便為其獲得譯^t量得分。在步驟215,對于上述多個(gè)機(jī)器翻譯系統(tǒng)所獲得的上述多個(gè)目標(biāo)語言 譯文中的每一個(gè),利用一個(gè)語言模型來計(jì)算其可信度。利用語言模型來計(jì) 算譯文的可信度也是本領(lǐng)域的通用技術(shù),在此對其不再作進(jìn)一步詳細(xì)描迷。在步驟220,對于上iWf言檢索請求的上述多個(gè)目標(biāo)語言譯文中的 每一個(gè),將在步驟210中所獲得的生成該目標(biāo)語言譯文的機(jī)器翻譯系統(tǒng)的 譯文質(zhì)量得分與在步驟215中所獲得的該目標(biāo)語言譯文的可信度相結(jié)合,以得到該目標(biāo)語言譯文的翻譯可信度。具體地,在本實(shí)施例中,對于上述^言檢索請求的上述多個(gè)目標(biāo)語言譯文中的每一個(gè),將在步驟210中所 獲得的生成該目標(biāo)語言譯文的機(jī)器翻譯系統(tǒng)的譯文質(zhì)量得分與在步驟215 中所獲得的該目標(biāo)語言譯文的可信度相乘,以得到該目標(biāo)語言譯文的翻譯 可信度。但在其他實(shí)施例中,只要能夠得到表示目標(biāo)語言譯文的翻譯可信 度的信息,也可采用其他的方式對各機(jī)器翻譯系統(tǒng)的譯文質(zhì)量得分與目標(biāo) 語言譯文的可信度進(jìn)行關(guān)聯(lián).在步驟225,合并上述跨語言檢索請求的上述多個(gè)目標(biāo)語言譯文,以 形成檢索詞列表。具體地,在本步驟中,識別出各目標(biāo)語言譯文中的對于 檢索來i兌有用的檢索詞,而刪除各目標(biāo)語言譯文中的功能詞,從而將這些 對于檢索來說有用的檢索詞組合在一起形成檢索詞列表。其中,各目標(biāo)語 言譯文中的功能詞是指其功能主要在于表達(dá)一種語法關(guān)系、而沒有具體詞 匯含義的詞,如介詞、連詞等。此外,在本實(shí)施例中,在形成上述檢索詞列表時(shí),將在上述多個(gè)目標(biāo) 語言譯文中重復(fù)出現(xiàn)的所識別出的檢索詞合并,并針對該檢索詞記錄有關(guān) 其曾出現(xiàn)在其中的哪些目標(biāo)語言譯文中的信息,以4更在下面的步驟230中 使用。此外,在其他實(shí)施例中,也可以不合并這些重復(fù)出現(xiàn)的檢索詞,而 在檢索詞列表中單獨(dú)記錄每一個(gè)檢索詞以及有關(guān)其是出現(xiàn)在其中的哪一個(gè) 目標(biāo)語言譯文中的檢索詞的信息。在步驟230,為在步驟225中獲得的上述檢索詞列表中的各檢索詞計(jì)算權(quán)值。在本步騍中,首先獲得檢索詞列表中的各檢索詞及相關(guān)信息以及上述多個(gè)目標(biāo)語言譯文中的每一個(gè)的翻譯可信度,然后將各目標(biāo)語言譯文 的翻譯可信度用于為該檢索詞列表中的各檢索詞計(jì)算基于翻譯可信度的權(quán)值。具體地,在本步驟中,利用TF-IDF算法來計(jì)算各檢索詞的權(quán)值,下 面,以根據(jù)跨語言檢索請求《的7V個(gè)目標(biāo)語言譯文所形成的檢索詞列表為 例來說明利用TF-IDF算法為其中的檢索詞/計(jì)算權(quán)值的過程,其中在步 驟220中計(jì)算的各目標(biāo)語言譯文/ (tl AO的翻譯可信度被用于計(jì)算檢索詞/的詞頻,也就是說,下面所討論的情況是,利用了iV個(gè)機(jī)器翻譯系統(tǒng)分別對跨語言檢索請求《進(jìn)行了從源語言到目標(biāo)語言的翻譯從而生成了該跨語言檢索請求《的7V個(gè)目標(biāo)語言譯文,并根據(jù)這iV個(gè)目標(biāo)語言譯文形成 了該跨語言檢索請求《的檢索詞列表。從而,在此情況下,對于根據(jù)這7V 個(gè)目標(biāo)語言譯文所形成的檢索詞列表中的檢索詞/,可根據(jù)下式來求得其權(quán) 值其中 Z)<formula>formula see original document page 14</formula>其中,^;,為^i"言檢索請求《中的檢索詞/的權(quán)值;7T;,為檢索詞/在跨語言檢索請求《中的加權(quán)詞頻;/D《為檢索詞/的反向文檔頻率;"為文梱總數(shù);《為包含檢索詞/的文檔數(shù);/^,為檢索詞/在跨語言檢索請求《的目標(biāo)語言譯文f中出現(xiàn)的次數(shù);rc,為跨語言檢索請求《的目標(biāo)語言譯文r的翻譯可信度.此外,需要說明的是,在本實(shí)施例中雖然使用了 TF-IDF算法為上述 檢索詞列表中的各檢索詞計(jì)算權(quán)值,但這僅是示意性的說明,而并非要對 本發(fā)明進(jìn)行限制,只要能夠達(dá)到本發(fā)明的目的,可使用任何能夠根據(jù)各目 標(biāo)語言譯文的翻譯可信度得到檢索詞列表中各檢索詞的權(quán)值的算法.接著,在步棵235,根據(jù)上述檢索詞列表及其中各檢索詞的權(quán)值來構(gòu) 造與上iiJ^語言檢索請求對應(yīng)的目標(biāo)語言檢索請求。具體地,在本步驟中, 以上述檢索詞列表中的各檢索詞及其權(quán)值為H得到嫌索詞權(quán)值>對, 從而上述檢索詞列表中的所有檢索詞的嫌索詞權(quán)值>對組合在一起構(gòu)成 了與上^語言檢索請求對應(yīng)的目標(biāo)語言檢索式,作為上述目標(biāo)語言檢索 請求,從而成為檢索的依據(jù)。以上,就是對本實(shí)施例的跨語言檢索請求的轉(zhuǎn)換方法的描述。從以上描述可知,本實(shí)施例首先利用多個(gè)機(jī)器翻譯系統(tǒng)對用戶所輸入的跨語言檢 索請求進(jìn)行從源語言到目標(biāo)語言的翻譯以得到該跨語言檢索請求的多個(gè)目標(biāo)語言譯文,并為這多個(gè)目標(biāo)語言譯文中的每一個(gè)計(jì)算翻譯可信度;然后 融合這所有目標(biāo)語言譯文以獲得一個(gè)帶有翻譯可信度信息的檢索詞列表; 最后,根據(jù)該檢索詞列表中各檢索詞的基于翻譯可信度的權(quán)值來構(gòu)造與上 述跨語言檢索請求對應(yīng)的目標(biāo)語言檢索式。因而,在本實(shí)施例中,由于融合多個(gè)機(jī)器翻譯系統(tǒng)所生成的跨語言檢 索請求的目標(biāo)語言譯文,所以可以構(gòu)造出與該跨語言檢索請求更加相關(guān)的 目標(biāo)語言檢索式。此外,需要說明的是,上面結(jié)合圖2對本實(shí)施例的跨語言檢索請求的 轉(zhuǎn)換方法的說明中,是為了方便起見而以一定的順序?qū)Ω鞑斤M(jìn)行描述的, 但這并非是限制性的,只要能夠達(dá)到本發(fā)明的目的,可采用任何順序來執(zhí) 行這些步驟.此外,還應(yīng)該指出的是,以上是針對于將跨語言檢索請求從源語言轉(zhuǎn) 換為一種指定的目標(biāo)語言的情況進(jìn)行描述的,^Lil僅是示意性的說明,而 并非要對本發(fā)明進(jìn)行限制。在實(shí)際實(shí)現(xiàn)中,也可以存在將跨語言檢索請求從源語言轉(zhuǎn)換為多種指定目標(biāo)語言而從這多種指定目標(biāo)語言的信息中檢索 符合條件的文檔的情況。在此情況下,這多種目標(biāo)語言的種類可以由用戶 在提交跨語言檢索請求時(shí)來選定,也可以是未經(jīng)用戶選擇而由跨語言信息 檢索系統(tǒng)所默認(rèn)的語種或該系統(tǒng)能夠支持的所有語種。此外,在目標(biāo)語言 為多個(gè)語種的愔況下,對于每一個(gè)目標(biāo)語種來說,其轉(zhuǎn)換過程均與上面單 個(gè)目標(biāo)語種的情況相同,因而在此不再重復(fù)描述。返回到閨1,在步驟115,根據(jù)在步驟110所得到的目標(biāo)語言檢索請求, 在信息源的用于檢索的文檔中進(jìn)行匹配,以檢索得到符合條件的文檔。在本步稞中,以W言信息檢索系統(tǒng)中的檢索部分由一個(gè)檢索模塊構(gòu)成的情況為例進(jìn)行說明。具體地,在本步艱中,將在步驟110中獲得的目 標(biāo)語言檢索請求,即<檢索詞權(quán)值>對形式的目標(biāo)語言檢索式提交給該檢 索模塊;該檢索橫塊根據(jù)該目標(biāo)語言檢索式的集合在信息源的用于檢索的文檔中進(jìn)行匹配,以檢索出符合條件的、該目標(biāo)語言的文檔,作為針對該 目標(biāo)語言檢索請求的檢索結(jié)果,此外,在本實(shí)施例中,對于構(gòu)成該跨語言 信息檢索系統(tǒng)中的檢索部分的檢索模塊并沒有特別限制,其可使用能夠支 持上述目標(biāo)語言的現(xiàn)在已知或?qū)砜芍娜魏螜z索模塊(搜索引擎)來實(shí) 現(xiàn)。此外,在其他的實(shí)施例中,上述檢索部分也可以使用分別能夠支持某 一種或某幾種目標(biāo)語言的多個(gè)不同的檢索模塊來實(shí)現(xiàn),這尤其適合于該跨 語言信息檢索系統(tǒng)能夠同時(shí)支持多種目標(biāo)語言的情況。在此情況下,在步驟110中為跨語言檢索請求生成各目標(biāo)語言的檢索式時(shí)還需要針對支持不同目標(biāo)語言的各檢索棋塊構(gòu)造不同表達(dá)方式的目標(biāo)語言檢索式。此外,在 跨語言信息檢索系統(tǒng)使用多個(gè)檢索模塊作為檢索部分的情況下,該#言 信息檢索系統(tǒng)還應(yīng)包括對這多個(gè)檢索模塊的檢索結(jié)果進(jìn)行組合的功能。但 是,由于這并不是本發(fā)明的特征所在,所以本發(fā)明對此沒有特別的限定。接著,在步驟120,向用戶呈現(xiàn)根據(jù)上述目標(biāo)語言檢索請求檢索得到 的檢索結(jié)果.以上,就是對本實(shí)施例的跨語言信息檢索方法的描述.從以上描述可 知,本實(shí)施例裉據(jù)融合了多個(gè)機(jī)器翻譯系統(tǒng)所生成的^言檢索請求的多 個(gè)目標(biāo)語言譯文而得到的目標(biāo)語言檢索請求來檢索符合條件的目標(biāo)語言信 息,使得跨語言信息檢索的精度得到了提高,從而所得到的檢索結(jié)果也更 加準(zhǔn)確。此外,需要說明的是,圖1的跨語言信息檢索方法及圖2的W言檢 索請求的轉(zhuǎn)換方法可與任何現(xiàn)在已知或?qū)砜芍目缯Z言信息檢索系統(tǒng)相 結(jié)合來使用。在同一發(fā)明構(gòu)思下,圖3是示出根據(jù)本發(fā)明實(shí)施例的^"言信息檢索 系統(tǒng)的方框圍.如圖3所示,本實(shí)施例的跨語言信息檢索系統(tǒng)30包括用戶模塊31、 跨語言檢索請求的轉(zhuǎn)換裝置32及檢索模塊33。其中,用戶棋塊31用于從檢索用戶處獲得源語言的跨語言檢索請求以提交給跨語言檢索請求的轉(zhuǎn)換裝置32,并向檢索用戶呈現(xiàn)檢索模塊33所 得到的檢索結(jié)果.在本實(shí)施例中,用戶輸入a言檢索請求所使用的源語 言可以是該跨語言信息檢索系統(tǒng)30所能夠支持的任何語言。此外,在本實(shí) 施例中,用戶模塊31還允許檢索用戶在提交上i^^語言檢索請求時(shí)選定目 標(biāo)語種,在用戶jMt擇的情況下則使用該跨語言信息檢索系統(tǒng)所默認(rèn)的目 標(biāo)語種或其所能夠支持的所有語種??缯Z言檢索請求的轉(zhuǎn)換裝置32用于對從上述用戶模塊31處獲得的跨 語言檢索請求進(jìn)行從源語言到目標(biāo)語言的轉(zhuǎn)換,以獲得與該跨語言檢索請 求對應(yīng)的目標(biāo)語言檢索請求。以下,結(jié)合圖4對該跨語言檢索請求的轉(zhuǎn)換裝置32進(jìn)行詳細(xì)描述。圖4是示出根據(jù)本發(fā)明實(shí)施例的跨語言檢索請求的轉(zhuǎn)換裝置的方框 圖。如圖4所示,該跨語言檢索請求的轉(zhuǎn)換裝置32包括多個(gè)機(jī)器翻譯模塊 321和目標(biāo)語言檢索請求構(gòu)造模塊322。其中,多個(gè)機(jī)器翻譯模塊321用于分別對從上述用戶模塊31處獲得的 上il^語言檢索請求進(jìn)行從源語言到指定目標(biāo)語言的翻譯,以得到該i^ 言檢索請求的多個(gè)目標(biāo)語言譯文。在本實(shí)施例中,對于這多個(gè)機(jī)器翻譯模 塊并沒有特別的限制,只要能夠?qū)崿F(xiàn)跨語言檢索請求的從源語言到指定目 標(biāo)語言的翻譯,本發(fā)明可使用任何現(xiàn)在已知或?qū)砜芍臋C(jī)器翻譯系統(tǒng)來 實(shí)現(xiàn)。目標(biāo)語言檢索請求構(gòu)造模塊322用于以上述多個(gè)機(jī)器翻譯模塊321所 得到的上^語言檢索請求的多個(gè)目標(biāo)語言譯文為基礎(chǔ),構(gòu)造與該跨語言 檢索請求對應(yīng)的目標(biāo)語言檢索請求。具體地,如困4所示,該目標(biāo)語言檢索請求構(gòu)it模塊322進(jìn)一步包括 譯文質(zhì)量評測模塊3221、譯文可信度計(jì)算模塊3222、翻譯可信度計(jì)算模塊 3223、檢索詞列表形成模塊3224、權(quán)值計(jì)算模塊3225和檢索式生成模塊 3226。其中,譯文質(zhì)量評測模塊3221用于對上述多個(gè)機(jī)器翻譯模塊321的每 一個(gè)進(jìn)*文質(zhì)量的評測,以得到該機(jī)器翻譯模塊321的譯文質(zhì)量得分。譯文可倌度計(jì)算樣夾3222用于利用一個(gè)語言模型為上述多個(gè)機(jī)器翻 譯模塊321的每一個(gè)所生成的上述目標(biāo)語言譯文計(jì)算可信度。翻譯可倌度計(jì)算模塊3223用于為上述多個(gè)機(jī)器翻譯模塊321所得到的 上述多個(gè)目標(biāo)語言譯文計(jì)算翻譯可信度。具體地,該翻譯可信度計(jì)算模塊 3223對于上述多個(gè)機(jī)器翻譯模塊321所得到的上述跨語言檢索請求的多個(gè) 目標(biāo)語言譯文中的每一個(gè),將由譯文質(zhì)量評測模塊3221為生成該目標(biāo)語言譯文的機(jī)器翻譯模塊321所評測的譯文質(zhì)量得分與由譯文可信度計(jì)算模塊 3222為該目標(biāo)語言譯文所計(jì)算的可信度相乘,以得到該目標(biāo)語言譯文的翻 譯可信度。檢索詞列表形成模塊3224用于合并上述多個(gè)機(jī)器翻譯模塊321所得到 的上igj^語言檢索請求的多個(gè)目標(biāo)語言譯文,以形成檢索詞列表。具體地, 在本實(shí)施例中,檢索詞列表形成模塊3224識別出上述各目標(biāo)語言譯文中的 對于檢索來說有用的檢索詞,而刪除各目標(biāo)語言譯文中的功能詞,從而將 這些對于檢索來說有用的檢索詞組合在一起構(gòu)成檢索詞列表,其中在該檢 索詞列表中對于各檢索詞記錄有關(guān)于該檢索詞出現(xiàn)在哪一目標(biāo)語言譯文中 的信息。權(quán)值計(jì)算模塊3225用于為上述檢索詞列表形成模塊3224所獲得的檢 索詞列表中的備檢索詞計(jì)算權(quán)值。具體地,在本實(shí)施例中,該權(quán)值計(jì)算模 塊3225利用上述翻譯可信度計(jì)算模塊3223為上述多個(gè)目標(biāo)語言譯文中的 每一個(gè)計(jì)算的翻譯可信度,根據(jù)上面結(jié)合困2所描述的TF-IDF算法來為 上述檢索詞列表中的各檢索詞計(jì)算權(quán)值。檢索式生成棋塊3226根據(jù)上述檢索詞列表形成模塊3224所形成的檢 索詞列表及其中各檢索詞的由上述淑值計(jì)算模塊3225所計(jì)算的權(quán)值,得到 與各檢索詞對應(yīng)的<檢索詞權(quán)值>對,從而將所有檢索詞的<檢索詞權(quán) 值>對組合在"^構(gòu)成了目標(biāo)語言檢索式,并作為目標(biāo)語言檢索請求被提交 給檢索模塊33,以作為檢索的依據(jù)。以上,就是對本實(shí)施例的跨語言檢索請求的轉(zhuǎn)換裝置的描述。從以上 描述可知,本實(shí)施例的跨語言檢索請求的轉(zhuǎn)換裝置首先利用多個(gè)機(jī)器翻譯模塊對用戶所輸入的跨語言檢索請求進(jìn)行從源語言到目標(biāo)語言的翻譯以得 到該跨語言檢索請求的多個(gè)目標(biāo)語言譯文,并為這多個(gè)目標(biāo)語言譯文中的每一個(gè)計(jì)算翻譯可信度;然后融合這所有目標(biāo)語言譯文以獲得一個(gè)帶有翻 譯可信度信息的檢索詞列表;最后,根據(jù)該檢索詞列表中各檢索詞的基于 翻譯可信度的權(quán)值來構(gòu)造與上述跨語言檢索請求對應(yīng)的目標(biāo)語言檢索式。因而,本實(shí)施例的跨語言檢索請求的轉(zhuǎn)換裝置,由于融合多個(gè)機(jī)器翻 譯模塊所生成的跨語言檢索請求的目標(biāo)語言譯文,所以可以構(gòu)造出與* 言檢索請求更加相關(guān)的檢索式.接著,返回到圖3,檢索模塊33用于根據(jù)上i^語言檢索請求的轉(zhuǎn)換 裝置32所生成的、與從用戶模塊31處獲得的跨語言檢索請求對應(yīng)的目標(biāo) 語言檢索請求,從信息源檢索滿足條件的目標(biāo)語言文檔,以作為針對該跨 語言檢索請求的檢索結(jié)果,從而通過用戶模塊31呈現(xiàn)給檢索用戶。以上,就是對本實(shí)施例的跨語言信息檢索系統(tǒng)的描述。從以上描述可 知,本實(shí)施例的跨語言信息檢索系統(tǒng)根據(jù)融合了多個(gè)機(jī)器翻譯模塊所生成 的跨語言檢索請求的多個(gè)目標(biāo)語言譯文而得到的目標(biāo)語言檢索請求來檢索 符合條件的目標(biāo)語言信息,其檢索的精度得到了提高,從而所得到的檢索 結(jié)果也更加準(zhǔn)確。此外,需要說明的是,上面結(jié)合圖4描述的跨語言檢索請求的轉(zhuǎn)換裝 置還可與任何現(xiàn)在已知或?qū)砜芍目缯Z言信息檢索系統(tǒng)相結(jié)合來4吏用。本實(shí)施例的ii^浩言信息檢索系統(tǒng)及其各個(gè)組成,可以由專用的電路或 芯片構(gòu)成,也可以通過計(jì)算機(jī)(處理器)執(zhí)行相應(yīng)的程序來實(shí)現(xiàn)。并且, 本實(shí)施例的*言信息檢索系統(tǒng),操作上可以實(shí)現(xiàn)前面結(jié)合圖l說明的實(shí) 施例的跨語言信息檢索方法.以上雖然通過一些示例性的實(shí)施例對本發(fā)明的跨語言檢索請求的轉(zhuǎn)換方法和裝置以;s^"言信息檢索方法和系統(tǒng)進(jìn)行了詳細(xì)的描述,但是以上這些實(shí)施例并不是窮舉的,本領(lǐng)域技術(shù)人員可以在本發(fā)明的精神和范圍內(nèi) 實(shí)現(xiàn)各種變化和修改.因此,本發(fā)明并不限于這些實(shí)施例,本發(fā)明的范圍 僅以所附權(quán)利要求為準(zhǔn),
權(quán)利要求
1. 一種跨語言檢索請求的轉(zhuǎn)換方法,包括利用多個(gè)不同的機(jī)器翻譯系統(tǒng)分別對上述跨語言檢索請求進(jìn)行從源語言到目標(biāo)語言的翻譯,以得到該跨語言檢索請求的多個(gè)目標(biāo)語言譯文;以及以上述跨語言檢索請求的上述多個(gè)目標(biāo)語言譯文為基礎(chǔ),構(gòu)造與該跨語言檢索請求對應(yīng)的目標(biāo)語言檢索請求。
2. 如權(quán)利要求1所述的跨語言檢索請求的轉(zhuǎn)換方法,其中上述構(gòu)造目 標(biāo)語言檢索請求的步驟進(jìn)一步包括合并上il^語言檢索請求的上述多個(gè)目標(biāo)語言譯文,以形成檢索詞列表;為上述檢索詞列表中的各檢索詞計(jì)算權(quán)值;以及 根據(jù)上述檢索詞列表及其中各檢索詞的權(quán)值構(gòu)造與上^浯言檢索請 求對應(yīng)的目標(biāo)語言檢索請求。
3. 如權(quán)利要求2所述的跨語言檢索請求的轉(zhuǎn)換方法,其中為上述檢索詞列表中的各檢索詞計(jì)算權(quán)值的步驟進(jìn)一步包括為上i^語言檢索請求的上述多個(gè)目標(biāo)語言譯文中的每一個(gè)計(jì)算翻譯 可信度;將上iii^言檢索請求的上述多個(gè)目標(biāo)語言譯文中的每一個(gè)的翻譯可 信度用于計(jì)算上述檢索詞列表中的各檢索詞的權(quán)值。
4. 如權(quán)利要求3所述的跨語言檢索請求的轉(zhuǎn)換方法,其中上述計(jì)算翻 譯可信度的步壤進(jìn)一步包括獲得上述多個(gè)機(jī)器翻譯系統(tǒng)的每一個(gè)的譯文質(zhì)量得分;利用 一個(gè)語言棋型為上M語言檢索請求的上述多個(gè)目標(biāo)語言譯文中的每一個(gè)計(jì)算可信度;以及對于上一浩言檢索請求的上述多個(gè)目標(biāo)語言譯文中的每一個(gè),將生成該目標(biāo)語言譯文的機(jī)器翻譯系統(tǒng)的譯文質(zhì)量得分與該目標(biāo)語言譯文的可信度相結(jié)合,以得到該目標(biāo)語言譯文的翻譯可信度。
5. 如權(quán)利要求4所述的跨語言檢索請求的轉(zhuǎn)換方法,其中將生成該目 標(biāo)語言譯文的機(jī)器翻譯系統(tǒng)的譯文質(zhì)量得分與該目標(biāo)語言譯文的可信度相結(jié)合的步跺進(jìn)一步包括將生成該目標(biāo)語言譯文的機(jī)器翻譯系統(tǒng)的譯文質(zhì)量得分與該目標(biāo)語言 譯文的可信度相乘.
6. 如權(quán)利要求4所述的跨語言檢索請求的轉(zhuǎn)換方法,其中上述多個(gè)機(jī) 器翻譯系統(tǒng)的每一個(gè)的譯文質(zhì)量得分是預(yù)先針對該機(jī)器翻譯系統(tǒng)進(jìn)W文 質(zhì)量的評測而得到的。
7. 如權(quán)利要求3-6中任意一項(xiàng)所述的跨語言檢索請求的轉(zhuǎn)換方法,其 中將上il^言檢索請求的上述多個(gè)目標(biāo)語言譯文中的每一個(gè)的翻譯可信 度用于計(jì)算上迷檢索詞列表中的各檢索詞的權(quán)值的步驟進(jìn)一步包括將上述跨語言檢索請求的上述多個(gè)目標(biāo)語言譯文中的每一個(gè)的翻譯可 信度用于計(jì)算上述檢索詞列表中的各檢索詞的加權(quán)詞頻。
8. 如權(quán)利要求3-6中任意一項(xiàng)所述的跨語言檢索請求的轉(zhuǎn)換方法,其 中將上i^if言檢索請求的上述多個(gè)目標(biāo)語言譯文中的每一個(gè)的翻譯可信 度用于計(jì)算上述檢索詞列表中的各檢索詞的權(quán)值的步驟進(jìn)一步包括利用上述!Ht言檢索請求的上述多個(gè)目標(biāo)語言譯文中的每一個(gè)的翻譯 可信度、根據(jù)下述算法計(jì)算上述檢索詞列表中的各檢索詞的權(quán)值<formula>formula see original document page 3</formula>其中 <formula>formula see original document page 3</formula>其中,『,,為1*#言檢索請求《中的檢索詞/的權(quán)值;TF,.,為檢索詞/在跨 語言檢索請求f中的加權(quán)詞頻;/z巧為檢索詞/的反向文檔頻率;Z)為文檔 總數(shù);rf,為包含檢索詞z'的文檔數(shù);如《,,為檢索詞/在跨語言檢索請求《 的目標(biāo)語言譯文r中出現(xiàn)的次數(shù);rc,為跨語言檢索請求《的目標(biāo)語言譯文 《的翻譯可信度,
9. 如權(quán)利要求1所述的跨語言檢索請求的轉(zhuǎn)換方法,其中上述目標(biāo)語言檢索請求是與上i!J^語言檢索請求中的各檢索詞對應(yīng)的檢索詞-權(quán)值對 的集合。
10. 如權(quán)利要求9所述的跨語言檢索請求的轉(zhuǎn)換方法,其中上述檢索 詞-權(quán)值對是<^索詞權(quán)值>形式的。
11. 一種跨語言信息檢索方法,包括 從檢索用戶處獲得跨語言檢索請求;利用權(quán)利要求1-10中任意一項(xiàng)所述的跨語言檢索請求的轉(zhuǎn)換方法對上 述跨語言檢索請求進(jìn)行從源語言到目標(biāo)語言的轉(zhuǎn)換,以生成與該跨語言檢 索請求對應(yīng)的鼷標(biāo)語言檢索請求;以及根據(jù)上述目標(biāo)語言檢索請求從信息源檢索滿足條件的目標(biāo)語言文檔。
12. 根據(jù)權(quán)利要求ll所述的跨語言信息檢索方法,還包括 向檢索用戶呈現(xiàn)上述滿足條件的目標(biāo)語言文檔。
13. —種跨語言檢索請求的轉(zhuǎn)換裝置,包括 多個(gè)機(jī)器翻譯模塊,其分別對上i^J^言檢索請求進(jìn)行從源語言到目標(biāo)語言的翻譯,以得到該跨語言檢索請求的多個(gè)目標(biāo)語言譯文;以及目標(biāo)語言搶索請求構(gòu)造模塊,其以上i^語言檢索請求的上述多個(gè)目 標(biāo)語言譯文為基礎(chǔ),構(gòu)造與該跨語言檢索請求對應(yīng)的目標(biāo)語言檢索請求。
14. 如權(quán)利要求13所述的跨語言檢索請求的轉(zhuǎn)換裝置,其中上述目標(biāo) 語言檢索請求構(gòu)造模塊進(jìn)一步包括檢索詞列表形成模塊,其合并上*洽言檢索請求的上述多個(gè)目標(biāo)語言譯文,以形成檢索詞列表;權(quán)值計(jì)算模塊,其為上述檢索詞列表中的各檢索詞計(jì)算權(quán)值;以及 檢索式生成棋塊,其根據(jù)上述檢索詞列表形成模塊所形成的檢索詞列表及其中由上迷權(quán)值計(jì)算模塊計(jì)算出的各檢索詞的權(quán)值,生成與上述^i吾言檢索請求對應(yīng)的目標(biāo)語言檢索式。
15. 如權(quán)利要求13或14所述的跨語言檢索請求的轉(zhuǎn)換裝置,其中上 述目標(biāo)語言檢索請求構(gòu)造模塊進(jìn)一步包括翻譯可信度計(jì)算棋塊,其為上述多個(gè)機(jī)器翻譯模塊的每一個(gè)所生成的上述跨語言檢索請求的目標(biāo)語言譯文計(jì)算翻譯可信度;其中,上述權(quán)值計(jì)算模塊將上述翻譯可信度計(jì)算模塊計(jì)算的上述多個(gè) 目標(biāo)語言譯文中的每一個(gè)的翻譯可信度用于計(jì)算上述檢索詞列表中的各檢 索詞的權(quán)值。
16. 如權(quán)利要求15所述的跨語言檢索請求的轉(zhuǎn)換裝置,其中上述翻譯 可信度計(jì)算模塊進(jìn)一步包括譯文質(zhì)重評測模塊,其對上述多個(gè)機(jī)器翻i^模塊的每一個(gè)進(jìn)^i^t 量的評測,以獲得該機(jī)器翻譯模塊的譯文質(zhì)量得分;譯文可信度計(jì)算模塊,其利用一個(gè)語言模型計(jì)算上述多個(gè)機(jī)器翻譯模 塊的每一個(gè)所生成的上述跨語言檢索請求的目標(biāo)語言譯文的可信度;其中,上述翻譯可信度計(jì)算模塊對于上ii^語言檢索請求的上述多個(gè) 目標(biāo)語言譯文中的每一個(gè),將由上述譯文質(zhì)量評測模塊為生成該目標(biāo)語言 譯文的機(jī)器翻譯模塊所評測的譯文質(zhì)量得分與由上述譯文可信度計(jì)算模塊 為該目標(biāo)語言譯文所計(jì)算的可信度相乘,以得到該目標(biāo)語言譯文的翻譯可 信度。
17. 如權(quán)利要求15或16所述的跨語言檢索請求的轉(zhuǎn)換裝置,其中上 述權(quán)值計(jì)算模塊根據(jù)下述算法計(jì)算上述檢索詞列表中的各檢索詞的權(quán)值其中 <formula>formula see original document page 5</formula> 其中,K,為跨語言檢索請求《中的檢索詞/的權(quán)值;T^,為檢索詞,'在跨 語言檢索請求《中的加權(quán)詞頻;/z巧為檢索詞/的反向文檔頻率;D為文檔 總數(shù);4為包含檢索詞/的文檔數(shù);/^,,為檢索詞/在跨語言檢索請求《 的目標(biāo)語言譯文f中出現(xiàn)的次數(shù);rc,為跨語言檢索請求《的目標(biāo)語言譯文 f的翻譯可信度。
18. —種跨語言信息檢索系統(tǒng),包括用戶模塊,其*索用戶處獲得冷浯言檢索請求,并向檢索用戶呈現(xiàn) 該跨語言信息檢索系統(tǒng)的檢索結(jié)果;權(quán)利要求13-17中任意一項(xiàng)所述的跨語言檢索請求的轉(zhuǎn)換裝置,其對 上^語言檢索請求進(jìn)行從源語言到目標(biāo)語言的轉(zhuǎn)換,以生成與該跨語言 檢索請求對應(yīng)的目標(biāo)語言檢索請求;以及檢索模塊,其根據(jù)上述目標(biāo)語言檢索請求從信息源檢索滿足條件的目 標(biāo)語言文檔。
全文摘要
本發(fā)明提供一種跨語言檢索請求的轉(zhuǎn)換方法和裝置以及跨語言信息檢索方法和系統(tǒng)。該跨語言檢索請求的轉(zhuǎn)換方法包括利用多個(gè)不同的機(jī)器翻譯系統(tǒng)分別對上述跨語言檢索請求進(jìn)行從源語言到目標(biāo)語言的翻譯,以得到該跨語言檢索請求的多個(gè)目標(biāo)語言譯文;以及以上述跨語言檢索請求的上述多個(gè)目標(biāo)語言譯文為基礎(chǔ),構(gòu)造與該跨語言檢索請求對應(yīng)的目標(biāo)語言檢索請求。本發(fā)明通過融合多個(gè)機(jī)器翻譯系統(tǒng)所生成的跨語言檢索請求的譯文來構(gòu)造目標(biāo)語言檢索請求,從而提高跨語言信息檢索系統(tǒng)的檢索性能。
文檔編號G06F17/28GK101271461SQ20071008911
公開日2008年9月24日 申請日期2007年3月19日 優(yōu)先權(quán)日2007年3月19日
發(fā)明者江 朱, 王海峰 申請人:株式會社東芝
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
班戈县| 蓬溪县| 乌鲁木齐县| 青州市| 陵川县| 九寨沟县| 广宁县| 潼关县| 惠安县| 大关县| 泽库县| 历史| 星子县| 南木林县| 仙居县| 江都市| 石台县| 四子王旗| 崇文区| 五台县| 上高县| 鹿邑县| 宜丰县| 蓝山县| 六盘水市| 潜江市| 抚顺县| 东乌| 安宁市| 宣城市| 息烽县| 古交市| 奉节县| 深州市| 博罗县| 眉山市| 微山县| 吴忠市| 黔江区| 吉安县| 嘉义县|