两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

獲取限制詞信息的方法、優(yōu)化輸出的方法和輸入法系統(tǒng)的制作方法

文檔序號:6608805閱讀:294來源:國知局
專利名稱:獲取限制詞信息的方法、優(yōu)化輸出的方法和輸入法系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及計算機字符輸入數(shù)據(jù)處理領(lǐng)域,特別是涉及一種獲取限制詞信息的方法和裝置、一種更新輸入法詞庫的方法、一種優(yōu)化輸出的方法以及一種輸入法系統(tǒng)。
背景技術(shù)
隨著計算機技術(shù)以及互聯(lián)網(wǎng)技術(shù)的普及與發(fā)展,不同專業(yè)領(lǐng)域、不同興趣以及使用習(xí)慣的用戶對于輸入法系統(tǒng)的智能性要求越來越高。
在現(xiàn)有技術(shù)中,已經(jīng)出現(xiàn)了利用龐雜的互聯(lián)網(wǎng)語料庫統(tǒng)計、篩選得到輸入法詞庫的技術(shù)。所得到的互聯(lián)網(wǎng)詞庫中可以包含很多通過之前的封閉語料信息(如現(xiàn)代漢語詞典、新聞、報紙等)所無法得到的新詞,從而可以大大提高人們的輸入效率。但是,正是由于互聯(lián)網(wǎng)語料庫的復(fù)雜性,使得從中通過詞頻統(tǒng)計篩選得到的一些詞,具有語言學(xué)或者使用輸入習(xí)慣上的一些缺陷。
例如,對于用戶輸入的拼音編碼字符串“l(fā)iangjiang”,一般可獲得的候選項包括“兩江”、“良將”等,具有互聯(lián)網(wǎng)詞庫的候選項還可能包括“量將”,因為“量將”這個詞在互聯(lián)網(wǎng)網(wǎng)頁中的出現(xiàn)頻率還是相當(dāng)高的,但是其一般都出現(xiàn)在句子中多個詞的連接處(用于表達(dá)鏈接關(guān)系),例如,“旅客量將超過”。將“量將”這個詞收入輸入法詞庫中,固然可以增加輸入法的智能性(達(dá)到較高的智能組詞效果),但是卻由于“量將”一詞在單獨成詞的情況下很少出現(xiàn),從而也有可能給用戶輸入造成麻煩,增加用戶需要選擇的候選項數(shù)量,降低輸入效率。
因此,迫切需要本領(lǐng)域技術(shù)人員解決的一個技術(shù)問題就是如何找出這樣的具有語言學(xué)或者使用習(xí)慣上缺陷的詞,并在輸入過程中加以限制。

發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是提供一種獲取限制詞信息的方法和裝置,能夠從大量的詞匯中找出具有語言學(xué)或者使用習(xí)慣上缺陷的詞,從而提高用戶的輸入體驗。
本發(fā)明另一個目的是提供一種更新輸入法詞庫的方法、一種優(yōu)化輸出的方法以及一種輸入法系統(tǒng),能夠?qū)崿F(xiàn)在實際輸入過程中對某些詞在某些情況下加以限制,從而可以實現(xiàn)在不增加用戶操作的前提下,達(dá)到提高輸入法智能性的目的。
為了解決上述技術(shù)問題,本發(fā)明公開了一種獲取限制詞信息的方法,具體可以包括獲取一目標(biāo)詞;獲取該目標(biāo)詞相應(yīng)的特征信息;判斷所述特征信息或其相應(yīng)的計算結(jié)果是否符合預(yù)置條件,如果符合,則確定該目標(biāo)詞為限制詞并記錄相關(guān)限制信息,所述限制信息用于限制該詞單獨輸出時的排序。
其中,優(yōu)選的,所述特征信息為該目標(biāo)詞中位于詞首的單字在預(yù)設(shè)語料庫內(nèi)作為詞首的特征值,以及該目標(biāo)詞中位于詞尾的單字在預(yù)設(shè)語料庫內(nèi)作為詞尾的特征值;所述用于判斷的預(yù)置條件為上述特征值中是否存在至少一個特征值是否屬于預(yù)置范圍。
或者,優(yōu)選的,所述特征信息為該目標(biāo)詞中所包含的各個單字詞和/或多字詞的語言學(xué)搭配關(guān)系在預(yù)設(shè)語料庫內(nèi)的特征值;所述用于判斷的預(yù)置條件為上述特征值中是否存在至少一個特征值屬于預(yù)置范圍。
或者,優(yōu)選的,所述特征信息為該目標(biāo)詞在輸入法應(yīng)用中用戶單獨輸入的特征值;所述用于判斷的預(yù)置條件為該特征值是否屬于預(yù)置范圍。
或者,優(yōu)選的,所述特征信息包括該目標(biāo)詞中位于詞首的單字在預(yù)設(shè)語料庫內(nèi)作為詞首的特征值;該目標(biāo)詞中位于詞尾的單字在預(yù)設(shè)語料庫內(nèi)作為詞尾的特征值;以及該目標(biāo)詞的通用詞頻;所述用于判斷的預(yù)置條件為上述特征值中至少一個特征值與該目標(biāo)詞通用詞頻的比值是否屬于預(yù)置范圍。
或者,優(yōu)選的,所述特征信息包括該目標(biāo)詞中所包含的各個單字詞和/或多字詞的語言學(xué)搭配關(guān)系在預(yù)設(shè)語料庫內(nèi)的特征值;以及該目標(biāo)詞的通用詞頻;所述用于判斷的預(yù)置條件為上述特征值中至少一個特征值與該目標(biāo)詞通用詞頻的比值是否屬于預(yù)置范圍。
或者,優(yōu)選的,所述特征信息為該目標(biāo)詞在輸入法應(yīng)用中用戶單獨輸入的特征值;以及該目標(biāo)詞的通用詞頻;所述用于判斷的預(yù)置條件為該特征值與該目標(biāo)詞通用詞頻的比值是否屬于預(yù)置范圍。
或者,優(yōu)選的,所述特征信息為該目標(biāo)詞在針對同一輸入編碼的各候選詞中的用戶排序位置信息;以及該目標(biāo)詞的原始排序位置信息;其中,所述用戶排序信息與該目標(biāo)詞在輸入法應(yīng)用中用戶單獨輸入的特征值相關(guān);所述原始排序信息與該目標(biāo)詞的通用詞頻相關(guān);所述用于判斷的預(yù)置條件為所述用戶排序位置信息與所述原始排序位置信息的差值是否屬于預(yù)置范圍。
進一步,在特征信息獲取步驟之前還可以包括對目標(biāo)詞的優(yōu)化步驟。
優(yōu)選的,所述限制信息包括該限制詞在各預(yù)設(shè)場景下的限制單獨輸出的權(quán)重。進一步,所述限制信息還可以包括該限制詞在預(yù)設(shè)語料庫中的語言學(xué)搭配參數(shù);所述語言學(xué)搭配參數(shù)用于限制該詞在智能組詞輸出時的排序。
優(yōu)選的,所述方法還可以包括生成一詞庫或詞表,所述詞庫或詞表包括所述限制詞及其相關(guān)限制信息;或者,生成一詞庫,所述詞庫包括所述限制詞及其相關(guān)限制信息,以及通用字詞。
依據(jù)本發(fā)明的另一實施例,公開了一種獲取限制詞信息的方法,具體可以包括獲取一目標(biāo)詞;獲取該目標(biāo)詞在預(yù)設(shè)語料庫中的語言學(xué)搭配參數(shù);判斷所述語言學(xué)搭配參數(shù)是否符合預(yù)置條件,如果符合,則記錄該目標(biāo)詞的限制信息,所述限制信息包括相應(yīng)的語言學(xué)搭配參數(shù),所述限制信息用于限制該詞智能組詞輸出時的排序。
其中,優(yōu)選的,所述語言學(xué)搭配參數(shù)為一通用參數(shù);或者,所述語言學(xué)搭配參數(shù)包括針對各預(yù)設(shè)場景的分參數(shù)。
依據(jù)本發(fā)明的另一實施例,還公開了一種更新詞庫的方法,包括獲取一目標(biāo)詞;獲取該目標(biāo)詞相應(yīng)的特征信息;判斷所述特征信息或其相應(yīng)的計算結(jié)果是否符合預(yù)置條件,如果符合,則確定該目標(biāo)詞為限制詞并記錄相關(guān)限制信息,所述限制信息用于限制該詞單獨輸出時的排序,和/或,用于限制該詞智能組詞輸出時的排序;將所述限制詞及其相關(guān)限制信息添加至輸入法現(xiàn)有詞庫中。
優(yōu)選的,所述添加可以為判斷該限制詞是否在所述原始詞庫中已存在,如果已存在,則僅記錄其相關(guān)限制信息至所述輸入法現(xiàn)有詞庫中;或者,所述添加還可以為直接將所述限制詞及其相關(guān)限制信息記錄至所述輸入法現(xiàn)有詞庫中,如果詞條重復(fù),則覆蓋原始詞條;或者,所述添加還可以為將所述限制詞及其相關(guān)限制信息存儲為一限制詞表,所述限制詞表和輸入法現(xiàn)有詞庫用于協(xié)作完成候選項排序。
進一步,所述限制詞具有在各預(yù)設(shè)場景下的限制信息。
依據(jù)本發(fā)明的另一實施例,還公開了一種獲取限制詞信息的裝置,具體可以包括目標(biāo)詞獲取單元,用于獲取一目標(biāo)詞;特征信息獲取單元,用于獲取該目標(biāo)詞相應(yīng)的特征信息;限制信息獲取單元,用于判斷所述特征信息或其相應(yīng)的計算結(jié)果是否符合預(yù)置條件,如果符合,則確定該目標(biāo)詞為限制詞并記錄相關(guān)限制信息,所述限制信息用于限制該詞單獨輸出時的排序,和/或,用于限制該詞智能組詞輸出時的排序。
依據(jù)本發(fā)明的另一實施例,還公開了一種優(yōu)化輸出的方法,包括接收用戶輸入信息,并對所述輸入信息進行轉(zhuǎn)換;獲得輸出侯選項;判斷一輸出候選項是否符合應(yīng)用限制信息的預(yù)置條件;如果是,則提取該輸出候選項相應(yīng)的限制信息,并根據(jù)所述限制信息對各候選項進行排序。
優(yōu)選的,所述應(yīng)用限制信息的預(yù)置條件為所述輸出侯選項是否為單獨輸出的詞;或者,所述應(yīng)用限制信息的預(yù)置條件為所述輸出侯選項是否屬于智能組詞情形。
優(yōu)選的,可以通過以下步驟獲取所述的限制信息獲取一目標(biāo)詞;獲取該目標(biāo)詞相應(yīng)的特征信息;判斷所述特征信息或其相應(yīng)的計算結(jié)果是否符合預(yù)置條件,如果符合,則針對該目標(biāo)詞記錄相關(guān)限制信息。
進一步,當(dāng)需要判斷所述輸出侯選項是否為單獨輸出的詞時,可以通過以下步驟完成判斷一輸出候選項是否只包含一個元素,并且長度大于1個輸出字符;所述元素為預(yù)置詞庫中存儲的字詞;如果是,則確定該輸出候選項為單獨輸出的詞。
依據(jù)本發(fā)明的另一實施例,還公開了一種輸入法系統(tǒng),包括輸入接口單元和顯示單元,所述輸入法系統(tǒng)還可以包括詞庫所述詞庫包括限制信息;候選項獲取單元用于根據(jù)用戶的輸入信息獲得輸出侯選項;判斷單元,用于判斷一輸出候選項是否符合應(yīng)用限制信息的預(yù)置條件;候選項排序單元,用于當(dāng)符合預(yù)置條件時,提取該輸出候選項相應(yīng)的限制信息,并根據(jù)所述限制信息對各候選項進行排序。
優(yōu)選的,所述應(yīng)用限制信息的預(yù)置條件為所述輸出侯選項是否為單獨輸出的詞;或者,所述應(yīng)用限制信息的預(yù)置條件為所述輸出侯選項是否屬于智能組詞情形。
優(yōu)選的,所述判斷單元進一步可以包括用于判斷一輸出候選項是否只包含一個元素的子單元;其中,所述元素為預(yù)置詞庫中存儲的字詞;以及,用于判斷該輸出候選項的長度是否大于1個輸出字符的子單元;以及,用于當(dāng)該輸出候選項符合上述兩個判斷條件時,確定其為單獨輸出的詞的子單元。
優(yōu)選的,所述輸入法系統(tǒng)的輸入接口單元、顯示單元以及詞庫位于同一計算設(shè)備中;或者,所述輸入法系統(tǒng)的輸入接口單元、顯示單元位于第一計算設(shè)備中,詞庫位于第二計算設(shè)備中,所述輸入法系統(tǒng)根據(jù)用戶輸入的信息,從位于第二計算設(shè)備中獲取相應(yīng)信息,在第一計算設(shè)備顯示相應(yīng)字詞。
與現(xiàn)有技術(shù)相比,本發(fā)明實施例具有以下優(yōu)點本發(fā)明實施例通過預(yù)置包括限制詞信息的輸入法詞庫,在用戶進行輸入時,判斷輸出候選項是否符合應(yīng)用限制信息的預(yù)置條件,進而依據(jù)是否符合的結(jié)果,控制具有限制詞信息的候選項的是否顯示和輸出,從而使用戶在不增加操作的前提下,可以獲得更有效地輸出(例如,在實際中,使限制詞“量將”在被單獨輸出時不顯示在候選項中,而在其它情況下參與組詞),極大地優(yōu)化了輸入法系統(tǒng)的字符輸出過程,提高了輸入法系統(tǒng)的智能性。


圖1是本發(fā)明一種獲取限制詞信息的方法實施例1的步驟流程圖;圖2是本發(fā)明一種獲取限制詞信息的方法實施例2的步驟流程圖;圖3是本發(fā)明一種更新輸入法詞庫的方法實施例的步驟流程圖;圖4是本發(fā)明一種獲取限制詞信息的裝置實施例的結(jié)構(gòu)框圖;圖5是本發(fā)明一種優(yōu)化輸出的方法實施例的步驟流程圖;圖6是一種拼音網(wǎng)絡(luò)切分方法的詞網(wǎng)格示意圖;圖7是一種輸入法系統(tǒng)實施例的結(jié)構(gòu)框圖。
具體實施例方式
為使本發(fā)明的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結(jié)合附圖和具體實施方式
對本發(fā)明作進一步詳細(xì)的說明。
參照圖1,示出了一種獲取限制詞信息的方法實施例1,具體可以包括步驟101、獲取一目標(biāo)詞;所述獲取目標(biāo)詞的過程可以從互聯(lián)網(wǎng)得到,即直接從互聯(lián)網(wǎng)語料庫(例如,互聯(lián)網(wǎng)網(wǎng)頁集合或者搜索關(guān)鍵詞集合等)中經(jīng)過統(tǒng)計、篩選獲得,也可以從現(xiàn)有詞庫得到,本發(fā)明對此并不需要加以限制,只要能夠獲得一個目標(biāo)詞集合即可;至于該集合的范圍大小,本領(lǐng)域技術(shù)人員根據(jù)實際需要設(shè)定即可。
優(yōu)選的,對于所獲得的這個目標(biāo)詞集合,還可以包括一優(yōu)化步驟,采用目標(biāo)詞的一些屬性去除一些詞匯,以進一步縮小范圍。例如,從該集合中去除互聯(lián)網(wǎng)詞頻或者詞庫詞頻小于等于預(yù)設(shè)閾值的詞;從該集合中去除能夠確定不屬于限制詞的詞(例如字典中的通用詞匯)等等。當(dāng)然,所述的這個優(yōu)化步驟,也完全可以在獲取目標(biāo)詞集合的過程中完成。
步驟102、獲取該目標(biāo)詞相應(yīng)的特征信息;步驟103、判斷所述特征信息或其相應(yīng)的計算結(jié)果是否符合預(yù)置條件,如果符合,則確定該目標(biāo)詞為限制詞并記錄相關(guān)限制信息,所述限制信息用于限制該詞單獨輸出時的排序。例如,對于限制詞“量將”、“上一”等,在單獨輸出時不出現(xiàn)在候選項中,但是在與其他字詞智能組詞輸出時沒有限制。具體的例子當(dāng)輸入“l(fā)iangjiang”,依據(jù)詞頻信息的預(yù)輸出的第一條為“量將”,但是由于其具有限制信息標(biāo)記,則從候選項中去除;當(dāng)輸入“l(fā)vkeliangjiangchaoguo”,則輸出“旅客量將超過”,此時“量將”這個詞不需要被限制輸出。
本實施例得到的限制詞及其限制信息可以直接存儲至一獨立詞庫(或詞表)中,例如,生成一詞庫(或詞表),所述詞庫包括所述限制詞及其相關(guān)限制信息;也可以與通用字詞一起生成一輸入法詞庫,例如,生成一詞庫,所述詞庫包括所述限制詞及其相關(guān)限制信息,以及通用字詞;還可以直接將其添加至輸入法現(xiàn)有詞庫中。
所述限制信息可以為標(biāo)識(例如,在詞庫中的該限制詞打上標(biāo)記0或1),也可以具有數(shù)值(例如,從0到1的二位小數(shù)),用于對候選項的排序進行調(diào)整,當(dāng)然不顯示就是一種極端情況。所得到的限制詞及其限制信息根據(jù)實際需要,由用戶手動更改,或者服務(wù)器更新修改都是可行的。
本實施例中根據(jù)所獲得的特征信息的不同,相應(yīng)的判斷條件也會有所不同,下面舉出多個例子對步驟102和103進行說明。其中的預(yù)置語料庫可以為任何語料庫;所述特征值可以經(jīng)過統(tǒng)計得到,也可以根據(jù)經(jīng)驗或者現(xiàn)有知識直接得到;所述特征值可以為各種數(shù)值,例如概率或者頻率等。其中的判斷條件僅僅是舉例而已,本領(lǐng)域技術(shù)人員可以根據(jù)需要設(shè)定更為復(fù)雜的判斷條件,本發(fā)明對此不作限制。
例1所述特征信息為該目標(biāo)詞中位于詞首的單字在預(yù)設(shè)語料庫內(nèi)作為詞首的特征值,以及該目標(biāo)詞中位于詞尾的單字在預(yù)設(shè)語料庫內(nèi)作為詞尾的特征值;所述用于判斷的預(yù)置條件為上述特征值中是否存在至少一個特征值是否屬于預(yù)置范圍。
例如,對于“量將”中的單字“量”很少出現(xiàn)在詞首,如果其詞首出現(xiàn)頻率小于或等于預(yù)設(shè)閾值,則可以判定“量將”為限制詞。
當(dāng)然,對于目標(biāo)詞為三個或以上的字組成,則還有可能判斷位于詞中某個位置上的單字在預(yù)設(shè)語料庫內(nèi)處于詞中相同位置上的特征值。
例2所述特征信息為該目標(biāo)詞中所包含的各個單字詞和/或多字詞的語言學(xué)搭配關(guān)系在預(yù)設(shè)語料庫內(nèi)的特征值;所述用于判斷的預(yù)置條件為上述特征值中是否存在至少一個特征值屬于預(yù)置范圍。
所述的語言學(xué)搭配關(guān)系可以包括詞與詞的搭配參數(shù),詞與詞性的搭配參數(shù)、詞性與詞性的搭配參數(shù)等多種匹配關(guān)系。本領(lǐng)域技術(shù)人員可以根據(jù)實際需要選用或者組合應(yīng)用上述各種匹配關(guān)系。
例如,對于“是玩”一詞,“是”之后緊跟動詞,這樣的搭配關(guān)系在語言學(xué)上很少見的,所以可以得到其搭配特征值小于或等于預(yù)設(shè)閾值,則可以判定“是玩”為限制詞。
例3所述特征信息為該目標(biāo)詞在輸入法應(yīng)用中用戶單獨輸入的特征值;所述用于判斷的預(yù)置條件為該特征值是否屬于預(yù)置范圍。
所述的用戶單獨輸入可以為一個用戶的統(tǒng)計值,也可以為一個用戶群的統(tǒng)計平均值。所述用戶單獨輸入的特征值可以直接從用戶詞庫的記錄得到,還可以通過監(jiān)控用戶輸入行為得到。
例如,對于“是玩”一詞,用戶很少單獨輸入該詞,所以當(dāng)統(tǒng)計的特征值小于或等于預(yù)設(shè)閾值時,則可以判定“是玩”為限制詞。
下面的幾個例子中,為了進一步提高限制詞的判定準(zhǔn)確度,在判斷條件中引入了通用詞頻,所述通用詞頻可以為互聯(lián)網(wǎng)詞頻,也可以為詞庫詞頻。下面例子中與前述例子相似之處就不再贅述,具體請參見前述。
例4所述特征信息包括該目標(biāo)詞中位于詞首的單字在預(yù)設(shè)語料庫內(nèi)作為詞首的特征值;該目標(biāo)詞中位于詞尾的單字在預(yù)設(shè)語料庫內(nèi)作為詞尾的特征值;以及該目標(biāo)詞的通用詞頻;所述用于判斷的預(yù)置條件為上述特征值中至少一個特征值與該目標(biāo)詞通用詞頻的比值是否屬于預(yù)置范圍。
例5所述特征信息包括該目標(biāo)詞中所包含的各個單字詞和/或多字詞的語言學(xué)搭配關(guān)系在預(yù)設(shè)語料庫內(nèi)的特征值;以及該目標(biāo)詞的通用詞頻;所述用于判斷的預(yù)置條件為上述特征值中至少一個特征值與該目標(biāo)詞通用詞頻的比值是否屬于預(yù)置范圍。
例6所述特征信息為該目標(biāo)詞在針對同一輸入編碼的各候選詞中的用戶排序位置信息;以及該目標(biāo)詞的原始排序位置信息;其中,所述用戶排序信息與該目標(biāo)詞在輸入法應(yīng)用中用戶單獨輸入的特征值相關(guān);所述原始排序信息與該目標(biāo)詞的通用詞頻相關(guān);所述用于判斷的預(yù)置條件為所述用戶排序位置信息與所述原始排序位置信息的差值是否屬于預(yù)置范圍。
例7所述特征信息為該目標(biāo)詞在輸入法應(yīng)用中用戶單獨輸入的特征值;以及該目標(biāo)詞的通用詞頻;所述用于判斷的預(yù)置條件為該特征值與該目標(biāo)詞通用詞頻的比值是否屬于預(yù)置范圍。
具體描述例7的一種具體實現(xiàn)過程如下A、統(tǒng)計每個詞的通用詞頻f_web;B、在用戶群體的輸入記錄中統(tǒng)計每個詞被單獨輸入的頻率f_user;C、計算alpha=f_user/f_web,當(dāng)alpha遠(yuǎn)遠(yuǎn)小于正常水平的詞認(rèn)為是限制詞;D、或者,計算alpha=f_user/f_web,當(dāng)alpha遠(yuǎn)遠(yuǎn)小于正常水平且f_user很低的詞才認(rèn)為是限制詞。
其中,alpha為計算結(jié)果,f_web為字詞的通用詞頻信息,f_user為字詞的特征詞頻信息。
具體而言,可以對于所有的目標(biāo)詞匯,計算得到其對應(yīng)的alpha值,并按照alpha值從小到大排序。對于那些alpha值排在top的詞,如前5%,并且本身詞頻較高,如大于10000,則認(rèn)為它是限制詞。
需要說明的是,上述各個例子中的判斷條件還可以組合使用。總之,本領(lǐng)域技術(shù)人員可以根據(jù)需要設(shè)定各種各樣的判定方式,在此無法一一列舉。
優(yōu)選的,所述限制信息可以包括該限制詞在各預(yù)設(shè)場景下的限制單獨輸出的權(quán)重。即該限制詞可以具有不同應(yīng)用場景下的限制信息,并不僅僅具有一個通用的限制信息。例如,通過輸入法當(dāng)前程序確定用戶的應(yīng)用場景,當(dāng)用戶在word中輸入時,調(diào)用限制在該預(yù)設(shè)場景(例如,工作用語環(huán)境)下的限制信息值。
進一步,所述限制信息還可以包括該限制詞在預(yù)設(shè)語料庫中的語言學(xué)搭配參數(shù);所述語言學(xué)搭配參數(shù)用于限制該詞在智能組詞輸出時的排序。即對于某些限制詞,在單獨輸出時,需要加以限制,并且在其智能組詞輸出時,也需要加以限制。例如,對于“上一”一詞,在單獨輸出時需要加以限制,盡量不出現(xiàn)在候選項中,而對于“上一”和“里”智能組詞輸出時,也要依據(jù)搭配關(guān)系加以限制,盡量不出現(xiàn)在候選項中。
其中,所述限制信息可以包括該詞在預(yù)設(shè)語料庫中的所有的語言學(xué)搭配參數(shù)(例如,詞性搭配參數(shù)),也可以僅僅保存所需的搭配參數(shù)。例如,設(shè)置一限制輸出的閾值,如果某個搭配參數(shù)小于等于該閾值,則保存該搭配參數(shù)。
需要說明的是,所述預(yù)置語料信息可以為互聯(lián)網(wǎng)語料信息和/或用戶輸入記錄語料信息。其中,所述互聯(lián)網(wǎng)語料信息可以通過網(wǎng)絡(luò)spider從互聯(lián)網(wǎng)上抓取海量網(wǎng)頁獲得;所述用戶輸入記錄語料庫可以包括直接信息和間接信息,例如,用戶輸入的字符記錄等可作為直接信息,用戶輸入的字符分布統(tǒng)計等則可作為間接信息。當(dāng)然,所述預(yù)置語料信息也可以由本領(lǐng)域技術(shù)人員根據(jù)需要或經(jīng)驗進行設(shè)置,本發(fā)明對此不需要進行限定。
參照圖2,示出了一種獲取限制詞信息的方法實施例2,可以包括步驟201、獲取一目標(biāo)詞;步驟202、獲取該目標(biāo)詞在預(yù)設(shè)語料庫中的語言學(xué)搭配參數(shù);步驟203、判斷所述語言學(xué)搭配參數(shù)是否符合預(yù)置條件,如果符合,則記錄該目標(biāo)詞的限制信息,所述限制信息包括相應(yīng)的語言學(xué)搭配參數(shù),所述限制信息用于限制該詞智能組詞輸出時的排序。
例如,“上一”與方位詞的搭配參數(shù)值就很低,則如果一候選項為“上一”與方位詞的搭配,則在進行智能組詞時從候選項中將“上一”去除。
再例如,“講”與動詞的搭配參數(shù)小于預(yù)定閾值,則如果一候選項為“講”與動詞的搭配,則將“講”從智能組詞的序列中去除。
優(yōu)選的,所述語言學(xué)搭配參數(shù)可以為一通用參數(shù);或者,所述語言學(xué)搭配參數(shù)也可以包括針對各預(yù)設(shè)場景的分參數(shù)。所述的語言學(xué)搭配參數(shù),可以包括詞與詞的搭配參數(shù),詞與詞性的搭配參數(shù)、詞性與詞性的搭配參數(shù)等等。所述的語言學(xué)搭配參數(shù)所采用的表現(xiàn)數(shù)值可以為相鄰?fù)F(xiàn)頻率、同現(xiàn)概率或連接強度值等,這些數(shù)值可以從任一預(yù)置語料庫中統(tǒng)計得到,也可以依據(jù)現(xiàn)有經(jīng)驗或知識直接得到。
需要說明的是,通過上述篩選步驟,可以將符合條件的限制詞從智能組詞的序列中去除,從而減少了智能組詞時的搜索空間,提高智能組詞的效率。
參照圖3,示出了一種更新輸入法詞庫的方法實施例,具體可以包括步驟301、獲取一目標(biāo)詞;步驟302、獲取該目標(biāo)詞相應(yīng)的特征信息;步驟303、判斷所述特征信息或其相應(yīng)的計算結(jié)果是否符合預(yù)置條件,如果符合,則確定該目標(biāo)詞為限制詞并記錄相關(guān)限制信息,所述限制信息用于限制該詞單獨輸出時的排序,和/或,用于限制該詞智能組詞輸出時的排序;步驟304、將所述限制詞及其相關(guān)限制信息添加至輸入法現(xiàn)有詞庫中。
本實施例可以應(yīng)用于服務(wù)器端獲得了限制詞信息,然后將其及時更新至輸入法現(xiàn)有詞庫。所更新的限制可以包括前述兩個實施例所獲得的限制信息,即可以包括用于限制該詞單獨輸出時排序的信息,也可以包括用于限制該詞智能組詞輸出時排序的信息;二者可以單獨存在,也可以并存。所述限制信息包括該限制詞在各預(yù)設(shè)場景下的限制單獨輸出的權(quán)重。
當(dāng)然,也可以在服務(wù)器端將限制信息添加至詞庫后,然后將新詞庫進行發(fā)布更新。具體的更新傳輸方式在此就不詳述了。
步驟304中所述的添加可以為各種方式,例如,所述添加為判斷該限制詞是否在所述原始詞庫中已存在,如果已存在,則僅記錄其相關(guān)限制信息至所述輸入法現(xiàn)有詞庫中;或者,所述添加為直接將所述限制詞及其相關(guān)限制信息記錄至所述輸入法現(xiàn)有詞庫中,如果詞條重復(fù),則覆蓋原始詞條;或者,所述添加為將所述限制詞及其相關(guān)限制信息存儲為一限制詞表,所述限制詞表和輸入法現(xiàn)有詞庫用于協(xié)作完成候選項排序。
參照圖4,示出了一種獲取限制詞信息的裝置實施例,具體可以包括目標(biāo)詞獲取單元401,用于獲取一目標(biāo)詞;特征信息獲取單元402,用于獲取該目標(biāo)詞相應(yīng)的特征信息;限制信息獲取單元403,用于判斷所述特征信息或其相應(yīng)的計算結(jié)果是否符合預(yù)置條件,如果符合,則確定該目標(biāo)詞為限制詞并記錄相關(guān)限制信息,所述限制信息用于限制該詞單獨輸出時的排序,和/或,用于限制該詞智能組詞輸出時的排序。
參照圖5,示出了一種優(yōu)化輸出的方法實施例,具體可以包括步驟501、接收用戶輸入信息,并對所述輸入信息進行轉(zhuǎn)換;所述輸入信息可以包括編碼字符串,也可以包括手寫輸入信息以及語音輸入的信息,因為這些輸入方式也都需要用到詞庫進行候選項排序。即本發(fā)明可以應(yīng)用于各種輸入方式的輸入法平臺,包括鍵盤符號、手寫信息以及語音輸入等等。由于這些輸入方式中的信息轉(zhuǎn)換都屬于公知技術(shù),在此就不詳述了。
例如,當(dāng)用戶輸入時,輸入法系統(tǒng)會對用戶輸入的編碼字符串進行切分,以對拼音編碼字符串的切分為例,通常,對一個拼音編碼字符串進行切分,可以獲得多種切分方案,例如,對于拼音編碼字符串“fangan”,可以切分成“fang’an”,也可以切分成“fan’gan”等。當(dāng)然,所述切分的方法可以為現(xiàn)有技術(shù)中的任一方法,本發(fā)明對此不需要進行限定。
步驟502、獲得輸出侯選項;以一種拼音網(wǎng)絡(luò)切分法為例,根據(jù)所述切分后的編碼字符串獲得輸出侯選項的過程相當(dāng)于把輸入的連續(xù)拼音流自動轉(zhuǎn)換為相應(yīng)的文字流的過程。具體地說,所述過程為對于一個給定的連續(xù)拼音流A,按著某種拼音流切分算法可以切分為一個拼音序列A1A2…Am,其中每個拼音Ai對應(yīng)的一組同音字詞可以用一組列節(jié)點表示為Wi1Wi2…Wi3。那么對于拼音序列A1A2…Am,對應(yīng)的候選同音字詞可用m組列節(jié)點表示。顯然,一個拼音序列對應(yīng)的候選同音字詞組成了一個候選同音字詞矩陣。把相鄰的節(jié)點用有向邊連接起來,形成詞網(wǎng)格。詞網(wǎng)格構(gòu)成了漢字輸入問題的狀態(tài)空間。音字轉(zhuǎn)換問題演變?yōu)樵谠~網(wǎng)格中搜索一條最優(yōu)路徑問題。
例如,輸入一個拼音流“zheshiyizhipiaoliangdemao”,經(jīng)過拼音流切分生成″zhe’shi’yi’zhi’piaoliang’de’mao”拼音序列,該拼音序列對應(yīng)的詞網(wǎng)格為圖6所示。
然后,查詢系統(tǒng)的語言規(guī)則庫,進行規(guī)則匹配,遞歸地把所有可以匹配某一條語言規(guī)則的相鄰列的節(jié)點捆綁成語言元素節(jié)點,形成元素網(wǎng)格。該元素網(wǎng)格構(gòu)成了音字轉(zhuǎn)換的新的狀態(tài)空間。通過使用Viterbi動態(tài)規(guī)劃算法,把系統(tǒng)的Bigram統(tǒng)計庫和Bigram學(xué)習(xí)庫的概率值通過加權(quán)結(jié)合起來,計算元素網(wǎng)格中所有的字詞中候選字詞的概率,選擇其中具有最大概率的字詞候選作為音字轉(zhuǎn)換結(jié)果輸出。
當(dāng)然,本領(lǐng)域技術(shù)人員采用任一種獲得所述輸出候選項的方法都是可行的,本發(fā)明對此不需要進行限定。
步驟503、判斷是否符合應(yīng)用限制信息的預(yù)置條件;步驟504、如果是,則提取輸出候選項相應(yīng)的限制信息,并根據(jù)所述限制信息對各候選項進行排序。
根據(jù)所述限制信息對各候選項進行排序可以通過直接設(shè)定展現(xiàn)位置或者順序的方式實現(xiàn),也可以通過修正詞頻(包括但不限于加權(quán)、降權(quán))的方式實現(xiàn);其中,最極端的就是從候選項中去除而不顯示。
當(dāng)某個詞具有限制單獨輸出的限制信息時,所述應(yīng)用限制信息的預(yù)置條件為所述輸出侯選項是否為單獨輸出的詞;而所述的限制信息則可以通過以下步驟獲取所述的限制信息獲取一目標(biāo)詞;獲取該目標(biāo)詞相應(yīng)的特征信息;判斷所述特征信息或其相應(yīng)的計算結(jié)果是否符合預(yù)置條件,如果符合,則針對該目標(biāo)詞記錄相關(guān)限制信息。
當(dāng)某個詞具有限制組詞輸出的限制信息時,所述應(yīng)用限制信息的預(yù)置條件為所述輸出侯選項是否屬于智能組詞情形,而所述的限制信息則可以通過以下步驟獲取獲取一目標(biāo)詞;獲取該目標(biāo)詞在預(yù)設(shè)語料庫中的語言學(xué)搭配參數(shù);判斷所述語言學(xué)搭配參數(shù)是否符合預(yù)置條件,如果符合,則記錄該目標(biāo)詞的限制信息,所述限制信息包括相應(yīng)的語言學(xué)搭配參數(shù),所述限制信息用于限制該詞智能組詞輸出時的排序。
優(yōu)選的,當(dāng)需要判斷所述輸出侯選項是否為單獨輸出的詞時,可以通過以下步驟完成針對用戶輸入的編碼字符串,首先獲得所有可能的輸出候選項;然后,判斷一輸出候選項是否只包含一個元素,并且長度大于1個輸出字符;所述元素為預(yù)置詞庫中存儲的字詞;如果是,則確定該輸出候選項為單獨輸出的詞。對于是否包含一個元素的判斷,可以通過ID映射的方式從詞庫中查詢獲得,或者通過判斷所包含元素ID的個數(shù),即可確定所述輸出候選項是否只包含一個元素。
所述1個輸出字符可以為不同輸入法系統(tǒng)中不同字節(jié)長度或其它長度的字符,例如,對于中文、日文或韓文輸入法來說,所述1個輸出字符為包含2個字節(jié)的字;對于所述長度的判斷,可以通過讀取詞庫中預(yù)置的長度參數(shù)來判斷,所述長度參數(shù)可以針對所述字詞ID存儲在相應(yīng)詞條的屬性中;或者,通過直接獲取所述輸出候選項的長度來判斷,以及采用現(xiàn)有技術(shù)中的其它方法都是可行的,本發(fā)明對此不作限制。
例如,對于用戶輸入編碼字符串“l(fā)iangjiangzong”的情況而言,針對該編碼字符串做完拼音網(wǎng)絡(luò)切分之后,得到的各個可能的候選項為兩江總、量將、兩江、良將等等。其中,假設(shè)每個候選項可以表示為<詞條1,屬性1>、<詞條2,屬性2>……;或者,<詞條1的ID,屬性1>、<詞條2的ID,屬性2>。
比如,對于候選項“兩江總”,就可以表示為<兩江p1>、<總p2>;對于候選項“量將”,就可以表示為<量將q1>;而對于<量將q1>而言,其僅包含一個元素,并且大于1個輸出字符;繼續(xù)判斷其屬性q1是否包含限制信息標(biāo)記,由于其具有限制信息標(biāo)記(例如,tag非0),所以該候選項不輸出。所述屬性q1中還可以包括長度參數(shù)。
即最終輸出的候選項為兩江總、兩江、良將。
對于一般情況而言,一個候選項不是單獨輸出,則就是屬于組詞輸出,所以上述過程也可以用于智能組詞情況的判斷。
當(dāng)然,對于當(dāng)用戶僅僅輸入了兩個音節(jié)的時候,可以不用經(jīng)過上述判斷過程,直接判定為單獨輸出,因為兩個音節(jié)一般不會是智能組詞的情況。即所述判斷是否為單獨輸出的方法可以包括現(xiàn)有技術(shù)中的任一種方法,例如,對于用戶輸入的不需要進行切分的編碼字符串,判定獲得的輸出候選項為單獨輸出的詞;或者,對于用戶輸入的編碼字符串對應(yīng)于詞庫中單個詞條的輸出候選項,確定為單獨輸出的詞。
參照圖7,示出了一種輸入法系統(tǒng)實施例,具體可以包括輸入接口單元701和顯示單元702,以及詞庫703所述詞庫包括限制信息;其中所述限制信息可以為前述的各種限制信息;所述限制信息的存在方式也可以各種各樣,例如,以詞表的方式存在于詞庫中,或者通過對詞庫中的相應(yīng)詞條打標(biāo)記的方式實現(xiàn)。
候選項獲取單元704用于根據(jù)用戶的輸入信息獲得輸出侯選項;判斷單元705,用于判斷一輸出候選項是否符合應(yīng)用限制信息的預(yù)置條件;候選項排序單元706,用于當(dāng)符合預(yù)置條件時,提取該輸出候選項相應(yīng)的限制信息,并根據(jù)所述限制信息對各候選項進行排序。
所述的詞庫703可以包括詞條信息和限制詞信息,即可以在現(xiàn)有詞庫中對于符合預(yù)置條件的詞記錄限制詞信息。另一種優(yōu)選的情況為,所述詞庫703為包括基礎(chǔ)詞庫和限制詞表,所述限制詞表為記錄具有限制詞信息的詞表。在這種情況下,可以將符合預(yù)置條件的單詞及相應(yīng)的限制信息獨立存儲為一張限制詞表,該限制詞表和基礎(chǔ)詞庫即組成本實施例中的輸入法詞庫。當(dāng)然,本領(lǐng)域技術(shù)人員采用現(xiàn)有技術(shù)中的其它方法預(yù)置輸入法詞庫也是可行的,本發(fā)明對此不作限制。
優(yōu)選的,當(dāng)某個詞具有限制單獨輸出的限制信息時,所述應(yīng)用限制信息的預(yù)置條件為所述輸出侯選項是否為單獨輸出的詞;則所述判斷單元進一步可以包括用于判斷一輸出候選項是否只包含一個元素的子單元;其中,所述元素為預(yù)置詞庫中存儲的字詞;以及,用于判斷該輸出候選項的長度是否大于1個輸出字符的子單元;以及,用于當(dāng)該輸出候選項符合上述兩個判斷條件時,確定其為單獨輸出的詞的子單元。
當(dāng)某個詞具有限制組詞輸出的限制信息時,所述應(yīng)用限制信息的預(yù)置條件為所述輸出侯選項是否屬于智能組詞情形。其判定方式也可以采用前述方法,如果不符合判斷條件,則屬于智能組詞情形。
上述輸入法系統(tǒng)可以為普通輸入法系統(tǒng),例如,所述輸入法系統(tǒng)的輸入接口單元、顯示單元以及詞庫位于同一計算設(shè)備中;上述輸入法系統(tǒng)可以為網(wǎng)絡(luò)輸入法系統(tǒng),例如,所述輸入法系統(tǒng)的輸入接口單元、顯示單元位于第一計算設(shè)備中,詞庫位于第二計算設(shè)備中,所述輸入法系統(tǒng)根據(jù)用戶輸入的信息,從位于第二計算設(shè)備中獲取相應(yīng)信息,在第一計算設(shè)備顯示相應(yīng)字詞。
由于前述的各個實施例都是基于本發(fā)明同一構(gòu)思的,所以互相著重描述的是區(qū)別之處,相似之處可以參見本說明書相應(yīng)部分。
以上對本發(fā)明所提供的一種獲取限制詞信息的方法和裝置、一種更新詞庫的方法、一種優(yōu)化輸出的方法和一種輸入法系統(tǒng)進行了詳細(xì)介紹,本文中應(yīng)用了具體個例對本發(fā)明的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實施方式
及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。
權(quán)利要求
1.一種獲取限制詞信息的方法,其特征在于,包括獲取一目標(biāo)詞;獲取該目標(biāo)詞相應(yīng)的特征信息;判斷所述特征信息或其相應(yīng)的計算結(jié)果是否符合預(yù)置條件,如果符合,則確定該目標(biāo)詞為限制詞并記錄相關(guān)限制信息,所述限制信息用于限制該詞單獨輸出時的排序。
2.如權(quán)利要求1所述的方法,其特征在于,所述特征信息為該目標(biāo)詞中位于詞首的單字在預(yù)設(shè)語料庫內(nèi)作為詞首的特征值,以及該目標(biāo)詞中位于詞尾的單字在預(yù)設(shè)語料庫內(nèi)作為詞尾的特征值;所述用于判斷的預(yù)置條件為上述特征值中是否存在至少一個特征值是否屬于預(yù)置范圍。
3.如權(quán)利要求1所述的方法,其特征在于,所述特征信息為該目標(biāo)詞中所包含的各個單字詞和/或多字詞的語言學(xué)搭配關(guān)系在預(yù)設(shè)語料庫內(nèi)的特征值;所述用于判斷的預(yù)置條件為上述特征值中是否存在至少一個特征值屬于預(yù)置范圍。
4.如權(quán)利要求1所述的方法,其特征在于,所述特征信息為該目標(biāo)詞在輸入法應(yīng)用中用戶單獨輸入的特征值;所述用于判斷的預(yù)置條件為該特征值是否屬于預(yù)置范圍。
5.如權(quán)利要求1所述的方法,其特征在于,所述特征信息包括該目標(biāo)詞中位于詞首的單字在預(yù)設(shè)語料庫內(nèi)作為詞首的特征值;該目標(biāo)詞中位于詞尾的單字在預(yù)設(shè)語料庫內(nèi)作為詞尾的特征值;以及該目標(biāo)詞的通用詞頻;所述用于判斷的預(yù)置條件為上述特征值中至少一個特征值與該目標(biāo)詞通用詞頻的比值是否屬于預(yù)置范圍。
6.如權(quán)利要求1所述的方法,其特征在于,所述特征信息包括該目標(biāo)詞中所包含的各個單字詞和/或多字詞的語言學(xué)搭配關(guān)系在預(yù)設(shè)語料庫內(nèi)的特征值;以及該目標(biāo)詞的通用詞頻;所述用于判斷的預(yù)置條件為上述特征值中至少一個特征值與該目標(biāo)詞通用詞頻的比值是否屬于預(yù)置范圍。
7.如權(quán)利要求1所述的方法,其特征在于,所述特征信息為該目標(biāo)詞在輸入法應(yīng)用中用戶單獨輸入的特征值;以及該目標(biāo)詞的通用詞頻;所述用于判斷的預(yù)置條件為該特征值與該目標(biāo)詞通用詞頻的比值是否屬于預(yù)置范圍。
8.如權(quán)利要求1所述的方法,其特征在于,所述特征信息為該目標(biāo)詞在針對同一輸入編碼的各候選詞中的用戶排序位置信息;以及該目標(biāo)詞的原始排序位置信息;其中,所述用戶排序信息與該目標(biāo)詞在輸入法應(yīng)用中用戶單獨輸入的特征值相關(guān);所述原始排序信息與該目標(biāo)詞的通用詞頻相關(guān);所述用于判斷的預(yù)置條件為所述用戶排序位置信息與所述原始排序位置信息的差值是否屬于預(yù)置范圍。
9.如權(quán)利要求1-8所述的任一方法,其特征在于,在特征信息獲取步驟之前還包括對目標(biāo)詞的優(yōu)化步驟。
10.如權(quán)利要求1-8所述的任一方法,其特征在于,所述限制信息包括該限制詞在各預(yù)設(shè)場景下的限制單獨輸出的權(quán)重。
11.如權(quán)利要求1-8所述的任一方法,其特征在于,所述限制信息還包括該限制詞在預(yù)設(shè)語料庫中的語言學(xué)搭配參數(shù);所述語言學(xué)搭配參數(shù)用于限制該詞在智能組詞輸出時的排序。
12.如權(quán)利要求1-8所述的任一方法,其特征在于,還包括生成一詞庫或詞表,所述詞庫或詞表包括所述限制詞及其相關(guān)限制信息;或者,生成一詞庫,所述詞庫包括所述限制詞及其相關(guān)限制信息,以及通用字詞。
13.一種獲取限制詞信息的方法,其特征在于,包括獲取一目標(biāo)詞;獲取該目標(biāo)詞在預(yù)設(shè)語料庫中的語言學(xué)搭配參數(shù);判斷所述語言學(xué)搭配參數(shù)是否符合預(yù)置條件,如果符合,則記錄該目標(biāo)詞的限制信息,所述限制信息包括相應(yīng)的語言學(xué)搭配參數(shù),所述限制信息用于限制該詞智能組詞輸出時的排序。
14.如權(quán)利要求13所述的方法,其特征在于所述語言學(xué)搭配參數(shù)為一通用參數(shù);或者,所述語言學(xué)搭配參數(shù)包括針對各預(yù)設(shè)場景的分參數(shù)。
15.一種更新詞庫的方法,其特征在于,包括獲取一目標(biāo)詞;獲取該目標(biāo)詞相應(yīng)的特征信息;判斷所述特征信息或其相應(yīng)的計算結(jié)果是否符合預(yù)置條件,如果符合,則確定該目標(biāo)詞為限制詞并記錄相關(guān)限制信息,所述限制信息用于限制該詞單獨輸出時的排序,和/或,用于限制該詞智能組詞輸出時的排序;將所述限制詞及其相關(guān)限制信息添加至輸入法現(xiàn)有詞庫中。
16.如權(quán)利要求15所述的方法,其特征在于,所述添加為判斷該限制詞是否在所述原始詞庫中已存在,如果已存在,則僅記錄其相關(guān)限制信息至所述輸入法現(xiàn)有詞庫中;或者,所述添加為直接將所述限制詞及其相關(guān)限制信息記錄至所述輸入法現(xiàn)有詞庫中,如果詞條重復(fù),則覆蓋原始詞條;或者,所述添加為將所述限制詞及其相關(guān)限制信息存儲為一限制詞表,所述限制詞表和輸入法現(xiàn)有詞庫用于協(xié)作完成候選項排序。
17.如權(quán)利要求15所述的方法,其特征在于,所述限制詞具有在各預(yù)設(shè)場景下的限制信息。
18.一種獲取限制詞信息的裝置,其特征在于,包括目標(biāo)詞獲取單元,用于獲取一目標(biāo)詞;特征信息獲取單元,用于獲取該目標(biāo)詞相應(yīng)的特征信息;限制信息獲取單元,用于判斷所述特征信息或其相應(yīng)的計算結(jié)果是否符合預(yù)置條件,如果符合,則確定該目標(biāo)詞為限制詞并記錄相關(guān)限制信息,所述限制信息用于限制該詞單獨輸出時的排序,和/或,用于限制該詞智能組詞輸出時的排序。
19.一種優(yōu)化輸出的方法,其特征在于,包括接收用戶輸入信息,并對所述輸入信息進行轉(zhuǎn)換;獲得輸出侯選項;判斷一輸出候選項是否符合應(yīng)用限制信息的預(yù)置條件;如果是,則提取該輸出候選項相應(yīng)的限制信息,并根據(jù)所述限制信息對各候選項進行排序。
20.如權(quán)利要求19所述的方法,其特征在于所述應(yīng)用限制信息的預(yù)置條件為所述輸出侯選項是否為單獨輸出的詞;或者,所述應(yīng)用限制信息的預(yù)置條件為所述輸出侯選項是否屬于智能組詞情形。
21.如權(quán)利要求19所述的方法,其特征在于,通過以下步驟獲取所述的限制信息獲取一目標(biāo)詞;獲取該目標(biāo)詞相應(yīng)的特征信息;判斷所述特征信息或其相應(yīng)的計算結(jié)果是否符合預(yù)置條件,如果符合,則針對該目標(biāo)詞記錄相關(guān)限制信息。
22.如權(quán)利要求20所述的方法,其特征在于,當(dāng)需要判斷所述輸出侯選項是否為單獨輸出的詞時,通過以下步驟完成判斷一輸出候選項是否只包含一個元素,并且長度大于1個輸出字符;所述元素為預(yù)置詞庫中存儲的字詞;如果是,則確定該輸出候選項為單獨輸出的詞。
23.一種輸入法系統(tǒng),包括輸入接口單元和顯示單元,其特征在于,所述輸入法系統(tǒng)還包括詞庫所述詞庫包括限制信息;候選項獲取單元用于根據(jù)用戶的輸入信息獲得輸出侯選項;判斷單元,用于判斷一輸出候選項是否符合應(yīng)用限制信息的預(yù)置條件;候選項排序單元,用于當(dāng)符合預(yù)置條件時,提取該輸出候選項相應(yīng)的限制信息,并根據(jù)所述限制信息對各候選項進行排序。
24.如權(quán)利要求23所述的系統(tǒng),其特征在于所述應(yīng)用限制信息的預(yù)置條件為所述輸出侯選項是否為單獨輸出的詞;或者,所述應(yīng)用限制信息的預(yù)置條件為所述輸出侯選項是否屬于智能組詞情形。
25.如權(quán)利要求23所述的輸入法系統(tǒng),其特征在于,所述判斷單元進一步包括用于判斷一輸出候選項是否只包含一個元素的子單元;其中,所述元素為預(yù)置詞庫中存儲的字詞;以及,用于判斷該輸出候選項的長度是否大于1個輸出字符的子單元;以及,用于當(dāng)該輸出候選項符合上述兩個判斷條件時,確定其為單獨輸出的詞的子單元。
26.如權(quán)利要求24所述的輸入法系統(tǒng),其特征在于,所述輸入法系統(tǒng)的輸入接口單元、顯示單元以及詞庫位于同一計算設(shè)備中;或者,所述輸入法系統(tǒng)的輸入接口單元、顯示單元位于第一計算設(shè)備中,詞庫位于第二計算設(shè)備中,所述輸入法系統(tǒng)根據(jù)用戶輸入的信息,從位于第二計算設(shè)備中獲取相應(yīng)信息,在第一計算設(shè)備顯示相應(yīng)字詞。
全文摘要
本發(fā)明公開了一種獲取限制詞信息的方法,包括獲取一目標(biāo)詞;獲取該目標(biāo)詞相應(yīng)的特征信息;判斷所述特征信息或其相應(yīng)的計算結(jié)果是否符合預(yù)置條件,如果符合,則確定該目標(biāo)詞為限制詞并記錄相關(guān)限制信息,所述限制信息用于限制該詞單獨輸出時的排序。本發(fā)明實施例通過預(yù)置包括限制詞信息的輸入法詞庫,在用戶進行輸入時,判斷輸出候選項是否符合應(yīng)用限制信息的預(yù)置條件,進而依據(jù)是否符合的結(jié)果,控制具有限制詞信息的候選項的是否顯示和輸出,從而使用戶在不增加操作的前提下,可以獲得更有效地輸出,極大地優(yōu)化了輸入法系統(tǒng)的字符輸出過程,提高了輸入法系統(tǒng)的智能性。
文檔編號G06F3/023GK101055588SQ20071009964
公開日2007年10月17日 申請日期2007年5月25日 優(yōu)先權(quán)日2007年5月25日
發(fā)明者呂杰勇 申請人:北京搜狗科技發(fā)展有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
沽源县| 瑞昌市| 沙田区| 九台市| 桂平市| 宁乡县| 锦屏县| 页游| 讷河市| 望江县| 綦江县| 九龙城区| 朔州市| 东乡县| 兴山县| 微山县| 克东县| 闻喜县| 延寿县| 吴江市| 辽阳市| 襄垣县| 乾安县| 繁昌县| 阜南县| 巴中市| 余庆县| 板桥市| 汪清县| 霍城县| 临夏县| 胶州市| 澎湖县| 康保县| 凌海市| 汽车| 林芝县| 兴国县| 横山县| 新丰县| 墨玉县|