一種對(duì)輸入法候選項(xiàng)進(jìn)行調(diào)頻排序的控制方法及控制裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計(jì)算機(jī)軟件處理系統(tǒng),尤其是輸入法系統(tǒng),具體地涉及輸入法軟件中 對(duì)候選項(xiàng)進(jìn)行調(diào)頻排序的控制方法以及相應(yīng)的控制裝置。
【背景技術(shù)】
[0002] 隨著計(jì)算機(jī)的普及,人們的工作和生活、娛樂(lè)與計(jì)算機(jī)系統(tǒng)的緊密程度越來(lái)越高。 移動(dòng)設(shè)備的出現(xiàn),更加鎖定了人們與移動(dòng)設(shè)備的關(guān)系,我們?cè)陲埡蟛栌喽紩?huì)與朋友通過(guò)移 動(dòng)設(shè)備進(jìn)行網(wǎng)絡(luò)聊天、書寫郵件等。
[0003] 不論是計(jì)算機(jī),還是移動(dòng)設(shè)備,輸入問(wèn)題都是需要解決的首要問(wèn)題。對(duì)于英文輸入 而言,不論是硬鍵盤還是軟鍵盤,一旦鍵盤確定后,就基本確定了輸入的方式,其可選擇性 并不大。但對(duì)于中文輸入而言,則是一個(gè)非常好復(fù)雜的問(wèn)題,中文輸入歷來(lái)是一個(gè)很大的系 統(tǒng)工程。
[0004] 為了解決中文輸入難的問(wèn)題,很多輸入法已經(jīng)被開發(fā),比如拼音輸入法、五筆輸入 法等。拼音輸入法由于便于學(xué)習(xí)、上手快,所以成為了開發(fā)的重點(diǎn),也出現(xiàn)了各種各樣的輸 入法,例如雙拼輸入法等。而在日常生活中,用戶通過(guò)傳統(tǒng)輸入法軟件向計(jì)算機(jī)或其他設(shè)備 輸入文字時(shí),經(jīng)常會(huì)發(fā)生無(wú)法第一時(shí)間獲取希望輸入的字或詞的情況,例如,用戶希望輸入 "問(wèn)話"一詞,在一輸入法軟件中鍵入拼音"wenhua",則該輸入法軟件跳出的第一候選詞可 能是"文化",而非用戶希望輸入的"問(wèn)話"。這是由于用戶通過(guò)輸入法進(jìn)行輸入時(shí),輸入法 軟件無(wú)法對(duì)相同讀音的字符進(jìn)行智能排序,而僅能根據(jù)已有的排序順序固定輸出某一字符 對(duì)應(yīng)的所有候選項(xiàng)的集合。
[0005] 目前,市場(chǎng)上比較流行的輸入法軟件主要有:搜狗拼音輸入法、百度拼音輸入法、 谷歌拼音輸入法、智能ABC輸入法等。這些軟件根據(jù)用戶向計(jì)算機(jī)或其他設(shè)備(例如手機(jī)) 發(fā)送的各種字符來(lái)獲取字符對(duì)應(yīng)的候選項(xiàng)并提示給用戶以便用戶選擇相應(yīng)的候選項(xiàng)來(lái)完 成輸入,但這些輸入法軟件無(wú)法對(duì)相同讀音的字符對(duì)應(yīng)的候選項(xiàng)合集進(jìn)行智能排序,以現(xiàn) 有的一款智能ABC輸入法軟件為例,軟件對(duì)于用戶輸入的相同讀音的字符對(duì)應(yīng)的候選項(xiàng)集 合,在提示給用戶的候選項(xiàng)詞條中各候選項(xiàng)的排序是固定的,例如,對(duì)于拼音"fuze",該拼 音對(duì)應(yīng)的候選項(xiàng)包括"負(fù)責(zé)"、"福澤"、"附則"等多個(gè),智能ABC輸入法軟件向用戶推送的候 選項(xiàng)排序基本是按照"負(fù)責(zé)"、"附則"、"福澤"的順序排列,則當(dāng)用戶希望輸入"福澤"一詞 時(shí)就無(wú)法直接從候選項(xiàng)詞條的第一位獲得需要的字詞,當(dāng)候選項(xiàng)數(shù)量較多時(shí),可能還需翻 頁(yè)才能查找到需要的字詞,加大了用戶的工作量,用戶體驗(yàn)相對(duì)較差。另一方面,現(xiàn)有的輸 入法軟件中的語(yǔ)料庫(kù)通常都是基于對(duì)網(wǎng)頁(yè)語(yǔ)料的智能分析后獲得的,很大程度上必須依托 互聯(lián)網(wǎng)才能實(shí)現(xiàn),軟件需要定期對(duì)語(yǔ)料庫(kù)進(jìn)行更新,如果用戶處在一個(gè)信號(hào)較差甚至斷網(wǎng) 的環(huán)境下,軟件就無(wú)法對(duì)語(yǔ)料庫(kù)進(jìn)行更新。
[0006] 又例如,在申請(qǐng)?zhí)枮?01210531852. 4的專利申請(qǐng)文件中,提出了一種解決方案, 其根據(jù)每個(gè)候選項(xiàng)的第一權(quán)值計(jì)算每個(gè)候選項(xiàng)的第一累積值的大小對(duì)輸入信息的候選項(xiàng) 進(jìn)行排序,當(dāng)兩個(gè)候選項(xiàng)的第一累積值相同時(shí)再基于第一累積值計(jì)算對(duì)應(yīng)的第二累積值、 第三累積值等等,以此類推,直至獲得所有候選項(xiàng)的排序,最終將排序結(jié)果提示給用戶以供 選擇。這種排序方法雖然允許軟件根據(jù)一定的算法對(duì)相同讀音的字符對(duì)應(yīng)的候選項(xiàng)合集進(jìn) 行高頻排序,將相同讀音的字符中網(wǎng)絡(luò)出現(xiàn)最頻繁的字詞排在第一位展示給用戶,但無(wú)法 將用戶最近突然高頻輸入的字詞快速排序到候選項(xiàng)詞條的前幾位,而且,這種算法需要用 到大量的加權(quán)求和公式,計(jì)算量大,無(wú)形中加重了計(jì)算機(jī)操作系統(tǒng)的運(yùn)行負(fù)擔(dān)。
[0007] 現(xiàn)在的用戶對(duì)于操作的便利性是有很高的要求的,尤其在用戶體驗(yàn)上。用戶體驗(yàn) 的細(xì)微變化往往決定了一個(gè)軟件被接受的程度,這對(duì)于存在著充分競(jìng)爭(zhēng)的計(jì)算機(jī)軟件市 場(chǎng)、計(jì)算機(jī)服務(wù)市場(chǎng)上構(gòu)成了強(qiáng)大的競(jìng)爭(zhēng)差別。以上述情況為例,在很多時(shí)候,用戶需要一 種即能根據(jù)用戶習(xí)慣智能排序候選項(xiàng)又具有內(nèi)置語(yǔ)料庫(kù)的輸入法軟件。例如,用戶輸入一 串字符后,輸入法軟件基于內(nèi)置語(yǔ)料庫(kù)獲得輸入字符對(duì)應(yīng)的候選項(xiàng)的集合,并根據(jù)一定算 法將最常輸入的字詞相對(duì)固定地排列在候選項(xiàng)詞條的前幾位提示給用戶,同時(shí)用戶最近突 然高頻輸入的字詞也能相對(duì)快速的排到前面。
[0008] 在現(xiàn)階段,沒有一個(gè)非常好的方法能夠解決上述提到的問(wèn)題。大多數(shù)情況下,用戶 都只能在一系列候選項(xiàng)的集合中手動(dòng)查找需要的字詞,完成輸入,沒有提供一種有效的輸 入法軟件,使最常輸入的字詞相對(duì)固定地排在候選項(xiàng)詞條前幾位的同時(shí)用戶最近突然高頻 輸入的字詞能相對(duì)快速的排到前面。
【發(fā)明內(nèi)容】
[0009] 為了克服現(xiàn)有技術(shù)中沒有提供對(duì)基于用戶輸入習(xí)慣對(duì)輸入法候選項(xiàng)進(jìn)行排序的 技術(shù)方案的技術(shù)問(wèn)題,本發(fā)明的目的是提供一種在輸入法編輯器中調(diào)整輸入法候選項(xiàng)排序 的控制方法以及相應(yīng)的控制裝置。
[0010] 根據(jù)本發(fā)明的一個(gè)方面,提供一種在輸入法編輯器中調(diào)整輸入法候選項(xiàng)排序的控 制方法,所述候選項(xiàng)被顯示在輸入界面上以待用戶選擇,其特征在于,包括如下步驟:
[0011] a.基于用戶輸入信息在語(yǔ)料庫(kù)中確定與所述用戶輸入信息對(duì)應(yīng)的N個(gè)候選編碼, 其中N彡1 ;
[0012] b.通過(guò)如下公式計(jì)算每個(gè)所述候選編碼的總頻率F :
[0013]
[0014] 其中,X為所述候選編碼被輸入的次數(shù),y為語(yǔ)料庫(kù)中所述候選編碼的頻率,k為所 述候選編碼在單位時(shí)間內(nèi)的輸入次數(shù);
[0015] c.基于所述總頻率F確定所述N個(gè)候選編碼的排列順序,從而生成與所述用戶輸 入信息對(duì)應(yīng)的候選項(xiàng)列表。
[0016] 優(yōu)選地,所述k為0。
[0017] 優(yōu)選地,所述y通過(guò)如下公式計(jì)算:
[0018] y = Yi+H
[0019] 其中,yi為基礎(chǔ)頻率,H為單位時(shí)間下的修正參數(shù)。
[0020] 優(yōu)選地,所述yi通過(guò)如下步驟獲得:
[0021] -分析所述詞在第一閾值時(shí)間內(nèi)在一個(gè)或多個(gè)歷史語(yǔ)料庫(kù)中出現(xiàn)的頻率,并將所 述頻率作為所述yi。
[0022] 優(yōu)選地,所述H通過(guò)如下公式計(jì)算獲得:
[0023] H = h*f (C1, Y1)
[0024] 其中,h為基準(zhǔn)參數(shù),f函數(shù)通過(guò)如下公式計(jì)算:
[0025]
[0026] 其中,所述C1通過(guò)如下步驟獲得:
[0027] -分析所述詞在第二閾值時(shí)間內(nèi)在一個(gè)或多個(gè)歷史語(yǔ)料庫(kù)中出現(xiàn)的頻率,并將所 述頻率作為所述C1。
[0028] 優(yōu)選地,所述歷史語(yǔ)料庫(kù)包括如下中的任一種:
[0029] -詞庫(kù);
[0030] -句庫(kù);
[0031] -互聯(lián)網(wǎng)上的全部文章組成的集合。
[0032] 優(yōu)選地,所述語(yǔ)料庫(kù)被預(yù)置在輸入法軟件客戶端內(nèi)。
[0033] 優(yōu)選地,所述語(yǔ)料庫(kù)預(yù)置在輸入法軟件客戶端所在的計(jì)算機(jī)系統(tǒng)內(nèi),其中,所述語(yǔ) 料庫(kù)以單獨(dú)文件形式存儲(chǔ)在所述輸入法編輯器客戶端根目錄中。
[0034] 優(yōu)選地,所述語(yǔ)料庫(kù)包括核心詞庫(kù)以及核心字庫(kù),其中,所述核心詞庫(kù)包括詞編碼 和所述詞編碼對(duì)應(yīng)的頻率,所述核心字庫(kù)包括字編碼和所述字編碼對(duì)應(yīng)的頻率。
[0035] 優(yōu)選地,所述步驟a包括如下步驟:
[0036] al.若所述用戶輸入信息為多個(gè)字編碼組成的詞編碼,則在所述核心詞庫(kù)中查找 對(duì)應(yīng)的N個(gè)候選詞編碼;否則,
[0037] a2.若所述用戶輸入信息為單個(gè)字編碼,則在所述核心字庫(kù)中查找對(duì)應(yīng)的N個(gè)候 選字編碼。
[0038] 優(yōu)選地,所述步驟al還包括如下步驟:
[0039] all.若所述用戶輸入信息在所述核心詞庫(kù)中未查找到對(duì)應(yīng)候選項(xiàng),則根據(jù)用戶選 擇在核心字庫(kù)中逐字確定新編碼。
[0040] 優(yōu)選地,所述語(yǔ)料庫(kù)還包括候選編碼列表,其用于保存同一拼音下用戶最近M次 確定輸入的候選編碼信息,其中,M多1。
[0041 ] 優(yōu)選地,在所述步驟c后還包括如下步驟:
[0042] -基于用戶本次確定輸入的候選編碼信息更新所述候選編碼列表。
[0043] 優(yōu)選地,所述候選編碼信息包括所述候選編碼的編碼信息、頻率信息或用戶確定 輸入的時(shí)間信息中的任一種或任多種。
[0044] 根據(jù)本發(fā)明的另一個(gè)方面,還提供一種在輸入法編輯器中調(diào)整輸入法候選項(xiàng)排序 的控制裝置,優(yōu)選地,所述候選項(xiàng)被顯示在輸入界面上以待用戶選擇,包括:
[0045] 第一確定裝置,其用于基于用戶輸入信息在語(yǔ)料庫(kù)中確定與所述用戶輸入信息對(duì) 應(yīng)的N個(gè)候選編碼,其中N多1 ;
[0046] 第一處理裝置,其用于通過(guò)如下公式計(jì)算每個(gè)所述候選編碼的總頻率F :
[0047]
[0048] 其中,x為所述候選編碼被輸入的次數(shù),y為語(yǔ)料庫(kù)中所述候選編碼的頻率,k為所 述候選編碼在單位時(shí)間內(nèi)的輸入次數(shù);
[0049] 第一生成裝置,基于所述總頻率F確定所述N個(gè)候選編碼的排列順序,從而生成與 所述用戶輸入信息對(duì)應(yīng)的候選項(xiàng)列表。
[0050] 優(yōu)選地,所述k為0。
[0051] 優(yōu)選地,所述y通過(guò)如下公式計(jì)算:
[0052] y = Yi+H
[0053] 其中,yi為基礎(chǔ)頻率,H為單位時(shí)間下的修正參數(shù)。
[0054] 優(yōu)選地,所述yi通過(guò)如下裝置獲得:
[0055] 第一分析裝置,其用于分析所述詞在第一閾值時(shí)間內(nèi)在一個(gè)或多個(gè)歷史語(yǔ)料庫(kù)中 出現(xiàn)的頻率,并將所述頻率作為所述 yi。
[0056] 優(yōu)選地,所述H通過(guò)如下公式計(jì)算獲得:
[0057] H = h*f (C1, Y1)
[0058] 其中,h為基準(zhǔn)參數(shù),f函數(shù)通過(guò)如下公式計(jì)算:
[0059]
[0060] 其中,所述C1通過(guò)如下裝置獲得:
[0061] 第二分析裝置,其用于分析所述詞在第二閾值時(shí)間內(nèi)在一個(gè)或多個(gè)歷史語(yǔ)料庫(kù)中 出現(xiàn)的頻率,并將所述頻率作為所述C 1。
[0062] 優(yōu)選地,所述語(yǔ)料庫(kù)被預(yù)置在輸入法軟件客戶端內(nèi)。
[0063] 優(yōu)選地,所述語(yǔ)料庫(kù)預(yù)置在輸入法軟件客戶端所在的計(jì)算機(jī)系統(tǒng)內(nèi),其中,所述語(yǔ) 料庫(kù)以單獨(dú)文件形式存儲(chǔ)在所述輸入法編輯器客戶端根目錄中。
[0064] 優(yōu)選地,所述語(yǔ)料庫(kù)包括核心詞庫(kù)以及核心字庫(kù),其中,所述核心詞庫(kù)包括詞編碼 和所述詞編碼對(duì)應(yīng)的頻率,所述核心字庫(kù)包括字編碼和所述字編碼對(duì)應(yīng)的頻率。
[0065] 優(yōu)選地,所述第一確定裝置包括:
[0066] 第一查找裝置,其用于在所述用戶輸入信息為多個(gè)字編碼組成的詞編碼時(shí)在所述 核心詞庫(kù)中查找對(duì)應(yīng)的N個(gè)候選詞編碼;或者,第二查找裝置,其用于在所述用戶輸入信息 為單個(gè)字編碼時(shí)在所述核心字庫(kù)中查找對(duì)應(yīng)的N個(gè)候選字編碼。
[0067] 優(yōu)選地,所述第一查找裝置包括:
[0068] 第二確定裝置,其用于若所述用戶輸入信息在所述核心詞庫(kù)中未查找到對(duì)應(yīng)候選 項(xiàng),則根據(jù)用戶選擇在核心字庫(kù)中逐字確定新編碼。
[0069] 優(yōu)選地,所述語(yǔ)料庫(kù)還包括候選編碼列表,其用于保存同一拼音下用戶最近M次 確定輸入的候選編碼信息,其中,M多1。
[0070] 優(yōu)選地,所述第一生成裝置還包括:
[0071] 第二處理裝置,其用于基于用戶本次確定輸入的候選編碼信息更新所述候選編碼 列表。
[0072] 優(yōu)選地,所述候選編碼信息包括所述候選編碼的編碼信息、頻率信息或用戶確定 輸入的時(shí)間信息中的任一種或任多種。
[0073] 通過(guò)本發(fā)明提供的技術(shù)內(nèi)容,可以有效地解決用戶無(wú)法在所述輸入法候選項(xiàng)前幾 位找到最常輸入或最近突然高頻輸入字詞的技術(shù)問(wèn)題,從而給終端用戶帶來(lái)了非常良好的 用戶體驗(yàn),并提高了工作效率。
【附圖說(shuō)明】
[0074] 通過(guò)閱讀參照以下附圖對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其他特征、 目的和優(yōu)點(diǎn)將會(huì)變得更明顯:
[0075] 圖1示出根據(jù)本發(fā)明的第一實(shí)施例的,在輸入法編輯器中調(diào)整輸入法候選項(xiàng)排序 的控制方法的流程圖;
[0076] 圖2示出根據(jù)本發(fā)明的第二實(shí)施例的,在輸入法編輯器中調(diào)整輸入法候選項(xiàng)排序 的控制方法的流程圖;
[0077] 圖3示出根據(jù)本發(fā)明的第三實(shí)施例的,在輸入法編輯器中調(diào)整輸入法候選項(xiàng)排序 的控制方法的流程圖;
[0078] 圖4示出根據(jù)本發(fā)明的第四實(shí)施例的,在輸入法編輯器中調(diào)整輸入法候選項(xiàng)排序 的控制方法的流程圖;
[0079] 圖5示出根據(jù)本發(fā)明的第五實(shí)施例的,在輸入法編輯器中調(diào)整輸入法候選項(xiàng)排序 的控制方法的時(shí)序圖;以及
[0080] 圖6示出根據(jù)本發(fā)明的第六實(shí)施例的,在輸入法編輯器中調(diào)整輸入法候選項(xiàng)排序 的控制裝置的結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0081] 為了更好的使本發(fā)明的技術(shù)方案清晰的表示出來(lái),下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一 步說(shuō)明。
[0082] 本領(lǐng)域技術(shù)人員理解,本發(fā)明的技術(shù)方案在于提供一種可以調(diào)整輸入法候選項(xiàng)排 序的解決方案。解決了目前現(xiàn)有的輸入法編輯器中,無(wú)法根據(jù)用戶使用習(xí)慣智能調(diào)整候選 項(xiàng)排序的技術(shù)問(wèn)題,大大優(yōu)化了用戶體驗(yàn),提高了終端用戶的辦公效率。
[0083] 圖1示出根據(jù)本發(fā)明的第一具體實(shí)施例的,在輸入法編輯器中調(diào)整輸入法候選項(xiàng) 排序的控制方法的流程圖,所述候選項(xiàng)被顯示在輸入界面上以待用戶選擇。具體地,在本實(shí) 施例中,首先執(zhí)行步驟S101,基于用戶輸入信息在核心詞庫(kù)中