两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

嵌合字根式中文輸入法的制作方法

文檔序號(hào):6375881閱讀:220來源:國知局
專利名稱:嵌合字根式中文輸入法的制作方法
技術(shù)領(lǐng)域
本發(fā)明關(guān)于一種在電子裝置的鍵盤上輸入中文文字方法,特別是關(guān)于一種建立于特殊鍵盤對(duì)應(yīng)規(guī)則的輸入法。
背景技術(shù)
如何將中文輸入計(jì) 算機(jī)或其他電子設(shè)備一直是令人困擾的問題。由于中文字并非由字母組成,中文輸入必須仰賴一層額外的轉(zhuǎn)換才能將一組鍵盤鍵入的順序(輸入鍵組)對(duì)應(yīng)到內(nèi)存的中文字。傳統(tǒng)上,我們以兩種方式實(shí)踐這個(gè)對(duì)應(yīng)一是以字的讀音為標(biāo)準(zhǔn),將音轉(zhuǎn)換成拼音符號(hào),再以簡單的鍵盤對(duì)應(yīng)輸入。拼音式輸入法的最大優(yōu)點(diǎn)是容易學(xué)習(xí),每個(gè)人根據(jù)日常口語的使用習(xí)慣便可輕易上手。但是拼音式輸入法也有一些缺點(diǎn),其中最嚴(yán)重的是使用者必須分心在眾多同音字中挑選出正確的字,使得這類輸入法的速度無法提升。另一種輸入法的途徑是將中文字依照特定的規(guī)則拆解成若干字根,再將字根分組,對(duì)應(yīng)到鍵盤位置。這類字形式輸入法的速度相對(duì)較快,但是有一個(gè)致命的缺點(diǎn)難學(xué)易忘。以字形為基礎(chǔ)的輸入法在臺(tái)灣有倉頡、大易、嘸蝦米等,在中國大陸有五筆、鄭碼、二筆等輸入法。中文字的構(gòu)造遵循著若干基本規(guī)則。一個(gè)字往往能夠用直覺拆解成一些基本的構(gòu)件,例如「明」可拆成「日」「月」、「呆」可拆成「口」「木」,符合直觀,每個(gè)人都能操作。也有某些輸入法為了避免龐大字根表的記憶困難,主張以基本筆劃、或是兩個(gè)基本筆劃合并的組合作為拆字的單元。但是用筆劃拆字,并不符合我們對(duì)中文字的直觀。我們相信,如果要超越中文眾多同音字的限制,仍必須以字根為單元將每個(gè)字拆分編碼。以字形為基礎(chǔ)的輸入法包含兩套關(guān)鍵規(guī)則將文字拆解成字根的「拆字規(guī)則」,與將字根對(duì)應(yīng)到鍵盤位置的「對(duì)應(yīng)規(guī)則」。如果要使「拆字規(guī)則」符合直觀、好記好學(xué),所使用的中文字根數(shù)目一般在一百以上。如何將這許多看似無關(guān)的字根對(duì)應(yīng)到實(shí)際鍵盤位置是一個(gè)棘手的問題。這一部分往往也是初學(xué)一種輸入法的人最難以克服的障礙。為了方便學(xué)習(xí),各種拆字式輸入法都設(shè)計(jì)了某種便于記憶學(xué)習(xí)的字根對(duì)應(yīng)規(guī)則。一般的做法是先確定每個(gè)鍵的代表中文字,稱之為「碼元」,然后再將形狀類似的字根指定到同一碼元的位置。以倉頡輸入法為例,其碼元是日(A)、月(B)、金(C)、木(D)、水(E)、火(F)、土(G)、竹(H)、戈(I)、十(J)、大(K)、中(L)、一(M)、弓(N)、人(O)、心(P)、手(Q)、口(R)、尸(S)、廿(T)、山(U)、女(V)、田(W)、卜(Y)。通常碼元與其對(duì)應(yīng)的英文字母并無關(guān),為了讓用戶容易記憶,作者或許會(huì)設(shè)計(jì)一些可供聯(lián)想的口訣。例如倉頡碼有一種口訣是「日頭、月餅、金星…」;“頭”表示“頭一個(gè)字母”,即是A ;“餅”與“星”則依諧音對(duì)應(yīng)到B與C。一旦碼元與字根的對(duì)應(yīng)確立后,可以依照不同拆碼原則產(chǎn)生各式輸入法。以倉頡碼為例,它衍生出速成、快倉、全倉、易頡、大新、亂倉打鳥、輕松等眾多輸入法。而基于五筆鍵盤衍生出的輸入法也有極點(diǎn)五筆、華夏五筆、搜狗五筆等等。由此看來,鍵盤對(duì)應(yīng)規(guī)則可說是輸入法的靈魂。

發(fā)明內(nèi)容
為了克服一般字根表難背難學(xué)的缺點(diǎn),本發(fā)明提出一種將字根嵌合成一般中文字,使字根能符合直觀地對(duì)應(yīng)到鍵盤字母的方法。若要以字根為單元拆解中文字,大致需要上百個(gè)字根才能符合直觀。換言之,如果只用26個(gè)英文字母鍵進(jìn)行編碼,每一個(gè)鍵位必需對(duì)應(yīng)數(shù)個(gè)字根。如果能夠找出一組25或26個(gè)中文字,每一個(gè)字分別能與一個(gè)英文字母產(chǎn)生聯(lián)想,同時(shí)其本身又由一組字根構(gòu)成,那么我們就可以輕易地記憶這些字根以及它們所對(duì)應(yīng)的鍵盤位置。本發(fā)明提出一種符合直觀的字根鍵盤設(shè)計(jì)方法。許多中文字是直接由字根嵌合而成,換言之,其本身可以拆解成若干個(gè)符合直觀的字根。而這個(gè)中文字本身的意義又可以直接譯成英文然后自然地對(duì)應(yīng)到鍵盤。舉例來說“早"這個(gè)字由“日"與“十"兩個(gè)字根組成。通過[早一 Early]的中英對(duì)照,我們可以很直觀地將“日"與"十"這兩個(gè)字根對(duì) 應(yīng)到“E "這個(gè)鍵盤位置。又如“釣"可以拆成“金"、“勹"與“、",而“釣魚"的英譯是“Fishing ",因此鍵盤上的“F "就代表“金"、“勹"與“、"這三個(gè)字根。我們考慮所有常用的嵌合式中文字,在其中挑出一組作為碼元,它們必須同時(shí)符合二個(gè)條件(一)嵌合出這組碼元的字根無重復(fù),(二)每一個(gè)碼元對(duì)應(yīng)到一個(gè)字詞,這個(gè)字詞的英文翻譯的頭一個(gè)字母無重復(fù)。例如根據(jù)這個(gè)方法,可以選出如圖1所示的25個(gè)碼元,分別對(duì)應(yīng)到不同的英文字母(“X "保留為其他用途),因此使用者只要記熟這25個(gè)字與其英文意涵,便掌握了鍵盤上六十多個(gè)字根的位置。相較于一般輸入法,本發(fā)明不但降低了將字根對(duì)應(yīng)到碼元的記憶負(fù)擔(dān),同時(shí)因?yàn)榇a元本身代表的六十多個(gè)字根提供了更廣泛的模擬基礎(chǔ),未被碼元涵蓋的字根可以更直覺地經(jīng)由聯(lián)想與碼元連接。在拆字規(guī)則方面,本發(fā)明舍棄將每一個(gè)字完全拆分成字根的傳統(tǒng)模式,對(duì)于每一個(gè)中文字,依其第一筆劃與最末筆劃所屬的字根取兩碼,再加上由其讀音的聲母對(duì)應(yīng)的鍵盤,這三碼即形成此一中文字的編碼。雖然這種固定三碼長度的法則會(huì)產(chǎn)生若干重碼,但是拆字的規(guī)則大為簡化,便于學(xué)習(xí)。三碼可以產(chǎn)生一萬多種組合,相較于拼音式輸入法只有一千多種發(fā)音組合,選字需求將大幅降低,使用者可進(jìn)一步依賴智能選字系統(tǒng)滿足所需。


圖1顯示依本發(fā)明較佳實(shí)施例的鍵盤對(duì)應(yīng)。圖2顯示依本發(fā)明較佳實(shí)施例的英文聯(lián)想規(guī)則。圖3A,3B, 3C,3D顯示依本發(fā)明較佳實(shí)施例的字根涵蓋對(duì)應(yīng)規(guī)則。圖4顯示本發(fā)明尋找一組對(duì)應(yīng)于英文鍵盤的碼元的算法預(yù)先建立的「候選字庫」示意圖。圖5顯示依本發(fā)明尋找一組對(duì)應(yīng)于英文鍵盤的碼元的算法流程圖。圖6A,6B,6C顯示若干依本發(fā)明算法所產(chǎn)生的對(duì)應(yīng)碼元。附圖標(biāo)記說明510--------選出一組嵌合字「候選字庫」520--------記錄每個(gè)字包含的字根
530--------附加對(duì)應(yīng)的英文意義并記錄首字母540--------隨機(jī)由「候選字庫」中選取一字加入「選定字集」550-------將「候選字庫」中具有與「選定字集」相同字根的字移除560--------「選定字集」的字?jǐn)?shù)是否已達(dá)25570--------以匹配程序(matching)檢查「選定字集」中每個(gè)字是否可對(duì)應(yīng)到一
不同的英文首字母571--------輸出「選定字集」580--------「候選字庫」中是否仍有字可選
590--------加載原始「候選字庫」
具體實(shí)施例方式要依照嵌合字根原理設(shè)計(jì)一套輸入法首先必須選出認(rèn)為可用的簡單中文字,同時(shí)將其包含的字根與可能對(duì)應(yīng)的英文字母表列出來。我們稱這些字為「候選字庫」。例如我們考慮“案”這個(gè)字,它可以直觀地被拆解成女”、“木”這三個(gè)字根,而通過[案例一Case]與[答案一 Answer]這兩項(xiàng)中英對(duì)應(yīng),我們可以選擇C或A作為“案"的代表鍵。當(dāng)然,如果有需要,我們也可以考慮更多相對(duì)比較不自然的中英文對(duì)照以尋求更多的鍵盤對(duì)應(yīng),例如可以加入[提案一 Proposal]讓P也可能代表“案"。圖4列出更多的例子,但是它只顯示可供我們選擇的眾多候選字中的一小部分,我們省略了較罕用字(如“嵌”)、不能直覺地被拆解的字(如“世”)、找不到妥適英文對(duì)應(yīng)的字(如“系”)、字根數(shù)過多的字(如“慮”);實(shí)際上考慮的「候選字庫」超過三百個(gè)字。接著必須就每一個(gè)英文字母對(duì)應(yīng)的中文字中選定一個(gè)作為碼元,要求所選出的碼元中沒有重復(fù)字根。為此,我們建立一個(gè)「隨機(jī)算法」(Randomized Algorithm)。開始時(shí),建立一個(gè)空的「選定字集」,然后在不引進(jìn)重復(fù)字根的條件下,隨機(jī)從「候選字庫」中挑出一個(gè)字加入。如此反復(fù),直到「選定字集」中包含了 25個(gè)字為止。此時(shí)再以「匹配」(Matching)算法檢查這25個(gè)字是否能對(duì)應(yīng)到不同的英文字母。以上過程中如果失敗或遇到無字可選的情況,就重新開始。流程圖如圖5。實(shí)務(wù)上,我們也可以先以人工選定一些較符合直觀的字,再以計(jì)算機(jī)輔助完成剩余的選擇。圖1顯示一組依照以上規(guī)則所選出的鍵盤對(duì)應(yīng)規(guī)則。實(shí)踐本發(fā)明的方法,可以產(chǎn)生多種不同的碼元組合。圖6顯示了更多例子。選定碼元組合后,我們的鍵盤上就對(duì)應(yīng)了數(shù)十個(gè)字根。但是數(shù)目還不夠。以圖1的碼元組合為例,“工"、“乙”、“刀”等字根就在基本字根的涵蓋之外。但是我們可以將它們指派到形狀相似的字根上,例如以“土”代表“工"、以“1_”代表“乙”、以“力”代表“刀”。如此規(guī)定后,幾乎所有常用字根都能被直覺地對(duì)應(yīng)到基本字根。圖3顯示了一個(gè)將各種字根變化對(duì)應(yīng)到基本字根的規(guī)則。因?yàn)楸景l(fā)明并不將每一個(gè)中文字完全拆解取碼,而是取包含首尾兩筆劃的兩個(gè)字根,即使少了某些在其他輸入法中被使用的字根,單是由筆劃也能夠得出合理的編碼。任何一個(gè)中文輸入系統(tǒng)無非只是一個(gè)碼表。依照規(guī)定的字根對(duì)應(yīng)與簡單的取碼規(guī)則對(duì)所有中文字建立出碼表后,我們的工作就接近完成。剩下的工作是建立一個(gè)智能選字的機(jī)制;包括對(duì)大量語料庫進(jìn)行分析統(tǒng)計(jì),找出字與字之間出現(xiàn)的機(jī)率,以及對(duì)單一使用者新輸入的字進(jìn)行學(xué)習(xí)。這些工作都有大量公開且成熟的技術(shù)與文件可參考,因此不再贅言。上述實(shí)施例僅為例示性說明本發(fā)明的原理及其功效,而非用于限制本發(fā)明。本發(fā)明亦可藉由其他不同的具體實(shí)例加以實(shí)施或應(yīng)用,任何熟悉此技術(shù)的人員均可在不違背本發(fā)明的精神及范疇下,對(duì)上述實(shí)施例進(jìn)行修飾與變化。因此,本發(fā)明的權(quán)利保護(hù)范圍,應(yīng)如所述的申請(qǐng)專利范圍所列。
權(quán)利要求
1.一種中文輸入法,執(zhí)行于具有各式鍵盤的電子裝置,其特征在于用一種使用嵌合字根方法將字根組合為中文字,再依其英文翻譯對(duì)應(yīng)到鍵盤位置,其步驟包括有設(shè)計(jì)一鍵盤對(duì)應(yīng)表,供用戶記憶鍵盤與字根的對(duì)應(yīng)關(guān)系;規(guī)定取碼的拆解規(guī)則,并依此規(guī)則建立中文字集的碼表;接收使用者的輸入鍵組,由碼表中找出對(duì)應(yīng)中文字。
2.如權(quán)利要求1項(xiàng)所述的嵌合字根式輸入法,其特征在于字根與鍵盤對(duì)應(yīng)規(guī)則來自將數(shù)個(gè)字根嵌合為一個(gè)中文字,再依該字的英文意涵對(duì)應(yīng)至鍵盤位置。
全文摘要
一種便于記憶的鍵盤對(duì)應(yīng)規(guī)則的產(chǎn)生方法及衍生出的輸入法,執(zhí)行于具有數(shù)字輸入組件及英文字母輸入組件的電子裝置,該電子裝置中存儲(chǔ)有與按鍵上的字碼相對(duì)應(yīng)的中文字庫,該方法包括如下步驟創(chuàng)造一個(gè)對(duì)應(yīng)表,令其相對(duì)于每一個(gè)英文鍵盤有一個(gè)便于記憶的中文字,而此中文字又可以直接被拆解為數(shù)個(gè)字根;將中文文字依其第一筆畫、最后筆畫、與讀音的聲母,分別對(duì)應(yīng)為“首字根”、“尾字根”、與“音字根”三碼,每一碼由一個(gè)鍵盤位置產(chǎn)生;使用者輸入三碼后可調(diào)出預(yù)存的對(duì)應(yīng)中文字組選擇所需的輸入字。
文檔編號(hào)G06F3/023GK102999169SQ201210313088
公開日2013年3月27日 申請(qǐng)日期2012年8月29日 優(yōu)先權(quán)日2011年9月16日
發(fā)明者馬自恒 申請(qǐng)人:馬自恒
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
沧源| 黄山市| 龙游县| 赣州市| 和田县| 云浮市| 扎兰屯市| 南澳县| 辰溪县| 新巴尔虎左旗| 方正县| 四会市| 盐边县| 郴州市| 股票| 房山区| 贡嘎县| 永泰县| 寻甸| 三原县| 崇仁县| 武穴市| 思南县| 孟村| 隆回县| 乐陵市| 安宁市| 丰原市| 读书| 特克斯县| 徐闻县| 集贤县| 迭部县| 榆社县| 手机| 洪洞县| 鄂托克旗| 麻城市| 望谟县| 克什克腾旗| 青铜峡市|