两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

信息壓縮方法及其裝置的制作方法

文檔序號:6413794閱讀:282來源:國知局
專利名稱:信息壓縮方法及其裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種信息壓縮方法及一種信息壓縮裝置,特別涉及一種可使用于電子辭典信息,具有高壓縮率、快速解壓縮特性的信息壓縮方法及其裝置。
隨著計(jì)算機(jī)科技的快速發(fā)展,大量的計(jì)算機(jī)設(shè)備已被廣泛的應(yīng)用于生活中,而隨著所謂“無紙時代”的來臨,大量的文件或書籍資料如商務(wù)文書、百科全書、甚至是辭典等,皆逐漸將其信息計(jì)算機(jī)化,不僅增加其保存的安全性及管理上的方便性,更藉由計(jì)算機(jī)在處理信息上易于查詢、便于復(fù)制、容易攜帶及處理的特性,大幅度提高了使用上的便利性及信息運(yùn)用上的效率。
但是隨著大量信息的計(jì)算機(jī)化,許多文字資料建立而成的檔案資料或是文字檔,其所需占用的容量亦相當(dāng)?shù)目捎^,過于龐大的檔案,往往造成計(jì)算機(jī)硬件的存儲空間如硬磁盤等過大的負(fù)荷,使管理及保存上較為不便,并導(dǎo)致處理及攜帶上的不便,也使得存取的效率及速度受到影響。雖然近年來大容量的存儲設(shè)備如光盤、高容量軟盤等的發(fā)展已使得存儲容量大幅提高,但考慮軟件信息的存取速度及方便性,縮減信息所占空間的應(yīng)用技術(shù)發(fā)展,仍有相當(dāng)迫切的需要。
一般而言,為達(dá)到縮減信息所占空間,且不影響存儲內(nèi)容及信息的目的下,可采用特定的壓縮方法,例如使用一數(shù)據(jù)編碼技術(shù),以較少的數(shù)據(jù)信息來代表較為多量的字元及字串信息,達(dá)到減少信息所占空間的目的。目前在縮減信息所占空間的壓縮方法上,已有相當(dāng)?shù)倪M(jìn)展,知名的壓縮軟件如ARJ或是PKZJP等,在作為文件壓縮工具上已有相當(dāng)?shù)膽?yīng)用。但是以上述的壓縮工具而言,對于大文件的整體壓縮較為有效,但若使用于較小而多量的文件,或是將大文件分為許多個小文件時,壓縮率則會大為降低,導(dǎo)致了對于小文件或分段式文件,高壓縮率難以實(shí)現(xiàn)的缺點(diǎn)。尤其以目前的壓縮技術(shù)而言,當(dāng)需取得單一或特定文件中某一指定的段落或字串時,必須將壓縮檔中的整個文件解壓,方能取得所需的信息,即必須花費(fèi)將一整個文件解壓縮的時間,來取得一個所需的段落或字串,相當(dāng)?shù)馁M(fèi)時與不便。
對于大多數(shù)的信息庫而言,其內(nèi)容多包含有具有許多筆獨(dú)立的信息,例如一商業(yè)組織的客戶信息、或是電子辭典的信息庫等,以此種信息的使用特性來說,其內(nèi)容包含了劃分為許多段落或區(qū)間的個別信息,壓縮后的壓縮檔,必須接受經(jīng)常性的查詢或是檢出的工作,因此在應(yīng)用傳統(tǒng)的壓縮方式上,受限于其壓縮率過低,且取得文件中某一指定的段落或字串不易而速度極慢的缺點(diǎn),無法同時達(dá)到壓縮文件所占空間,且增進(jìn)使用效率的要求。
本發(fā)明的目的是提供一種信息壓縮方法及裝置。
本發(fā)明的另一目的為提供一種信息壓縮方法及裝置,可達(dá)成較高的壓縮率,并提高解壓縮的速度,減少壓縮文件所占空間,且增進(jìn)使用效能。
本發(fā)明的另一目的為提供一種可以適用于如電子辭典等信息庫文件的信息壓縮方法及裝置,可提高查詢或使用時即時解壓縮的速度,且增進(jìn)查詢時解壓縮的效率。
本發(fā)明中的信息壓縮方法用以壓縮一信息文件,包含首先建立一靜態(tài)壓縮字典,靜態(tài)壓縮字典至少包含多個代碼,一對一的相對應(yīng)于多個字串;再由信息文件中讀入一字元,加入一暫存字串;并于靜態(tài)壓縮字典中,搜尋暫存字串;當(dāng)暫存字串存在于靜態(tài)壓縮字典時,由信息文件中讀入下一字元,加入暫存字串中;而當(dāng)暫存字串不存在于靜態(tài)壓縮字典中時,輸出一對應(yīng)于一前一暫存字串的一代碼,以最后讀入的字元取代為暫存字串,由信息文件中讀入下一字元,加入暫存字串中。
本發(fā)明的方法還可進(jìn)一步選擇性的加入一個字串頻率統(tǒng)計(jì)步驟,針對信息文件中所有出現(xiàn)的字串,進(jìn)行出現(xiàn)次數(shù)的統(tǒng)計(jì),以將使用頻率較高的字串加入靜態(tài)壓縮字典中,增加對信息文件的壓縮率。也可藉由一分段結(jié)構(gòu)的方式,加入可相互與一索引信息相對應(yīng)的編碼或存儲位址,進(jìn)一步可加快解壓縮時,即時取得信息的速度。
本發(fā)明中的信息壓縮裝置包含一靜態(tài)壓縮信息存儲裝置,靜態(tài)壓縮信息存儲裝置包含多個代碼,一對一的相對應(yīng)于多個字串;及一壓縮裝置,與靜態(tài)壓縮信息存儲裝置相連結(jié),壓縮裝置讀入信息文件與多個代碼,用以進(jìn)行壓縮,以產(chǎn)生一壓縮資料。信息壓縮裝置可進(jìn)一步包含一動態(tài)壓縮信息存儲裝置,與壓縮裝置相連,用以于壓縮步驟中存儲多個動態(tài)字串信息。


圖1為本發(fā)明中信息壓縮裝置結(jié)構(gòu)及連接示意圖。
圖2顯示本發(fā)明中信息壓縮方法的壓縮處理過程的流程圖。
圖3顯示本發(fā)明中信息壓縮方法的字串頻率統(tǒng)計(jì)過程的流程圖。
圖4為本發(fā)明中信息壓縮方法所對應(yīng)的解壓縮處理過程的流程圖。
圖5為本發(fā)明中信息壓縮方法,采用分段壓縮方式時的對應(yīng)結(jié)構(gòu)。
本發(fā)明中提供一種信息壓縮方法及裝置,利用一靜態(tài)壓縮字典及一動態(tài)壓縮字典的建立,使靜態(tài)壓縮字典包含使用頻率高的字串,而將使用頻率低的字串置于動態(tài)壓縮字典中,并包含多數(shù)個一對一相互對應(yīng)的編碼或代碼,增進(jìn)對文件壓縮的壓縮率。并可進(jìn)一步選擇性的加入一字串頻率統(tǒng)計(jì)過程,針對文件中所有出現(xiàn)的不定長字串,進(jìn)行出現(xiàn)次數(shù)的統(tǒng)計(jì),并將出現(xiàn)頻率加以排列,加入靜態(tài)壓縮字典中,以進(jìn)一步增加此信息壓縮方法的壓縮率。也可藉由一加入分段結(jié)構(gòu)的特征及方法,加快解壓縮的速度。
參見圖1所示,為本發(fā)明中信息壓縮裝置的結(jié)構(gòu)及連接示意圖。當(dāng)對信息文件10進(jìn)行壓縮時,信息文件10內(nèi)的信息,經(jīng)過一壓縮裝置12將其信息內(nèi)容、即字元或字串讀入,處理后輸出代碼以產(chǎn)生一壓縮信息14,壓縮裝置12與一靜態(tài)壓縮字典16及一動態(tài)壓縮字典18連結(jié)。靜態(tài)壓縮字典16為一靜態(tài)壓縮信息存儲裝置,其中至少包含信息文件10中經(jīng)常使用或出現(xiàn)的字串及字元,及這些字串或字元所對應(yīng)的編碼或代碼,作為壓縮時對應(yīng)之用,在同一文件或段落中為一不受壓縮裝置12影響而變化的信息內(nèi)容;動態(tài)壓縮字典18為一動態(tài)壓縮信息存儲裝置,用以存儲壓縮裝置12處理過程中,不包含于靜態(tài)壓縮字典16中的字串,動態(tài)壓縮字典18即作為一暫存區(qū)域,根據(jù)當(dāng)時所處理的信息文件10中的字串所臨時建立而成,其信息內(nèi)容會隨壓縮過程的進(jìn)行而變動。
本發(fā)明中信息壓縮方法所使用的裝置還可進(jìn)一步加入一字串頻率統(tǒng)計(jì)裝置20,如圖1中所示,與信息文件10及靜態(tài)壓縮字典16相連結(jié),以對信息文件10中所有出現(xiàn)的不定長度的字串,進(jìn)行出現(xiàn)次數(shù)的統(tǒng)計(jì),并以出現(xiàn)頻率的多寡將字串依序加以排列,取出其中出現(xiàn)頻率較高者,成為一高頻字典,并加入靜態(tài)壓縮字典16中,做為常用字串,以更進(jìn)一步增加壓縮裝置12處理信息時的速度及所得壓縮信息14的壓縮率。
信息壓縮裝置中還可包含一對應(yīng)的解壓縮裝置22,如圖1中所示,解壓縮裝置22用以讀入壓縮信息14,藉由靜態(tài)壓縮字典16中字串或字元與代碼對應(yīng),執(zhí)行一解壓縮步驟,以輸出一還原信息文件,即為原來的信息文件10。
本發(fā)明中的信息壓縮方法,其壓縮處理的流程可參照圖2所示的流程圖,壓縮過程50開始之后,首先由信息文件10中的起始處讀入一字元,存入一暫存字串中(步驟52);并于靜態(tài)壓縮字典16中,搜尋暫存字串(步驟54);當(dāng)暫存字串存在于靜態(tài)壓縮字典時,由信息文件中讀入下一字元,加入暫存字串中(步驟56);而當(dāng)暫存字串不存在于靜態(tài)壓縮字典16中時,輸出一對應(yīng)于一前一暫存字串的一代碼,以最后讀入的字元取為代為暫存字串的內(nèi)容,再由信息文件10中讀入下一字元,加入暫存字串中(步驟58)。
信息壓縮方法即是反復(fù)進(jìn)行上述的步驟54至步驟56(或步驟58),并于每一次讀入下一字元時由讀入字元判斷是否到達(dá)結(jié)尾,當(dāng)尚未到達(dá)信息文件10的分段處或結(jié)束處時,即重復(fù)的進(jìn)行壓縮過程;當(dāng)已到達(dá)信息文件10的分段處或結(jié)束處時,即輸出靜態(tài)壓縮字典16中相對于暫存字串的代碼至壓縮信息14中,以完成壓縮過程。
而在步驟58中,若靜態(tài)壓縮字典16不存在與暫存字串相同的字串,可進(jìn)一步將暫存字串加入一動態(tài)壓縮字典18中。通常若是在動態(tài)壓縮字典18容量有限的狀況下,可包含一步驟,以判斷動態(tài)壓縮字典18內(nèi)的空量是否達(dá)到其容量上限,當(dāng)動態(tài)壓縮字典18內(nèi)的容量達(dá)到容量上限時,將動態(tài)壓縮字典18內(nèi)重復(fù)出現(xiàn)次數(shù)最少的字串(即極低頻的字串)加以清除,以預(yù)留空間作為下一次暫存字串加入時之用。
綜上所述,在進(jìn)行信息壓縮處理的循環(huán)過程50中,利用一對于靜態(tài)壓縮字典16的參照,將信息文件10的內(nèi)容,藉由可搜尋到最長的常用字串,轉(zhuǎn)換成占用空間小的代碼,并將未包含于靜態(tài)壓縮字典16中的字串,存放于動態(tài)壓縮字典18中,成為較不常用的字串、也就是較為低頻的字串的參考存儲區(qū),完成將信息文件10壓縮至壓縮信息14的過程。
為了進(jìn)一步增加壓縮裝置12處理信息時的速度及所得壓縮信息14的壓縮率,可進(jìn)一步加入一字串頻率統(tǒng)計(jì)的過程60,進(jìn)行于信息壓縮處理的循環(huán)過程50之前,以產(chǎn)生一個更能夠與信息文件10的內(nèi)容相配合的靜態(tài)壓縮字典16,其流程如圖3所示。字串頻率統(tǒng)計(jì)的過程60如下首先包含一起始基本壓縮字典的步驟62,建立一空白的基本壓縮字典;再由信息文件10中的起始處讀入一字元,存入于一暫存字串中(步驟64);并記錄暫存字串的出現(xiàn),累加其出現(xiàn)次數(shù)(步驟66);接著于基本壓縮字典中,搜尋暫存字串(步驟68);當(dāng)暫存字串存在于基本壓縮字典中時,由信息文件中讀入下一字元,加入暫存字串中(步驟70);當(dāng)暫存字串不存在于基本壓縮字典中時,將暫存字串存入基本壓縮字典中,以最后讀入的字元取代為暫存字串的內(nèi)容,由信息文件中讀入下一字元,加入暫存字串中(步驟72)。
字串頻率統(tǒng)計(jì)過程60即是反復(fù)進(jìn)行上述的步驟66至步驟70(或步驟72),并于每一次讀入下一字元時由讀入字元判斷是否到達(dá)結(jié)尾,當(dāng)尚未到達(dá)信息文件10的結(jié)束處時,即重復(fù)的進(jìn)行壓縮過程;當(dāng)已到達(dá)信息文件10的結(jié)束處時,即進(jìn)行一排序步驟74,進(jìn)行一所有出現(xiàn)字串的排序,將個別字串依出現(xiàn)頻率的多寡加以排列,取出其中出現(xiàn)次數(shù)較多的個別字串,以加入于靜態(tài)壓縮字典16中,并建立對應(yīng)于加入字串的代碼。綜上所述,藉由字串頻率統(tǒng)計(jì)的過程60,可取出出現(xiàn)頻率較高的個別字串,成為常用字串,以產(chǎn)生一個更能夠與信息文件10的內(nèi)容相配合的靜態(tài)壓縮字典16,增進(jìn)壓縮效率。
相對于本發(fā)明中的信息壓縮方法,當(dāng)需取出壓縮信息14中的代碼,以產(chǎn)生其原始的信息文件10時,則須進(jìn)行一解壓縮處理的過程80,如圖4的流程圖所示,壓縮過程開始之后,首先由壓縮信息14讀入一壓縮代碼(步驟82);并于靜態(tài)壓縮字典中16,搜尋此壓縮代碼(步驟84);當(dāng)壓縮代碼存在于靜態(tài)壓縮字典中時,輸出相同于壓縮代碼所對應(yīng)的一字串(步驟86);而當(dāng)壓縮代碼不存在于靜態(tài)壓縮字典中的字串時,輸出壓縮代碼所代表的一字元(步驟88)。
解壓縮處理的過程80即是反復(fù)進(jìn)行上述的步驟82至步驟86(或步驟88),并于每一次讀入下一壓縮代碼時由讀入壓縮代碼判斷是否到達(dá)結(jié)尾,當(dāng)尚未到達(dá)壓縮信息14的結(jié)束處時,即重復(fù)的進(jìn)行解壓縮處理,直至完成全部壓縮信息14的解壓縮處理,而得到一與原始信息文件完全相同的還原信息文件,完成一解壓縮的過程。
而在步驟84中,可進(jìn)一步包含一存入動態(tài)壓縮字典18的步驟,以記錄解壓縮處理80過程中的字串使用頻率及狀況。于步驟86中,即當(dāng)壓縮代碼存在于靜態(tài)壓縮字典16中時,將字串的第一字元合并于一前次輸出字串之后,存入動態(tài)壓縮字典18之中;而于步驟88中,即當(dāng)壓縮代碼不存在于靜態(tài)壓縮字典16中時,則將前次輸出字串的第一字元合并于前次輸出字串之后,存入動態(tài)壓縮字典18之中。
以下提供一實(shí)際壓縮過程的結(jié)果,以作為進(jìn)一步了解本發(fā)明之用,但并非用以限制本發(fā)明。一信息文件10含有以下分段性的資料字串1SAMPLE_ONE_SAME字串2SAMPLE_TWO_PLEASE_FREE字串3SAMPLE_THREE_SEE首先經(jīng)過一字串頻率統(tǒng)計(jì)過程、如圖3中所示的字串頻率統(tǒng)計(jì)過程60,得出一靜態(tài)壓縮字典包含代碼及其字串如下<100>=‘E_’<101>=‘SA’<102>=‘SAM’<103>=‘PL’<104>=‘SAMP’<105>=‘E_S’<106>=‘PLE’<107>=‘EE’<108>=‘LE’<109>=‘RE’接著經(jīng)過一壓縮過程、如圖2中所示的壓縮過程50,得出代碼如下字串1<104><108><’_ ’><’O’><’N’><105><’A’><’M’>
<’E’>
字串2<104><108><’_’><’T’><’W’><’O’><’_’><106>
<’A’><’S’><100><’F’><109><’E’>
字串3<104><108><’_’><’T’><’H’><109><105><107>
而再經(jīng)過一解壓縮過程、如圖4中所示的解壓縮過程80,即可得出原來的信息文件10。
對于大多數(shù)的信息庫而言、其內(nèi)容多包含有具有許多筆獨(dú)立的信息,例如一電子辭典的信息內(nèi)容等,以此種信息的使用特性來說,其內(nèi)容包含了劃分為許多段落或區(qū)間的個別信息,壓縮后的壓縮檔,必須接受經(jīng)常性的查詢或是檢出的工作,因此在應(yīng)用傳統(tǒng)的壓縮方式上,受限于其壓縮率過低,且取得文件中某一指定的段落或字串,須將整份文件解壓縮,而導(dǎo)致速度極慢的缺點(diǎn)。本發(fā)明中的壓縮方法,還可包含一分段壓縮的方式,也就是在壓縮的過程中,采用分段進(jìn)行的方法,也就是在壓縮過程50之中,于由讀入字元判斷是否到達(dá)結(jié)尾過程中,加入一檢查分段點(diǎn)的過程,當(dāng)讀入一分段的代表字元時,即輸出代碼,并將個別段落所得的壓縮信息建立一與索引文件的對應(yīng)關(guān)系,例如建立其存儲位址等。以電子辭典的信息內(nèi)容而言,即是以每一個字詞及其內(nèi)文字串,作為獨(dú)立段落的基準(zhǔn),如圖5所示。信息文件10包含一索引信息10a及一字串信息10b,索引信息10a包含電子辭典信息的各字詞,字串信息10b包含電子辭典信息各字詞的內(nèi)文或解釋字串,而壓縮后的索引文件14a中的個別字詞,仍能保持具有與壓縮后的信息文件14b的相互對應(yīng)關(guān)系,當(dāng)必須查詢或是檢出某一字詞的內(nèi)文字串時,僅需依照此一對應(yīng)關(guān)系,針對特定的字串作解壓縮的動作,可大幅度加快信息取出的速度,提高即時解壓縮的效率。
因此,在進(jìn)行信息壓縮處理過程中,利用對于靜態(tài)壓縮字典的參照,將信息文件的內(nèi)容,轉(zhuǎn)換為代碼,減少所占空間,并將未包含于靜態(tài)壓縮字典中的字串,存放于動態(tài)壓縮字典中,成為一低頻字串的參考存儲區(qū),完成對信息文件壓縮的過程。
本發(fā)明中所提供的信息壓縮方法,利用一靜態(tài)壓縮字典及一動態(tài)壓縮字典的建立,使靜態(tài)壓縮字典包含使用頻率高的字串,而將使用頻率低的字串置于動態(tài)壓縮字典中,并于靜態(tài)壓縮字典中包含與字串一一對應(yīng)的代碼,增加對文件壓縮的壓縮率。并可加入一字串頻率統(tǒng)計(jì)過程,針對文件中所有出現(xiàn)的定長或不定長的字串,進(jìn)行出現(xiàn)次數(shù)的統(tǒng)計(jì),并將出現(xiàn)頻率加以排列,加入靜態(tài)壓縮字典中,以更增加此信息壓縮方法的壓縮率。也可藉由一分段結(jié)構(gòu)的特征,加快取出信息時、即時解壓縮的速度,且可使用于不同語系的信息文件,以相同的實(shí)施方式,達(dá)到對信息文件壓縮的目的。與傳統(tǒng)的壓縮方法如ARJ、PKZIP、甚至是LZW的分段壓縮方式比較而言,本發(fā)明中的壓縮方法,當(dāng)應(yīng)用于電子辭典的信息時,可大幅提高壓縮率達(dá)傳統(tǒng)壓縮方法的兩倍以上,同時藉由其壓縮特性及分段結(jié)構(gòu)的特征,在取出字串信息時,其即時解壓縮的平均時間僅為傳統(tǒng)壓縮方法的四分之一,提高了該一壓縮及解壓縮方法應(yīng)用的便利性及使用效能。
本發(fā)明以一較佳實(shí)施例說明如上,僅用于藉以幫助了解本發(fā)明的實(shí)施,并非用以限制本發(fā)明的精神,而本領(lǐng)域的技術(shù)人員在理解本發(fā)明的精神后,在不脫離本發(fā)明的精神范圍內(nèi),可作些許更動潤飾及等同的變化替換,其專利保護(hù)范圍應(yīng)當(dāng)以權(quán)利要求及其等同物的范圍而定。
權(quán)利要求
1.一種信息壓縮方法,用以壓縮一信息文件,該方法至少包含下列步驟建立一靜態(tài)壓縮字典,該靜態(tài)壓縮字典至少包含多個代碼,一對一的對應(yīng)于多個字串;由該信息文件中讀入一字元,加入一暫存字串;于該靜態(tài)壓縮字典中,搜尋該暫存字串;當(dāng)該暫存字串存在于該靜態(tài)壓縮字典時,由該信息文件中讀入下一個該字元,加入該暫存字串中;及當(dāng)該暫存字串不存在于該靜態(tài)壓縮字典中時,輸出一對應(yīng)于一前一個該暫存字串的一代碼,且以最后讀入的該字元取代為該暫存字串,并由該信息文件中讀入下一個該字元,為入該暫存字串中。
2.如權(quán)利要求1的信息壓縮方法,其中于所述的建立該靜態(tài)壓縮字典的步驟前,還包含一建立一壓縮信息的步驟,以于該搜尋該暫存字串的步驟中,輸出該代碼至該壓縮信息中,用以存儲該信息文件壓縮后的信息。
3.如權(quán)利要求1的信息壓縮方法,其中所述的當(dāng)該暫存字串不存在于該靜態(tài)壓縮字典中時的步驟中,包含將該暫存字串存入一動態(tài)壓縮字典中的步驟。
4.如權(quán)利要求3的信息壓縮方法,其中于所述的將該暫存字串存入該動態(tài)壓縮字典的步驟后,包含一更新步驟,當(dāng)該動態(tài)壓縮字典達(dá)到一容量上限時,以清除一低頻字串方式,更新該動態(tài)壓縮字典。
5.如權(quán)利要求1的信息壓縮方法,其中所述的信息壓縮方法是用以壓縮一電子辭典中的該信息文件。
6.如權(quán)利要求1的信息壓縮方法,其中包含進(jìn)行一字串頻率統(tǒng)計(jì)的步驟,以于該提供該靜態(tài)壓縮字典的步驟執(zhí)行前,用以產(chǎn)生該靜態(tài)壓縮字典,該字串頻率統(tǒng)計(jì)的步驟至少包含下列步驟建立一基本壓縮字典;由該信息文件中讀入一字元,加入一暫存字串中;由該信息文件中讀入下一個該字元,加入于該暫存字串中;記錄該暫存字串的出現(xiàn)次數(shù);于該基本壓縮字典中,搜尋該暫存字串;當(dāng)該暫存字串存在于該基本壓縮字典中時,由該信息文件中讀入下一個該字元,加入該暫存字串中;當(dāng)該暫存字串不存在于該基本壓縮字典中時,將該暫存字串存入該基本壓縮字典中,以最后讀入的該字元取代為該暫存字串,并由該信息文件中讀入下一個該字元,加入該暫存字串中;及進(jìn)行一排序步驟,取出多個高頻字串,以產(chǎn)生該靜態(tài)壓縮字典,用以建立對應(yīng)于該多個高頻字串的該多個代碼。
7.如權(quán)利要求6的信息壓縮方法,其中所述的將該暫存字串存入該基本壓縮字典中的步驟,包含一更新步驟,當(dāng)該基本壓縮字典達(dá)到一容量上限時,以清除一低頻字串方式,更新該基本壓縮字典。
8.如權(quán)利要求1的信息壓縮方法,其中所述的信息壓縮方法包含一對應(yīng)的一信息解壓縮方法,用以還原一壓縮信息,該信息解壓縮方法至少包含下列步驟由該壓縮信息中讀入一壓縮代碼;于該靜態(tài)壓縮字典中,搜尋該壓縮代碼;當(dāng)該壓縮代碼存在于該靜態(tài)壓縮字典中時,輸出相同于該壓縮代碼所對應(yīng)的一字串;及當(dāng)該壓縮代碼不存在于該靜態(tài)壓縮字典中時,輸出該壓縮代碼的一字元。
9.如權(quán)利要求8的信息壓縮方法,其中所述的搜尋步驟包含下列步驟當(dāng)該壓縮代碼存在于該靜態(tài)壓縮字典中時,將該字串的一第一字元合并于前一次輸出的該字串之后,存入該動態(tài)壓縮字典之中;及當(dāng)該壓縮代碼不存在于該靜態(tài)壓縮字典中時,將前一次輸出的該字串的一第一字元合并于前一次輸出的該字串之后,存入該動態(tài)壓縮字典之中。
10.一種信息壓縮方法,用以壓縮一電子辭典的內(nèi)容,該方法至少包含下列步驟建立一靜態(tài)壓縮字典,該靜態(tài)壓縮字典至少包含多個代碼,一對一的對應(yīng)于多個字串;由該電子辭典中讀入下一個該字元,加入一暫存字串;于該靜態(tài)壓縮字典中,搜尋該暫存字串;當(dāng)該暫存字串存在于該靜態(tài)壓縮字典時,由該電子辭典中讀入下一個該字元,加入該暫存字串中;及當(dāng)該暫存字串不存在于該靜態(tài)壓縮字典中時,輸出一對應(yīng)于一前一個該暫存字串的一代碼,以最后讀入的該字元取代為該暫存字串,由該電子辭典中讀入下一個該字元,加入該暫存字串中。
11.如權(quán)利要求10的信息壓縮方法,其中于所述的建立該靜態(tài)壓縮字典的步驟前,還包含一建立一壓縮信息的步驟,以于該搜尋該暫存字串的步驟中,輸出該代碼至該壓縮信息中,用以存儲該信息文件壓縮后的信息。
12.如權(quán)利要求10的信息壓縮方法,其中所述的當(dāng)該暫存字串不存在于該靜態(tài)壓縮字典中時的步驟中,包含將該暫存字串存入一動態(tài)壓縮字典中的步驟。
13如權(quán)利要求12的信息壓縮方法,其中于所述的將該暫存字串存入該動態(tài)壓縮字典的步驟后,包含一更新步驟,當(dāng)該動態(tài)壓縮字典達(dá)到一容量上限時,以清除一低頻字串方式,更新該動態(tài)壓縮字典。
14.如權(quán)利要求10的信息壓縮方法,其中包含進(jìn)行一字串頻率統(tǒng)計(jì)的步驟,以于該提供該靜態(tài)壓縮字典的步驟執(zhí)行前,用以產(chǎn)生該靜態(tài)壓縮字典,該字串頻率統(tǒng)計(jì)的步驟至少包含下列步驟建立一基本壓縮字典;由該信息文件中讀入一字元,加入一暫存字串中;由該信息文件中讀入下一個該字元,加入于該暫存字串中;記錄該暫存字串的出現(xiàn)次數(shù);于該基本壓縮字典中,搜尋該暫存字串;當(dāng)該暫存字串存在于該基本壓縮字典中時,由該信息文件中讀入下一個該字元,加入該暫存字串中當(dāng)該暫存字串不存在于該基本壓縮字典中時,將該暫存字串存入該基本壓縮字典中,以最后讀入的該字元取代為該暫存字串,并由該信息文件中讀入下一個該字元,加入該暫存字串中;及進(jìn)行一排序步驟,取出多個高頻字串,以產(chǎn)生該靜態(tài)壓縮字典,用以建立對應(yīng)于該多個高頻字串的該多個代碼。
15.如權(quán)利要求14的信息壓縮方法,其中所述的將該暫存字串存入該基本壓縮字典中的步驟,包含一更新步驟,當(dāng)該基本壓縮字典達(dá)到一容量上限時,以清除一低頻字串方式,更新該基本壓縮字典。
16.如權(quán)利要求10的信息壓縮方法,其中所述的信息壓縮方法包含一對應(yīng)的一信息解壓縮方法,用以還原一壓縮信息,該信息解壓縮方法至少包含下列步驟由該壓縮信息中讀入一壓縮代碼;于該靜態(tài)壓縮字典中,搜尋該壓縮代碼;當(dāng)該壓縮代碼存在于該靜態(tài)壓縮字典中時,輸出相同于該壓縮代碼所對應(yīng)的一字串;及當(dāng)該壓縮代碼不存在于該靜態(tài)壓縮字典中時,輸出該壓縮代碼的一字元。
17.如權(quán)利要求16的信息壓縮方法,其中所述的搜尋步驟包含下列步驟當(dāng)該壓縮代碼存在于該靜態(tài)壓縮字典中時,將該字串的一第一字元合并于前一次輸出的該字串之后,存入該動態(tài)壓縮字典之中;及當(dāng)該壓縮代碼不存在于該靜態(tài)壓縮字典中時,將前一次輸出的該字串的一第一字元合并于前一次輸出的該字串之后,存入該動態(tài)壓縮字典之中。
18.一種信息壓縮方法,該信息壓縮方法為一分段式壓縮方法,用以分段壓縮一電子辭典的內(nèi)容,以于壓縮后保持一索引文件與一壓縮后文件的對應(yīng),該方法至少包含下列步驟建立一壓縮信息;進(jìn)行一字串頻率統(tǒng)計(jì),以產(chǎn)生一靜態(tài)壓縮字典,該靜態(tài)壓縮字典至少包含多個代碼,一對一的對應(yīng)于多個字串;由該電子辭典中讀入一字元,加入一暫存字串;于該靜態(tài)壓縮字典中,搜尋該暫存字串;當(dāng)該暫存字串存在于該靜態(tài)壓縮字典時,由該電子辭典中讀入下一字元,加入該暫存字串中;及當(dāng)該暫存字串不存在于該靜態(tài)壓縮字典中時,輸出一對應(yīng)于一前一暫存字串的一代碼至該壓縮信息中,并將該暫存字串存入一動態(tài)壓縮字典中,更新該暫存字串為一最后讀入的字元,由該電子辭典中讀入下一字元,加入該暫存字串中。
19.如權(quán)利要求18的信息壓縮方法,其中于所述的將該暫存字串存入該動態(tài)壓縮字典的步驟后,包含一更新步驟,當(dāng)該動態(tài)壓縮字典達(dá)到一容量上限時,以清除一低頻字串方式,更新該動態(tài)壓縮字典。
20.如權(quán)利要求18的信息壓縮方法,其中所述的字串頻率統(tǒng)計(jì)的步驟至少包含下列步驟建立一基本壓縮字典;由該信息文件中讀入一字元,加入一暫存字串中;由該信息文件中讀入下一個該字元,加入于該暫存字串中;記錄該暫存字串的出現(xiàn)次數(shù);于該基本壓縮字典中,搜尋該暫存字串;當(dāng)該暫存字串存在于該基本壓縮字典中時,由該信息文件中讀入下一個該字元,加入該暫存字串中;當(dāng)該暫存字串不存在于該基本壓縮字典中時,將該暫存字串存入該基本壓縮字典中,以最后讀入的該字元取代為該暫存字串,并由該信息文件中讀入下一個該字元,加入該暫存字串中;及進(jìn)行一排序步驟,取出多個高頻字串,以產(chǎn)生該靜態(tài)壓縮字典,用以建立對應(yīng)于該多個高頻字串的該多個代碼。
21.如權(quán)利要求20的信息壓縮方法,其中所述的將該暫存字串存入該基本壓縮字典中的步驟,包含一更新步驟,當(dāng)該基本壓縮字典達(dá)到一容量上限時,以清除一低頻字串方式,更新該基本壓縮字典。
22.如權(quán)利要求18的信息壓縮方法,其中所述的信息壓縮方法包含一對應(yīng)的一信息解壓縮方法,用以還原一壓縮信息,該信息解壓縮方法至少包含下列步驟由該壓縮信息中讀入一壓縮代碼;于該靜態(tài)壓縮字典中,搜尋該壓縮代碼;當(dāng)該壓縮代碼存在于該靜態(tài)壓縮字典中時,輸出相同于該壓縮代碼所對應(yīng)的一字串;及當(dāng)該壓縮代碼不存在于該靜態(tài)壓縮字典中時,輸出該壓縮代碼的一字元。
23.如權(quán)利要求22的信息壓縮方法,其中所述的搜尋步驟包含下列步驟當(dāng)該壓縮代碼存在于該靜態(tài)壓縮字典中時,將該字串的一第一字元合并于前一次輸出的該字串之后,存入該動態(tài)壓縮字典之中;及當(dāng)該壓縮代碼不存在于該靜態(tài)壓縮字典中時,將前一次輸出的該字串的一第一字元合并于前一次輸出的該字串之后,存入該動態(tài)壓縮字典之中。
24.一種信息壓縮裝置,用以壓縮一信息文件,該信息壓縮裝置至少包含一靜態(tài)壓縮信息存儲裝置,該靜態(tài)壓縮信息存儲裝置包含多個代碼,一對一的相對應(yīng)于多個字串;及一壓縮裝置,與該靜態(tài)壓縮信息存儲裝置相連結(jié),該壓縮裝置讀入該信息文件與該多個代碼,用以進(jìn)行壓縮,以產(chǎn)生一壓縮信息。
25.如權(quán)利要求24的信息壓縮裝置,其中所述的信息壓縮裝置包含一動態(tài)壓縮信息存儲裝置,與該壓縮裝置相連,用以于該壓縮步驟中存儲多個動態(tài)字串信息。
26.如權(quán)利要求24的信息壓縮裝置,其中所述的信息壓縮裝置包含一字串頻率統(tǒng)計(jì)裝置,讀入該信息文件,用以產(chǎn)生該信息文件的多個高頻字串,以存儲于該靜態(tài)壓縮信息存儲裝置之中。
27.如權(quán)利要求24的信息壓縮裝置,其中所述的信息壓縮裝置包含一解壓縮裝置,與該靜態(tài)壓縮信息存儲裝置相連結(jié),該解壓縮裝置用以讀入該壓縮信息,藉由該多個字串,執(zhí)行一解壓縮步驟,以產(chǎn)生一還原信息文件。
28.如權(quán)利要求24的信息壓縮裝置,其中所述的信息壓縮裝置是用以壓縮一電子辭典中的該信息文件。
29.一種信息壓縮裝置.該信息壓縮裝置為一分段式壓縮裝置,用以分段壓縮一電子辭典的內(nèi)容,以于壓縮后保持一索引文件與一壓縮后文件的對應(yīng),該信息壓縮裝置至少包含一靜態(tài)壓縮信息存儲裝置,該靜態(tài)壓縮信息存儲裝置至少包含多個代碼,一對一的對應(yīng)于多個字串;一字串頻率統(tǒng)計(jì)裝置,讀入該信息文件,用以產(chǎn)生該信息文件的多個高頻字串,以存儲于該靜態(tài)壓縮信息存儲裝置之中,與該信息文件及該靜態(tài)壓縮信息存儲裝置相連,用以產(chǎn)生該信息文件的多個高頻字串,以存儲于該靜態(tài)壓縮信息存儲裝置之中;一動態(tài)壓縮信息存儲裝置,用以存儲多個動態(tài)字串信息;及一壓縮裝置,與該靜態(tài)壓縮信息存儲裝置及該動態(tài)壓縮信息存儲裝置相連結(jié),該壓縮裝置讀入該信息文件與該多個代碼,用以進(jìn)行壓縮,以產(chǎn)生一壓縮信息。
30.如權(quán)利要求29的信息壓縮裝置,其中所述的信息壓縮裝置包含一解壓縮裝置,與該靜態(tài)壓縮信息存儲裝置相連結(jié),該解壓縮裝置用以讀入該壓縮信息,藉由該多個字串,執(zhí)行一解壓縮步驟,以輸出一還原信息文件。
全文摘要
一種信息壓縮方法及裝置,該方法包含建立靜態(tài)字典;由信息文件中讀入一字元,加入一暫存字串;搜尋暫存字串;當(dāng)暫存字串存在靜態(tài)字典時,讀入下一字元加入暫存字串中;當(dāng)暫存字串不存在靜態(tài)字典中時,輸出一對應(yīng)的代碼,更新暫存字串為最后讀入字元,并讀入下一字元加入暫存字串中。也可進(jìn)一步加入一字串頻率統(tǒng)計(jì)步驟。信息壓縮裝置則包含一靜態(tài)壓縮信息存儲裝置及一壓縮裝置,以讀入信息文件,用以進(jìn)行壓縮,產(chǎn)生一壓縮信息。
文檔編號G06F17/00GK1186987SQ9810423
公開日1998年7月8日 申請日期1998年1月14日 優(yōu)先權(quán)日1998年1月14日
發(fā)明者林光信, 盧鳳順, 李伯峰 申請人:英業(yè)達(dá)股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
澄江县| 区。| 县级市| 临洮县| 西林县| 名山县| 教育| 农安县| 高台县| 兰考县| 辽阳市| 兰坪| 泸定县| 永胜县| 濮阳市| 章丘市| 怀安县| 通州市| 文安县| 册亨县| 屏边| 佛冈县| 南华县| 尼玛县| 中宁县| 太湖县| 阿克陶县| 麻阳| 五华县| 东至县| 桂阳县| 页游| 扬州市| 崇义县| 南京市| 外汇| 宁陵县| 丰城市| 邢台县| 和林格尔县| 嘉义县|