两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

在基于字符的文檔和文件中的屬性數(shù)據(jù)的隱形編碼的制作方法

文檔序號:6460566閱讀:374來源:國知局
專利名稱:在基于字符的文檔和文件中的屬性數(shù)據(jù)的隱形編碼的制作方法
背景技術(shù)
1.發(fā)明領(lǐng)域本發(fā)明涉及信息處理領(lǐng)域,尤其涉及文檔和文件的電子版本中的信息的編碼。
2.現(xiàn)有技術(shù)說明隨著對信息編碼的方法已經(jīng)變?yōu)樵试S更高的性能和效率,與現(xiàn)有技術(shù)的系統(tǒng)不兼容的可能性增大了。已經(jīng)采用了一些技術(shù)和標準來使得這種不兼容性最小化,但仍然留有一類在采用這種技術(shù)和標準之前生成的遺留產(chǎn)品。
一種已經(jīng)具有相當高程度的兼容性成功的標準是MIME(多用途網(wǎng)際郵件擴充)格式。采用MIME格式,通過對消息進行兩次編碼可以提供兼容性第一次編碼是“純文本(plain-text)”,第二次編碼是“多信息文本(rich-text)”。如同其名稱所隱含的,純文本編碼是在沒有影響這些字符的顯示的任何控制代碼或標記的情況下對消息中的所有可打印文本字符進行的編碼,而多信息文本格式包括表明與可打印文本字符相聯(lián)系的屬性、例如黑體、斜體、下劃線、顏色、字體尺寸、字體類型以及其他屬性的控制代碼。MIME格式文件包括對消息的兩種編碼。當應(yīng)用程序打開一個MIME格式文件以供查看時,應(yīng)用程序根據(jù)其性能或其所操作于其上的系統(tǒng)的性能確定使用何種編碼。如果應(yīng)用程序例如支持黑體或斜體字體,則采用多信息文本格式來精確反映在原始消息中黑體或斜體字符的顯示。相反,如果應(yīng)用程序或系統(tǒng)不能顯示黑體或斜體字母,則顯示純文本編碼。
為了在允許多信息文本的設(shè)備以及允許純文本的設(shè)備之間提供兼容性,MIME格式文件只由可打印字符代碼組成。原始消息中的標記或控制代碼在消息的純文本編碼中被忽略,在多信息文本格式中被編碼為多組唯一字符串。

圖1顯示了消息100到純文本格式110和多信息文本格式120的編碼。圖2顯示了既包括純文本格式110’又包括多信息文本格式120’、以及描述文件內(nèi)容、文檔類型等等的MIME專用控制信息的合成的MIME格式文件200。多信息文本格式120’包括確定文本元素在顯示時如何出現(xiàn)的控制信息121、122,在這個例子中是在開始“黑體”繪制121和結(jié)束“黑體”繪制122時。為了容易引用,將純文本信息之外的信息共同稱為“屬性”。當支持黑體、斜體和下劃線的應(yīng)用程序處理MIME格式文件200時,它將處理多信息文本格式120’,并且所顯示或所打印的消息將以與圖1的原始消息100類似的形式出現(xiàn)。如果應(yīng)用程序或系統(tǒng)不支持黑體、斜體和下劃線,則應(yīng)用程序?qū)⑻幚砑兾谋靖袷?,所顯示或所打印的消息將以與圖1的純文本格式110類似的形式出現(xiàn)。
然而,MIME格式文件200的上述適當?shù)娘@示或打印是預(yù)先假定應(yīng)用程序是可兼容MIME的。也就是說,預(yù)先假定應(yīng)用程序可識別MIME專用信息201、202、203,并選擇適當?shù)木幋a110’、120’進行處理和顯示。然而,不兼容MIME的應(yīng)用程序?qū)⒉荒茏R別出文件的初始部分201是MIME標題,也不能識別出中間部分202是在純文本編碼110’與多信息文本編碼120’之間的MIME分隔符,也不能識別出結(jié)束部分203是MIME腳注。對于不兼容MIME的應(yīng)用程序,MIME格式文件200僅僅作為常規(guī)的文本文件出現(xiàn)。通過這樣一個應(yīng)用程序顯示或打印的MIME格式文件200將以與圖2的MIME格式文件200的圖象類似的形式出現(xiàn)。也就是說,所有MIME專用信息201、202、203將作為所顯示文檔的一部分以及純文本格式110’和多信息文本格式120’信息出現(xiàn)。MIME格式文件200的這樣一種直接顯示在視覺上是沒有吸引力的,并且對于不熟悉格式化的計算機文件的原始形式的用戶來說常常是不可識別的。
這些目的和其他目的是以兩種方式實現(xiàn)的。在第一種方法中,將包含文本元素和可以影響文本元素的顯示的標記元素的消息編碼為純文本消息,其隨后跟著對純文本消息的改變的列表,以便對純文本消息的增強顯示起作用。通過將純文本同與文本元素相聯(lián)系的屬性分離,所有文本應(yīng)用程序都能夠顯示文本的原狀拷貝。在一個最佳實施例中,將控制和格式化屬性添加到純文本上,使得消息的初始部分的直接顯示是文本的立即可讀版本。在與第一種方法無關(guān)或與其相結(jié)合的第二種方法中,用字符的“隱形”序列對控制和格式化信息進行編碼。在一個實施例中,采用隱形字符、例如空格、退格、制表等的唯一序列來對每個唯一的標記進行編碼。在另一個實施例中,標記元素被編碼為可見字符與相應(yīng)的具有擦除可見字符的作用的隱形字符、例如退格的序列。通過對標記元素進行隱形編碼,消息的直接顯示將以純文本消息的形式出現(xiàn),因為標記元素或者是自擦除的,或者是作為“隱形”空白附加到純文本消息上的。
圖2顯示了現(xiàn)有技術(shù)的對包含文本元素和標記元素的文檔的MIME編碼的一個例子。
圖3顯示了依據(jù)本發(fā)明的一個方面的對包含文本元素和將文本元素分組的標記元素的文檔編碼的一個例子。
圖4A-4C顯示了依據(jù)本發(fā)明的另一個方面的標記元素的隱形編碼的一個例子。
圖5顯示了依據(jù)本發(fā)明的對包含文本元素和包括文本元素的群集的標記元素的文檔編碼的一個例子以及對標記元素的隱形編碼的另一個例子。
圖6顯示了依據(jù)本發(fā)明的對文檔的標記元素進行成行隱形編碼的一個例子。
圖7顯示了依據(jù)本發(fā)明的用于對文檔編碼的編碼器的一個例示方框圖。
圖8顯示了依據(jù)本發(fā)明的用于對文檔編碼的一個例示流程圖。
圖9顯示了依據(jù)本發(fā)明的用于對編碼的文檔進行譯碼的譯碼器的一個例示方框圖。
在附圖中,相同的標號表示相似的或相應(yīng)的功能或特征。
發(fā)明詳細說明圖3顯示了依據(jù)本發(fā)明的一個方面的文檔100的編碼的一個例子。如圖所示,編碼的文檔300包括純文本部分310和標記部分320。純文本部分310是文檔100的文本內(nèi)容的提取或群集,而不帶有影響文本的出現(xiàn)的與文本相聯(lián)系的屬性。也就是說,所有字母、數(shù)字、符號、標點等都從輸入文檔100直接編碼;在大多數(shù)情況下,文檔100將是電子形式的,對文本項目的編碼僅僅是采用包含在文檔100的電子形式中的相同字符代碼、例如ASCII將文本從文檔100傳送到編碼文檔300。
標記部分320是文檔100中的每個標記元素的提取,以及與標記元素相聯(lián)系的偏移或位置。通過將每個標記加到編碼文檔300中的相關(guān)偏移位置上的文本310,用偏移來重新生成文檔100。例如,在輸入文檔100中的第33到第36個字符位置出現(xiàn)的詞“黑體”101是以黑體類型出現(xiàn)的。為了實現(xiàn)這個黑體形式,在剛好第33個字符位置之前加上“黑體-開始”屬性,在剛好第36個字符位置之后加上“黑體-結(jié)束”屬性。所示的標記部分320包括數(shù)字“32”340和字母“B”345,表示黑體-開始(“B”)要被加在純文本310中剛好第32個(“32”)字符位置之后。同樣,標記部分320包含數(shù)字“36”350和字母序列“/B”,表示黑體-結(jié)束(“/B”)要被加在純文本310中第36個(“36”)字符位置之后。因此,標記部分320中的“32 B 36/B”條目提供了足夠的信息來用于對純文本310中的詞“黑體”進行黑體繪制。通過參考其在純文本310中所想要的位置來同樣地對每個隨后的屬性標記(“I”斜體,“UL”下劃線)編碼。其他類型的標記元素、例如對超文本鏈接的UTML引用同樣被編碼。如果標記元素的內(nèi)容被常規(guī)顯示,例如明確引用的文件名或因特網(wǎng)地址,則這些內(nèi)容保持為純文本310。如果標記元素的內(nèi)容不是被常規(guī)顯示,例如對內(nèi)部產(chǎn)生的參考的引用,與圖2的例示文檔中的段202類似,則將其在標記部分320中編碼,并且不以純文本310出現(xiàn)。
要注意的是,通過將每個標記引用到純文本310中的位置,則不需要重復(fù)文本。在假設(shè)一個典型文檔包含比標記多得多的文本的情況下,則消除重復(fù)文本的需求在采用本發(fā)明的格式化文件的尺寸上與等效的MIME格式文件的尺寸相比提供了相當大的減少。還要注意的是,在一個最佳實施例中,純文本310首先出現(xiàn)在格式化文件300中。這樣,直接顯示格式化文件300的內(nèi)容的遺留應(yīng)用程序?qū)ο?00的文本提供有意義的并且易于讀取的再現(xiàn)310。所有標記信息出現(xiàn)在文本結(jié)尾,可以被用戶所忽略。
通過使用標記部分定界符“{changes”321來使得格式化文件300的譯碼更容易,該標記部分定界符識別純文本310的結(jié)束和標記部分320的開始。與格式化文件300的格式兼容的應(yīng)用程序識別出這個預(yù)定定界符,然后將后面的信息解釋為標記-位置一標記-信息對。對標記段定界符321的字符的特定選擇“{changes”出現(xiàn)在這里只是為了例示的目的。在一個最佳實施例中,選擇一個極為可能是唯一的字符序列;即,具有不同時出現(xiàn)在純文本310中的高可能性的序列,例如“qx74gh#$6^2”?;蛘?,可以從格式化文件300的內(nèi)容推出標記部分定界符。例如,應(yīng)用程序可以從后向前處理格式化文件300,注意可識別的-標記-元素-數(shù)字-位置對的出現(xiàn)。通過可識別的-標記-元素-數(shù)字-位置對的第一次缺失來識別標記段320的開始。用于描繪信息的可區(qū)分段或群集的這些和其他技術(shù)對于本領(lǐng)域普通技術(shù)人員來說都是公知的。
如上所述,標記元素將出現(xiàn)在純文本310的結(jié)尾。依據(jù)本發(fā)明的另一個方面, 用“隱形”字符代碼對最佳實施例中的標記元素進行編碼。即,用于對標記元素及其位置編碼的代碼被編碼,以使得對編碼文件的直接顯示不會產(chǎn)生可見的效果。為了本發(fā)明的目的,縱使空格在顯示時產(chǎn)生一個“空白”空間,也將它認為是一個“隱形”字符。同樣,空白行也包括在“隱形”的定義內(nèi)。
圖4A-4C顯示了生成對應(yīng)于標記元素的隱形序列的例子。如圖4A所示,每種類型的標記元素410由標記-類型標識符420唯一地定義。每個標記-類型標識符420的定義可以被預(yù)先限定,或者可以為每個編碼文檔定義唯一標識符到標記-類型的映射。為了容易理解,這里假設(shè)標記-類型到標記-類型標識符的映射是預(yù)先限定的,這是本領(lǐng)域公知的另一個數(shù)據(jù)映射技術(shù)。如圖4A所示,“開始斜體”標記-類型具有標識符“100”421,“結(jié)束斜體”標記-類型具有標識符“101”422,等等。如本領(lǐng)域所公知的,一些標記-類型具有相關(guān)參數(shù)。例如,“開始顏色”標記-類型具有標識符“106”425,這個標識符后面跟有定義所定義顏色的紅色426、綠色427和藍色428分量的振幅的參數(shù)。
圖4A中顯示了每個標記-類型標識符420的值的二進制表示420B。依據(jù)本發(fā)明的一個實施例,通過將二進制表示420B中的二進制(0-1)值的序列編碼為隱形字符序列,為每個標記元素生成一個隱形序列。如圖4B所示,例如,用“空格”(Sp)表示邏輯“0”,而用“回車”(CR)表示邏輯“1”。通過采用這個表示,將“開始斜體”標記元素的二進制編碼421B例子01100100編碼為如下序列Sp-CR-CR-Sp-Sp-CR-Sp-Sp 431。同樣,與每個標記元素相聯(lián)系的偏移的二進制表示以及與每個標記元素相聯(lián)系的任何參數(shù)的二進制表示也同樣被編碼。通過采用“隱形”字符來對標記元素,其偏移以及與標記元素相聯(lián)系的任何其他參數(shù)進行編碼,編碼標記元素的直接顯示將僅在純文本310的結(jié)尾產(chǎn)生空格和空行。
另一種用于產(chǎn)生對應(yīng)于標記信息的“隱形”序列的編碼方式對于本領(lǐng)域普通技術(shù)人員是明顯的。例如,圖4C顯示了采用四個“隱形”字符來表示如下二進制數(shù)字對的編碼“空格”(SP)表示00對,“換行”(LF)表示01對,“制表”(TB)表示10,“回車”(CR)表示11。采用這個表示,“開始斜體”標記元素的01100100 421B表示被編碼為序列LF-Tb-LF-Sp 441。
圖5顯示了另一種通過采用潛在可見的字符結(jié)合“擦除”潛在可見字符的字符代碼來提供“隱形序列”的編碼方法。如前面的例子所示,圖5的編碼文件500包括純文本510,后面跟著標記部分520。純文本510的結(jié)尾519與標記部分520的開始由描繪序列521來描繪。在這個例子中,描繪序列521包括“空格”字符后跟“退格”字符的三次重復(fù)序列。注意,空格后跟退格的直接顯示不是“可見”的,不會在顯示上產(chǎn)生“空白”。也就是說,在產(chǎn)生空格之后,常規(guī)的“光標放置”指針被增大,然后在產(chǎn)生退格之后又減小,結(jié)果導(dǎo)致有效靜止的光標放置指針。在一個打印設(shè)備中,打印頭先前進以產(chǎn)生空格,然后又回退以得到退格。
在標記部分定界符序列521之后是第一標記元素和標記-類型的編碼。如上所述,消息100中的第一標記,“開始黑體”標記具有偏移位置32。依據(jù)這個編碼方法的例子,這個標記偏移值的隱形序列編碼560包括數(shù)字“32”561,后面跟著兩個退格字符562。標記元素編碼570包括文本串“<B>”571,后面跟著三個退格字符572。也就是說,每個標記-偏移和標記-標識符的編碼是圖3中展示的用于識別對伴隨著適當數(shù)目的退格字符以便擦除每個項目的純文本310的改變的文本。當編碼文件500直接顯示在一個常規(guī)顯示設(shè)備上時,字符“32”561將簡短地出現(xiàn)純文本510的結(jié)尾,光標放置指針將通過兩個退格字符562返回純文本510的結(jié)尾。“<B>”字符571然后簡短地出現(xiàn)在純文本510的結(jié)尾,然后光標放置指針將通過三個退格字符572返回純文本510的結(jié)尾。同樣,標記部分520中的每一項目將簡短地顯示在純文本510的結(jié)尾,然后立即由下一個項目覆蓋。在標記部分520的結(jié)尾,附加有五個空格和五個退格的最后一個序列590,以便擦除任何殘留的可見文本。最后一個序列590中的空格和退格數(shù)應(yīng)該等于最長的可見標記序列長。在一個顯示設(shè)備上,被重擊的字符的最后出現(xiàn)形式將是要被重擊的最后的字符,在這種情況下,是空格字符序列。在一個打印設(shè)備上,根據(jù)打印設(shè)備中緩沖和處理程度的不同,可見字符可以被打印,然后在打印頭返回純文本的結(jié)尾時為標記部分520中的每一項目以退格字符再三擊打。在一些應(yīng)用程序中,一些字符在純文本消息的結(jié)尾處的打印和重擊可能優(yōu)于在純文本消息的結(jié)尾處打印空格和空行。另外,相對于圖4所展示的使用所有隱形字符的編碼將是較佳的。同樣,一些遺留設(shè)備不“處理”退格字符,而是顯示一個表示退格字符的符號。因此,如果希望與遺留設(shè)備的最大兼容性,則相對于圖4所展示的編碼也是較佳的。
與這個格式兼容的顯示應(yīng)用程序?qū)⒏袷交募械臄?shù)據(jù)作為純文本處理,直到它遇到標記部分定界符521。此后,它將處理每個標記-偏移--標記-類型對,而忽略退格字符,并響應(yīng)于每個標記元素而適當?shù)卦鰪娂兾谋镜娘@示。
圖6顯示了另一個編碼方案,該編碼方案對標記元素信息“成行”編碼,而消除了對每個標記的偏移參數(shù)編碼的需要。圖5所展示的同一退格擦除方法用于對每個標記進行“隱形”編碼。即,依據(jù)本發(fā)明的這個方面,編碼文件600以與常規(guī)多信息文本格式類似的方式出現(xiàn),不同之處在于每個標記元素650、660后面立即跟有適當數(shù)目的退格字符651、661,用于在直接顯示編碼文件600時擦除標記元素。如圖5所示,一個兼容的應(yīng)用程序?qū)⑼ㄟ^運用由每個標記元素表明的屬性、同時忽略與每個標記元素相聯(lián)系的退格字符來處理編碼文件600。如上所述,這個替換方案可能不適合于為退格字符顯示一個符號的設(shè)備,或者不適合于不緩沖和預(yù)處理退格的打印機,因為對字符的重擊將在視覺上產(chǎn)生干擾物。在這些情況下,為了達到與遺留設(shè)備的最大兼容性,圖4的替換方案是最佳的。
圖7顯示了一個處理輸入文檔100以產(chǎn)生編碼文件780的編碼器700的例示方框圖。編碼器700包括語法分析器710、標記編碼器720和文件組織器和寫文件器730。語法分析器710將輸入文檔100中的文本元素與標記元素區(qū)分開來。文本元素712被傳送到文件組織器和寫文件器730,標記元素714被傳送到標記編碼器720。標記編碼器720將標記編碼為一個標記-類型標識符,如果它還沒有被如此編碼的話。如果本發(fā)明的隱形序列特征被采用的話,標記編碼器720還采用上面相對于圖4-6展示的編碼中的一個來將標記-類型標識符編碼為一個隱形序列。編碼的標記序列721被傳送到文件組織器和寫文件器730。如果不采用成行編碼,則每個標記元素711相對于純文本元素712的位置也同樣采用上述技術(shù)作為編碼偏移被傳送。
文件組織器和寫文件器730準備文本712和標記721信息,以供存儲在編碼文件780中。在這里,術(shù)語文件被用在一般的意義上,意思是數(shù)據(jù)的合成序列。例如,它包括計算機系統(tǒng)上的文件、存儲器中的字節(jié)序列、通過因特網(wǎng)傳送的分組序列,等等。如果采用隱形序列的成行編碼,則如圖6所討論的,文件組織器和寫文件器730僅僅將文本元素712和編碼的標記元素721以它們出現(xiàn)在輸入文檔100中的順序?qū)懙骄幋a文件780中。如果不采用成行編碼,如圖3-5所討論的,則將每個文本元素712直接寫到編碼文件780中,后面跟著每個編碼的標記序列及其偏移。
圖8顯示了依據(jù)本發(fā)明的各個方面用于對輸入文檔編碼的例示流程圖。在810,打開輸入消息以進行處理。對于圖7的輸出文件,輸入消息可以是各種形式計算機文件、來自顯示屏幕的圖象、網(wǎng)頁、來自鍵盤的輸入、等等。方框820分析輸入消息的文本元素和標記元素。方框820還可以包括用于根據(jù)輸入消息的形式產(chǎn)生標記元素的裝置。例如,如果輸入消息是一個掃描圖象,則方框820可以是一個識別文本內(nèi)容以及其屬性、例如黑體、斜體等的文本識別系統(tǒng)。
在830,如果輸入消息中的下一個元素是標記元素,則在836判定相應(yīng)的標記序列。如果未采用成行編碼,則方框836包括這個標記元素在相應(yīng)的標記序列中的偏移位置。如果利用本發(fā)明的隱形編碼方案,則方框836將標記元素變換成一個隱形序列。如果在840未采用成行編碼,則臨時存儲編碼的標記序列,以供隨后附加到輸出文件的純文本部分的結(jié)尾。如果在840未采用成行編碼,則編碼標記序列臨時儲存,以便接著附加到輸出文件的純文本部分的末端。如果在840采用了成行編碼,則將對應(yīng)于標記元素的隱形序列傳送到方框850,以便按照它出現(xiàn)在輸入消息中的順序?qū)懙捷敵鑫募小?br> 如果在830在輸入消息中的下一個元素不是標記元素,則在832判定相應(yīng)的文本序列,并傳送到方框850,以便寫到輸出文件中。一般地,方框832僅僅將文本元素直接傳送到方框850,以供寫到輸出文件中,但如果需要對輸入消息的文本的任何重新格式化、例如變換成ASCII字符代碼的話,則可以在這個方框832執(zhí)行。
在將對應(yīng)于輸入消息中的元素的序列在850寫到輸出文件之后,或在842進行存儲以供以后使用之后,系統(tǒng)通過860至820返回以便分析下一元素,并繼續(xù)這個過程,直到輸入消息的結(jié)束。
如果在870還未使用成行格式化,則在875將標志標記部分的開始的定界符寫到輸出文件中,并在878將每個存儲的標記序列及其偏移位置寫到輸出文件中。如上所述,因為這些序列和偏移是在所有文本元素之后放在輸出文件中的,所以輸出文件的直接顯示將導(dǎo)致以容易閱讀的格式來繪制輸入消息的文本內(nèi)容。即,如果由不與這里所討論的編碼格式“兼容”的應(yīng)用程序來繪制輸出文件以供顯示,則輸出文件的初始部分仍然被繪制為純文本文檔,而沒有插入在視覺上有干擾的標記元素。
圖9顯示了依據(jù)本發(fā)明的各個方面操作的可兼容譯碼器900的例示方框圖。譯碼器900處理編碼文件901,以產(chǎn)生一個繪制輸出980,所述繪制輸出980包括與每個對應(yīng)于用于產(chǎn)生編碼文件901的輸入文檔的文本元素相聯(lián)系的屬性。譯碼器900包括語法分析器910、標記譯碼器920以及顯示驅(qū)動器930。如上所述,編碼文件901可以是計算機文件、計算機存儲器中的字節(jié)序列、通信媒介上的分組序列、等等。同樣,術(shù)語顯示980和顯示驅(qū)動器930用在一般的意義上,包括常規(guī)的計算機顯示器和打印機,并且可由本領(lǐng)域普通技術(shù)人員認可為包括中間顯示裝置,例如包含用于通過繪制應(yīng)用程序、例如網(wǎng)絡(luò)瀏覽器和其他查看裝置來產(chǎn)生繪制的信息的文件、網(wǎng)頁、小程序、子波、小信息等。
語法分析器910從編碼的標記描繪文本元素。如果采用標記的成行編碼,則語法分析器910包括一個在每個編碼標記911出現(xiàn)在編碼文件901中時對其進行識別的標記識別系統(tǒng);另外,語法分析器910包括一個標記部分定界符識別器,用于識別文本元素912的結(jié)束和標記元素911的開始。如上所述,用于區(qū)分文件的各個部分或信息數(shù)據(jù)的類型的技術(shù)在本領(lǐng)域是公知的。文本元素912被直接提供給顯示驅(qū)動器930。編碼的標記序列911由標記譯碼器920譯碼,譯碼的標記元素921被提供給顯示驅(qū)動器930。
如果已經(jīng)使用了標記元素的成行編碼,則顯示驅(qū)動器在接收到標記元素和文本元素之后立即以其適當?shù)睦L制形式產(chǎn)生每個文本元素。如果還未使用成行編碼,則在處理了可能影響特定文本元素912的任何標記元素921之后顯示文本元素912。例如,譯碼器980可以將編碼文件901用作文本元素的“緩沖”位置,并在其通過將由標記元素產(chǎn)生作用的改變列表時提取出文本元素912。例如,在圖3的輸入消息100的例子中,可以將語法分析器910設(shè)計為具有對編碼文件901的多個端口,一個端口訪問純文本310的開始,其他端口訪問標記部分320的開始。當?shù)谝粋€標記偏移“32”340通過第二端口被接收到并被譯碼時,顯示驅(qū)動器930指示語法分析器910從第一端口提供字符,直到第32個字符,并將它們不作修改地繪制到輸出980上。顯示驅(qū)動器930然后根據(jù)來自第二端口的“B”標記345產(chǎn)生“黑體”效果,并如第一端口上的“36”偏移350所表明的,指示語法分析器910展示來自第一端口的后續(xù)字符,直至第36個字符。從第33到第36的每個字符都采用黑體效果進行繪制。響應(yīng)來自第二端口的“/B”標記355,顯示驅(qū)動器930對于來自第一端口的后續(xù)字符禁止黑體效果。如同本領(lǐng)域所公知的,這個二重過程一直持續(xù)到編碼文件901的結(jié)束,產(chǎn)生一個包括文本和表示用于生成編碼文件901的輸入文件的相關(guān)屬性的輸出980。
上述僅僅顯示了本發(fā)明的原理。因此,應(yīng)該理解,本領(lǐng)域普通技術(shù)人員能夠設(shè)計出各種實施本發(fā)明原理的裝置,雖然在這里沒有明確地描述或顯示,但都落入本發(fā)明的精神和范圍內(nèi)。例如,與文檔中的“結(jié)尾標注”類似,已經(jīng)展示的編碼標記序列被放置在編碼輸出文件的純文本部分的結(jié)尾?;蛘?,與文檔中的“腳注”或“章節(jié)標注”類似,編碼標記序列可以放置在每個純文本頁或部分的結(jié)尾。在這個公開文本中提供的特定結(jié)構(gòu)和序列是為了例示的目的。例如,編碼器700和譯碼器900在這里為了完整而展示為單獨的設(shè)備。如同對于本領(lǐng)域普通技術(shù)人員來說顯而易見的,本發(fā)明的原理可以通過變換已經(jīng)采用常規(guī)編碼器編碼、例如用于生成一個MIME格式的文件的消息的預(yù)處理器和后處理器來實施。即,編碼器700可以被構(gòu)造為接受一個MIME格式的文件作為輸入,并采用本發(fā)明的原理僅僅變換MIME格式文件的多信息文本段。相應(yīng)的譯碼器800將接受多信息文本段的這個編碼,并重新生成一個全(純文本加上多信息文本)MIME格式文件,以供一個常規(guī)的可兼容MIME的顯示設(shè)備繪制。同樣,文本通過譯碼器800的顯示被展示為帶有其屬性的文本的繪制。或者,為了進行信息的快速立即顯示,譯碼器800可以被構(gòu)造為將純文本部分立即繪制到顯示器上,然后在隨后添加上對應(yīng)于標記元素的屬性。這樣,例如,與不帶細節(jié)到達、然后被增強以反映細節(jié)的圖象類似,一個編碼文檔901從因特網(wǎng)網(wǎng)站的下載將被立即展示為純文本,然后隨著時間和帶寬的允許進行增強。這些和其他系統(tǒng)優(yōu)化技術(shù)對于本領(lǐng)域普通技術(shù)人員來說在本公開文本的啟示下將是顯而易見的,并且落入后面的權(quán)利要求書所要保擴的范圍內(nèi)。
權(quán)利要求
1.一種對消息(100)編碼的方法,其中,消息(100)包括多個文本元素(110)和在顯示時指定所述消息(100)的出現(xiàn)的至少一個標記元素(711),所述方法包括編碼(710)所述多個文本元素(110),編碼(720)所述至少一個標記元素(711),并將一個標記類型與所述多個文本元素(110)的一個文本元素(101)相聯(lián)系,以形成一個編碼的標記序列(721);以及群集(730)與所述編碼的標記序列(721)分離的所述編碼的多個文本元素(110)。
2.如權(quán)利要求1所述的方法,其中,所述編碼的標記序列(721)被編碼為一個字符代碼隱形序列。
3.如權(quán)利要求2所述的方法,其中,所述字符代碼隱形序列對應(yīng)于與所述至少一個標記元素(711)的二進制表示(421B)相對應(yīng)的隱形字符代碼序列(431)。
4.一種對消息(100)編碼的方法,所述消息包含多個文本元素(110)和用于控制所述多個文本元素(110)的至少一個文本元素(101)的顯示的至少一個標記元素(711),所述方法包括使得能夠?qū)⑺鱿?100)的所述至少一個標記元素(711)編碼(720)成一個相應(yīng)的字符代碼隱形標記序列(721),以及使得能夠?qū)⑺龆鄠€文本元素(110)的每個文本元素編碼成一個字符代碼可見序列(712)。
5.如權(quán)利要求4所述的方法,進一步包括使得能夠判定對應(yīng)于所述消息(100)中的一個位置的所述至少一個標記元素(711)的偏移(340),其中所述位置是所述至少一個標記元素(711)所位于的位置,使得能夠?qū)⑺鲋辽僖粋€標記元素(711)的偏移(561)編碼為一個隱形偏移序列(560),使得能夠?qū)⑺龆鄠€文本元素(110)中的每個文本元素的編碼形成一個群集(510)的格式,使得能夠?qū)⑺鲭[形偏移序列和所述隱形標記序列(520)附加到所述多個文本元素(110)中的每個文本元素的編碼的所述群集(510)上。
6.一種對輸入消息(100)編碼的編碼器(700),所述輸入消息包含多個文本元素(110)和用于控制所述多個文本元素(110)的至少一個文本元素(101)的顯示的至少一個標記元素(711),所述編碼器包括標記編碼器(720),將所述至少一個標記元素(711)編碼成一個字符代碼隱形標記序列(721),文本編碼器(710),將所述多個文本元素(110)的每個文本元素編碼成一個字符代碼可見序列(712)。
7.如權(quán)利要求6所述的編碼器(700),進一步包括標記提取器(830),判定對應(yīng)于所述輸入消息(100)中所述至少一個標記元素(711)的位置的所述至少一個標記元素(711)的偏移(842),偏移編碼器,將所述偏移編碼為一個字符代碼隱形偏移序列,以及寫文件器(730),將對應(yīng)于所述多個文本元素(110)的每個文本元素的字符代碼可見序列作為字符代碼的一個連續(xù)群集寫到一個輸出文件(780),以及將所述字符代碼隱形標記序列和所述字符代碼隱形偏移序列(721)寫到所述輸出文件(780)。
8.一種對輸入消息(100)編碼的編碼器(700),所述輸入消息包含多個文本元素(110)和用于控制所述多個文本元素(110)的至少一個文本元素(101)的顯示的至少一個標記元素(711),所述編碼器包括標記提取器(710),判定對應(yīng)于所述輸入消息(100)中所述至少一個標記元素(711)的位置的所述至少一個標記元素(711)的偏移,標記編碼器(720),將所述偏移和所述至少一個標記元素(711)編碼為一個編碼的字符代碼標記序列(721),以及文件組織器(730),將所述多個文本元素(110)的每個文本元素群集為純文本字符代碼的一個連續(xù)群集(510),以及將所述編碼的字符代碼(520)標記序列(721)附加到純文本字符代碼的連續(xù)群集(510),以形成輸入消息(100)的編碼(500)。
9.一種對輸入消息(901)譯碼的譯碼器(900),所述輸入消息包括至少一個字符代碼隱形標記序列(911)和至少一個字符代碼可見序列,所述譯碼器包括標記譯碼器(920),將所述至少一個字符代碼隱形標記序列譯碼成一個標記元素(921),以及顯示驅(qū)動器(930),根據(jù)標記元素(921)繪制字符代碼(912)的至少一個可見序列,以及
10.如權(quán)利要求9所述的譯碼器(900),其中,標記譯碼器(930)進一步將隱形標記序列譯碼成一個對應(yīng)于標記元素(921)的偏移(340),以及顯示驅(qū)動器(930),進一步根據(jù)偏移(340)繪制所述至少一個字符代碼可見序列(912)。
11.一種對輸入消息(300)譯碼的譯碼器(900),所述輸入消息包括一個連續(xù)純文本段(310)和至少一個標記序列(320),所述譯碼器包括標記譯碼器(921),將所述至少一個標記序列(320)譯碼成一個標記元素(345)和一個標記偏移(340),以及顯示驅(qū)動器(930),采用取決于標記元素(345)和標記偏移(340)的出現(xiàn)形式來繪制連續(xù)純文本段(310)。
12.如權(quán)利要求11所述的譯碼器(900),其中,所述至少一個標記序列(320)是一個字符代碼隱形標記序列(431),以及標記譯碼器(921)將隱形標記序列(431)譯碼為標記元素(345)和標記偏移(340)。
13.一種對應(yīng)于原始消息(100)的編碼消息(500),所述原始消息(100)具有多個文本元素(110)和在顯示時指定所述原始消息(100)的出現(xiàn)的至少一個標記元素(121),所述編碼消息(500)包括對應(yīng)于多個文本元素(110)的連續(xù)純文本段(510),以及對應(yīng)于所述至少一個標記元素(121)的至少一個編碼標記序列(570)。
14.如權(quán)利要求13所述的編碼消息(500),其中編碼標記序列(570)被編碼為一個字符代碼隱形序列。
15.一種對應(yīng)于原始消息(100)的編碼消息(500),所述原始消息(100)具有多個文本元素(110)和在顯示時指定所述原始消息的出現(xiàn)的至少一個標記元素(121),所述編碼消息(500)包括對應(yīng)于多個文本元素(110)的多個字符代碼可見序列(510),以及對應(yīng)于所述至少一個標記元素(121)的至少一個字符代碼隱形標記序列(570)。
全文摘要
將包含文本元素和影響文本元素的顯示的屬性的消息編碼為一個純文本消息,隨后跟有影響純文本消息的增強顯示的對純文本消息的改變的列表。通過將純文本同與文本元素相聯(lián)系的屬性分離開來,所有文本應(yīng)用程序能夠顯示文本的無干擾的拷貝。將控制和格式化屬性附加到純文本上,使得消息的初始部分的直接顯示是文本的立即可讀版本。另外,控制和格式化信息可以采用字符“隱形”序列、例如空格、退格、制表等進行編碼,或者被編碼為可見字符和具有擦除可見字符的作用的相應(yīng)隱形字符的序列。通過對標記元素進行隱形編碼,消息的直接顯示將以純文本消息形式出現(xiàn),因為標記元素或者是自擦除的,或者是作為“隱形”空白附加在純文本消息上的。
文檔編號G06F17/21GK1335966SQ00801713
公開日2002年2月13日 申請日期2000年6月7日 優(yōu)先權(quán)日1999年6月15日
發(fā)明者K·T·埃恩 申請人:皇家菲利浦電子有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
息烽县| 黄平县| 弥渡县| 无锡市| 济宁市| 肃北| 安多县| 来凤县| 乌审旗| 曲麻莱县| 旌德县| 永福县| 宝山区| 沈阳市| 阳山县| 正宁县| 平定县| 寿阳县| 瑞丽市| 双峰县| 汶上县| 育儿| 正阳县| 京山县| 德保县| 二连浩特市| 望江县| 宜丰县| 三原县| 日照市| 邵武市| 建宁县| 图木舒克市| 富平县| 建宁县| 特克斯县| 抚远县| 宝坻区| 库车县| 灵山县| 吴川市|