[0069]8)根據第7步獲取的文檔數據模板描述,從數據源中獲取文檔原始數據和數據模板對應的格式轉換Xslt模板。利用Xslt轉換技術,對文檔數據模板和文檔原始數據進行融合和轉換為含樣式索引序號的Office OpenXml中間數據。
[0070]9)查找第8步格式轉換后的文檔數據中的樣式索引序號,并依次與第4步獲取的樣式組模板中的樣式索引序號進行匹配。例如,數據模板中w:pPr節(jié)點下SN索引序號“I”的匹配。首先,根據數據模板對應的Source節(jié)點所歸屬的Group節(jié)點的StyleID屬性值“1001”,在樣式組模板中找到ID屬性為“1001”的GroupStyle節(jié)點。然后,根據數據模板w:pPr (段落樣式的Office OpenXml描述)節(jié)點類型,在樣式組模板GroupStyle節(jié)點下找到Paragraph (段落樣式)子節(jié)點。接著,根據數據模板SN索引序號“ I ”,在樣式組模板Paragraph節(jié)點下找到No屬性為“I”的SN子節(jié)點。最后,使用樣式組模板SN節(jié)點的Value屬性值“C0VER_LEFT”,構建文檔段落樣式引用的Office OpenXml描述(例如:〈W:pStylew:val = 〃C0VER_LEFT〃/>)。
[0071]10)遵循先數據組級別再大綱級別、依據數據先后位置順序的組裝規(guī)則,將第9步樣式匹配好的文檔數據依次進行組裝。數據組裝時,根據大綱模板需求(Layer的Sect1nID屬性)或數據模板需求(各級樣式的SN的Load屬性)將分節(jié)、字體、段落等樣式的具體OfficeOpenXml描述一并進行組裝。
[0072]11)如果大綱模板中文檔架構解析未完成,則繼續(xù)進行第3?10步工作。如果大綱模板中文檔架構解析已完成,則根據文檔格式需求,將組裝好的帶樣式的文檔數據進行格式化輸出,形成最終文檔。
[0073]本發(fā)明對復雜文檔的大綱、數據和樣式進行分離組織和描述,構建了完整的復雜文檔自動生成技術框架,實現了基于Xml描述和Xslt變換的,文檔數據與樣式模板融合并轉換為Office OpenXml的文檔生成技術(例如如圖9所示)。
[0074]本發(fā)明相對于傳統(tǒng)的文檔自動生成技術,具有良好的靈活性、高效性和可擴展性。
[0075]本發(fā)明提供的復雜文檔大綱、數據和樣式的分離組織和描述方法,突破了文檔內容信息描述所受到的文檔格式、樣式的約束和限制。對復雜文檔的文檔架構逐層細化,對文檔數據與樣式的分離解析,使復雜文檔的組織變得更清晰靈活?;赬ml描述的文檔大綱、數據和樣式組織,可實現復雜文檔內容的跨平臺生成和復用,具有良好的可擴展性。
[0076]本發(fā)明提供的復雜文檔自動生成技術框架,使文檔自動生成流程更加靈活和高效。結合文檔大綱、數據和樣式的分離描述,該技術框架使得單個復雜文檔的多個文檔內容的并發(fā)生成成為可能,同時極大程度的方便了用戶對文檔內容的組織和定制。該技術框架,即為用戶提供了更為靈活的文檔架構與內容定制接口,又可整合相關性和相似度強的文檔大綱、樣式和內容,避免了重復的文字輸入工作,較大程度的提高了工作效率。
[0077]此外,需要說明的是,除非特別指出,否則說明書中的術語“第一”、“第二”、“第三”等描述僅僅用于區(qū)分說明書中的各個組件、元素、步驟等,而不是用于表示各個組件、元素、步驟之間的邏輯關系或者順序關系等。
[0078]可以理解的是,雖然本發(fā)明已以較佳實施例披露如上,然而上述實施例并非用以限定本發(fā)明。對于任何熟悉本領域的技術人員而言,在不脫離本發(fā)明技術方案范圍情況下,都可利用上述揭示的技術內容對本發(fā)明技術方案作出許多可能的變動和修飾,或修改為等同變化的等效實施例。因此,凡是未脫離本發(fā)明技術方案的內容,依據本發(fā)明的技術實質對以上實施例所做的任何簡單修改、等同變化及修飾,均仍屬于本發(fā)明技術方案保護的范圍內。
【主權項】
1.一種基于XML描述的復雜文檔自動生成方法,其特征在于包括: 首先,執(zhí)行第一步驟以獲取文檔大綱模板描述; 隨后,執(zhí)行第二步驟以便對文檔大綱模板進行解析;其中在第二步驟中,根據文檔數據和文檔樣式模板定義信息控制進行第三步驟、第四步驟和第五步驟以完成文檔相關數據和樣式模板的獲??; 隨后,根據文檔架構描述和關聯索引信息控制第六步驟、第七步驟和第八步驟以完成文檔數據獲取及其格式的轉換; 接著,根據文檔內容與樣式關聯信息執(zhí)行第九步驟和第十步驟以完成文檔數據與樣式的匹配及組裝,最后根據文檔的完成情況進入第十一步驟以完成最終文檔的輸出。
2.根據權利要求1所述的基于XML描述的復雜文檔自動生成方法,其特征在于, 第三步驟用于獲取文檔數據組模板,數據組模板描述了文檔內容的組合和獲取方法以及文檔內容分組的樣式索引; 第四步驟用于獲取文檔樣式組模板,文檔樣式組模板定義了文檔內容樣式索引,并且對文檔內容樣式的具體標識進行了編排; 第五步驟用于獲取文檔的屬性模板。
3.根據權利要求1或2所述的基于XML描述的復雜文檔自動生成方法,其特征在于,第六步驟用于根據文檔大綱模板中文檔架構描述和關聯索引信息涉及的宏觀的文檔內容分組信息,從第三步驟獲取到的文檔數據組模板中提取相應的文檔內容分組描述并進行解析,獲取文檔內容數據的模板信息。
4.根據權利要求1或2所述的基于XML描述的復雜文檔自動生成方法,其特征在于,第七步驟用于根據第六步驟獲取到的文檔內容數據的模板信息,獲取文檔數據模板。
5.根據權利要求1或2所述的基于XML描述的復雜文檔自動生成方法,其特征在于,第八步驟用于根據第七步驟獲取到的文檔數據模板,獲取原始數據,并將原始數據進行格式轉換。
6.根據權利要求1或2所述的基于XML描述的復雜文檔自動生成方法,其特征在于,第九步驟用于將第八步驟格式轉換后的文檔數據與第四步驟獲取到文檔內容樣式索引進行關聯分析,根據文檔內容分組關聯的文檔內容樣式索引,以及文檔具體內容關聯的文檔內容樣式索引序號,將格式轉換后的文檔數據中的文檔具體內容與具體的文檔內容樣式標識進行匹配。
7.根據權利要求1或2所述的基于XML描述的復雜文檔自動生成方法,其特征在于,第十步驟用于將第九步驟樣式匹配后的文檔數據與第五步獲取到的各類文檔樣式進行組裝。
8.根據權利要求1或2所述的基于XML描述的復雜文檔自動生成方法,其特征在于,第十一步驟用于根據文檔格式需求,將組裝好的帶樣式的文檔數據進行格式化輸出,形成最終文檔。
【專利摘要】本發(fā)明提供了一種基于XML描述的復雜文檔自動生成方法,包括:首先,執(zhí)行第一步驟以獲取文檔大綱模板描述;隨后,執(zhí)行第二步驟以便對文檔大綱模板進行解析;其中在第二步驟中,根據文檔數據和文檔樣式模板定義信息控制進行第三步驟、第四步驟和第五步驟以完成文檔相關數據和樣式模板的獲取;隨后,根據文檔架構描述和關聯索引信息控制第六步驟、第七步驟和第八步驟以完成文檔數據獲取及其格式的轉換;接著,根據文檔內容與樣式關聯信息執(zhí)行第九步驟和第十步驟以完成文檔數據與樣式的匹配及組裝,最后根據文檔的完成情況進入第十一步驟以完成最終文檔的輸出。
【IPC分類】G06F17-30, G06F17-21
【公開號】CN104598635
【申請?zhí)枴緾N201510063357
【發(fā)明人】吳利, 董國良, 何曼, 徐小春
【申請人】無錫江南計算技術研究所
【公開日】2015年5月6日
【申請日】2015年2月6日