本發(fā)明涉及人工智能算法,尤其涉及一種公文智能排版方法、裝置設備及存儲介質。
背景技術:
1、公文排版是指利用人工智能技術對公文進行自動化排版和格式化的過程?,F(xiàn)有技術中,公文的排版通常需要人工進行,包括調整字體、字號、行距、段落間距等,以確保公文的格式符合規(guī)范和標準。
2、隨著人工智能技術的發(fā)展,特別是自然語言處理和計算機視覺的進步,公文智能排版得到了顯著的改進。現(xiàn)在,通過使用算法和模型,可以自動識別和處理公文中的文本內容,包括標題、段落、表格和圖像等。但是,現(xiàn)實中依然存在公文排版過程中需要較多人工參與,效率低,歸咎其原因在于使用門檻較高以及排版軟件操作難度高等問題,并且現(xiàn)有的軟件功能過于繁瑣、復雜,不便于滿足個性化定制等要求。
3、因此,如何能夠根據(jù)不同公文要求,實現(xiàn)簡單、輕便、高效的公文自動排版以及根據(jù)要求進行個性化定制,并提高企業(yè)公文排版效率是一個亟待解決的問題。
技術實現(xiàn)思路
1、為此,本申請?zhí)峁┮环N技術方案來提供新的解決思路和技術方法,用以彌補上述所述的現(xiàn)有技術缺陷,本發(fā)明提供一種公文智能排版方法、裝置設備及存儲介質,用以解決上述中的至少一種技術問題。
2、為實現(xiàn)上述目的,第一方面,本發(fā)明提供一種公文智能排版方法,包括:
3、檢測當前文檔段落數(shù)量是否滿足公文的最小段落要求;
4、若滿足要求,繼續(xù)逐段落對所述文檔內容進行第一特征分析,所述第一特征分析內容包括:文檔標題、主送單位信息、落款及落款日期識別;
5、然后對所述文檔內容進行第二特征分析,所述第二特征分析內容包括:一級標題、二級標題及多級標題識別,附件及正文等多要素信息識別;
6、根據(jù)所述第一特征分析及第二特征分析結果,生成公文結構樹;根據(jù)所述公文格式要求,掃描所述公文結構樹中各段落文字內容,檢測出其中不符合所述公文格式要求之處進行條件化處理,直至檢測符合要求終止;
7、對所述文檔設定終止詞,當掃描至所述終止詞時進行判斷;若判斷所述終止詞后無段落或判斷所述終止詞后段落以特定格式開頭,則終止掃描,提示排版結束;否則繼續(xù)進行掃描及排版至所述終止詞后無段落或所述終止詞后段落以特定格式開頭。
8、進一步地,所述最小段落要求至少包括5個段落,分別為:標題、主送單位、正文、落款及落款日期。
9、進一步地,在所述分析過程中,識別并忽略所述文檔中包含的:表格、圖像及圖表等相關元素。
10、進一步地,所述格式要求包括:替換所屬文檔中半角標點符號;刪除多余的空白行、空格和標點符號;設置文檔頁面格式,按照奇偶頁設置頁碼格式;計算并設置附件標題對齊的邊距;根據(jù)所述文檔落款的文本長度,計算并設置落款的右邊距;根據(jù)落款的位置,計算并設置落款及落款日期的右邊距。
11、第二方面,本發(fā)明還提供了一種公文智能排版裝置,所述裝置包括:文檔檢測模塊、文檔掃描模塊、文檔分析模塊、文檔判斷模塊;
12、所述文檔檢測模塊:用于檢測當前文檔段落數(shù)量是否滿足公文的最小段落要求;以及根據(jù)所述公文格式要求,掃描所述公文結構樹中各段落文字內容,檢測出其中不符合所述公文格式要求之處進行條件化處理,直至檢測符合要求終止;
13、所述文檔掃描模塊:用于掃描所述文檔,提取所述文檔設定的終止詞;并接收判斷模塊所發(fā)出的指令進行下一步操作;
14、所述文檔分析模塊:用于逐段落對所述文檔內容進行第一特征分析,所述第一特征分析內容包括:文檔標題、主送單位信息、落款及落款日期識別;然后對所述文檔內容進行第二特征分析,所述第二特征分析內容包括:一級標題、二級標題及多級標題識別,附件及正文等多要素信息識別;根據(jù)所述第一特征分析及第二特征分析結果,生成公文結構樹;
15、所述文檔判斷模塊:用于對所述文檔掃描模塊提供的終止詞進行判斷;若判斷所述終止詞后無段落或判斷所述終止詞后段落以特定格式開頭,則發(fā)送文檔掃描模塊終止掃描信號;否則發(fā)送繼續(xù)掃描信號至所述終止詞后無段落或所述終止詞后段落以特定格式開頭。
16、進一步地,所述最小段落要求至少包括5個段落,分別為:標題、主送單位、正文、落款及落款日期。
17、進一步地,在所述分析過程中,識別并忽略所述文檔中包含的:表格、圖像及圖表等相關元素。
18、進一步地,所述格式要求包括:替換所屬文檔中半角標點符號;刪除多余的空白行、空格和標點符號;設置文檔頁面格式,按照奇偶頁設置頁碼格式;計算并設置附件標題對齊的邊距;根據(jù)所述文檔落款的文本長度,計算并設置落款的右邊距;根據(jù)落款的位置,計算并設置落款及落款日期的右邊距。
19、第三方面,本發(fā)明提供了一種計算設備,包括:
20、存儲器,用于存儲程序指令;
21、處理器,用于調用所述存儲器中存儲的程序指令,按照獲得的程序指令執(zhí)行上述所述的一種公文智能排版方法。
22、第四方面,本發(fā)明提供一種計算機可讀存儲介質,包括,計算機可讀指令,當計算機讀取并執(zhí)行所述計算機可讀指令時,實現(xiàn)上述所述的一種公文智能排版方法,所述可讀介質可以為多個,所述多個可讀介質相互之間能夠獨立運行。
23、與現(xiàn)有技術相比,本方案通過檢測文檔段落數(shù)量是否滿足公文的最小段落要求,逐段對文檔內容進行特征分析,根據(jù)分析結果生成公文結構樹,根據(jù)格式要求掃描公文結構樹中各段落文字內容,檢測出其中不符合所述公文格式要求之處進行條件化處理,并設定終止詞,對終止詞進行判斷直至符合為止。實現(xiàn)了公文個性化定制的同時,也在公文編輯時,實現(xiàn)了更簡單、輕便、高效的自動排版,顯著提高企業(yè)公文排版效率。并且本發(fā)明提供的裝置根據(jù)計軟件環(huán)境自動安裝vsto運行支持庫,自動注冊為word或wps的擴展插件,降低工作人員使用門檻,帶來更好的使用體驗之余提高工作人員的整體工作效率。
1.一種公文智能排版方法,其特征在于,包括:
2.根據(jù)權利要求1所述的公文智能排版方法,其特征在于,所述最小段落要求至少包括5個段落,分別為:標題、主送單位、正文、落款及落款日期。
3.根據(jù)權利要求1所述的公文智能排版方法,其特征在于,在所述分析過程中,識別并忽略所述文檔中包含的:表格、圖像及圖表等相關元素。
4.根據(jù)權利要求1所述的公文智能排版方法,其特征在于,所述格式要求包括:替換所屬文檔中半角標點符號;刪除多余的空白行、空格和標點符號;設置文檔頁面格式,按照奇偶頁設置頁碼格式;計算并設置附件標題對齊的邊距;根據(jù)所述文檔落款的文本長度,計算并設置落款的右邊距;根據(jù)落款的位置,計算并設置落款及落款日期的右邊距。
5.一種公文智能排版裝置,其特征在于,所述裝置包括:文檔檢測模塊、文檔掃描模塊、文檔分析模塊、文檔判斷模塊;
6.根據(jù)權利要求5所述的公文智能排版裝置,其特征在于,所述最小段落要求至少包括5個段落,分別為:標題、主送單位、正文、落款及落款日期。
7.根據(jù)權利要求5所述的公文智能排版裝置,其特征在于,在所述分析過程中,識別并忽略所述文檔中包含的:表格、圖像及圖表等相關元素。
8.根據(jù)權利要求5所述的公文智能排版裝置,其特征在于,所述格式要求包括:替換所屬文檔中半角標點符號;刪除多余的空白行、空格和標點符號;設置文檔頁面格式,按照奇偶頁設置頁碼格式;計算并設置附件標題對齊的邊距;根據(jù)所述文檔落款的文本長度,計算并設置落款的右邊距;根據(jù)落款的位置,計算并設置落款及落款日期的右邊距。
9.一種計算設備,其特征在于,包括:
10.一種計算機可讀存儲介質,其特征在于,包括計算機可讀指令,當計算機讀取并執(zhí)行所述計算機可讀指令時,實現(xiàn)如權利要求1至4中任一項方法,所述可讀介質可以為多個,所述多個可讀介質相互之間能夠獨立運行。