電子文檔生成系統(tǒng)以及電子文檔生成裝置的制造方法【
技術領域:
】[0001]本發(fā)明涉及生成電子文檔的電子文檔生成系統(tǒng)以及與此相關的技術。【
背景技術:
】[0002]在MFP(多功能一體機(Mult1-Funct1nalPeripheral))等的圖像形成裝置中,存在掃描原稿來制作電子文檔的技術。[0003]在這種電子文檔生成技術中,存在通過將掃描圖像內的字符區(qū)域和非字符區(qū)域(照片區(qū)域等)分離,以比較高的壓縮率壓縮非字符區(qū)域,并且以比較低的壓縮率壓縮字符區(qū)域,來生成電子文檔(例如緊湊roF)的技術(參照專利文獻1等)。由此,能夠維持字符的容易觀看性并且減少電子文檔文件的容量(緊湊化)。[0004]另外,也存在生成帶文本數據電子文檔(下述)的技術(參照專利文獻2等)。具體而言,對于原稿的掃描圖像(特別是表示字符的圖像)實施了光學字符識別處理(以下,也稱為OCR(OpticalCharacterRecognit1n)處理),該掃描圖像內的字符的文本數據被自動識別,該文本數據以非顯示狀態(tài)重疊嵌入該掃描圖像。這樣一來,例如,生成了被稱為帶透明文本H)F(PortableDocumentFormat)(或者可檢索的FOF)等的規(guī)定形式的電子文檔(帶文本數據電子文檔)。[0005]另外,也存在生成被緊湊化(高壓縮化)并且可檢索化的電子文檔(例如,也稱為可檢索的緊湊PDF文件等)的技術。在該技術中,進行了由用于緊湊化的一系列的子處理(區(qū)域分離處理以及壓縮處理等)構成的處理(也稱為緊湊化處理)和用于可檢索化的OCR處理(也稱為可檢索化處理),并基于兩處理的結果生成了電子文檔。[0006]專利文獻1:日本特開2008-193234號公報[0007]專利文獻2:日本特開2012—073749號公報[0008]然而,基于掃描圖像生成電子文檔的裝置(電子文檔生成裝置)并不是除了上述的由一系列的子處理構成的處理(緊湊化處理)以外還進行OCR處理(可檢索化處理),而是考慮使與該電子文檔生成裝置不同的其它的裝置(也稱為協(xié)作目標裝置)執(zhí)行OCR處理。更詳細而言,考慮有電子文檔生成裝置首先執(zhí)行該一系列的子處理,之后使協(xié)作目標裝置(云服務器等)進行OCR處理,利用從該協(xié)作目標裝置接收到的OCR結果生成電子文檔。[0009]然而,在這樣的處理中,在一系列的子處理被連續(xù)執(zhí)行完成之后,才進一步執(zhí)行與該一系列的子處理不同的其它的處理亦即OCR處理。因此,直至該一系列的子處理結束為止,協(xié)作目標裝置無法執(zhí)行OCR處理,無法進行高效的處理?!?br/>發(fā)明內容】[0010]因此,該發(fā)明的課題在于,提供在由多個裝置協(xié)作生成電子文檔的技術中,能夠更高效地生成電子文檔的技術。[0011]為了解決上述課題,第一方面的發(fā)明是生成電子文檔的電子文檔生成系統(tǒng),其特征在于,具備:第一裝置,其執(zhí)行用于根據原稿的掃描圖像生成電子文檔的第一處理;以及第二裝置,其基于來自上述第一裝置的委托,執(zhí)行用于生成上述電子文檔的第二處理,并將該第二處理的處理結果發(fā)送至上述第一裝置,上述第一裝置具備:處理執(zhí)行單元,其是執(zhí)行上述第一處理的處理執(zhí)行單元,若在構成上述第一處理的多個子處理中的任意一個中生成在上述第二處理中利用的數據,則在上述多個子處理中未執(zhí)行的殘余的處理存在的階段將上述數據發(fā)送至上述第二裝置,并且繼續(xù)執(zhí)行上述多個子處理中的殘余的處理;接收單元,其從上述第二裝置接收由上述第二裝置對于上述數據執(zhí)行的上述第二處理的處理結果;以及生成單元,其基于上述處理執(zhí)行單元的上述第一處理的處理結果和由上述接收單元接收到的上述第二處理的處理結果,生成上述電子文檔。[0012]第二方面的發(fā)明的特征在于,在第一方面的發(fā)明的電子文檔生成系統(tǒng)中,上述第二處理與由上述第一裝置的上述處理執(zhí)行單元執(zhí)行的上述殘余的處理的至少一部分并行地由上述第二裝置執(zhí)行。[0013]第三方面的發(fā)明的特征在于,在第一方面或者第二方面的發(fā)明的電子文檔生成系統(tǒng)中,若上述第一裝置的上述處理執(zhí)行單元在是上述多個子處理中的任意一個的規(guī)定的處理中生成上述數據,則將上述數據發(fā)送至上述第二裝置并使上述第二裝置執(zhí)行上述第二處理,并且使用上述規(guī)定的處理的處理結果繼續(xù)執(zhí)行上述殘余的處理。[0014]第四方面的發(fā)明的特征在于,在第三方面的發(fā)明的電子文檔生成系統(tǒng)中,上述規(guī)定的處理是從上述掃描圖像分離字符區(qū)域的字符區(qū)域分離處理。[0015]第五方面的發(fā)明的特征在于,在第四方面的發(fā)明的電子文檔生成系統(tǒng)中,上述第二處理包括關于上述字符區(qū)域的光學字符識別處理。[0016]第六方面的發(fā)明的特征在于,在第一方面的發(fā)明的電子文檔生成系統(tǒng)中,上述第一處理包括:從上述掃描圖像分離字符區(qū)域的字符區(qū)域分離處理、從上述掃描圖像分離非字符區(qū)域的非字符區(qū)域分離處理、針對上述字符區(qū)域的第一壓縮處理、以及針對上述非字符區(qū)域的第二壓縮處理,上述第二處理包括關于上述字符區(qū)域的光學字符識別處理,若上述處理執(zhí)行單元在上述多個子處理中的上述字符區(qū)域分離處理中生成在上述第二處理中利用的字符區(qū)域圖像數據,則將上述字符區(qū)域圖像數據發(fā)送至上述第二裝置,并且繼續(xù)執(zhí)行上述多個子處理中上述字符區(qū)域分離處理之后進行的殘余的處理,上述接收單元從上述第二裝置接收與由上述處理執(zhí)行單元執(zhí)行的上述殘余的處理的至少一部分并行地由上述第二裝置執(zhí)行的上述第二處理的處理結果,上述生成單元基于上述處理執(zhí)行單元的上述第一處理的處理結果和由上述接收單元接收到的上述第二處理的處理結果,生成上述電子文檔,其中,上述電子文檔具有分別以相互不同的壓縮率壓縮上述字符區(qū)域和上述非字符區(qū)域而得到的各圖像,并且具有上述光學字符識別處理的處理結果的文本數據。[0017]第七方面的發(fā)明的特征在于,在第一方面的發(fā)明的電子文檔生成系統(tǒng)中,上述第一處理包括從上述掃描圖像分離字符區(qū)域的字符區(qū)域分離處理和從上述掃描圖像分離照片區(qū)域來生成照片區(qū)域圖像數據的照片區(qū)域分離處理,上述第二處理包括關于上述字符區(qū)域的光學字符識別處理,若上述處理執(zhí)行單元在上述多個子處理中的上述字符區(qū)域分離處理中生成在上述第二處理中利用的字符區(qū)域圖像數據,則將上述字符區(qū)域圖像數據發(fā)送至上述第二裝置,并且繼續(xù)執(zhí)行上述多個子處理中上述字符區(qū)域分離處理之后進行的殘余的處理,上述接收單元從上述第二裝置接收與由上述處理執(zhí)行單元執(zhí)行的上述殘余的處理的至少一部分并行地由上述協(xié)作目標裝置執(zhí)行的上述第二處理的處理結果,上述生成單元基于上述處理執(zhí)行單元的上述第一處理的處理結果和由上述接收單元接收到的上述第二處理的處理結果生成上述電子文檔,其中,上述電子文檔具有上述照片區(qū)域和上述光學字符識別處理的處理結果的文本數據。[0018]第八方面的發(fā)明的特征在于,在第七方面的發(fā)明的電子文檔生成系統(tǒng)中,還具備第三裝置,其基于來自上述第一裝置的委托,執(zhí)行用于生成上述電子文檔的第三處理,并將該第三處理的處理結果發(fā)送至上述第一裝置,上述第一處理還包括從上述掃描圖像分離與上述字符區(qū)域和上述照片區(qū)域都不同的特定種類的區(qū)域的特定區(qū)域分離處理,上述第三處理包括從包括多個個別照片區(qū)域的上述照片區(qū)域圖像數據分別剪切出上述多個個別照片區(qū)域的個別區(qū)域剪切處理,若上述處理執(zhí)行單元在上述多個子處理中的上述照片區(qū)域分離處理中生成在上述第三處理中利用的上述照片區(qū)域圖像數據,則將上述照片區(qū)域圖像數據發(fā)送至上述第三目標裝置,并且繼續(xù)執(zhí)行上述多個子處理中上述照片區(qū)域分離處理之后進行的殘余的處理,上述接收單元從上述第三裝置接收與上述照片區(qū)域分離處理之后進行的上述殘余的處理的至少一部分并行地由上述第三裝置執(zhí)行的上述第三處理的處理結果,上述生成單元基于上述處理執(zhí)行單元的上述第一處理的處理結果、由上述接收單元接收到的上述第二處理的處理結果、以及由上述接收單元接收到的上述第三處理的處理結果生成上述電子文檔,其中,上述電子文檔具有上述特定種類的區(qū)域、上述多個個別照片區(qū)域、以及上述光學字符識別處理的處理結果的文本數據。[0019]第九方面的發(fā)明的特征在于,在第一方面至第八方面的任意一項的發(fā)明的電子文檔生成系統(tǒng)中,上述第一裝置是信息終端,上述第二裝置是服務器。[0020]第十方面的發(fā)明的特征在于,在第一方面至第八方面的任意一項的發(fā)明的電子文檔生成系統(tǒng)中,上述第一裝置是圖像形成裝置,上述第二裝置是服務器。[0021]第十一方面的發(fā)明的特征在于,在第一方面至第八方面的任意一項的發(fā)明的電子文檔生成系統(tǒng)中,上述第一裝置是圖像形成裝置,上述第二裝置是信息終端。[0022]第十二方面的發(fā)明是與協(xié)作目標裝置協(xié)作來生成電子文檔的電子文檔生成裝置,其特征在于,具備:處理執(zhí)行單元,其是執(zhí)行用于根據原稿的掃描圖像生成電子文檔的第一處理的處理執(zhí)行單元,若在構成上述第一處理的多個子處理中的任意一個中生成在由上述協(xié)作目標裝置執(zhí)行的第二處理中利用的數據,則在上述多個子處理中未執(zhí)行的殘余的處理存在的階段將上述數據發(fā)送至上述協(xié)作目標裝置,并且繼續(xù)執(zhí)行上述多個子處理中的殘余的處理;接收單元,其從上述協(xié)作目標裝置接收由上述協(xié)作目標裝置對于上述數據執(zhí)行的上述第二處理的處理結果;以及生成單元,其基于上述處理執(zhí)行單元的上述第一處理的處理結果和由上述接收單元接收到的上述第二處理的處理結果,生成上述電子文檔。[0023]第十三方面的發(fā)明的特征在于,在第十二方面的發(fā)明的電子文檔生成裝置中,上述接收單元從上述協(xié)作目標裝置接收與由上述處理執(zhí)行單元執(zhí)行的上述殘余的處理的至少一部分并行地由上述協(xié)作目標裝置執(zhí)行的上述第二處理的處理結果。[0024]第十四方面的發(fā)明的特征在于,在第十二方面或者第十三方面的發(fā)明的電子文檔生成裝置中,若上述處理執(zhí)行單元在是上述多個子處理中的任意一個的規(guī)定的處理中生成上述數據,則將上述數據發(fā)送至上述協(xié)作目標裝置并使上述協(xié)作目標裝置執(zhí)行上述第二處理,并且使用上述規(guī)定的處理的處理結果繼續(xù)執(zhí)行上述殘余的處理。[0025]第十五方面的發(fā)明的特征在于,在第十四方面的發(fā)明的電子文檔生成裝置中,上述規(guī)定的處理是從上述掃描圖像分離字符區(qū)域的字符區(qū)域分離處理。[0026]第十六方面的發(fā)明的特征在于,在第十五方面的發(fā)明的電子文檔生成裝置中,上述第二處理包括關于上述字符區(qū)域的光學字符識別處理。[0027]第十七方面的發(fā)明的特征在于,在第十二方面的發(fā)明的電子文檔生成裝置中,上述第一處理包括:從上述掃描圖像分離字符區(qū)域的字符區(qū)域分離處理、從上述掃描圖像分離非字符區(qū)域的非字符區(qū)域分離處理、針對上述字符區(qū)域的第一壓縮處理、以及針對上述非字符區(qū)域的第二壓縮處理,上述第二處理包括關于上述字符區(qū)域的光學字符識別處理,若上述處理執(zhí)行單元在上述多個子處理中的上述字符區(qū)域分離處理中生成在上述第二處理中利用的字符區(qū)域圖像數據,則將上述字符區(qū)域圖像數據發(fā)送至上述協(xié)作目標裝置,并且繼續(xù)執(zhí)行上述多個子處理中上述字符區(qū)域分離處理之后進行的殘余的處理,上述接收單元從上述協(xié)作目標裝置接收與由上述處理執(zhí)行單元執(zhí)行的上述殘余的處理的至少一部分并行地由上述協(xié)作目標裝置執(zhí)行的上述第二處理的處理結果,上述生成單元基于上述處理執(zhí)行單元的上述第一處理的處理結果和由上述接收單元接收到的上述第二處理的處理結果,生成上述電子文檔,其中,上述電子文檔具有分別以相互不同的壓縮率壓縮上述字符區(qū)域和上述非字當前第1頁1 2 3 4 5 6