本公開(kāi)涉及人工智能,尤其涉及計(jì)算機(jī)視覺(jué)、深度學(xué)習(xí)、大模型等,可應(yīng)用于aigc(artificial?intelligence?generative?content)、基于人工智能的內(nèi)容生成等場(chǎng)景。
背景技術(shù):
1、隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,用戶可以通過(guò)智能手機(jī)、平板電腦等智能終端設(shè)備來(lái)便捷地挑選想要觀看的視頻資源。例如可以通過(guò)智能終端來(lái)瀏覽視頻資源的海報(bào)圖像來(lái)了解視頻資源內(nèi)容,并針對(duì)海報(bào)圖像進(jìn)行點(diǎn)擊開(kāi)始瀏覽視頻。
技術(shù)實(shí)現(xiàn)思路
1、本公開(kāi)提供了一種圖像生成方法、裝置、電子設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品。
2、根據(jù)本公開(kāi)的一方面,提供了一種圖像生成方法,包括:響應(yīng)于海報(bào)生成請(qǐng)求,利用大模型處理視頻素材,得到海報(bào)圖像和標(biāo)題文本;基于海報(bào)圖像中關(guān)鍵視覺(jué)元素的元素屬性,在海報(bào)圖像中確定用于展示標(biāo)題文本的標(biāo)題區(qū)域,關(guān)鍵視覺(jué)元素是通過(guò)對(duì)海報(bào)圖像進(jìn)行目標(biāo)識(shí)別得到的;以及基于標(biāo)題區(qū)域融合海報(bào)圖像和標(biāo)題文本,得到目標(biāo)圖像。
3、根據(jù)本公開(kāi)的另一方面,提供了一種圖像生成裝置,包括:圖像與文本獲得模塊,用于響應(yīng)于海報(bào)生成請(qǐng)求,利用大模型處理視頻素材,得到海報(bào)圖像和標(biāo)題文本;標(biāo)題區(qū)域獲得模塊,用于基于海報(bào)圖像中關(guān)鍵視覺(jué)元素的元素屬性,在海報(bào)圖像中確定用于展示標(biāo)題文本的標(biāo)題區(qū)域,關(guān)鍵視覺(jué)元素是通過(guò)對(duì)海報(bào)圖像進(jìn)行目標(biāo)識(shí)別得到的;以及目標(biāo)圖像獲得模塊,用于基于標(biāo)題區(qū)域融合海報(bào)圖像和標(biāo)題文本,得到目標(biāo)圖像。
4、根據(jù)本公開(kāi)的另一方面,提供了一種電子設(shè)備,包括:至少一個(gè)處理器;以及與所述至少一個(gè)處理器通信連接的存儲(chǔ)器;其中,所述存儲(chǔ)器存儲(chǔ)有可被所述至少一個(gè)處理器執(zhí)行的指令,所述指令被所述至少一個(gè)處理器執(zhí)行,以使所述至少一個(gè)處理器能夠執(zhí)行本公開(kāi)實(shí)施例提供的方法。
5、根據(jù)本公開(kāi)的另一方面,提供了一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中,所述計(jì)算機(jī)指令用于使所述計(jì)算機(jī)執(zhí)行本公開(kāi)實(shí)施例提供的方法。
6、根據(jù)本公開(kāi)的另一方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)本公開(kāi)實(shí)施例提供的方法。
7、應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識(shí)本公開(kāi)的實(shí)施例的關(guān)鍵或重要特征,也不用于限制本公開(kāi)的范圍。本公開(kāi)的其它特征將通過(guò)以下的說(shuō)明書(shū)而變得容易理解。
1.一種圖像生成方法,包括:
2.根據(jù)權(quán)利要求1所述的方法,其中,所述基于所述海報(bào)圖像中關(guān)鍵視覺(jué)元素的元素屬性,在所述海報(bào)圖像中確定用于展示所述標(biāo)題文本的標(biāo)題區(qū)域包括:
3.根據(jù)權(quán)利要求2所述的方法,其中,所述基于多個(gè)所述初始標(biāo)題區(qū)域各自的區(qū)域面積,從多個(gè)所述初始標(biāo)題區(qū)域中確定所述標(biāo)題區(qū)域包括:
4.根據(jù)權(quán)利要求3所述的方法,其中,所述指定圖像元素包括以下至少一項(xiàng):
5.根據(jù)權(quán)利要求1所述的方法,其中,所述基于所述海報(bào)圖像中關(guān)鍵視覺(jué)元素的元素屬性,在所述海報(bào)圖像中確定用于展示所述標(biāo)題文本的標(biāo)題區(qū)域包括:
6.根據(jù)權(quán)利要求5所述的方法,其中,所述標(biāo)題區(qū)域滿足以下至少一項(xiàng)形態(tài)適配條件:
7.根據(jù)權(quán)利要求1所述的方法,其中,所述基于所述標(biāo)題區(qū)域融合所述海報(bào)圖像和所述標(biāo)題文本,得到目標(biāo)圖像包括:
8.根據(jù)權(quán)利要求7所述的方法,其中,所述基于所述標(biāo)題區(qū)域的區(qū)域形態(tài)屬性確定標(biāo)題排列方式包括:
9.根據(jù)權(quán)利要求7所述的方法,其中,所述標(biāo)題文本元素是基于如下操作確定的:
10.根據(jù)權(quán)利要求1所述的方法,其中,所述利用大模型處理視頻素材,得到海報(bào)圖像和標(biāo)題文本包括:
11.一種圖像生成裝置,包括:
12.根據(jù)權(quán)利要求11所述的裝置,其中,所述標(biāo)題區(qū)域獲得模塊包括:
13.根據(jù)權(quán)利要求12所述的裝置,其中,所述第一標(biāo)題區(qū)域獲得子模塊包括:
14.根據(jù)權(quán)利要求11所述的裝置,其中,所述標(biāo)題區(qū)域獲得模塊包括:
15.根據(jù)權(quán)利要求14所述的裝置,其中,所述標(biāo)題區(qū)域滿足以下至少一項(xiàng)形態(tài)適配條件:
16.根據(jù)權(quán)利要求11所述的裝置,其中,所述目標(biāo)圖像獲得模塊包括:
17.根據(jù)權(quán)利要求16所述的裝置,其中,所述標(biāo)題排列方式確定子模塊包括:
18.一種電子設(shè)備,包括:
19.一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中,所述計(jì)算機(jī)指令用于使所述計(jì)算機(jī)執(zhí)行根據(jù)權(quán)利要求1至10中任一項(xiàng)所述的方法。
20.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)根據(jù)權(quán)利要求1至10中任一項(xiàng)所述的方法。