圖像生成方法、裝置、電子設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品與流程

文檔序號(hào)：40653844發(fā)布日期：2025-01-10 19:02閱讀：10來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

圖像生成方法、裝置、電子設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品與流程

本公開(kāi)涉及人工智能，尤其涉及計(jì)算機(jī)視覺(jué)、深度學(xué)習(xí)、大模型等，可應(yīng)用于aigc（artificial?intelligence?generative?content）、基于人工智能的內(nèi)容生成等場(chǎng)景。

背景技術(shù)：

1、隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展，用戶可以通過(guò)智能手機(jī)、平板電腦等智能終端設(shè)備來(lái)便捷地挑選想要觀看的視頻資源。例如可以通過(guò)智能終端來(lái)瀏覽視頻資源的海報(bào)圖像來(lái)了解視頻資源內(nèi)容，并針對(duì)海報(bào)圖像進(jìn)行點(diǎn)擊開(kāi)始瀏覽視頻。

技術(shù)實(shí)現(xiàn)思路

1、本公開(kāi)提供了一種圖像生成方法、裝置、電子設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品。

2、根據(jù)本公開(kāi)的一方面，提供了一種圖像生成方法，包括：響應(yīng)于海報(bào)生成請(qǐng)求，利用大模型處理視頻素材，得到海報(bào)圖像和標(biāo)題文本；基于海報(bào)圖像中關(guān)鍵視覺(jué)元素的元素屬性，在海報(bào)圖像中確定用于展示標(biāo)題文本的標(biāo)題區(qū)域，關(guān)鍵視覺(jué)元素是通過(guò)對(duì)海報(bào)圖像進(jìn)行目標(biāo)識(shí)別得到的；以及基于標(biāo)題區(qū)域融合海報(bào)圖像和標(biāo)題文本，得到目標(biāo)圖像。

3、根據(jù)本公開(kāi)的另一方面，提供了一種圖像生成裝置，包括：圖像與文本獲得模塊，用于響應(yīng)于海報(bào)生成請(qǐng)求，利用大模型處理視頻素材，得到海報(bào)圖像和標(biāo)題文本；標(biāo)題區(qū)域獲得模塊，用于基于海報(bào)圖像中關(guān)鍵視覺(jué)元素的元素屬性，在海報(bào)圖像中確定用于展示標(biāo)題文本的標(biāo)題區(qū)域，關(guān)鍵視覺(jué)元素是通過(guò)對(duì)海報(bào)圖像進(jìn)行目標(biāo)識(shí)別得到的；以及目標(biāo)圖像獲得模塊，用于基于標(biāo)題區(qū)域融合海報(bào)圖像和標(biāo)題文本，得到目標(biāo)圖像。

4、根據(jù)本公開(kāi)的另一方面，提供了一種電子設(shè)備，包括：至少一個(gè)處理器；以及與所述至少一個(gè)處理器通信連接的存儲(chǔ)器；其中，所述存儲(chǔ)器存儲(chǔ)有可被所述至少一個(gè)處理器執(zhí)行的指令，所述指令被所述至少一個(gè)處理器執(zhí)行，以使所述至少一個(gè)處理器能夠執(zhí)行本公開(kāi)實(shí)施例提供的方法。

5、根據(jù)本公開(kāi)的另一方面，提供了一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其中，所述計(jì)算機(jī)指令用于使所述計(jì)算機(jī)執(zhí)行本公開(kāi)實(shí)施例提供的方法。

6、根據(jù)本公開(kāi)的另一方面，提供了一種計(jì)算機(jī)程序產(chǎn)品，包括計(jì)算機(jī)程序，所述計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)本公開(kāi)實(shí)施例提供的方法。

7、應(yīng)當(dāng)理解，本部分所描述的內(nèi)容并非旨在標(biāo)識(shí)本公開(kāi)的實(shí)施例的關(guān)鍵或重要特征，也不用于限制本公開(kāi)的范圍。本公開(kāi)的其它特征將通過(guò)以下的說(shuō)明書(shū)而變得容易理解。

技術(shù)特征：

1.一種圖像生成方法，包括：

2.根據(jù)權(quán)利要求1所述的方法，其中，所述基于所述海報(bào)圖像中關(guān)鍵視覺(jué)元素的元素屬性，在所述海報(bào)圖像中確定用于展示所述標(biāo)題文本的標(biāo)題區(qū)域包括：

3.根據(jù)權(quán)利要求2所述的方法，其中，所述基于多個(gè)所述初始標(biāo)題區(qū)域各自的區(qū)域面積，從多個(gè)所述初始標(biāo)題區(qū)域中確定所述標(biāo)題區(qū)域包括：

4.根據(jù)權(quán)利要求3所述的方法，其中，所述指定圖像元素包括以下至少一項(xiàng)：

5.根據(jù)權(quán)利要求1所述的方法，其中，所述基于所述海報(bào)圖像中關(guān)鍵視覺(jué)元素的元素屬性，在所述海報(bào)圖像中確定用于展示所述標(biāo)題文本的標(biāo)題區(qū)域包括：

6.根據(jù)權(quán)利要求5所述的方法，其中，所述標(biāo)題區(qū)域滿足以下至少一項(xiàng)形態(tài)適配條件：

7.根據(jù)權(quán)利要求1所述的方法，其中，所述基于所述標(biāo)題區(qū)域融合所述海報(bào)圖像和所述標(biāo)題文本，得到目標(biāo)圖像包括：

8.根據(jù)權(quán)利要求7所述的方法，其中，所述基于所述標(biāo)題區(qū)域的區(qū)域形態(tài)屬性確定標(biāo)題排列方式包括：

9.根據(jù)權(quán)利要求7所述的方法，其中，所述標(biāo)題文本元素是基于如下操作確定的：

10.根據(jù)權(quán)利要求1所述的方法，其中，所述利用大模型處理視頻素材，得到海報(bào)圖像和標(biāo)題文本包括：

11.一種圖像生成裝置，包括：

12.根據(jù)權(quán)利要求11所述的裝置，其中，所述標(biāo)題區(qū)域獲得模塊包括：

13.根據(jù)權(quán)利要求12所述的裝置，其中，所述第一標(biāo)題區(qū)域獲得子模塊包括：

14.根據(jù)權(quán)利要求11所述的裝置，其中，所述標(biāo)題區(qū)域獲得模塊包括：

15.根據(jù)權(quán)利要求14所述的裝置，其中，所述標(biāo)題區(qū)域滿足以下至少一項(xiàng)形態(tài)適配條件：

16.根據(jù)權(quán)利要求11所述的裝置，其中，所述目標(biāo)圖像獲得模塊包括：

17.根據(jù)權(quán)利要求16所述的裝置，其中，所述標(biāo)題排列方式確定子模塊包括：

18.一種電子設(shè)備，包括：

19.一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其中，所述計(jì)算機(jī)指令用于使所述計(jì)算機(jī)執(zhí)行根據(jù)權(quán)利要求1至10中任一項(xiàng)所述的方法。

20.一種計(jì)算機(jī)程序產(chǎn)品，包括計(jì)算機(jī)程序，所述計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)根據(jù)權(quán)利要求1至10中任一項(xiàng)所述的方法。

技術(shù)總結(jié)
本公開(kāi)提供了圖像生成方法、裝置、電子設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品，涉及人工智能技術(shù)領(lǐng)域，尤其涉及計(jì)算機(jī)視覺(jué)、深度學(xué)習(xí)、大模型等技術(shù)領(lǐng)域，可應(yīng)用于AIGC、基于人工智能的內(nèi)容生成等場(chǎng)景。具體實(shí)現(xiàn)方案為：響應(yīng)于海報(bào)生成請(qǐng)求，利用大模型處理視頻素材，得到海報(bào)圖像和標(biāo)題文本；基于海報(bào)圖像中關(guān)鍵視覺(jué)元素的元素屬性，在海報(bào)圖像中確定用于展示標(biāo)題文本的標(biāo)題區(qū)域，關(guān)鍵視覺(jué)元素是通過(guò)對(duì)海報(bào)圖像進(jìn)行目標(biāo)識(shí)別得到的；以及基于標(biāo)題區(qū)域融合海報(bào)圖像和標(biāo)題文本，得到目標(biāo)圖像。

技術(shù)研發(fā)人員：鐘銘,宋雨鑫
受保護(hù)的技術(shù)使用者：北京百度網(wǎng)訊科技有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/1/9

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：鐘銘,宋雨鑫
技術(shù)所有人：北京百度網(wǎng)訊科技有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

圖像生成方法、裝置、電子設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品與流程

圖像生成方法、裝置、電子設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品與流程