一種基于智能音箱的動態(tài)畫面生成方法與裝置與流程

文檔序號：40621766發(fā)布日期：2025-01-10 18:27閱讀：2來源：國知局

本申請屬于數據處理，尤其涉及基于智能音箱的動態(tài)畫面生成方法與裝置。

背景技術：

1、隨著社會發(fā)展，各種智能家居逐漸走入人們的日常生活，智能音箱作為一種能夠播放各種音頻內容的智能家居設備，能夠滿足現(xiàn)代人在各種場景下的播放音樂需求，豐富了現(xiàn)代人的工作與生活。智能音箱的種類與功能也層出不窮。

2、在現(xiàn)有的智能音箱中，顯示屏僅用于顯示固定畫面或僅顯示歌詞內容以及時間信息，其中，固定畫面指的是歌詞顯示背景，通常由智能音箱的默認出廠配置確定，用戶在使用過程中無法對固定畫面進行更換，從而限制了智能音箱的適用范圍，且顯示的歌詞信息經常出現(xiàn)錯誤，降低了用戶在使用過程中的滿意度。

技術實現(xiàn)思路

1、有鑒于此，本申請實施例提供了一種基于智能音箱的動態(tài)畫面生成方法與裝置，通過將用戶上傳的視頻幀進行多維重建處理，并對歌詞進行糾錯后結合多維重建后的圖像進行顯示，以解決現(xiàn)有技術中對于歌詞顯示背景無法更換、顯示歌詞出現(xiàn)錯誤的問題，以豐富智能音箱的應用場景，提升用戶在智能音箱使用過程中的沉浸感與愉悅感。

2、本申請實施例的第一方面提供了一種基于智能音箱的動態(tài)畫面生成方法，包括：

3、獲取初始視頻幀信息、初始歌詞信息以及音頻信息；

4、對所述初始視頻幀信息進行多維重建處理，生成目的圖像信息；

5、對所述初始歌詞信息進行文本檢測與糾錯處理，得到目的歌詞信息；

6、根據所述目的圖像信息、所述目的歌詞信息以及所述音頻信息，得到動態(tài)畫面，以通過智能音箱的顯示屏進行顯示。

7、本申請實施例的第二方面提供了一種基于智能音箱的動態(tài)畫面生成裝置，包括：

8、信息獲取模塊，用于獲取初始視頻幀信息、初始歌詞信息以及音頻信息；

9、目的圖像信息生成模塊，用于對所述初始視頻幀信息進行多維重建處理，生成目的圖像信息；

10、目的歌詞信息生成模塊，用于對所述初始歌詞信息進行文本檢測與糾錯處理，得到目的歌詞信息；

11、動態(tài)畫面生成模塊，用于根據所述目的圖像信息、所述目的歌詞信息以及所述音頻信息，得到動態(tài)畫面，以通過智能音箱的顯示屏進行顯示。

12、本申請實施例與現(xiàn)有技術相比存在的有益效果是：本申請通過將用戶上傳的視頻幀進行多維重建處理，將多維重建后的圖像作為歌詞背景供顯示屏進行顯示，實現(xiàn)了歌詞背景的自定義，同時對獲取到的歌詞信息進行語義檢測，能夠對錯誤歌詞進行糾正，確保顯示正確的歌詞以供用戶進行即時演唱，從而增加了智能音箱的應用場景，有效提升用戶在使用過程中的沉浸感與愉悅感。

技術特征：

1.一種基于智能音箱的動態(tài)畫面生成方法，其特征在于，包括：

2.如權利要求1所述的基于智能音箱的動態(tài)畫面生成方法，其特征在于，所述對所述初始視頻幀信息進行多維重建處理，生成目的圖像信息的步驟，具體包括：

3.如權利要求2所述的基于智能音箱的動態(tài)畫面生成方法，其特征在于，

4.如權利要求3所述的基于智能音箱的動態(tài)畫面生成方法，其特征在于，所述根據所述視角顯示特征以及所述多維顯示位置坐標，生成目的圖像信息的步驟，具體包括：

5.如權利要求1所述的基于智能音箱的動態(tài)畫面生成方法，其特征在于，所述對所述初始歌詞信息進行文本檢測與糾錯處理，得到目的歌詞信息的步驟，具體包括：

6.如權利要求5所述的基于智能音箱的動態(tài)畫面生成方法，其特征在于，所述對所述歌詞文本向量與所述標準歌詞分句向量進行分析計算，得到距離度量值的步驟，具體包括：

7.如權利要求5所述的基于智能音箱的動態(tài)畫面生成方法，其特征在于，所述對所述初始歌詞信息進行糾錯處理，得到目的歌詞信息的步驟，具體包括：

8.如權利要求1所述的基于智能音箱的動態(tài)畫面生成方法，其特征在于，所述根據所述目的圖像信息、所述目的歌詞信息以及所述音頻信息，得到動態(tài)畫面的步驟，具體包括：

9.如權利要求8所述的基于智能音箱的動態(tài)畫面生成方法，其特征在于，所述將所述目的歌詞信息與所述音頻信息進行匹配，得到普通顯示歌詞信息與特效顯示歌詞信息的步驟，具體包括：

10.一種基于智能音箱的動態(tài)畫面生成裝置，其特征在于，包括：

技術總結
本申請?zhí)峁┝艘环N基于智能音箱的動態(tài)畫面生成方法與裝置，適用于數據處理技術領域，該方法包括：獲取初始視頻幀信息、初始歌詞信息以及音頻信息；對所述初始視頻幀信息進行多維重建處理，生成目的圖像信息；對所述初始歌詞信息進行文本檢測與糾錯處理，得到目的歌詞信息；根據所述目的圖像信息、所述目的歌詞信息以及所述音頻信息，得到動態(tài)畫面，以通過智能音箱的顯示屏進行顯示。本申請將上傳的視頻幀圖像進行多維重建，實現(xiàn)歌詞背景圖像的自定義并增強背景圖像的視覺效果，將獲取到的歌詞進行差錯檢測和糾錯，確保用戶跟隨正確的歌詞進行演唱，將多維重建的圖像與糾錯后的歌詞組合后通過智能音箱的顯示屏動態(tài)輸出，以全面提升用戶體驗感。

技術研發(fā)人員：范紅忠
受保護的技術使用者：深圳更美日記科技有限公司
技術研發(fā)日：
技術公布日：2025/1/9

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：范紅忠
技術所有人：深圳更美日記科技有限公司
我是此專利的發(fā)明人

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、王老師：1.數字信號處理 2.傳感器技術及應用 3.機電一體化產品開發(fā) 4.機械工程測試技術 5.逆向工程技術研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設計 2.汽車檢測系統(tǒng)設計 3.汽車電子控制系統(tǒng)設計
4、畢老師：機構動力學與控制
5、袁老師：1.計算機視覺 2.無線網絡及物聯(lián)網
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種基于智能音箱的動態(tài)畫面生成方法與裝置與流程