本申請屬于數據處理,尤其涉及基于智能音箱的動態(tài)畫面生成方法與裝置。
背景技術:
1、隨著社會發(fā)展,各種智能家居逐漸走入人們的日常生活,智能音箱作為一種能夠播放各種音頻內容的智能家居設備,能夠滿足現(xiàn)代人在各種場景下的播放音樂需求,豐富了現(xiàn)代人的工作與生活。智能音箱的種類與功能也層出不窮。
2、在現(xiàn)有的智能音箱中,顯示屏僅用于顯示固定畫面或僅顯示歌詞內容以及時間信息,其中,固定畫面指的是歌詞顯示背景,通常由智能音箱的默認出廠配置確定,用戶在使用過程中無法對固定畫面進行更換,從而限制了智能音箱的適用范圍,且顯示的歌詞信息經常出現(xiàn)錯誤,降低了用戶在使用過程中的滿意度。
技術實現(xiàn)思路
1、有鑒于此,本申請實施例提供了一種基于智能音箱的動態(tài)畫面生成方法與裝置,通過將用戶上傳的視頻幀進行多維重建處理,并對歌詞進行糾錯后結合多維重建后的圖像進行顯示,以解決現(xiàn)有技術中對于歌詞顯示背景無法更換、顯示歌詞出現(xiàn)錯誤的問題,以豐富智能音箱的應用場景,提升用戶在智能音箱使用過程中的沉浸感與愉悅感。
2、本申請實施例的第一方面提供了一種基于智能音箱的動態(tài)畫面生成方法,包括:
3、獲取初始視頻幀信息、初始歌詞信息以及音頻信息;
4、對所述初始視頻幀信息進行多維重建處理,生成目的圖像信息;
5、對所述初始歌詞信息進行文本檢測與糾錯處理,得到目的歌詞信息;
6、根據所述目的圖像信息、所述目的歌詞信息以及所述音頻信息,得到動態(tài)畫面,以通過智能音箱的顯示屏進行顯示。
7、本申請實施例的第二方面提供了一種基于智能音箱的動態(tài)畫面生成裝置,包括:
8、信息獲取模塊,用于獲取初始視頻幀信息、初始歌詞信息以及音頻信息;
9、目的圖像信息生成模塊,用于對所述初始視頻幀信息進行多維重建處理,生成目的圖像信息;
10、目的歌詞信息生成模塊,用于對所述初始歌詞信息進行文本檢測與糾錯處理,得到目的歌詞信息;
11、動態(tài)畫面生成模塊,用于根據所述目的圖像信息、所述目的歌詞信息以及所述音頻信息,得到動態(tài)畫面,以通過智能音箱的顯示屏進行顯示。
12、本申請實施例與現(xiàn)有技術相比存在的有益效果是:本申請通過將用戶上傳的視頻幀進行多維重建處理,將多維重建后的圖像作為歌詞背景供顯示屏進行顯示,實現(xiàn)了歌詞背景的自定義,同時對獲取到的歌詞信息進行語義檢測,能夠對錯誤歌詞進行糾正,確保顯示正確的歌詞以供用戶進行即時演唱,從而增加了智能音箱的應用場景,有效提升用戶在使用過程中的沉浸感與愉悅感。
1.一種基于智能音箱的動態(tài)畫面生成方法,其特征在于,包括:
2.如權利要求1所述的基于智能音箱的動態(tài)畫面生成方法,其特征在于,所述對所述初始視頻幀信息進行多維重建處理,生成目的圖像信息的步驟,具體包括:
3.如權利要求2所述的基于智能音箱的動態(tài)畫面生成方法,其特征在于,
4.如權利要求3所述的基于智能音箱的動態(tài)畫面生成方法,其特征在于,所述根據所述視角顯示特征以及所述多維顯示位置坐標,生成目的圖像信息的步驟,具體包括:
5.如權利要求1所述的基于智能音箱的動態(tài)畫面生成方法,其特征在于,所述對所述初始歌詞信息進行文本檢測與糾錯處理,得到目的歌詞信息的步驟,具體包括:
6.如權利要求5所述的基于智能音箱的動態(tài)畫面生成方法,其特征在于,所述對所述歌詞文本向量與所述標準歌詞分句向量進行分析計算,得到距離度量值的步驟,具體包括:
7.如權利要求5所述的基于智能音箱的動態(tài)畫面生成方法,其特征在于,所述對所述初始歌詞信息進行糾錯處理,得到目的歌詞信息的步驟,具體包括:
8.如權利要求1所述的基于智能音箱的動態(tài)畫面生成方法,其特征在于,所述根據所述目的圖像信息、所述目的歌詞信息以及所述音頻信息,得到動態(tài)畫面的步驟,具體包括:
9.如權利要求8所述的基于智能音箱的動態(tài)畫面生成方法,其特征在于,所述將所述目的歌詞信息與所述音頻信息進行匹配,得到普通顯示歌詞信息與特效顯示歌詞信息的步驟,具體包括:
10.一種基于智能音箱的動態(tài)畫面生成裝置,其特征在于,包括: