進,主要改進之處在于:在本發(fā)明第三實施方式中,在標記位置處還插入備注,在回放過程中方便用戶了解音頻或視頻的內(nèi)容,從而提高信息獲取效率。
[0055]具體地說,在記錄文件中除了記錄插入標記的位置之外,還同時記載一些備注,比如,文字、錄音、圖片或錄像中的一種或幾種,來簡要記錄標記位置對應(yīng)的音視頻內(nèi)容。
[0056]如果是插入文字作為備注,可以提供人機交互界面,允許用戶輸入;也可以采用語音處理軟件,對語音進行自動識別分析,比如,智能識別在標記點(或檢測點)處的5-20秒的語音,自動轉(zhuǎn)化成文字并自動備注;也可以提取打點位置對應(yīng)這段話的關(guān)鍵詞作為文字備注,實現(xiàn)自動插入文字備注,方便用戶使用。目前的關(guān)鍵詞提取技術(shù)均可用于本實施方式,在此不--贅述。在本實施方式中,如果插入文字備注,可以直接在時間標簽[分鐘數(shù):
秒數(shù)]之后寫入用戶輸入的文字或提取的關(guān)鍵字。
[0057]如果插入語音作為備注,可以錄一小段語音,將這一小段錄音的地址記載到記錄文件中,比如,在[分鐘數(shù):秒數(shù)]之后寫入這一小段錄音的存儲地址以及文件名。
[0058]插入圖片或錄像的情形與插入語音類似,時間標簽[分鐘數(shù):秒數(shù)]之后寫入圖片或錄像的存儲地址以及文件名即可。這種情況特別適用于在重要會議或老師授課中,演示文稿(PPT)的某一張很重要,則可以拍照與一段錄音對應(yīng),方便后續(xù)對照觀看和回放。如果某一場景非常重要,則可以錄像,以便與錄音對應(yīng),從而解決了長時間錄像時,視頻文件過大的問題,又能記錄較為重要的場景。如果采用具有雙攝像頭的設(shè)備,則可錄制小段視頻作為備注。另外,也可以對標記點(或檢測點)處的視頻文件進行分析并切圖,將得到的圖片作為備注,可實現(xiàn)自動插入圖片或視頻備注,方便用戶使用。
[0059]此外,值得說明的是,備注的內(nèi)容也可以在音視頻錄制過程中,或者錄制完畢之后,根據(jù)需要自由修改。比如,在回放中,覺得備注內(nèi)容寫得太簡單,可以增加備注內(nèi)容;或者原來的備注內(nèi)容不準確,則修改該備注內(nèi)容,現(xiàn)有的音視頻編輯軟件已經(jīng)可以實現(xiàn)備注內(nèi)容的增加或修改,本實施方式的重點也不在于如何實現(xiàn)備注內(nèi)容的修改,此處不詳細闡述。
[0060]本發(fā)明的第四實施方式涉及一種音頻或視頻的錄制方法。第四實施方式在第一至第三實施方式基礎(chǔ)上做了進一步改進,主要改進之處在于:在本發(fā)明第四實施方式中,可以允許用戶自定義打點標記動作,可以提高對打點動作識別的準確性。
[0061]具體地說,本實施方式的音頻或視頻的錄制方法中的打點標記動作是用戶設(shè)定的動作。在進行音視頻錄制之前,提供人機交互界面允許用戶設(shè)定打點標記動作。由于每個人的習慣不同,即使同一動作,不同的人在實施時,也可能得到不同的數(shù)據(jù),如果能事前記載用戶做出某一動作的數(shù)據(jù),顯然在后續(xù)檢測中,可以提高動作檢測的準確度。比如,按照設(shè)定的次數(shù),設(shè)定的頻率敲擊(點擊)手機,這一動作,有的人敲擊的頻率較高,有的人敲擊的頻率較低,有的人習慣敲擊2次,有的人習慣敲擊3次,這些都可以按照用戶的喜好進行設(shè)定。
[0062]本領(lǐng)域技術(shù)人員應(yīng)該理解,用戶預先設(shè)定的動作并不僅僅以上述舉例為限,其他預先設(shè)定的動作,比如,使用實體或虛擬組合按鍵,手持手機并點擊手機任意位置等,用戶都可以通過設(shè)定或錄制來對動作進行定制。
[0063]本發(fā)明的第五實施方式涉及一種音頻或視頻的播放方法。該方法可用于播放采用第一至第四實施方式錄制的音頻或視頻文件。在播放過程中,檢測用戶是否選擇了某個標記,若選擇了某一標記,則從這一標記位置開始播放,流程如圖3所示,具體包含以下步驟:
[0064]步驟301,打開音頻文件或視頻文件;
[0065]步驟302,在顯示界面上音頻或視頻的播放進度條,并在播放進度條上標示在錄制過程中插入的標記。
[0066]在音視頻的播放過程中,根據(jù)用戶選擇的標記,播放用戶選擇的標記對應(yīng)時間點開始的音頻或視頻,具體如下:
[0067]步驟303,判斷是否某一標記被選中,若是,則執(zhí)行步驟304,;若否,則返回步驟303 ;
[0068]步驟304,播放被選中的標記對應(yīng)時間點開始的音頻或視頻。
[0069]本領(lǐng)域技術(shù)人員可以理解,在播放過程中,“判斷是否某一標記被選中”這一步驟一直都在執(zhí)行,可以采用中斷方式,觸發(fā)CPU執(zhí)行步驟304,也可以采用周期性地檢測方式實現(xiàn)。本實施方式的重點不在于如何實現(xiàn)步驟304的觸發(fā),因此在此不再一一詳述。
[0070]此外,如圖4所示,除了在播放進度條(圖中402所示)上標示標記(圖4中401所示)之外,還可以在播放進度條上方顯示備注,或者設(shè)置打點標記顯示區(qū)域,如圖中403顯示文字備注,404顯示圖片備注。文字備注可以是在錄制過程中通過語音自動分析識別得到的文字,也可以是用戶插入的文字。為了方便用戶選擇,從而解決了錄制時間較長,或者標記過多時,播放進度條上標記過多,難于選中的問題,還可以設(shè)置搖桿(如圖中406所示)。往右按一下?lián)u桿,切換到下一個標記點(如圖5所示),開始播放;或者往右按住,按一定的時間間隔(比如1.5秒)繼續(xù)下一個標記點,松開則從最后一個標記點開始播放。此外,還可以反復點擊如圖中405中播放按鈕,反復從當前標記點播放錄音。由于在錄制過程中,除了保存了音頻文件或視頻文件之外,還保存了記錄文件,因此,在錄音或錄像時間較長時,或標記較多時,可以讀取記錄文件,顯示標記順序和時間標簽,如圖4中“20:26”所示,表示第2個標記在錄音的第20分26秒開始。
[0071]進一步地,如果錄制過程中,已經(jīng)插入了備注,還可以在打點標記顯示區(qū)域顯示備注內(nèi)容,方便用戶了解標記處的大致內(nèi)容,進一步提高信息獲取效率。而對于插入的備注是錄音、圖片或文字,可以顯示對應(yīng)的圖標,點擊該圖標,可以收聽錄音,查看圖片或視頻。
[0072]在回放過程中,也可以對標記點位置、備注等進行編輯,比如,如圖6所示,在虛線處局部放大,來回拖動4號標簽,使其放置在合適的位置。也就是對標記點進行精確調(diào)整。
[0073]此外,如果采用第一實施方式的錄制方法錄制的音頻或視頻,由于標記點是設(shè)置在檢測到打點標記動作之時的,這種情況下,如果選中標記,從標記點開始播放,顯然播放內(nèi)容不太完整,本實施方式的音視頻播放方法還可以提前或者延遲預設(shè)時間的音頻或視頻,或者分析信號波形,找到標記點之前的停頓點,從該停頓點開始播放,其原理與第二實施方式相似,在此不再贅述。也就是說,第二實施方式在做標記時,進行處理使得回放更準確,而本實施方式在回放中進行處理使得回放更準確。
[0074]上面各種方法的步驟劃分,只是為了描述清楚,實現(xiàn)時可以合并為一個步驟或者對某些步驟進行拆分,分解為多個步驟,只要包含相同的邏輯關(guān)系,都在本專利的保護范圍內(nèi);對算法中或者流程中添加無關(guān)緊要的修改或者引入無關(guān)緊要的設(shè)計,但不改變其算法和流程的核心設(shè)計都在該專利的保護范圍內(nèi)。
[0075]本發(fā)明第六實施方式涉及一種電子裝置,該電子裝置可采用上述第一至第四實施方式