本發(fā)明涉及電子應用領域中的信息處理技術,尤其涉及一種錄音方法及終端。
背景技術:
隨著終端的普及,終端已經(jīng)成為生活中必不可少且隨身攜帶的電子設備,可以隨時對身邊的事情進行記錄。對于一些場合,也需要終端采用錄音的方式進行信息記錄,例如,會議記錄等。
現(xiàn)有技術中,在錄音過程中,終端啟動錄音設置,通過麥克風對場景中的語音信息進行采集,得到音頻數(shù)據(jù),以使得用戶在錄音之后的任意時刻,在終端上播放該音頻數(shù)據(jù)時可以再現(xiàn)場景中的語音信息。比如,用戶可以通過麥克風記錄會議的會議內(nèi)容,然后通過終端播放該音頻數(shù)據(jù)時,可以再現(xiàn)會議內(nèi)容,以便于記錄整理。
然而,若用戶需要在錄音得到的音頻數(shù)據(jù)中查詢預定內(nèi)容,比如,會議中有多個人員進行了發(fā)言,則可以調(diào)整音頻數(shù)據(jù)的播放進度,對音頻數(shù)據(jù)進行試聽,以查找到某個人的發(fā)言內(nèi)容。因此,現(xiàn)有技術中的查找音頻數(shù)據(jù)中預定的音頻內(nèi)容的操作比較繁瑣,不人性化、降低了用戶體驗感。
技術實現(xiàn)要素:
為解決上述技術問題,本發(fā)明實施例期望提供一種錄音方法及終端,能夠根據(jù)不同的用戶來記錄不同的音頻,體現(xiàn)了人性化設計,提高了終端的智能化。
本發(fā)明的技術方案是這樣實現(xiàn)的:
本發(fā)明實施例提供了一種錄音方法,包括:
在記錄音頻數(shù)據(jù)的過程中,獲取第i個標記信息,所述第i個標記信息包括: 第i個標記時間點和第i個標記標識,其中,n≥i≥1,n≥2;
根據(jù)所述第i個標記標識和預設的標記標識與被訪用戶信息的對應關系,確定第i個標記標識對應的用戶信息;
當i≠n時,將所述第i個標記時間點和第i+1個標記時間點之間的音頻數(shù)據(jù),保存為與所述第i個標記標識對應的用戶信息匹配的第i個音頻文件。
在上述方案中,所述根據(jù)所述第i個標記標識和預設的標記標識與用戶信息的對應關系,確定第i個標記標識對應的用戶信息之后,所述方法還包括:
當i=n時,獲取錄音結束時間點;
將所述第i個標記時間點和所述錄音結束時間點之間的音頻數(shù)據(jù),保存為與所述第i個標記標識對應的用戶信息匹配的第i個音頻文件。
檢測n個音頻文件中,是否存在匹配了相同的用戶信息的至少兩個音頻文件;
若存在,則將所述至少兩個音頻文件合成為一個音頻文件,所述一個音頻文件匹配與所述至少兩個音頻文件相同的用戶信息。
在上述方案中,所述根據(jù)所述第i個標記標識和預設的標記標識與用戶信息的對應關系,確定第i個標記標識對應的用戶信息之后,所述方法還包括:
將所述第i個標記標識對應的用戶信息轉化為第i個音頻信息;
在所述第i個標記時間點時,將所述第i個音頻信息插入到第一音軌上;
當i≠n時,將所述第i個標記時間點和第i+1個標記時間點之間的音頻數(shù)據(jù)插入到第二音軌上;
當i=n時,獲取所述錄音結束時間點;
將所述第i個標記時間點和所述錄音結束時間點之間的音頻數(shù)據(jù)插入到第二音軌上;
將所述第一音軌上的n個音頻信息和所述第二音軌上的音頻數(shù)據(jù)合成為一個合成錄音文件。
在上述方案中,所述獲取第i個標記信息之前,所述方法還包括:
獲取預設被訪用戶信息庫;
根據(jù)所述預設被訪用戶信息庫,確定預設的標記標識與被訪用戶信息的對應關系。
在上述方案中,所述獲取第i個標記信息,包括:
獲取第i個第一操作,所述第一操作用于確定所述第i個標記信息;
根據(jù)所述第i個第一操作,獲取第i個標記標識;
獲取所述第i個第一操作的發(fā)生時間,所述第i個第一操作的發(fā)生時間為所述第i個標記時間點。
本發(fā)明實施例提供了一種終端,包括:
獲取單元,用于在記錄音頻數(shù)據(jù)的過程中,獲取第i個標記信息,所述第i個標記信息包括:第i個標記時間點和第i個標記標識,其中,ni1,n為正整數(shù);
確定單元,用于根據(jù)所述獲取單元獲取的所述第i個標記標識和預設的標記標識與被訪用戶信息的對應關系,確定第i個標記標識對應的用戶信息;
保存單元,用于當i≠n時,將所述獲取單元獲取的所述第i個標記時間點和第i+1個標記時間點之間的音頻數(shù)據(jù),保存為與所述確定單元確定的所述第i個標記標識對應的用戶信息匹配的第i個音頻文件。
在上述終端中,所述終端還包括:檢測單元和合成單元;
所述獲取單元,還用于所述確定單元根據(jù)所述第i個標記標識和預設的標記標識與用戶信息的對應關系,確定第i個標記標識對應的用戶信息之后,當i=n時,獲取錄音結束時間點;
所述保存單元,還用于將所述獲取單元獲取的所述第i個標記時間點和所述錄音結束時間點之間的音頻數(shù)據(jù),保存為與所述確定單元確定的所述第i個標記標識對應的用戶信息匹配的第i個音頻文件;
所述檢測單元,用于檢測所述保存單元保存的n個音頻文件中,是否存在匹配了相同的用戶信息的至少兩個音頻文件;
所述合成單元,還用于若所述檢測單元檢測存在,則將所述保存單元保存的所述至少兩個音頻文件合成為一個音頻文件,所述一個音頻文件匹配與所述 至少兩個音頻文件相同的用戶信息。
在上述終端中,所述終端還包括:轉化單元、插入單元;
所述轉化單元,用于所述確定單元根據(jù)所述第i個標記標識和預設的標記標識與用戶信息的對應關系,確定第i個標記標識對應的用戶信息之后,將所述確定單元確定的所述第i個標記標識對應的用戶信息轉化為第i個音頻信息;
所述插入單元,用于在所述獲取單元獲取的所述第i個標記時間點時,將所述轉化單元轉化的所述第i個音頻信息插入到第一音軌上,以及當i≠n時,將所述第i個標記時間點和第i+1個標記時間點之間的音頻數(shù)據(jù)插入到第二音軌上;
所述獲取單元,還用于當i=n時,獲取所述錄音結束時間點;
所述插入單元,還用于將所述獲取單元獲取的所述第i個標記時間點和所述錄音結束時間點之間的音頻數(shù)據(jù)插入到第二音軌上;
所述合成單元,還用于將所述插入單元合好的所述第一音軌上的n個音頻信息和所述第二音軌上的音頻數(shù)據(jù)合成為一個合成錄音文件。
在上述終端中,所述獲取單元,還用于所述獲取第i個標記信息之前,獲取預設被訪用戶信息庫;
所述確定單元,還用于根據(jù)所述獲取單元獲取的所述預設被訪用戶信息庫,確定預設的標記標識與被訪用戶信息的對應關系。
在上述終端中,所述獲取單元,具體用于獲取第i個第一操作,所述第一操作用于確定所述第i個標記信息;及根據(jù)所述第i個第一操作,獲取第i個標記標識;以及獲取所述第i個第一操作的發(fā)生時間,所述第i個第一操作的發(fā)生時間為所述第i個標記時間點。
本發(fā)明實施例提供了一種錄音方法及終端,通過在記錄音頻數(shù)據(jù)的過程中,獲取第i個標記信息,該第i個標記信息包括:第i個標記時間點和第i個標記標識,其中,n≥i≥1,n≥2;根據(jù)第i個標記標識和預設的標記標識與被訪用戶信息的對應關系,確定第i個標記標識對應的用戶信息;當i≠n時,將第i個標記時間點和第i+1個標記時間點之間的音頻數(shù)據(jù),保存為與第i個標記標 識對應的用戶信息匹配的第i個音頻文件。采用上述技術實現(xiàn)方案,由于終端在錄音的過程中,將被發(fā)言人或被訪問者的信息(用戶信息)與相應的發(fā)言人的發(fā)言內(nèi)容相對應標記保存了,因此,終端能夠根據(jù)不同的用戶來記錄不同的音頻,體現(xiàn)了人性化設計,提高了終端的智能化。
附圖說明
圖1為本發(fā)明實施例提供了一種錄音方法的流程圖一;
圖2為本發(fā)明實施例提供了一種錄音方法的流程圖二;
圖3為本發(fā)明實施例提供了一種錄音標記設置的界面示意圖;
圖4為本發(fā)明實施例提供了一種錄音方法的流程圖三;
圖5為本發(fā)明實施例提供了一種錄音方法的流程圖四;
圖6為本發(fā)明實施例提供了一種錄音方法的流程圖五;
圖7為本發(fā)明實施例提供了一種終端的結構示意圖一;
圖8為本發(fā)明實施例提供了一種終端的結構示意圖二;
圖9為本發(fā)明實施例提供了一種終端的結構示意圖三。
具體實施方式
下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述。
實施例一
本發(fā)明實施例提供了一種錄音方法,如圖1所示,該方法可以包括:
s101、在記錄音頻數(shù)據(jù)的過程中,獲取第i個標記信息,該第i個標記信息包括:第i個標記時間點和第i個標記標識,其中,n≥i≥1,n≥2。
需要說明的是,本發(fā)明實施例所提供的錄音方法適用于在一次錄音的過程中要記錄多個訪問者的情況,或者記錄多個人在一場會議中要發(fā)言的情況,即在進行會議錄音或多人訪問要錄音等的情況。
可選的,本發(fā)明實施例中的終端為具有錄音功能的電子設備,例如,錄音 筆、智能手機、平板電腦等。本發(fā)明實施例中的終端可以是通過觸摸屏的接收標記信息,也可以在設置界面的進行相應的標記設置,還可以通過設置有可以感應觸摸操作的傳感器或感應器接收標記信息,本發(fā)明實施例不作限制。
需要說明的是,本發(fā)明實施例中的第i個就是依次按照順序實現(xiàn)的,例如第1次獲取的標識信息就是第1個標識信息,第2次獲取的標識信息就是第2個標識信息,依次類推。
特別的,由于本發(fā)明實施例中的錄音針對兩個以上的發(fā)言,因此,本發(fā)明實施例中的n至少為2,具體的n的數(shù)值是可以根據(jù)實際用戶發(fā)言的情況決定的。
具體的,如圖2所示,本發(fā)明實施例中終端獲取第i個標識信息的過程具體可以包括:
s1011、獲取第i個第一操作,該第一操作用于確定第i個標記信息。
終端在開始記錄音頻數(shù)據(jù)時,用戶可以在終端的觸摸屏、感應區(qū)域或者標記設置界面進行標記標識的輸入,即終端獲取用于確定第i個標記信息的第i個第一操作。
可選的,本發(fā)明實施例中,第一操作可以為手勢,也可以為輸入操作具體不限制第一操作的具體形態(tài)。
示例性的,用戶可以通過終端的觸摸屏或感應區(qū)域滑動第i個第一手勢,即終端就獲取到了第i個第一操作(手勢操作)。或者,用戶可以通過具有設置界面或設置按鈕的終端直接進行第i個輸入操作,使得該終端獲取到第i個第一操作(輸入操作)。
需要說明的是,由于本發(fā)明實施例是以在一次錄音中記錄多個用戶的音頻數(shù)據(jù)為前提,因此,會存在需要獲取多個標記信息的情況,從而出現(xiàn)獲取多個第一操作的過程,又由于一個用戶可以在不同的時段發(fā)表言論,從而被終端記錄,因此,每次終端獲取的第一操作以及第一操作對應的標記標識可能會出現(xiàn)一樣的情況。也就是說,每個第一操作可以是相同的,也可以是不同的,需要按照實際獲取的情況而定。
s1012、根據(jù)第i個第一操作,獲取第i個標記標識。
終端獲取第i個第一操作之后,由于第i個第一操作使得終端可以獲取到該第i個第一操作產(chǎn)生的第i個操作數(shù)據(jù),因此,終端獲取到的這些操作數(shù)據(jù)就是第i個標記標識。
可選的,本發(fā)明實施例中的標記標識可以為圖形、符號、數(shù)字或文字等,本發(fā)明實施例不作限制。
示例性的,用戶a使用手機進行錄音的過程中,當?shù)?個用戶發(fā)言時,用戶a在手機的觸摸屏上滑動了一個折線手勢,該折線手勢在手機的觸摸屏感應出來是一個“z”,這里,將“z”作為第3個標記標識。同理,如圖3所示,用戶a也可以在手機里的標記設置界面,通過輸入操作,獲取輸入操作輸入的“zm”作為標記標識。
需要說明的是,本發(fā)明實施例中的第一操作是用于標記的特定的手勢或動作或輸入等,例如特定的字母手勢等,終端只在獲取特定的手勢時,才能根據(jù)該手勢識別出標記標識。若是終端在錄音的過程中獲取到設定第一操作類型外的操作,則終端對該操作是不作標記處理的。這樣,就避免了在錄音過程中由于誤操作或無觸摸等原因造成的誤標記情況的發(fā)生。
可選的,終端獲取第一操作是可以在操作發(fā)生開始的預設時間內(nèi)獲取的,該預設時間可以為30秒等,具體的數(shù)值可以根據(jù)實際的設定而設置時間,本發(fā)明實施例不作限制。
需要說明的是,本發(fā)明實施例中的第一操作可以是兩個觸摸動作或輸入次數(shù)等,因此,終端需要在一個預設時間內(nèi)來獲取第一操作的。例如,從第一操作發(fā)生的時間開始的預設時間內(nèi),獲取第一操作,這樣,就避免了終端獲取的第i個第一操作是兩個字母手勢的情況時會被終端誤認為是兩個第一操作的情況發(fā)生。
示例性的,用戶a使用手機進行錄音時,用戶a在手機的觸摸屏上進行字母手勢圖像操作,該手機的觸摸屏從字母手勢圖像的邊緣信息中提取關鍵點對手勢進行識別,顯示屏上則會顯示出相應的字母手勢圖像,比如“張明”發(fā)言 時,用戶可以30秒內(nèi)在屏幕上分別輸入“z”和“m”字母手勢以表示;這里的“z”和“m”是依次輸入??梢岳斫獾氖牵捎?0秒的預設時間較短,即手機獲取“z”和“m”中間間隔時間較短,因此,手機可以根據(jù)字母手勢圖像操作,判定“zm”為一個完整的標記標識。
s1013、獲取第i個第一操作的發(fā)生時間,該第i個第一操作的發(fā)生時間為第i個標記時間點。
終端在獲取第i個第一操作時,同時獲取該第i個第一操作對應的發(fā)生時間,也就是第i個標記時間點。
需要說明的是,本發(fā)明實施例中的第i個第一操作的發(fā)生時間是以從這次的錄音開始為起始時刻。即本發(fā)明實施例中的第i個第一操作的發(fā)生時間為該第i個第一操作的發(fā)生時刻與起始時刻之間的差值。
示例性的,用戶a使用手機在10點開始錄音的,這個手機在10點30分的時候獲取到了第3個手勢操作,這時,手機就記錄下該第3個手勢發(fā)生的時間為30分鐘。
s102、根據(jù)第i個標記標識和預設的標記標識與被訪用戶信息的對應關系,確定第i個標記標識對應的用戶信息。
終端在獲取第i個標記信息之后,由于在錄音之前該終端已經(jīng)獲取到了預設的標記標識與被訪用戶信息的對應關系,因此,該終端可以根據(jù)第i個標記標識和預設的標記標識與被訪用戶信息的對應關系來確定出第i個標識對應的用戶信息。
需要說明的是,本發(fā)明實施例中的用戶信息可以為發(fā)言人的姓名、用戶的頭像等可以表征發(fā)言人身份的信息。
需要說明的是,具體的獲取預設的標記標識與被訪用戶信息的對應關系的過程將在后續(xù)的實施例中進行詳細地說明。
可選的,預設的標記標識與被訪者用戶信息的對應關系可以為標記標識與用戶身份信息之間的對應列表,例如,可以為標記標識與用戶的姓名或用戶的頭像之間的對應列表關系。
示例性的,預設的標記標識與被訪者用戶信息的對應關系可以是用戶姓名的首字母為標記標識,該標記標識對應用戶的姓名。例如,“zm”樣的標記標識對應的為張明。
示例性的,用戶a使用手機記錄會議錄音時,獲取到了第i個標記標識為“zm”,這時手機根據(jù)預設的標記標識與被訪者用戶信息的對應關系,找到了“zm-張明”,于是,該手機就確定了第i個標記標識對應的用戶信息為張明。
s103、當i≠n時,將第i個標記時間點和第i+1個標記時間點之間的音頻數(shù)據(jù),保存為與第i個標記標識對應的用戶信息匹配的第i個音頻文件。
終端根據(jù)第i個標記標識和預設的標記標識與被訪用戶信息的對應關系,確定第i個標記標識對應的用戶信息之后,當i≠n時,在該終端獲取到第i+1個標記信息時,該終端可以將第i個標記時間點和第i+1個標記時間點之間的已經(jīng)記錄的音頻數(shù)據(jù),另存為與第i個標記標識對應的用戶信息匹配的第i個音頻文件。
具體的,終端可以將第i個標記時間點和第i+1個標記時間點之間的已經(jīng)記錄的音頻數(shù)據(jù)分段出來,另存為采用第i個標記標識對應的用戶信息命名的第i個音頻文件。
需要說明的是,當i≠n時(即終端獲取第i+1個標記信息),表明錄音還沒有結束,于是,終端將第i個標識時間點與下一次獲取的第i+1個標記時間點之間記錄的音頻數(shù)據(jù)先另保存起來。同時,終端還在同步進行正常第i+1個標記標識對應的用戶的錄音工作。
示例性的,用戶a使用手機進行會議記錄的過程中,手機按照前后兩次標記時間點順序,在第2個標記標識獲取完畢后,手機首先分段保存為第1個音頻文件,這時第2個標記時刻點則作為下一組分段保存的起始標記點;其中,錄音文件的名稱根據(jù)預設的標記標識與被訪用戶信息的對應關系自動保存為該發(fā)言人的用戶信息(姓名,例如“張明”),當本發(fā)明實施例中的用戶信息還同時包括用戶的頭像時,該第1個音頻文件也會同時以發(fā)言者的頭像信息顯示出來。若接下來還有多個的標記信息,分段保存原理與上述過程相同。進一步地, 若同一人(相同的標記信息)在不同時段均有發(fā)言的音頻數(shù)據(jù)也可以依據(jù)此方式分段保存,或者自動保存并命名為張明-1、張明-2等樣式。
進一步地,如圖4所示,在s102之后,本發(fā)明實施例提供的一種錄音方法還包括:s104-s107。具體如下:
s104、當i=n時,獲取錄音結束時間點。
終端根據(jù)第i個標記標識和預設的標記標識與被訪用戶信息的對應關系,確定第i個標記標識對應的用戶信息之后,由于此時終端獲取的第i個標記信息可能是最后一個標記信息,該終端在繼續(xù)進行下面的錄音時不會在接收到第i+1個標記信息,因此,i=n時的情況下,終端可以獲取到錄音結束的時間點。
s105、將第i個標記時間點和錄音結束時間點之間的音頻數(shù)據(jù),保存為與第i個標記標識對應的用戶信息匹配的第i個音頻文件。
終端獲取錄音結束時間點之后,該終端就可以將第i個標記時間點和錄音結束時間點之間的音頻數(shù)據(jù)(也就是最后一個發(fā)言人的音頻數(shù)據(jù)),另存為與第i個標記標識對應的用戶信息匹配的第i個音頻文件。
s106、檢測n個音頻文件中,是否存在匹配了相同的用戶信息的至少兩個音頻文件。
在終端結束了n個音頻文件的保存之后,由于同一個發(fā)言人可以在不同的時間點發(fā)言了幾次,因此,可能存在同一個發(fā)言人對應的多個音頻文件,于是,該終端可以檢測該n個或n段音頻文件對應的用戶信息是不是有相同的。
s107、若存在,則將至少兩個音頻文件合成為一個音頻文件,該一個音頻文件匹配與至少兩個音頻文件相同的用戶信息。
終端檢測n個音頻文件中,是否存在匹配了相同的用戶信息的至少兩個音頻文件之后,當終端檢測到存在與同一個用戶信息匹配的至少兩個音頻文件(多個)時,該終端可以將同一個用戶信息匹配的該至少兩個音頻文件合在一起,合成為一個音頻文件。
示例性的,若終端另存的音頻文件有張明-1、李四、張三、張明-2時,該終端就將張明-1和張明-2對應的音頻文件拼接,合成為一段音頻文件保存起來, 并以張明來命名該一個段音頻文件。這樣,就可以將同一個發(fā)言人的發(fā)言集中在一起了,便于用戶以后的查詢和整理。
進一步地,如圖5所示,在s101之前,本發(fā)明實施例提供的一種錄音方法還包括:s108-s109。具體如下:
s108、獲取預設被訪用戶信息庫。
s109、根據(jù)預設被訪用戶信息庫,確定預設的標記標識與被訪用戶信息的對應關系。
需要說明的是,在用戶進行會議記錄或錄音工作開始之前,可以先獲取到這次錄音的發(fā)言人(預設被訪用戶信息庫)有哪些,然后就在終端上設置每個發(fā)言人對應的標記標識。
具體的,預設被訪用戶信息庫可以由用戶手動統(tǒng)計記錄。具體的終端根據(jù)預設被訪用戶信息庫,確定預設的標記標識與被訪用戶信息的對應關系的過程可以是終端設置標記標識的形式,然后與每個被訪者(發(fā)言人)的用戶信息相關聯(lián)即可。具體的實現(xiàn)方式可以為現(xiàn)有技術中的信息關聯(lián)方案,本發(fā)明實施例不作限制。
需要說明的是,本發(fā)明實施例提供的一種錄音方法的使用場景可以是終端黑屏進行后臺錄音,也可以是屏幕點亮進行后臺錄音,還可以是沒有屏幕的終端進行錄音等等。用戶可以根據(jù)不同的使用場景選擇不同的標記信息的輸入方式,以使得用戶在終端上設置的屏幕暗或亮的情況下都可以進行錄音。例如,當終端沒有屏幕或屏幕鎖屏的情況下,終端還在錄音時,用戶可以在屏幕上的預設感應區(qū)直接手勢操作完成標記動作,或者在終端有屏幕且屏幕亮著且在后臺錄音時,直接在感應區(qū)或設置界面輸入標記信息。
本發(fā)明實施例所提供的一種錄音方法,通過在記錄音頻數(shù)據(jù)的過程中,獲取第i個標記信息,該第i個標記信息包括:第i個標記時間點和第i個標記標識,其中,n≥i≥1,n≥2;根據(jù)第i個標記標識和預設的標記標識與被訪用戶信息的對應關系,確定第i個標記標識對應的用戶信息;當i≠n時,將第i個標記時間點和第i+1個標記時間點之間的音頻數(shù)據(jù),保存為與第i個標記標識 對應的用戶信息匹配的第i個音頻文件。采用上述技術實現(xiàn)方案,由于終端在錄音的過程中,將被發(fā)言人或被訪問者的信息(用戶信息)與相應的發(fā)言人的發(fā)言內(nèi)容相對應標記保存了,因此,終端能夠根據(jù)不同的用戶來記錄不同的音頻,體現(xiàn)了人性化設計,提高了終端的智能化。
實施例二
本發(fā)明實施例提供一種錄音方法,如圖6所示,該方法可以包括:
s201、獲取預設被訪用戶信息庫。
s202、根據(jù)預設被訪用戶信息庫,確定預設的標記標識與被訪用戶信息的對應關系。
需要說明的是,本發(fā)明實施例所提供的錄音方法適用于在一次錄音的過程中要記錄多個訪問者的情況,或者記錄多個人在一場會議中要發(fā)言的情況,即在進行會議錄音或多人訪問要錄音等的情況。
可選的,本發(fā)明實施例中的終端為具有錄音功能的電子設備,例如,錄音筆、智能手機、平板電腦等。本發(fā)明實施例中的終端可以是通過觸摸屏的接收標記信息,也可以在設置界面的進行相應的標記設置,還可以通過設置有可以感應觸摸操作的傳感器或感應器接收標記信息,本發(fā)明實施例不作限制。
需要說明的是,在用戶進行會議記錄或錄音工作開始之前,可以先獲取到這次錄音的發(fā)言人(預設被訪用戶信息庫)有哪些,然后就在終端上設置每個發(fā)言人對應的標記標識。
具體的,預設被訪用戶信息庫可以由用戶手動統(tǒng)計記錄。具體的終端根據(jù)預設被訪用戶信息庫,確定預設的標記標識與被訪用戶信息的對應關系的過程可以是終端設置標記標識的形式,然后與每個被訪者(發(fā)言人)的用戶信息相關聯(lián)即可。具體的實現(xiàn)方式可以為現(xiàn)有技術中的信息關聯(lián)方案,本發(fā)明實施例不作限制。
需要說明的是,本發(fā)明實施例提供的一種錄音方法的使用場景可以是終端黑屏進行后臺錄音,也可以是屏幕點亮進行后臺錄音,還可以是沒有屏幕的終端進行錄音等等。用戶可以根據(jù)不同的使用場景選擇不同的標記信息的輸入方 式,以使得用戶在終端上設置的屏幕暗或亮的情況下都可以進行錄音。例如,當終端沒有屏幕或屏幕鎖屏的情況下,終端還在錄音時,用戶可以在屏幕上的預設感應區(qū)直接手勢操作完成標記動作,或者在終端有屏幕且屏幕亮著且在后臺錄音時,直接在感應區(qū)或設置界面輸入標記信息。
s203、在記錄音頻數(shù)據(jù)的過程中,獲取第i個標記信息,該第i個標記信息包括:第i個標記時間點和第i個標記標識,其中,n≥i≥1,n≥2。
需要說明的是,本發(fā)明實施例中的第i個就是依次按照順序實現(xiàn)的,例如第1次獲取的標識信息就是第1個標識信息,第2次獲取的標識信息就是第2個標識信息,依次類推。
特別的,由于本發(fā)明實施例中的錄音針對兩個以上的發(fā)言,因此,本發(fā)明實施例中的n至少為2,具體的n的數(shù)值是可以根據(jù)實際用戶發(fā)言的情況決定的。
具體的,如圖2所示,本發(fā)明實施例中終端獲取第i個標識信息的過程具體可以包括:
s1011、獲取第i個第一操作,該第一操作用于確定第i個標記信息。
終端在開始記錄音頻數(shù)據(jù)時,用戶可以在終端的觸摸屏、感應區(qū)域或者標記設置界面進行標記標識的輸入,即終端獲取用于確定第i個標記信息的第i個第一操作。
可選的,本發(fā)明實施例中,第一操作可以為手勢,也可以為輸入操作具體不限制第一操作的具體形態(tài)。
示例性的,用戶可以通過終端的觸摸屏或感應區(qū)域滑動第i個第一手勢,即終端就獲取到了第i個第一操作(手勢操作)?;蛘撸脩艨梢酝ㄟ^具有設置界面或設置按鈕的終端直接進行第i個輸入操作,使得該終端獲取到第i個第一操作(輸入操作)。
需要說明的是,由于本發(fā)明實施例是以在一次錄音中記錄多個用戶的音頻數(shù)據(jù)為前提,因此,會存在需要獲取多個標記信息的情況,從而出現(xiàn)獲取多個第一操作的過程,又由于一個用戶可以在不同的時段發(fā)表言論,從而被終端記 錄,因此,每次終端獲取的第一操作以及第一操作對應的標記標識可能會出現(xiàn)一樣的情況。也就是說,每個第一操作可以是相同的,也可以是不同的,需要按照實際獲取的情況而定。
s1012、根據(jù)第i個第一操作,獲取第i個標記標識。
終端獲取第i個第一操作之后,由于第i個第一操作使得終端可以獲取到該第i個第一操作產(chǎn)生的第i個操作數(shù)據(jù),因此,終端獲取到的這些操作數(shù)據(jù)就是第i個標記標識。
可選的,本發(fā)明實施例中的標記標識可以為圖形、符號、數(shù)字或文字等,本發(fā)明實施例不作限制。
示例性的,用戶a使用手機進行錄音的過程中,當?shù)?個用戶發(fā)言時,用戶a在手機的觸摸屏上滑動了一個折線手勢,該折線手勢在手機的觸摸屏感應出來是一個“z”,這里,將“z”作為第3個標記標識。同理,如圖3所示,用戶a也可以在手機里的標記設置界面,通過輸入操作,獲取輸入操作輸入的“zm”作為標記標識。
需要說明的是,本發(fā)明實施例中的第一操作是用于標記的特定的手勢或動作或輸入等,例如特定的字母手勢等,終端只在獲取特定的手勢時,才能根據(jù)該手勢識別出標記標識。若是終端在錄音的過程中獲取到設定第一操作類型外的操作,則終端對該操作是不作標記處理的。這樣,就避免了在錄音過程中由于誤操作或無觸摸等原因造成的誤標記情況的發(fā)生。
可選的,終端獲取第一操作是可以在操作發(fā)生開始的預設時間內(nèi)獲取的,該預設時間可以為30秒等,具體的數(shù)值可以根據(jù)實際的設定而設置時間,本發(fā)明實施例不作限制。
需要說明的是,本發(fā)明實施例中的第一操作可以是兩個觸摸動作或輸入次數(shù)等,因此,終端需要在一個預設時間內(nèi)來獲取第一操作的。例如,從第一操作發(fā)生的時間開始的預設時間內(nèi),獲取第一操作,這樣,就避免了終端獲取的第i個第一操作是兩個字母手勢的情況時會被終端誤認為是兩個第一操作的情況發(fā)生。
示例性的,用戶a使用手機進行錄音時,用戶a在手機的觸摸屏上進行字母手勢圖像操作,該手機的觸摸屏從字母手勢圖像的邊緣信息中提取關鍵點對手勢進行識別,顯示屏上則會顯示出相應的字母手勢圖像,比如“張明”發(fā)言時,用戶可以30秒內(nèi)在屏幕上分別輸入“z”和“m”字母手勢以表示;這里的“z”和“m”是依次輸入??梢岳斫獾氖?,由于30秒的預設時間較短,即手機獲取“z”和“m”中間間隔時間較短,因此,手機可以根據(jù)字母手勢圖像操作,判定“zm”為一個完整的標記標識。
s1013、獲取第i個第一操作的發(fā)生時間,該第i個第一操作的發(fā)生時間為第i個標記時間點。
終端在獲取第i個第一操作時,同時獲取該第i個第一操作對應的發(fā)生時間,也就是第i個標記時間點。
需要說明的是,本發(fā)明實施例中的第i個第一操作的發(fā)生時間是以從這次的錄音開始為起始時刻。即本發(fā)明實施例中的第i個第一操作的發(fā)生時間為該第i個第一操作的發(fā)生時刻與起始時刻之間的差值。
示例性的,用戶a使用手機在10點開始錄音的,這個手機在10點30分的時候獲取到了第3個手勢操作,這時,手機就記錄下該第3個手勢發(fā)生的時間為30分鐘。
s204、根據(jù)第i個標記標識和預設的標記標識與被訪用戶信息的對應關系,確定第i個標記標識對應的用戶信息。
終端在獲取第i個標記信息之后,由于在錄音之前該終端已經(jīng)獲取到了預設的標記標識與被訪用戶信息的對應關系,因此,該終端可以根據(jù)第i個標記標識和預設的標記標識與被訪用戶信息的對應關系來確定出第i個標識對應的用戶信息。
需要說明的是,本發(fā)明實施例中的用戶信息可以為發(fā)言人的姓名、用戶的頭像等可以表征發(fā)言人身份的信息。
需要說明的是,具體的獲取預設的標記標識與被訪用戶信息的對應關系的過程將在后續(xù)的實施例中進行詳細地說明。
可選的,預設的標記標識與被訪者用戶信息的對應關系可以為標記標識與用戶身份信息之間的對應列表,例如,可以為標記標識與用戶的姓名或用戶的頭像之間的對應列表關系。
示例性的,預設的標記標識與被訪者用戶信息的對應關系可以是用戶姓名的首字母為標記標識,該標記標識對應用戶的姓名。例如,“zm”樣的標記標識對應的為張明。
示例性的,用戶a使用手機記錄會議錄音時,獲取到了第i個標記標識為“zm”,這時手機根據(jù)預設的標記標識與被訪者用戶信息的對應關系,找到了“zm-張明”,于是,該手機就確定了第i個標記標識對應的用戶信息為張明。
s205、將第i個標記標識對應的用戶信息轉化為第i個音頻信息。
終端在根據(jù)第i個標記標識和預設的標記標識與被訪用戶信息的對應關系,確定第i個標記標識對應的用戶信息之后,由于音頻數(shù)據(jù)可以分為左右兩個聲道播放,因此,終端在錄音的時候,首先可以將第i個標記標識對應的用戶信息轉化為第i個音頻信息(語音)。
示例性的,終端將第i個標記標識“zm”對應的用戶信息“張明”轉化了第i個音頻信息。
s206、在第i個標記時間點時,將第i個音頻信息插入到第一音軌上。
終端將第i個標記標識對應的用戶信息轉化為第i個音頻信息之后,由于音頻數(shù)據(jù)可以分為左右兩個聲道播放,因此,終端在錄音的時候,在第i個標記時間點時,該終端可以將第i個音頻信息插入到第一音軌上。
示例性的,終端將第i個標記標識“zm”對應的用戶信息“張明”轉化了第i個音頻信息,并將語音“張明”插入到左聲道的音軌上。
s207、當i≠n時,將第i個標記時間點和第i+1個標記時間點之間的音頻數(shù)據(jù)插入到第二音軌上。
終端在根據(jù)第i個標記標識和預設的標記標識與被訪用戶信息的對應關系,確定第i個標記標識對應的用戶信息之后,當i≠n時,在該終端獲取到第i+1個標記信息時,該終端可以將第i個標記時間點和第i+1個標記時間點之間的 已經(jīng)記錄的音頻數(shù)據(jù)插入到第二音軌上。
具體的,終端可以將第i個標記時間點和第i+1個標記時間點之間的已經(jīng)記錄的音頻數(shù)據(jù)分段出來插入到第二音軌上。
需要說明的是,當i≠n時(即終端獲取第i+1個標記信息),表明錄音還沒有結束,于是,終端將第i個標識時間點與下一次獲取的第i+1個標記時間點之間記錄的音頻數(shù)據(jù)保存插入到第二音軌上。同時,終端還可以在繼續(xù)進行正常第i+1個標記標識對應的用戶的錄音工作。
示例性的,用戶a使用手機進行會議記錄的過程中,手機按照前后兩次標記時間點順序,在第2個標記標識獲取完畢后,手機將第1個音頻文件插入到右聲道所在的音軌上。
s208、當i=n時,獲取錄音結束時間點。
終端在根據(jù)第i個標記標識和預設的標記標識與被訪用戶信息的對應關系,確定第i個標記標識對應的用戶信息之后,由于此時終端獲取的第i個標記信息可能是最后一個標記信息,該終端在繼續(xù)進行下面的錄音時不會在接收到第i+1個標記信息,因此,i=n時的情況下,終端可以獲取到錄音結束的時間點。
s209、將第i個標記時間點和錄音結束時間點之間的音頻數(shù)據(jù)插入到第二音軌上。
終端獲取錄音結束時間點之后,該終端可以將第i個標記時間點和錄音結束時間點之間的音頻數(shù)據(jù)插入到第二音軌上。
s210、將第一音軌上的n個音頻信息和第二音軌上的音頻數(shù)據(jù)合成為一個合成錄音文件。
終端將n個音頻信息插入到第一音軌,且該終端將第i個標記時間點和第i+1個標記時間點之間的音頻數(shù)據(jù)插入到第二音軌上和該終端將第i個標記時間點和錄音結束時間點之間的音頻數(shù)據(jù)插入到第二音軌上之后,該終端將第一音軌上的n個音頻信息和第二音軌上的音頻數(shù)據(jù)合成為一個合成錄音文件。
具體的,終端在每個標記時間點將每個標記標識對應的用戶信息插入到錄音的第一音軌,同時,將錄音的內(nèi)容插入到第二音軌。
可以理解的是,這樣終端在進行錄音的過程中,就將每個標記標識對應的用戶信息在每個標記時間點插入在第一音軌,而將發(fā)言人的錄音內(nèi)容插入到第二音軌,最后終端得到的合成錄音文件就是兩個聲音具有不一樣的音頻數(shù)據(jù)的錄音文件并保存。
進一步地,終端在播放錄音文件時,首先需要判斷是否需要多聲道設備播放錄制的錄音文件,若是需要,則左聲道播放音軌1的音頻信息,右聲道正常播放發(fā)言人的錄音(音頻數(shù)據(jù))即可。具體地,將音軌1和音軌2做分離處理,使得音軌1對應左聲道,音軌2對應右聲道。示例性的,當用戶插入耳機播放錄音時,耳機的左聲道在標記的某一時刻點上會播放對應用戶信息“張”和“明”的語音信息,右聲道則播放發(fā)言人張明的錄音內(nèi)容。
本發(fā)明實施例所提供的一種錄音方法,通過在記錄音頻數(shù)據(jù)的過程中,獲取第i個標記信息,該第i個標記信息包括:第i個標記時間點和第i個標記標識,其中,n≥i≥1,n≥2;根據(jù)第i個標記標識和預設的標記標識與被訪用戶信息的對應關系,確定第i個標記標識對應的用戶信息;當i≠n時,將第i個標記時間點和第i+1個標記時間點之間的音頻數(shù)據(jù),保存為與第i個標記標識對應的用戶信息匹配的第i個音頻文件。采用上述技術實現(xiàn)方案,由于終端在錄音的過程中,將被發(fā)言人或被訪問者的信息(用戶信息)與相應的發(fā)言人的發(fā)言內(nèi)容相對應標記保存了,因此,終端能夠根據(jù)不同的用戶來記錄不同的音頻,體現(xiàn)了人性化設計,提高了終端的智能化。
實施例三
如圖7所示,本發(fā)明實施例提供了一種終端1,該終端1可以包括:
獲取單元10,用于在記錄音頻數(shù)據(jù)的過程中,獲取第i個標記信息,所述第i個標記信息包括:第i個標記時間點和第i個標記標識,其中,n≥i≥1,n≥2。
確定單元11,用于根據(jù)所述獲取單元10獲取的所述第i個標記標識和預設的標記標識與被訪用戶信息的對應關系,確定第i個標記標識對應的用戶信息。
保存單元12,用于當i≠n時,將所述獲取單元10獲取的所述第i個標記時間點和第i+1個標記時間點之間的音頻數(shù)據(jù),保存為與所述確定單元11確定 的所述第i個標記標識對應的用戶信息匹配的第i個音頻文件。
可選的,如圖8所示,所述終端1還包括:檢測單元13和合成單元14。
所述獲取單元10,還用于所述確定單元11根據(jù)所述第i個標記標識和預設的標記標識與用戶信息的對應關系,確定第i個標記標識對應的用戶信息之后,當i=n時,獲取錄音結束時間點。
所述保存單元12,還用于當i=n時,將所述獲取單元10獲取的所述第i個標記時間點和所述錄音結束時間點之間的音頻數(shù)據(jù),保存為與所述確定單元11確定的所述第i個標記標識對應的用戶信息匹配的第i個音頻文件。
所述檢測單元13,用于檢測所述保存單元12保存的n個音頻文件中,是否存在匹配了相同的用戶信息的至少兩個音頻文件。
所述合成單元14,還用于若所述檢測單元13檢測存在,則將所述保存單元12保存的所述至少兩個音頻文件合成為一個音頻文件,所述一個音頻文件匹配與所述至少兩個音頻文件相同的用戶信息。
可選的,如圖9所示,所述終端1還包括:轉化單元15、插入單元16。
所述轉化單元15,用于所述確定單元11根據(jù)所述第i個標記標識和預設的標記標識與用戶信息的對應關系,確定第i個標記標識對應的用戶信息之后,將所述確定單元11確定的所述第i個標記標識對應的用戶信息轉化為第i個音頻信息。
所述插入單元16,用于在所述獲取單元10獲取的所述第i個標記時間點時,將所述轉化單元15轉化的所述第i個音頻信息插入到第一音軌上,以及當i≠n時,將所述第i個標記時間點和第i+1個標記時間點之間的音頻數(shù)據(jù)插入到第二音軌上。
所述獲取單元10,還用于當i=n時,獲取所述錄音結束時間點。
所述插入單元16,還用于將所述獲取單元10獲取的所述第i個標記時間點和所述錄音結束時間點之間的音頻數(shù)據(jù)插入到第二音軌上。
所述合成單元14,還用于將所述插入單元16合好的所述第一音軌上的n個音頻信息和所述第二音軌上的音頻數(shù)據(jù)合成為一個合成錄音文件。
可選的,所述獲取單元10,還用于所述獲取第i個標記信息之前,獲取預設被訪用戶信息庫。
所述確定單元11,還用于根據(jù)所述獲取單元10獲取的所述預設被訪用戶信息庫,確定預設的標記標識與被訪用戶信息的對應關系。
可選的,所述獲取單元10,具體用于獲取第i個第一操作,所述第一操作用于確定所述第i個標記信息;及根據(jù)所述第i個第一操作,獲取第i個標記標識。以及獲取所述第i個第一操作的發(fā)生時間,所述第i個第一操作的發(fā)生時間為所述第i個標記時間點。
可選的,本發(fā)明實施例中的終端為具有錄音功能的電子設備,例如,錄音筆、智能手機、平板電腦等。本發(fā)明實施例中的終端可以是通過觸摸屏的接收標記信息,也可以在設置界面的進行相應的標記設置,還可以通過設置有可以感應觸摸操作的傳感器或感應器接收標記信息,本發(fā)明實施例不作限制。
在實際應用中,上述獲取單元10、確定單元11、檢測單元13、合成單元14、轉化單元15和插入單元16可由位于終端1上的處理器實現(xiàn),具體為中央處理器(cpu)、微處理器(mpu)、數(shù)字信號處理器(dsp)或現(xiàn)場可編程門陣列(fpga)等實現(xiàn),保存單元12可由存儲器實現(xiàn),該存儲器可以通過系統(tǒng)總線與處理器連接,其中,存儲器用于存儲可執(zhí)行程序代碼,該程序代碼包括計算機操作指令,存儲器可能包含高速ram存儲器,也可能還包括非易失性存儲器,例如,至少一個磁盤存儲器。
本發(fā)明實施例所提供的一種終端,通過在記錄音頻數(shù)據(jù)的過程中,獲取第i個標記信息,該第i個標記信息包括:第i個標記時間點和第i個標記標識,其中,n≥i≥1,n≥2;根據(jù)第i個標記標識和預設的標記標識與被訪用戶信息的對應關系,確定第i個標記標識對應的用戶信息;當i≠n時,將第i個標記時間點和第i+1個標記時間點之間的音頻數(shù)據(jù),保存為與第i個標記標識對應的用戶信息匹配的第i個音頻文件。采用上述技術實現(xiàn)方案,由于終端在錄音的過程中,將被發(fā)言人或被訪問者的信息(用戶信息)與相應的發(fā)言人的發(fā)言內(nèi)容相對應標記保存了,因此,終端能夠根據(jù)不同的用戶來記錄不同的音頻, 體現(xiàn)了人性化設計,提高了終端的智能化。
本領域內(nèi)的技術人員應明白,本發(fā)明的實施例可提供為方法、系統(tǒng)、或計算機程序產(chǎn)品。因此,本發(fā)明可采用硬件實施例、軟件實施例、或結合軟件和硬件方面的實施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(包括但不限于磁盤存儲器和光學存儲器等)上實施的計算機程序產(chǎn)品的形式。
本發(fā)明是參照根據(jù)本發(fā)明實施例的方法、設備(系統(tǒng))、和計算機程序產(chǎn)品的流程圖和/或方框圖來描述的。應理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合??商峁┻@些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設備的處理器以產(chǎn)生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理設備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
這些計算機程序指令也可存儲在能引導計算機或其他可編程數(shù)據(jù)處理設備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理設備上,使得在計算機或其他可編程設備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理,從而在計算機或其他可編程設備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
以上所述,僅為本發(fā)明的較佳實施例而已,并非用于限定本發(fā)明的保護范圍。