專利名稱:語音混音的實現(xiàn)方法、系統(tǒng)及設備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信技術(shù)領(lǐng)域,尤其涉及一種語音混音的實現(xiàn)方法、系統(tǒng)及 設備。
背景技術(shù):
語音會議系統(tǒng)可以實現(xiàn)多個用戶同時進行語音通信,如圖1所示,目前
語音會議系統(tǒng)包括MCU (Multipoint Control Unit,多點控制器)和多個終端, 這些終端在不同時刻功能不同,分為語音發(fā)起終端和語音接收終端。其中, 語音發(fā)起終端將語音信息進行編碼后匯聚到MCU, MCU將來自各個語音發(fā) 起終端的信息進行解碼,將各個解碼后的語音信號進行混音并編碼后,發(fā)送 給語音接收終端;語音接收終端接收到聲音流后,進行解碼輸出。
由于MCU對所有的語音信號進行混音可能造成資源占用過多及混音后 的信號效果不好,因此,提出了一種優(yōu)化方法MCU解碼后,計算各路語音 信號的聲音能量,然后和其他語音信號進行能量比較,只混音能量最高的幾 路(例如兩路)語音信號,將語音能量最高的幾路語音信號進行混音并編碼。
然而,上述兩種方法都需要MCU先解碼,再編碼等,而且解碼,編碼等 都非常消耗性能,因此語音會議的總接入路數(shù)受到MCU性能的制約。
另外,當沒有專門的MCU來混音時,各個終端把各自的聲音發(fā)送給會議 的各個加入者,各個加入者來自主的實現(xiàn)混音。
然而,該方案中會議容量受到終端性能的限制,而且網(wǎng)絡中流量太大。
發(fā)明內(nèi)容
本發(fā)明提供了一種語音混音的實現(xiàn)方法、系統(tǒng)及設備,以大幅度提升混 音的性能。
本發(fā)明提供了一種語音混音的實現(xiàn)方法,應用于包括組播網(wǎng)絡、語音會議服務器和至少兩個語音終端的系統(tǒng)中,所述語音終端包括語音發(fā)送終端和
語音接收終端,所述方法包括以下步驟
所述語音發(fā)送終端獲取語音信息,計算所述語音信息的聲音能量,并將 所述語音信息對應的聲音能量發(fā)送給所述語音會議服務器,將所述語音信息 發(fā)送到組播網(wǎng)絡中對應的組播地址;
所述語音會議服務器對來自多個語音發(fā)送終端的聲音能量進行比較,獲 得能量大的至少兩路語音信息后,通過信令指示語音接收終端從所述組播網(wǎng) 絡中對應的組播地址獲取對應的至少兩路語音信息;
所述語音接收終端對所述至少兩路語音信息進行混音。
優(yōu)選地,所述方法還包括
所述語音發(fā)送終端獲取語音信息,并將所述語音信息發(fā)送給所述語音會 議服務器和組播網(wǎng)絡中對應的組播地址;
所述語音會議服務器計算來自多個語音發(fā)送終端的所述語音信息的聲音 能量,并對所述多個語音發(fā)送終端的聲音能量進行比較,獲得能量大的至少 兩路語音信息后,通過信令指示語音接收終端從所述組播網(wǎng)絡中對應的組播 地址獲取對應的至少兩路語音信息;
所述語音接收終端對所述至少兩路語音信息進行混音。
優(yōu)選地,所述將語音信息對應的聲音能量發(fā)送給所述語音會議服務器, 將所述語音信息發(fā)送到組播網(wǎng)絡中對應的組播地址,具體包括
建立與所述語音會議服務器之間的聲音能量通道,與組播網(wǎng)絡之間的聲 音通道;
語音發(fā)送終端通過所述聲音通道向組播網(wǎng)絡發(fā)送語音信息,通過所述聲 音能量通道向所述語音會議服務器發(fā)送所述語音信息對應的聲音能量。
優(yōu)選地,所述通過信令指示語音接收終端從所述組播網(wǎng)絡中對應的組播 地址獲取對應的至少兩路語音信息,具體包括
所述語音會議服務器向所述語音接收終端發(fā)送指令,所述指令中包括聲
音能量最高的至少兩^f各聲音信號的標識;
所述語音接收終端根據(jù)組播網(wǎng)絡中所述聲音能量最高的至少兩路聲音信
6號的標識獲取對應的至少兩路語音信息。
優(yōu)選地,所述語音接收終端根據(jù)組播網(wǎng)絡中所述聲音能量最高的至少兩
路聲音信號的標識獲取對應的至少兩路語音信息包括
所述語音接收終端向組播網(wǎng)絡發(fā)送攜帶聲音能量最高的至少兩路聲音信 號標識的信息;
所述組播網(wǎng)絡根據(jù)所述標識查找所述標識對應的至少兩鴻4吾音信息;
所述語音接收終端接收來自所述組播網(wǎng)絡的對應的至少兩路語音信息。
本發(fā)明提供了一種語音混音的實現(xiàn)系統(tǒng),包括組播網(wǎng)絡、語音會議服務 器、語音接收終端和語音發(fā)送終端,其中
所述語音發(fā)送終端,用于獲: 又語音信息,計算所述語音信息的聲音能量, 并將所述語音信息對應的聲音能量發(fā)送給所述語音會議服務器,將所述語音 信息發(fā)送到所述組播網(wǎng)絡中對應的組播地址;
所述語音會議服務器,用于對來自多個語音發(fā)送終端的聲音能量進行比 較,獲得能量大的至少兩路語音信息后,通過信令指示語音接收終端從所述 組播網(wǎng)絡中對應的組播地址獲取對應的至少兩路語音信息;
所述組播網(wǎng)絡,用于接收來自所述語音發(fā)送終端的語音信息,并向所述 語音接收終端發(fā)送所述能量大的至少兩路語音信息;
所述語音接收終端,用于獲取所述至少兩路語音信息后,對所述至少兩 路語音信息進行混音。
本發(fā)明提供了一種語音終端,包括
語音信息獲取模塊,用于采集用戶發(fā)出的語音信息;
能量計算模塊,用于根據(jù)所述語音信息獲取模塊采集的所述語音信息計 算所述語音信息對應的聲音能量;
發(fā)送模塊,用于將所述能量計算模塊計算得到的所述語音信息對應的聲 音能量發(fā)送給語音會議服務器,將所述語音信息發(fā)送到組播網(wǎng)絡中對應的組 播地址。
優(yōu)選地,還包括
接收模塊,用于接收語音會議服務器發(fā)送的指令,所述指令中包括聲音能量最高的至少兩^ 各聲音信號的標識;
獲取模塊,用于根據(jù)所述接收模塊接收的所述指令向組播網(wǎng)絡中所述聲音能量最高的至少兩路聲音信號的標識對應的組播地址中獲取對應的至少兩
路語音信息;
混音模塊,用于對所述獲取模塊獲取的所述至少兩路語音信息進行混音輸出。
優(yōu)選地,還包括
建立模塊,用于建立與所述語音會議服務器之間的聲音能量通道,與組播網(wǎng)絡之間的聲音通道。
本發(fā)明提供了一種語音會議服務器,包括接收模塊,用于接收來自多個語音終端的聲音能量;比較模塊,用于對所述接收模塊接收的所述多個聲音能量進行比較;發(fā)送模塊,用于根據(jù)所述比較模塊對所述多個聲音能量的比較結(jié)果,通過信令指示語音接收終端從所述組播網(wǎng)絡中對應的組^番地址獲取對應的至少
兩路語音信息。
優(yōu)選地,所述接收模塊還用于接收來自多個語音終端的語音信息;所述語音會議服務器還包括
計算模塊,用于計算來自多個語音發(fā)送終端的所述語音信息的聲音能量,并通過所述比較才莫塊對所述多個語音發(fā)送終端的聲音能量進行比較。與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點
本發(fā)明中,通過優(yōu)化功能部署來降低對混音服務器的性能要求,從而提升整體的語音會議容量,使同等硬件條件下系統(tǒng)的混音容量得到很大的提升。并且,由于本發(fā)明利用組播網(wǎng)絡傳輸語音信息,可以更有效地實現(xiàn)語音信息的集中管理控制,有效節(jié)省與利用會議帶寬,增加與會用戶數(shù)量,與會人員的數(shù)量不會受到限制。
圖l是現(xiàn)有技術(shù)中一種語音會議系統(tǒng)示意圖;圖2是本發(fā)明中一種語音混音的實現(xiàn)方法流程圖3是本發(fā)明中 一種語音會議系統(tǒng)示意圖4是本發(fā)明中另一種語音混音的實現(xiàn)方法流程圖;
圖5是本發(fā)明中一種語音終端結(jié)構(gòu)圖6是本發(fā)明中一種語音會議服務器結(jié)構(gòu)圖。
具體實施例方式
本發(fā)明的基本思想為語音發(fā)送終端獲取語音信息,計算語音信息的聲音能量,并將語音信息對應的聲音能量發(fā)送給語音會議服務器,將語音信息發(fā)送到組播網(wǎng)絡中對應的組播地址;語音會議服務器對來自多個語音發(fā)送終
端的聲音能量進行比較,獲得能量大的至少兩路語音信息后,通過信令指示
語音接收終端從組l番網(wǎng)絡中對應的組〗番地址獲耳又對應的至少兩i 各語音信息;語音接收終端對所述至少兩路語音信息進行混音。本發(fā)明通過優(yōu)化混音功能的部署來減少語音會議服務器的混音步驟,從而大幅度提升了混音的性能。
本發(fā)明提供了一種語音混音的實現(xiàn)方法,應用于包括組播網(wǎng)絡、語音會議服務器和至少兩個語音終端的系統(tǒng)中,所述語音終端包括語音發(fā)送終端和語音接收終端,所述方法如圖2所示,包括以下步驟
步驟201,所述語音發(fā)送終端獲取語音信息,計算所述語音信息的聲音能量,并將所述語音信息對應的聲音能量發(fā)送給所述語音會議服務器,將所述語音信息發(fā)送到組播網(wǎng)絡中對應的組播地址;
步驟202,所述語音會議服務器對來自多個語音發(fā)送終端的聲音能量進行比較,獲得能量大的至少兩路語音信息后,通過信令指示語音接收終端從所述組播網(wǎng)絡中對應的組播地址獲取對應的至少兩路語音信息;
步驟203,所述語音接收終端對所述至少兩路語音信息進行混音。
其中,所述方法還包括
所述語音發(fā)送終端獲取語音信息,并將所述語音信息發(fā)送給所述語音會議服務器和組播網(wǎng)絡中對應的組播地址;
所述語音會議服務器計算來自多個語音發(fā)送終端的所述語音信息的聲音
9能量,并對所迷多個語音發(fā)送終端的聲音能量進行比較,獲得能量大的至少 兩路語音信息后,通過信令指示語音接收終端從所述組播網(wǎng)絡中對應的組播
地址獲取對應的至少兩^各語音信息;
所述語音接收終端對所述至少兩路語音信息進行混音。
其中,所述將語音信息對應的聲音能量發(fā)送給所述語音會議服務器,將
所述語音信息發(fā)送到組播網(wǎng)絡中對應的組播地址,具體包括
建立與所述語音會議服務器之間的聲音能量通道,與組播網(wǎng)絡之間的聲
音通道;
語音發(fā)送終端通過所述聲音通道向組播網(wǎng)絡發(fā)送語音信息,通過所述聲 音能量通道向所述語音會議服務器發(fā)送所述語音信息對應的聲音能量。
其中,所述通過信令指示語音接收終端從所述組播網(wǎng)絡中對應的組播地 址獲取對應的至少兩路語音信息,具體包括
所述語音會議服務器向所迷語音接收終端發(fā)送指令,所述指令中包括聲 音能量最高的至少兩路聲音信號的標識;
所述語音接收終端根據(jù)組播網(wǎng)絡中所述聲音能量最高的至少兩路聲音信 號的標識獲取對應的至少兩路語音信息。
其中,所述語音接收終端根據(jù)組播網(wǎng)絡中所述聲音能量最高的至少兩路
聲音信號的標識獲取對應的至少兩路語音信息包括
所述語音接收終端向組播網(wǎng)絡發(fā)送攜帶聲音能量最高的至少兩路聲音信 號標識的信息;
所述組播網(wǎng)絡根據(jù)所述標識查找所述標識對應的至少兩路語音信息; 所述語音接收終端接收來自所述組播網(wǎng)絡的對應的至少兩路語音信息。
本發(fā)明中,提供了一種語音混音的實現(xiàn)方法,應用于包括一個語音會議 服務器,多個語音終端的系統(tǒng)中,這些語音終端根據(jù)會議的需要可以分為語 音發(fā)送終端和語音接收終端,其中,語音發(fā)送終端為會議發(fā)言者,語音接收 終端為會議聽眾。該實施例僅以對兩路語音信號進4亍混音為例說明,該方法 應用的系統(tǒng)如圖3所示,具體處理過程如圖4所示,包括以下步驟
10步驟401,語音會議服務器通過呼叫信令(例如SIP協(xié)議或R323協(xié)議等) 和語音終端協(xié)商建立聲音能量通道,語音終端與組播網(wǎng)絡建立聲音通道。其 中,聲音通道,用于語音終端與組播網(wǎng)絡交互語音信號;聲音能量通道,用 于語音會議服務器使用標準的RTP (Real-time Transport Protocol,實時傳輸協(xié) 議)協(xié)議來接收語音發(fā)送終端的聲音能量信息,例如,語音會議服務器和語 音終端通過將SIP (Session Initiation Protocol,會議起始協(xié)議)協(xié)議中的SDP (Service Discovery Protocol,服務發(fā)現(xiàn)協(xié)議)報文擴展一個PayLoad (有效載 荷)類型,協(xié)商出一個聲音能量通道。
其中,在語音發(fā)送終端與組播網(wǎng)絡建立聲音通道時,該語音發(fā)送終端為 源終端(即組^"源),該組#"網(wǎng)絡的地址為目的地址(即組^"組地址)。
步驟402,語音發(fā)送終端在采集到語音信息后,判斷該語音發(fā)送終端是否 具有根據(jù)語音信息計算聲音能量的功能,如果有,則與語音會議服務器建立 聲音能量通道,轉(zhuǎn)到步驟403。該建立的聲音能量通道為語音會議服務器和語 音發(fā)送終端協(xié)商的聲音能量通道,步驟401中,該語音發(fā)送終端與組播網(wǎng)絡 已建立聲音通道,此時,可以確定聲音通道和聲音能量通道的對應關(guān)系,即 建立語音信息及該語音信息的聲音能量的對應關(guān)系;當語音發(fā)送終端不具有 根據(jù)語音信息計算聲音能量的功能時,只建立語音發(fā)送終端與組播網(wǎng)絡的聲 音通道,轉(zhuǎn)到步驟407。
步驟403,語音發(fā)送終端具有根據(jù)語音信息計算聲音能量的功能,則在采 集語音信息后,計算該語音信息的聲音能量;對該語音信息和對應的聲音能 量進行編碼,然后在發(fā)送語音信息的RTP報文和發(fā)送對應的聲音能量的RTP 報文的時間戳上打上相同的時間,以便語音會議服務器根據(jù)時間戳確定該語 音信息在該時間段的聲音能量,并將該語音信息對應的聲音能量通過聲音能 量通道發(fā)送到語音會議服務器。
本發(fā)明中,語音發(fā)送終端在釆集到語音信息后,還將通過聲音通道將該 語音信息發(fā)送到組播網(wǎng)絡中,該語音信息中還可以攜帶該語音發(fā)送終端的地 址信息(當多個語音發(fā)送終端向同一組播組地址發(fā)送語音信息時,用于區(qū)分 發(fā)送該語音信息的源終端)。其中,語音發(fā)送終端向組播網(wǎng)絡發(fā)送語音信息和語音發(fā)送終端向語音會議服務器發(fā)送該語音信息所對應的聲音能量并沒有先 后的順序關(guān)系。
步驟404,語音會議服務器從各個聲音能量通道中接收來自多個語音發(fā)送 終端發(fā)送的聲音能量信息;比較各路聲音能量,比較聲音能量不是直接比較 聲音能量值,而且對正在傳輸?shù)穆曇粢x予更高的權(quán)重,使得聲音逐漸退出。 例如,初始比較時,聲音能量最大的權(quán)重賦值為2,在第二次的比較中,先直 接比較聲音能量,如果該路聲音的能量值已經(jīng)不是最大值,則該路聲音的權(quán) 重降低為1.8,并把該路聲音能量乘以權(quán)重后再和最大的聲音能量進行比較, 如該路聲音能量乘以權(quán)重后仍比當前最大的聲音能量大,則還使用原先的這 路語音,如果該路聲音能量乘以權(quán)重后小于當前最大的聲音能量,則使用當 前最大的聲音能量。
步驟405,語音會議服務器依據(jù)能量比較算法得出能量最高的兩路語音信 息,并通過信令指示語音接收終端從組播網(wǎng)絡中對應的組播源地址中去接收 語音信息,該信令為擴展的信令,目的是指示語音接收終端變更"源"的地址。 其中,選擇兩路語音信息是避免聲音切換的過于頻繁,背景聲音的突然變化 導致用戶不適應。
其中,語音會議服務器在接收到來自多個語音發(fā)送終端的聲音能量信息 時,獲取語音發(fā)送終端的IP地址信息,在計算出能量最高的兩路語音信息后, 將該兩路語音信息所對應的IP地址信息添加到信令中,并將該信令發(fā)送給語 音接收終端(可以為多個),而該信令中攜帶了組播源(語音發(fā)送終端)的IP 地址信息(聲音能量最高的兩路聲音信號的標識)。其中,在組播網(wǎng)絡中,組 播是允許一個或多個發(fā)送者(組播源)發(fā)送的數(shù)據(jù)包到多個接收者(一次的, 同時的)的網(wǎng)絡技術(shù),組播源把數(shù)據(jù)包發(fā)送到特定組播組,而只有屬于該組 播組的地址才能接收到數(shù)據(jù)包,從而大大的節(jié)省網(wǎng)絡帶寬。本發(fā)明中,組播 源將攜帶語音信息的數(shù)據(jù)包發(fā)送到組播網(wǎng)絡,在組播網(wǎng)絡中存儲不同組播源 (不同的語音發(fā)送終端)的語音信息,當該特定組#~組內(nèi)的接收者(語音接 收終端)需要接收語音信息時,組播網(wǎng)絡將對應的語音信息發(fā)送給語音接收 終端。多個語音接收終端在接收到上述的信令后,分別向組播網(wǎng)絡發(fā)送消息, 該消息的目的地址為組播組地址,并且該消息中攜帶了組播源的IP地址信息 (能量最高的兩路語音信息所對應的語音發(fā)送終端的IP地址信息)。其中,該 多個語音接收終端為組播網(wǎng)絡所在組播組內(nèi)的不同接收者。
組播網(wǎng)絡在接收到來自多個語音接收終端的消息后,獲取消息中攜帶的 組播源的IP地址信息(能量最高的兩路語音信息所對應的語音發(fā)送終端的IP 地址),查找到該組播源IP地址所對應的語音信息(能量最高的兩路語音信 息),并將該語音信息發(fā)送給多個語音接收終端。
步驟406,語音接收終端對這兩路語音信息進行解碼,并對解碼后的兩路 語音信息進行混音,然后輸出。
步驟407,語音發(fā)送終端不具有根據(jù)語音信息計算聲音能量的功能時,語 音發(fā)送終端根據(jù)語音發(fā)送終端與組播網(wǎng)絡之間的聲音通道,將語音信息發(fā)送 給組播網(wǎng)絡,該語音信息中攜帶該語音發(fā)送終端的地址信息。該語音發(fā)送終 端向語音會議服務器發(fā)送消息,該消息中攜帶了經(jīng)過編碼的語音發(fā)送終端的 語音信息,語音會議服務器對語音信息進行解碼,并進行能量計算和能量比 較過程。轉(zhuǎn)到步驟405。
上述實施例僅以對兩路語音信號進行混音為例說明,實際應用中也可以 對兩路以上語音信號進行混音,但實現(xiàn)過程有所區(qū)別。例如對于3路語音信 號進行混音,需要在語音會議服務器和語音終端之間預先建立3條聲音能量 通道;語音會議服務器接收來自至少三個語音發(fā)送終端的語音信息及對應的 聲音能量,對這些聲音能量進行比較,獲得聲音能量最高的三個,分別將這 三個聲音能量最高的語音信息通過對應的3條聲音能量通道發(fā)送給語音接收 終端,使語音接收終端這三路語音信息進行解碼,并對解碼后的三路語音信 息進行混音輸出。
本發(fā)明提供了一種語音混音的實現(xiàn)系統(tǒng),包括組播網(wǎng)絡、語音會議服務 器、語音接收終端和至少兩個語音發(fā)送終端,其中
語音發(fā)送終端,用于獲取語音信息,計算所述語音信息的聲音能量,并將所述語音信息對應的聲音能量發(fā)送給所述語音會議服務器,將所述語音信
息發(fā)送到組播網(wǎng)絡中對應的組播地址;
語音會議服務器,用于對來自多個語音發(fā)送終端的聲音能量進行比較, 獲得能量大的至少兩路語音信息后,通過信令指示語音接收終端從所述組播 網(wǎng)絡中對應的組播地址獲取對應的至少兩路語音信息;
組播網(wǎng)絡,用于接收來自語音發(fā)送終端的語音信息,并向語音接收終端 發(fā)送能量大的至少兩路語音信息;
語音接收終端,用于獲取所述至少兩路語音信息后,對所述至少兩路語 音信息進行混音。
本發(fā)明提供了一種語音終端,如圖5所示,包括
語音信息獲取模塊510,用于采集用戶發(fā)出的語音信息;
能量計算模塊520,用于根據(jù)語音信息獲取模塊510采集的所述語音信息
計算所述語音信息對應的聲音能量;
發(fā)送模塊530,用于將能量計算模塊520計算得到的所述語音信息對應的
聲音能量發(fā)送給語音會議服務器,將所述語音信息發(fā)送到組播網(wǎng)絡中對應的
組插,地址。
接收模塊540,用于接收語音會議服務器發(fā)送的指令,所述指令中包括聲
音能量最高的至少兩路聲音信號的標識;
獲取模塊550,用于根據(jù)接收模塊540接收的所述指令向組播網(wǎng)絡中所述 聲音能量最高的至少兩路聲音信號的標識對應的組播地址中獲取對應的至少 兩路語音信息;
混音模塊560,用于對獲取模塊550獲取的所述至少兩路語音信息進行混 音輸出。
建立模塊570,用于建立與語音會議服務器之間的聲音能量通道,以及與 組播網(wǎng)絡之間的聲音通道,以使發(fā)送模塊530根據(jù)聲音能量通道將語音信息 對應的聲音能量發(fā)送給語音會議服務器,使發(fā)送模塊530根據(jù)聲音通道將語 音信息發(fā)送到組播網(wǎng)絡中對應的組播地址。本發(fā)明提供了一種語音會議服務器,如圖6所示,包括接收模塊610, 用于接收來自多個語音終端的語音信息和對應的聲音能量; 該接收模塊610還用于接收來自多個語音終端的語音信息; 比較模塊620,用于對接收模塊610接收的所述多個聲音能量進行比較; 發(fā)送模塊630,用于根據(jù)比較模塊620對所述多個聲音能量的比較結(jié)果, 通過信令指示語音接收終端從所述組播網(wǎng)絡中對應的組播地址獲取對應的至 少兩路語音信息。
計算模塊640,用于計算接收模塊610接收到的來自多個語音發(fā)送終端的 語音信息的聲音能量,并通過比較模塊620對多個語音發(fā)送終端的聲音能量 進行比較。
本發(fā)明中在語音終端支持聲音能量計算及傳輸特性的情況下,語音會議 服務器只需要進行語音信息及對應的聲音能量的接收,聲音能量的比較。不 需要進行聲音能量的計算及混音,極大的降低對語音會議服務器的性能要求, 從而提升了語音會議系統(tǒng)整體的容量。
另外,語音終端根據(jù)語音信息計算聲音能量,并向語音會議服務器傳輸 聲音能量的特性都是在標準協(xié)議的基礎上進行擴展,即使所有的語音終端不 支持這些特性也將不影響該語音會議系統(tǒng)的正常使用,也不會降低原有的性 能,但只要有一部分語音終端支持該特性,則語音會議系統(tǒng)的整體性能就將 得到提升,如所有的終端都支持該特性,則語音會議服務器的整體性能將得 到極大的提升。
通過以上的實施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到本 發(fā)明可借助軟件加必需的通用硬件平臺的方式來實現(xiàn),當然也可以通過硬 件,但很多情況下前者是更佳的實施方式?;谶@樣的理解,本發(fā)明的技
現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使 得一臺計算機設備(可以是個人計算機,服務器,或者網(wǎng)絡設備等)執(zhí)行
15本發(fā)明各個實施例所述的方法。
以上公開的僅為本發(fā)明的幾個具體實施例,但是,本發(fā)明并非局限于此, 任何本領(lǐng)域的技術(shù)人員能思之的變化都應落入本發(fā)明的保護范圍。
權(quán)利要求
1、一種語音混音的實現(xiàn)方法,應用于包括組播網(wǎng)絡、語音會議服務器和至少兩個語音終端的系統(tǒng)中,所述語音終端包括語音發(fā)送終端和語音接收終端,其特征在于,所述方法包括以下步驟所述語音發(fā)送終端獲取語音信息,計算所述語音信息的聲音能量,并將所述語音信息對應的聲音能量發(fā)送給所述語音會議服務器,將所述語音信息發(fā)送到組播網(wǎng)絡中對應的組播地址;所述語音會議服務器對來自多個語音發(fā)送終端的聲音能量進行比較,獲得能量大的至少兩路語音信息后,通過信令指示語音接收終端從所述組播網(wǎng)絡中對應的組播地址獲取對應的至少兩路語音信息;所述語音接收終端對所述至少兩路語音信息進行混音。
2、 如權(quán)利要求l所述的方法,其特征在于,所述方法還包括 所述語音發(fā)送終端獲取語音信息,并將所述語音信息發(fā)送給所述語音會議服務器和組播網(wǎng)絡中對應的組播地址;所述語音會議服務器計算來自多個語音發(fā)送終端的所述語音信息的聲音 能量,并對所述多個語音發(fā)送終端的聲音能量進行比較,獲得能量大的至少 兩路語音信息后,通過信令指示語音接收終端從所述組播網(wǎng)絡中對應的組播 地址獲取對應的至少兩路語音信息;所述語音接收終端對所述至少兩路語音信息進行混音。
3、 如權(quán)利要求1或2所述的方法,其特征在于,所述將語音信息對應的 聲音能量發(fā)送給所述語音會議服務器,將所述語音信息發(fā)送到組播網(wǎng)絡中對 應的組播地址,具體包括建立與所述語音會議服務器之間的聲音能量通道,與組播網(wǎng)絡之間的聲 音通道;語音發(fā)送終端通過所述聲音通道向組播網(wǎng)絡發(fā)送語音信息,通過所述聲 音能量通道向所述語音會議服務器發(fā)送所述語音信息對應的聲音能量。
4、 如權(quán)利要求1或2所述的方法,其特征在于,所述通過信令指示語音 接收終端從所述組播網(wǎng)絡中對應的組播地址獲取對應的至少兩路語音信息,具體包括所述語音會議服務器向所述語音接收終端發(fā)送指令,所述指令中包括聲 音能量最高的至少兩路聲音信號的標識;所述語音接收終端根據(jù)組播網(wǎng)絡中所述聲音能量最高的至少兩路聲音信 號的標識獲取對應的至少兩路語音信息。
5、 如權(quán)利要求4所述的方法,其特征在于,所述語音接收終端根據(jù)組播 網(wǎng)絡中所述聲音能量最高的至少兩路聲音信號的標識獲取對應的至少兩路語 音信息包括所述語音接收終端向組播網(wǎng)絡發(fā)送攜帶聲音能量最高的至少兩路聲音信 號標識的信息;所述組#~網(wǎng)絡才艮據(jù)所述標識查找所述標識對應的至少兩鴻4吾音信息; 所述語音接收終端接收來自所述組播網(wǎng)絡的對應的至少兩路語音信息。
6、 一種語音混音的實現(xiàn)系統(tǒng),其特征在于,包括組播網(wǎng)絡、語音會議服 務器、語音接收終端和語音發(fā)送終端,其中所述語音發(fā)送終端,用于獲取語音信息,計算所述語音信息的聲音能量, 并將所述語音信息對應的聲音能量發(fā)送給所述語音會議服務器,將所述語音 信息發(fā)送到所述組播網(wǎng)絡中對應的組播地址;所述語音會議服務器,用于對來自多個語音發(fā)送終端的聲音能量進行比 較,獲得能量大的至少兩路語音信息后,通過信令指示語音接收終端從所述 組播網(wǎng)絡中對應的組4番地址獲取對應的至少兩路語音信息;所述組播網(wǎng)絡,用于接收來自所述語音發(fā)送終端的語音信息,并向所述 語音接收終端發(fā)送所述能量大的至少兩路語音信息;所述語音接收終端,用于獲取所述至少兩路語音信息后,對所述至少兩 路語音信息進行混音。
7、 一種語音終端,其特征在于,包括 語音信息獲取模塊,用于采集用戶發(fā)出的語音信息; 能量計算模塊,用于根據(jù)所述語音信息獲取模塊采集的所述語音信息計算所述語音信息對應的聲音能量;發(fā)送模塊,用于將所述能量計算模塊計算得到的所述語音信息對應的聲 音能量發(fā)送給語音會議服務器,將所述語音信息發(fā)送到組播網(wǎng)絡中對應的組 播地址。
8、 如權(quán)利要求7所述語音終端,其特征在于,還包括接收模塊,用于接收語音會議服務器發(fā)送的指令,所述指令中包括聲音 能量最高的至少兩^ 各聲音信號的標識;獲取模塊,用于根據(jù)所述接收模塊接收的所述指令向組播網(wǎng)絡中所述聲 音能量最高的至少兩路聲音信號的標識對應的組播地址中獲取對應的至少兩 路語音信息;混音模塊,用于對所述獲取模塊獲取的所述至少兩路語音信息進行混音 輸出。
9、 如權(quán)利要求7或8所述語音終端,其特征在于,還包括 建立模塊,用于建立與所述語音會議服務器之間的聲音能量通道,與組播網(wǎng)絡之間的聲音通道。
10、 一種語音會議服務器,其特征在于,包括 接收模塊,用于接收來自多個語音終端的聲音能量;比較模塊,用于對所述接收模塊接收的所述多個聲音能量進行比較; 發(fā)送模塊,用于根據(jù)所述比較模塊對所述多個聲音能量的比較結(jié)果,通 過信令指示語音接收終端從所述組播網(wǎng)絡中對應的組^番地址獲取對應的至少兩路語音信息。
11、 如權(quán)利要求IO所述語音會議服務器,其特征在于,所述接收模塊還 用于接收來自多個語音終端的語音信息;所述語音會議服務器還包括計算模塊,用于計算來自多個語音發(fā)送終端的所述語音信息的聲音能量, 并通過所述比較模塊對所述多個語音發(fā)送終端的聲音能量進行比較。
全文摘要
本發(fā)明公開了一種語音混音的實現(xiàn)方法,應用于包括組播網(wǎng)絡、語音會議服務器和至少兩個語音終端的系統(tǒng)中,該方法包括語音發(fā)送終端獲取語音信息,計算語音信息的聲音能量,并將語音信息對應的聲音能量發(fā)送給語音會議服務器,將語音信息發(fā)送到組播網(wǎng)絡中對應的組播地址;語音會議服務器對來自多個語音發(fā)送終端的聲音能量進行比較,獲得能量大的至少兩路語音信息后,通過信令指示語音接收終端從組播網(wǎng)絡中對應的組播地址獲取對應的至少兩路語音信息;語音接收終端對所述至少兩路語音信息進行混音。本發(fā)明中,通過優(yōu)化功能部署來降低對混音服務器的性能要求,從而提升整體的語音會議容量,使同等硬件條件下系統(tǒng)的混音容量得到很大的提升。
文檔編號H04L12/18GK101488870SQ200910009468
公開日2009年7月22日 申請日期2009年2月25日 優(yōu)先權(quán)日2009年2月25日
發(fā)明者斌 周 申請人:杭州華三通信技術(shù)有限公司