語音混音的實現(xiàn)方法、系統(tǒng)及設備的制作方法

文檔序號：7945157閱讀：463來源：國知局

專利名稱：語音混音的實現(xiàn)方法、系統(tǒng)及設備的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及通信技術(shù)領(lǐng)域，尤其涉及一種語音混音的實現(xiàn)方法、系統(tǒng)及設備。
背景技術(shù)：
語音會議系統(tǒng)可以實現(xiàn)多個用戶同時進行語音通信，如圖1所示，目前
語音會議系統(tǒng)包括MCU (Multipoint Control Unit，多點控制器)和多個終端，這些終端在不同時刻功能不同，分為語音發(fā)起終端和語音接收終端。其中，語音發(fā)起終端將語音信息進行編碼后匯聚到MCU， MCU將來自各個語音發(fā) 起終端的信息進行解碼，將各個解碼后的語音信號進行混音并編碼后，發(fā)送給語音接收終端；語音接收終端接收到聲音流后，進行解碼輸出。
由于MCU對所有的語音信號進行混音可能造成資源占用過多及混音后的信號效果不好，因此，提出了一種優(yōu)化方法MCU解碼后，計算各路語音信號的聲音能量，然后和其他語音信號進行能量比較，只混音能量最高的幾路(例如兩路)語音信號，將語音能量最高的幾路語音信號進行混音并編碼。
然而，上述兩種方法都需要MCU先解碼，再編碼等，而且解碼，編碼等都非常消耗性能，因此語音會議的總接入路數(shù)受到MCU性能的制約。
另外，當沒有專門的MCU來混音時，各個終端把各自的聲音發(fā)送給會議的各個加入者，各個加入者來自主的實現(xiàn)混音。
然而，該方案中會議容量受到終端性能的限制，而且網(wǎng)絡中流量太大。

發(fā)明內(nèi)容
本發(fā)明提供了一種語音混音的實現(xiàn)方法、系統(tǒng)及設備，以大幅度提升混音的性能。
本發(fā)明提供了一種語音混音的實現(xiàn)方法，應用于包括組播網(wǎng)絡、語音會議服務器和至少兩個語音終端的系統(tǒng)中，所述語音終端包括語音發(fā)送終端和
語音接收終端，所述方法包括以下步驟
所述語音發(fā)送終端獲取語音信息，計算所述語音信息的聲音能量，并將所述語音信息對應的聲音能量發(fā)送給所述語音會議服務器，將所述語音信息發(fā)送到組播網(wǎng)絡中對應的組播地址；
所述語音會議服務器對來自多個語音發(fā)送終端的聲音能量進行比較，獲得能量大的至少兩路語音信息后，通過信令指示語音接收終端從所述組播網(wǎng) 絡中對應的組播地址獲取對應的至少兩路語音信息；
所述語音接收終端對所述至少兩路語音信息進行混音。
優(yōu)選地，所述方法還包括
所述語音發(fā)送終端獲取語音信息，并將所述語音信息發(fā)送給所述語音會議服務器和組播網(wǎng)絡中對應的組播地址；
所述語音會議服務器計算來自多個語音發(fā)送終端的所述語音信息的聲音能量，并對所述多個語音發(fā)送終端的聲音能量進行比較，獲得能量大的至少兩路語音信息后，通過信令指示語音接收終端從所述組播網(wǎng)絡中對應的組播地址獲取對應的至少兩路語音信息；
所述語音接收終端對所述至少兩路語音信息進行混音。
優(yōu)選地，所述將語音信息對應的聲音能量發(fā)送給所述語音會議服務器，將所述語音信息發(fā)送到組播網(wǎng)絡中對應的組播地址，具體包括
建立與所述語音會議服務器之間的聲音能量通道，與組播網(wǎng)絡之間的聲音通道；
語音發(fā)送終端通過所述聲音通道向組播網(wǎng)絡發(fā)送語音信息，通過所述聲音能量通道向所述語音會議服務器發(fā)送所述語音信息對應的聲音能量。
優(yōu)選地，所述通過信令指示語音接收終端從所述組播網(wǎng)絡中對應的組播地址獲取對應的至少兩路語音信息，具體包括
所述語音會議服務器向所述語音接收終端發(fā)送指令，所述指令中包括聲
音能量最高的至少兩^f各聲音信號的標識；
所述語音接收終端根據(jù)組播網(wǎng)絡中所述聲音能量最高的至少兩路聲音信
6號的標識獲取對應的至少兩路語音信息。
優(yōu)選地，所述語音接收終端根據(jù)組播網(wǎng)絡中所述聲音能量最高的至少兩
路聲音信號的標識獲取對應的至少兩路語音信息包括
所述語音接收終端向組播網(wǎng)絡發(fā)送攜帶聲音能量最高的至少兩路聲音信號標識的信息；
所述組播網(wǎng)絡根據(jù)所述標識查找所述標識對應的至少兩鴻4吾音信息；
所述語音接收終端接收來自所述組播網(wǎng)絡的對應的至少兩路語音信息。
本發(fā)明提供了一種語音混音的實現(xiàn)系統(tǒng)，包括組播網(wǎng)絡、語音會議服務器、語音接收終端和語音發(fā)送終端，其中
所述語音發(fā)送終端，用于獲: 又語音信息，計算所述語音信息的聲音能量，并將所述語音信息對應的聲音能量發(fā)送給所述語音會議服務器，將所述語音信息發(fā)送到所述組播網(wǎng)絡中對應的組播地址；
所述語音會議服務器,用于對來自多個語音發(fā)送終端的聲音能量進行比較，獲得能量大的至少兩路語音信息后，通過信令指示語音接收終端從所述組播網(wǎng)絡中對應的組播地址獲取對應的至少兩路語音信息；
所述組播網(wǎng)絡，用于接收來自所述語音發(fā)送終端的語音信息，并向所述語音接收終端發(fā)送所述能量大的至少兩路語音信息；
所述語音接收終端，用于獲取所述至少兩路語音信息后，對所述至少兩路語音信息進行混音。
本發(fā)明提供了一種語音終端，包括
語音信息獲取模塊，用于采集用戶發(fā)出的語音信息；
能量計算模塊，用于根據(jù)所述語音信息獲取模塊采集的所述語音信息計算所述語音信息對應的聲音能量；
發(fā)送模塊，用于將所述能量計算模塊計算得到的所述語音信息對應的聲音能量發(fā)送給語音會議服務器，將所述語音信息發(fā)送到組播網(wǎng)絡中對應的組播地址。
優(yōu)選地，還包括
接收模塊，用于接收語音會議服務器發(fā)送的指令，所述指令中包括聲音能量最高的至少兩^ 各聲音信號的標識；
獲取模塊，用于根據(jù)所述接收模塊接收的所述指令向組播網(wǎng)絡中所述聲音能量最高的至少兩路聲音信號的標識對應的組播地址中獲取對應的至少兩
路語音信息；
混音模塊，用于對所述獲取模塊獲取的所述至少兩路語音信息進行混音輸出。
優(yōu)選地，還包括
建立模塊，用于建立與所述語音會議服務器之間的聲音能量通道，與組播網(wǎng)絡之間的聲音通道。
本發(fā)明提供了一種語音會議服務器，包括接收模塊，用于接收來自多個語音終端的聲音能量；比較模塊，用于對所述接收模塊接收的所述多個聲音能量進行比較；發(fā)送模塊，用于根據(jù)所述比較模塊對所述多個聲音能量的比較結(jié)果，通過信令指示語音接收終端從所述組播網(wǎng)絡中對應的組^番地址獲取對應的至少
兩路語音信息。
優(yōu)選地，所述接收模塊還用于接收來自多個語音終端的語音信息；所述語音會議服務器還包括
計算模塊，用于計算來自多個語音發(fā)送終端的所述語音信息的聲音能量，并通過所述比較才莫塊對所述多個語音發(fā)送終端的聲音能量進行比較。與現(xiàn)有技術(shù)相比，本發(fā)明具有以下優(yōu)點
本發(fā)明中，通過優(yōu)化功能部署來降低對混音服務器的性能要求，從而提升整體的語音會議容量，使同等硬件條件下系統(tǒng)的混音容量得到很大的提升。并且，由于本發(fā)明利用組播網(wǎng)絡傳輸語音信息，可以更有效地實現(xiàn)語音信息的集中管理控制，有效節(jié)省與利用會議帶寬，增加與會用戶數(shù)量，與會人員的數(shù)量不會受到限制。

圖l是現(xiàn)有技術(shù)中一種語音會議系統(tǒng)示意圖；圖2是本發(fā)明中一種語音混音的實現(xiàn)方法流程圖3是本發(fā)明中一種語音會議系統(tǒng)示意圖4是本發(fā)明中另一種語音混音的實現(xiàn)方法流程圖;
圖5是本發(fā)明中一種語音終端結(jié)構(gòu)圖6是本發(fā)明中一種語音會議服務器結(jié)構(gòu)圖。
具體實施例方式
本發(fā)明的基本思想為語音發(fā)送終端獲取語音信息，計算語音信息的聲音能量，并將語音信息對應的聲音能量發(fā)送給語音會議服務器，將語音信息發(fā)送到組播網(wǎng)絡中對應的組播地址；語音會議服務器對來自多個語音發(fā)送終
端的聲音能量進行比較，獲得能量大的至少兩路語音信息后，通過信令指示
語音接收終端從組l番網(wǎng)絡中對應的組〗番地址獲耳又對應的至少兩i 各語音信息；語音接收終端對所述至少兩路語音信息進行混音。本發(fā)明通過優(yōu)化混音功能的部署來減少語音會議服務器的混音步驟，從而大幅度提升了混音的性能。
本發(fā)明提供了一種語音混音的實現(xiàn)方法，應用于包括組播網(wǎng)絡、語音會議服務器和至少兩個語音終端的系統(tǒng)中，所述語音終端包括語音發(fā)送終端和語音接收終端，所述方法如圖2所示，包括以下步驟
步驟201，所述語音發(fā)送終端獲取語音信息，計算所述語音信息的聲音能量，并將所述語音信息對應的聲音能量發(fā)送給所述語音會議服務器，將所述語音信息發(fā)送到組播網(wǎng)絡中對應的組播地址；
步驟202,所述語音會議服務器對來自多個語音發(fā)送終端的聲音能量進行比較，獲得能量大的至少兩路語音信息后，通過信令指示語音接收終端從所述組播網(wǎng)絡中對應的組播地址獲取對應的至少兩路語音信息；
步驟203,所述語音接收終端對所述至少兩路語音信息進行混音。
其中，所述方法還包括
所述語音發(fā)送終端獲取語音信息，并將所述語音信息發(fā)送給所述語音會議服務器和組播網(wǎng)絡中對應的組播地址；
所述語音會議服務器計算來自多個語音發(fā)送終端的所述語音信息的聲音
9能量，并對所迷多個語音發(fā)送終端的聲音能量進行比較，獲得能量大的至少兩路語音信息后，通過信令指示語音接收終端從所述組播網(wǎng)絡中對應的組播
地址獲取對應的至少兩^各語音信息；
所述語音接收終端對所述至少兩路語音信息進行混音。
其中，所述將語音信息對應的聲音能量發(fā)送給所述語音會議服務器，將
所述語音信息發(fā)送到組播網(wǎng)絡中對應的組播地址，具體包括
建立與所述語音會議服務器之間的聲音能量通道，與組播網(wǎng)絡之間的聲
音通道；
語音發(fā)送終端通過所述聲音通道向組播網(wǎng)絡發(fā)送語音信息，通過所述聲音能量通道向所述語音會議服務器發(fā)送所述語音信息對應的聲音能量。
其中，所述通過信令指示語音接收終端從所述組播網(wǎng)絡中對應的組播地址獲取對應的至少兩路語音信息，具體包括
所述語音會議服務器向所迷語音接收終端發(fā)送指令，所述指令中包括聲音能量最高的至少兩路聲音信號的標識；
所述語音接收終端根據(jù)組播網(wǎng)絡中所述聲音能量最高的至少兩路聲音信號的標識獲取對應的至少兩路語音信息。
其中，所述語音接收終端根據(jù)組播網(wǎng)絡中所述聲音能量最高的至少兩路
聲音信號的標識獲取對應的至少兩路語音信息包括
所述語音接收終端向組播網(wǎng)絡發(fā)送攜帶聲音能量最高的至少兩路聲音信號標識的信息；
所述組播網(wǎng)絡根據(jù)所述標識查找所述標識對應的至少兩路語音信息；所述語音接收終端接收來自所述組播網(wǎng)絡的對應的至少兩路語音信息。
本發(fā)明中，提供了一種語音混音的實現(xiàn)方法，應用于包括一個語音會議服務器，多個語音終端的系統(tǒng)中，這些語音終端根據(jù)會議的需要可以分為語音發(fā)送終端和語音接收終端，其中，語音發(fā)送終端為會議發(fā)言者，語音接收終端為會議聽眾。該實施例僅以對兩路語音信號進4亍混音為例說明，該方法應用的系統(tǒng)如圖3所示，具體處理過程如圖4所示，包括以下步驟
10步驟401,語音會議服務器通過呼叫信令(例如SIP協(xié)議或R323協(xié)議等) 和語音終端協(xié)商建立聲音能量通道，語音終端與組播網(wǎng)絡建立聲音通道。其中，聲音通道，用于語音終端與組播網(wǎng)絡交互語音信號；聲音能量通道，用于語音會議服務器使用標準的RTP (Real-time Transport Protocol，實時傳輸協(xié) 議)協(xié)議來接收語音發(fā)送終端的聲音能量信息，例如，語音會議服務器和語音終端通過將SIP (Session Initiation Protocol,會議起始協(xié)議)協(xié)議中的SDP (Service Discovery Protocol,服務發(fā)現(xiàn)協(xié)議)報文擴展一個PayLoad (有效載荷)類型，協(xié)商出一個聲音能量通道。
其中，在語音發(fā)送終端與組播網(wǎng)絡建立聲音通道時，該語音發(fā)送終端為源終端(即組^"源)，該組#"網(wǎng)絡的地址為目的地址(即組^"組地址)。
步驟402,語音發(fā)送終端在采集到語音信息后，判斷該語音發(fā)送終端是否具有根據(jù)語音信息計算聲音能量的功能，如果有，則與語音會議服務器建立聲音能量通道，轉(zhuǎn)到步驟403。該建立的聲音能量通道為語音會議服務器和語音發(fā)送終端協(xié)商的聲音能量通道，步驟401中，該語音發(fā)送終端與組播網(wǎng)絡已建立聲音通道，此時，可以確定聲音通道和聲音能量通道的對應關(guān)系，即建立語音信息及該語音信息的聲音能量的對應關(guān)系；當語音發(fā)送終端不具有根據(jù)語音信息計算聲音能量的功能時，只建立語音發(fā)送終端與組播網(wǎng)絡的聲音通道，轉(zhuǎn)到步驟407。
步驟403，語音發(fā)送終端具有根據(jù)語音信息計算聲音能量的功能，則在采集語音信息后，計算該語音信息的聲音能量；對該語音信息和對應的聲音能量進行編碼，然后在發(fā)送語音信息的RTP報文和發(fā)送對應的聲音能量的RTP 報文的時間戳上打上相同的時間，以便語音會議服務器根據(jù)時間戳確定該語音信息在該時間段的聲音能量，并將該語音信息對應的聲音能量通過聲音能量通道發(fā)送到語音會議服務器。
本發(fā)明中，語音發(fā)送終端在釆集到語音信息后，還將通過聲音通道將該語音信息發(fā)送到組播網(wǎng)絡中，該語音信息中還可以攜帶該語音發(fā)送終端的地址信息(當多個語音發(fā)送終端向同一組播組地址發(fā)送語音信息時，用于區(qū)分發(fā)送該語音信息的源終端)。其中，語音發(fā)送終端向組播網(wǎng)絡發(fā)送語音信息和語音發(fā)送終端向語音會議服務器發(fā)送該語音信息所對應的聲音能量并沒有先后的順序關(guān)系。
步驟404，語音會議服務器從各個聲音能量通道中接收來自多個語音發(fā)送終端發(fā)送的聲音能量信息；比較各路聲音能量，比較聲音能量不是直接比較聲音能量值，而且對正在傳輸?shù)穆曇粢x予更高的權(quán)重，使得聲音逐漸退出。例如，初始比較時，聲音能量最大的權(quán)重賦值為2,在第二次的比較中，先直接比較聲音能量，如果該路聲音的能量值已經(jīng)不是最大值，則該路聲音的權(quán) 重降低為1.8,并把該路聲音能量乘以權(quán)重后再和最大的聲音能量進行比較，如該路聲音能量乘以權(quán)重后仍比當前最大的聲音能量大，則還使用原先的這路語音，如果該路聲音能量乘以權(quán)重后小于當前最大的聲音能量，則使用當前最大的聲音能量。
步驟405,語音會議服務器依據(jù)能量比較算法得出能量最高的兩路語音信息，并通過信令指示語音接收終端從組播網(wǎng)絡中對應的組播源地址中去接收語音信息，該信令為擴展的信令，目的是指示語音接收終端變更"源"的地址。其中，選擇兩路語音信息是避免聲音切換的過于頻繁，背景聲音的突然變化導致用戶不適應。
其中，語音會議服務器在接收到來自多個語音發(fā)送終端的聲音能量信息時，獲取語音發(fā)送終端的IP地址信息，在計算出能量最高的兩路語音信息后，將該兩路語音信息所對應的IP地址信息添加到信令中，并將該信令發(fā)送給語音接收終端(可以為多個)，而該信令中攜帶了組播源(語音發(fā)送終端)的IP 地址信息(聲音能量最高的兩路聲音信號的標識)。其中，在組播網(wǎng)絡中，組播是允許一個或多個發(fā)送者(組播源)發(fā)送的數(shù)據(jù)包到多個接收者(一次的，同時的)的網(wǎng)絡技術(shù)，組播源把數(shù)據(jù)包發(fā)送到特定組播組，而只有屬于該組播組的地址才能接收到數(shù)據(jù)包，從而大大的節(jié)省網(wǎng)絡帶寬。本發(fā)明中，組播源將攜帶語音信息的數(shù)據(jù)包發(fā)送到組播網(wǎng)絡，在組播網(wǎng)絡中存儲不同組播源 (不同的語音發(fā)送終端)的語音信息，當該特定組#~組內(nèi)的接收者(語音接收終端)需要接收語音信息時，組播網(wǎng)絡將對應的語音信息發(fā)送給語音接收終端。多個語音接收終端在接收到上述的信令后，分別向組播網(wǎng)絡發(fā)送消息，該消息的目的地址為組播組地址，并且該消息中攜帶了組播源的IP地址信息 (能量最高的兩路語音信息所對應的語音發(fā)送終端的IP地址信息)。其中，該多個語音接收終端為組播網(wǎng)絡所在組播組內(nèi)的不同接收者。
組播網(wǎng)絡在接收到來自多個語音接收終端的消息后，獲取消息中攜帶的組播源的IP地址信息(能量最高的兩路語音信息所對應的語音發(fā)送終端的IP 地址)，查找到該組播源IP地址所對應的語音信息(能量最高的兩路語音信息)，并將該語音信息發(fā)送給多個語音接收終端。
步驟406,語音接收終端對這兩路語音信息進行解碼，并對解碼后的兩路語音信息進行混音，然后輸出。
步驟407，語音發(fā)送終端不具有根據(jù)語音信息計算聲音能量的功能時，語音發(fā)送終端根據(jù)語音發(fā)送終端與組播網(wǎng)絡之間的聲音通道，將語音信息發(fā)送給組播網(wǎng)絡，該語音信息中攜帶該語音發(fā)送終端的地址信息。該語音發(fā)送終端向語音會議服務器發(fā)送消息，該消息中攜帶了經(jīng)過編碼的語音發(fā)送終端的語音信息，語音會議服務器對語音信息進行解碼，并進行能量計算和能量比較過程。轉(zhuǎn)到步驟405。
上述實施例僅以對兩路語音信號進行混音為例說明，實際應用中也可以對兩路以上語音信號進行混音，但實現(xiàn)過程有所區(qū)別。例如對于3路語音信號進行混音，需要在語音會議服務器和語音終端之間預先建立3條聲音能量通道；語音會議服務器接收來自至少三個語音發(fā)送終端的語音信息及對應的聲音能量，對這些聲音能量進行比較，獲得聲音能量最高的三個，分別將這三個聲音能量最高的語音信息通過對應的3條聲音能量通道發(fā)送給語音接收終端，使語音接收終端這三路語音信息進行解碼，并對解碼后的三路語音信息進行混音輸出。
本發(fā)明提供了一種語音混音的實現(xiàn)系統(tǒng)，包括組播網(wǎng)絡、語音會議服務器、語音接收終端和至少兩個語音發(fā)送終端，其中
語音發(fā)送終端，用于獲取語音信息，計算所述語音信息的聲音能量，并將所述語音信息對應的聲音能量發(fā)送給所述語音會議服務器，將所述語音信
息發(fā)送到組播網(wǎng)絡中對應的組播地址；
語音會議服務器，用于對來自多個語音發(fā)送終端的聲音能量進行比較，獲得能量大的至少兩路語音信息后，通過信令指示語音接收終端從所述組播網(wǎng)絡中對應的組播地址獲取對應的至少兩路語音信息；
組播網(wǎng)絡，用于接收來自語音發(fā)送終端的語音信息，并向語音接收終端發(fā)送能量大的至少兩路語音信息；
語音接收終端，用于獲取所述至少兩路語音信息后，對所述至少兩路語音信息進行混音。
本發(fā)明提供了一種語音終端，如圖5所示，包括
語音信息獲取模塊510，用于采集用戶發(fā)出的語音信息；
能量計算模塊520，用于根據(jù)語音信息獲取模塊510采集的所述語音信息
計算所述語音信息對應的聲音能量；
發(fā)送模塊530,用于將能量計算模塊520計算得到的所述語音信息對應的
聲音能量發(fā)送給語音會議服務器，將所述語音信息發(fā)送到組播網(wǎng)絡中對應的
組插，地址。
接收模塊540,用于接收語音會議服務器發(fā)送的指令，所述指令中包括聲
音能量最高的至少兩路聲音信號的標識；
獲取模塊550,用于根據(jù)接收模塊540接收的所述指令向組播網(wǎng)絡中所述聲音能量最高的至少兩路聲音信號的標識對應的組播地址中獲取對應的至少兩路語音信息；
混音模塊560,用于對獲取模塊550獲取的所述至少兩路語音信息進行混音輸出。
建立模塊570,用于建立與語音會議服務器之間的聲音能量通道，以及與組播網(wǎng)絡之間的聲音通道，以使發(fā)送模塊530根據(jù)聲音能量通道將語音信息對應的聲音能量發(fā)送給語音會議服務器，使發(fā)送模塊530根據(jù)聲音通道將語音信息發(fā)送到組播網(wǎng)絡中對應的組播地址。本發(fā)明提供了一種語音會議服務器，如圖6所示，包括接收模塊610，用于接收來自多個語音終端的語音信息和對應的聲音能量；該接收模塊610還用于接收來自多個語音終端的語音信息；比較模塊620，用于對接收模塊610接收的所述多個聲音能量進行比較；發(fā)送模塊630,用于根據(jù)比較模塊620對所述多個聲音能量的比較結(jié)果，通過信令指示語音接收終端從所述組播網(wǎng)絡中對應的組播地址獲取對應的至少兩路語音信息。
計算模塊640，用于計算接收模塊610接收到的來自多個語音發(fā)送終端的語音信息的聲音能量，并通過比較模塊620對多個語音發(fā)送終端的聲音能量進行比較。
本發(fā)明中在語音終端支持聲音能量計算及傳輸特性的情況下，語音會議服務器只需要進行語音信息及對應的聲音能量的接收，聲音能量的比較。不需要進行聲音能量的計算及混音，極大的降低對語音會議服務器的性能要求，從而提升了語音會議系統(tǒng)整體的容量。
另外，語音終端根據(jù)語音信息計算聲音能量，并向語音會議服務器傳輸聲音能量的特性都是在標準協(xié)議的基礎上進行擴展，即使所有的語音終端不支持這些特性也將不影響該語音會議系統(tǒng)的正常使用，也不會降低原有的性能，但只要有一部分語音終端支持該特性，則語音會議系統(tǒng)的整體性能就將得到提升，如所有的終端都支持該特性，則語音會議服務器的整體性能將得到極大的提升。
通過以上的實施方式的描述，本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助軟件加必需的通用硬件平臺的方式來實現(xiàn)，當然也可以通過硬件，但很多情況下前者是更佳的實施方式?；谶@樣的理解，本發(fā)明的技
現(xiàn)出來，該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中，包括若干指令用以使得一臺計算機設備(可以是個人計算機，服務器，或者網(wǎng)絡設備等)執(zhí)行
15本發(fā)明各個實施例所述的方法。
以上公開的僅為本發(fā)明的幾個具體實施例，但是，本發(fā)明并非局限于此, 任何本領(lǐng)域的技術(shù)人員能思之的變化都應落入本發(fā)明的保護范圍。
權(quán)利要求
1、一種語音混音的實現(xiàn)方法，應用于包括組播網(wǎng)絡、語音會議服務器和至少兩個語音終端的系統(tǒng)中，所述語音終端包括語音發(fā)送終端和語音接收終端，其特征在于，所述方法包括以下步驟所述語音發(fā)送終端獲取語音信息，計算所述語音信息的聲音能量，并將所述語音信息對應的聲音能量發(fā)送給所述語音會議服務器，將所述語音信息發(fā)送到組播網(wǎng)絡中對應的組播地址；所述語音會議服務器對來自多個語音發(fā)送終端的聲音能量進行比較，獲得能量大的至少兩路語音信息后，通過信令指示語音接收終端從所述組播網(wǎng)絡中對應的組播地址獲取對應的至少兩路語音信息；所述語音接收終端對所述至少兩路語音信息進行混音。
2、如權(quán)利要求l所述的方法，其特征在于，所述方法還包括所述語音發(fā)送終端獲取語音信息，并將所述語音信息發(fā)送給所述語音會議服務器和組播網(wǎng)絡中對應的組播地址；所述語音會議服務器計算來自多個語音發(fā)送終端的所述語音信息的聲音能量，并對所述多個語音發(fā)送終端的聲音能量進行比較，獲得能量大的至少兩路語音信息后，通過信令指示語音接收終端從所述組播網(wǎng)絡中對應的組播地址獲取對應的至少兩路語音信息；所述語音接收終端對所述至少兩路語音信息進行混音。
3、如權(quán)利要求1或2所述的方法，其特征在于，所述將語音信息對應的聲音能量發(fā)送給所述語音會議服務器，將所述語音信息發(fā)送到組播網(wǎng)絡中對應的組播地址，具體包括建立與所述語音會議服務器之間的聲音能量通道，與組播網(wǎng)絡之間的聲音通道；語音發(fā)送終端通過所述聲音通道向組播網(wǎng)絡發(fā)送語音信息，通過所述聲音能量通道向所述語音會議服務器發(fā)送所述語音信息對應的聲音能量。
4、如權(quán)利要求1或2所述的方法，其特征在于，所述通過信令指示語音接收終端從所述組播網(wǎng)絡中對應的組播地址獲取對應的至少兩路語音信息，具體包括所述語音會議服務器向所述語音接收終端發(fā)送指令，所述指令中包括聲音能量最高的至少兩路聲音信號的標識；所述語音接收終端根據(jù)組播網(wǎng)絡中所述聲音能量最高的至少兩路聲音信號的標識獲取對應的至少兩路語音信息。
5、如權(quán)利要求4所述的方法，其特征在于，所述語音接收終端根據(jù)組播網(wǎng)絡中所述聲音能量最高的至少兩路聲音信號的標識獲取對應的至少兩路語音信息包括所述語音接收終端向組播網(wǎng)絡發(fā)送攜帶聲音能量最高的至少兩路聲音信號標識的信息；所述組#~網(wǎng)絡才艮據(jù)所述標識查找所述標識對應的至少兩鴻4吾音信息；所述語音接收終端接收來自所述組播網(wǎng)絡的對應的至少兩路語音信息。
6、一種語音混音的實現(xiàn)系統(tǒng)，其特征在于，包括組播網(wǎng)絡、語音會議服務器、語音接收終端和語音發(fā)送終端，其中所述語音發(fā)送終端，用于獲取語音信息，計算所述語音信息的聲音能量，并將所述語音信息對應的聲音能量發(fā)送給所述語音會議服務器，將所述語音信息發(fā)送到所述組播網(wǎng)絡中對應的組播地址；所述語音會議服務器，用于對來自多個語音發(fā)送終端的聲音能量進行比較，獲得能量大的至少兩路語音信息后，通過信令指示語音接收終端從所述組播網(wǎng)絡中對應的組4番地址獲取對應的至少兩路語音信息；所述組播網(wǎng)絡，用于接收來自所述語音發(fā)送終端的語音信息，并向所述語音接收終端發(fā)送所述能量大的至少兩路語音信息；所述語音接收終端，用于獲取所述至少兩路語音信息后，對所述至少兩路語音信息進行混音。
7、一種語音終端，其特征在于，包括語音信息獲取模塊，用于采集用戶發(fā)出的語音信息；能量計算模塊，用于根據(jù)所述語音信息獲取模塊采集的所述語音信息計算所述語音信息對應的聲音能量；發(fā)送模塊，用于將所述能量計算模塊計算得到的所述語音信息對應的聲音能量發(fā)送給語音會議服務器，將所述語音信息發(fā)送到組播網(wǎng)絡中對應的組播地址。
8、如權(quán)利要求7所述語音終端，其特征在于，還包括接收模塊，用于接收語音會議服務器發(fā)送的指令，所述指令中包括聲音能量最高的至少兩^ 各聲音信號的標識；獲取模塊，用于根據(jù)所述接收模塊接收的所述指令向組播網(wǎng)絡中所述聲音能量最高的至少兩路聲音信號的標識對應的組播地址中獲取對應的至少兩路語音信息；混音模塊，用于對所述獲取模塊獲取的所述至少兩路語音信息進行混音輸出。
9、如權(quán)利要求7或8所述語音終端，其特征在于，還包括建立模塊，用于建立與所述語音會議服務器之間的聲音能量通道，與組播網(wǎng)絡之間的聲音通道。
10、一種語音會議服務器，其特征在于，包括接收模塊，用于接收來自多個語音終端的聲音能量；比較模塊，用于對所述接收模塊接收的所述多個聲音能量進行比較；發(fā)送模塊，用于根據(jù)所述比較模塊對所述多個聲音能量的比較結(jié)果，通過信令指示語音接收終端從所述組播網(wǎng)絡中對應的組^番地址獲取對應的至少兩路語音信息。
11、如權(quán)利要求IO所述語音會議服務器，其特征在于，所述接收模塊還用于接收來自多個語音終端的語音信息；所述語音會議服務器還包括計算模塊，用于計算來自多個語音發(fā)送終端的所述語音信息的聲音能量，并通過所述比較模塊對所述多個語音發(fā)送終端的聲音能量進行比較。
全文摘要
本發(fā)明公開了一種語音混音的實現(xiàn)方法，應用于包括組播網(wǎng)絡、語音會議服務器和至少兩個語音終端的系統(tǒng)中，該方法包括語音發(fā)送終端獲取語音信息，計算語音信息的聲音能量，并將語音信息對應的聲音能量發(fā)送給語音會議服務器，將語音信息發(fā)送到組播網(wǎng)絡中對應的組播地址；語音會議服務器對來自多個語音發(fā)送終端的聲音能量進行比較，獲得能量大的至少兩路語音信息后，通過信令指示語音接收終端從組播網(wǎng)絡中對應的組播地址獲取對應的至少兩路語音信息；語音接收終端對所述至少兩路語音信息進行混音。本發(fā)明中，通過優(yōu)化功能部署來降低對混音服務器的性能要求，從而提升整體的語音會議容量，使同等硬件條件下系統(tǒng)的混音容量得到很大的提升。
文檔編號H04L12/18GK101488870SQ200910009468
公開日2009年7月22日申請日期2009年2月25日優(yōu)先權(quán)日2009年2月25日
發(fā)明者斌周申請人:杭州華三通信技術(shù)有限公司

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：周斌
技術(shù)所有人：杭州華三通信技術(shù)有限公司
我是此專利的發(fā)明人

上一篇：一種用于ofdm系統(tǒng)的信道估計方法
上一篇：一種gre隧道的動態(tài)建立方法和設備的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設計 2.汽車檢測系統(tǒng)設計 3.汽車電子控制系統(tǒng)設計
4、畢老師：機構(gòu)動力學與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

語音混音相關(guān)技術(shù)

混音器設備安裝相關(guān)技術(shù)

混音設備相關(guān)技術(shù)

混音器設備相關(guān)技術(shù)

沒有混音器設備可用相關(guān)技術(shù)

活動混音器設備下載相關(guān)技術(shù)

混音器設備下載安裝相關(guān)技術(shù)

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

語音混音的實現(xiàn)方法、系統(tǒng)及設備的制作方法