基于語音識別的語音呼叫方法和接入網(wǎng)關(guān)的制作方法

文檔序號：7809369閱讀：193來源：國知局

基于語音識別的語音呼叫方法和接入網(wǎng)關(guān)的制作方法
【專利摘要】本發(fā)明實施例提供一種基于語音識別的語音呼叫方法和接入網(wǎng)關(guān)。該方法包括：接入網(wǎng)關(guān)獲取用戶輸入的呼叫語音，所述呼叫語音包括被叫方信息；接入網(wǎng)關(guān)根據(jù)所述呼叫語音，識別獲得被叫號碼，并執(zhí)行語音呼叫。本發(fā)明實施例提供的基于語音識別的語音呼叫方法和接入網(wǎng)關(guān)，通過接入網(wǎng)關(guān)識別用戶的呼叫語音，能夠從呼叫語音中識別獲得被叫號碼，基于識別獲得的被叫號碼，從而與被叫進行語音通話。由于無需用戶逐位按下話機上與被叫號碼對應(yīng)的一連串按鍵，因此能夠簡化語音呼叫流程，實現(xiàn)快速呼叫被叫號碼的目的，同時由于避免了用戶操作按鍵，因此能夠適應(yīng)殘疾人或手腳不便的老年人這類特定人群的需求，提升了用戶體驗。
【專利說明】基于語音識別的語音呼叫方法和接入網(wǎng)關(guān)

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明實施例涉及通信【技術(shù)領(lǐng)域】，尤其涉及一種基于語音識別的語音呼叫方法和接入網(wǎng)關(guān)。

【背景技術(shù)】
[0002] 近幾年，隨著國家大力提倡的"寬帶中國"和"最后一公里"建設(shè)，大量的接入網(wǎng)關(guān) 應(yīng)運而生。隨著2013年工業(yè)和信息化部提出新建小區(qū)必須實施光纖到戶的規(guī)定，接入網(wǎng) 關(guān)作為最后一公里，與終端用戶的關(guān)系更加緊密；特別是語音業(yè)務(wù)，作為運營商提供的最基本業(yè)務(wù)，目前使用最為廣泛。以家庭網(wǎng)關(guān)為例，家庭網(wǎng)關(guān)與用戶的終端設(shè)備接觸緊密，用于將家庭內(nèi)部的所有終端設(shè)備與外部的所有接入網(wǎng)連接。例如，如果某一家庭要通過家庭內(nèi) 的話機與外界終端進行語音通話，則需要通過家庭網(wǎng)關(guān)接入網(wǎng)絡(luò)后與外界終端進行語音通話。
[0003] 現(xiàn)有技術(shù)中，話機通過家庭網(wǎng)關(guān)進行語音呼叫時，首先在用戶摘機后，由用戶通過操作話機按鍵撥被叫號碼，然后話機通過家庭網(wǎng)關(guān)發(fā)起語音呼叫請求，最終接通被叫終端，從而實現(xiàn)與被叫語音通話的目的。
[0004] 上述語音呼叫技術(shù)存在以下缺陷：由于需要用戶操作話機按鍵撥被叫號碼，也即需要用戶逐位按下話機上與被叫號碼對應(yīng)的一連串按鍵，尤其是對于被叫是手機用戶、夕卜市或外國用戶，對應(yīng)的被叫號碼通常在11位以上，需要在話機上按11個以上的按鍵，操作過程繁瑣，容易出錯；而且一旦按錯一個鍵，就得掛機后重新摘機撥號呼叫，既不方便又耗費大量時間。此外，這種通過按鍵實現(xiàn)語音呼出的方式無法適應(yīng)殘疾人或手腳不便的老年人等特定人群的需求。

【發(fā)明內(nèi)容】

[0005] 本發(fā)明實施例提供一種基于語音識別的語音呼叫方法和接入網(wǎng)關(guān)，以簡化語音呼叫流程、實現(xiàn)快速呼叫被叫號碼的目的，并提升用戶體驗。
[0006] 第一方面，本發(fā)明實施例提供了一種基于語音識別的語音呼叫方法，包括：
[0007] 獲取用戶輸入的呼叫語音，所述呼叫語音包括被叫方信息；
[0008] 根據(jù)所述呼叫語音，識別獲得被叫號碼，并執(zhí)行語音呼叫。
[0009] 第二方面，本發(fā)明實施例還提供了一種基于語音識別的接入網(wǎng)關(guān)，包括：
[0010] 呼叫語音獲取模塊，用于獲取用戶輸入的呼叫語音，所述呼叫語音包括被叫方信息；
[0011] 語音呼叫模塊，用于根據(jù)所述呼叫語音，識別獲得被叫號碼，并執(zhí)行語音呼叫。
[0012] 本發(fā)明實施例提供的基于語音識別的語音呼叫方法和接入網(wǎng)關(guān)，通過接入網(wǎng)關(guān)識別用戶的呼叫語音，能夠從呼叫語音中識別獲得被叫號碼，基于識別獲得的被叫號碼，從而能夠與被叫進行語音通話。由于無需用戶逐位按下話機上與被叫號碼對應(yīng)的一連串按鍵，因此能夠簡化語音呼叫流程，實現(xiàn)快速呼叫被叫號碼的目的，同時由于避免了用戶操作按鍵，因此能夠適應(yīng)殘疾人或手腳不便的老年人這類特定人群的需求，提升了用戶體驗。

【專利附圖】

【附圖說明】
[0013] 為了更清楚地說明本發(fā)明，下面將對本發(fā)明中所需要使用的附圖做一簡單地介紹，顯而易見地，下面描述中的附圖是本發(fā)明的一些實施例，對于本領(lǐng)域普通技術(shù)人員來講，在不付出創(chuàng)造性勞動性的前提下，還可以根據(jù)這些附圖獲得其他的附圖。
[0014] 圖1為本發(fā)明實施例一提供的一種基于語音識別的語音呼叫方法的流程圖；
[0015] 圖2為本發(fā)明實施例二提供的一種基于語音識別的語音呼叫方法的流程圖；
[0016] 圖3為本發(fā)明實施例三提供的一種基于語音識別的語音呼叫方法的流程圖；
[0017] 圖4為本發(fā)明實施例四提供的一種基于語音識別的語音呼叫方法的流程圖；
[0018] 圖5為本發(fā)明實施例五提供的一種基于語音識別的語音呼叫方法的流程圖；
[0019] 圖6為本發(fā)明實施例六提供的一種基于語音識別的接入網(wǎng)關(guān)的結(jié)構(gòu)示意圖。

【具體實施方式】
[0020] 為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚，下面將結(jié)合附圖對本發(fā)明實施例中的技術(shù)方案作進一步詳細描述，顯然，所描述的實施例是本發(fā)明一部分實施例，而不是全部的實施例?？梢岳斫獾氖?，此處所描述的具體實施例僅用于解釋本發(fā)明，而非對本發(fā)明的限定，基于本發(fā)明中的實施例，本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例，都屬于本發(fā)明保護的范圍。另外還需要說明的是，為了便于描述，附圖中僅示出了與本發(fā)明相關(guān)的部分而非全部內(nèi)容。
[0021] 實施例一
[0022] 請參閱圖1，為本發(fā)明實施例一提供的一種基于語音識別的語音呼叫方法的流程圖。本發(fā)明實施例的方法可以由硬件和/或軟件實現(xiàn)的語音呼叫裝置來執(zhí)行，該實現(xiàn)裝置典型的是配置在接入網(wǎng)關(guān)設(shè)備中，如家庭網(wǎng)關(guān)。
[0023] 如圖1所示，所述方法包括：
[0024] 步驟110、接入網(wǎng)關(guān)獲取用戶輸入的呼叫語音，所述呼叫語音包括被叫方信息；
[0025] 本步驟具體是獲取主叫用戶輸入的包含有被叫方信息的呼叫語音。具體地，主叫用戶可以通過話機的話筒或者免提按鍵輸入所述呼叫語音，并將所述呼叫語音發(fā)送至接入網(wǎng)關(guān)，以使接入網(wǎng)關(guān)接收到主叫用戶輸入的呼叫語音。主叫用于也可以通過接入網(wǎng)關(guān)內(nèi)置的麥克風或功放設(shè)備輸入所述呼叫語音。
[0026] 所述呼叫語音可以有多種實施方式，例如包括下述至少一項：被叫號碼的自然語言、被叫姓名的自然語言以及被叫短號的自然語言。
[0027] 具體地，被叫號碼的自然語音包括被叫方信息，也即被叫號碼。被叫號碼的自然語音是所述呼叫語音中常見的一種語音形式，例如主叫用戶在摘機后通過話機的話筒說出被叫方的手機號碼"13012345678"，則主叫用戶的語音"13012345678"即為被叫號碼的自然語音。
[0028] 其中，在所述呼叫語音為被叫姓名的自然語言時，所述接入網(wǎng)關(guān)中預(yù)先配置有電子通訊錄，所述電子通訊錄包括被叫姓名和被叫號碼的第一映射關(guān)系。具體地，被叫姓名的自然語言包括被叫方信息，也即被叫姓名。
[0029] 例如，主叫用戶在摘機后通過話機的話筒說出被叫方的姓名"黃小明"，則主叫用戶的語音"黃小明"即為被叫姓名的自然語言。
[0030] 其中，電子通訊錄是被叫方信息的載體，而電子通訊錄具體反映了被叫方的各信息之間的關(guān)聯(lián)關(guān)系。所述電子通訊錄還可以包括被叫家庭地址和被叫電子郵件地址等。
[0031] 作為在接入網(wǎng)關(guān)中預(yù)先配置電子通訊錄這一操作的一種可選的實施方式，具體可以包括：
[0032] 將電子通訊錄導入到接入網(wǎng)關(guān)，具體地，可以將智能手機中的電子通訊錄導入到接入網(wǎng)關(guān)；
[0033] 接入網(wǎng)關(guān)解析所述電子通訊錄，以得到所述第一映射關(guān)系，并所述第一映射關(guān)系存儲在接入網(wǎng)關(guān)的數(shù)據(jù)區(qū)。
[0034] 可選地，所述導入到網(wǎng)關(guān)中的電子通訊錄的格式可以為VCF格式、VCard格式、CSV 格式、doc格式或excel格式。優(yōu)選地，所述導入到網(wǎng)關(guān)設(shè)備中的電子通訊錄的格式為VCF 格式、VCard格式或CSV格式，以增加電子通訊錄的通用性。
[0035] 優(yōu)選地，接入網(wǎng)關(guān)在解析所述電子通訊錄，以得到所述第一映射關(guān)系之后，還可以包括：接入網(wǎng)關(guān)將解析后的電子通訊錄預(yù)先發(fā)送至話機。
[0036] 換言之，主叫用戶在摘機后，可以通過話機上的上翻按鍵和/或下翻按鍵查看顯示在顯示屏上的電子通訊錄，以確定被叫方；然后通過話機聽筒輸入被叫姓名的自然語言，例如"黃小明"。
[0037] 在所述呼叫語音為被叫短號的自然語言時，接入網(wǎng)關(guān)中預(yù)置被叫號碼和被叫短號的第二映射關(guān)系，被叫短號的位數(shù)可以為1-3。
[0038] 被叫短號適用于縮位呼叫，具體地，用戶可以根據(jù)呼叫被叫號碼的頻率，設(shè)置與被叫號碼對應(yīng)的被叫短號，例如，根據(jù)用戶的行為習慣，可以將呼叫頻率較高的被叫號碼 "13012345678"設(shè)置對應(yīng)的被叫短號"01"，當用戶在摘機后通過話機的話筒說出被叫短號 "01"時，則主叫用戶的語音"01"即為被叫短號的自然語言。
[0039] 以上以被叫短號的位數(shù)為2為例進行說明，需要注意的是，當被叫短號的位數(shù) 為3位時，不能與現(xiàn)有的常規(guī)業(yè)務(wù)對應(yīng)的3位號碼設(shè)置沖突，也即不能將被叫短號設(shè)置為 "110"、"119"以及"120"等短號。需要說明的是，當被叫為手機用戶、外市或外國用戶時，對應(yīng)的被叫號碼通常在11位以上，而被叫短號的位數(shù)優(yōu)選為1-3位，便于用戶執(zhí)行呼叫操作。
[0040] 步驟120、接入網(wǎng)關(guān)根據(jù)所述呼叫語音，識別獲得被叫號碼，并執(zhí)行語音呼叫。
[0041] 本步驟具體是通過語音識別，獲得被叫號碼，然后根據(jù)獲得的被叫號碼進行語音呼叫，以實現(xiàn)與被叫語音通話的目的。
[0042] 本實施例的技術(shù)方案，通過接入網(wǎng)關(guān)識別用戶的呼叫語音，能夠從呼叫語音中識別獲得被叫號碼，基于識別獲得的被叫號碼，從而實現(xiàn)語音呼叫。由于無需用戶逐位按下話機上與被叫號碼對應(yīng)的一連串按鍵，因此能夠簡化語音呼叫流程，實現(xiàn)快速呼叫被叫號碼的目的，同時由于避免了用戶操作按鍵，因此能夠適應(yīng)殘疾人或手腳不便的老年人這類特定人群的需求，提升了用戶體驗。
[0043] 實施例二
[0044] 請參閱圖2,為本發(fā)明實施例二提供的一種基于語音識別的語音呼叫方法的流程圖。本實施例在上述實施例的基礎(chǔ)上，提供了根據(jù)所述呼叫語音，識別獲得被叫號碼的優(yōu)選方法。本實施例提供的基于語音識別的語音呼叫方法適用于呼叫語音為被叫號碼的自然語言。本實施例的方法可以由接入網(wǎng)關(guān)執(zhí)行。
[0045] 如圖2所示，所述方法包括：
[0046] 步驟210、接入網(wǎng)關(guān)獲取用戶輸入的呼叫語音，所述呼叫語音包括被叫方信息；
[0047] 步驟220、接入網(wǎng)關(guān)將所述呼叫語音進行模數(shù)轉(zhuǎn)換，并進行語音預(yù)處理；
[0048] 本步驟具體是在對所述呼叫語音進行語音預(yù)處理之前，進行模數(shù)轉(zhuǎn)換，也即將用戶的自然語言從模擬信號轉(zhuǎn)換為數(shù)字電信號；然后進行語音預(yù)處理。
[0049] 優(yōu)選地，所述語音預(yù)處理包括：數(shù)字濾波處理、預(yù)加重處理、加窗分幀處理和端點檢測處理。
[0050] 其中，數(shù)字濾波處理是利用離散時間系統(tǒng)的特性對所述數(shù)字電信號的波形進行濾波處理，以降低噪聲，使得輸出信號的頻譜變得平坦。
[0051] 本領(lǐng)域的技術(shù)人員可以理解，在很高的頻率（GHz以上）下，高頻信號在傳輸中的衰減很明顯，為了補償傳輸中的高頻信號衰減，可以采取信號預(yù)加重方法，對傳輸信號中的高頻部分進行補償，使得接收到的高頻和低頻信號的幅度一致。
[0052] 加窗處理是使原本沒有周期性的語音信號呈現(xiàn)出周期性的語音特征，同時也避免出現(xiàn)吉布斯效應(yīng)。其中，吉布斯效應(yīng)是當用信號的諧波分量的和來表述具有間斷點的波形時出現(xiàn)，并能夠觀察的現(xiàn)象。
[0053] 本領(lǐng)域的技術(shù)人員可以理解，語音端點檢測是語音識別是否正確的關(guān)鍵技術(shù)之一，可以在語音識別中提高識別精度及減少識別時間。常用語音端點檢測方法包括能量法、過零率法和相關(guān)系數(shù)法等。
[0054] 步驟230、接入網(wǎng)關(guān)從經(jīng)語音預(yù)處理后的呼叫語音中獲取語音特征；
[0055] 語音特征主要是指語音特征參數(shù)，包括線性預(yù)測倒譜系數(shù)、MF2CC(美爾倒譜系數(shù)）、小波分析的特征參數(shù)。這些參數(shù)本質(zhì)上是一個個語音的幀。也就是說，利用短時傅立葉分析，將預(yù)處理后的語音信號分割成l〇-20ms的幀，或者通過小波分析獲取語音特征。
[0056] 步驟240、接入網(wǎng)關(guān)在預(yù)設(shè)語音模型庫中匹配所述語音特征，確定與所述語音特征對應(yīng)的語音模板；
[0057] 其中，語音模型庫中既包括語音模板，也包括語音查詢表，所述語音查詢庫中包括所述語音模板與對應(yīng)的字段。在本實施例中所述對應(yīng)的字段為數(shù)字。
[0058] 在本步驟中，優(yōu)選將匹配度最高的語音模板作為與所述語音特征對應(yīng)的語音模板。
[0059] 步驟250、接入網(wǎng)關(guān)根據(jù)所述語音模板，利用預(yù)設(shè)語音庫中的語音查詢表，得到被叫號碼，并執(zhí)行語音呼叫。
[0060] 本步驟具體是根據(jù)匹配到的最優(yōu)語音模板，以及語音查詢表，將語音查詢表中與匹配到的最優(yōu)語音模板對應(yīng)的字段作為被叫號碼，從而得到用戶輸入的呼叫語音的識別結(jié) 果，然后執(zhí)行語音呼叫，進行實現(xiàn)與被叫語音通話的目的。
[0061] 例如，用戶輸入的呼叫語音為"13012345678"的自然語言，通過本實施例的方法可以匹配到最優(yōu)的語音模板，通過在語音查詢庫中查詢，識別到與最優(yōu)語音模板對應(yīng)的字段為"13012345678"，即得到了被叫號碼。
[0062] 本實施例中，可以采用上述離線語音識別方式，即接入網(wǎng)關(guān)通過自身的離線語音模型庫進行識別呼叫語音，也可以采用在線語音識別方式。區(qū)別在于：在線語音識別時，需要建立接入網(wǎng)關(guān)與能夠提供語音識別功能的服務(wù)器之間的連接鏈路，通過所述服務(wù)器實現(xiàn) 呼叫語音識別，然后接入網(wǎng)關(guān)基于所述識別結(jié)果執(zhí)行語音呼叫。
[0063] 本實施例的技術(shù)方案，在接入網(wǎng)關(guān)獲取用戶的呼叫語音之后，接入網(wǎng)關(guān)通過從經(jīng) 模數(shù)轉(zhuǎn)換和語音預(yù)處理后的呼叫語音中提取特征，并進行特征匹配，能夠識別用戶的呼叫語音，并根據(jù)匹配結(jié)果從呼叫語音中識別獲得被叫號碼，基于識別獲得的被叫號碼，從而實現(xiàn)語音呼叫。由于無需用戶逐位按下話機上與被叫號碼對應(yīng)的一連串按鍵，因此能夠簡化語音呼叫流程，實現(xiàn)快速呼叫被叫號碼的目的，同時由于避免了用戶操作按鍵，因此能夠適應(yīng)殘疾人或手腳不便的老年人這類特定人群的需求，提升了用戶體驗。
[0064] 實施例三
[0065] 請參閱圖3,為本發(fā)明實施例三提供的一種基于語音識別的語音呼叫方法的流程圖。本發(fā)明在上述實施例的基礎(chǔ)上，提供了根據(jù)所述語音模板，利用預(yù)設(shè)語音庫中的語音查詢表，得到被叫號碼的優(yōu)選方案。本實施例提供的基于語音識別的語音呼叫方法適用于呼叫語音為被叫姓名的自然語言。本實施例方法可以由接入網(wǎng)關(guān)執(zhí)行。
[0066] 如圖3所示，所述優(yōu)選方法包括：
[0067] 步驟310、接入網(wǎng)關(guān)根據(jù)所述語音模板，利用預(yù)設(shè)語音庫中的語音查詢表，識別獲得被叫姓名；
[0068] 與上述實施例的區(qū)別在于：第一，本實施例中用戶輸入的呼叫語音為被叫姓名的自然語言；而上述實施例中用戶輸入的呼叫語音為被叫號碼的自然語言。第二，本實施例中語音查詢庫既包括語音模板，也包括語音查詢表，所述語音查詢庫中包括所述語音模板與對應(yīng)的字段，其中對應(yīng)的字段為漢字；而上述實施例中語音模型庫中既包括語音模板，也包括語音查詢表，所述語音查詢庫中包括所述語音模板與對應(yīng)的字段，其中所述對應(yīng)的字段為數(shù)字。第三，本實施例中所述接入網(wǎng)關(guān)中預(yù)先配置有電子通訊錄，所述電子通訊錄包括被叫姓名和被叫號碼的第一映射關(guān)系。
[0069] 作為在接入網(wǎng)關(guān)中預(yù)先配置電子通訊錄這一操作的一種可選的實施方式，具體可以包括：將電子通訊錄導入到接入網(wǎng)關(guān)，具體地，可以將智能手機中的電子通訊錄導入到接入網(wǎng)關(guān)；接入網(wǎng)關(guān)解析所述電子通訊錄，以得到所述第一映射關(guān)系，并所述第一映射關(guān)系存儲在接入網(wǎng)關(guān)的數(shù)據(jù)區(qū)。
[0070] 進一步優(yōu)選地，在接入網(wǎng)關(guān)解析所述電子通訊錄，以得到所述第一映射關(guān)系之后，還可以包括：接入網(wǎng)關(guān)將解析后的電子通訊錄預(yù)先發(fā)送至話機。
[0071] 換言之，主叫用戶在摘機后，可以通過話機上的上翻按鍵和/或下翻按鍵查看顯示在顯示屏上的電子通訊錄，以確定被叫方；然后通過話機聽筒輸入被叫姓名的自然語言。
[0072] 第四，本實施例中接入網(wǎng)關(guān)的識別結(jié)果為與呼叫語音對應(yīng)的被叫姓名；而上述實施例中接入網(wǎng)關(guān)的識別結(jié)果為與呼叫語音對應(yīng)的被叫號碼。
[0073] 步驟320、接入網(wǎng)關(guān)利用所述第一映射關(guān)系，得到被叫號碼，并執(zhí)行語音呼叫。
[0074] 本步驟具體是根據(jù)匹配到的最優(yōu)語音模板，以及語音查詢表，將語音查詢表中與匹配到的最優(yōu)語音模板對應(yīng)的字段作為被叫姓名，并利用接入網(wǎng)關(guān)中存儲的所述第一映射關(guān)系得到被叫號碼，然后執(zhí)行語音呼叫，進行實現(xiàn)與被叫語音通話的目的。
[0075] 需要說明的是，接入網(wǎng)關(guān)中存儲通過解析獲得的所述第一映射關(guān)系，以在接入網(wǎng) 關(guān)識別到所述被叫姓名的自然語言對應(yīng)的被叫姓名后，基于預(yù)先存儲的所述第一映射關(guān) 系，從而得到與被叫姓名對應(yīng)的被叫號碼，進而執(zhí)行語音呼叫。
[0076] 優(yōu)選地，在接入網(wǎng)關(guān)解析所述電子通訊錄，以得到所述第一映射關(guān)系之后，還可以包括：接入網(wǎng)關(guān)將解析后的電子通訊錄預(yù)先發(fā)送至話機，以使主叫用戶在摘機后，可以通過話機上的上翻按鍵和/或下翻按鍵查看顯示在顯示屏上的電子通訊錄，從而確定被叫方。
[0077] 實施例四
[0078] 請參閱圖4,為本發(fā)明實施例四提供的一種基于語音識別的語音呼叫方法的流程圖。本發(fā)明在實施例二的基礎(chǔ)上，提供了根據(jù)所述語音模板，利用預(yù)設(shè)語音庫中的語音查詢表，得到被叫號碼的優(yōu)選方案。本實施例提供的基于語音識別的語音呼叫方法適用于呼叫語音為被叫短號的自然語言。本實施例的方法可以由接入網(wǎng)關(guān)執(zhí)行。
[0079] 如圖4所示，所述優(yōu)選方法包括：
[0080] 步驟410、接入網(wǎng)關(guān)根據(jù)所述語音模板，利用預(yù)設(shè)語音庫中的語音查詢表，識別獲得被叫短號；
[0081] 本實施例在于實施例二的區(qū)別在于：第一，本實施例中用戶輸入的呼叫語音為被叫短號的自然語言；而實施例二中用戶輸入的呼叫語音為被叫號碼的自然語言。第二，本實施例中接入網(wǎng)關(guān)中預(yù)置被叫號碼和被叫短號的第二映射關(guān)系，被叫短號的位數(shù)可以為1-3。第三，本實施例中接入網(wǎng)關(guān)的識別結(jié)果為與呼入語音對應(yīng)的被叫短號；而實施例二中接入網(wǎng)關(guān)的識別結(jié)果為與呼入語音對應(yīng)的被叫號碼。
[0082] 步驟420、接入網(wǎng)關(guān)利用所述第二映射關(guān)系，得到被叫號碼，并執(zhí)行語音呼叫。
[0083] 本步驟具體是根據(jù)匹配到的最優(yōu)語音模板，以及語音查詢表，將語音查詢表中與匹配到的最優(yōu)語音模板對應(yīng)的字段作為被叫短號，并利用接入網(wǎng)關(guān)中存儲的所述第二映射關(guān)系得到被叫號碼，然后執(zhí)行語音呼叫，進行實現(xiàn)與被叫語音通話的目的。
[0084] 需要說明的是，接入網(wǎng)關(guān)中預(yù)置的所述第二映射關(guān)系，以在接入網(wǎng)關(guān)識別到所述被叫短號的自然語言對應(yīng)的被叫短號后，基于所述第二映射關(guān)系，能夠得到與被叫短號對應(yīng)的被叫號碼，進而執(zhí)行語音呼叫。
[0085] 優(yōu)選地，接入網(wǎng)關(guān)可以將所述第二映射關(guān)系發(fā)送至話機，也即，所述第二映射關(guān)系預(yù)置在話機中，以使主叫用戶在摘機后，可以通過操作話機上的1-3位按鍵，能夠采用傳統(tǒng) 的按鍵呼叫方式實現(xiàn)與被叫語音通話的目的。也即，被叫短號的自然語音的呼叫方式可以與傳統(tǒng)的按鍵呼叫方式兼容應(yīng)用，主叫用戶可以根據(jù)自身的呼叫習慣和實際需求，決定采用哪種呼叫方式，簡化了呼叫流程，并增加了呼叫的靈活性。
[0086] 實施例五
[0087] 請參閱圖5,為本發(fā)明實施例五提供的一種基于語音識別的語音呼叫方法的流程圖。本實施例在上述各實施例的基礎(chǔ)上，提供了獲取用戶輸入的呼叫語音的優(yōu)選方案。如圖5所示，所述優(yōu)選方法包括：
[0088] 步驟510、接入網(wǎng)關(guān)獲取用戶通過話機按鍵輸入的按鍵值；
[0089] 步驟520、接入網(wǎng)關(guān)在預(yù)配置的語音識別業(yè)務(wù)鍵號碼表中匹配所述按鍵值，如果匹配成功，則觸發(fā)獲取用戶輸入的呼叫語音的操作。
[0090] 用戶通過話機輸入的按鍵值，傳輸至接入網(wǎng)關(guān)，如果用戶輸入的按鍵值與接入網(wǎng) 關(guān)預(yù)配置的語音識別業(yè)務(wù)鍵號碼表匹配一致，則接入網(wǎng)關(guān)觸發(fā)獲取用戶的呼叫語音以及語音識別流程，即接入網(wǎng)關(guān)將此后從話機接收到的語音作為呼叫語音進行識別。接入網(wǎng)關(guān)也可以顯式地向話機發(fā)送啟動語音識別的指令，控制話機向用戶提示，可以開始輸入語音信肩、。
[0091] 其中，話機與接入網(wǎng)關(guān)一般是通過POTS 口連接。
[0092] 示例性的，接入網(wǎng)關(guān)預(yù)配置的語音識別業(yè)務(wù)鍵號碼表中語音識別業(yè)務(wù)鍵設(shè)置為 *#，那么當用戶摘機并且依次按下*#按鍵，則匹配成功。
[0093] 需要說明的是，如果匹配失敗，可以將該匹配結(jié)果返回話機，以提示用戶，例如通過在話機聽筒播放"請重新輸入"的語音提示，或在話機的顯示屏顯示"輸入失敗"或"請重新輸入"的提示。
[0094] 除了上述通過話機上的按鍵值進行觸發(fā)操作之外，還可以通過用戶與話機之間的交互進行觸發(fā)，例如語音交互，或者觸摸話機的顯示頻的設(shè)定區(qū)域的方式進行觸發(fā)，所述設(shè) 定區(qū)域可以預(yù)先設(shè)定為語音獲取區(qū)域。
[0095] 本實施例的技術(shù)方案，在獲取用戶輸入的按鍵值之后，通過在預(yù)配置的語音識別業(yè)務(wù)鍵號碼表中匹配所述按鍵值，并根據(jù)匹配結(jié)果決定是否觸發(fā)獲取用戶輸入的呼叫語音以及語音識別的操作。
[0096] 在本實施例的基礎(chǔ)上，接入網(wǎng)關(guān)獲取用戶輸入的呼叫語音優(yōu)選包括：
[0097] 接入網(wǎng)關(guān)按預(yù)設(shè)DigitMap (數(shù)圖）收號規(guī)則或預(yù)設(shè)DialPlan (撥叫計劃）收號規(guī) 則獲取用戶輸入的呼叫語音，其中所述DigitMap收號規(guī)則包括：首位撥號定時器的時長、位間定時器的時長。
[0098] 換言之，本優(yōu)選方案具體是通過所述DigitMap收號規(guī)則或所述DialPlan收號規(guī) 則獲取用戶的呼叫語音。
[0099] 以DigitMap收號規(guī)則為例進行說明。
[0100] 首位撥號定時器、位間定時器用在用戶摘機到呼叫結(jié)束的不同階段。具體地可以有多種實施方式，下面介紹其中兩種。
[0101] 方式一、摘機到輸入呼叫語音前的階段由首位撥號定時器控制，如果在首位撥號定時器的時長（例如15s)內(nèi)，用戶沒有輸入呼叫語音，則接入網(wǎng)關(guān)向話機下發(fā)催掛音或忙音提示。如果在首位撥號定時器的時長內(nèi)，用戶開始輸入呼叫語音，接入網(wǎng)關(guān)則啟用位間定時器，當用戶的呼叫語音停頓間隔時長超過位間定時器的時長（比如5s)，接入網(wǎng)關(guān)對呼叫語音進行語音識別，也即對之前的語音進行一次識別，然后進行后續(xù)呼出流程。
[0102] 方式二、摘機到輸入呼叫語音前的階段由首位撥號定時器控制，如果在首位撥號定時器的時長（例如15S)內(nèi)，用戶沒有輸入呼叫語音，則接入網(wǎng)關(guān)向話機下發(fā)催掛音或忙音提示。如果在首位撥號定時器的時長內(nèi)，用戶開始輸入呼叫語音，接入網(wǎng)關(guān)進行實時語音識別，例如，用戶輸入一位呼叫語音，接入網(wǎng)關(guān)就進行一次語音識別，同時啟用位間定時器，當用戶的呼叫語音停頓間隔時長超過位間定時器的時長（比如5s)，則進行后續(xù)呼出流程。
[0103] 方式一和方式二的區(qū)別在于：接入網(wǎng)關(guān)進行語音識別的時間點不同，進行語音識別的次數(shù)不同。
[0104] 換言之，用戶通過呼叫語音與被叫進行語音通話過程中，是以預(yù)先配置的各個定時器的時長為依據(jù)，決定是否結(jié)束收取用戶的呼叫語音以便執(zhí)行識別流程。
[0105] 需要說明的是，各定時器的時長可通過配置來設(shè)置和更改。
[0106] 實施例六
[0107] 請參閱圖6,為本發(fā)明實施例六提供的一種基于語音識別的接入網(wǎng)關(guān)的結(jié)構(gòu)示意圖。所述接入網(wǎng)關(guān)包括：呼叫語音獲取模塊610和語音呼叫模塊620。
[0108] 其中，呼叫語音獲取模塊610用于獲取用戶輸入的呼叫語音，所述呼叫語音包括被叫方信息；語音呼叫模塊620用于根據(jù)所述呼叫語音，識別獲得被叫號碼，并執(zhí)行語音呼口 L1。
[0109] 本實施例的技術(shù)方案，通過識別用戶的呼叫語音，能夠從呼叫語音中識別獲得被叫號碼，基于識別獲得的被叫號碼，從而實現(xiàn)語音呼叫。由于無需用戶逐位按下話機上與被叫號碼對應(yīng)的一連串按鍵，因此能夠簡化語音呼叫流程，實現(xiàn)快速呼叫被叫號碼的目的，同時由于避免了用戶操作按鍵，因此能夠適應(yīng)殘疾人或手腳不便的老年人這類特定人群的需求，提升了用戶體驗。
[0110] 在上述方案中，所述呼叫語音包括下述至少一項：被叫號碼的自然語言、被叫姓名的自然語言以及被叫短號的自然語言；
[0111] 其中，在所述呼叫語音為被叫姓名的自然語言時，所述接入網(wǎng)關(guān)中預(yù)先配置有電子通訊錄，所述電子通訊錄包括被叫姓名和被叫號碼的第一映射關(guān)系；
[0112] 在所述呼叫語音為被叫短號的自然語言時，接入網(wǎng)關(guān)中預(yù)置被叫號碼和被叫短號的第二映射關(guān)系，被叫短號的位數(shù)可以為1-3。
[0113] 在上述方案中，語音呼叫模塊620優(yōu)選包括：預(yù)處理單元、語音特征獲取單元、語音特征匹配單元和被叫號碼獲取單元。
[0114] 其中，預(yù)處理單元用于將所述呼叫語音進行模數(shù)轉(zhuǎn)換，并進行語音預(yù)處理；語音特征獲取單元用于從經(jīng)語音預(yù)處理后的呼叫語音中獲取語音特征；語音特征匹配單元用于在預(yù)設(shè)語音模型庫中匹配所述語音特征，確定與所述語音特征對應(yīng)的語音模板；被叫號碼獲取單元用于根據(jù)所述語音模板，利用預(yù)設(shè)語音庫中的語音查詢表，得到被叫號碼。
[0115] 作為被叫號碼獲取單元的一種優(yōu)選的實施方式，所述被叫號碼獲取單元優(yōu)選包括：第一識別子單元和第一映射子單元。
[0116] 其中，第一識別子單元用于根據(jù)所述語音模板，利用預(yù)設(shè)語音庫中的語音查詢表，識別獲得被叫姓名；第一映射子單元用于利用所述第一映射關(guān)系，得到被叫號碼。
[0117] 作為被叫號碼獲取單元的另一種優(yōu)選的實施方式，所述被叫號碼獲取單元優(yōu)選包括：第二識別子單元和第二映射子單元。
[0118] 其中，第二識別子單元用于根據(jù)所述語音模板，利用預(yù)設(shè)語音庫中的語音查詢表，識別獲得被叫短號；第二映射子單元用于利用所述第二映射關(guān)系，得到被叫號碼。
[0119] 在上述方案中，所述語音預(yù)處理包括：數(shù)字濾波處理、預(yù)加重處理、加窗分幀處理和端點檢測處理。
[0120] 作為本實施例的一種優(yōu)選的實施方式，該裝置還可以包括：按鍵值獲取模塊和觸發(fā)模塊。
[0121] 其中，按鍵值獲取模塊用于在獲取用戶輸入的呼叫語音之前，獲取用戶通過話機按鍵輸入的按鍵值；觸發(fā)模塊用于在預(yù)配置的語音識別業(yè)務(wù)鍵號碼表中匹配所述按鍵值，如果匹配成功，則觸發(fā)獲取用戶輸入的呼叫語音的操作。
[0122] 在上述方案中，呼叫語音獲取模塊610具體用于：
[0123] 按預(yù)設(shè)DigitMap收號規(guī)則或預(yù)設(shè)DialPlan收號規(guī)則獲取用戶輸入的呼叫語音，其中所述DigitMap收號規(guī)則包括：首位撥號定時器的時長、位間定時器的時長。
[0124] 本發(fā)明實施例提供的基于語音識別的接入網(wǎng)關(guān)可執(zhí)行本發(fā)明任意實施例所提供的基于語音識別的語音呼叫方法，具備執(zhí)行方法相應(yīng)的功能模塊和有益效果。
[0125] 本領(lǐng)域普通技術(shù)人員可以理解：實現(xiàn)上述各方法實施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成。前述的程序可以存儲于一計算機可讀取存儲介質(zhì)中。該程序在執(zhí)行時，執(zhí)行包括上述各方法實施例的步驟；而前述的存儲介質(zhì)包括：ROM、RAM、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
[0126] 最后應(yīng)說明的是：以上各實施例僅用于說明本發(fā)明的技術(shù)方案，而非對其進行限制；實施例中優(yōu)選的實施方式，并非對其進行限制，對于本領(lǐng)域技術(shù)人員而言，本發(fā)明可以有各種改動和變化。凡在本發(fā)明的精神和原理之內(nèi)所作的任何修改、等同替換、改進等，均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。
【權(quán)利要求】
1. 一種基于語音識別的語音呼叫方法，其特征在于，包括：接入網(wǎng)關(guān)獲取用戶輸入的呼叫語音，所述呼叫語音包括被叫方信息；所述接入網(wǎng)關(guān)根據(jù)所述呼叫語音，識別獲得被叫號碼，并執(zhí)行語音呼叫。
2. 根據(jù)權(quán)利要求1所述的方法，其特征在于，所述呼叫語音包括下述至少一項：被叫號碼的自然語言、被叫姓名的自然語言以及被叫短號的自然語言；其中，在所述呼叫語音為被叫姓名的自然語言時，所述接入網(wǎng)關(guān)中預(yù)先配置有電子通訊錄，所述電子通訊錄包括被叫姓名和被叫號碼的第一映射關(guān)系；在所述呼叫語音為被叫短號的自然語言時，接入網(wǎng)關(guān)中預(yù)置被叫號碼和被叫短號的第二映射關(guān)系。
3. 根據(jù)權(quán)利要求2所述的方法，其特征在于，所述接入網(wǎng)關(guān)根據(jù)所述呼叫語音，識別獲得被叫號碼，包括：所述接入網(wǎng)關(guān)將所述呼叫語音進行模數(shù)轉(zhuǎn)換，并進行語音預(yù)處理；所述接入網(wǎng)關(guān)從經(jīng)語音預(yù)處理后的呼叫語音中獲取語音特征；所述接入網(wǎng)關(guān)在預(yù)設(shè)語音模型庫中匹配所述語音特征，確定與所述語音特征對應(yīng)的語音模板；所述接入網(wǎng)關(guān)根據(jù)所述語音模板，利用預(yù)設(shè)語音庫中的語音查詢表，得到被叫號碼。
4. 根據(jù)權(quán)利要求3所述的方法，其特征在于，所述接入網(wǎng)關(guān)根據(jù)所述語音模板，利用預(yù) 設(shè)語音庫中的語音查詢表，得到被叫號碼，包括：所述接入網(wǎng)關(guān)根據(jù)所述語音模板，利用預(yù)設(shè)語音庫中的語音查詢表，識別獲得被叫姓名；所述接入網(wǎng)關(guān)利用所述第一映射關(guān)系，得到被叫號碼；或所述接入網(wǎng)關(guān)根據(jù)所述語音模板，利用預(yù)設(shè)語音庫中的語音查詢表，識別獲得被叫短號；所述接入網(wǎng)關(guān)利用所述第二映射關(guān)系，得到被叫號碼。
5. 根據(jù)權(quán)利要求3或4所述的方法，其特征在于，所述語音預(yù)處理包括：數(shù)字濾波處理、預(yù)加重處理、加窗分幀處理和端點檢測處理。
6. 根據(jù)權(quán)利要求3或4所述的方法，其特征在于，在接入網(wǎng)關(guān)獲取用戶輸入的呼叫語音之前，還包括：接入網(wǎng)關(guān)獲取用戶通過話機按鍵輸入的按鍵值；接入網(wǎng)關(guān)在預(yù)配置的語音識別業(yè)務(wù)鍵號碼表中匹配所述按鍵值，如果匹配成功，則觸發(fā)獲取用戶輸入的呼叫語音的操作。
7. 根據(jù)權(quán)利要求3或4所述的方法，其特征在于，接入網(wǎng)關(guān)獲取用戶輸入的呼叫語音，包括：接入網(wǎng)關(guān)按預(yù)設(shè)數(shù)圖DigitMap收號規(guī)則或預(yù)設(shè)撥號計劃DialPlan收號規(guī)則獲取用戶輸入的呼叫語音，其中所述DigitMap收號規(guī)則包括：首位撥號定時器的時長、位間定時器的時長。
8. -種基于語音識別的接入網(wǎng)關(guān)，其特征在于，包括：呼叫語音獲取模塊，用于獲取用戶輸入的呼叫語音，所述呼叫語音包括被叫方信息；語音呼叫模塊，用于根據(jù)所述呼叫語音，識別獲得被叫號碼，并執(zhí)行語音呼叫。
9. 根據(jù)權(quán)利要求8所述的接入網(wǎng)關(guān)，其特征在于，所述呼叫語音包括下述至少一項：被叫號碼的自然語言、被叫姓名的自然語言以及被叫短號的自然語言；其中，在所述呼叫語音為被叫姓名的自然語言時，所述接入網(wǎng)關(guān)中預(yù)先配置有電子通訊錄，所述電子通訊錄包括被叫姓名和被叫號碼的第一映射關(guān)系；在所述呼叫語音為被叫短號的自然語言時，接入網(wǎng)關(guān)中預(yù)置被叫號碼和被叫短號的第二映射關(guān)系。
10. 根據(jù)權(quán)利要求9所述的接入網(wǎng)關(guān)，其特征在于，語音呼叫模塊包括：預(yù)處理單元，用于將所述呼叫語音進行模數(shù)轉(zhuǎn)換，并進行語音預(yù)處理；語音特征獲取單元，用于從經(jīng)語音預(yù)處理后的呼叫語音中獲取語音特征；語音特征匹配單元，用于在預(yù)設(shè)語音模型庫中匹配所述語音特征，確定與所述語音特征對應(yīng)的語音模板；被叫號碼獲取單元，用于根據(jù)所述語音模板，利用預(yù)設(shè)語音庫中的語音查詢表，得到被叫號碼。
【文檔編號】H04M1/725GK104092829SQ201410347198
【公開日】2014年10月8日申請日期:2014年7月21日優(yōu)先權(quán)日:2014年7月21日
【發(fā)明者】商琦, 曹紀清, 伏玉琛申請人:蘇州工業(yè)園區(qū)服務(wù)外包職業(yè)學院

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：商琦;曹紀清;伏玉琛
技術(shù)所有人：蘇州工業(yè)園區(qū)服務(wù)外包職業(yè)學院
我是此專利的發(fā)明人

上一篇：一種協(xié)同辦公u盤系統(tǒng)及方法
上一篇：一種多級數(shù)字信道化接收的制造方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機構(gòu)動力學與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

語音接入網(wǎng)關(guān)相關(guān)技術(shù)

視頻接入網(wǎng)關(guān)相關(guān)技術(shù)

接入網(wǎng)關(guān)相關(guān)技術(shù)

安全接入網(wǎng)關(guān)相關(guān)技術(shù)

視頻接入網(wǎng)關(guān)是什么相關(guān)技術(shù)

?？狄曨l接入網(wǎng)關(guān)相關(guān)技術(shù)

安全接入網(wǎng)關(guān)是什么相關(guān)技術(shù)

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

基于語音識別的語音呼叫方法和接入網(wǎng)關(guān)的制作方法