專利名稱:使用聲道的語音識別來獲取有關(guān)音視頻節(jié)目的信息的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般地涉及使用聲道的語音識別來獲取有關(guān)諸如TV之類的消費電子產(chǎn)品(CE)上呈現(xiàn)的音視頻節(jié)目的信息。
背景技術(shù):
技術(shù)向用戶提供了越來越多的用來觀看音視頻節(jié)目和/或內(nèi)容的選擇。這些節(jié)目可以在例如高清晰電視、智能電話和個人計算機上被觀看。這些音視頻節(jié)目也可以是從例如互聯(lián)網(wǎng)或衛(wèi)星電視提供商的不同源得到的。通常,用戶期望查看與節(jié)目有關(guān)的信息,其中該信息對于他們而言可能不一定是容易辨識的或容易訪問的。例如,用戶可能想要有關(guān)節(jié)目中出演的個人的姓名的信息。本申請認識到了獲取與音視頻節(jié)目有關(guān)的信息的難度?!?br>
發(fā)明內(nèi)容
因此,本原理認識到向用戶提供查明與音視頻節(jié)目有關(guān)的信息的相對而言非常簡單的方式是有利的。因此,一種用于獲取有關(guān)消費電子產(chǎn)品(CE)設(shè)備上正在呈現(xiàn)的音視頻節(jié)目的信息的方法包括在CE設(shè)備處接收識別CE設(shè)備上正在呈現(xiàn)的音視頻節(jié)目的觀看者命令。該方法還包括從麥克風(fēng)接收信號,其中所述信號可以代表來自CE設(shè)備上正在呈現(xiàn)的音視頻節(jié)目的音頻,當(dāng)所述音頻在CE設(shè)備上被實時播放時,所述音頻被所述麥克風(fēng)感測到。在非限制性實時方式中,該方法還可以包括對來自麥克風(fēng)的信號執(zhí)行語音識別以確定被所述麥克風(fēng)感測到的來自所述CE設(shè)備上正在呈現(xiàn)的音視頻節(jié)目的音頻中的詞語(words)。另外,該方法還可以包括將詞語上載到因特網(wǎng)服務(wù)器并從因特網(wǎng)服務(wù)器接收回通過服務(wù)器使用所述詞語而被與CE設(shè)備上正在呈現(xiàn)的音視頻節(jié)目相相關(guān)的信息。更進一歩,在一些非限制性實施方式中,該方法還可以包括從來自麥克風(fēng)的信號捕獲來自被麥克風(fēng)感測到的音視頻節(jié)目的音頻中的預(yù)定數(shù)目的詞語,并將該預(yù)定數(shù)目的詞語和其它內(nèi)容上載到因特網(wǎng)服務(wù)器。如果期望的話,該方法還可以包括通過服務(wù)器使用詞語而被與CE設(shè)備上正在呈現(xiàn)的音視頻節(jié)目相相關(guān)的信息可以包括音視頻節(jié)目的藝術(shù)貢獻者。此外,在非限制性實施方式中,從服務(wù)器接收的信息可以包括到因特網(wǎng)站點的鏈接,所述鏈接可被觀看者選擇來訪問因特網(wǎng)站點以下載與音視頻節(jié)目有關(guān)的信息。在一些實施方式中,CE設(shè)備可以從服務(wù)器接收響應(yīng)于詞語到服務(wù)器的上載的對另外的音視頻節(jié)目的推薦。另外,在非限制性實施方式中,該方法還可以包括從服務(wù)器接收響應(yīng)于對詞語到服務(wù)器的上載的廣告。在非限制性所述方式中,CE設(shè)備可以是TV,并且用于識別CE設(shè)備上正在呈現(xiàn)的音視頻節(jié)目的觀看者命令可以是通過對TV選項用戶界面上的“識別”選擇器的選擇而被接收的。在其它非限制性實施例中,CE設(shè)備可以是個人計算機(PC),并且用于識別CE設(shè)備上正在呈現(xiàn)的音視頻節(jié)目的觀看者命令可以是通過對右擊實例化的可選擇的“識別”選擇器的選擇而被接收的。在又一些非限制性實施例中,CE設(shè)備可以是智能電話,并且用于識別CE設(shè)備上正被呈現(xiàn)的音視頻節(jié)目的觀看者命令可以是通過對電話選項用戶界面菜單上的“識另IJ”選擇器的選擇而被接收的。在另一方面中,服務(wù)器可以包括音視頻節(jié)目腳本的數(shù)據(jù)庫和處理器。處理器可以通過因特網(wǎng)從消費電子產(chǎn)品(CE)設(shè)備接收詞語,其中,所述詞語可以被CE設(shè)備從CE設(shè)備上正被呈現(xiàn)的音視頻節(jié)目的聲道中識別出。在非限制性實施方式中,處理器可以訪問數(shù)據(jù)庫并且使用詞語來將所述詞語與至少ー個音視頻節(jié)目腳本相匹配。如果期望,服務(wù)器還可以向CE設(shè)備返回與其聲道是與詞語匹配的音視頻腳本的音視頻節(jié)目有關(guān)的信息。在又一方面中,一種系統(tǒng),可以包括消費電子產(chǎn)品(CE)設(shè)備和服務(wù)器。該服務(wù)器可以包括處理器和數(shù)據(jù)庫,其中所述數(shù)據(jù)庫可以具有音視頻節(jié)目聲道。在非限制性實施例中,處理器可以通過因特網(wǎng)來從CE設(shè)備上正在呈現(xiàn)的音視頻節(jié)目接收(ー個或多個)音頻信號。處理器可以使用這(ー個或多個)音頻信號來訪問數(shù)據(jù)庫以將這(ー個或多個)·音頻信號與至少ー個音視頻節(jié)目匹配。如果期望,處理器可以向CE設(shè)備返回與其聲道與這(ー個或多個)音頻信號相匹配的音視頻節(jié)目的有關(guān)的信息。參考附圖可以看出本申請結(jié)構(gòu)和操作兩方面的細節(jié),其中,類似的標號指代類似的部件,其中
圖I是根據(jù)本原理的非限制性示例系統(tǒng)的框圖;圖2是根據(jù)本原理的用于獲取與音視頻節(jié)目有關(guān)的信息的示例邏輯的流程圖;圖3是根據(jù)本原理的用于確定服務(wù)器可以推薦的音視頻節(jié)目的示例邏輯的流程圖;圖4是根據(jù)本原理的用于確定服務(wù)器可以向CE設(shè)備發(fā)送的廣告的示例邏輯的流程圖;以及圖5和圖6是包括與可以呈現(xiàn)在CE設(shè)備上的音視頻節(jié)目有關(guān)的信息的示例截屏。
具體實施例方式首先參考圖I中示出的非限制性示例實施例,系統(tǒng)10包括諸如TV之類的消費電子產(chǎn)品(CE)設(shè)備12,其包括外殼14和TV調(diào)諧器16,TV調(diào)諧器16與TV處理器18通信,TV處理器18訪問諸如基于盤的或固態(tài)的存儲裝置之類的有形計算機可讀存儲介質(zhì)20。CE設(shè)備12可以在ー個或多個揚聲器22上輸出音頻,并且可以使用諸如有線或無線調(diào)制解調(diào)器之類的網(wǎng)絡(luò)接ロ 24來從因特網(wǎng)接收流傳輸視頻,其中網(wǎng)絡(luò)接ロ 24與處理器18通信,處理器18可以運行軟件實現(xiàn)的瀏覽器。視頻在TV處理器18的控制下被呈現(xiàn)在TV顯示器26上,TV顯示器26諸如但不限于是高清晰TV(HDTV)平板顯示器。麥克風(fēng)28可以被設(shè)置在外殼14上并與圖所示地與處理器18通信。此外,給處理器18的用戶命令可以使用例如射頻或紅外線從遙控器(RC) 30無線地接收。在所示出的示例中,RC 30包括信息鍵32。可以使用除了 TV之外的音視頻顯示設(shè)備。使用網(wǎng)絡(luò)接ロ 24,處理器18可以與具有處理器38的信息服務(wù)器34通信來訪問腳本數(shù)據(jù)庫36以用于馬上要披露的目的。通過與TV 12通信的地面廣播天線接收到的來自ー個或多個地面TV廣播源的TV節(jié)目編排(programming)可以在顯示器26和揚聲器22上被呈現(xiàn)。來自有線TV頭端的TV節(jié)目編排也可以在TV處被接收以用于在顯示器26和揚聲器22上呈現(xiàn)。類似地,從通過與家用衛(wèi)星天線相關(guān)聯(lián)的集成接收機/解碼器(RID)接收到的TV廣播信號的衛(wèi)星源發(fā)送的HDMI基帶信號可以被輸入到CE設(shè)備12以用于在顯示器26和揚聲器22上呈現(xiàn)。此外,流傳輸視頻可以經(jīng)由因特網(wǎng)和網(wǎng)絡(luò)接ロ 24從ー個或多個內(nèi)容服務(wù)器接收以用于在顯示器26和揚聲器22上呈現(xiàn)?,F(xiàn)在參考圖2,示出根據(jù)本原理的示例邏輯的流程圖。從框40開始,邏輯可以接收對呈現(xiàn)與諸如上述CE設(shè)備12之類的CE設(shè)備上正在呈現(xiàn)的音視頻節(jié)目有關(guān)的信息的請求。因此,CE設(shè)備可以是TV,其中,對與音視頻節(jié)目有關(guān)的信息的請求可以通過對選項用戶界面上的“識別”選擇器(類似于例如圖I的信息鍵32)的選擇而被接收到。然而,在非限·制性實施例中,CE設(shè)備也可以是個人計算機(PC),其中用于識別音視頻節(jié)目的觀看者命令可以通過對右擊實例化的可選擇的“識別”選擇器的選擇而被接收到。在又一些非限制性實施例中,CE設(shè)備可以是智能電話,其中,用于識別音視頻節(jié)目的觀看者命令可以通過對電話選項用戶界面菜單上的“識別”選擇器的選擇而被接收到。不論如何,在圖2的框42處,邏輯可以從CE設(shè)備上的麥克風(fēng)接收信號,在非限制性實施例中,麥克風(fēng)例如是上述麥克風(fēng)28,所述信號代表來自CE設(shè)備上正被呈現(xiàn)的音視頻節(jié)目的音頻,其中當(dāng)所述音頻在CE設(shè)備上被實時播放時,所述音頻被麥克風(fēng)感測到。應(yīng)當(dāng)理解,在非限制性實施例中,音頻中的預(yù)定數(shù)目的詞語(例如十個),和/或音頻中具有預(yù)定時間長度的音頻部分和/或片段可以通過麥克風(fēng)從信號中被捕獲。隨后,在圖2的框44處,邏輯可以對來自麥克風(fēng)的信號執(zhí)行語音識別來確定來自被麥克風(fēng)感測到的、CE設(shè)備上正在呈現(xiàn)的音視頻節(jié)目的音頻中的詞語。移動到框46,邏輯隨后可以將詞語上載到因特網(wǎng)服務(wù)器,在非限制性實施例中,因特網(wǎng)服務(wù)器諸如是上述服務(wù)器34。應(yīng)當(dāng)理解,在一些實現(xiàn)方式中,該信息可以通過因特網(wǎng)被上載。在非限制性實施例中,還應(yīng)當(dāng)理解,僅上述預(yù)定數(shù)目的詞語以及其它內(nèi)容可以被上載到因特網(wǎng)服務(wù)器。此外,在非限制性實施例中,僅具有預(yù)定時間長度的音頻部分和/或片段以及其它音頻部分和/或片段可以被上載到因特網(wǎng)服務(wù)器。還是參考圖2,邏輯隨后可以在框48處結(jié)束,其中,邏輯可以從因特網(wǎng)服務(wù)器接收回通過服務(wù)器使用所述詞語而被與CE設(shè)備上正在呈現(xiàn)的音視頻節(jié)目相相關(guān)和/或相匹配的信息。在非限制性實施例中,所述信息可以包括音視頻節(jié)目的藝術(shù)貢獻者、諸如哪個工作室擁有節(jié)目的合法權(quán)益的制作數(shù)據(jù),節(jié)目被拍攝和/或制作的地點、(例如通過稱為“數(shù)據(jù)挖掘”的技術(shù)生成的)與節(jié)目的流行度有關(guān)的數(shù)據(jù),和/或與節(jié)目有關(guān)的其它數(shù)據(jù)。此外,在非限制性實施例中,所述信息還可以包括到因特網(wǎng)站點的鏈接,這些鏈接可被觀看者選擇來訪問因特網(wǎng)站點以下載與音視頻節(jié)目有關(guān)的信息和/或購買可以被與音視頻節(jié)目相相關(guān)的另外的音視頻內(nèi)容或節(jié)目。還應(yīng)當(dāng)理解,在非限制性實施例中,服務(wù)器可以具有音視頻節(jié)目腳本的數(shù)據(jù)庫和處理器,諸如上述處理器38和數(shù)據(jù)庫36。因此,CE設(shè)備上的處理器可以與服務(wù)器通信來訪問腳本數(shù)據(jù)庫,其中,服務(wù)器上的處理器可以通過因特網(wǎng)接收從CE設(shè)備上載并且被CE設(shè)備從CE設(shè)備上正在呈現(xiàn)的音視頻節(jié)目的聲道識別的詞語。服務(wù)器隨后可以在訪問數(shù)據(jù)庫時使用這些詞語來將詞語與至少ー個腳本相相關(guān)和/或匹配。服務(wù)器隨后可以向CE設(shè)備返回與其聲道是與詞語相匹配的腳本的音視頻節(jié)目有關(guān)的信息,該信息如上所述在框48處被接收。應(yīng)當(dāng)理解,數(shù)據(jù)庫中的ー個或多個腳本可以是音頻腳本。還應(yīng)當(dāng)理解,數(shù)據(jù)庫中的腳本可以是從與音視頻節(jié)目相相關(guān)的閉合字幕文本導(dǎo)出的。還是參考圖2,替代于在框48處結(jié)束,在非限制性實施例中,邏輯可以繼續(xù)進行到框50。在框50處,邏輯可以從服務(wù)器接收響應(yīng)于詞語到服務(wù)器的上載的和/或關(guān)聯(lián)于(一個或多個)腳本的屬性被與詞語的相關(guān)的對另外的音視頻節(jié)目的推薦。如果期望,邏輯隨后可以進行到框52,其中,邏輯可以從服務(wù)器接收響應(yīng)于詞語到服務(wù)器的上載的和/或關(guān)聯(lián)于(ー個或多個)腳本的屬性被與詞語的相關(guān)的廣告。參考圖3,示出根據(jù)本原理的用于確定服務(wù)器可以推薦的音視頻節(jié)目的示例邏輯·的流程圖。因此,在框54處開始時,邏輯可以將從CE設(shè)備上載到服務(wù)器的表示音視頻節(jié)目的詞語與至少ー個音視頻腳本相關(guān)和/或匹配。隨后,在框56處,邏輯可以將在框54處與詞語匹配的(ー個或多個)腳本與共有藝術(shù)屬性的其它音視頻節(jié)目相關(guān)聯(lián)。這樣的屬性可以包括例如音視頻流派、諸如演員之類的藝術(shù)貢獻者和制作工作室。在框58處結(jié)束時,包含與音視頻節(jié)目共有藝術(shù)屬性的其它音視頻節(jié)目的推薦可以被發(fā)送給CE設(shè)備已被呈現(xiàn)給CE設(shè)備的用戶。現(xiàn)在參考圖4,示出根據(jù)本原理的用于確定服務(wù)器可以發(fā)送給CE設(shè)備的廣告的示例邏輯的流程圖。在框60處開始時,邏輯可以將從CE設(shè)備上載到服務(wù)器的表示音視頻節(jié)目的詞語與至少ー個音視頻腳本相關(guān)和/或匹配。隨后,在框62處,邏輯可以將與詞語匹配的(ー個或多個)腳本與廣告相關(guān)聯(lián)。在非限制性實施例中,廣告可以與和CE設(shè)備上正在呈現(xiàn)的音視頻節(jié)目共有藝術(shù)屬性的另外的音視頻節(jié)目有夫。這樣的屬性可以包括例如音視頻流派、諸如演員之類的藝術(shù)貢獻者,以及制作工作室。然而,應(yīng)當(dāng)理解,廣告可以與和CE設(shè)備上正在呈現(xiàn)的音視頻節(jié)目的屬性沒有關(guān)聯(lián)的產(chǎn)品和/或服務(wù)有夫。無論如何,邏輯在框64處結(jié)束,其中,廣告可以被提供給CE設(shè)備已被呈現(xiàn)給CE設(shè)備的用戶。移動到圖5,示出根據(jù)本原理的可以被呈現(xiàn)在CE設(shè)備上的信息的非限制性示例截屏。根據(jù)本原理,截屏66可以包括對CE設(shè)備上正在呈現(xiàn)的音視頻做出貢獻的演員清單68、作者清單70和導(dǎo)演清單72。應(yīng)當(dāng)理解,這里使用的諸如“X”、“A”和“E”之類的字母為了簡化起見而在自此描述的截屏中被提供,但是,在非限制性實施例中,例如演員、作者和導(dǎo)演的全名將被呈現(xiàn)。圖5的截屏66還可以包括與音視頻節(jié)目被拍攝的地點例如加利福尼亞有關(guān)的地點信息74。更進一歩地,根據(jù)本原理,截屏66可以包括廣告76。最后,在圖6中,示出根據(jù)本原理的可以被呈現(xiàn)在CE設(shè)備上的信息的另ー非限制性示例截屏。截屏78可以包括演員清單80。根據(jù)本原理,截屏78還可以提供到因特網(wǎng)站點的鏈接,所述鏈接可被觀看者選擇來訪問包含與被提供了針對其的信息的音視頻節(jié)目有關(guān)的信息的因特網(wǎng)站點和/或來購買有關(guān)的另外的音視頻內(nèi)容或節(jié)目。截屏78還可以包括有關(guān)與被提供針對其的信息的音視頻節(jié)目的共有藝術(shù)屬性的另外的音視頻節(jié)目的推薦84,例如,圖6的非限制性截屏中示出的“節(jié)目I”和“節(jié)目2”。另外,在非限制性實施例中,根據(jù)本原理,截頻78可以包括廣告86。
盡管在這里詳細示出并描述了具體的使用聲道的語音識別來獲取有關(guān)音視頻節(jié)目的信息,但是應(yīng)當(dāng)理解,本發(fā)明涵蓋的主題僅由權(quán)利要求書限定?!?br>
權(quán)利要求
1.一種用于獲取有關(guān)消費電子產(chǎn)品CE設(shè)備上正在呈現(xiàn)的音視頻節(jié)目的信息的方法,包括 在所述CE設(shè)備處接收識別所述CE設(shè)備 上正在呈現(xiàn)的音視頻節(jié)目的觀看者命令;從麥克風(fēng)接收代表來自所述CE設(shè)備上正在呈現(xiàn)的音視頻節(jié)目的音頻的信號,其中當(dāng)所述音頻在所述CE設(shè)備上被實時播放時,所述音頻被所述麥克風(fēng)感測到; 對來自所述麥克風(fēng)的所述信號執(zhí)行語音識別來確定被所述麥克風(fēng)感測到的來自所述CE設(shè)備上正在呈現(xiàn)的音視頻節(jié)目的音頻中的詞語; 將所述詞語上載到因特網(wǎng)服務(wù)器;以及 從因特網(wǎng)服務(wù)器接收回通過所述服務(wù)器使用所述詞語被與所述CE設(shè)備上正在呈現(xiàn)的音視頻節(jié)目相關(guān)的信息。
2.如權(quán)利要求I所述的方法,其中,通過所述服務(wù)器使用所述詞語被與所述CE設(shè)備上正在呈現(xiàn)的音視頻節(jié)目相關(guān)的信息包括所述音視頻節(jié)目的藝術(shù)貢獻者。
3.如權(quán)利要求I所述的方法,包括從來自所述麥克風(fēng)的所述信號中捕獲被所述麥克風(fēng)感測到的來自所述CE設(shè)備上正在呈現(xiàn)的音視頻節(jié)目的音頻中的預(yù)定數(shù)目的詞語并僅所述預(yù)定數(shù)目的詞語上載到所述因特網(wǎng)服務(wù)器。
4.如權(quán)利要求I所述的方法,其中,從所述服務(wù)器接收的信息包括到因特網(wǎng)站點的鏈接,所述鏈接能被觀看者選擇來訪問所述因特網(wǎng)站點以下載與所述音視頻節(jié)目有關(guān)的信肩、O
5.如權(quán)利要求I所述的方法,包括從所述服務(wù)器接收響應(yīng)于所述詞語到所述服務(wù)器的上載的對另外的音視頻節(jié)目的推薦。
6.如權(quán)利要求I所述的方法,包括從所述服務(wù)器接收響應(yīng)于所述詞語到所述服務(wù)器的上載的廣告。
7.如權(quán)利要求I所述的方法,其中,所述CE設(shè)備是TV并且識別所述CE設(shè)備上正在呈現(xiàn)的音視頻節(jié)目的觀看者命令是通過對TV選項用戶界面上的“識別”選擇器的選擇而被接收的。
8.如權(quán)利要求I所述的方法,其中,所述CE設(shè)備是個人計算機PC并且識別所述CE設(shè)備上正在呈現(xiàn)的音視頻節(jié)目的觀看者命令是通過對右擊實例化的能選擇“識別”選擇器的選擇而被接收的。
9.一種服務(wù)器,包括 處理器; 音視頻節(jié)目腳本的數(shù)據(jù)庫,所述處理器 通過因特網(wǎng)從消費者電子產(chǎn)品CE設(shè)備接收詞語,所述詞語是由所述CE設(shè)備從所述CE設(shè)備上正在呈現(xiàn)的音視頻節(jié)目的聲道識別出的; 使用所述詞語,訪問所述數(shù)據(jù)庫來將所述詞語與至少一個音視頻節(jié)目腳本匹配;以及向所述CE設(shè)備返回與其聲道是與所述詞語相匹配的音視頻腳本的音視頻節(jié)目有關(guān)的信息。
10.一種系統(tǒng),包括 消費電子產(chǎn)品CE設(shè)備; 服務(wù)器,該服務(wù)器具有處理器;所述服務(wù)器上的音視頻節(jié)目聲道的數(shù)據(jù)庫;其中,所述處理器 通過因特網(wǎng)接收來自所述CE設(shè)備上正在呈現(xiàn)的音視頻節(jié)目的一個或多個音頻信號;使用所述一個或多個音頻信號來訪問所述數(shù)據(jù)庫以將所述一個或多個音頻信號與至少一個音視頻節(jié)目相匹配;以及 向所述CE設(shè)備返回與其聲道與所述一個或多個音頻信號相匹配的音視頻節(jié)目有關(guān)的信息。
全文摘要
本發(fā)明公開了使用聲道的語音識別來獲取有關(guān)音視頻節(jié)目的信息。一種用于獲取有關(guān)消費電子(CE)設(shè)備上正在呈現(xiàn)的音視頻節(jié)目的信息的方法,包括在CE設(shè)備處接收識別CE設(shè)備上正在呈現(xiàn)的音視頻節(jié)目的觀看者命令。該方法還包括從麥克風(fēng)接收表示來自音視頻節(jié)目的音頻的信號,其中當(dāng)所述音頻在CE設(shè)備上被實時播放時,所述音頻被麥克風(fēng)感測到。該方法還包括對來自麥克風(fēng)的信號執(zhí)行語音識別以確定被麥克風(fēng)感測到的來自音視頻節(jié)目的音頻中的詞語。詞語隨后被上載到因特網(wǎng)服務(wù)器,在那兒,它們被與至少一個音視頻腳本相關(guān)。該方法還包括從因特網(wǎng)服務(wù)器接收回通過服務(wù)器使用詞語被與音視頻節(jié)目相關(guān)的信息。
文檔編號G10L15/00GK102790916SQ20121014248
公開日2012年11月21日 申請日期2012年5月4日 優(yōu)先權(quán)日2011年5月18日
發(fā)明者塞思·希爾, 弗雷德里克·J·祖斯塔克 申請人:索尼公司