信息歸納分析方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于IT應(yīng)用技術(shù)領(lǐng)域,尤其涉及一種對(duì)信息歸納分析的方法和裝置。
【背景技術(shù)】
[0002] 隨著信息技術(shù)的發(fā)展,政府機(jī)構(gòu)、企事業(yè)單位、公益機(jī)構(gòu)和國(guó)家安全部門(mén)等都積累 了海量的數(shù)據(jù)信息,在一些情況下,需要從該數(shù)據(jù)信息中的部分?jǐn)?shù)據(jù)里提取需要的信息,而 由于這些媒體數(shù)據(jù)信息之間并沒(méi)有建立直接的關(guān)聯(lián)關(guān)系,無(wú)法直接用搜索引擎檢索,通常 只能通過(guò)人工過(guò)濾、分析、確認(rèn)的方法進(jìn)行信息提取,該方法使得信息提取的工作量巨大, 又由于信息歸納分析涉及語(yǔ)音檢測(cè)與識(shí)別、圖像檢測(cè)與識(shí)別、文本分析等人工智能技術(shù),較 為復(fù)雜,所以,在數(shù)據(jù)分析應(yīng)用中,還是主要依賴(lài)人工分析確認(rèn),這就產(chǎn)生了巨大的人工成 本,也增加了信息分析的周期。
[0003] 例如,每個(gè)城市的交警隊(duì)都通過(guò)交通監(jiān)控系統(tǒng)攝取了大量視頻錄像資料,由于工 作量大和技術(shù)的原因,這些視頻資料中的車(chē)輛信息目前是不做內(nèi)容檢索的,只有在出現(xiàn)交 通事故后,如果發(fā)生車(chē)輛逃逸,需要對(duì)逃逸車(chē)輛進(jìn)行軌跡追蹤時(shí),通過(guò)人工瀏覽各可能經(jīng)過(guò) 路線(xiàn)的錄像資料查找相關(guān)逃逸車(chē)輛的逃逸路線(xiàn)及其他信息。
[0004] 此外,在有些應(yīng)用中,采用大數(shù)據(jù)分析技術(shù),可以對(duì)部分靜態(tài)信息進(jìn)行過(guò)濾和提 取,但是,大數(shù)據(jù)分析側(cè)重于信息狀態(tài)發(fā)展趨勢(shì)的分析,對(duì)于實(shí)時(shí)性處理要求較高和現(xiàn)場(chǎng)應(yīng) 用的環(huán)境,還不適合。同時(shí),大數(shù)據(jù)不以信息處理中查全為主,對(duì)于查全率要求高的應(yīng)用也 不適合。
【發(fā)明內(nèi)容】
[0005] 為了解決現(xiàn)有信息歸納分析方法主要依靠人工信息篩選完成,造成的分析周期 長(zhǎng),人力成本投入巨大且查全慮不高的技術(shù)問(wèn)題,本發(fā)明提供了一種信息歸納分析方法及 裝置,用以減小人工信息篩選范圍,將需要閱覽的海量數(shù)據(jù)信息轉(zhuǎn)變?yōu)殚営[與目標(biāo)相關(guān)的 有效?目息,提尚有用?目息的提取效率。
[0006] 為了實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案為:一種信息歸納分析方法,包括如下 步驟:
[0007] SI.根據(jù)使用者提供的輸入數(shù)據(jù)信息的類(lèi)型,對(duì)輸入數(shù)據(jù)信息中涉及的文本、語(yǔ) 音、圖片和視頻中的一種或多種數(shù)據(jù)信息提取特征數(shù)據(jù),并加載、釋放對(duì)應(yīng)的樣本模型庫(kù);
[0008] S2.動(dòng)態(tài)加載檢測(cè)引擎以對(duì)所述特征數(shù)據(jù)追蹤識(shí)別處理,在樣本模型庫(kù)中找到疑 似目標(biāo);
[0009] S3.預(yù)置關(guān)聯(lián)條件以得到疑似目標(biāo)之間的關(guān)聯(lián)性,確定各疑似目標(biāo)的相似性;
[0010] S4.得到輸出數(shù)據(jù)信息,所述輸出的數(shù)據(jù)信息包括媒體文件或媒體流中出現(xiàn)的疑 似目標(biāo)的所在位置。
[0011] 作為技術(shù)方案的補(bǔ)充,所述輸入數(shù)據(jù)信息為文本、語(yǔ)音、圖片和視頻中;所述樣本 模型庫(kù),包括文本分析用的文本特征庫(kù),語(yǔ)音處理用的聲紋模型庫(kù)及聲學(xué)和語(yǔ)言模型庫(kù),圖 片處理和視頻處理用的物體形體特征模型庫(kù)、人臉特征模型庫(kù)、顏色特征模型庫(kù)和物體紋 理特征模型庫(kù);所述樣本模型庫(kù)的加載由動(dòng)態(tài)加載、云端服務(wù)器或集群模型庫(kù)中加載、本地 模型庫(kù)加載和USB設(shè)備加載中任意加載方式實(shí)現(xiàn)。
[0012] 作為技術(shù)方案的補(bǔ)充,根據(jù)輸入數(shù)據(jù)信息的類(lèi)型,自動(dòng)啟動(dòng)相應(yīng)的服務(wù)引擎;根據(jù) 系統(tǒng)狀態(tài),控制各服務(wù)引擎進(jìn)程;在網(wǎng)絡(luò)環(huán)境下,輸入信息由接收云端或集群服務(wù)端的待檢 測(cè)數(shù)據(jù)文件或接收IP媒體流的方式得到。
[0013] 作為技術(shù)方案的補(bǔ)充,動(dòng)態(tài)加載的檢測(cè)引擎來(lái)自于云端服務(wù)器、集群引擎庫(kù)、本地 引擎庫(kù)及USB設(shè)備中的一種或多種;對(duì)所述生物特征數(shù)據(jù)進(jìn)行追蹤識(shí)別處理時(shí),其包括語(yǔ) 音關(guān)鍵詞識(shí)別、圖像檢測(cè)、圖像識(shí)別、顏色識(shí)別、物體大小識(shí)別、紋理分析、音視頻特征比對(duì) 和多種引擎協(xié)同并行處理的方法中的多種組合。
[0014] 作為技術(shù)方案的進(jìn)一步補(bǔ)充,在對(duì)所述生物特征數(shù)據(jù)進(jìn)行追蹤識(shí)別處理時(shí),還進(jìn) 行如下一種或多種操作:設(shè)置和/或調(diào)整檢測(cè)目標(biāo)、調(diào)整檢測(cè)順序、增加同一檢測(cè)目標(biāo)的檢 測(cè)要素。
[0015] 作為技術(shù)方案的補(bǔ)充,輸出信息還包括,出現(xiàn)該疑似目標(biāo)的音頻、視頻文件的名 稱(chēng)、疑似目標(biāo)出現(xiàn)的入點(diǎn)時(shí)間和時(shí)長(zhǎng);出現(xiàn)該疑似目標(biāo)的音頻流、視頻流媒體的名稱(chēng):疑似 目標(biāo)出現(xiàn)的入點(diǎn)時(shí)間和時(shí)長(zhǎng);出現(xiàn)該疑似目標(biāo)的圖片文件的文件名列表和存儲(chǔ)路徑,在輸 出信息后,將媒體文件或媒體流中出現(xiàn)的疑似目標(biāo)的所在位置的媒體片段留存和/或提 取。
[0016] 作為技術(shù)方案的補(bǔ)充,還包括對(duì)相似的疑似目標(biāo)進(jìn)行聚類(lèi)匯編,并以時(shí)間順序、位 置信息為主線(xiàn)展示。
[0017] 作為技術(shù)方案的補(bǔ)充,設(shè)置有網(wǎng)絡(luò)集群運(yùn)行和單機(jī)獨(dú)立運(yùn)行兩種模式,并提供有 網(wǎng)絡(luò)端口,自動(dòng)檢測(cè)網(wǎng)絡(luò)鏈接狀態(tài),處于離線(xiàn)狀態(tài)時(shí),自動(dòng)或手動(dòng)切換到獨(dú)立運(yùn)行狀態(tài);處 于網(wǎng)絡(luò)連接狀態(tài)時(shí),根據(jù)配置信息,自動(dòng)運(yùn)行在集群模式或獨(dú)立運(yùn)行模式。
[0018] 作為技術(shù)方案的補(bǔ)充,使用該方法時(shí)涉及的各功能模塊和引擎之間的數(shù)據(jù)交換, 通過(guò)消息機(jī)制實(shí)現(xiàn),消息格式有標(biāo)準(zhǔn)定義,系統(tǒng)提供消息池進(jìn)行管理,定義消息觸發(fā)、推送 機(jī)制,各引擎之間有消息確認(rèn)機(jī)制,實(shí)時(shí)了解引擎的工作狀態(tài),在出現(xiàn)引擎宕機(jī)故障時(shí),啟 動(dòng)重啟機(jī)制;
[0019] 設(shè)置系統(tǒng)故障監(jiān)測(cè)管理為獨(dú)立進(jìn)程,實(shí)時(shí)采集各功能模塊的狀態(tài)信息,在發(fā)現(xiàn)軟 件或硬件故障時(shí)發(fā)出報(bào)警消息,在功能模塊宕機(jī)時(shí)觸發(fā)重啟功能模塊機(jī)制,應(yīng)用該方法的 系統(tǒng)宕機(jī)時(shí)重啟整個(gè)系統(tǒng),在網(wǎng)絡(luò)集群運(yùn)行模式下,各設(shè)備間的故障監(jiān)測(cè)管理進(jìn)程之間會(huì) 實(shí)時(shí)匯總設(shè)備狀態(tài)到主設(shè)備。
[0020] 一種使用所述的信息歸納分析方法的信息歸納分析裝置,
[0021] 加載、釋放樣本模型庫(kù)模塊,根據(jù)使用者提供的輸入數(shù)據(jù)信息的類(lèi)型,對(duì)輸入數(shù)據(jù) 信息中涉及的文本、語(yǔ)音、圖片和視頻中的一種或多種數(shù)據(jù)信息提取特征數(shù)據(jù),并加載、釋 放對(duì)應(yīng)的樣本模型庫(kù);
[0022] 特征數(shù)據(jù)提取模塊,動(dòng)態(tài)加載檢測(cè)引擎以對(duì)所述特征數(shù)據(jù)追蹤識(shí)別處理,在樣本 模型庫(kù)中找到疑似目標(biāo);
[0023] 疑似目標(biāo)查找模塊,動(dòng)態(tài)加載檢測(cè)引擎以對(duì)所述生物特征數(shù)據(jù)追蹤識(shí)別處理,找 到疑似目標(biāo);
[0024] 關(guān)聯(lián)模塊,預(yù)置關(guān)聯(lián)條件以得到疑似目標(biāo)之間的關(guān)聯(lián)性,確定各疑似目標(biāo)的相似 性;
[0025] 輸出模塊,得到輸出數(shù)據(jù)信息,所述輸出的數(shù)據(jù)信息包括媒體文件或媒體流中出 現(xiàn)的疑似目標(biāo)的所在位置。
[0026] 有益效果:該所述信息歸納分析方法及裝置,針對(duì)可提供的疑是目標(biāo)的關(guān)鍵詞、圖 片、語(yǔ)音中的單一信息進(jìn)行檢測(cè),追蹤發(fā)現(xiàn)關(guān)聯(lián)信息并輸出,可以減小人工信息篩選范圍, 將需要閱覽的海量數(shù)據(jù)信息轉(zhuǎn)變?yōu)殚営[與目標(biāo)相關(guān)的有效信息,提高有用信息的提取效 率。
【附圖說(shuō)明】
[0027] 圖1為實(shí)施例1中的各分類(lèi)信息提取的特征信息與樣本模型庫(kù)對(duì)應(yīng)的示意圖;
[0028] 圖2為實(shí)施例5中的裝置統(tǒng)一管理控制引擎的加載、運(yùn)行和釋放的示意圖;
[0029] 圖3為實(shí)施例4中的裝置的內(nèi)部功能模塊連接的示意圖;
[0030] 圖4為實(shí)施例1中所述信息歸納分析方法的流程示意圖。
【具體實(shí)施方式】
[0031] 實(shí)施例1 : 一種信息歸納分析方法,包括如下步驟:
[0032] SI.根據(jù)使用者提供的輸入數(shù)據(jù)信息的類(lèi)型,對(duì)輸入數(shù)據(jù)信息中涉及的文本、語(yǔ) 音、圖片和視頻中的一種或多種數(shù)據(jù)信息提取特征數(shù)據(jù),并加載、釋放對(duì)應(yīng)的樣本模型庫(kù);
[0033] 具體的,所述輸入數(shù)據(jù)信息為文本、語(yǔ)音、圖片和視頻中,尤其是,本方法可以 接收網(wǎng)絡(luò)文件數(shù)據(jù)和網(wǎng)絡(luò)流媒體數(shù)據(jù),數(shù)據(jù)格式:視頻及流媒體支持AVI、MPEG-1/2/4, Η· 263/264/265, M-JPEG、MP4 ;音頻支持:WAV、MP3、PCM ;圖片支持:BMP、JPG/JPEG、Gif、 Tiff、PNG