两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種數(shù)據(jù)缺失的補(bǔ)償方法和裝置與流程

文檔序號(hào):11583240閱讀:869來(lái)源:國(guó)知局
一種數(shù)據(jù)缺失的補(bǔ)償方法和裝置與流程

本發(fā)明涉及數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù)領(lǐng)域,具體涉及到一種數(shù)據(jù)缺失的補(bǔ)償方法和裝置。



背景技術(shù):

在現(xiàn)有的數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù)中,常會(huì)遇到高維數(shù)據(jù)的某些維度缺失的問(wèn)題。數(shù)據(jù)的維度可以是低層次的某個(gè)數(shù)據(jù)向量的某一維,也可以是多模態(tài)數(shù)據(jù)中的某個(gè)模態(tài),或者是某種語(yǔ)義信息。

在現(xiàn)有技術(shù)中對(duì)數(shù)據(jù)缺失的問(wèn)題的處理,通常會(huì)提前定義好完整的特征維度,直接得知缺失的維度到底有哪些,對(duì)于這些缺失的維度,往往會(huì)對(duì)這些缺失的維度進(jìn)行補(bǔ)0,或直接剔除這些缺失的維度。

但是,運(yùn)用現(xiàn)有技術(shù)的處理方法時(shí),并不能清晰的得知當(dāng)前數(shù)據(jù)是否存在缺失,并且在當(dāng)前數(shù)據(jù)下采用補(bǔ)0或降維的方式可能會(huì)導(dǎo)致根據(jù)現(xiàn)有獲得的數(shù)據(jù)無(wú)法得到需要的最終結(jié)論判決結(jié)果。

因此,如何在數(shù)據(jù)缺失不確定的情況下對(duì)數(shù)據(jù)進(jìn)行針對(duì)性的補(bǔ)償成為亟待解決的問(wèn)題。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明要解決的技術(shù)問(wèn)題在于在數(shù)據(jù)缺失不確定的情況下對(duì)數(shù)據(jù)進(jìn)行針對(duì)性的補(bǔ)償。

為此,根據(jù)第一方面,本發(fā)明實(shí)例提供了一種數(shù)據(jù)缺失的補(bǔ)償方法,包括:

獲取用于表征對(duì)象信息的對(duì)象數(shù)據(jù),對(duì)象數(shù)據(jù)為多維度數(shù)據(jù)和/或多模態(tài)數(shù)據(jù);獲取與對(duì)象數(shù)據(jù)中的各個(gè)維度組合映射的各個(gè)預(yù)設(shè)結(jié)論判決結(jié)果;根據(jù)各個(gè)維度組合和各個(gè)預(yù)設(shè)結(jié)論判決結(jié)果的映射關(guān)系得到各個(gè)維度組合中指定維度組合的第一數(shù)據(jù)缺失性,第一數(shù)據(jù)缺失性用于表征指定維度組合的數(shù)據(jù)缺失對(duì)判決結(jié)果的影響程度;判斷第一數(shù)據(jù)缺失性是否大于預(yù)設(shè)閾值;如果第一數(shù)據(jù)缺失性大于預(yù)設(shè)閾值,則在指定維度組合之外的對(duì)象數(shù)據(jù)中選擇數(shù)據(jù)對(duì)指定維度組合進(jìn)行補(bǔ)償,以得到完成補(bǔ)償?shù)闹付ňS度組合。

優(yōu)選地,根據(jù)各個(gè)維度組合和各個(gè)預(yù)設(shè)結(jié)論判決結(jié)果的映射關(guān)系得到各個(gè)維度組合中指定維度組合的第一數(shù)據(jù)缺失性,包括:通過(guò)訓(xùn)練數(shù)據(jù)得到各個(gè)維度組合與對(duì)應(yīng)的各個(gè)預(yù)設(shè)結(jié)論判決結(jié)果之間的映射關(guān)系的集合;獲取各個(gè)維度組合中的數(shù)據(jù)在映射關(guān)系集合中的第一概率;通過(guò)第一概率得到指定維度組合的第一數(shù)據(jù)缺失性。

優(yōu)選地,在指定維度組合之外的對(duì)象數(shù)據(jù)中選擇數(shù)據(jù)對(duì)指定維度組合進(jìn)行補(bǔ)償,以得到完成補(bǔ)償?shù)闹付ňS度組合,包括:在指定維度組合之外的對(duì)象數(shù)據(jù)中選擇指定維度組合需要的任意可用數(shù)據(jù),對(duì)指定維度組合進(jìn)行補(bǔ)償,得到多個(gè)預(yù)補(bǔ)償?shù)闹付ňS度組合;根據(jù)多個(gè)預(yù)補(bǔ)償?shù)闹付ňS度組合和與指定維度組合對(duì)應(yīng)的預(yù)設(shè)結(jié)論判決結(jié)果得到第二數(shù)據(jù)缺失性;第二數(shù)據(jù)缺失性用于表征多個(gè)與補(bǔ)償?shù)闹付ňS度組合的數(shù)據(jù)缺失對(duì)判決結(jié)果的影響;根據(jù)第二數(shù)據(jù)缺失性對(duì)多個(gè)預(yù)補(bǔ)償?shù)闹付ňS度組合排序;選擇第二數(shù)據(jù)缺失性最小的預(yù)補(bǔ)償?shù)闹付ňS度組合作為完成補(bǔ)償?shù)闹付ňS度組合。

優(yōu)選地,在指定維度組合之外的對(duì)象數(shù)據(jù)中選擇數(shù)據(jù)對(duì)指定維度組合進(jìn)行補(bǔ)償,以得到完成補(bǔ)償?shù)闹付ňS度組合,還包括:在指定維度組合之外的對(duì)象數(shù)據(jù)中選擇指定維度組合需要的任意可用數(shù)據(jù);獲取可用數(shù)據(jù)在映射關(guān)系集合中的第二概率;根據(jù)第二概率對(duì)可用的數(shù)據(jù)進(jìn)行排序;選擇第二概率最高的所訴可用數(shù)據(jù)對(duì)指定維度組合進(jìn)行補(bǔ)償,作為完成補(bǔ)償?shù)闹付ňS度組合。

優(yōu)選地,根據(jù)完成補(bǔ)償?shù)闹付ňS度組合和與指定維度組合對(duì)應(yīng)的預(yù)設(shè)結(jié)論判決結(jié)果得到第三數(shù)據(jù)缺失性;第三數(shù)據(jù)缺失性用于表征完成補(bǔ)償?shù)闹付ňS度組合的數(shù)據(jù)缺失對(duì)判決結(jié)果的影響程度;判斷第三數(shù)據(jù)缺失性是否大于預(yù)設(shè)閾值;如果第三數(shù)據(jù)缺失性大于預(yù)設(shè)閾值,則返回在指定維度組合之外的對(duì)象數(shù)據(jù)中選擇數(shù)據(jù)對(duì)指定維度組合進(jìn)行補(bǔ)償,以得到完成補(bǔ)償?shù)闹付ňS度組合的步驟。

根據(jù)第二方面,本發(fā)明實(shí)施例提供了一種數(shù)據(jù)缺失的補(bǔ)償裝置,包括:第一獲取單元,用于獲取用于表征對(duì)象信息的對(duì)象數(shù)據(jù),對(duì)象數(shù)據(jù)為多維度數(shù)據(jù)和/或多模態(tài)數(shù)據(jù);

第二獲取單元,用于獲取與對(duì)象數(shù)據(jù)中的各個(gè)維度組合映射的各個(gè)預(yù)設(shè)結(jié)論判決結(jié)果;第一數(shù)據(jù)缺失性得到單元,用于據(jù)各個(gè)維度組合和各個(gè)預(yù)設(shè)結(jié)論判決結(jié)果的映射關(guān)系得到各個(gè)維度組合中指定維度組合的第一數(shù)據(jù)缺失性,第一數(shù)據(jù)缺失性用于表征指定維度組合的數(shù)據(jù)缺失對(duì)判決結(jié)果的影響程度;第一判斷單元,用于判斷第一數(shù)據(jù)缺失性是否大于預(yù)設(shè)閾值;補(bǔ)償單元,用于如果第一數(shù)據(jù)缺失性大于預(yù)設(shè)閾值,則在指定維度組合之外的對(duì)象數(shù)據(jù)中選擇數(shù)據(jù)對(duì)指定維度組合進(jìn)行補(bǔ)償,以得到完成補(bǔ)償?shù)闹付ňS度組合。

優(yōu)選地,第一數(shù)據(jù)缺失性得到單元包括:訓(xùn)練數(shù)據(jù)子單元,用于通過(guò)訓(xùn)練數(shù)據(jù)得到各個(gè)維度組合與對(duì)應(yīng)的各個(gè)預(yù)設(shè)結(jié)論判決結(jié)果之間的映射關(guān)系的集合;第一獲取子單元,用于獲取各個(gè)維度組合中的數(shù)據(jù)在映射關(guān)系集合中的第一概率;第一缺失性得到子單元,用于通過(guò)第一概率得到指定維度組合的第一數(shù)據(jù)缺失性。

優(yōu)選地,補(bǔ)償單元包括:預(yù)補(bǔ)償子單元,用于在指定維度組合之外的對(duì)象數(shù)據(jù)中選擇指定維度組合需要的任意可用數(shù)據(jù),對(duì)指定維度組合進(jìn)行補(bǔ)償,得到多個(gè)預(yù)補(bǔ)償?shù)闹付ňS度組合;第二缺失性子單元,用于根據(jù)多個(gè)預(yù)補(bǔ)償?shù)闹付ňS度組合和與指定維度組合對(duì)應(yīng)的預(yù)設(shè)結(jié)論判決結(jié)果得到第二數(shù)據(jù)缺失性;第二數(shù)據(jù)缺失性用于表征多個(gè)與補(bǔ)償?shù)闹付ňS度組合的數(shù)據(jù)缺失對(duì)判決結(jié)果的影響;第一排序子單元,用于根據(jù)第二數(shù)據(jù)缺失性對(duì)多個(gè)預(yù)補(bǔ)償?shù)闹付ňS度組合排序;第一選擇子單元,用于選擇第二數(shù)據(jù)缺失性最小的預(yù)補(bǔ)償?shù)闹付ňS度組合作為完成補(bǔ)償?shù)闹付ňS度組合。

優(yōu)選地,補(bǔ)償單元還包括:第二選擇子單元,用于在指定維度組合之外的對(duì)象數(shù)據(jù)中選擇指定維度組合需要的任意可用數(shù)據(jù);第二獲取子單元,用于獲取可用數(shù)據(jù)在映射關(guān)系集合中的第二概率;第二排序子單元,用于根據(jù)第二概率對(duì)可用的數(shù)據(jù)進(jìn)行排序;第三選擇子單元,用于選擇概率最高的可用的數(shù)據(jù)對(duì)指定維度組合進(jìn)行補(bǔ)償作為完成補(bǔ)償?shù)闹付ňS度組合。

優(yōu)選地,第二數(shù)據(jù)缺失性得到單元,用于根據(jù)完成補(bǔ)償?shù)闹付ňS度組合和與指定維度組合對(duì)應(yīng)的預(yù)設(shè)結(jié)論判決結(jié)果得到第三數(shù)據(jù)缺失性;第三數(shù)據(jù)缺失性用于表征完成補(bǔ)償?shù)闹付ňS度組合的數(shù)據(jù)缺失對(duì)判決結(jié)果的影響程度;第二判斷單元,用于判斷第三數(shù)據(jù)缺失性是否大于預(yù)設(shè)閾值;返回單元,用于如果第三數(shù)據(jù)缺失性大于預(yù)設(shè)閾值,則返回在指定維度組合之外的對(duì)象數(shù)據(jù)中選擇數(shù)據(jù)對(duì)指定維度組合進(jìn)行補(bǔ)償,以得到完成補(bǔ)償?shù)闹付ňS度組合的步驟。

本發(fā)明實(shí)施例提供的數(shù)據(jù)缺失的補(bǔ)償方法,通過(guò)獲取用于表征對(duì)象信息的對(duì)象數(shù)據(jù),對(duì)象數(shù)據(jù)為多維度數(shù)據(jù);獲取與對(duì)象數(shù)據(jù)中的各個(gè)維度組合映射的各個(gè)預(yù)設(shè)結(jié)論判決結(jié)果;根據(jù)各個(gè)維度組合和各個(gè)預(yù)設(shè)結(jié)論判決結(jié)果的映射關(guān)系得到各個(gè)維度組合中指定維度組合的第一數(shù)據(jù)缺失性,第一數(shù)據(jù)缺失性用于表征指定維度組合的數(shù)據(jù)缺失對(duì)判決結(jié)果的影響程度;判斷第一數(shù)據(jù)缺失性是否大于預(yù)設(shè)閾值;如果第一數(shù)據(jù)缺失性大于預(yù)設(shè)閾值,則在指定維度組合之外的對(duì)象數(shù)據(jù)中選擇數(shù)據(jù)對(duì)指定維度組合進(jìn)行補(bǔ)償,以得到完成補(bǔ)償?shù)闹付ňS度組合,從而,可以根據(jù)獲取的對(duì)象數(shù)據(jù)和存在的預(yù)設(shè)結(jié)論判決結(jié)果的映射關(guān)系確定數(shù)據(jù)的缺失性,然后在對(duì)象數(shù)據(jù)中選擇數(shù)據(jù)對(duì)缺失的維度組合進(jìn)行針對(duì)性的增值補(bǔ)償,進(jìn)而,可以完成在數(shù)據(jù)缺失不確定的情況下對(duì)數(shù)據(jù)進(jìn)行針對(duì)性的補(bǔ)償,以便在較短的時(shí)間內(nèi)獲得相應(yīng)的結(jié)論判決結(jié)果。

附圖說(shuō)明

為了更清楚地說(shuō)明本發(fā)明具體實(shí)施方式或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)具體實(shí)施方式或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖是本發(fā)明的一些實(shí)施方式,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

圖1示出了本實(shí)施例的數(shù)據(jù)缺失的補(bǔ)償方法的流程圖;

圖2示出了本實(shí)施例的數(shù)據(jù)缺失的補(bǔ)償方法中數(shù)據(jù)缺失性得到方法的流程圖;

圖3示出了本實(shí)施例的數(shù)據(jù)缺失的補(bǔ)償方法中補(bǔ)償數(shù)據(jù)方法的流程圖;

圖4示出了本實(shí)施例的數(shù)據(jù)缺失的補(bǔ)償方法中補(bǔ)償數(shù)據(jù)方法的流程圖;

圖5示出了本實(shí)施例的數(shù)據(jù)缺失補(bǔ)償驗(yàn)證方法的流程圖;

圖6示出了本實(shí)施的數(shù)據(jù)缺失的補(bǔ)償裝置示意圖。

具體實(shí)施方式

下面將結(jié)合附圖對(duì)本發(fā)明的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。

在本發(fā)明的描述中,需要說(shuō)明的是,除非另有明確的規(guī)定和限定,術(shù)語(yǔ)“安裝”、“相連”、“連接”應(yīng)做廣義理解,例如,可以是固定連接,也可以是可拆卸連接,或一體地連接;可以是機(jī)械連接,也可以是電連接;可以是直接相連,也可以通過(guò)中間媒介間接相連,還可以是兩個(gè)元件內(nèi)部的連通,可以是無(wú)線連接,也可以是有線連接。對(duì)于本領(lǐng)域的普通技術(shù)人員而言,可以具體情況理解上述術(shù)語(yǔ)在本發(fā)明中的具體含義。

本發(fā)明實(shí)施例提供了一種數(shù)據(jù)缺失的補(bǔ)償方法,如圖1所示,包括如下步驟:

s10.獲取用于表征對(duì)象信息的對(duì)象數(shù)據(jù)。在本實(shí)施中,所稱的對(duì)象數(shù)據(jù)可以是多維度數(shù)據(jù),也可以是多模態(tài)數(shù)據(jù),具體地,多模態(tài)數(shù)據(jù)可以是通過(guò)不同的方法或角度收集的例如聲音、圖像或文字等數(shù)據(jù)。

s20.獲取與對(duì)象數(shù)據(jù)中的各個(gè)維度組合映射的各個(gè)預(yù)設(shè)結(jié)論判決結(jié)果。在具體的實(shí)施例中,每一套對(duì)象數(shù)據(jù)中存在多個(gè)維度組合,理論上都可以分別得到對(duì)應(yīng)的多個(gè)結(jié)論判決結(jié)果,可以獲取與對(duì)象數(shù)據(jù)對(duì)應(yīng)的理論上的結(jié)論判決結(jié)果。在本實(shí)施例中,對(duì)象數(shù)據(jù)的獲取和預(yù)設(shè)結(jié)論判決結(jié)果的獲取可以是同步獲取,也可以有先后順序,可以先獲取對(duì)象數(shù)據(jù),也可以先獲取預(yù)設(shè)結(jié)論判決結(jié)果。

s30.根據(jù)各個(gè)維度組合和各個(gè)預(yù)設(shè)結(jié)論判決結(jié)果的映射關(guān)系得到各個(gè)維度組合中指定維度組合的第一缺失性。在本實(shí)施例中,所稱的第一數(shù)據(jù)缺失性用于表征指定維度組合的數(shù)據(jù)缺失對(duì)判決結(jié)果的影響程度,例如,如果指定維度組合中有三個(gè)數(shù)據(jù),缺失第二數(shù)據(jù)后,根據(jù)第一數(shù)據(jù)和第三數(shù)據(jù)得到的結(jié)論判決結(jié)果為預(yù)設(shè)結(jié)論判決結(jié)果完整性的百分之八十,則該數(shù)據(jù)的缺失性為百分之二十。在具體的實(shí)施例中,每個(gè)維度組合與結(jié)論判決結(jié)果之間都存在這一個(gè)映射關(guān)系,該映射關(guān)系可以為:其中,為某個(gè)維度組合,ωj為與該維度組合對(duì)應(yīng)的結(jié)論判決結(jié)果,f為映射關(guān)系法則。通過(guò)統(tǒng)計(jì)各維度組合中的數(shù)據(jù)在映射關(guān)系中重要性,可以得到該數(shù)據(jù)在該映射關(guān)系中的缺失度,即可確定指定維度組合的缺失性。在本實(shí)施例中,所稱的指定維度組合中某些數(shù)據(jù)缺失可以是多維度數(shù)據(jù)中的某些數(shù)據(jù)的缺失,也可以是多模態(tài)數(shù)據(jù)中的某個(gè)模態(tài)或者某種語(yǔ)義信息的缺失。

s40.判斷第一缺失性是否大于預(yù)設(shè)閾值。在具體的實(shí)施例中,可以預(yù)先設(shè)置缺失性的閾值,該閾值的設(shè)置可以根據(jù)缺失性對(duì)結(jié)果影響程度設(shè)置。如果第一缺失性大于預(yù)設(shè)閾值,則進(jìn)入步驟s50。如果第一缺失性小于預(yù)設(shè)閾值,則可以認(rèn)為指定維度組合不缺失數(shù)據(jù)或缺失的數(shù)據(jù)對(duì)結(jié)論判決結(jié)果無(wú)影響。

s50.在指定維度組合之外的對(duì)象數(shù)據(jù)中選擇數(shù)據(jù)對(duì)指定維度組合進(jìn)行補(bǔ)償。以得到完成補(bǔ)償?shù)闹付ňS度組合。在具體的實(shí)施例中,在確認(rèn)指定維度組合數(shù)據(jù)缺失后,可以從指定維度組合之外的對(duì)象數(shù)據(jù)中選擇該缺失數(shù)據(jù)的指定維度組合需要的數(shù)據(jù)對(duì)該指定組合進(jìn)行補(bǔ)償,由于之前的映射關(guān)系已經(jīng)確定,選擇數(shù)據(jù)需要從已經(jīng)獲取的對(duì)象數(shù)據(jù)中選擇,選擇的數(shù)據(jù)可以是該指定組合缺失的數(shù)據(jù),也可以是當(dāng)選擇的數(shù)據(jù)對(duì)該指定維度組合的結(jié)論判決結(jié)果有幫助的數(shù)據(jù)。

下面將結(jié)合圖2詳細(xì)的介紹確定數(shù)據(jù)缺失的過(guò)程:

s31.通過(guò)訓(xùn)練數(shù)據(jù)得到各個(gè)維度組合與對(duì)應(yīng)的各個(gè)預(yù)設(shè)結(jié)論判決結(jié)果之間的映射關(guān)系的集合。在具體的實(shí)施例中,每個(gè)維度組合與預(yù)設(shè)結(jié)論判決結(jié)果之間都存在這一個(gè)映射關(guān)系,該映射關(guān)系可以為:多個(gè)維度組合與對(duì)應(yīng)的多個(gè)預(yù)設(shè)結(jié)論判決結(jié)果之間的映射關(guān)系可以組合成一個(gè)映射關(guān)系集合,例如映射關(guān)系集合可以表示為:

其中f為映射關(guān)系集合。

s32.獲取各個(gè)維度組合中的數(shù)據(jù)在映射關(guān)系集合中的第一概率。在具體的實(shí)施例中,分別統(tǒng)計(jì)各個(gè)維度組合中的數(shù)據(jù)在所有的映射關(guān)系中所占的概率,例如在映射關(guān)系的集合中的概率為可以由以下公式表示:

其中,第一項(xiàng)表示數(shù)據(jù)ni在當(dāng)前映射關(guān)系fj下所有數(shù)據(jù)nk中的出現(xiàn)頻率。第二項(xiàng)表示在所有的映射集合f中,包含有數(shù)據(jù)ni的映射概率。

但是,在實(shí)際情況中,由于有數(shù)據(jù)的缺失,數(shù)據(jù)的缺失可能會(huì)對(duì)結(jié)論判決結(jié)果有影響,因而出現(xiàn)數(shù)據(jù)的概率會(huì)被抑制,所以,第一概率會(huì)變?yōu)?imgfile="bda0001143054710000095.gif"wi="158"he="55"img-content="drawing"img-format="gif"orientation="portrait"inline="no"/>其中,α為概率抑制系數(shù),α<1。

s33.通過(guò)第一概率得到指定維度組合的第一數(shù)據(jù)缺失性。在具體的實(shí)施例中,數(shù)據(jù)在映射關(guān)系集合中的第一概率為可以根據(jù)統(tǒng)計(jì)學(xué)的計(jì)算公式得到該數(shù)據(jù)的缺失性,例如,缺失性計(jì)算公式可以由如下公式表示:

其中h為數(shù)據(jù)缺失性。

如果當(dāng)前數(shù)據(jù)缺失性h大于預(yù)設(shè)閾值,則可以確認(rèn)數(shù)據(jù)缺失。

在可選的實(shí)施例中,對(duì)有數(shù)據(jù)缺失性的指定維度組合進(jìn)行補(bǔ)償?shù)姆椒?,如圖3所示,可以包括如下步驟:

s51a.在指定維度組合之外的對(duì)象數(shù)據(jù)中選擇指定維度組合需要的任意可用數(shù)據(jù)對(duì)指定維度組合進(jìn)行補(bǔ)償,得到多個(gè)預(yù)補(bǔ)償?shù)闹付ňS度組合。在具體的實(shí)施例中,現(xiàn)在指定維度組合之外的對(duì)象數(shù)據(jù)中選擇能夠?qū)υ撝付ńM合結(jié)論判決結(jié)果有幫助的數(shù)據(jù)補(bǔ)入該有數(shù)據(jù)缺失的指定維度組合中,可以生成多個(gè)預(yù)補(bǔ)償?shù)闹付ňS度組合。

s52a.根據(jù)多個(gè)預(yù)補(bǔ)償?shù)闹付ňS度組合和與指定維度組合對(duì)應(yīng)的預(yù)設(shè)結(jié)論判決結(jié)果得到第二數(shù)據(jù)缺失性。本實(shí)施例中所稱的第二數(shù)據(jù)缺失性用于表征與補(bǔ)償?shù)闹付ňS度組合的數(shù)據(jù)缺失對(duì)判決結(jié)果的影響。在本實(shí)施例中,得到第二數(shù)據(jù)缺失性的方法如上述實(shí)施例中步驟s31至步驟s33的方法,分別得到各個(gè)預(yù)補(bǔ)償?shù)闹付ňS度組合的第二數(shù)據(jù)缺失性。

s53a.根據(jù)第二數(shù)據(jù)缺失性對(duì)多個(gè)預(yù)補(bǔ)償?shù)闹付ňS度組合進(jìn)行排序。在具體的實(shí)施例中,可以以各個(gè)預(yù)補(bǔ)償?shù)闹付ňS度組合的數(shù)據(jù)缺失性的大小,對(duì)各個(gè)預(yù)補(bǔ)償?shù)闹付ňS度組合進(jìn)行排序。

s54a.選擇第二數(shù)據(jù)缺失性最小的預(yù)補(bǔ)償?shù)闹付ňS度組合作為完成補(bǔ)償?shù)闹付ňS度組合。

在可選的實(shí)施例中,在本實(shí)施例中還提供了另一種對(duì)有數(shù)據(jù)缺失性的指定維度組合進(jìn)行補(bǔ)償?shù)姆椒?,如圖4所示,包括如下步驟:

s51b.在指定維度組合之外的對(duì)象數(shù)據(jù)中選擇指定維度組合需要的任意可用數(shù)據(jù)。具體選擇方法參見(jiàn)上述實(shí)施例步驟s51a。

s52b.獲取可用數(shù)據(jù)在映射關(guān)系集合中的第二概率。具體獲取第二概率的方法參見(jiàn)上述實(shí)施例步驟s32。

s53b.選擇第二概率最高的可用數(shù)據(jù)對(duì)當(dāng)指定維度組合進(jìn)行補(bǔ)償,作為完成補(bǔ)償?shù)闹付ňS度組合。在本實(shí)施例中,可以選擇排序靠前可用數(shù)據(jù)對(duì)指定位置組合進(jìn)行補(bǔ)償。

為保證補(bǔ)償后數(shù)據(jù)后的指定維度組合可用,還需對(duì)完成補(bǔ)償?shù)闹付ňS度組合進(jìn)行數(shù)據(jù)缺失性驗(yàn)證,如圖5所示,對(duì)完成補(bǔ)償?shù)闹付ňS度組合進(jìn)行數(shù)據(jù)缺失性驗(yàn)證的方法包括如下步驟:

s60.根據(jù)完成補(bǔ)償?shù)闹付ňS度組合與指定維度組合對(duì)應(yīng)的預(yù)設(shè)結(jié)論判決結(jié)果得到第三數(shù)據(jù)缺失性。第三數(shù)據(jù)缺失性用于表征完成補(bǔ)償?shù)闹付ňS度組合的數(shù)據(jù)缺失對(duì)判決結(jié)果的影響程度。第三數(shù)據(jù)缺失得到的方法參見(jiàn)上述步驟s30。

s70.判斷第三數(shù)據(jù)的缺失性是否大于預(yù)設(shè)閾值。如果第三數(shù)據(jù)缺失性大于預(yù)設(shè)閾值,則返回步驟步s50繼續(xù)對(duì)指定維度組合進(jìn)行補(bǔ)償。如果第三數(shù)據(jù)缺失性小于預(yù)設(shè)閾值,則完成數(shù)據(jù)補(bǔ)償。

為便于本領(lǐng)域技術(shù)人員理解,本實(shí)施例還可選的示例了上述方法的一種應(yīng)用,以對(duì)象數(shù)據(jù)是預(yù)存的病人癥狀信息的集合;各個(gè)維度組合中的指定維度組合是獲取的特定癥狀信息組合為例進(jìn)行說(shuō)明??梢灶A(yù)先對(duì)對(duì)象數(shù)據(jù)(癥狀信息的集合)進(jìn)行訓(xùn)練,得到各個(gè)維度組合(各個(gè)癥狀信息組合)與各種預(yù)設(shè)結(jié)論判決結(jié)果(預(yù)設(shè)診斷結(jié)果)的映射關(guān)系。具體地,在對(duì)對(duì)對(duì)象數(shù)據(jù)(癥狀信息的集合)進(jìn)行訓(xùn)練時(shí),可以采用離線的方式。而后采用上述實(shí)施例公開(kāi)的數(shù)據(jù)缺失的補(bǔ)償方法確定特定癥狀信息組合的缺失性、對(duì)數(shù)據(jù)進(jìn)行針對(duì)性的補(bǔ)償。例如:如果存在數(shù)據(jù)缺失,則表明癥狀信息存在缺失,則需要繼續(xù)獲取病人的癥狀信息,以補(bǔ)償缺失的特定癥狀信息;而后,判斷補(bǔ)償后的特定癥狀信息組合對(duì)應(yīng)的結(jié)論是否符合對(duì)應(yīng)的映射關(guān)系下的預(yù)設(shè)診斷結(jié)果,如果符合預(yù)設(shè)診斷結(jié)果,則表明補(bǔ)償后的特定癥狀信息組合不存在缺失性,或缺失性在可接受誤差范圍內(nèi),可以通過(guò)特定癥狀信息組合得到預(yù)設(shè)診斷結(jié)果。

本發(fā)明實(shí)施例還提供了一種數(shù)據(jù)缺失的補(bǔ)償裝置,如圖6所示,該裝置包括:

第一獲取單元100,用于獲取用于表征對(duì)象信息的對(duì)象數(shù)據(jù),對(duì)象數(shù)據(jù)為多維度數(shù)據(jù)或多模態(tài)數(shù)據(jù);第二獲取單元200,用于獲取與對(duì)象數(shù)據(jù)中的各個(gè)維度組合映射的各個(gè)預(yù)設(shè)結(jié)論判決結(jié)果;第一數(shù)據(jù)缺失性得到單元300,用于據(jù)各個(gè)維度組合和各個(gè)預(yù)設(shè)結(jié)論判決結(jié)果的映射關(guān)系得到各個(gè)維度組合中指定維度組合的第一數(shù)據(jù)缺失性,第一數(shù)據(jù)缺失性用于表征指定維度組合的數(shù)據(jù)缺失對(duì)判決結(jié)果的影響程度;第一判斷單元400,用于判斷第一數(shù)據(jù)缺失性是否大于預(yù)設(shè)閾值;補(bǔ)償單元500,用于如果第一數(shù)據(jù)缺失性大于預(yù)設(shè)閾值,則在指定維度組合之外的對(duì)象數(shù)據(jù)中選擇數(shù)據(jù)對(duì)指定維度組合進(jìn)行補(bǔ)償,以得到完成補(bǔ)償?shù)闹付ňS度組合。

在可選的實(shí)施例中,第一數(shù)據(jù)缺失性得到單元300,包括:訓(xùn)練數(shù)據(jù)子單元,用于通過(guò)訓(xùn)練數(shù)據(jù)得到各個(gè)維度組合與對(duì)應(yīng)的各個(gè)預(yù)設(shè)結(jié)論判決結(jié)果之間的映射關(guān)系的集合;第一獲取子單元,用于獲取各個(gè)維度組合中的數(shù)據(jù)在映射關(guān)系集合中的第一概率;第一缺失性得到子單元,用于通過(guò)第一概率得到指定維度組合的第一數(shù)據(jù)缺失性。

在可選的實(shí)施例中,補(bǔ)償單元500可以包括:預(yù)補(bǔ)償子單元,用于在指定維度組合之外的對(duì)象數(shù)據(jù)中選擇指定維度組合需要的任意可用數(shù)據(jù),對(duì)指定維度組合進(jìn)行補(bǔ)償,得到多個(gè)預(yù)補(bǔ)償?shù)闹付ňS度組合;第二數(shù)據(jù)缺失性子單元,用于根據(jù)多個(gè)預(yù)補(bǔ)償?shù)闹付ňS度組合和與指定維度組合對(duì)應(yīng)的預(yù)設(shè)結(jié)論判決結(jié)果得到第二數(shù)據(jù)缺失性;第二數(shù)據(jù)缺失性用于表征多個(gè)與補(bǔ)償?shù)闹付ňS度組合的數(shù)據(jù)缺失對(duì)判決結(jié)果的影響;第一排序子單元,用于根據(jù)第二數(shù)據(jù)缺失性對(duì)多個(gè)預(yù)補(bǔ)償?shù)闹付ňS度組合排序;第一選擇子單元,用于選擇第二數(shù)據(jù)缺失性最小的預(yù)補(bǔ)償?shù)闹付ňS度組合作為完成補(bǔ)償?shù)闹付ňS度組合。

在可選的實(shí)施例中,補(bǔ)償單元500還可以包括:第二選擇子單元,用于在指定維度組合之外的對(duì)象數(shù)據(jù)中選擇指定維度組合需要的任意可用數(shù)據(jù);第二獲取子單元,用于獲取可用數(shù)據(jù)在映射關(guān)系集合中的第二概率;第二排序子單元,用于根據(jù)第二概率對(duì)可用的數(shù)據(jù)進(jìn)行排序;第三選擇子單元,用于選擇概率最高的可用的數(shù)據(jù)對(duì)指定維度組合進(jìn)行補(bǔ)償作為完成補(bǔ)償?shù)闹付ňS度組合。

在可選的實(shí)施例中,數(shù)據(jù)缺失的補(bǔ)償裝置還包括:第二數(shù)據(jù)缺失性得到單元,用于根據(jù)完成補(bǔ)償?shù)闹付ňS度組合和與指定維度組合對(duì)應(yīng)的預(yù)設(shè)結(jié)論判決結(jié)果得到第三數(shù)據(jù)缺失性;第三數(shù)據(jù)缺失性用于表征完成補(bǔ)償?shù)闹付ňS度組合的數(shù)據(jù)缺失對(duì)判決結(jié)果的影響程度;第二判斷單元,用于判斷第三數(shù)據(jù)缺失性是否大于預(yù)設(shè)閾值;返回單元,用于如果第三數(shù)據(jù)缺失性大于預(yù)設(shè)閾值,則返回在指定維度組合之外的對(duì)象數(shù)據(jù)中選擇數(shù)據(jù)對(duì)指定維度組合進(jìn)行補(bǔ)償,以得到完成補(bǔ)償?shù)闹付ňS度組合。

本實(shí)施例公開(kāi)的數(shù)據(jù)缺失的補(bǔ)償方法和裝置,通過(guò)獲取用于表征對(duì)象信息的對(duì)象數(shù)據(jù),對(duì)象數(shù)據(jù)為多維度數(shù)據(jù);獲取與對(duì)象數(shù)據(jù)中的各個(gè)維度組合映射的各個(gè)預(yù)設(shè)結(jié)論判決結(jié)果;根據(jù)各個(gè)維度組合和各個(gè)預(yù)設(shè)結(jié)論判決結(jié)果的映射關(guān)系得到各個(gè)維度組合中指定維度組合的第一數(shù)據(jù)缺失性,第一數(shù)據(jù)缺失性用于表征指定維度組合的數(shù)據(jù)缺失對(duì)判決結(jié)果的影響程度;判斷第一數(shù)據(jù)缺失性是否大于預(yù)設(shè)閾值;如果第一數(shù)據(jù)缺失性大于預(yù)設(shè)閾值,則在指定維度組合之外的對(duì)象數(shù)據(jù)中選擇數(shù)據(jù)對(duì)指定維度組合進(jìn)行補(bǔ)償,以得到完成補(bǔ)償?shù)闹付ňS度組合,從而,可以根據(jù)獲取的對(duì)象數(shù)據(jù)和存在的預(yù)設(shè)結(jié)論判決結(jié)果的映射關(guān)系確定數(shù)據(jù)的缺失性,然后在對(duì)象數(shù)據(jù)中選擇數(shù)據(jù)對(duì)缺失的維度組合進(jìn)行針對(duì)性的增值補(bǔ)償,進(jìn)而,可以完成在數(shù)據(jù)缺失不確定的情況下對(duì)數(shù)據(jù)進(jìn)行針對(duì)性的補(bǔ)償,以便在較短的時(shí)間內(nèi)獲得相應(yīng)的結(jié)論判決結(jié)果。

雖然結(jié)合附圖描述了本發(fā)明的實(shí)施方式,但是本領(lǐng)域技術(shù)人員可以在不脫離本發(fā)明的精神和范圍的情況下作出各種修改和變型,這樣的修改和變型均落入由所附權(quán)利要求所限定的范圍之內(nèi)。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
禄劝| 铜梁县| 连南| 镇远县| 桂阳县| 南安市| 东平县| 龙胜| 庆阳市| 安徽省| 剑阁县| 特克斯县| 长治县| 容城县| 顺昌县| 双峰县| 潼关县| 临漳县| 贵溪市| 赤壁市| 大邑县| 黄平县| 钟山县| 新龙县| 神木县| 礼泉县| 南郑县| 宝鸡市| 黔江区| 永修县| 海安县| 宿迁市| 双辽市| 图木舒克市| 苏尼特右旗| 安阳市| 沁源县| 建始县| 江阴市| 哈密市| 乐昌市|