本公開涉及計算機技術,特別涉及一種對象選擇方法和裝置。
背景技術:
很多應用場景中都涉及到由眾多對象中選擇出特定的目標對象,比如,在駕駛員征信系統(tǒng)中,可以根據(jù)駕駛員的多方面因素,比如違法次數(shù)、駕齡、從業(yè)時長等維度,對該駕駛員進行量化評分,分數(shù)越高表明其履職能力越高。當分數(shù)較低時表明該駕駛員存在“安全隱患”,可以被列入“駕駛員黑名單”,交警部門可以實時通報給聘用該駕駛員的企業(yè)并建議解聘,或者責令駕駛員進行學習教育。這樣可以從源頭上管理存在安全隱患的駕駛人,保證道路行駛安全,并且這樣也可以使得駕駛員自覺減少違法行為。
現(xiàn)有技術中,對象選擇的方法可以有很多,仍以上述駕駛員征信系統(tǒng)為例,可以主要使用諸如違法次數(shù)、駕齡等連續(xù)型變量,作為判斷駕駛員履職能力的依據(jù)。但是這種方法在對象的評定和選擇方面不太科學,可能導致選擇的對象不符合要求,比如,有的駕駛員本來沒有安全隱患卻被列入黑名單。
技術實現(xiàn)要素:
有鑒于此,本公開提供一種對象選擇方法和裝置,以提高對象選擇的科學性。
具體地,本公開是通過如下技術方案實現(xiàn)的:
第一方面,提供一種對象選擇方法,所述方法包括:
獲取對象的對象參數(shù),所述對象參數(shù)包括:字符型變量和連續(xù)型變量;
對所述字符型變量和連續(xù)型變量,均按照預定量化方式進行量化處理,得到所述對象對應的量化值;
若所述量化值達到預定的目標對象的數(shù)值范圍,則選擇所述對象作為所述目標對象。
第二方面,提供一種對象選擇裝置,所述裝置包括:
參數(shù)獲取模塊,用于獲取對象的對象參數(shù),所述對象參數(shù)包括:字符型變量和連續(xù)型變量;
量化處理模塊,用于對所述字符型變量和連續(xù)型變量,均按照預定量化方式進行量化處理,得到所述對象對應的量化值;
對象選擇模塊,用于在所述量化值達到預定的目標對象的數(shù)值范圍時,則選擇所述對象作為所述目標對象。
第三方面,提供一種機動車駕駛員的駕駛數(shù)據(jù)處理方法,所述方法包括:
分別在駕駛數(shù)據(jù)中的每一個變量類型下,獲取第一比值和第二比值,所述第一比值是所述變量類型下的駕駛員的壞樣本的數(shù)量與所有壞樣本總數(shù)量的比值,第二比值是所述變量類型下的駕駛員的好樣本的數(shù)量與所有好樣本總數(shù)量的比值;所述駕駛數(shù)據(jù)包括:字符型變量和連續(xù)型變量,且所述字符型變量和連續(xù)型變量分別包括至少一個變量類型;
根據(jù)所述第一比值和第二比值,分別得到每一個變量類型下的子量化值;
根據(jù)各個變量類型下的子量化值,得到駕駛員對應的量化值。
本公開的對象選擇方法和裝置,通過將連續(xù)型變量和字符型變量都納入對駕駛員的量化,這種多方面因素的綜合考慮,將使得對駕駛員的評估更加科學,從而也可以提高對象選擇的科學性。
附圖說明
圖1是本公開實施例提供的對象選擇方法的流程圖;
圖2是本公開實施例提供的另一種對象選擇方法的處理流程圖;
圖3是本公開實施例提供的一種對象選擇裝置的結構示意圖;
圖4是本公開實施例提供的另一種對象選擇裝置的結構示意圖。
具體實施方式
對一個對象進行量化的評估,是很多應用場景中都涉及到的一個問題。
例如,在駕駛員征信系統(tǒng)中,可以根據(jù)駕駛員的多方面因素,比如違法次數(shù)、駕齡等,對該駕駛員進行量化評分,以評估該駕駛員的履職能力,是否適合駕駛某種車輛,并且可以根據(jù)評估結果對該駕駛員進行教育或解聘。
以駕駛員征信系統(tǒng)為例,據(jù)以考量駕駛員的多方面因素可以包括如下表1所示的參數(shù),但是下面的幾個參數(shù)只是舉例,實際實施中并不局限于此:
表1駕駛員參數(shù)
在上述表1中,駕駛員標識可以是用于唯一標識一個駕駛員的id,活動區(qū)域表示該駕駛員經(jīng)常駕駛車輛在哪個區(qū)域活動,比如表1示例的貴陽、黔東南,還可以有更多的其他區(qū)域;如果駕駛員在某一區(qū)域活動,可以將表1中對應該區(qū)域的位置記為“1”,否則可以記為“0”(一種示例性的標記方式)。其中的違法內(nèi)容可以包括多種類型的違法,比如,醉酒駕駛、駕駛無牌無證車輛、不按規(guī)定停車等,每一種類型的違法都可以用一個對應的違法代碼表示,如果駕駛員觸發(fā)了某種違法類型,則可以將對應的表1中的位置標記為“1”。在表1中,一個駕駛員對應的一行數(shù)據(jù)可以稱為該駕駛員的一個樣本,例如上述的{s1、5、1、0、1、0}是駕駛員s1的一個樣本數(shù)據(jù);同一個駕駛員在表1中可以有多個樣本。
本公開的例子中,可以將駕駛員參數(shù)分為如下兩種類型:
連續(xù)型變量:連續(xù)型變量是一種可以具有連續(xù)取值的變量,例如,“駕齡”即為一種連續(xù)型變量,駕齡的取值可以包括“2、2.5、3、3.5、4……”等各個取值。
字符型變量:字符型變量是一種可以具有離散取值的變量,例如,以表1中的活動區(qū)域為例,該“活動區(qū)域”的取值可以包括“貴陽、黔東南”等多個離散值;“違法內(nèi)容”也可以包括“a、b”等多個離散的違法類型。
圖1示例了本公開例子的對象選擇方法的流程,以上述的駕駛員征信系統(tǒng)為例,通過該方法可以對各個駕駛員進行量化評估,并根據(jù)評估結果由多個駕駛員中選擇出滿足特定條件的駕駛員。在本例子中,對象即為“駕駛員”。
在步驟101中,獲取對象的對象參數(shù),所述對象參數(shù)包括:字符型變量和連續(xù)型變量。
本例子中,對象參數(shù)即用于作為量化評估對象的依據(jù),不論是字符型變量或者連續(xù)型變量,都將用以量化評估對象。比如,在駕駛員參數(shù)中,可以將駕齡、活動區(qū)域、違法內(nèi)容等各種類型的變量,都用于后續(xù)步驟對駕駛員的量化中。在傳統(tǒng)處理方式中,通常是按照連續(xù)型變量進行量化,造成對駕駛員的評估不太準確,本例子通過將連續(xù)型變量和字符型變量都納入對駕駛員的量化,將使得對駕駛員的評估更加準確。
在步驟102中,對所述字符型變量和連續(xù)型變量,均按照預定量化方式進行量化處理,得到所述對象對應的量化值。
本步驟中,字符型變量和連續(xù)型變量都可以進行量化,并且這些變量的量化方式可以相同,均按照預定的量化方式進行量化處理。這樣將駕駛員的各種類型的變量參數(shù)都參與量化,就可以使得各個駕駛員都可以按照統(tǒng)一的方式進行量化評估,保證各駕駛員之間的量化比較更加公平。
在步驟103中,若所述量化值達到預定的目標對象的數(shù)值范圍,則選擇所述對象作為所述目標對象。
本步驟可以根據(jù)對象的量化值,判斷該對象是否是所需要的目標對象;可以預先設定目標對象的數(shù)值范圍,若步驟102得到的量化值在該范圍內(nèi),則可以確定該對象是目標對象。例如,在駕駛員征信系統(tǒng)中,如果目的是要選擇出具有安全隱患的駕駛員,可以將具有安全隱患的駕駛員稱為黑名單對象,并設定黑名單對象的數(shù)值范圍,該數(shù)值范圍可以是量化值l1~量化值l2,其中數(shù)值范圍的最大值l2,如果一個駕駛員評估的量化值>wl2,此處w的取值接近于1,例如w=0.9,則可以確定該駕駛員的屬性更偏向于黑名單對象。需要說明的是,在得到對象的量化值后,如何根據(jù)量化值選擇目標對象可以自主設定,本例子不做限制,上述只是一個舉例。
本公開例子中提供的對象選擇方法,通過將連續(xù)型變量和字符型變量都納入對駕駛員的量化,這種多方面因素的綜合考慮,將使得對駕駛員的評估更加科學,從而也可以提高對象選擇的科學性。
在另一個例子中,還可以對對象參數(shù)中的字符型變量進行細化,劃分為第一類字符變量和第二類字符變量。其中,第一類字符變量包括的變量類型的數(shù)量小于預定數(shù)量,而字符型變量中所述第一類字符變量之外的變量,為第二類字符變量。
例如,以駕駛員參數(shù)中的“活動區(qū)域”為例,一般每個省市的活動區(qū)域通常都少于20個,如果將活動區(qū)域稱為第一類字符變量,其中包括的例如貴陽、黔東南等區(qū)域稱為變量類型,那么該第一類字符變量中包括的變量類型的數(shù)量是有限的,比如上述的少于20個。在具體實施中,可以為變量類型設定一個預定數(shù)量,如果某一字符變量包括的變量類型的數(shù)量小于該預定數(shù)量,則可以將該字符變量歸為第一類字符變量;否則,如果字符變量包括的變量類型的數(shù)量大于等于預定數(shù)量,則可以將該字符變量歸為第二類字符變量。比如,字符變量“違法內(nèi)容”中所包括的違法類型數(shù)量較多,可以作為第二類字符變量。
此外,不論第一類字符變量還是第二類字符變量,都可以包括多個,例如上述的“活動區(qū)域”是其中一種第一類字符變量,還可以包括其他的第一類字符變量;同樣,上述的“違法內(nèi)容”是其中一種第二類字符變量,還可以包括其他變量。并且,第一類字符變量不僅包括的變量類型的數(shù)量相對較少,每個變量類型下的變量取值的數(shù)量也通常會大于一定數(shù)量,比如,貴陽、黔東南等區(qū)域?qū)儆谧兞款愋?,在每個變量類型比如“貴陽”下,可能有很多駕駛員的樣本,樣本數(shù)量較多;而第二類字符變量不僅包括的變量類型的數(shù)量相對較多,每個變量類型下的變量取值的數(shù)量也通常較少,有些變量類型下的取值可能會缺失,比如在違法代碼b下可能不存在駕駛員樣本,即沒有駕駛員犯此類錯誤。
圖2示例了另一種對象選擇方法的處理流程,該方法中可以根據(jù)上述更加細化的參數(shù)分類對駕駛員進行量化評估,以對其中一個駕駛員的評估為例,該方法可以包括如下步驟,但具體實施中并不局限于如下執(zhí)行順序:
在步驟201中,分別在每一個變量類型下,獲取第一比值和第二比值。
以其中一個駕駛員為例,該駕駛員的參數(shù)包括很多類型的變量,比如表1所示的部分變量;本例子中,可以將連續(xù)型變量、第一類字符變量、第二類字符變量中的每一個變量類型都稱為一個“水平值”,比如在表1中,“駕齡”是一個水平值,“貴陽”是一個水平值,“黔東南”是一個水平值,“違法代碼a”是一個水平值,“違法代碼b”是一個水平值。
本步驟中,可以分別在每一個水平值下,計算該駕駛員的第一比值和第二比值。其中,第一比值是駕駛員的壞樣本的數(shù)量與所有壞樣本總數(shù)量的比值,第二比值是駕駛員的好樣本的數(shù)量與所有好樣本總數(shù)量的比值。
以“貴陽”為例,本例子中正在評估的該駕駛員在“貴陽”水平值下,可能有多個樣本,比如表1中的s1就包括兩個樣本,統(tǒng)計該駕駛員在“貴陽”下的好樣本數(shù)量和壞樣本數(shù)量,其中,“好樣本”是未發(fā)生事故的樣本,“壞樣本”是發(fā)生了事故的樣本;還需要統(tǒng)計“貴陽”水平值下的所有好樣本數(shù)量和所有壞樣本數(shù)量(即貴陽下所有用戶的好樣本和壞樣本)。
將駕駛員的壞樣本的數(shù)量與所有壞樣本總數(shù)量相比,得到第一比值。例如,
將駕駛員的好樣本的數(shù)量與所有好樣本總數(shù)量相比,得到第二比值。例如,
在步驟202中,根據(jù)所述第一比值和第二比值,分別得到每一個變量類型下的子量化值。
例如,可以根據(jù)步驟201中得到的兩個比值,計算對應一個水平值下的子量化值。示例性的一種方式可以是:
在步驟203中,將第一類字符變量下各個變量類型的子量化值求和得到第一字符量化值,將第二類字符變量下的各個變量類型的子量化值求和得到第二字符量化值,將連續(xù)型變量下的各個變量類型的子量化值求和得到連續(xù)型量化值。
例如,第一類字符變量下可以包括多個水平值,將每一個水平值i下計算的子量化值相加,可以得到第一字符量化值,比如,
在步驟204中,將所述第一字符量化值、第二字符量化值和連續(xù)型量化值求和,得到所述對象對應的量化值。
本步驟可以將上述步驟203中得到的第一字符量化值、第二字符量化值和連續(xù)型量化值求和,其中,在求和時可以設置這三方面因素各自的權重,第一字符量化值的權重可以高于第二字符量化值的權重。
例如,可以按照如下公式計算:
其中,scale即為對象對應的量化值,也是本例子所評估的駕駛員的量化分值。1-a可以是第一字符量化值的權重,a是第二字符量化值的權重。由于第一類字符變量的水平值較少且每個水平值的樣本較多,可以賦予較高的權重,而第二類字符變量的水平值太多,比如通常超過1000個,而且會在某些水平值下的樣本極度缺失,這樣的變量更適合賦予較小的權重。在一個例子中,可以設置α的數(shù)值小于0.1,這樣可以使得水平值不是太多的變量權重更大。
在步驟205中,若所述量化值達到預定的目標對象的數(shù)值范圍,則選擇所述對象作為所述目標對象。
本公開例子中提供的對象選擇方法,通過將連續(xù)型變量和字符型變量都納入對駕駛員的量化,這種多方面因素的綜合考慮,將使得對駕駛員的評估更加準確,從而也可以提高對象選擇的科學性;并且通過將字符型變量進行細化,使得考慮了不同類型變量因素在衡量對象量化方面的不同作用,進一步提高了對象量化和選擇的科學性。
結合上述的方法實施例,本公開例子中提供了一種機動車駕駛員的駕駛數(shù)據(jù)處理方法,該駕駛數(shù)據(jù)例如可以包括上述實施例中提及的字符型變量(例如,駕駛活動區(qū)域、違法內(nèi)容)和連續(xù)型變量(例如,駕齡),這里的駕駛數(shù)據(jù)處理可以是根據(jù)駕齡和違法內(nèi)容等變量對駕駛員進行評估。該方法例如可以應用于駕駛員征信系統(tǒng)。
該機動車駕駛員的駕駛數(shù)據(jù)處理方法可以包括如下處理,其中,如下處理步驟只做簡單說明,詳細的描述可以結合參見上面的方法實施例:
分別在駕駛數(shù)據(jù)中的每一個變量類型下,獲取第一比值和第二比值,所述第一比值是所述變量類型下的駕駛員的壞樣本的數(shù)量與所有壞樣本總數(shù)量的比值,第二比值是所述變量類型下的駕駛員的好樣本的數(shù)量與所有好樣本總數(shù)量的比值;
根據(jù)所述第一比值和第二比值,分別得到每一個變量類型下的子量化值;
根據(jù)各個變量類型下的子量化值,得到駕駛員對應的量化值。
這種機動車駕駛員的駕駛數(shù)據(jù)處理方法,由于將駕駛數(shù)據(jù)中的字符型變量和連續(xù)型變量都納入了對駕駛員的量化評估,因此可以更準確的評價駕駛員。
在另一個例子中,字符型變量可以進行細化,包括:第一類字符變量和第二類字符變量;所述第一類字符變量包括的變量類型的數(shù)量小于預定數(shù)量;所述字符型變量中所述第一類字符變量之外的變量,為第二類字符變量;所述第一類字符變量、第二類字符變量和連續(xù)型變量,分別包括多個所述變量類型。
該例子中,在根據(jù)各個變量類型下的子量化值,得到駕駛員對應的量化值時,具體可以包括:將所述第一類字符變量下各個變量類型的子量化值求和得到第一字符量化值,將所述第二類字符變量下的各個變量類型的子量化值求和得到第二字符量化值,將所述連續(xù)型變量下的各個變量類型的子量化值求和得到連續(xù)型量化值。將所述第一字符量化值、第二字符量化值和連續(xù)型量化值求和,得到所述駕駛員對應的量化值。
當然,在得到駕駛員對應的量化值之后,還可以進一步應用該量化值,比如,根據(jù)量化值選擇目標駕駛員,若所述量化值達到預定的目標駕駛員的數(shù)值范圍,則選擇所述駕駛員作為所述目標駕駛員。在不同的應用場景中,可以根據(jù)量化值選擇較好的駕駛員,也可以根據(jù)量化值選擇較差的駕駛員,并且如何根據(jù)量化值選擇也可以有多種設定方式,不做限制。
為了實現(xiàn)上述的對象選擇方法,本公開的例子中還提供了一種對象選擇裝置,如圖3所示,該對象選擇裝置可以包括:參數(shù)獲取模塊31、量化處理模塊32和對象選擇模塊33。
參數(shù)獲取模塊31,用于獲取對象的對象參數(shù),所述對象參數(shù)包括:字符型變量和連續(xù)型變量;
量化處理模塊32,用于對所述字符型變量和連續(xù)型變量,均按照預定量化方式進行量化處理,得到所述對象對應的量化值;
對象選擇模塊33,用于在所述量化值達到預定的目標對象的數(shù)值范圍時,則選擇所述對象作為所述目標對象。
在一個例子中,所述字符型變量,包括:第一類字符變量和第二類字符變量;所述第一類字符變量包括的變量類型的數(shù)量小于預定數(shù)量;所述字符型變量中所述第一類字符變量之外的變量,為第二類字符變量。
在一個例子中,如圖4所示,所述第一類字符變量、第二類字符變量和連續(xù)型變量,分別包括多個變量類型;所述量化處理模塊32,包括:
比值確定子模塊321,用于分別在每一個變量類型下,獲取第一比值和第二比值,所述第一比值是所述變量類型下的所述對象的壞樣本的數(shù)量與所有對象壞樣本總數(shù)量的比值,所述第二比值是所述變量類型下的所述對象的好樣本的數(shù)量與所有對象好樣本總數(shù)量的比值;
量化確定子模塊322,用于根據(jù)所述第一比值和第二比值,分別得到每一個變量類型下的子量化值;
求和處理子模塊323,用于將所述第一類字符變量下各個變量類型的子量化值求和得到第一字符量化值,將所述第二類字符變量下的各個變量類型的子量化值求和得到第二字符量化值,將所述連續(xù)型變量下的各個變量類型的子量化值求和得到連續(xù)型量化值;
量化結果子模塊324,用于將所述第一字符量化值、第二字符量化值和連續(xù)型量化值求和,得到所述對象對應的量化值。
在一個例子中,量化結果子模塊324,在用于將所述第一字符量化值、第二字符量化值和連續(xù)型量化值求和時,所述第一字符量化值的權重高于第二字符量化值的權重。
在一個例子中,對象選擇模塊33,具體用于若所述量化值小于預定的閾值,所述閾值為黑名單對象的數(shù)值范圍最大值,則選擇所述對象作為黑名單對象。
上述實施例闡明的裝置或模塊,具體可以由計算機芯片或?qū)嶓w實現(xiàn),或者由具有某種功能的產(chǎn)品來實現(xiàn)。一種典型的實現(xiàn)設備為計算機,計算機的具體形式可以是個人計算機、膝上型計算機、蜂窩電話、相機電話、智能電話、個人數(shù)字助理、媒體播放器、導航設備、電子郵件收發(fā)設備、游戲控制臺、平板計算機、可穿戴設備或者這些設備中的任意幾種設備的組合。
為了描述的方便,描述以上裝置時以功能分為各種模塊分別描述。當然,在實施本公開時可以把各模塊的功能在同一個或多個軟件和/或硬件中實現(xiàn)。
以上所述僅為本公開的較佳實施例而已,并不用以限制本公開,凡在本公開的精神和原則之內(nèi),所做的任何修改、等同替換、改進等,均應包含在本公開保護的范圍之內(nèi)。