本發(fā)明涉及信息處理技術(shù)領(lǐng)域,尤其涉及一種業(yè)務流程相關(guān)性的判別方法和裝置。
背景技術(shù):
業(yè)務流程是公司的重要資產(chǎn),對公司的運營和管理有著重要的作用。隨著公司規(guī)模的不斷擴大、管理日漸完善,越來越多的流程模型被創(chuàng)建,流程庫中所存儲的流程模型數(shù)據(jù)日益增多。例如,電信行業(yè)擁有大量的流程模型,包括查詢服務流程、充值繳費流程、業(yè)務辦理流程等。這些流程模型可以為企業(yè)提供競爭優(yōu)勢,但同時也對業(yè)務流程模型的管理帶來一定的困難。為了適應新的需求,公司的流程建模人員要對某個業(yè)務的處理流程進行重新設計,在將新的流程加入到流程庫之前,為了避免冗余,需要先把流程庫中的相關(guān)流程都找出來逐一進行比較。
檢索流程指的是要在流程庫中進行檢索的流程,相關(guān)流程指的是和檢索流程存在某種聯(lián)系的流程。一個檢索流程要在流程庫中找出與它相關(guān)的流程,需要確定檢索流程和流程庫中所有流程間的相關(guān)程度?,F(xiàn)有技術(shù)判斷兩個流程是否相關(guān)是通過度量兩個流程間的相似度來進行的,例如,給定一個閾值,相似度大于該閾值則兩個流程相關(guān),否則不相關(guān)?,F(xiàn)有的流程相關(guān)性的判別方法大多只考慮了一個維度,然而事實上流程間的相關(guān)程度需要從不同維度進行分析。并且,現(xiàn)有的流程相關(guān)性的判別方法在計算出檢索流程與流程庫中所有流程間的相似度后,將流程庫所有的流程按與檢索流程的相似度從高到低進行排序,通常僅提供前N個流程為該檢索流程的相關(guān)流程,而用戶有時需要獲取全部的相關(guān)流程與檢索流程的相關(guān)性。
技術(shù)實現(xiàn)要素:
有鑒于此,本發(fā)明要解決的一個技術(shù)問題是提供一種業(yè)務流程相關(guān)性的判別方法和裝置。
根據(jù)本發(fā)明的一個實施例,提供一種業(yè)務流程相關(guān)性的判別方法,包括:確定流程樣本,并確定用于度量流程間相關(guān)性的業(yè)務權(quán)重特征,其中,業(yè)務權(quán)重特征包括:結(jié)構(gòu)特征和行為關(guān)系特征;計算流程樣本和流程庫中的業(yè)務流程對于所述業(yè)務權(quán)重特征的關(guān)聯(lián)特征值;確定用于標識所述流程樣本和所述業(yè)務流程是否相似的關(guān)聯(lián)目標值;基于所述關(guān)聯(lián)特征值和所述關(guān)聯(lián)目標值生成分類訓練關(guān)系向量,根據(jù)所述分類訓練關(guān)系向量進行分類訓練獲得分類模型;基于所述分類模型判別新業(yè)務流程與所述業(yè)務流程的相關(guān)性。
可選地,所述流程樣本和所述業(yè)務流程為圖形化的業(yè)務流程模型,包括:節(jié)點、用于將所述節(jié)點連接并具有方向的邊;所述結(jié)構(gòu)特征包括:替換節(jié)點、刪除/插入節(jié)點、替換邊、刪除/插入邊;所述行為關(guān)系特征包括:順序關(guān)系、互斥關(guān)系、并發(fā)關(guān)系。
可選地,計算所述流程樣本和流程庫中的業(yè)務流程對于所述業(yè)務權(quán)重特征的關(guān)聯(lián)特征值包括:確定對于替換節(jié)點或刪除/插入節(jié)點的關(guān)聯(lián)特征值fv1=(|f1(Process1,Process2)|)/(|Node(Process 1)∪Node(Process2)|);其中,Process1為所述流程樣本,Process2為所述業(yè)務流程,f1(Process 1,Process 2)為Process1和Process2中相同的替換節(jié)點或刪除/插入節(jié)點的集合的元素個數(shù),Node(Process 1)為Process 1中的所有節(jié)點的集合的元素個數(shù),Node(Process 2)為Process 2中的所有節(jié)點的集合中的元素個數(shù),0≤fv1≤1。
可選地,計算所述流程樣本和流程庫中的業(yè)務流程對于所述業(yè)務權(quán)重特征的關(guān)聯(lián)特征值包括:確定對于替換邊或刪除/插入邊的關(guān)聯(lián)特征值fv2=(|f2(Process 1,Process2)|)/(|Edge(Process1)∪Edge(Process2)|);其中,Process1為所述流程樣本,Process2為所述業(yè)務流程,f2(Process 1,Process 2)為Process1和Process2中相同的替換邊或刪除/插入邊的集合的元素個數(shù),Edge(Process 1)為Process 1中的所有邊的集合的元素個數(shù),Edge(Process 2)為Process 2中的所有邊的集合的元素個數(shù),0≤fv2≤1。
可選地,計算所述流程樣本和流程庫中的業(yè)務流程對于所述業(yè)務權(quán)重特征的關(guān)聯(lián)特征值包括:確定對于順序關(guān)系、互斥關(guān)系或并發(fā)關(guān)系的關(guān)聯(lián)特征值fv3=(|f3(Process 1)∩f3(Process 2)|)/(|f3(Process1)∪f3(Process 2)|);其中,Process1為所述流程樣本,Process2為所述業(yè)務流程,f3(Process 1)為Process 1中的順序關(guān)系、互斥關(guān)系或并發(fā)關(guān)系的集合的元素個數(shù),Edge(Process 2)為Process 2中的順序關(guān)系、互斥關(guān)系或并發(fā)關(guān)系的集合的元素個數(shù),0≤fv3≤1。
可選地,基于所述關(guān)聯(lián)特征值和所述關(guān)聯(lián)目標值生成分類訓練關(guān)系向量包括:設置流程樣本集,計算所述流程樣本集中的每個流程樣本分別與業(yè)務流程庫中的每個業(yè)務流程對于各個所述業(yè)務權(quán)重特征的關(guān)聯(lián)特征值;確定每個流程樣本分別與每個業(yè)務流程的關(guān)聯(lián)目標值;生成每個流程樣本分別與所述每個業(yè)務流程的所述分類訓練關(guān)系向量,其中所述分類訓練關(guān)系向量的元素包括:所述關(guān)聯(lián)特征值、所述關(guān)聯(lián)目標值。
可選地,通過所述分類模型判別新業(yè)務流程與所述業(yè)務流程的相關(guān)性包括:通過分類模型獲取所述新業(yè)務流程與所述業(yè)務流程集中的每個業(yè)務流程的關(guān)聯(lián)值,基于所述關(guān)聯(lián)值判斷是否相關(guān)。
可選地,所述圖形化的業(yè)務流程模型包括:Petri網(wǎng)模型;所述關(guān)聯(lián)目標值為1或0,其中,1表明相關(guān)聯(lián),或0表明非關(guān)聯(lián)。
根據(jù)本發(fā)明的另一方面,提供一種業(yè)務流程相關(guān)性的判別裝置,包括:樣本設置模塊,用于確定流程樣本;特征確定模塊,用于確定用于度量流程間相關(guān)性的業(yè)務權(quán)重特征,其中,所述業(yè)務權(quán)重特征包括:結(jié)構(gòu)特征和行為關(guān)系特征;特征值計算模塊,用于計算所述流程樣本和流程庫中的業(yè)務流程對于所述業(yè)務權(quán)重特征的關(guān)聯(lián)特征值;目標值確定模塊,用于確定用于標識所述流程樣本和所述業(yè)務流程是否相似的關(guān)聯(lián)目標值;模型訓練模塊,用于基于所述關(guān)聯(lián)特征值和所述關(guān)聯(lián)目標值生成分類訓練關(guān)系向量,根據(jù)所述分類訓練關(guān)系向量進行分類訓練獲得分類模型;關(guān)聯(lián)判別模塊,用于基于所述分類模型判別新業(yè)務流程與所述業(yè)務流程的相關(guān)性。
可選地,所述流程樣本和所述業(yè)務流程為圖形化的業(yè)務流程模型,包括:節(jié)點、用于將所述節(jié)點連接并具有方向的邊;所述結(jié)構(gòu)特征包括:替換節(jié)點、刪除/插入節(jié)點、替換邊、刪除/插入邊;所述行為關(guān)系特征包括:順序關(guān)系、互斥關(guān)系、并發(fā)關(guān)系。
可選地,所述特征值計算模塊,還用于確定對于替換節(jié)點或刪除/插入節(jié)點的關(guān)聯(lián)特征值fv1=(|f1(Process1,Process2)|)/(|Node(Process1)∪Node(Process 2)|);其中,Process1為所述流程樣本,Process2為所述業(yè)務流程,f1(Process 1,Process 2)為Process1和Process2中相同的替換節(jié)點或刪除/插入節(jié)點的集合的元素個數(shù),Node(Process 1)為Process1中的所有節(jié)點的集合的元素個數(shù),Node(Process 2)為Process 2中的所有節(jié)點的集合中的元素個數(shù),0≤fv1≤1。
可選地,所述特征值計算模塊,還用于確定對于替換邊或刪除/插入邊的關(guān)聯(lián)特征值fv2=(|f2(Process 1,Process2)|)/(|Edge(Process1)∪Edge(Process 2)|);其中,Process1為所述流程樣本,Process2為所述業(yè)務流程,f2(Process 1,Process 2)為Process1和Process2中相同的替換邊或刪除/插入邊的集合的元素個數(shù),Edge(Process 1)為Process 1中的所有邊的集合的元素個數(shù),Edge(Process 2)為Process 2中的所有邊的集合的元素個數(shù),0≤fv2≤1。
可選地,所述特征值計算模塊,還用于確定對于順序關(guān)系、互斥關(guān)系或并發(fā)關(guān)系的關(guān)聯(lián)特征fv3=(|f3(Process 1)∩f3(Process 2)|)/(|f3(Process 1)∪f3(Process 2)|);其中,Process1為所述流程樣本,Process2為所述業(yè)務流程,f3(Process 1)為Process 1中的順序關(guān)系、互斥關(guān)系或并發(fā)關(guān)系的集合的元素個數(shù),Edge(Process 2)為Process 2中的順序關(guān)系、互斥關(guān)系或并發(fā)關(guān)系的集合的元素個數(shù),0≤fv3≤1。
可選地,所述樣本設置模塊,還用于設置流程樣本集;所述特征值計算模塊,用于計算所述流程樣本集中的每個流程樣本分別與業(yè)務流程庫中的每個業(yè)務流程對于各個所述業(yè)務權(quán)重特征的關(guān)聯(lián)特征值;所述模型訓練模塊,用于確定每個流程樣本分別與每個業(yè)務流程的關(guān)聯(lián)目標值;生成每個流程樣本分別與所述每個業(yè)務流程的所述分類訓練關(guān)系向量,其中所述分類訓練關(guān)系向量的元素包括:所述關(guān)聯(lián)特征值、所述關(guān)聯(lián)目標值。
可選地,所述關(guān)聯(lián)判別模塊,還用于通過分類模型獲取所述新業(yè)務流程與所述業(yè)務流程集中的每個業(yè)務流程的關(guān)聯(lián)值,基于所述關(guān)聯(lián)值判斷是否相關(guān)。
可選地,所述圖形化的業(yè)務流程模型包括:Petri網(wǎng)模型;所述關(guān)聯(lián)目標值為1或0,其中,1表明相關(guān)聯(lián),或0表明非關(guān)聯(lián)。
本發(fā)明的業(yè)務流程相關(guān)性的判別方法和裝置,在相關(guān)性判決中融合了結(jié)構(gòu)和行為兩個維度,確定代表結(jié)構(gòu)和行為維度的業(yè)務權(quán)重特征并計算流程的關(guān)聯(lián)特征值,基于關(guān)聯(lián)特征值和關(guān)聯(lián)目標值進行分類訓練生成分類模型,通過分類模型判別新業(yè)務流程與業(yè)務流程的相關(guān)性,通過對于流程的相似度檢索進行預處理工作,可以提高相似度檢索以及相關(guān)性判決的準確率和效率。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為根據(jù)本發(fā)明的業(yè)務流程相關(guān)性的判別方法的一個實施例的流程示意圖;
圖2A為采用Petri網(wǎng)模型建模的流程樣本示意圖,圖2B為采用Petri網(wǎng)模型建模的業(yè)務流程示意圖;
圖3A為特征向量的示意圖,圖3B為分類訓練關(guān)系向量的示意圖;
圖4為根據(jù)本發(fā)明的業(yè)務流程相關(guān)性的判別方法的另一個實施例的流程示意圖;
圖5為根據(jù)本發(fā)明的業(yè)務流程相關(guān)性的判別裝置的一個實施例的模塊示意圖。
具體實施方式
下面參照附圖對本發(fā)明進行更全面的描述,其中說明本發(fā)明的示例性實施例。下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。下面結(jié)合各個圖和實施例對本發(fā)明的技術(shù)方案進行多方面的描述。
圖1為根據(jù)本發(fā)明的業(yè)務流程相關(guān)性的判別方法的一個實施例的流程示意圖,如圖1所示:
步驟101,確定流程樣本,并確定用于度量流程間相關(guān)性的業(yè)務權(quán)重特征,業(yè)務權(quán)重特征包括:結(jié)構(gòu)特征和行為關(guān)系特征。
步驟102,計算流程樣本和流程庫中的業(yè)務流程對于業(yè)務權(quán)重特征的關(guān)聯(lián)特征值。
步驟103,確定用于標識流程樣本和業(yè)務流程是否相似的關(guān)聯(lián)目標值。
步驟104,基于關(guān)聯(lián)特征值和關(guān)聯(lián)目標值生成分類訓練關(guān)系向量,根據(jù)分類訓練關(guān)系向量進行分類訓練獲得分類模型。
步驟105,基于分類模型判別新業(yè)務流程與業(yè)務流程的相關(guān)性。
流程樣本和業(yè)務流程可以為圖形化的業(yè)務流程模型,包括:節(jié)點、用于將節(jié)點連接并具有方向的邊。可以采用多種模型進行建模獲取流程樣本、業(yè)務流程等。如圖2A、2B所示,Process 1和Process 2為用Petri網(wǎng)建模的流程模型,其中方形節(jié)點代表變遷,表示任務或事件,如Process 1中的A,B,C,D,E,F(xiàn)節(jié)點;圓形節(jié)點代表庫所,表示狀態(tài)或條件,如Process 1中的P1,P2,P3,P4,P5,P6,P7節(jié)點;有向弧是庫所和變遷之間連接的邊,如Process 1中的P1→A,A→P2。
度量兩個流程間的相關(guān)程度通??紤]以下維度:
(1)節(jié)點標簽相似度,即基于兩個流程模型間對應的任務節(jié)點和其他節(jié)點標識之間的相似度。流程模型中主要元素是各種節(jié)點,節(jié)點的標簽名在一定程度上能表達出該流程節(jié)點的相關(guān)功能及應用領(lǐng)域。
(2)結(jié)構(gòu)相似度:流程的拓撲結(jié)構(gòu)主要體現(xiàn)了流程中的各個業(yè)務邏輯單元式通過何種邏輯關(guān)系相互連接起來的,它在很大程度上決定了流程中的相關(guān)業(yè)務數(shù)據(jù)以及控制流的運轉(zhuǎn)方向。
(3)行為相似度:流程的行為最能體現(xiàn)實際運行中流程中各個活動的依賴關(guān)系。
流程的結(jié)構(gòu)表示它是以何種拓撲結(jié)構(gòu)來對節(jié)點和邊進行連接的,是流程的一個重要特征。圖編輯距離是衡量結(jié)構(gòu)相似性的一種很好的方式,主要從替換節(jié)點、替換邊、刪除節(jié)點、刪除邊、插入節(jié)點、插入邊六個特征來考量。本發(fā)明從結(jié)構(gòu)和行為兩個維度考慮,確定的結(jié)構(gòu)特征包括:替換節(jié)點、刪除/插入節(jié)點、替換邊、刪除/插入邊。行為關(guān)系特征包括:順序關(guān)系、互斥關(guān)系、并發(fā)關(guān)系。
替換節(jié)點:來自兩個流程圖中的兩個節(jié)點是替換節(jié)點,則意味著這對節(jié)點存在某種對應關(guān)系。一般這種對應關(guān)系都是節(jié)點標簽間的相似性,可以用文本相似度或者語義相似度來計算。節(jié)點標簽間的相似性越大,則這對節(jié)點越有可能成為替換節(jié)點。刪除/插入節(jié)點:在識別出兩個流程中的替換節(jié)點后,剩余的節(jié)點就是刪除或者插入的節(jié)點。
替換邊:在流程圖中,一條邊的左右兩端分別對應兩個節(jié)點,稱為左節(jié)點和右節(jié)點。如果來自兩個流程中的兩條邊是替換的,則這兩條邊的左節(jié)點是替換節(jié)點且右節(jié)點也是替換節(jié)點。刪除/插入邊:流程圖中的邊是刪除或者插入邊,則該邊對應的左節(jié)點不是替換節(jié)點,或者右節(jié)點不是替換節(jié)點,或者左節(jié)點和右節(jié)點都不是替換節(jié)點。
行為是流程圖很重要的維度,主要描述了一個流程中的各個任務節(jié)點之間是以什么樣的關(guān)系順序執(zhí)行的:順序、選擇(互斥)、并發(fā)關(guān)系。順序關(guān)系:一個流程中的兩個任務節(jié)點的執(zhí)行關(guān)系是順序的,也就是其中一個任務先執(zhí)行,另一個任務要在這個任務執(zhí)行完成后才能執(zhí)行。選擇(互斥)關(guān)系:如果一個流程中的兩個任務節(jié)點是選擇關(guān)系,這意味著流程會選擇兩個任務節(jié)點中的一個節(jié)點執(zhí)行而不執(zhí)行另一個。在用Petri網(wǎng)建模的流程中,兩個任務節(jié)點(變遷)是選擇關(guān)系,則它們有共同的前驅(qū)庫所,隨后馬上分成兩條支路。并行關(guān)系:如果一個流程中的兩個任務節(jié)點間的執(zhí)行關(guān)系既不是順序關(guān)系也不是選擇關(guān)系,則它們之間是并行關(guān)系。也就是兩個任務節(jié)點之間可以同時執(zhí)行。
在一個實施例中,兩個流程“Process 1”和“Process 2”對應替換節(jié)點或刪除/插入節(jié)點的關(guān)聯(lián)特征值:
fv1=(|f1(Process1,Process2)|)/(|Node(Process 1)∪Node(Process2)|);(1)
Process1為流程樣本,Process2為業(yè)務流程,f1(Process 1,Process 2)為Process1和Process2中相同的替換節(jié)點或刪除/插入節(jié)點的集合的元素個數(shù),Node(Process 1)為Process 1中的所有節(jié)點的集合的元素個數(shù),Node(Process 2)為Process 2中的所有節(jié)點的集合中的元素個數(shù),0≤fv1≤1。
確定對于替換邊或刪除/插入邊的關(guān)聯(lián)特征值:
fv2=(|f2(Process 1,Process2)|)/(|Edge(Process1)∪Edge(Process2)|);(2)
f2(Process 1,Process 2)為Process1和Process2中相同的替換邊或刪除/插入邊的集合的元素個數(shù),Edge(Process 1)為Process 1中的所有邊的集合的元素個數(shù),Edge(Process 2)為Process 2中的所有邊的集合的元素個數(shù),0≤fv2≤1。
每個流程都有自己的行為,因此兩個流程的行為相似性可以用行為交集數(shù)目大小來衡量。確定對于順序關(guān)系、互斥關(guān)系或并發(fā)關(guān)系的關(guān)聯(lián)特征值:
fv3=(|f3(Process 1)∩f3(Process 2)|)/(|f3(Process 1)∪f3(Process 2)|)(3)
f3(Process 1)為Process 1中的順序關(guān)系、互斥關(guān)系或并發(fā)關(guān)系的集合的元素個數(shù),Edge(Process 2)為Process 2中的順序關(guān)系、互斥關(guān)系或并發(fā)關(guān)系的集合的元素個數(shù),0≤fv3≤1。從公式(3)可以看到,兩個流程對于同一個特征的特征值同時取決于它們行為特征的交集數(shù)和并集數(shù)。
Process 1與Process 2的替換節(jié)點為{A,B,C,D,P1,P2,P3,P4,P5,P6},其中{A,B,C,D}是替換的變遷,{P1,P2,P3,P4,P5,P6,P7}是替換的庫所。刪除/插入節(jié)點為{E,P7,F(xiàn),G,P8,H}。
替換邊為{P1→A,A→P2,P2→B,B→P3,P3→D,D→P6,A→P4,P4→C,C→P5,P5→D}。刪除/插入邊為{P1→E,E→P7,P7→F,F(xiàn)→P6,P1→G,G→P8,P8→H,H→P6}。
順序關(guān)系有{A→B,A→D,A→C,B→D,C→D,E→F},Process 2中的順序關(guān)系有{A→B,A→D,A→C,B→D,C→D,G→H},其中“→”表示兩個節(jié)點的順序關(guān)系。選擇關(guān)系有{A#E,A#F,B#E,B#F,C#E,C#F,D#E,D#F},{A#G,A#H,B#G,B#H,C#G,C#H,D#G,D#H}是Process 2的選擇關(guān)系,其中“#”表示兩個任務節(jié)點之間是選擇關(guān)系。并行關(guān)系都為{B==C},其中“==”指的是并行關(guān)系。
按照公式(1)進行計算,Process 1與Process 2的替換節(jié)點值為fv1(替換節(jié)點)=10/16,刪除/插入節(jié)點值為fv1(刪除/插入節(jié)點)=6/16。
按照公式(2)進行計算,Process 1與Process 2的替換邊值為fv2(替換邊)=10/18,刪除/插入節(jié)點值為fv2(刪除/插入邊)=8/18。
按照公式(3)進行計算,Process 1與Process 2的任務節(jié)點間順序關(guān)系值為fv3(順序)=5/7,選擇關(guān)系值為fv3(選擇)=0,并行關(guān)系值為fv3(并行)=1。
特征值越大則對應的特征越相似或越不相似。如圖3A、3B所示,基于特征值,定義了兩個數(shù)據(jù)結(jié)構(gòu):特征向量和關(guān)系向量。Process 1和Process 2的特征向量FV=(替換節(jié)點值,刪除/插入節(jié)點值,替換邊值,刪除/插入邊值,順序關(guān)系值,選擇關(guān)系值,并行關(guān)系值),由7個特征值組成,兩個流程之間的相關(guān)關(guān)系對應一個特征向量。關(guān)系向量是在特征向量的基礎上加上一個目標值得到的,關(guān)系向量RV=(特征值,目標值)。為了衡量分類算法的分類準確率,在準備數(shù)據(jù)的時候人工對兩個流程是否相關(guān)給出一個目標值,若相關(guān)則該值為1,否則為0。
Process 1和Process 2的關(guān)系向量=(特征向量,目標值)。人為判斷出Process 1和Process 2相關(guān),所以目標值為1。由此,Process 1和Process 2對應的特征向量為FV=(0.625,0.375,0.556,0.444,0.713,0,1)。
設置流程樣本集,計算流程樣本集中的每個流程樣本分別與業(yè)務流程庫中的每個業(yè)務流程對于各個業(yè)務權(quán)重特征的關(guān)聯(lián)特征值。確定每個流程樣本分別與每個業(yè)務流程的關(guān)聯(lián)目標值,生成每個流程樣本分別與每個業(yè)務流程的分類訓練關(guān)系向量,其中分類訓練關(guān)系向量的元素包括:關(guān)聯(lián)特征值、關(guān)聯(lián)目標值。
可以采用多種算法模型進行分類訓練,獲取分模型,例如,BP神經(jīng)網(wǎng)絡算法、向量支持機(SVM)算法等。通過分類模型獲取新業(yè)務流程與業(yè)務流程集中的每個業(yè)務流程的關(guān)聯(lián)值,基于關(guān)聯(lián)值判斷是否相關(guān)。
在一個實施例中,為了適應新的需求,某電信企業(yè)的流程設計者要對手機用戶續(xù)約流程進行重新設計。在將新的流程加入到流程庫之前,為了避免冗余,需要先把流程庫中的相關(guān)流程都找出來逐一進行比較。在流程庫中,新的流程要與已有的業(yè)務流程進行逐一的比較,若某個相關(guān)流程與新流程屬于相同類型的流程,則該業(yè)務流程要從流程庫中去除,以防冗余。
圖4為根據(jù)本發(fā)明的業(yè)務流程相關(guān)性的判別方法的另一個實施例的流程示意圖,如圖4所示
步驟401,給定m個檢索流程Q1,...,Qm和一個包含n個候選流程C1,...,Cn的流程庫。
預先給定10個檢索流程作為流程樣本。例如,Q1:預約流程,Q2:賬單查詢流程,Q3:積分查詢流程,Q4:積分兌換禮品流程,Q5:賬單支付流程,Q6:話費充值流程,Q7:流量訂購流程,Q8:手機用戶續(xù)約流程,Q9:寬帶辦理流程,Q10:辦理主副卡流程。設置有一個包含100個業(yè)務流程C1,...,C100的電信流程庫,這100個業(yè)務流程為候選流程
步驟402:讀入1個檢索流程Qi(1≤i≤10)。
步驟403:取出流程庫中的業(yè)務流程Cj(1≤j≤100)。
步驟404,計算Qi和Cj的7個特征值,并組成一個特征向量FV(Qi,Cj)=(替換節(jié)點值,刪除/插入節(jié)點值,替換邊值,刪除/插入邊值,順序關(guān)系值,選擇關(guān)系值,并行關(guān)系值)。
例如,話費查詢流程和流量查詢都可通過發(fā)送短信查詢或打電話查詢或網(wǎng)上營業(yè)廳查詢。話費查詢流程:撥打XXXX/(登錄網(wǎng)上營業(yè)廳→點擊話費查詢)/發(fā)送X到XXXX→返回話費詳情;流量查詢流程:撥打XXXX/(登錄網(wǎng)上營業(yè)廳→點擊流量查詢)/發(fā)送Y到XXXX→返回流量詳情。
兩個流程替換的節(jié)點為“登錄網(wǎng)上營業(yè)廳”、“撥打電話XXXX”,刪除節(jié)點為“點擊話費查詢”、“發(fā)送X到XXXX”,“返回話費詳情”,插入節(jié)點為“點擊流量查詢”、“發(fā)送Y到XXXX”,“返回流量詳情”。由于沒有邊的兩個節(jié)點都為替換節(jié)點,由此替換邊數(shù)為0,所有邊都為刪除/插入邊。根據(jù)這些信息,按照公式(1)、公式(2)和公式(3)可以得到話費查詢流程和流量查詢流程的特征向量。
步驟405,人為對Qi與Cj進行相關(guān)性的判定并給出目標值,1表示相關(guān),0表示不相關(guān)。例如,話費查詢流程和流量查詢是相關(guān)的,因為都是查詢流程,則將這兩個流程標記為相關(guān),標記為1。在FV的基礎上加上一個目標值值組成一個關(guān)系向量RV(Qi,Cj)。
步驟406,將RV(Qi,Cj)寫入到文件中。
步驟407,判斷流程庫中是否還有未計算過的業(yè)務流程,如果是,則進入步驟403,如果否,則進入步驟408。
步驟408,判斷10個檢索流程是否都計算完畢。如果是,則執(zhí)行步驟403,如否則執(zhí)行步驟408。
步驟409,將包含1000條記錄的文件輸入到BP神經(jīng)網(wǎng)絡(BPNN)或向量支持機(SVM)算法中進行訓練,得到分類模型。
步驟401-409為線下訓練過程。
步驟410,給定1個新的檢索流程Q。例如,手機用戶續(xù)約流程,輸入到訓練好的分類模型中。
步驟411,取出流程庫中的候選流程Cj(1≤j≤100)。
步驟412,通過分類模型對Q與Cj是否相關(guān)做出判斷,即輸出0或1,0表示Q與Cj相關(guān),1表示Q與Cj不相關(guān)。
例如,流程庫中的寬帶續(xù)約流程等流程是Q的相關(guān)流程,標記為1。流程庫中的其他流程,如故障報修流程、網(wǎng)齡提速流程、停機保號流程等流程為Q的不相關(guān)流程,標記為0。
步驟413,判斷流程庫中是否還有未計算的業(yè)務流程,如果是,則進入步驟410,如果否,則結(jié)束。
步驟410-413為線上查詢過程。
上述實施例中提供的業(yè)務流程相關(guān)性的判別方法,融合了結(jié)構(gòu)和行為兩個維度,確定代表結(jié)構(gòu)和行為維度的業(yè)務權(quán)重特征并計算流程的關(guān)聯(lián)特征值,基于關(guān)聯(lián)特征值和關(guān)聯(lián)目標值進行分類訓練生成分類模型,通過分類模型判別新業(yè)務流程與業(yè)務流程的相關(guān)性,通過對于流程的相似度檢索進行預處理工作,可以提高相似度檢索的準確率和效率。
在一個實施例中,本發(fā)明提供一種業(yè)務流程相關(guān)性的判別裝置50,包括:樣本設置模塊51、特征確定模塊52、特征值計算模塊53、目標值確定模塊54、模型訓練模塊55和關(guān)聯(lián)判別模塊56。樣本設置模塊51確定流程樣本;特征確定模塊52確定用于度量流程間相關(guān)性的業(yè)務權(quán)重特征,業(yè)務權(quán)重特征包括:結(jié)構(gòu)特征和行為關(guān)系特征。
特征值計算模塊53計算流程樣本和流程庫中的業(yè)務流程對于業(yè)務權(quán)重特征的關(guān)聯(lián)特征值。目標值確定模塊54確定用于標識流程樣本和業(yè)務流程是否相似的關(guān)聯(lián)目標值。模型訓練模塊55基于關(guān)聯(lián)特征值和關(guān)聯(lián)目標值生成分類訓練關(guān)系向量,根據(jù)分類訓練關(guān)系向量進行分類訓練獲得分類模型。關(guān)聯(lián)判別模塊56基于分類模型判別新業(yè)務流程與業(yè)務流程的相關(guān)性。
特征值計算模塊53確定對于替換節(jié)點或刪除/插入節(jié)點的關(guān)聯(lián)特征值fv1=(|f1(Process1,Process2)|)/(|Node(Process 1)∪Node(Process2)|);其中,Process1為流程樣本,Process2為業(yè)務流程,f1(Process1,Process 2)為Process1和Process2中相同的替換節(jié)點或刪除/插入節(jié)點的集合的元素個數(shù),Node(Process 1)為Process 1中的所有節(jié)點的集合的元素個數(shù),Node(Process 2)為Process 2中的所有節(jié)點的集合中的元素個數(shù),0≤fv1≤1。
特征值計算模塊53確定對于替換邊或刪除/插入邊的關(guān)聯(lián)特征值fv2=(|f2(Process 1,Process2)|)/(|Edge(Process1)∪Edge(Process 2)|);其中,Process1為流程樣本,Process2為業(yè)務流程,f2(Process 1,Process 2)為Process1和Process2中相同的替換邊或刪除/插入邊的集合的元素個數(shù),Edge(Process 1)為Process 1中的所有邊的集合的元素個數(shù),Edge(Process 2)為Process 2中的所有邊的集合的元素個數(shù),0≤fv2≤1。
特征值計算模塊53確定對于順序關(guān)系、互斥關(guān)系或并發(fā)關(guān)系的關(guān)聯(lián)特征fv3=(|f3(Process 1)∩f3(Process 2)|)/(|f3(Process 1)∪f3(Process2)|);其中,Process1為流程樣本,Process2為業(yè)務流程,f3(Process 1)為Process 1中的順序關(guān)系、互斥關(guān)系或并發(fā)關(guān)系的集合的元素個數(shù),Edge(Process 2)為Process 2中的順序關(guān)系、互斥關(guān)系或并發(fā)關(guān)系的集合的元素個數(shù),0≤fv3≤1。
樣本設置模塊51設置流程樣本集。特征值計算模塊53計算流程樣本集中的每個流程樣本分別與業(yè)務流程庫中的每個業(yè)務流程對于各個業(yè)務權(quán)重特征的關(guān)聯(lián)特征值。模型訓練模塊54確定每個流程樣本分別與每個業(yè)務流程的關(guān)聯(lián)目標值,生成每個流程樣本分別與每個業(yè)務流程的分類訓練關(guān)系向量,其中,分類訓練關(guān)系向量的元素包括:關(guān)聯(lián)特征值、關(guān)聯(lián)目標值。關(guān)聯(lián)判別模塊55通過分類模型獲取新業(yè)務流程與業(yè)務流程集中的每個業(yè)務流程的關(guān)聯(lián)值,基于關(guān)聯(lián)值判斷是否相關(guān)。
上述實施例中提供的業(yè)務流程相關(guān)性的判別方法和裝置,融合了結(jié)構(gòu)和行為兩個維度,確定代表結(jié)構(gòu)和行為維度的業(yè)務權(quán)重特征并計算流程的關(guān)聯(lián)特征值,基于關(guān)聯(lián)特征值和關(guān)聯(lián)目標值進行分類訓練生成分類模型,通過分類模型判別新業(yè)務流程與業(yè)務流程的相關(guān)性,能夠?qū)⒘鞒處熘械臉I(yè)務流程分為與新業(yè)務流程相關(guān)和不相關(guān)流程兩大類,通過對于流程的相似度檢索進行預處理工作,可以提高相似度檢索以及相關(guān)性判決的準確率和效率。
可能以許多方式來實現(xiàn)本發(fā)明的方法和系統(tǒng)。例如,可通過軟件、硬件、固件或者軟件、硬件、固件的任何組合來實現(xiàn)本發(fā)明的方法和系統(tǒng)。用于方法的步驟的上述順序僅是為了進行說明,本發(fā)明的方法的步驟不限于以上具體描述的順序,除非以其它方式特別說明。此外,在一些實施例中,還可將本發(fā)明實施為記錄在記錄介質(zhì)中的程序,這些程序包括用于實現(xiàn)根據(jù)本發(fā)明的方法的機器可讀指令。因而,本發(fā)明還覆蓋存儲用于執(zhí)行根據(jù)本發(fā)明的方法的程序的記錄介質(zhì)。
本發(fā)明的描述是為了示例和描述起見而給出的,而并不是無遺漏的或者將本發(fā)明限于所公開的形式。很多修改和變化對于本領(lǐng)域的普通技術(shù)人員而言是顯然的。選擇和描述實施例是為了更好說明本發(fā)明的原理和實際應用,并且使本領(lǐng)域的普通技術(shù)人員能夠理解本發(fā)明從而設計適于特定用途的帶有各種修改的各種實施例。