本發(fā)明涉及基于運維知識庫的運維推薦,尤其涉及一種基于知識庫的云平臺運維推薦方法、裝置、設(shè)備及介質(zhì)。
背景技術(shù):
1、設(shè)備運維是一項考驗設(shè)備維護經(jīng)驗的工作,氣象大數(shù)據(jù)云平臺的運維工作尤其如此。氣象大數(shù)據(jù)云平臺是一種根據(jù)大數(shù)據(jù)運算需求搭建的集運算與存儲于一體的平臺。氣象大數(shù)據(jù)云平臺有較高的可靠性要求,例如,在云平臺出現(xiàn)異常時,要能夠快速地響應(yīng),及時地解決問題。然而,氣象大數(shù)據(jù)云平臺專用特性使得其與通用云平臺的運維具有一定程度的不同,通用云平臺的運維經(jīng)驗往往不能直接運用于氣象大數(shù)據(jù)云平臺。而建立健全氣象大數(shù)據(jù)云平臺的運維知識庫,可以實現(xiàn)對運維經(jīng)驗的積累和共享,幫助加快對氣象大數(shù)據(jù)云平臺異常的響應(yīng)速度。
2、通常知識庫包括相關(guān)運維知識條目,如常見故障的解決方法、平臺升級的流程等,可以方便運維人員快速查詢和解決問題,提高運維的效率。在引入知識圖譜技術(shù)后,將運維過程中的經(jīng)驗和知識進行整理、歸納,形成知識庫,可以便于后續(xù)的自動化運維工作。
3、目前,對于運維知識庫的運用上,主要存在不便于從知識庫中找到最符合當前設(shè)備異常的運維知識,基于此,需要開發(fā)設(shè)計出一種基于知識庫的云平臺運維推薦方法。
技術(shù)實現(xiàn)思路
1、本發(fā)明實施方式提供了一種基于知識庫的云平臺運維推薦方法、裝置、設(shè)備及介質(zhì),用于解決現(xiàn)有技術(shù)中不便于從知識庫中找到最符合當前設(shè)備異常的運維知識的問題。
2、第一方面,本發(fā)明實施方式提供了一種基于知識庫的云平臺運維推薦方法,包括:
3、獲取異常描述語句;
4、對所述異常描述語句進行分詞,獲得的多個實體分詞;
5、根據(jù)所述多個實體分詞在運維知識文本中出現(xiàn)的頻次以及反向文件頻率,從運維知識庫中確定多個備選運維知識文本,其中,反向文件頻率表征包含有實體分詞的運維知識文本與全部運維知識文本的比例;
6、根據(jù)多個異常原因的概率、出現(xiàn)實體分詞的概率以及異常原因條件下的運維知識文本中出現(xiàn)實體分詞的概率確定所述多個原因可靠度概率,并根據(jù)所述多個原因可靠度概率從所述多個備選運維知識文本中確定目標運維知識文本,其中,每個備選運維知識文本對應(yīng)一個原因可靠度概率以及一個異常原因。
7、在一種可能實現(xiàn)的方式中,所述對所述異常描述語句進行分詞,獲得的多個實體分詞,包括:
8、從所述異常描述語句的預(yù)定位置提取第一數(shù)量的多個文字;
9、若所述多個文字非目標詞性,則根據(jù)所述多個文字在知識圖譜中進行實體匹配,其中,所述知識圖譜包括多個實體,所述知識圖譜的實體與實體之間通過關(guān)系連接;
10、若未匹配,則增加所述第一數(shù)量的值,并跳轉(zhuǎn)至所述從所述異常描述語句的預(yù)定位置提取第一數(shù)量的多個文字的步驟;
11、否則,將匹配的實體以及與所述匹配的實體具有多個相同關(guān)系的實體加入到多個實體分詞中;
12、根據(jù)所述預(yù)定位置以及所述第一數(shù)量對所述預(yù)定位置進行偏移,并跳轉(zhuǎn)至所述從所述異常描述語句的預(yù)定位置提取第一數(shù)量的多個文字的步驟。
13、在一種可能實現(xiàn)的方式中,所述根據(jù)所述多個實體分詞在運維知識文本中出現(xiàn)的頻次以及反向文件頻率,從運維知識庫中確定多個備選運維知識文本,包括:
14、根據(jù)所述多個實體分詞,確定多個分詞頻率隊列,其中,每個分詞頻率隊列對應(yīng)一個運維知識文本,分詞頻率隊列包括多個分詞頻率值,每個分詞頻率值對應(yīng)一個實體分詞,分詞頻率值表征實體分詞在運維知識文本中出現(xiàn)的概率;
15、根據(jù)所述多個實體分詞在運維知識庫中出現(xiàn)的頻率構(gòu)建反向文件頻率隊列,其中,所述反向文件頻率隊列包括多個反向文件頻率值,每個反向文件頻率值對應(yīng)一個實體分詞;
16、根據(jù)所述多個分詞頻率隊列以及所述反向文件頻率隊列,確定多個關(guān)聯(lián)值,其中,每個關(guān)聯(lián)值對應(yīng)一個運維知識文本,關(guān)聯(lián)值表征運維知識文本與所述異常描述語句的關(guān)聯(lián)程度;
17、根據(jù)所述多個關(guān)聯(lián)值,從所述運維知識庫中確定多個備選運維知識文本。
18、在一種可能實現(xiàn)的方式中,所述根據(jù)所述多個實體分詞,確定多個分詞頻率隊列,包括:
19、對于每個運維知識文本,分別執(zhí)行如下步驟:
20、從所述多個實體分詞中依次取出實體分詞作為待處理實體分詞;
21、根據(jù)第一公式計算分詞頻率值,其中,所述第一公式為:
22、
23、式中,為待處理實體分詞的分詞頻率值,為待處理實體分詞在運維知識文本中出現(xiàn)的次數(shù),為運維知識文本中分詞的數(shù)量;
24、將所述分詞頻率值加入分詞頻率隊列;
25、若未完成對所述多個實體分詞的遍歷,則跳轉(zhuǎn)至所述從所述多個實體分詞中依次取出實體分詞作為待處理實體分詞的步驟。
26、在一種可能實現(xiàn)的方式中,所述根據(jù)所述多個實體分詞在運維知識庫中出現(xiàn)的頻率構(gòu)建反向文件頻率隊列,包括:
27、從所述多個實體分詞中依次取出實體分詞作為待處理實體分詞;
28、根據(jù)第二公式計算待處理實體分詞的反向文件頻率值,其中,所述第二公式為:
29、
30、式中,為待處理實體分詞的反向文件頻率值,為出現(xiàn)待處理實體分詞的運維知識文本的數(shù)量,為運維知識庫中運維知識文本的數(shù)量,為第一常數(shù);
31、將所述反向文件頻率值加入反向文件頻率隊列;
32、若未完成對所述多個實體分詞的遍歷,則跳轉(zhuǎn)至所述從所述多個實體分詞中依次取出實體分詞作為待處理實體分詞的步驟。
33、在一種可能實現(xiàn)的方式中,所述根據(jù)所述多個分詞頻率隊列以及所述反向文件頻率隊列,確定多個關(guān)聯(lián)值,包括:
34、對于每個運維知識文本,分別根據(jù)第三公式確定關(guān)聯(lián)值,其中,所述第三公式為:
35、
36、式中,為運維知識文本的關(guān)聯(lián)值,為分詞頻率隊列的第個分詞頻率值,為反向文件頻率隊列的第個反向文件頻率值,為實體分詞的總數(shù)量。
37、在一種可能實現(xiàn)的方式中,所述根據(jù)多個異常原因的概率、出現(xiàn)實體分詞的概率以及異常原因條件下的運維知識文本中出現(xiàn)實體分詞的概率確定所述多個原因可靠度概率,包括:
38、根據(jù)第四公式確定每個異常原因的原因可靠度概率,其中,所述第四公式為:
39、
40、式中,為原因可靠度概率,為異常原因條件下的運維知識文本中出現(xiàn)第個實體分詞的概率,為安全風(fēng)險概率,為第個實體分詞在運維知識文本中出現(xiàn)的概率。
41、第二方面,本發(fā)明實施方式提供了一種基于知識庫的云平臺運維推薦裝置,用于實現(xiàn)如上第一方面或第一方面的任一種可能的實現(xiàn)方式所述的基于知識庫的云平臺運維推薦方法,所述基于知識庫的云平臺運維推薦裝置包括:
42、描述獲取模塊,用于獲取異常描述語句;
43、分詞模塊,用于對所述異常描述語句進行分詞,獲得的多個實體分詞;
44、初選模塊,用于根據(jù)所述多個實體分詞在運維知識文本中出現(xiàn)的頻次以及反向文件頻率,從運維知識庫中確定多個備選運維知識文本,其中,反向文件頻率表征包含有實體分詞的運維知識文本與全部運維知識文本的比例;
45、以及,
46、運維推薦模塊,用于根據(jù)多個異常原因的概率、出現(xiàn)實體分詞的概率以及異常原因條件下的運維知識文本中出現(xiàn)實體分詞的概率確定所述多個原因可靠度概率,并根據(jù)所述多個原因可靠度概率從所述多個備選運維知識文本中確定目標運維知識文本,其中,每個備選運維知識文本對應(yīng)一個原因可靠度概率以及一個異常原因。
47、第三方面,本發(fā)明實施方式提供了一種電子設(shè)備,包括存儲器以及處理器,所述存儲器中存儲有可在所述處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)如上第一方面或第一方面的任一種可能的實現(xiàn)方式所述方法的步驟。
48、第四方面,本發(fā)明實施方式提供了一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如上第一方面或第一方面的任一種可能的實現(xiàn)方式所述方法的步驟。
49、本發(fā)明實施方式與現(xiàn)有技術(shù)相比存在的有益效果是:
50、本發(fā)明實施方式公開了一種基于知識庫的云平臺運維推薦方法,其首先獲取異常描述語句;然后對所述異常描述語句進行分詞,獲得的多個實體分詞;接著根據(jù)所述多個實體分詞在運維知識文本中出現(xiàn)的頻次以及反向文件頻率,從運維知識庫中確定多個備選運維知識文本,其中,反向文件頻率表征包含有實體分詞的運維知識文本與全部運維知識文本的比例;最后根據(jù)多個異常原因的概率、出現(xiàn)實體分詞的概率以及異常原因條件下的運維知識文本中出現(xiàn)實體分詞的概率確定所述多個原因可靠度概率,并根據(jù)所述多個原因可靠度概率從所述多個備選運維知識文本中確定目標運維知識文本,其中,每個備選運維知識文本對應(yīng)一個原因可靠度概率以及一個異常原因。本發(fā)明實施方式通過分析異常描述語句的分詞在運維知識文本中出現(xiàn)的頻次和包含有實體分詞的運維知識文本的占比,確定備選運維知識文本,最后通過統(tǒng)計和概率論,從備選運維知識文本中選出與異常描述語句最相關(guān)的運維知識文本進行推送,本發(fā)明方法提高了運維知識庫查詢的速度和準確度,給運維工作提供了幫助,提高了運維的效率。