本技術(shù)屬于信息,尤其涉及一種數(shù)據(jù)的提取方法、裝置、設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品。
背景技術(shù):
1、隨著大數(shù)據(jù)信息化建設(shè)的推進(jìn),各企業(yè)的業(yè)務(wù)聚集了大量業(yè)務(wù)數(shù)據(jù)并存于數(shù)據(jù)倉(cāng)庫(kù)中。企業(yè)為了更好地利用數(shù)據(jù)資源,提高工作效率和決策質(zhì)量,推動(dòng)業(yè)務(wù)的持續(xù)發(fā)展,通常會(huì)伴隨著大量的數(shù)據(jù)提取需求。
2、為了完成這些數(shù)據(jù)提取需求,企業(yè)通常會(huì)建立數(shù)據(jù)管理團(tuán)隊(duì),將各部門(mén)的業(yè)務(wù)數(shù)據(jù)存于數(shù)據(jù)倉(cāng)庫(kù),并讓專(zhuān)門(mén)的團(tuán)隊(duì)或人員通過(guò)編寫(xiě)sql語(yǔ)句從數(shù)據(jù)倉(cāng)庫(kù)中提取需求的業(yè)務(wù)數(shù)據(jù),由于sql語(yǔ)句的編寫(xiě)比較復(fù)雜,因此會(huì)導(dǎo)致數(shù)據(jù)提取的時(shí)間較長(zhǎng),因此數(shù)據(jù)提取的效率較低。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)實(shí)施例提供了一種數(shù)據(jù)的提取方法、裝置、設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品,能夠解決現(xiàn)有的數(shù)據(jù)提取的效率較低的問(wèn)題。
2、第一方面,本技術(shù)實(shí)施例提供一種數(shù)據(jù)的提取方法,方法包括:
3、獲取用戶(hù)輸入的第一需求描述文本,所述第一需求描述文本用于描述所述用戶(hù)的數(shù)據(jù)需求;
4、根據(jù)所述第一需求描述文本生成數(shù)據(jù)查詢(xún)語(yǔ)句,所述數(shù)據(jù)查詢(xún)語(yǔ)句通過(guò)編程語(yǔ)言表示,所述數(shù)據(jù)查詢(xún)語(yǔ)句用于從數(shù)據(jù)倉(cāng)庫(kù)中進(jìn)行數(shù)據(jù)提??;
5、將所述數(shù)據(jù)查詢(xún)語(yǔ)句轉(zhuǎn)換為查詢(xún)語(yǔ)句描述文本,所述查詢(xún)語(yǔ)句描述文本用于通過(guò)自然語(yǔ)言描述所述數(shù)據(jù)查詢(xún)語(yǔ)句的內(nèi)容;
6、在獲取所述查詢(xún)語(yǔ)句描述文本對(duì)應(yīng)的第一確認(rèn)信息的情況下,利用所述數(shù)據(jù)查詢(xún)語(yǔ)句進(jìn)行數(shù)據(jù)提取,所述第一確認(rèn)信息用于指示所述數(shù)據(jù)查詢(xún)語(yǔ)句滿(mǎn)足用戶(hù)的數(shù)據(jù)需求。
7、在一些實(shí)施例中,所述根據(jù)所述第一需求描述文本生成數(shù)據(jù)查詢(xún)語(yǔ)句,包括:
8、將所述第一需求描述文本輸入預(yù)先訓(xùn)練好的第一模型中,得到所述第一模型輸出的多個(gè)短語(yǔ),所述多個(gè)短語(yǔ)包括第一目標(biāo)模型表的名稱(chēng)和第一目標(biāo)字段;
9、將所述多個(gè)短語(yǔ)輸入預(yù)先訓(xùn)練好的第二模型中,由所述第二模型根據(jù)所述多個(gè)短語(yǔ)生成所述數(shù)據(jù)查詢(xún)語(yǔ)句,所述數(shù)據(jù)查詢(xún)語(yǔ)句用于從所述數(shù)據(jù)倉(cāng)庫(kù)中的所述第一目標(biāo)模型表中提取所述第一目標(biāo)字段。
10、在一些實(shí)施例中,所述將所述多個(gè)短語(yǔ)輸入預(yù)先訓(xùn)練好的第二模型中,包括:
11、顯示所述多個(gè)短語(yǔ);
12、在接收到所述多個(gè)短語(yǔ)對(duì)應(yīng)的第二確認(rèn)信息的情況下,將所述多個(gè)短語(yǔ)輸入預(yù)先訓(xùn)練好的第二模型中,所述第二確認(rèn)信息用于確認(rèn)所述第一目標(biāo)模型表的名稱(chēng)和所述第一目標(biāo)字段滿(mǎn)足用戶(hù)的數(shù)據(jù)需求。
13、在一些實(shí)施例中,所述將所述數(shù)據(jù)查詢(xún)語(yǔ)句轉(zhuǎn)換為查詢(xún)語(yǔ)句描述文本,包括:
14、將所述數(shù)據(jù)查詢(xún)語(yǔ)句對(duì)應(yīng)的特征向量輸入所述預(yù)先訓(xùn)練好的第二模型中,得到所述第二模型輸出的所述查詢(xún)語(yǔ)句描述文本。
15、在一些實(shí)施例中,所述將所述第一需求描述文本輸入預(yù)先訓(xùn)練好的第一模型中之前,所述方法還包括:
16、獲取第一訓(xùn)練樣本集,所述第一訓(xùn)練樣本集包括多個(gè)第一訓(xùn)練樣本,每個(gè)所述訓(xùn)練樣本包括一個(gè)第二需求描述文本及其對(duì)應(yīng)的模型表和字段的第一預(yù)測(cè)標(biāo)簽;
17、利用所述第一訓(xùn)練樣本集和預(yù)先獲取的數(shù)據(jù)庫(kù)表訓(xùn)練所述第一模型,直至滿(mǎn)足訓(xùn)練停止條件,得到訓(xùn)練好的第一模型,所述模型庫(kù)表用于表征多個(gè)所述模型表之間的關(guān)聯(lián)關(guān)系,其中,所述模型庫(kù)表用于描述多個(gè)模型表之間的關(guān)聯(lián)關(guān)系。
18、在一些實(shí)施例中,所述將所述多個(gè)短語(yǔ)輸入預(yù)先訓(xùn)練好的第二模型中之前,所述方法還包括:
19、獲取第二訓(xùn)練樣本集,所述訓(xùn)練樣本集包括多個(gè)第二訓(xùn)練樣本,每個(gè)所述第二訓(xùn)練樣本包括第三需求描述文本以及其對(duì)應(yīng)的查詢(xún)語(yǔ)句描述文本的第二預(yù)測(cè)標(biāo)簽;
20、利用所述第二訓(xùn)練樣本集和預(yù)先獲取的數(shù)據(jù)庫(kù)表訓(xùn)練所述第二模型,直至滿(mǎn)足訓(xùn)練停止條件,得到訓(xùn)練好的第二模型。
21、在一些實(shí)施例中,所述方法還包括:
22、從數(shù)據(jù)倉(cāng)庫(kù)中的模型表中獲取模型數(shù)據(jù)的元數(shù)據(jù);
23、根據(jù)數(shù)據(jù)分析算法對(duì)所述元數(shù)據(jù)進(jìn)行多維度分析,得到分析結(jié)果,其中,所述多維度分析包括血緣分析、關(guān)聯(lián)性分析和影響分析;
24、根據(jù)所述分析結(jié)果建立所述元數(shù)據(jù)之間的數(shù)據(jù)關(guān)系;
25、根據(jù)所述元數(shù)據(jù)及所述數(shù)據(jù)關(guān)系構(gòu)建模型庫(kù)表。
26、在一些實(shí)施例中,所述根據(jù)所述第一需求描述文本生成數(shù)據(jù)查詢(xún)語(yǔ)句之后,所述方法還包括:
27、顯示所述數(shù)據(jù)查詢(xún)語(yǔ)句;
28、響應(yīng)于用戶(hù)對(duì)所述數(shù)據(jù)查詢(xún)語(yǔ)句的修改輸入,對(duì)所述數(shù)據(jù)查詢(xún)語(yǔ)句進(jìn)行修改,得到修改后的所述數(shù)據(jù)查詢(xún)語(yǔ)句。
29、在一些實(shí)施例中,所述將所述數(shù)據(jù)查詢(xún)語(yǔ)句轉(zhuǎn)換為查詢(xún)語(yǔ)句描述文本之后,所述方法還包括:
30、在獲取所述查詢(xún)語(yǔ)句描述文本對(duì)應(yīng)的第一駁回信息的情況下,生成更新提示,其中,所述第一駁回信息用于指示所述數(shù)據(jù)查詢(xún)語(yǔ)句不滿(mǎn)足用戶(hù)的數(shù)據(jù)需求,所述更新提示用于提示更新所述數(shù)據(jù)查詢(xún)語(yǔ)句的內(nèi)容。
31、第二方面,本技術(shù)實(shí)施例提供一種數(shù)據(jù)的提取裝置,裝置包括:
32、獲取模塊,用于獲取用戶(hù)輸入的第一需求描述文本,所述第一需求描述文本用于描述所述用戶(hù)的數(shù)據(jù)需求;
33、生成模塊,用于根據(jù)所述第一需求描述文本生成數(shù)據(jù)查詢(xún)語(yǔ)句,所述數(shù)據(jù)查詢(xún)語(yǔ)句通過(guò)編程語(yǔ)言表示,所述數(shù)據(jù)查詢(xún)語(yǔ)句用于從數(shù)據(jù)倉(cāng)庫(kù)中進(jìn)行數(shù)據(jù)提取;
34、轉(zhuǎn)換模塊,用于將所述數(shù)據(jù)查詢(xún)語(yǔ)句轉(zhuǎn)換為查詢(xún)語(yǔ)句描述文本,所述查詢(xún)語(yǔ)句描述文本用于通過(guò)自然語(yǔ)言描述所述數(shù)據(jù)查詢(xún)語(yǔ)句的內(nèi)容;
35、提取模塊,用于在獲取所述查詢(xún)語(yǔ)句描述文本對(duì)應(yīng)的第一確認(rèn)信息的情況下,利用所述數(shù)據(jù)查詢(xún)語(yǔ)句進(jìn)行數(shù)據(jù)提取,所述第一確認(rèn)信息用于指示所述數(shù)據(jù)查詢(xún)語(yǔ)句滿(mǎn)足用戶(hù)的數(shù)據(jù)需求。
36、第三方面,本技術(shù)實(shí)施例提供了一種數(shù)據(jù)的提取設(shè)備,設(shè)備包括:處理器以及存儲(chǔ)有計(jì)算機(jī)程序指令的存儲(chǔ)器;
37、處理器執(zhí)行計(jì)算機(jī)程序指令時(shí)實(shí)現(xiàn)如上的數(shù)據(jù)的提取方法。
38、第四方面,本技術(shù)實(shí)施例提供了一種計(jì)算機(jī)存儲(chǔ)介質(zhì),計(jì)算機(jī)存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序指令,計(jì)算機(jī)程序指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上的數(shù)據(jù)的提取方法。
39、第五方面,本技術(shù)實(shí)施例提供了一種計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)程序指令,所述計(jì)算機(jī)程序指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上的數(shù)據(jù)的提取方法。
40、在本技術(shù)中,通過(guò)數(shù)據(jù)的提取方法、裝置、設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品,可以獲取用戶(hù)輸入的第一需求描述文本,根據(jù)第一需求描述文本生成數(shù)據(jù)查詢(xún)語(yǔ)句,數(shù)據(jù)查詢(xún)語(yǔ)句通過(guò)編程語(yǔ)言表示,然后將數(shù)據(jù)查詢(xún)語(yǔ)句轉(zhuǎn)換為查詢(xún)語(yǔ)句描述文本,在獲取查詢(xún)語(yǔ)句描述文本對(duì)應(yīng)的第一確認(rèn)信息的情況下,利用數(shù)據(jù)查詢(xún)語(yǔ)句進(jìn)行數(shù)據(jù)提取。也就是說(shuō),用戶(hù)只需要以自然語(yǔ)言提出第一需求描述文本,就可以將自然語(yǔ)言轉(zhuǎn)成編程語(yǔ)言的數(shù)據(jù)查詢(xún)語(yǔ)句,然后將數(shù)據(jù)查詢(xún)語(yǔ)句轉(zhuǎn)換為自然語(yǔ)言描述的查詢(xún)語(yǔ)句描述文本,只需要用戶(hù)確認(rèn)過(guò)查詢(xún)語(yǔ)句描述文本,即可以通過(guò)數(shù)據(jù)查詢(xún)語(yǔ)句進(jìn)行數(shù)據(jù)提取。如此一來(lái),用戶(hù)可以以自然語(yǔ)言描述數(shù)據(jù)的需求來(lái)進(jìn)行數(shù)據(jù)提取,并對(duì)自然語(yǔ)言描述的查詢(xún)語(yǔ)句描述文本進(jìn)行確認(rèn),無(wú)需用戶(hù)編寫(xiě)編程語(yǔ)言,從而提升了數(shù)據(jù)提取的效率。