本發(fā)明涉及人工智能以及金融科技領(lǐng)域,尤其涉及一種基于擴(kuò)散策略的文本生成方法、裝置、設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、在金融領(lǐng)域,隨著大數(shù)據(jù)、人工智能和云計(jì)算技術(shù)的廣泛應(yīng)用,金融機(jī)構(gòu)日益依賴于智能化技術(shù)來提升運(yùn)營效率和服務(wù)質(zhì)量。智能文本生成技術(shù)已經(jīng)逐漸融入到金融服務(wù)的各個(gè)環(huán)節(jié),如客戶服務(wù)、市場分析、投資建議等,為金融機(jī)構(gòu)提供了強(qiáng)有力的技術(shù)支持。
2、金融機(jī)構(gòu)每天都會(huì)收到大量的客戶咨詢,這些咨詢涉及賬戶信息、交易細(xì)節(jié)、產(chǎn)品推薦等多方面內(nèi)容。通過智能文本生成技術(shù),金融機(jī)構(gòu)可以自動(dòng)化地生成個(gè)性化的客戶應(yīng)答,極大地提高了服務(wù)效率。借助自然語言處理技術(shù),系統(tǒng)能夠理解客戶問題的語義,并根據(jù)預(yù)定義的知識庫生成準(zhǔn)確且個(gè)性化的回答。
3、金融機(jī)構(gòu)需要頻繁地生成市場分析報(bào)告,以指導(dǎo)業(yè)務(wù)決策和客戶投資。傳統(tǒng)的報(bào)告撰寫方式通常需要大量的人力投入,且耗時(shí)較長。利用基于擴(kuò)散策略的文本生成模型,可以自動(dòng)從金融數(shù)據(jù)庫中提取最新的市場數(shù)據(jù),并生成結(jié)構(gòu)化的分析報(bào)告。這種自動(dòng)化生成的報(bào)告能夠覆蓋市場趨勢、產(chǎn)品表現(xiàn)等多個(gè)維度,幫助金融分析師快速完成報(bào)告編寫任務(wù)。
4、在投資咨詢領(lǐng)域,智能文本生成技術(shù)也發(fā)揮著越來越重要的作用。通過對客戶歷史投資行為、市場行情以及最新的金融產(chǎn)品信息進(jìn)行分析,智能系統(tǒng)可以自動(dòng)生成個(gè)性化的投資建議。這些建議通?;诳蛻舻娘L(fēng)險(xiǎn)偏好、預(yù)期收益以及投資目標(biāo),通過文本生成技術(shù)以清晰易懂的方式呈現(xiàn)給客戶,使得客戶能夠更好地做出投資決策。
5、金融產(chǎn)品通常具有復(fù)雜的條款和條件,且需要根據(jù)市場變化進(jìn)行頻繁更新。通過智能文本生成技術(shù),可以自動(dòng)撰寫和更新金融產(chǎn)品說明文檔。這一過程不僅提高了工作效率,也減少了人為錯(cuò)誤,確保金融產(chǎn)品信息的準(zhǔn)確性和及時(shí)性。智能生成的產(chǎn)品說明能夠快速響應(yīng)市場變化,提供最新的產(chǎn)品信息給客戶。
6、智能文本生成在金融領(lǐng)域的應(yīng)用雖然廣泛,但依然面臨一些挑戰(zhàn)。首先,金融領(lǐng)域的專業(yè)術(shù)語和復(fù)雜的語境要求生成文本不僅要準(zhǔn)確,還需要符合金融行業(yè)的標(biāo)準(zhǔn)和規(guī)范。其次,如何有效整合和處理大量的金融數(shù)據(jù),使生成文本既具備專業(yè)性又能通俗易懂,也是需要解決的重要問題。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的主要目的在于提供一種基于擴(kuò)散策略的文本生成方法、裝置、設(shè)備及存儲介質(zhì),旨在解決如何在擴(kuò)散模型生成的文本序列中,處理自然語言的順序依賴性的技術(shù)問題。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供一種基于擴(kuò)散策略的文本生成方法,包括:
3、獲取訓(xùn)練文本數(shù)據(jù)集,定義初始擴(kuò)散模型的目標(biāo)序列擴(kuò)展長度,確定初始擴(kuò)散模型的總擴(kuò)散時(shí)間步長;
4、在預(yù)設(shè)范圍內(nèi)選擇句子級時(shí)間步長,根據(jù)所述句子級時(shí)間步長計(jì)算生成序列的起點(diǎn),并為所述訓(xùn)練文本數(shù)據(jù)集中的每個(gè)令牌分配令牌級時(shí)間步長;
5、通過所述初始擴(kuò)散模型與所述令牌級時(shí)間步長計(jì)算每個(gè)令牌的生成概率,通過生成概率定義損失函數(shù),通過所述損失函數(shù)更新所述初始擴(kuò)散模型的參數(shù),得到目標(biāo)擴(kuò)散模型;
6、獲取輸入數(shù)據(jù),將所述輸入數(shù)據(jù)輸入所述目標(biāo)擴(kuò)散模型,得到目標(biāo)文本序列。
7、在一個(gè)實(shí)施例中,將所述輸入數(shù)據(jù)輸入所述目標(biāo)擴(kuò)散模型,得到目標(biāo)文本序列,包括:
8、將所述輸入數(shù)據(jù)輸入所述目標(biāo)擴(kuò)散模型,并將所述輸入數(shù)據(jù)作為目標(biāo)文本序列的生成起點(diǎn);
9、基于所述目標(biāo)序列擴(kuò)展長度以及所述總擴(kuò)散時(shí)間步長確定遞減時(shí)間步長序列;
10、從標(biāo)準(zhǔn)高斯分布中采樣初始隱變量,并初始化所述初始隱變量得到當(dāng)前隱變量;
11、根據(jù)所述目標(biāo)文本序列的生成起點(diǎn)、所述當(dāng)前隱變量與所述遞減時(shí)間步長序列生成所述目標(biāo)文本序列。
12、在一個(gè)實(shí)施例中,將所述輸入數(shù)據(jù)輸入所述目標(biāo)擴(kuò)散模型,得到目標(biāo)文本序列,包括:
13、根據(jù)總擴(kuò)散時(shí)間步長以及預(yù)設(shè)擴(kuò)散比例確定目標(biāo)擴(kuò)散模型在生成過程中的初期生成階段、中期生成階段和后期生成階段;
14、在初期生成階段,基于預(yù)設(shè)語法規(guī)則的生成策略進(jìn)行文本序列生成;
15、在中期生成階段,基于上下文依賴規(guī)則與中間語義驗(yàn)證規(guī)則的生成策略進(jìn)行文本序列生成;
16、在后期生成階段,基于語法和拼寫檢查規(guī)則的生成策略對初期生成階段和中期生成階段生成的文本序列進(jìn)行校正,得到所述目標(biāo)文本序列。
17、在一個(gè)實(shí)施例中,并為所述訓(xùn)練文本數(shù)據(jù)集中的每個(gè)令牌分配令牌級時(shí)間步長,包括:
18、利用預(yù)訓(xùn)練的語言模型預(yù)測每個(gè)令牌在上下文中的重要性;
19、統(tǒng)計(jì)每個(gè)令牌在所述訓(xùn)練文本數(shù)據(jù)集中的詞頻,并記錄每個(gè)令牌在句子的位置信息;
20、根據(jù)每個(gè)令牌的重要性、詞頻和位置信息確定每個(gè)令牌的令牌權(quán)重,根據(jù)所述每個(gè)令牌的令牌權(quán)重和所述句子級時(shí)間步長確定每個(gè)令牌的令牌級時(shí)間步長。
21、在一個(gè)實(shí)施例中,根據(jù)所述句子級時(shí)間步長計(jì)算生成序列的起點(diǎn),包括:
22、使用所述目標(biāo)序列長度的值減去所述句子級時(shí)間步長的值,得到起點(diǎn)差值,判讀所述起點(diǎn)差值是否小于零;
23、若所述起點(diǎn)差值不小于零,則直接將所述起點(diǎn)差值作為生成序列的起點(diǎn)的位置;
24、若所述起點(diǎn)差值小于零,將起點(diǎn)差值賦零并將其作為生成序列的起點(diǎn)的位置。
25、在一個(gè)實(shí)施例中,通過生成概率定義損失函數(shù),通過所述損失函數(shù)更新所述初始擴(kuò)散模型的參數(shù),得到目標(biāo)擴(kuò)散模型,包括:
26、確定所述初始擴(kuò)散模型的任務(wù)需求,根據(jù)所述任務(wù)需求確定多個(gè)預(yù)設(shè)損失函數(shù)以及各損失函數(shù)的權(quán)重;
27、通過各損失函數(shù)的權(quán)重和所述生成概率定義總的損失函數(shù);
28、通過所述初始擴(kuò)散模型計(jì)算生成概率并累計(jì)損失,通過鏈?zhǔn)椒▌t計(jì)算損失函數(shù)對所述初始擴(kuò)散模型的每個(gè)參數(shù)的偏導(dǎo)數(shù),使用梯度下降算法更新所述初始擴(kuò)散模型的參數(shù),得到所述目標(biāo)擴(kuò)散模型。
29、在一個(gè)實(shí)施例中,定義初始擴(kuò)散模型的目標(biāo)序列擴(kuò)展長度,包括:
30、將所述訓(xùn)練文本數(shù)據(jù)集分割成多個(gè)文本序列,統(tǒng)計(jì)每個(gè)文本序列的實(shí)際長度;
31、根據(jù)每個(gè)文本序列的實(shí)際長度計(jì)算所述訓(xùn)練文本數(shù)據(jù)集中文本序列的平均長度、最大長度、最小長度和標(biāo)準(zhǔn)差,結(jié)合文本生成任務(wù)需求確定目標(biāo)序列的實(shí)際長度;
32、設(shè)定目標(biāo)序列擴(kuò)展長度為目標(biāo)序列的實(shí)際長度的預(yù)設(shè)倍數(shù)。
33、進(jìn)一步地,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種基于擴(kuò)散策略的文本生成裝置,包括:
34、模型初始化模塊,用于獲取訓(xùn)練文本數(shù)據(jù)集,定義初始擴(kuò)散模型的目標(biāo)序列擴(kuò)展長度,確定初始擴(kuò)散模型的總擴(kuò)散時(shí)間步長;
35、生成起點(diǎn)確定模塊,用于在預(yù)設(shè)范圍內(nèi)選擇句子級時(shí)間步長,根據(jù)所述句子級時(shí)間步長計(jì)算生成序列的起點(diǎn),并為所述訓(xùn)練文本數(shù)據(jù)集中的每個(gè)令牌分配令牌級時(shí)間步長;
36、模型訓(xùn)練與參數(shù)優(yōu)化模塊,用于通過所述初始擴(kuò)散模型與所述令牌級時(shí)間步長計(jì)算每個(gè)令牌的生成概率,通過生成概率定義損失函數(shù),通過所述損失函數(shù)更新所述初始擴(kuò)散模型的參數(shù),得到目標(biāo)擴(kuò)散模型;
37、文本生成模塊,用于獲取輸入數(shù)據(jù),將所述輸入數(shù)據(jù)輸入所述目標(biāo)擴(kuò)散模型,得到目標(biāo)文本序列。
38、進(jìn)一步地,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種基于擴(kuò)散策略的文本生成設(shè)備,所述基于擴(kuò)散策略的文本生成設(shè)備包括存儲器、處理器以及存儲在所述存儲器上并可在所述處理器上運(yùn)行的基于擴(kuò)散策略的文本生成程序,所述基于擴(kuò)散策略的文本生成程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述所述的基于擴(kuò)散策略的文本生成方法的步驟。
39、進(jìn)一步地,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種計(jì)算機(jī)存儲介質(zhì),所述存儲介質(zhì)上存儲有基于擴(kuò)散策略的文本生成程序,所述基于擴(kuò)散策略的文本生成程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的基于擴(kuò)散策略的文本生成方法的步驟。
40、有益效果:本發(fā)明涉及一種基于擴(kuò)散策略的文本生成方法,通過獲取訓(xùn)練文本數(shù)據(jù)集,并定義初始擴(kuò)散模型的目標(biāo)序列擴(kuò)展長度并確定總擴(kuò)散時(shí)間步長。在生成過程中,首先在預(yù)設(shè)范圍內(nèi)選擇句子級時(shí)間步長,計(jì)算生成序列的起點(diǎn),并為每個(gè)令牌分配相應(yīng)的令牌級時(shí)間步長。通過這些時(shí)間步長,模型能夠動(dòng)態(tài)調(diào)整每個(gè)令牌的生成順序和步長,以適應(yīng)自然語言的順序依賴特性。在此基礎(chǔ)上,模型通過計(jì)算每個(gè)令牌的生成概率,定義和優(yōu)化損失函數(shù),最終通過梯度下降等優(yōu)化方法更新模型參數(shù),得到目標(biāo)擴(kuò)散模型。本發(fā)明能夠接受輸入數(shù)據(jù),生成符合上下文邏輯的目標(biāo)文本序列,從而有效解決了文本生成過程中順序依賴性的問題,確保生成內(nèi)容的邏輯連貫性和語義合理性。