本發(fā)明涉及智能教育,特別涉及一種基于llm的多源教育信息的推薦方法及裝置。
背景技術(shù):
1、k12教育中具有一系列的場(chǎng)景需求,如資訊查詢、知識(shí)點(diǎn)查詢、試題獲取、試題評(píng)估和能力評(píng)估等需求。市面上存在的學(xué)科教育類平臺(tái)基本都是數(shù)據(jù)展示的平臺(tái),無(wú)法滿足上述多種場(chǎng)景需求,并且檢索還停留在關(guān)鍵詞匹配的階段,無(wú)法實(shí)現(xiàn)用戶需求的精準(zhǔn)匹配。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本發(fā)明的目的在于提供一種基于llm的多源教育信息的推薦方法及裝置,旨在解決現(xiàn)有技術(shù)中的教育類平臺(tái)無(wú)法滿足教育多場(chǎng)景需求和精準(zhǔn)推薦的問(wèn)題。
2、本發(fā)明一方面提出一種基于llm的多源教育信息的推薦方法,所述方法包括:
3、分別采集教育資訊信息、學(xué)科知識(shí)信息以及學(xué)科試題信息,分別對(duì)所述教育資訊信息、學(xué)科知識(shí)信息以及學(xué)科試題信息利用文檔切片進(jìn)行文本向量化,后存入向量數(shù)據(jù)庫(kù)中得到多源教育信息數(shù)據(jù)庫(kù);
4、當(dāng)用戶發(fā)起學(xué)科知識(shí)、教育資訊相關(guān)的請(qǐng)求時(shí),獲取請(qǐng)求內(nèi)容并通過(guò)llm進(jìn)行意圖分析,根據(jù)意圖分析結(jié)果從多源教育信息數(shù)據(jù)庫(kù)當(dāng)中檢索出請(qǐng)求對(duì)應(yīng)的目標(biāo)信息;
5、當(dāng)用戶的請(qǐng)求中有查找相關(guān)試題的需求,通過(guò)llm向負(fù)責(zé)試題檢索的agent工具發(fā)起檢索需求,利用agent工具從多源教育信息數(shù)據(jù)庫(kù)獲取目標(biāo)試題。
6、進(jìn)一步的,上述多源教育信息的推薦方法,其中,所述利用文檔切片進(jìn)行文本向量化的步驟包括:
7、對(duì)獲取的文檔進(jìn)行預(yù)處理,其中,預(yù)處理包括去噪、標(biāo)準(zhǔn)化以及段落分割;
8、利用預(yù)設(shè)的句法分析算法對(duì)段落內(nèi)容進(jìn)行語(yǔ)義分析,根據(jù)分析結(jié)果對(duì)段落內(nèi)容進(jìn)行切片;
9、對(duì)切片后的內(nèi)容進(jìn)行結(jié)構(gòu)分析和利用上下文窗口進(jìn)行滑動(dòng)分析,后進(jìn)行切片內(nèi)容的調(diào)整以保證每個(gè)切片內(nèi)容的長(zhǎng)度在預(yù)設(shè)范圍;
10、將切片內(nèi)容輸入至預(yù)訓(xùn)練語(yǔ)言模型當(dāng)中進(jìn)行向量化,以對(duì)切片內(nèi)容進(jìn)行文本向量化。
11、進(jìn)一步的,上述多源教育信息的推薦方法,其中,所述獲取請(qǐng)求內(nèi)容并通過(guò)llm進(jìn)行意圖分析的步驟包括:
12、獲取請(qǐng)求內(nèi)容的語(yǔ)言含義、上下文信息識(shí)別出請(qǐng)求內(nèi)容的指令類型和具體領(lǐng)域;
13、識(shí)別請(qǐng)求內(nèi)容的語(yǔ)義信息,結(jié)合請(qǐng)求內(nèi)容的指令類型和具體領(lǐng)域確定請(qǐng)求內(nèi)容的意圖。
14、進(jìn)一步的,上述多源教育信息的推薦方法,其中,所述根據(jù)意圖分析結(jié)果從多源教育信息數(shù)據(jù)庫(kù)當(dāng)中檢索出請(qǐng)求對(duì)應(yīng)的目標(biāo)信息的步驟包括:
15、獲取用戶的畫(huà)像特征信息,根據(jù)所述畫(huà)像特征信息以及意圖分析結(jié)果從多源教育信息數(shù)據(jù)庫(kù)當(dāng)中檢索出請(qǐng)求對(duì)應(yīng)的目標(biāo)信息;
16、其中,通過(guò)分析用戶關(guān)于學(xué)科知識(shí)的問(wèn)題,結(jié)合用戶所屬的年級(jí)確定該年級(jí)的學(xué)生對(duì)于目標(biāo)信息的整體掌握水平,從而對(duì)比出用戶在所屬年級(jí)階段內(nèi)的學(xué)科水平;
17、獲取用戶對(duì)于相關(guān)試題的測(cè)試結(jié)果,根據(jù)測(cè)試結(jié)果以及學(xué)科水平確定用戶目標(biāo)學(xué)科水平,從而確定用戶的畫(huà)像特征信息。
18、進(jìn)一步的,上述多源教育信息的推薦方法,其中,所述方法還包括:
19、當(dāng)用戶的請(qǐng)求目的為查詢信息,根據(jù)用戶的查詢主題,從多源教育信息數(shù)據(jù)庫(kù)當(dāng)中檢索相關(guān)的信息或資訊反饋給用戶;
20、當(dāng)用戶的請(qǐng)求目的為咨詢意見(jiàn),獲取咨詢意見(jiàn)當(dāng)中涉及到的主題從多源教育信息數(shù)據(jù)庫(kù)當(dāng)中檢索相關(guān)的主題后,總結(jié)提煉后反饋給用戶;
21、當(dāng)用戶的請(qǐng)求目的為給出創(chuàng)意類提示,基于請(qǐng)求對(duì)應(yīng)的相關(guān)資訊進(jìn)行發(fā)散給出創(chuàng)意建議。
22、進(jìn)一步的,上述多源教育信息的推薦方法,其中,所述分別采集教育資訊信息、學(xué)科知識(shí)信息以及學(xué)科試題信息的步驟包括:
23、通過(guò)爬蟲(chóng)系統(tǒng)從門(mén)戶網(wǎng)站中實(shí)時(shí)抓取教育資訊信息,從預(yù)設(shè)的學(xué)科知識(shí)數(shù)據(jù)庫(kù)和學(xué)科試題數(shù)據(jù)庫(kù)分別采集學(xué)科知識(shí)信息以及學(xué)科試題信息。
24、本發(fā)明的另一個(gè)目的在于提供一種基于llm的多源教育信息的推薦裝置,所述裝置包括:
25、獲取模塊,用于分別采集教育資訊信息、學(xué)科知識(shí)信息以及學(xué)科試題信息,分別對(duì)所述教育資訊信息、學(xué)科知識(shí)信息以及學(xué)科試題信息利用文檔切片進(jìn)行文本向量化,后存入向量數(shù)據(jù)庫(kù)中得到多源教育信息數(shù)據(jù)庫(kù);
26、第一檢索模塊,用于當(dāng)用戶發(fā)起學(xué)科知識(shí)、教育資訊相關(guān)的請(qǐng)求時(shí),獲取請(qǐng)求內(nèi)容并通過(guò)llm進(jìn)行意圖分析,根據(jù)意圖分析結(jié)果從多源教育信息數(shù)據(jù)庫(kù)當(dāng)中檢索出請(qǐng)求對(duì)應(yīng)的目標(biāo)信息;
27、第二檢索模塊,用于當(dāng)用戶的請(qǐng)求中有查找相關(guān)試題的需求,通過(guò)llm向負(fù)責(zé)試題檢索的agent工具發(fā)起檢索需求,利用agent工具從多源教育信息數(shù)據(jù)庫(kù)獲取目標(biāo)試題。
28、本發(fā)明的另一個(gè)目的在于提供一種可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述的方法的步驟。
29、本發(fā)明的另一個(gè)目的是提供一種電子設(shè)備,包括存儲(chǔ)器、處理器以及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)上述的方法的步驟。
30、本發(fā)明通過(guò)分別采集教育資訊信息、學(xué)科知識(shí)信息以及學(xué)科試題信息,分別對(duì)教育資訊信息、學(xué)科知識(shí)信息以及學(xué)科試題信息利用文檔切片進(jìn)行文本向量化,后存入向量數(shù)據(jù)庫(kù)中得到多源教育信息數(shù)據(jù)庫(kù),融合了教育當(dāng)中的多種場(chǎng)景所需的信息;當(dāng)用戶發(fā)起學(xué)科知識(shí)、教育資訊相關(guān)的請(qǐng)求時(shí),獲取請(qǐng)求內(nèi)容并通過(guò)llm進(jìn)行意圖分析,根據(jù)意圖分析結(jié)果從多源教育信息數(shù)據(jù)庫(kù)當(dāng)中檢索出請(qǐng)求對(duì)應(yīng)的目標(biāo)信息;當(dāng)用戶的請(qǐng)求中有查找相關(guān)試題的需求,通過(guò)llm向負(fù)責(zé)試題檢索的agent工具發(fā)起檢索需求,利用agent工具從多源教育信息數(shù)據(jù)庫(kù)獲取目標(biāo)試題,針對(duì)不同的實(shí)際需求,通過(guò)llm進(jìn)行意圖分析,并給出個(gè)性化精準(zhǔn)推薦。解決了現(xiàn)有技術(shù)中的教育類平臺(tái)無(wú)法滿足教育多場(chǎng)景需求和精準(zhǔn)推薦的問(wèn)題。
1.一種基于llm的多源教育信息的推薦方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的基于llm的多源教育信息的推薦方法,其特征在于,所述獲取請(qǐng)求內(nèi)容并通過(guò)llm進(jìn)行意圖分析的步驟包括:
3.根據(jù)權(quán)利要求1所述的基于llm的多源教育信息的推薦方法,其特征在于,所述根據(jù)意圖分析結(jié)果從多源教育信息數(shù)據(jù)庫(kù)當(dāng)中檢索出請(qǐng)求對(duì)應(yīng)的目標(biāo)信息的步驟包括:
4.根據(jù)權(quán)利要求1所述的基于llm的多源教育信息的推薦方法,其特征在于,所述方法還包括:
5.根據(jù)權(quán)利要求1所述的基于llm的多源教育信息的推薦方法,其特征在于,所述分別采集教育資訊信息、學(xué)科知識(shí)信息以及學(xué)科試題信息的步驟包括:
6.一種基于llm的多源教育信息的推薦裝置,其特征在于,用于實(shí)現(xiàn)權(quán)利要求1至5中任意一項(xiàng)所述的基于llm的多源教育信息的推薦方法,所述裝置包括:
7.一種可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至5中任意一項(xiàng)所述的方法的步驟。
8.一種電子設(shè)備,其特征在于,包括存儲(chǔ)器、處理器以及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至5中任意一項(xiàng)所述的方法的步驟。