两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種重塑邏輯演繹鏈的搜索方法

文檔序號(hào):9417377閱讀:349來(lái)源:國(guó)知局
一種重塑邏輯演繹鏈的搜索方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于人大立法系統(tǒng)知識(shí)保障搜索領(lǐng)域,特別涉及一種在人大立法時(shí)使用的 重塑邏輯演繹鏈的搜索方法。
【背景技術(shù)】
[0002] 現(xiàn)今的立法質(zhì)量與經(jīng)濟(jì)社會(huì)發(fā)展的新要求、人民群眾的新期待還存有差距。其主 要表現(xiàn)為:1、中國(guó)特色社會(huì)主義法律體系雖然已經(jīng)形成,但還不夠完善,仍存在著相關(guān)社 會(huì)領(lǐng)域子法缺失、缺少配套規(guī)定和管理辦法等問(wèn)題。法律的規(guī)定相互矛盾、不明確、過(guò)于籠 統(tǒng)、模棱兩可、不嚴(yán)謹(jǐn)、難以貫徹實(shí)施、內(nèi)容嚴(yán)重滯后。2、公民提出法案動(dòng)議案及意見(jiàn)渠道急 需拓寬,社會(huì)上具有政治參與要求和能力的公民未能有序地參與到政治體系和決策過(guò)程中 來(lái),未能完全將科學(xué)與民主貫徹于立法程序的各個(gè)環(huán)節(jié)。3、立法后評(píng)估工作尚未啟動(dòng),無(wú)法 檢驗(yàn)立法質(zhì)量,無(wú)法總結(jié)提煉規(guī)律性的內(nèi)容用于指導(dǎo)今后的立法工作。4、參與立法工作的 人大代表雖然是各行業(yè)精英,但受限于工作領(lǐng)域和專(zhuān)業(yè)范圍的約束,往往難以準(zhǔn)確理解把 握審議表決的內(nèi)容,無(wú)從做出正確決策,無(wú)法將數(shù)據(jù)和信息高效地演化重塑成為滿(mǎn)足自身 需要的知識(shí)、情報(bào)和方案。
[0003] 當(dāng)前民主法制信息化建設(shè)中的立法業(yè)務(wù)系統(tǒng)主要針對(duì)立法工作的全過(guò)程進(jìn)行痕 跡管理,從立法建議的提出,立法規(guī)劃、計(jì)劃的產(chǎn)生,年度立法工作安排,起草法律草案前通 過(guò)調(diào)研、論證、聽(tīng)證、座談、網(wǎng)絡(luò)等各種方式收集資料、征求意見(jiàn)、草擬大綱等各項(xiàng)準(zhǔn)備工作, 法律草案的起草工作,法律草案起草后的專(zhuān)門(mén)委員會(huì)、常委會(huì)和大會(huì)審議,以及審議過(guò)程中 的征求意見(jiàn)工作,直到最后法律的通過(guò)和歸檔等。然而,上述信息化僅僅只是側(cè)重于機(jī)關(guān)辦 公的自動(dòng)化與業(yè)務(wù)流程的電子化,沒(méi)有涉及到與立法內(nèi)容相關(guān)的知識(shí)精煉和動(dòng)態(tài)現(xiàn)狀,沒(méi) 有知識(shí)保障信息機(jī)制、公眾參與信息機(jī)制,對(duì)象信息交互機(jī)制等,也就無(wú)法支撐立法質(zhì)量提 升這一人大履職使命的完成;此外,由于采取的是獨(dú)立封閉、粗放離散的建設(shè)方式,人大難 以與政府、法院、檢察院等相關(guān)政務(wù)部門(mén)形成協(xié)同互動(dòng)和資源共享的集約化發(fā)展模式。
[0004] 立法業(yè)務(wù)信息化的技術(shù)路徑選擇:
[0005] 基于分類(lèi)目錄與層層點(diǎn)擊查詢(xún)的信息搜索,其特點(diǎn)是"求全面"?;诔溄臃治?與機(jī)器抓取技術(shù)的信息搜索,其特點(diǎn)是"求精準(zhǔn)"。具有互動(dòng)模式并嘗試捕捉用戶(hù)查詢(xún)意圖, 且查詢(xún)更加精準(zhǔn)的信息搜索,其特點(diǎn)是"求專(zhuān)業(yè)"。
[0006] 如果說(shuō)上述三類(lèi)信息搜索方式是將太平洋中的水變成了青海湖,那么人大立法系 統(tǒng)的技術(shù)路徑則是下一代信息搜索引擎發(fā)展方向的主角,它呈現(xiàn)給用戶(hù)的是一個(gè)動(dòng)靜活潑 的青海湖生態(tài)系統(tǒng),為用戶(hù)在認(rèn)知上帶來(lái)更加直觀的體驗(yàn)。其通過(guò)人工智能與搜索技術(shù)相 結(jié)合,實(shí)現(xiàn)概念定義、背景原因、發(fā)展?fàn)顟B(tài)、手段措施等多知識(shí)的智能關(guān)聯(lián),從而實(shí)現(xiàn)專(zhuān)業(yè) 化、領(lǐng)域化和個(gè)性化搜索的目標(biāo),特點(diǎn)是"求理解"。

【發(fā)明內(nèi)容】

[0007] 本發(fā)明的目的在于克服上述立法信息不全面能掌控的問(wèn)題,提供一種重塑邏輯演 繹鏈的搜索方法,使人能準(zhǔn)確把握經(jīng)濟(jì)社會(huì)發(fā)展規(guī)律和現(xiàn)實(shí)社會(huì)利益矛盾,以提高立法的 質(zhì)量。
[0008] 為了實(shí)現(xiàn)上述目的,本發(fā)明采用以下技術(shù)方案實(shí)現(xiàn):
[0009] -種重塑邏輯演繹鏈的搜索方法,包括以下步驟:
[0010] A、建立專(zhuān)業(yè)范疇標(biāo)簽庫(kù);
[0011] B、建立邏輯特征詞庫(kù);
[0012] C、通過(guò)標(biāo)簽庫(kù)與特征詞庫(kù)得到搜索詞,將搜索詞擴(kuò)展成為關(guān)鍵詞域;
[0013] D、通過(guò)關(guān)鍵詞域形成以具體邏輯分類(lèi)為單元的文段庫(kù);
[0014] E、將文段庫(kù)中的數(shù)據(jù)內(nèi)容優(yōu)化關(guān)聯(lián)組織成為邏輯樹(shù);
[0015] 步驟A的具體方法是:收集整理與立法主題領(lǐng)域相關(guān)的法律法規(guī)、部門(mén)規(guī)章、政策 規(guī)劃和領(lǐng)導(dǎo)講話(huà),以及統(tǒng)計(jì)制度及其相關(guān)指標(biāo)解釋資料,提煉資料中的要素對(duì)象作為標(biāo)簽 詞,形成分類(lèi)分級(jí)的標(biāo)簽詞庫(kù);
[0016] 步驟B的建立方法是對(duì)立法主題領(lǐng)域內(nèi)的政府公文和學(xué)術(shù)論著在文段級(jí)予以標(biāo) 識(shí),每個(gè)擁有明確標(biāo)識(shí)的文段均視為數(shù)據(jù)庫(kù)中的一個(gè)數(shù)據(jù),并將每個(gè)詞作為一個(gè)項(xiàng)目,使用 類(lèi)Apriori的關(guān)聯(lián)規(guī)則算法挖掘出文段級(jí)的頻繁詞集,并以此作為詞組庫(kù),將不同的詞組 庫(kù)通過(guò)邏輯關(guān)系進(jìn)行關(guān)聯(lián),最終建立邏輯特征詞庫(kù);
[0017] 步驟C采用Sunday字符串匹配的方法,將關(guān)鍵詞投影至專(zhuān)業(yè)范疇標(biāo)簽詞庫(kù)中,疊 加邏輯特征詞組,最終形成關(guān)鍵詞域;
[0018] 步驟D利用關(guān)鍵詞域中的不同關(guān)鍵詞,在預(yù)置的網(wǎng)絡(luò)資源庫(kù)中匹配尋找相關(guān)信 息,并形成符合邏輯特征詞庫(kù)中邏輯分類(lèi)的文段庫(kù);
[0019] 步驟E是通過(guò)相似聚類(lèi)和最小樹(shù)生成的優(yōu)化關(guān)聯(lián)方法,將文段組織擬合為認(rèn)知適 應(yīng)性激勵(lì)下的邏輯脈絡(luò)樹(shù)。
[0020] 步驟B中的類(lèi)Apriori的關(guān)聯(lián)規(guī)則算法如下:
[0021] (1)產(chǎn)生頻繁詞集;掃描文獻(xiàn)數(shù)據(jù)庫(kù)產(chǎn)生一項(xiàng)頻繁詞集L1;
[0022] (2)連接;在k次掃描時(shí),其中k>l,采用遞推的連接方法求k項(xiàng)頻繁詞集Lk,用L k 1 與自身作連接產(chǎn)生候選k項(xiàng)詞集Ck;
[0023] (3)剪枝產(chǎn)生邏輯特征詞庫(kù);設(shè):cke C k,即Ck是一個(gè)候選k項(xiàng)詞集,c k i是c ,的 一個(gè)(k-Ι)項(xiàng)子詞集,若滿(mǎn)足Ck i不屬于L k i,則有Ck不屬于L k,即候選k項(xiàng)詞集Ck應(yīng)該從 候選k項(xiàng)詞集的集合Ck中刪除,直至剪枝完畢最終得出邏輯特征詞庫(kù)F p F2, F3,……,F(xiàn)n。
[0024] 步驟C的具體計(jì)算方法如下:
[0025] (1)采用Sunday字符串匹配的方法,將含有立法搜索關(guān)鍵詞的專(zhuān)業(yè)范疇標(biāo)簽詞篩 選出來(lái)(Wkl,wk2, wk3,......,Wkt);
[0026] (2)以字符串連接的方式,將專(zhuān)業(yè)范疇標(biāo)簽詞與旨在區(qū)分F = (F概念定義、F龍?jiān)?、F 發(fā)展?fàn)顟B(tài)、rV段措施)的邏輯特征詞組進(jìn)行疊加,形成關(guān)鍵詞域(wki+F,Wk2+F,w k3+F,......,wkt+F)。
[0027] 所述步驟E中的優(yōu)化關(guān)聯(lián)方法包括AP算法與類(lèi)Prim最小生成樹(shù)的構(gòu)造算法兩 步。
[0028] 所述AP算法的目標(biāo)是將相似的文段歸為一簇,不相似的文段劃分到不同簇中;AP 算法對(duì)文段劃分不同簇的具體步驟如下:
[0029] (1)計(jì)算文段間的向量余弦值,并生成初始相似度矩陣S ;
[0030] (2)分別計(jì)算文段間的 Responsibility 值和 Availability 值;
[0031] (3)評(píng)判S矩陣的對(duì)角線(xiàn)數(shù)值作為k點(diǎn)能否成為聚類(lèi)中心,若該值越大,則這個(gè)點(diǎn) 成為聚類(lèi)中心的可能性就越大,即不斷更新Responsibi Iity值和Avai Iabi Iity值;如果迭 代次數(shù)超過(guò)設(shè)定的最大值或者當(dāng)聚類(lèi)中心在若干次迭代中不發(fā)生改變時(shí)終止計(jì)算,確定中 心及各類(lèi)的樣本點(diǎn);否則返回步驟(2),繼續(xù)計(jì)算。
[0032] 文段間的向量余弦值的計(jì)算方法如下:
[0033] (1)面對(duì)歸屬于不同資料文獻(xiàn)的文段,使用中文分詞軟件進(jìn)行分詞預(yù)處理,基于向 量空間模型將文段表達(dá)為一組規(guī)范化正交詞條矢量Wl j, W2j,…,Wtj;W l j= TF IDF1JF表 H 示詞條i在文段j中出現(xiàn)的次數(shù),a 表示逆文檔頻率,其中,N表示文段集合中 所有的文段數(shù)目,Ii1表示整個(gè)文段集合中出現(xiàn)過(guò)詞條i的文段的總數(shù);
[0034] (2)在概念定義、根源癥結(jié)、發(fā)展?fàn)顟B(tài)、手段措施的各自范圍內(nèi),以基于向量余弦 值法的相似度計(jì)算,以及無(wú)需制定聚類(lèi)數(shù)目的Affinity Propagation(AP)算法實(shí)現(xiàn)文段 聚類(lèi);采用向量余弦值的方法計(jì)算文段相似度,對(duì)于文段集中的兩個(gè)文段向量(W11, W21,…,Wti)(Wlj, W2j,…,Wtj),它們之間的向量余弦值為:
[0035]
5
[0036] 其中,m為第i篇文檔和第j篇文檔共同的不重復(fù)的特征數(shù)量,Wlk表示第i篇文 檔中第k個(gè)特征項(xiàng)的權(quán)重,W jk表
當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
荣成市| 当雄县| 册亨县| 和田县| 甘孜县| 额济纳旗| 慈利县| 武城县| 永兴县| 图片| 聂荣县| 山西省| 澜沧| 浑源县| 图们市| 大港区| 津南区| 富宁县| 资阳市| 祁门县| 渝北区| 清新县| 南川市| 湘阴县| 麟游县| 炎陵县| 利辛县| 崇信县| 宁城县| 乌什县| 辽宁省| 平和县| 保亭| 吕梁市| 日照市| 成安县| 综艺| 武功县| 盘山县| 宣武区| 肥城市|