两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

建設(shè)行業(yè)工程量計(jì)價(jià)清單數(shù)據(jù)自動(dòng)編碼與識(shí)別方法及系統(tǒng)與流程

文檔序號(hào):12825818閱讀:520來(lái)源:國(guó)知局
建設(shè)行業(yè)工程量計(jì)價(jià)清單數(shù)據(jù)自動(dòng)編碼與識(shí)別方法及系統(tǒng)與流程

本發(fā)明屬于建設(shè)行業(yè)工程數(shù)據(jù)分析領(lǐng)域,具體涉及一種建設(shè)行業(yè)工程量計(jì)價(jià)清單數(shù)據(jù)自動(dòng)編碼與識(shí)別方法及系統(tǒng)。



背景技術(shù):

在建設(shè)行業(yè),各個(gè)企業(yè)要實(shí)現(xiàn)建設(shè)工程項(xiàng)目的全過(guò)程管理,需要對(duì)海量的工程項(xiàng)目數(shù)據(jù)(例如工程量計(jì)價(jià)清單數(shù)據(jù))進(jìn)行對(duì)比、分析、預(yù)警、總結(jié)等等。各省份所采用的清單計(jì)價(jià)規(guī)范偏差較大,或者采用不同版本的清單計(jì)價(jià)規(guī)范,編碼不統(tǒng)一,工程項(xiàng)目數(shù)據(jù)難以在計(jì)算機(jī)系統(tǒng)中統(tǒng)一識(shí)別和調(diào)用,通常只能靠人工經(jīng)驗(yàn)進(jìn)行判斷,效率低、成本高,準(zhǔn)確性差。導(dǎo)致在建設(shè)工程項(xiàng)目全過(guò)程管理中無(wú)法準(zhǔn)確有效的進(jìn)行成本管控和預(yù)警。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明針對(duì)現(xiàn)有技術(shù)中計(jì)價(jià)清單數(shù)據(jù)難以識(shí)別、分析所導(dǎo)致的效率低以及成本高等問(wèn)題,提出一種建設(shè)行業(yè)工程量計(jì)價(jià)清單數(shù)據(jù)自動(dòng)編碼與識(shí)別方法,同時(shí)相應(yīng)提出一種建設(shè)行業(yè)工程量計(jì)價(jià)清單數(shù)據(jù)自動(dòng)編碼與識(shí)別系統(tǒng)的結(jié)構(gòu)方案。

本發(fā)明提出的一種建設(shè)行業(yè)工程量計(jì)價(jià)清單數(shù)據(jù)自動(dòng)編碼與識(shí)別方法,主要包括以下步驟a1至步驟a6:

a1、獲取計(jì)價(jià)清單數(shù)據(jù),根據(jù)統(tǒng)一的標(biāo)準(zhǔn)清單編碼規(guī)范對(duì)所述計(jì)價(jià)清單數(shù)據(jù)中的清單編碼進(jìn)行標(biāo)準(zhǔn)化處理,提取標(biāo)準(zhǔn)的分項(xiàng)編碼,并過(guò)濾錯(cuò)誤的清單編碼;

a2、將所述計(jì)價(jià)清單數(shù)據(jù)中由自然語(yǔ)言描述的清單名稱、清單特征詞匯進(jìn)行分詞處理,并提取關(guān)鍵詞;

a3、將提取的關(guān)鍵詞通過(guò)決策樹(shù)算法自動(dòng)生成關(guān)鍵詞組合,結(jié)合分項(xiàng)編碼,形成關(guān)鍵詞規(guī)則數(shù)據(jù),并運(yùn)用機(jī)器學(xué)習(xí)方式維護(hù)及完善預(yù)置的關(guān)鍵詞規(guī)則庫(kù);

a4、將所述計(jì)價(jià)清單數(shù)據(jù)中提取出的關(guān)鍵詞在所述關(guān)鍵詞規(guī)則庫(kù)進(jìn)行匹配分析,結(jié)合分項(xiàng)編碼仲裁所述計(jì)價(jià)清單數(shù)據(jù)所屬的類別,將其清單編碼進(jìn)一步識(shí)別為預(yù)設(shè)位數(shù)的標(biāo)準(zhǔn)清單編碼;

a5、基于識(shí)別出的預(yù)設(shè)位數(shù)的標(biāo)準(zhǔn)清單編碼,識(shí)別所述計(jì)價(jià)清單數(shù)據(jù)所屬的工程專業(yè)、分部工程以及分項(xiàng)工程;

a6、基于識(shí)別出的預(yù)設(shè)位數(shù)的標(biāo)準(zhǔn)清單編碼,對(duì)所述計(jì)價(jià)清單數(shù)據(jù)包含的人工、材料、機(jī)械設(shè)備的具體要求進(jìn)行清單指引編碼。

本發(fā)明的一優(yōu)選方案中,所述步驟a1之前還包括:

a0、將各地及各版本的清單計(jì)價(jià)規(guī)范中的編碼與標(biāo)準(zhǔn)清單計(jì)價(jià)規(guī)范中的編碼進(jìn)行一一對(duì)應(yīng),形成統(tǒng)一的標(biāo)準(zhǔn)清單編碼;所述標(biāo)準(zhǔn)清單編碼包括四個(gè)層級(jí),從主到次分別為:專業(yè)編碼、分部編碼、分項(xiàng)編碼、清單編碼,分別與計(jì)價(jià)清單數(shù)據(jù)所屬的工程專業(yè)、分部工程以及分項(xiàng)工程、計(jì)價(jià)清單對(duì)應(yīng)。

本發(fā)明的一優(yōu)選方案中,所述預(yù)設(shè)位數(shù)的標(biāo)準(zhǔn)清單編碼為9位編碼,該9位編碼的前2位為專業(yè)編碼,前4位為分部編碼,前6位為分項(xiàng)編碼,全部9位唯一對(duì)應(yīng)一組計(jì)價(jià)清單編碼。當(dāng)然,標(biāo)準(zhǔn)清單編碼及各層級(jí)的位數(shù)可根據(jù)具體情況設(shè)置。

本發(fā)明的一優(yōu)選方案中,所述步驟a3中預(yù)置關(guān)鍵詞規(guī)則庫(kù)的方法包括:

a31、以計(jì)價(jià)清單數(shù)據(jù)對(duì)應(yīng)規(guī)范化編碼的方式形成數(shù)據(jù)訓(xùn)練集,對(duì)計(jì)價(jià)清單數(shù)據(jù)的清單名稱和清單特征詞匯進(jìn)行分詞處理,以獲取關(guān)鍵詞;

a32、通過(guò)決策樹(shù)算法將獲取的關(guān)鍵詞進(jìn)行組合,結(jié)合分項(xiàng)編碼,形成關(guān)鍵詞規(guī)則庫(kù);

a33、以加入新的數(shù)據(jù)訓(xùn)練集形成新的關(guān)鍵詞組合,并通過(guò)機(jī)器學(xué)習(xí)方式完善關(guān)鍵詞規(guī)則庫(kù),保證編碼的準(zhǔn)確性。

本發(fā)明的一優(yōu)選方案中,所述步驟a4包括:

a41、若匹配到的關(guān)鍵詞組合在關(guān)鍵詞規(guī)則庫(kù)中只對(duì)應(yīng)一個(gè)標(biāo)準(zhǔn)清單編碼,則直接獲取該標(biāo)準(zhǔn)清單編碼;若匹配到的關(guān)鍵詞組合對(duì)應(yīng)多個(gè)標(biāo)準(zhǔn)清單編碼,則加上標(biāo)準(zhǔn)的分項(xiàng)編碼進(jìn)行仲裁得到唯一的標(biāo)準(zhǔn)清單編碼;

a42、若匹配到的關(guān)鍵詞組合在規(guī)則庫(kù)中無(wú)對(duì)應(yīng)的標(biāo)準(zhǔn)清單編碼,則先對(duì)該關(guān)鍵詞組合進(jìn)行降維算法重新提取關(guān)鍵詞組合,并將該關(guān)鍵詞組合重新執(zhí)行步驟a41進(jìn)行匹配分析,根據(jù)最高匹配度確定唯一的標(biāo)準(zhǔn)清單編碼。

本發(fā)明的一可選方案中,所述各地清單計(jì)價(jià)規(guī)范包括各省份的清單計(jì)價(jià)規(guī)范,所述各版本的清單計(jì)價(jià)規(guī)范包括《gb50500-2008建設(shè)工程工程量清單計(jì)價(jià)規(guī)范》,所述標(biāo)準(zhǔn)清單計(jì)價(jià)規(guī)范為《gb50500-2013建設(shè)工程工程量清單計(jì)價(jià)規(guī)范》。

本發(fā)明相應(yīng)提出的一種建設(shè)行業(yè)工程量計(jì)價(jià)清單數(shù)據(jù)自動(dòng)編碼與識(shí)別系統(tǒng)的結(jié)構(gòu)方案,主要包括規(guī)范化模塊、分詞模塊、維護(hù)及完善模塊、匹配分析模塊、存儲(chǔ)模塊以及指引編碼模塊;

所述規(guī)范化模塊,用于獲取計(jì)價(jià)清單數(shù)據(jù),根據(jù)統(tǒng)一的標(biāo)準(zhǔn)清單編碼對(duì)其清單編碼進(jìn)行規(guī)范化處理,從中提取標(biāo)準(zhǔn)的分項(xiàng)編碼,并過(guò)濾錯(cuò)誤的清單編碼;

所述分詞模塊,用于將計(jì)價(jià)清單數(shù)據(jù)中由自然語(yǔ)言描述的清單名稱、清單特征詞匯進(jìn)行分詞處理,并提取關(guān)鍵詞;

所述維護(hù)及完善模塊,用于將提取的關(guān)鍵詞通過(guò)決策樹(shù)算法自動(dòng)生成關(guān)鍵詞組合,結(jié)合分項(xiàng)編碼,形成關(guān)鍵詞規(guī)則數(shù)據(jù),并運(yùn)用機(jī)器學(xué)習(xí)方式維護(hù)及完善預(yù)置的關(guān)鍵詞規(guī)則庫(kù);

所述匹配分析模塊,用于將計(jì)價(jià)清單數(shù)據(jù)中提取出的關(guān)鍵詞在關(guān)鍵詞規(guī)則庫(kù)進(jìn)行匹配分析,結(jié)合分項(xiàng)編碼仲裁計(jì)價(jià)清單數(shù)據(jù)所屬的類別,將其清單編碼進(jìn)一步識(shí)別為預(yù)設(shè)位數(shù)的標(biāo)準(zhǔn)清單編碼,以及進(jìn)一步識(shí)別計(jì)價(jià)清單數(shù)據(jù)所屬的工程專業(yè)、分部工程以及分項(xiàng)工程;

所述存儲(chǔ)模塊,用于將識(shí)別出所屬的工程專業(yè)、分部工程以及分項(xiàng)工程的計(jì)價(jià)清單數(shù)據(jù)分為工程專業(yè)、分部工程、分項(xiàng)工程以及計(jì)價(jià)清單四個(gè)層級(jí)進(jìn)行存儲(chǔ);

所述指引編碼模塊,用于基于識(shí)別出的預(yù)設(shè)位數(shù)的標(biāo)準(zhǔn)清單編碼,對(duì)計(jì)價(jià)清單數(shù)據(jù)包含的人工、材料、機(jī)械設(shè)備的具體要求進(jìn)行清單指引編碼。

本發(fā)明的一優(yōu)選方案中,還包括統(tǒng)一編碼模塊,所述統(tǒng)一編碼模塊用于將各地及各版本的清單計(jì)價(jià)規(guī)范中的編碼與標(biāo)準(zhǔn)清單計(jì)價(jià)規(guī)范中的編碼進(jìn)行一一對(duì)應(yīng),形成統(tǒng)一的標(biāo)準(zhǔn)清單編碼。

本發(fā)明至少具備以下有益效果:

1、經(jīng)過(guò)處理后的各計(jì)價(jià)清單數(shù)據(jù)將具有唯一對(duì)應(yīng)的編碼,可實(shí)現(xiàn)智能識(shí)別、轉(zhuǎn)換、分析、歸類、統(tǒng)計(jì)等功能的自動(dòng)化,無(wú)需人工操作,有助于提高工作效率,降低企業(yè)成本,更快推進(jìn)建設(shè)工程項(xiàng)目的投資分析以及全過(guò)程造價(jià)管理。

2、能夠智能識(shí)別計(jì)價(jià)清單數(shù)據(jù)的專業(yè)、分部工程、分項(xiàng)工程、計(jì)價(jià)清單等數(shù)據(jù),形成以計(jì)價(jià)清單為基礎(chǔ)的清單指引,并可進(jìn)行人工、材料、機(jī)械設(shè)備的定額及價(jià)格匹配,以便于計(jì)價(jià)清單數(shù)據(jù)的進(jìn)一步應(yīng)用及管理。

3、優(yōu)選方案中,將各地及各版本的清單計(jì)價(jià)規(guī)范中的編碼與標(biāo)準(zhǔn)清單計(jì)價(jià)規(guī)范中的編碼進(jìn)行一一對(duì)應(yīng),形成統(tǒng)一的標(biāo)準(zhǔn)清單編碼,方便對(duì)計(jì)價(jià)清單數(shù)據(jù)進(jìn)行識(shí)別、轉(zhuǎn)換、分析、歸類、統(tǒng)計(jì)等應(yīng)用及管理。

附圖說(shuō)明

圖1是實(shí)施例一涉及的一種建設(shè)行業(yè)工程量計(jì)價(jià)清單數(shù)據(jù)自動(dòng)編碼與識(shí)別方法整體流程示意圖。

圖2是實(shí)施例二涉及的一種建設(shè)行業(yè)工程量計(jì)價(jià)清單數(shù)據(jù)自動(dòng)編碼與識(shí)別系統(tǒng)結(jié)構(gòu)框圖。

具體實(shí)施方式

為了便于本領(lǐng)域技術(shù)人員理解,下面將結(jié)合附圖以及實(shí)施例對(duì)本發(fā)明進(jìn)行進(jìn)一步描述。

實(shí)施例一

請(qǐng)參閱圖1,本實(shí)施例涉及的一種建設(shè)行業(yè)工程量計(jì)價(jià)清單數(shù)據(jù)自動(dòng)編碼與識(shí)別方法,包括以下步驟s100至步驟s700:

s100、將各地及各版本的清單計(jì)價(jià)規(guī)范中的編碼與標(biāo)準(zhǔn)清單計(jì)價(jià)規(guī)范中的編碼進(jìn)行一一對(duì)應(yīng),形成統(tǒng)一的標(biāo)準(zhǔn)清單編碼。

步驟s100主要是形成新的統(tǒng)一標(biāo)準(zhǔn)清單編碼,其中各地清單計(jì)價(jià)規(guī)范可包括各省份的清單計(jì)價(jià)規(guī)范,各版本的清單計(jì)價(jià)規(guī)范的其中之一可包括《gb50500-2008建設(shè)工程工程量清單計(jì)價(jià)規(guī)范》(以下簡(jiǎn)稱為2008清單計(jì)價(jià)規(guī)范),所述標(biāo)準(zhǔn)清單計(jì)價(jià)規(guī)范為《gb50500-2013建設(shè)工程工程量清單計(jì)價(jià)規(guī)范》(以下簡(jiǎn)稱為2013清單計(jì)價(jià)規(guī)范)。當(dāng)然,隨著清單計(jì)價(jià)規(guī)范的不斷推陳出新,不限于以上2008清單計(jì)價(jià)規(guī)范及2013清單計(jì)價(jià)規(guī)范兩個(gè)版本。

步驟s100中通過(guò)將各地及各版本的清單計(jì)價(jià)規(guī)范中的編碼與標(biāo)準(zhǔn)清單計(jì)價(jià)規(guī)范中的編碼進(jìn)行比對(duì),形成一一對(duì)應(yīng)關(guān)系,不同的清單名稱根據(jù)所在分項(xiàng)工程進(jìn)行編碼順延,形成統(tǒng)一的標(biāo)準(zhǔn)清單編碼。

例如,2008清單計(jì)價(jià)規(guī)范中,清單編碼“010402001”對(duì)應(yīng)的清單名稱為“矩形柱”,與2013清單計(jì)價(jià)規(guī)范中的清單編碼“010502001矩形柱”形成對(duì)應(yīng)關(guān)系;而2008清單計(jì)價(jià)規(guī)范中的清單編碼“010203002振沖灌注碎石”,并不存在于2013清單計(jì)價(jià)規(guī)范中,該編碼的分項(xiàng)工程為“基坑與邊坡支護(hù)”,對(duì)應(yīng)2013清單計(jì)價(jià)規(guī)范中的分項(xiàng)工程編碼為“010202”,則可在該分項(xiàng)工程中進(jìn)行編碼順延為“010202012”(010202011之前的已被占用)。

步驟s100中所述標(biāo)準(zhǔn)清單編碼包括四個(gè)層級(jí),從主到次分別為:專業(yè)編碼、分部編碼、分項(xiàng)編碼、清單編碼,分別與計(jì)價(jià)清單數(shù)據(jù)所屬的工程專業(yè)、分部工程以及分項(xiàng)工程、計(jì)價(jià)清單對(duì)應(yīng)。

例如,本實(shí)施例中預(yù)設(shè)的標(biāo)準(zhǔn)清單編碼為9位編碼(當(dāng)然也可根據(jù)需要預(yù)設(shè)為其他位數(shù)),該9位編碼的前2位為專業(yè)編碼,前4位為分部編碼,前6位為分項(xiàng)編碼,全部9位唯一對(duì)應(yīng)一組計(jì)價(jià)清單編碼。假設(shè)一組計(jì)價(jià)清單編碼“010502001”,則對(duì)應(yīng)層級(jí)分別為:

專業(yè)編碼“01”,所對(duì)應(yīng)的工程專業(yè)為“房屋建筑與裝飾工程”;

分部編碼“0105”,所對(duì)應(yīng)的分部工程為“混凝土及鋼筋混凝土工程”;

分項(xiàng)編碼“010502”,所對(duì)應(yīng)的分項(xiàng)工程為“現(xiàn)澆混凝土柱”;

清單編碼“010502001”,所對(duì)應(yīng)的計(jì)價(jià)清單為“矩形柱”。

在步驟s100首次執(zhí)行之后,以后對(duì)計(jì)價(jià)清單數(shù)據(jù)的自動(dòng)編碼及識(shí)別均可從步驟s200起執(zhí)行。

s200、獲取計(jì)價(jià)清單數(shù)據(jù),根據(jù)統(tǒng)一的標(biāo)準(zhǔn)清單編碼規(guī)范對(duì)所述計(jì)價(jià)清單數(shù)據(jù)中的清單編碼進(jìn)行標(biāo)準(zhǔn)化處理,提取標(biāo)準(zhǔn)的分項(xiàng)編碼,并過(guò)濾錯(cuò)誤的清單編碼。

以一條用自然語(yǔ)言描述的不標(biāo)準(zhǔn)的工程量計(jì)價(jià)清單數(shù)據(jù)為例,假設(shè)其包括原始編碼、清單名稱、清單特征等信息,具體如下:

原始編碼:10402001001

名稱:矩形柱

清單特征:1.混凝土強(qiáng)度等級(jí):c30普通商品混凝土2.綜合考慮:混凝土拌和料要求、混凝土摻加劑、泵送費(fèi)用3.混凝土制作、運(yùn)輸、澆筑、振搗、養(yǎng)護(hù)、其它。

步驟s200主要是將不規(guī)范的原始編碼進(jìn)行標(biāo)準(zhǔn)化處理,提取出標(biāo)準(zhǔn)的分項(xiàng)編碼,例如上述計(jì)價(jià)清單數(shù)據(jù)的原始編碼“10402001001”并不是標(biāo)準(zhǔn)的清單編碼,而其中分項(xiàng)編碼應(yīng)為“010402”,因此需要將該編碼進(jìn)行處理,提取為正確的分項(xiàng)編碼。

當(dāng)然,這只是舉例說(shuō)明,而當(dāng)出現(xiàn)“001040200100”、“010402001001”字符時(shí),同樣也會(huì)提取為“010402”;而當(dāng)出現(xiàn)的編碼不是數(shù)字時(shí),則認(rèn)為該計(jì)價(jià)清單數(shù)據(jù)無(wú)分項(xiàng)編碼。

進(jìn)一步地,標(biāo)準(zhǔn)的分項(xiàng)編碼會(huì)在關(guān)鍵詞規(guī)則庫(kù)中預(yù)先存儲(chǔ),通過(guò)系統(tǒng)設(shè)定的提取規(guī)則,先進(jìn)行分項(xiàng)編碼的提取。

s300、將所述計(jì)價(jià)清單數(shù)據(jù)中由自然語(yǔ)言描述的清單名稱、清單特征詞匯進(jìn)行分詞處理,并提取關(guān)鍵詞。

s400、將提取的關(guān)鍵詞通過(guò)決策樹(shù)算法自動(dòng)生成關(guān)鍵詞組合,結(jié)合分項(xiàng)編碼,形成關(guān)鍵詞規(guī)則數(shù)據(jù),并運(yùn)用機(jī)器學(xué)習(xí)方式維護(hù)及完善預(yù)置的關(guān)鍵詞規(guī)則庫(kù)。

步驟s400中預(yù)置關(guān)鍵詞規(guī)則庫(kù)的方法可參考如下步驟s410至s430:

s410、以計(jì)價(jià)清單數(shù)據(jù)對(duì)應(yīng)規(guī)范化編碼的方式形成數(shù)據(jù)訓(xùn)練集,對(duì)計(jì)價(jià)清單數(shù)據(jù)的清單名稱和清單特征詞匯進(jìn)行分詞處理,以獲取關(guān)鍵詞。

s420、通過(guò)決策樹(shù)算法將獲取的關(guān)鍵詞進(jìn)行組合,結(jié)合分項(xiàng)編碼,形成關(guān)鍵詞規(guī)則庫(kù)。

s430、以加入新的數(shù)據(jù)訓(xùn)練集形成新的關(guān)鍵詞組合,并通過(guò)機(jī)器學(xué)習(xí)方式完善關(guān)鍵詞規(guī)則庫(kù),保證編碼的準(zhǔn)確性。

例如,本實(shí)施例可將原始編碼、清單名稱、清單特征作為訓(xùn)練集數(shù)據(jù),將該條數(shù)據(jù)與正確的標(biāo)準(zhǔn)清單編碼形成對(duì)應(yīng),通過(guò)決策樹(shù)算法,自動(dòng)生成名稱關(guān)鍵詞組合為“矩形柱+泵送費(fèi)+混凝土+運(yùn)輸+制作”,對(duì)應(yīng)的分項(xiàng)編碼為“010502”,將名稱關(guān)鍵詞組合及分項(xiàng)編碼給合得到清單編碼“010502001”,該數(shù)據(jù)中的關(guān)鍵詞組合、分項(xiàng)編碼、清單編碼則成為關(guān)鍵詞規(guī)則庫(kù)中的匹配規(guī)則。關(guān)鍵詞規(guī)則庫(kù)中的匹配規(guī)則均是通過(guò)這樣的方式自動(dòng)生成對(duì)應(yīng)關(guān)系的,并且加入機(jī)器學(xué)習(xí)的方式,可自動(dòng)將更多的訓(xùn)練數(shù)據(jù)生成新的匹配規(guī)則,完善及補(bǔ)充關(guān)鍵詞規(guī)則庫(kù),以保證編碼的成功率及準(zhǔn)確性。

s500、將所述計(jì)價(jià)清單數(shù)據(jù)中提取出的關(guān)鍵詞在所述關(guān)鍵詞規(guī)則庫(kù)進(jìn)行匹配分析,結(jié)合分項(xiàng)編碼仲裁所述計(jì)價(jià)清單數(shù)據(jù)所屬的類別,將其清單編碼進(jìn)一步識(shí)別為預(yù)設(shè)位數(shù)的標(biāo)準(zhǔn)清單編碼。

步驟s500中預(yù)設(shè)位數(shù)的標(biāo)準(zhǔn)清單編碼在本實(shí)施例中為9位編碼。作為參考,步驟s500進(jìn)一步細(xì)化如下步驟s510至s520:

s510、若匹配到的關(guān)鍵詞組合在關(guān)鍵詞規(guī)則庫(kù)中只對(duì)應(yīng)一個(gè)標(biāo)準(zhǔn)清單編碼,則直接獲取該標(biāo)準(zhǔn)清單編碼;若匹配到的關(guān)鍵詞組合對(duì)應(yīng)多個(gè)標(biāo)準(zhǔn)清單編碼,則加上標(biāo)準(zhǔn)化的分項(xiàng)編碼進(jìn)行仲裁得到唯一的標(biāo)準(zhǔn)清單編碼。

s520、若匹配到的關(guān)鍵詞組合在規(guī)則庫(kù)中無(wú)對(duì)應(yīng)的標(biāo)準(zhǔn)清單編碼,則先對(duì)該關(guān)鍵詞組合進(jìn)行降維算法重新提取關(guān)鍵詞組合,并將該關(guān)鍵詞組合重新執(zhí)行步驟s510進(jìn)行匹配分析,根據(jù)最高匹配度確定唯一的標(biāo)準(zhǔn)清單編碼。

例如,通過(guò)分詞處理,可以獲得“矩形柱”、“泵送費(fèi)”、“運(yùn)輸”、“制作”、“澆筑”、“混凝土”等關(guān)鍵詞;而在這些關(guān)鍵詞中,通過(guò)關(guān)鍵詞優(yōu)化及優(yōu)先級(jí)評(píng)定,最終提取“矩形柱”、“泵送費(fèi)”、“混凝土”、“運(yùn)輸”、“制作”作為關(guān)鍵詞組合與關(guān)鍵詞規(guī)則庫(kù)進(jìn)行匹配分析;執(zhí)行步驟s510后,符合該關(guān)鍵詞組合的只有一個(gè)標(biāo)準(zhǔn)清單編碼“010502001”,對(duì)應(yīng)的標(biāo)準(zhǔn)清單名稱為“矩形柱”。

s600、基于識(shí)別出的預(yù)設(shè)位數(shù)的標(biāo)準(zhǔn)清單編碼,識(shí)別所述計(jì)價(jià)清單數(shù)據(jù)所屬的工程專業(yè)、分部工程以及分項(xiàng)工程。

步驟s600例如,根據(jù)獲得的9位標(biāo)準(zhǔn)清單編碼,確定所屬工程專業(yè)為“01房屋建筑與裝飾工程”;分部工程為“0105混凝土及鋼筋混凝土工程”;分項(xiàng)工程為“010502現(xiàn)澆混凝土柱”。

s700、基于識(shí)別出的預(yù)設(shè)位數(shù)的標(biāo)準(zhǔn)清單編碼,對(duì)所述計(jì)價(jià)清單數(shù)據(jù)包含的人工、材料、機(jī)械設(shè)備的具體要求進(jìn)行清單指引編碼。

步驟s700例如,根據(jù)獲得的9位標(biāo)準(zhǔn)清單編碼,將可對(duì)該清單所包含的人工、材料、機(jī)械設(shè)備的具體要求進(jìn)行12位清單指引編碼,內(nèi)容分別為:

清單指引編碼“010502001001”對(duì)應(yīng)的內(nèi)容為“矩形”,

清單指引編碼“010502001002”對(duì)應(yīng)的內(nèi)容為“矩形(泵送商品砼)”,

清單指引編碼“010502001005”對(duì)應(yīng)的內(nèi)容為“矩形柱復(fù)合木模板”,

以此類推,從而將人工、材料、機(jī)械設(shè)備的具體要求均進(jìn)行編碼,每一項(xiàng)清單指引編碼下將可包含定額及價(jià)格。

實(shí)施例二

請(qǐng)參閱圖2,實(shí)施例二是與實(shí)施例一相對(duì)應(yīng)的一種建設(shè)行業(yè)工程量計(jì)價(jià)清單數(shù)據(jù)自動(dòng)編碼與識(shí)別系統(tǒng),主要包括規(guī)范化模塊10、分詞模塊20、維護(hù)及完善模塊30、匹配分析模塊40、存儲(chǔ)模塊50以及指引編碼模塊60。

所述規(guī)范化模塊10,用于獲取計(jì)價(jià)清單數(shù)據(jù),根據(jù)統(tǒng)一的標(biāo)準(zhǔn)清單編碼規(guī)范對(duì)計(jì)價(jià)清單數(shù)據(jù)中的清單編碼進(jìn)行標(biāo)準(zhǔn)化處理,提取標(biāo)準(zhǔn)的分項(xiàng)編碼,并過(guò)濾錯(cuò)誤的清單編碼。

所述分詞模塊20,用于將計(jì)價(jià)清單數(shù)據(jù)中由自然語(yǔ)言描述的清單名稱、清單特征詞匯進(jìn)行分詞處理,并提取關(guān)鍵詞。

所述維護(hù)及完善模塊30,用于將提取的關(guān)鍵詞通過(guò)決策樹(shù)算法自動(dòng)生成關(guān)鍵詞組合,結(jié)合分項(xiàng)編碼,形成關(guān)鍵詞規(guī)則數(shù)據(jù),并運(yùn)用機(jī)器學(xué)習(xí)方式維護(hù)及完善預(yù)置的關(guān)鍵詞規(guī)則庫(kù)。

所述匹配分析模塊40,用于將計(jì)價(jià)清單數(shù)據(jù)中提取出的關(guān)鍵詞在關(guān)鍵詞規(guī)則庫(kù)進(jìn)行匹配分析,結(jié)合分項(xiàng)編碼仲裁計(jì)價(jià)清單數(shù)據(jù)所屬的類別,將其清單編碼進(jìn)一步識(shí)別為預(yù)設(shè)位數(shù)的標(biāo)準(zhǔn)清單編碼,以及進(jìn)一步識(shí)別計(jì)價(jià)清單數(shù)據(jù)所屬的工程專業(yè)、分部工程以及分項(xiàng)工程。

所述存儲(chǔ)模塊50,用于將識(shí)別出所屬的工程專業(yè)、分部工程以及分項(xiàng)工程的計(jì)價(jià)清單數(shù)據(jù)分為工程專業(yè)、分部工程、分項(xiàng)工程以及計(jì)價(jià)清單四個(gè)層級(jí)進(jìn)行存儲(chǔ)。

所述指引編碼模塊60,用于基于識(shí)別出的預(yù)設(shè)位數(shù)的標(biāo)準(zhǔn)清單編碼,對(duì)計(jì)價(jià)清單數(shù)據(jù)包含的人工、材料、機(jī)械設(shè)備的具體要求進(jìn)行清單指引編碼。

請(qǐng)繼續(xù)參閱圖2,進(jìn)一步優(yōu)選方案中,除了以上模塊之外還包括統(tǒng)一編碼模塊70,用于將各地及各版本的清單計(jì)價(jià)規(guī)范中的編碼與標(biāo)準(zhǔn)清單計(jì)價(jià)規(guī)范中的編碼進(jìn)行一一對(duì)應(yīng),形成統(tǒng)一的標(biāo)準(zhǔn)清單編碼。

以上實(shí)施例二的技術(shù)原理和有益效果與實(shí)施例一相對(duì)應(yīng),這里不再贅述。

以上所述實(shí)施例僅表達(dá)了本發(fā)明的幾種實(shí)施方式,其描述較為具體和詳細(xì),但并不能因此而理解為對(duì)本發(fā)明專利范圍的限制。應(yīng)當(dāng)指出的是,對(duì)于本領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進(jìn),這些都屬于本發(fā)明的保護(hù)范圍。因此,本發(fā)明專利的保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
禄劝| 拉萨市| 鸡西市| 安乡县| 平舆县| 建平县| 秦安县| 通城县| 娱乐| 全椒县| 尼勒克县| 鄢陵县| 商都县| 田林县| 乌拉特中旗| 玉门市| 泰兴市| 左贡县| 武平县| 离岛区| 莱州市| 清涧县| 夏津县| 井研县| 顺义区| 泽州县| 涡阳县| 衡阳县| 都匀市| 巴楚县| 沿河| 六安市| 融水| 论坛| 和平区| 石河子市| 龙泉市| 奇台县| 宁强县| 毕节市| 麻城市|