两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

專利數(shù)據(jù)挖掘系統(tǒng)及方法

文檔序號:6606039閱讀:251來源:國知局
專利名稱:專利數(shù)據(jù)挖掘系統(tǒng)及方法
技術(shù)領(lǐng)域
本發(fā)明有關(guān)一種數(shù)據(jù)挖掘系統(tǒng)及方法,尤其是指一種基于引證關(guān)系的專利數(shù)據(jù)挖掘系統(tǒng)及方法。
背景技術(shù)
在知識經(jīng)濟(jì)的時代中,專利申請以取得排他權(quán)是企業(yè)保有競爭力的利器之一。專利除可以使業(yè)者維系其專屬的領(lǐng)域知識、避免受到競爭者模仿或侵犯之外,亦可通過專利銷售而創(chuàng)造收益。然而,在大量申請專利之后,對于專利申請所構(gòu)成的龐大維護(hù)經(jīng)費(fèi)的負(fù)擔(dān)是各個申請人所面臨到的問題。為了減少經(jīng)費(fèi)支出以及有效的將有限資金予以運(yùn)用,因此就必須將有限的資源運(yùn)用在維護(hù)有價值的專利上。亦即,如果專利的價值遠(yuǎn)大于維護(hù)所需的成本,那么該專利自然就是值得維護(hù)的標(biāo)的。不過,如何從大量專利案件中快速定位具備較高價值的專利案件,涉及到很多面向,因此,在此專利產(chǎn)業(yè)發(fā)展趨勢下,專利數(shù)據(jù)的智能挖掘?qū)崬楫a(chǎn)業(yè)經(jīng)營的重要課題。在現(xiàn)有技術(shù)中,不論是研究機(jī)構(gòu)或者是企業(yè)多半是以成本法或者是市場法來評估專利的價值,這樣的評估方式,需要相當(dāng)程度的人力投入來進(jìn)行數(shù)據(jù)搜尋、產(chǎn)業(yè)分析等工作。對于存在大量的專利案件時,這樣的方式存在效能低下的缺陷。再加上大部分專利價值通常無法真正通過市場交易得到真正的價值,所以通過人力投入來進(jìn)行數(shù)據(jù)搜尋以及產(chǎn)業(yè)分析對于價值評定的結(jié)果也差異很大。因此,常造成對同一篇專利的評估價值南轅北轍,反而造成廠商于授權(quán)談判時的困擾。綜合上述,亟需一種客觀、量化、科學(xué)化以及自動化的對專利群組進(jìn)行數(shù)據(jù)挖掘的方法來解決現(xiàn)有技術(shù)所產(chǎn)生的問題,進(jìn)而降低專利數(shù)據(jù)處理的成本。特別是通過全自動的技術(shù)方案,實(shí)現(xiàn)對專利案件的批量處理,自動定位目標(biāo)數(shù)據(jù),從而提高數(shù)據(jù)處理的效能。

發(fā)明內(nèi)容
本發(fā)明解決的技術(shù)問題在于,對專利案件間的引證關(guān)系進(jìn)行顯示,并基于該引證關(guān)系對專利群組進(jìn)行自動的數(shù)據(jù)挖掘,獲得目標(biāo)數(shù)據(jù)。為解決上述技術(shù)問題,本發(fā)明公開了一種專利數(shù)據(jù)挖掘系統(tǒng),包括專利群組獲取單元,用于獲取一專利群組;引證分析單元,用于分析該專利群組的各個專利案件之間的引證關(guān)系以建立一引證網(wǎng)絡(luò),該引證網(wǎng)絡(luò)具有多個連結(jié),每個該連結(jié)均根據(jù)該專利群組中具有引證關(guān)系的兩專利案件間的引證關(guān)系而形成,該引證分析單元于該引證網(wǎng)絡(luò)中獲取一聚落,為該聚落中所具有的每個連結(jié)賦予一權(quán)重值;以及中心性指標(biāo)獲取單元,用于根據(jù)每個該連結(jié)所具有的權(quán)重值,計算該聚落中每個專利案件的中心性指標(biāo)。為解決上述技術(shù)問題,本發(fā)明公開了一種專利數(shù)據(jù)挖掘系統(tǒng),包括專利群組獲取單元,用于獲取一專利群組;
引證分析單元,用于分析該專利群組的各個專利案件之間的引證關(guān)系,并根據(jù)該專利群組獲取一引證網(wǎng)絡(luò),該引證網(wǎng)絡(luò)具有多個連結(jié),其中每個連結(jié)均根據(jù)該專利群組中具有引證關(guān)系的兩專利案件間的引證關(guān)系而形成,并為每個連結(jié)賦予一權(quán)重值;圖 像轉(zhuǎn)換單元,用于將該引證網(wǎng)絡(luò)轉(zhuǎn)換為一引證樹以進(jìn)行顯示;中心性指標(biāo)獲取單元,用于根據(jù)每一連結(jié)所具有的權(quán)重值,計算該引證網(wǎng)絡(luò)中每個專利案件的中心性指標(biāo);自動識別單元,用于根據(jù)一預(yù)設(shè)閾值對該引證網(wǎng)絡(luò)中的各個中心性指標(biāo)進(jìn)行判斷,認(rèn)定達(dá)到該預(yù)設(shè)閾值的中心性指標(biāo)所對應(yīng)的專利案件為目標(biāo)數(shù)據(jù)以在該引證樹中對該目標(biāo)數(shù)據(jù)進(jìn)行標(biāo)識。為解決上述技術(shù)問題,本發(fā)明還公開了一種專利數(shù)據(jù)挖掘方法,至少包含下列步驟利用專利群組獲取單元獲取一專利群組;利用引證分析單元分析該專利群組的各個專利案件之間的引證關(guān)系以建立一引證網(wǎng)絡(luò),該引證網(wǎng)絡(luò)具有多個連結(jié),每個該連結(jié)均根據(jù)該專利群組中具有引證關(guān)系的兩專利案件間的引證關(guān)系而形成,該引證分析單元于該引證網(wǎng)絡(luò)中獲取一聚落,并為該聚落中所具有的每個連結(jié)賦予一權(quán)重值;以及利用中心性指標(biāo)獲取單元根據(jù)每個該連結(jié)所具有的權(quán)重值,計算該聚落中每個專利案件的中心性指標(biāo)。為解決上述技術(shù)問題,本發(fā)明還公開了一種專利數(shù)據(jù)挖掘方法,至少包含下列步驟利用專利群組獲取單元獲取一專利群組;利用引證分析單元分析該專利群組的各個專利案件之間的引證關(guān)系,并根據(jù)該專利群組獲取一引證網(wǎng)絡(luò),該引證網(wǎng)絡(luò)具有多個連結(jié),其中每個連結(jié)均根據(jù)該專利群組中具有引證關(guān)系的兩專利案件間的引證關(guān)系而形成,并為每個連結(jié)賦予一權(quán)重值;利用中心性指標(biāo)獲取單元,根據(jù)每一連結(jié)所具有的權(quán)重值,計算該引證網(wǎng)絡(luò)中每個專利案件的中心性指標(biāo);利用自動識別單元,根據(jù)一預(yù)設(shè)閾值對該引證網(wǎng)絡(luò)中的各個中心性指標(biāo)進(jìn)行判斷,認(rèn)定達(dá)到該預(yù)設(shè)閾值的中心性指標(biāo)所對應(yīng)的專利案件為目標(biāo)數(shù)據(jù);利用圖像轉(zhuǎn)換單元將該引證網(wǎng)絡(luò)轉(zhuǎn)換為一引證樹以進(jìn)行顯示,并在該引證樹中對該目標(biāo)數(shù)據(jù)進(jìn)行標(biāo)識。本發(fā)明實(shí)現(xiàn)的技術(shù)效果,顯示專利案件間的引證關(guān)系,并基于該引證關(guān)系對專利群組進(jìn)行自動的數(shù)據(jù)挖掘,獲得目標(biāo)數(shù)據(jù)。特別是可以實(shí)現(xiàn)對專利案件的批量處理,自動定位目標(biāo)數(shù)據(jù),從而提高數(shù)據(jù)處理的效能。


圖IA所示為本發(fā)明的專利數(shù)據(jù)挖掘系統(tǒng)100的功能結(jié)構(gòu)模塊圖;圖IB所示為本發(fā)明的專利數(shù)據(jù)挖掘方法的流程示意圖;圖IC所示為本發(fā)明的專利數(shù)據(jù)挖掘系統(tǒng)100另一實(shí)施例示意圖;圖ID所示為本發(fā)明的專利數(shù)據(jù)挖掘方法的流程圖IE所示為在另一實(shí)施例中本發(fā)明的專利數(shù)據(jù)挖掘系統(tǒng)的結(jié)構(gòu)示意圖;圖IF為本發(fā)明的專利數(shù)據(jù)挖掘方法實(shí)施例流程示意圖;圖IG為本發(fā)明的專利數(shù)據(jù)挖掘方法實(shí)施例流程示意圖;圖2為本發(fā)明的形成引證網(wǎng)絡(luò)(聚落)第一實(shí)施例流程示意圖;圖2A為本發(fā)明的專利數(shù)據(jù)挖掘系統(tǒng)100的功能結(jié)構(gòu)模塊圖;圖2B為本發(fā)明的專利數(shù)據(jù)挖掘系統(tǒng)100的功能結(jié)構(gòu)模塊圖;圖3A為根據(jù)一關(guān)鍵詞所得到的檢索結(jié)果示意圖;圖;3B為檢索和目標(biāo)專利案件P相關(guān)的專利群組示意圖;圖4A至圖4C為引證網(wǎng)絡(luò)的聚落示意圖;圖5A與圖5B分別為利用SPLC或者是SPNP給予連結(jié)權(quán)重示意圖;圖6為具有權(quán)重的引證網(wǎng)絡(luò)(聚落)連結(jié)示意圖;圖7為相對價值示意圖;圖8A至圖8C為本發(fā)明的產(chǎn)生引證網(wǎng)絡(luò)(聚落)第二至第四實(shí)施例示意圖。其中,附圖標(biāo)記2-專利數(shù)據(jù)挖掘方法20 25-步驟200 203-步驟300 327-專利案件S-專利群組S’ -聚落90、91、92_ 連結(jié)G1、G2、G3_ 聚落專利數(shù)據(jù)挖掘系統(tǒng)100引證分析單元12自動評價與識別單元14更新單元111搜尋路徑連結(jié)記數(shù)單元121搜尋路牷節(jié)點(diǎn)對早兀122
專利群組獲取單元11 中心性指標(biāo)獲取單元13 圖像轉(zhuǎn)換單元15 引證網(wǎng)絡(luò)選擇單元12具體實(shí)施例方式為使貴審查委員能對本發(fā)明的特征、目的及功能有更進(jìn)一步的認(rèn)知與了解,下文特將本發(fā)明的方法的相關(guān)細(xì)節(jié)以及設(shè)計的理念源由進(jìn)行說明,以使得審查委員可以了解本發(fā)明的特點(diǎn),詳細(xì)說明陳述如下本發(fā)明通過一專利數(shù)據(jù)挖掘系統(tǒng)100對專利案件進(jìn)行批量的數(shù)據(jù)處理,以得到目標(biāo)數(shù)據(jù),并對專利案件中存在的引證網(wǎng)絡(luò)進(jìn)行顯示。該專利數(shù)據(jù)挖掘系統(tǒng)100可設(shè)置在至少一臺數(shù)據(jù)處理裝置中。該數(shù)據(jù)處理裝置包括現(xiàn)有技術(shù)中所常用的硬件結(jié)構(gòu),如電腦、工作站或服務(wù)器等,其包括處理器、存儲器、內(nèi)存、顯示設(shè)備、輸入設(shè)備、網(wǎng)絡(luò)接口等。請參閱圖IA 所示,為本發(fā)明的專利數(shù)據(jù)挖掘系統(tǒng)100的功能結(jié)構(gòu)模塊圖。 專利數(shù)據(jù)挖掘系統(tǒng)100包括一專利群組獲取單元11、一引證分析單元12以及一中心性指標(biāo)獲取單元13。
專利群組獲取單元11用于獲取一專利群組。該專利群組獲取單元11可以通過網(wǎng)絡(luò)與一數(shù)據(jù)庫連接,通過檢索的操作接口與相關(guān)的檢索條件從而直接從該數(shù)據(jù)庫中取得到該專利群組?;蛘?,從與專利群組獲取單元11連接的存儲器,例如硬盤中調(diào)取。

引證分析單元12用于對專利群組獲取單元11所獲取的專利群組中的各個專利案件進(jìn)行引證關(guān)系分析,以于該專利群組的各個專利案件之間的引證關(guān)系建立一引證網(wǎng)絡(luò), 該引證網(wǎng)絡(luò)具有多個連結(jié),每個該連結(jié)均根據(jù)該專利群組中具有引證關(guān)系的兩專利案件間的引證關(guān)系而形成,該引證分析單元12并于該引證網(wǎng)絡(luò)中獲取一聚落,并為該聚落中所具有的每個連結(jié)賦予一權(quán)重值。任兩個專利案件之間可能具備引證關(guān)系,只要存在一次引證則具備一連結(jié),多個專利申請之間存在的相互引證可最終形成一引證網(wǎng)絡(luò)。中心性指標(biāo)獲取單元13用于根據(jù)每一連結(jié)所具有的權(quán)重值,計算該引證網(wǎng)絡(luò)中每個專利案件的中心性指標(biāo)。該中心性指標(biāo)用于表示每個專利案件的重要程度。請參閱圖IB所示,為本發(fā)明的專利數(shù)據(jù)挖掘方法的流程示意圖。步驟A,利用專利群組獲取單元獲取一專利群組;步驟B,利用引證分析單元分析該專利群組的各個專利案件之間的引證關(guān)系以建立一引證網(wǎng)絡(luò),該引證網(wǎng)絡(luò)具有多個連結(jié),每個該連結(jié)均根據(jù)該專利群組中具有引證關(guān)系的兩專利案件間的引證關(guān)系而形成,該引證分析單元于該引證網(wǎng)絡(luò)中獲取一聚落,并為該聚落中所具有的每個連結(jié)賦予一權(quán)重值;以及步驟C,利用中心性指標(biāo)獲取單元,根據(jù)每一連結(jié)所具有的權(quán)重值,計算該聚落中每個專利案件的中心性指標(biāo)。如圖IC所示,該圖為本發(fā)明的專利數(shù)據(jù)挖掘系統(tǒng)100的另一實(shí)施例的示意圖。在本實(shí)施例中,該系統(tǒng)基本上與圖IA相似,差異的是該系統(tǒng)100還具有一自動評價與識別單元14用于通過數(shù)據(jù)挖掘識別目標(biāo)數(shù)據(jù)。該自動評價與識別單元14可以如下方式實(shí)現(xiàn)第一,根據(jù)該聚落中所包括的一預(yù)設(shè)的具有價值的目標(biāo)專利案件,判斷該目標(biāo)專利案件的中心性指標(biāo)與該聚落中各個專利案件的中心性指標(biāo)的相對評價指標(biāo),進(jìn)而識別出該聚落中具有價值的其他專利案件作為目標(biāo)數(shù)據(jù)。第二,根據(jù)該聚落中所包括的一目標(biāo)專利案件,與該聚落中的一具有確定價值的專利案件間的該中心性指標(biāo)的比例,計算該目標(biāo)專利案件所具有的價值。第三,根據(jù)一預(yù)設(shè)閾值對該引證網(wǎng)絡(luò)中的各個中心性指標(biāo)進(jìn)行判斷,認(rèn)定達(dá)到該預(yù)設(shè)閾值的中心性指標(biāo)所對應(yīng)的專利案件為目標(biāo)數(shù)據(jù)。而該目標(biāo)數(shù)據(jù)即為通過數(shù)據(jù)挖掘, 從原始獲得的專利群組中進(jìn)一步篩選得到的。請參閱圖ID所示,為本發(fā)明的專利數(shù)據(jù)挖掘方法的流程示意圖。步驟A,利用專利群組獲取單元獲取一專利群組;步驟B,利用引證分析單元分析該專利群組的各個專利案件之間的引證關(guān)系以建立一引證網(wǎng)絡(luò),該引證網(wǎng)絡(luò)具有多個連結(jié),每個該連結(jié)均根據(jù)該專利群組中具有引證關(guān)系的兩專利案件間的引證關(guān)系而形成,該引證分析單元并于該專利群組獲取一聚落,并為該聚落中所具有的每個連結(jié)賦予一權(quán)重值;步驟C,利用中心性指標(biāo)獲取單元,根據(jù)每一連結(jié)所具有的權(quán)重值,計算該聚落中每個專利案件的中心性指標(biāo);步驟D,利用自動評價與識別單元,識別目標(biāo)數(shù)據(jù)。如圖IE所示為在另一實(shí)施例中本發(fā)明的專利數(shù)據(jù)挖掘系統(tǒng)的結(jié)構(gòu)示意圖。其中,該系統(tǒng)進(jìn)一步包括圖像轉(zhuǎn)換單元15,用于將該引證網(wǎng)絡(luò)轉(zhuǎn)換為一引證樹以進(jìn)行顯示。另外,該被篩選出的目標(biāo)數(shù)據(jù)也可在該引證樹上被特別標(biāo)識出。請參閱圖IF所示為本發(fā)明的專利數(shù)據(jù)挖掘方法的流程圖。步驟A,利用專利群組獲取單元獲取一專利群組;步驟B,利用引證分析單元分析該專利群組的各個專利案件之間的引證關(guān)系以建立一引證網(wǎng)絡(luò),該引證網(wǎng)絡(luò)具有多個連結(jié),每個該連結(jié)均根據(jù)該專利群組中具有引證關(guān)系的兩專利案件間的引證關(guān)系而形成,該引證分析單元并于該專利群組獲取一聚落,并為該聚落中所具有的每個連結(jié)賦予一權(quán)重值;步驟C,利用中心性指標(biāo)獲取單元,根據(jù)每一連結(jié)所具有的權(quán)重值,計算該聚落中每個專利案件的中心性指標(biāo);步驟D,利用自動識別單元,根據(jù)一預(yù)設(shè)閾值對該引證網(wǎng)絡(luò)中的各個中心性指標(biāo)進(jìn)行判斷,認(rèn)定達(dá)到該預(yù)設(shè)閾值的中心性指標(biāo)所對應(yīng)的專利案件為目標(biāo)數(shù)據(jù);步驟E,利用圖像轉(zhuǎn)換單元將該聚落轉(zhuǎn)換為一引證樹以進(jìn)行顯示,并在該引證樹中對該目標(biāo)數(shù)據(jù)進(jìn)行標(biāo)識。以下詳細(xì)說明本發(fā)明,請參閱圖IG所示,該圖為本發(fā)明的專利數(shù)據(jù)挖掘方法實(shí)施例流程示意圖。在該實(shí)施例中,該方法2包括有下列步驟,首先以步驟20提供一專利群組, 由該專利群組建立一引證網(wǎng)絡(luò),其中該引證網(wǎng)絡(luò)中具有多個連結(jié),每一連結(jié)由具有引證關(guān)系的任兩專利案件所建立而成,再選擇該引證網(wǎng)絡(luò)中的一聚落。以選擇出的聚落作為后續(xù)處理的基礎(chǔ)。請參閱圖2所示,該圖為本發(fā)明的建立引證網(wǎng)絡(luò)第一實(shí)施例示意圖。建立的方式首先以步驟200根據(jù)至少一檢索條件于一數(shù)據(jù)庫中尋找出一專利群組,其具有多個專利案件。在本步驟中,該數(shù)據(jù)庫可為各個國家知識產(chǎn)權(quán)局中所具有的專利數(shù)據(jù)庫,例如美國專利數(shù)據(jù)庫或者是歐盟專利數(shù)據(jù)庫等;此外,該數(shù)據(jù)庫也可以為商用軟件所建立的數(shù)據(jù)庫,例如=Delphion專利數(shù)據(jù)庫等,但不以此為限。在步驟20中,該檢索條件可以包括有關(guān)鍵詞(keyword)、國際分類碼(International patent classification, IPC)、申請?zhí)?(applicationnumber)、公開號(publication number)、公告號(issue number)、串 i青人 (applicant)、發(fā)明人(inventor)或前述的任意組合等,但不以此為限制。該關(guān)鍵詞可為預(yù)先存儲的一關(guān)鍵詞列表。步驟20執(zhí)行之后的結(jié)果,如圖3A所示,該圖為根據(jù)一關(guān)鍵詞所得到的檢索結(jié)果示意圖。檢索之后所得的多個專利案件的組合,即為該專利群組S。要說明的是,雖然圖3A中所列舉的為美國專利公告號,但是每一個專利案件可以為專利申請案的公開案或者是獲準(zhǔn)專利的公告案,而且不以美國專利為限。但目前免費(fèi)的專利數(shù)據(jù)庫中只有美國公告專利數(shù)據(jù)庫中的專利全文數(shù)據(jù)才具有完整引證數(shù)據(jù),因此,本發(fā)明所提出的方法目前僅適用于已經(jīng)公告的美國專利。再回到圖2所示,步驟200之后,接著進(jìn)行步驟201,判斷該專利群組S是否為適當(dāng)?shù)娜航M。
判斷方式之一為根 據(jù)該專利群組S所含有的專利案件數(shù)量是否適當(dāng),如果太少的話,則代表可能在步驟200中,所采用的檢索條件并不適當(dāng),因此需要再回到步驟200重新界定檢索條件,再重新檢索。即,預(yù)先設(shè)定一案件數(shù)量,判斷檢索得到的專利案件數(shù)量是否達(dá)到該預(yù)先設(shè)定的案件數(shù)量,如果未達(dá)到,改變檢索條件,重新檢索,如果達(dá)到,執(zhí)行后續(xù)步驟。該改變檢索條件的步驟可包括在關(guān)鍵詞列表中選取另一關(guān)鍵詞,或直接選取關(guān)鍵詞外的其他檢索條件及其組合。另外一種作法是首先預(yù)先建立一個“稽核組”(benchmark set),稽核組包含了至少一件已經(jīng)確知相關(guān)的目標(biāo)專利案件P,然后在每次調(diào)整檢索條件、判斷“檢索結(jié)果是否適當(dāng)”時,都檢查檢索到的專利群組是否有不正確的排除或過濾掉“稽核組”里的專利。如果排除或過濾掉該“稽核組”里的專利,視為應(yīng)該調(diào)整檢索條件。目標(biāo)專利案件P,可以為專利申請案的公開案或者是獲準(zhǔn)專利的公告案。請參閱圖2A為本發(fā)明的專利數(shù)據(jù)挖掘系統(tǒng)100的功能結(jié)構(gòu)模塊圖。具體的說,在這一實(shí)施例中,該專利群組獲取單元11中進(jìn)一步包括一更新單元 111以執(zhí)行步驟201,該更新單元111用于判斷檢索到的該專利群組是否包含該目標(biāo)專利案件(和/或判斷檢索到的該專利群組是否達(dá)到預(yù)定的案件數(shù)量范圍),如否,則調(diào)整該檢索條件,重新產(chǎn)生一專利群組,直到所產(chǎn)生的專利群組包括該目標(biāo)專利案件(和/或達(dá)到預(yù)定的案件數(shù)量范圍)。例如,以圖3B的斜線范圍A來代表最理想的專利群組。如果使用不正確的檢索條件,則可能得到如C或D的范圍所代表的專利群組,如此便會遺漏若干的專利。如果檢索條件適當(dāng)?shù)脑?,則可以得到如區(qū)域B或E的范圍所涵蓋的專利群組,則可以將范圍A包含在內(nèi)。再回到圖2所示,如果該專利群組S被判斷是適當(dāng)?shù)模瑒t以步驟202,根據(jù)圖3A的檢索結(jié)果,可以于該專利群組中所具有的每一個專利案件的內(nèi)容所引用的公開案或者是公告案,以及審查委員在審查過程中所提列的相關(guān)現(xiàn)有技術(shù)所形成的引證關(guān)聯(lián)性,在有引證關(guān)系的兩專利案件間建立一連結(jié)以形成一引證網(wǎng)絡(luò)。當(dāng)專利A被專利B引用時,基本上專利A的某種信息(a piece ofknowledge)對專利B而言是“相關(guān)”的,例如可能A是B的改良、或是對于相同的問題,A采用了和B不同的作法。從“信息流”(information flow)的角度來看,可以想象該“a piece of knowledge”從專利A “流向”專利B。因此用連結(jié)來表示的話,專利A和專利B是兩個節(jié)點(diǎn)(node),而A與B的連結(jié)是用從A到B —個箭頭(arrow) 來表示,代表了 “a piece of knowledge”從A “流向” B。請注意到,前述的“引證關(guān)系”可以是采用所謂的前向引證(forward citation)或是后向引證(backward citation) 二者其中之一。如圖4A至圖4C所示,該圖為引證網(wǎng)絡(luò)示意圖。根據(jù)圖3A的檢索結(jié)果,利用步驟 202得到的引證網(wǎng)絡(luò)包含有多個聚落(cluster),本實(shí)施例為三個(圖4A至圖4C)。聚落中的任二專利案件必然有直接或間接的引證關(guān)系。再回到圖2所示,接著以步驟203,由該引證網(wǎng)絡(luò)所包含的聚落中,根據(jù)每一個聚落所含有的專利案件數(shù)、或者是否有包含目標(biāo)專利案件P以選擇適當(dāng)?shù)木勐?。例如,以目?biāo)專利案件P為US. Pat. No. 4,310,211為例,在該多個聚落中選擇適當(dāng)?shù)木勐渥鳛橐C網(wǎng)絡(luò)時,主要有幾種情況第一種為目標(biāo)專利案件P完全不在任何聚落內(nèi),例如在圖4A至圖4C中完全找不到目標(biāo)專利案件P。第二種為目標(biāo)專利案件P確實(shí)屬于其中之一聚落,但該聚落的專利數(shù)量很少,例如,圖4B與圖4C都是數(shù)量小的聚落。第三種即為目標(biāo)專利案件處于適當(dāng)大小的聚落中,如圖4A的聚落所示。如果是屬于第一種與第二種的情況,則表示檢索條件不適當(dāng),因此需要再重新回到步驟20進(jìn)行檢索。由于在本實(shí)施例中,目標(biāo)專利案件P并沒有出現(xiàn)在圖4B與圖4C中的聚落中,因此可以剔除圖4B與圖4C的聚落,將被評價的而目標(biāo)專利案件P所在的聚落大小適當(dāng),因此以含有該目標(biāo)專利案件P的聚落(如圖4A所示)作為引證網(wǎng)絡(luò)。由于目標(biāo)專利案件P并沒有出現(xiàn)在圖4B與圖4C中之中,因此可以剔除圖4B與圖4C,而以圖 4A作為接下來分析的依據(jù)。請注意到引證網(wǎng)絡(luò)可以包含一或多個聚落,而聚落也可以視為是一引證網(wǎng)絡(luò)里的一個子網(wǎng)絡(luò)(sub-network)。換言之,一個聚落本身也是一子網(wǎng)絡(luò)。在本說明書中,“子網(wǎng)絡(luò)”與“聚落” 二詞其實(shí)是同義的。圖2B為本發(fā)明的專利數(shù)據(jù)挖掘系統(tǒng)100的功能結(jié)構(gòu)模塊圖。在該實(shí)施例中,該引證分析單元12進(jìn)一步包括一聚落選擇單元123,該聚落選擇單元123用于根據(jù)一選擇條件,從該專利群組形成的多個聚落中選擇一個,該選擇條件包括一專利案件數(shù)量和/或一目標(biāo)專利案件,該聚落選擇單元選擇符合該專利案件數(shù)量的聚落,和/或,選擇包含該目標(biāo)專利案件的聚落。再回到圖IG所示,步驟20選擇至少一適當(dāng)?shù)木勐渲螅又圆襟E21給予該聚落中的每一連結(jié)一權(quán)重值。在步驟21中,給予權(quán)重的方式有很多種,例如,每一個連結(jié)的權(quán)重值都為1,或者是以搜尋路徑連結(jié)記數(shù)法(search pathlink count, SPLC)或者是搜尋路徑節(jié)點(diǎn)對法(search path node pair, SPNP)來計算每一個連結(jié)所具有的權(quán)重。在一具體實(shí)施例中,如圖2B所示,該引證分析單元12包括一搜尋路徑連結(jié)記數(shù)單元121或者一搜尋路徑節(jié)點(diǎn)對單元122(圖中未示),該搜尋路徑連結(jié)記數(shù)單元121用于根據(jù)搜尋路徑連結(jié)記數(shù)法為每個連結(jié)賦予權(quán)重值,該搜尋路徑節(jié)點(diǎn)對單元122用于根據(jù)搜尋路徑節(jié)點(diǎn)對法為每個連結(jié)賦予權(quán)重值。請參閱圖5A與圖5B所示,該圖分別為利用SPLC或者是SPNP給予連結(jié)權(quán)重示意圖。首先說明SPLC的方式,在圖5A中,對于連結(jié)90而言,在連結(jié)90的右側(cè)有兩個節(jié)點(diǎn)A 與B(每一個節(jié)點(diǎn)代表專利公告案或者是專利公開案);而在連結(jié)90的左側(cè)可以達(dá)到四個節(jié)點(diǎn)E、G、I與J,因此該連結(jié)90的權(quán)重為虹2 = 8。此外,如圖5B所示,以SPNP來計算連結(jié)91的權(quán)重時,對于連結(jié)91的節(jié)點(diǎn)D而言,其右端有三個節(jié)點(diǎn)A C可以經(jīng)過連結(jié)91抵達(dá)節(jié)點(diǎn)D,而對節(jié)點(diǎn)C而言,其可經(jīng)過連結(jié)91抵達(dá)七個節(jié)點(diǎn)D J,因此連結(jié)91的權(quán)重為3x7 =21。步驟21所計算出的權(quán)重結(jié)果如圖6所示。再回到圖1所示,接著,以步驟22根據(jù)每一連結(jié)所具有的權(quán)重值,計算挑選出的適當(dāng)?shù)木勐銼’中關(guān)于每一個專利案件所具有的一中心性指標(biāo)。本實(shí)施例的中心性指標(biāo)為特征向量中心性(eigenvector centrality,EC)。由于專利引證所形成的引證網(wǎng)絡(luò)可以視為一種廣義的社會網(wǎng)絡(luò)(socialnetwork),而中心性 (centrality)是社會網(wǎng)絡(luò)分析中一個相當(dāng)重要的概念,用來衡量網(wǎng)絡(luò)中每一個節(jié)點(diǎn)的重要性。而本實(shí)施例所使用的特征向量中心性,其可以應(yīng)用到有方向性以及有權(quán)重的網(wǎng)絡(luò)中。而特征向量中心性具有獨(dú)特的特性,亦即節(jié)點(diǎn)的重要性與所有指向的節(jié)點(diǎn)所具有的重效性成正比,例如,在專利引證網(wǎng)絡(luò)中,被一個重要專利引用的專利,則其重要性也會大幅增加。因此,中心性高的專利,并非由引證數(shù)(citation count)決定,而是由該專利在引證網(wǎng)絡(luò)中的位置重要性來決定。接下來說明中心性指標(biāo)獲取單元13如何計算該中心性指標(biāo)的方法。特征向量中心性的概念說明如下,假設(shè)有一 η個節(jié)點(diǎn)的網(wǎng)絡(luò),其具有連結(jié)所構(gòu)成的權(quán)重矩陣Α。在矩陣 A中的每一個元素^^代表節(jié)點(diǎn)k指向節(jié)點(diǎn)j的權(quán)重。在矩陣中,對角線的元素皆為零。再假設(shè)有一 η元素的向量I,其中向量I中的每一個元素Ij代表對應(yīng)的節(jié)點(diǎn)j的重要性(rank score)。由于特征向量中心性(EC)的概念在于每一個節(jié)點(diǎn)的重要性應(yīng)該與指向該節(jié)點(diǎn)的所有節(jié)點(diǎn)重要性乘上相對應(yīng)連結(jié)的權(quán)重后而成一比例關(guān)系,如下式(1)所示
權(quán)利要求
1.一種專利數(shù)據(jù)挖掘系統(tǒng),其特征在于,包括專利群組獲取單元,用于獲取一專利群組;引證分析單元,用于分析該專利群組的各個專利案件之間的引證關(guān)系以建立一引證網(wǎng)絡(luò),該引證網(wǎng)絡(luò)具有多個連結(jié),每個該連結(jié)均根據(jù)該專利群組中具有引證關(guān)系的兩專利案件間的引證關(guān)系而形成,該引證分析單元于該引證網(wǎng)絡(luò)中獲取一聚落,為該聚落中所具有的每個連結(jié)賦予一權(quán)重值;以及中心性指標(biāo)獲取單元,用于根據(jù)每個該連結(jié)所具有的權(quán)重值,計算該聚落中每個專利案件的中心性指標(biāo)。
2.如權(quán)利要求1所述的系統(tǒng),其特征在于,該引證分析單元包括一搜尋路徑連結(jié)記數(shù)單元或者一搜尋路徑節(jié)點(diǎn)對單元,該搜尋路徑連結(jié)記數(shù)單元用于根據(jù)搜尋路徑連結(jié)記數(shù)法為每個連結(jié)賦予權(quán)重值,該搜尋路徑節(jié)點(diǎn)對單元用于根據(jù)搜尋路徑節(jié)點(diǎn)對法為每個連結(jié)賦予權(quán)重值。
3.如權(quán)利要求1所述的系統(tǒng),其特征在于,該中心性指標(biāo)為特征向量中心性。
4.如權(quán)利要求1所述的系統(tǒng),其特征在于,該引證分析單元進(jìn)一步包括聚落選擇單元,用于根據(jù)一選擇條件,從該引證網(wǎng)絡(luò)形成的多個聚落中選擇一個,該選擇條件包括一專利案件數(shù)量或者一目標(biāo)專利案件,該聚落選擇單元選擇符合該專利案件數(shù)量的聚落,或者,選擇包含該目標(biāo)專利案件的聚落。
5.如權(quán)利要求4所述的系統(tǒng),其特征在于,該系統(tǒng)還包括有一自動評價與識別單元,用于評價該目標(biāo)專利案件所具有的該中心性指標(biāo)于該聚落中的一相對評價指標(biāo),該相對評價指標(biāo)指該目標(biāo)專利案件所具有的該中心性指標(biāo)的百分等級。
6.如權(quán)利要求4所述的系統(tǒng),其特征在于,該系統(tǒng)還包括一自動評價與識別單元,利用該目標(biāo)專利案件的該中心性指標(biāo)與該聚落中的一具有確定價值的專利案件間的該中心性指標(biāo)的比例,計算該目標(biāo)專利案件所具有的價值。
7.如權(quán)利要求4所述的系統(tǒng),其特征在于,該專利群組為根據(jù)至少一檢索條件于一數(shù)據(jù)庫中尋找出的包含多個專利案件的集合。
8.如權(quán)利要求7所述的系統(tǒng),其特征在于,該專利群組獲取單元進(jìn)一步包括更新單元, 該更新單元判斷檢索到的該專利群組是否包含該目標(biāo)專利案件,如否,則調(diào)整該檢索條件, 重新產(chǎn)生一專利群組,直到所產(chǎn)生的專利群組包括該目標(biāo)專利案件。
9.如權(quán)利要求4所述的系統(tǒng),其特征在于,該專利群組為由該目標(biāo)專利案件至少一階前向引證展開、以及至少一階后向引證展開所形成的集合。
10.如權(quán)利要求9所述的系統(tǒng),其特征在于,該目標(biāo)專利案件直接或間接后向引證的一專利案件展開時,該專利群組僅包含該專利案件后向引證的專利案件;或者,該目標(biāo)專利案件直接或間接前向引證的一專利案件展開時,該專利群組僅包含該專利案件前向引證的專利案件。
11.一種專利數(shù)據(jù)挖掘方法,應(yīng)用于權(quán)利要求1所述的系統(tǒng)中,其特征在于,至少包含下列步驟利用專利群組獲取單元獲取一專利群組;利用引證分析單元分析該專利群組的各個專利案件之間的引證關(guān)系以建立一引證網(wǎng)絡(luò),該引證網(wǎng)絡(luò)具有多個連結(jié),每個該連結(jié)均根據(jù)該專利群組中具有引證關(guān)系的兩專利案件間的引證關(guān)系而形成,該引證分析單元于該引證網(wǎng)絡(luò)中獲取一聚落,并為該聚落中所具有的每個連結(jié)賦予一權(quán)重值;以及利用中心性指標(biāo)獲取單元根據(jù)每個該連結(jié)所具有的權(quán)重值,計算該聚落中每個專利案件的中心性指標(biāo)。
全文摘要
本發(fā)明提供一種專利數(shù)據(jù)挖掘系統(tǒng)及方法,該系統(tǒng)包括專利群組獲取單元,用于獲取一專利群組;引證分析單元,用于分析該專利群組的各個專利案件之間的引證關(guān)系以建立一引證網(wǎng)絡(luò),該引證網(wǎng)絡(luò)具有多個連結(jié),每個該連結(jié)均根據(jù)該專利群組中具有引證關(guān)系的兩專利案件間的引證關(guān)系而形成,該引證分析單元于該引證網(wǎng)絡(luò)中獲取一聚落,為該聚落中所具有的每個連結(jié)賦予一權(quán)重值;以及中心性指標(biāo)獲取單元,用于根據(jù)每個該連結(jié)所具有的權(quán)重值,計算該聚落中每個專利案件的中心性指標(biāo)。
文檔編號G06F17/30GK102331987SQ20101022750
公開日2012年1月25日 申請日期2010年7月12日 優(yōu)先權(quán)日2010年7月12日
發(fā)明者劉顯仲, 查士朝, 管中徽, 鄭正元, 高振滄 申請人:管中徽
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
云林县| 金寨县| 堆龙德庆县| 千阳县| 龙井市| 长葛市| 荥阳市| 河东区| 嘉祥县| 鲁甸县| 拜城县| 灌阳县| 乐陵市| 眉山市| 乌拉特后旗| 扎赉特旗| 尉氏县| 舞阳县| 垫江县| 松溪县| 舞阳县| 遵义县| 鹿邑县| 南召县| 罗源县| 达拉特旗| 柘城县| 梓潼县| 江永县| 托克逊县| 白沙| 九江市| 峨眉山市| 永新县| 南宁市| 成都市| 庐江县| 专栏| 潮州市| 墨玉县| 翁牛特旗|