本發(fā)明涉及創(chuàng)投信息跟蹤、歸集方法。
背景技術(shù):
目前的創(chuàng)投庫(kù)均是通過網(wǎng)絡(luò)爬蟲爬取新聞,然后,再根據(jù)新聞內(nèi)容進(jìn)行人工采編或者通過向特定對(duì)象人工采集的方式,獲取投資機(jī)構(gòu)的投資信息,以此建立創(chuàng)投庫(kù)。但是,該方法效率低,無法適應(yīng)目前復(fù)雜多變的投資市場(chǎng),且網(wǎng)上的新聞信息具有部分虛假信息,或者部分新聞只是傳言,獲取投資事件的數(shù)量有極大缺陷,因此可能導(dǎo)致創(chuàng)投庫(kù)中有信息不真實(shí)的情況。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明解決的技術(shù)問題是提供一種創(chuàng)投信息跟蹤、歸集方法,以為用戶帶來更真實(shí)、及時(shí)的創(chuàng)投信息。
為解決上述技術(shù)問題,本發(fā)明采用如下技術(shù)方案:
一種創(chuàng)投信息跟蹤、歸集方法,包括以下步驟:
1)信息采集階段:通過爬蟲軟件采集網(wǎng)絡(luò)數(shù)據(jù)獲得企業(yè)投資信息;
2)信息驗(yàn)證階段:將采集的企業(yè)投資信息與外部數(shù)據(jù)源進(jìn)行比對(duì)驗(yàn)證數(shù)據(jù)真實(shí)性;
3)信息歸集階段:判斷企業(yè)投資信息所對(duì)應(yīng)的投資主體和被投企業(yè),并為投資主體和被投企業(yè)創(chuàng)建信息庫(kù),將企業(yè)投資信息歸集至信息庫(kù)中對(duì)應(yīng)的投資主體和被投企業(yè)下;
4)信息整理階段:根據(jù)信息庫(kù)中的企業(yè)投資信息計(jì)算投資輪次,并生成投資機(jī)構(gòu)可視化信息圖譜、投資機(jī)構(gòu)投資事件列表和投資事件企業(yè)具體信息;
5)信息輸出階段:將投資機(jī)構(gòu)可視化信息圖譜、投資機(jī)構(gòu)投資事件列表和投資事件企業(yè)具體信息更新至前臺(tái)列表中;
6)校對(duì)階段:手工對(duì)前臺(tái)列表進(jìn)行校正。
進(jìn)一步的,所述信息采集階段中采集的網(wǎng)絡(luò)數(shù)據(jù)至少包括有:新聞信息、信息紕漏類信息、人脈數(shù)據(jù)源、企業(yè)數(shù)據(jù)源。
進(jìn)一步的,所述信息驗(yàn)證階段中所述外部數(shù)據(jù)源至少包括工商信息、實(shí)際控制人信息和股東信息。
進(jìn)一步的,所述投資主體包括投資集團(tuán)、基金管理人、投資基金,所述信息庫(kù)包括與投資集團(tuán)對(duì)應(yīng)的投資集團(tuán)信息庫(kù)、與基金管理人對(duì)應(yīng)的基金管理人信息庫(kù)、與投資基金對(duì)應(yīng)的投資基金信息庫(kù)、與被投企業(yè)對(duì)應(yīng)的被投企業(yè)信息庫(kù)。
進(jìn)一步的,在所述信息歸集階段和信息整理階段之間,自動(dòng)跟蹤信息庫(kù)中投資主體的對(duì)外投資信息,同時(shí)根據(jù)對(duì)外投資信息獲取被投企業(yè)的信息。
進(jìn)一步的,所述信息整理階段中,根據(jù)信息庫(kù)中的企業(yè)投資信息自動(dòng)計(jì)算投資主體的興趣、偏好
進(jìn)一步的,所述信息整理中,根據(jù)信息庫(kù)中的企業(yè)投資信息自動(dòng)預(yù)測(cè)投資主體的投資行為,自動(dòng)匹配潛在創(chuàng)業(yè)項(xiàng)目至投資主體。
進(jìn)一步的,所述信息輸出階段中所述投資機(jī)構(gòu)可視化信息圖譜至少包括投資熱力地形圖、投資偏好玫瑰圖、投資行業(yè)矩形樹圖、機(jī)構(gòu)交叉持股網(wǎng)狀關(guān)聯(lián)圖其中之一。
本發(fā)明的有益效果:
本發(fā)明的創(chuàng)投信息跟蹤、歸集方法,通過電腦人工智能自動(dòng)對(duì)企業(yè)投資信息進(jìn)行采集、歸集整理,提高了信息獲取的速度,通過跟蹤投資主體的動(dòng)態(tài),信息能更快的更新為用戶所用。并且相比傳統(tǒng)人工采編的方式,本發(fā)明能節(jié)約大量的人力成本。且本發(fā)明通過將企業(yè)投資信息與外部數(shù)據(jù)源進(jìn)行比對(duì)驗(yàn)證,提高企業(yè)投資信息的可靠性和真實(shí)性,有利于用戶更準(zhǔn)確的判斷投資市場(chǎng)。
本發(fā)明的這些特點(diǎn)和優(yōu)點(diǎn)將會(huì)在下面的具體實(shí)施方式中詳細(xì)的揭露。
【具體實(shí)施方式】
下面結(jié)合基體實(shí)施例對(duì)本發(fā)明的技術(shù)方案進(jìn)行詳細(xì)說明,但下述實(shí)施例僅僅為本發(fā)明的優(yōu)選實(shí)施例,并非全部?;趯?shí)施方式中的實(shí)施例,本領(lǐng)域技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)的前提下所獲得其它實(shí)施例,都屬于本發(fā)明的保護(hù)范圍。
本發(fā)明提供的一種創(chuàng)投信息跟蹤、歸集方法,應(yīng)用在計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)中,具體包括以下步驟:
1)信息采集階段:通過爬蟲軟件采集網(wǎng)絡(luò)數(shù)據(jù)獲得企業(yè)投資信息;其中采集的網(wǎng)絡(luò)數(shù)據(jù)至少包括有:新聞信息、信息紕漏類信息、人脈數(shù)據(jù)源、企業(yè)數(shù)據(jù)源。采集網(wǎng)上大量的投資信息,并自動(dòng)將不同類型的集數(shù)據(jù)信息源頭轉(zhuǎn)化成指定的標(biāo)準(zhǔn)字段。
2)信息驗(yàn)證階段:將采集的企業(yè)投資信息與若干外部數(shù)據(jù)源進(jìn)行比對(duì)驗(yàn)證數(shù)據(jù)真實(shí)性,外部數(shù)據(jù)源包括工商信息、實(shí)際控制人信息和股東信息等;通過將企業(yè)投資信息與具有公信力的政府信息和可靠的招商網(wǎng)頁(yè)信息進(jìn)行比對(duì),驗(yàn)證企業(yè)投資信息的正確性,提高創(chuàng)投信息真實(shí)性。驗(yàn)證結(jié)果為假時(shí),將該條企業(yè)投資信息直接刪除終止,驗(yàn)證結(jié)果為真時(shí),繼續(xù)下續(xù)步驟。
3)信息歸集階段:判斷企業(yè)投資信息所對(duì)應(yīng)的投資主體和被投企業(yè),并為投資主體和被投企業(yè)創(chuàng)建信息庫(kù),將企業(yè)投資信息歸集至對(duì)應(yīng)的信息庫(kù)中;如果信息庫(kù)中已有該投資主體或是被投企業(yè),則直接將企業(yè)投資信息歸集至信息庫(kù)對(duì)應(yīng)的投資主體或是被投企業(yè)中;若是信息庫(kù)中還沒有該投資主體或是被投企業(yè),則在信息庫(kù)中創(chuàng)建該投資主體或是被投企業(yè)的板塊,然后再將企業(yè)投資信息歸集至信息庫(kù)對(duì)應(yīng)的投資主體或是被投企業(yè)中。
并且自動(dòng)跟蹤信息庫(kù)中投資主體的對(duì)外投資信息,同時(shí)根據(jù)對(duì)外投資信息獲取被投企業(yè)的信息,被投企業(yè)的信息包括但不限于法人,所處行業(yè),股東,注冊(cè)資本,注冊(cè)地址,歷史變更記錄等信息;并將被投企業(yè)信息歸集至信息庫(kù)中對(duì)應(yīng)的被投企業(yè)下,將對(duì)外投資信息歸集至信息庫(kù)中對(duì)應(yīng)的投資主體下。采取跟蹤投資主體的動(dòng)態(tài)達(dá)到收集創(chuàng)投機(jī)構(gòu)投資事件的目的,來及時(shí)的獲取企業(yè)投資信息,確保數(shù)據(jù)更新的及時(shí)性。
4)信息整理階段:根據(jù)信息庫(kù)中的企業(yè)投資信息計(jì)算投資輪次,并生成投資機(jī)構(gòu)可視化信息圖譜、投資機(jī)構(gòu)投資事件列表和投資事件企業(yè)具體信息;
并且根據(jù)信息庫(kù)中的企業(yè)投資信息自動(dòng)計(jì)算投資主體的興趣、偏好。根據(jù)信息庫(kù)中的企業(yè)投資信息自動(dòng)預(yù)測(cè)投資主體的投資行為,自動(dòng)匹配潛在創(chuàng)業(yè)項(xiàng)目至投資機(jī)構(gòu)。更智能的對(duì)投資市場(chǎng)繼續(xù)預(yù)測(cè)風(fēng)險(xiǎn),滿足用戶更大的需求。
5)信息輸出階段:將投資機(jī)構(gòu)可視化信息圖譜、投資機(jī)構(gòu)投資事件列表和投資事件企業(yè)具體信息等信息更新至前臺(tái)列表中;投資機(jī)構(gòu)可視化信息圖譜至少包括投資熱力地形圖、投資偏好玫瑰圖、投資行業(yè)矩形樹圖、機(jī)構(gòu)交叉持股網(wǎng)狀關(guān)聯(lián)圖其中之一,從而帶來更好的用戶體驗(yàn)。
6)校對(duì)階段:手工對(duì)前臺(tái)列表的進(jìn)行校正,更正數(shù)據(jù)中的錯(cuò)誤。
上述的投資主體包括投資集團(tuán)、基金管理人、投資基金等,信息庫(kù)包括與投資集團(tuán)對(duì)應(yīng)的投資集團(tuán)信息庫(kù)、與基金管理人對(duì)應(yīng)的基金管理人信息庫(kù)、與投資基金對(duì)應(yīng)的投資基金信息庫(kù)、與被投企業(yè)對(duì)應(yīng)的被投企業(yè)信息庫(kù)。建立全面的信息庫(kù)有利于用戶全方位的連接所需的投資資訊,為用于的選擇提供更優(yōu)良的參考。
通過上述實(shí)施例,本發(fā)明的目的已經(jīng)被完全有效的達(dá)到了。熟悉該項(xiàng)技術(shù)的人士應(yīng)該明白本發(fā)明包括但不限上面具體實(shí)施方式中描述的內(nèi)容。任何不偏離本發(fā)明的修改都將包括在權(quán)利要求書的范圍中。