一種興趣點poi數(shù)據(jù)的分類方法和裝置的制造方法
【技術領域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)技術領域,特別涉及一種興趣點POI數(shù)據(jù)的分類方法和裝置。
【背景技術】
[0002]POI (Point of Interest),即興趣點,是地理信息系統(tǒng)中重要的信息,甚至可以稱為整個地圖導航產(chǎn)業(yè)的基石。在地理信息系統(tǒng)中,一個POI可以是一棟房子,一個商鋪,一個郵筒,一個公交站等。傳統(tǒng)的地理信息采集方法需要地圖測繪人員采用精密的測繪儀器去獲取一個POI的經(jīng)瑋度,然后再標記下來。
[0003]而在互聯(lián)網(wǎng)中,實現(xiàn)了將測繪得到的底圖數(shù)據(jù)制成電子地圖,自然地,在電子地圖中可以根據(jù)POI經(jīng)瑋度將其在電子地圖中加以標注?,F(xiàn)有的生活服務類平臺大多擁有自己的POI數(shù)據(jù)庫,可以為用戶提供服務型POI數(shù)據(jù),但POI數(shù)據(jù)庫只能涵蓋部分POI信息,在海量網(wǎng)頁中依然存在著許多未被收錄的POI數(shù)據(jù),由此產(chǎn)生了對POI進行數(shù)據(jù)挖掘的需求。
[0004]但挖掘到的POI數(shù)據(jù)往往只包含名稱、地址、經(jīng)瑋度、分類信息中的一種或幾種,而用戶在利用電子地圖的搜索功能搜索POI時,往往需要按類別搜索POI數(shù)據(jù),如搜索附近的餐館時,如果POI數(shù)據(jù)不包含分類信息,那么在名稱中不包含“餐館”的POI數(shù)據(jù)通常無法呈現(xiàn)給用戶,例如屬于“餐館”的“俏江南”,因為名稱原因就不會被提供給用戶。因此產(chǎn)生了對POI數(shù)據(jù)進行分類,或?qū)σ延械腜OI數(shù)據(jù)的分類信息加以修改的需求。
【發(fā)明內(nèi)容】
[0005]鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的興趣點POI數(shù)據(jù)的分類方法和裝置。
[0006]依據(jù)本發(fā)明的一個方面,提供了一種興趣點POI數(shù)據(jù)的分類方法,包括:對于獲取到的一個POI數(shù)據(jù),根據(jù)該POI數(shù)據(jù)的內(nèi)容確定對應的品牌信息;根據(jù)所確定的品牌信息查詢各品牌信息對應分類信息的數(shù)據(jù)庫,查找到與其對應的分類信息;根據(jù)所查找到的分類信息確定所述POI數(shù)據(jù)的分類,或者根據(jù)所查找到的分類信息糾正所述POI數(shù)據(jù)的分類。
[0007]可選地,該方法進一步包括:獲取品牌信息以及品牌對應的分類信息,保存到所述數(shù)據(jù)庫中。
[0008]可選地,獲取品牌信息以及品牌對應的分類信息,保存到所述數(shù)據(jù)庫中包括:從互聯(lián)網(wǎng)中挖掘一批包含分類信息的POI數(shù)據(jù);對于所述一批POI數(shù)據(jù)中的每個POI數(shù)據(jù),從該POI數(shù)據(jù)中分析得到其品牌信息;將所述一批POI數(shù)據(jù),按照品牌信息進行分類;對于每個類,根據(jù)該類中的各POI數(shù)據(jù)所包含的分類信息最終確定該類的分類信息;將每個類對應的品牌信息和分類信息對應保存到所述數(shù)據(jù)庫中。
[0009]可選地,所述從該POI數(shù)據(jù)中分析得到其品牌信息包括:如果該POI數(shù)據(jù)以括號分隔為兩部分,則括號外的部分為品牌信息,括號內(nèi)的部分為非品牌信息;如果該POI數(shù)據(jù)以連接號分隔為兩部分,則連接號前的部分為品牌信息,將連接號后的部分為非品牌信息。
[0010]可選地,所述對于每個類,根據(jù)該類中的各POI數(shù)據(jù)所包含的分類信息最終確定該類的分類信息包括:如果該類中的各POI數(shù)據(jù)所包含的分類信息為同一個分類信息,則將該同一個分類信息作為該類的分類信息;如果該類中的各POI數(shù)據(jù)所包含的分類信息為不同的多個分類信息,則從所述多個分類信息中選擇一個分類信息作為該類的分類信息,或者,將所述多個分類信息共同作為該類的分類信息,或者,根據(jù)所述多個分類信息概括出一個分類信息作為該類的分類信息。
[0011]可選地,從所述多個分類信息中選擇一個分類信息作為該類的分類信息包括:選擇對應的POI數(shù)據(jù)最多的一個分類信息作為該類的分類信息。
[0012]可選地,所述根據(jù)該POI數(shù)據(jù)的內(nèi)容確定對應的品牌信息包括:如果該POI數(shù)據(jù)以括號分隔為兩部分,則括號外的部分為品牌信息,括號內(nèi)的部分為非品牌信息;如果該POI數(shù)據(jù)連接號分隔為兩部分,則連接號前的部分為品牌信息,將連接號后的部分為非品牌信息。
[0013]可選地,該方法進一步包括:對于獲取到的一個POI數(shù)據(jù),如果根據(jù)該POI數(shù)據(jù)的內(nèi)容無法確定對應的品牌信息,則直接將該POI數(shù)據(jù)與所述數(shù)據(jù)庫中的各品牌信息進行匹配,如果通過匹配得知該POI數(shù)據(jù)中包含所述數(shù)據(jù)庫中的一個品牌信息,則確定該品牌信息即為該POI數(shù)據(jù)對應的品牌信息。
[0014]依據(jù)本發(fā)明的另一方面,一種興趣點POI數(shù)據(jù)的分類裝置,其中,該裝置包括:品牌信息確定單元,適于對于獲取到的一個POI數(shù)據(jù),根據(jù)該POI數(shù)據(jù)的內(nèi)容確定對應的品牌信息;查找單元,適于根據(jù)所確定的品牌信息查詢各品牌信息對應分類信息的數(shù)據(jù)庫,查找到與其對應的分類信息;品牌分類單元,適于根據(jù)將所查找到的分類信息確定所述POI數(shù)據(jù)的分類,或者根據(jù)所查找到的分類信息糾正所述POI數(shù)據(jù)的分類。
[0015]可選地,該裝置進一步包括:品牌分類獲取單元,適于獲取品牌信息以及品牌對應的分類信息,保存到所述數(shù)據(jù)庫中。
[0016]可選地,所述品牌分類獲取單元,適于從互聯(lián)網(wǎng)中挖掘一批包含分類信息的POI數(shù)據(jù);對于所述一批POI數(shù)據(jù)中的每個POI數(shù)據(jù),從該POI數(shù)據(jù)中分析得到其品牌信息;將所述一批POI數(shù)據(jù),按照品牌信息進行分類;對于每個類,根據(jù)該類中的各POI數(shù)據(jù)所包含的分類信息最終確定該類的分類信息;將每個類對應的品牌信息和分類信息對應保存到所述數(shù)據(jù)庫中。
[0017]可選地,所述品牌分類獲取單元,適于當該POI數(shù)據(jù)以括號分隔為兩部分時,將括號外的部分確定為品牌信息,將括號內(nèi)的部分確定為非品牌信息;以及當該POI數(shù)據(jù)以連接號分隔為兩部分時,將連接號前的部分確定為品牌信息,將連接號后的部分確定為非品牌信息。
[0018]可選地,所述品牌分類獲取單元,適于當該類中的各POI數(shù)據(jù)所包含的分類信息為同一個分類信息時,將該同一個分類信息作為該類的分類信息;當該類中的各POI數(shù)據(jù)所包含的分類信息為不同的多個分類信息時,從所述多個分類信息中選擇一個分類信息作為該類的分類信息,或者,將所述多個分類信息共同作為該類的分類信息,或者,根據(jù)所述多個分類信息概括出一個分類信息作為該類的分類信息。
[0019]可選地,所述品牌分類獲取單元,適于當該類中的各POI數(shù)據(jù)所包含的分類信息為不同的多個分類信息時,選擇對應的POI數(shù)據(jù)最多的一個分類信息作為該類的分類信息。
[0020]可選地,所述品牌信息確定單元,適于當該POI數(shù)據(jù)以括號分隔為兩部分時,將括號外的部分確定為品牌信息,括號內(nèi)的部分確定為非品牌信息;以及適于當該POI數(shù)據(jù)連接號分隔為兩部分時,將連接號前的部分確定為品牌信息,將連接號后的部分確定為非品牌信息。
[0021]可選地,所述查找單元,進一步適于對于獲取到的一個POI數(shù)據(jù),當所述品牌信息確定單元根據(jù)該POI數(shù)據(jù)的內(nèi)容無法確定對應的品牌信息時,直接將該POI數(shù)據(jù)與所述數(shù)據(jù)庫中的各品牌信息進行匹配,如果通過匹配得知該POI數(shù)據(jù)中包含所述數(shù)據(jù)庫中的一個品牌信息,則確定該品牌信息即為該POI數(shù)據(jù)對應的品牌信息。
[0022]由上述可知,本發(fā)明的技術方案,對于獲取到的一個POI數(shù)據(jù),先根據(jù)該POI數(shù)據(jù)的內(nèi)容確定對應的品牌信息,再根據(jù)所確定的品牌信息查詢各品牌信息對應分類信息的數(shù)據(jù)庫,查找到與其對應的分類信息,最終根據(jù)所查找到的分類信息確定所述POI數(shù)據(jù)的分類,或者根據(jù)所查找到的分類信息糾正所述POI數(shù)據(jù)的分類。該技術方案既可以對原本不包含分類信息的POI數(shù)據(jù)進行補全,還可以檢驗已包含分類信息的POI數(shù)據(jù)中的分類信息是否正確,如不正確還可糾正,在用戶按分類信息搜