專利名稱:用于位置搜索查詢的地理編碼的制作方法
技術(shù)領(lǐng)域:
搜索引擎提供強(qiáng)大的工具來(lái)定位在大型文檔數(shù)據(jù)庫(kù)中的文檔(諸 如因特網(wǎng)或萬(wàn)維網(wǎng)(WWW)上的文檔、和/或存儲(chǔ)在內(nèi)聯(lián)網(wǎng)的計(jì)算機(jī) 上的文檔)中的內(nèi)容。響應(yīng)于搜索査詢使用文檔的索引來(lái)定位文檔, 所述搜索查詢由用戶提交的一個(gè)或多個(gè)詞、詞語(yǔ)、關(guān)鍵詞和/或短語(yǔ)(此 后稱為詞語(yǔ))組成。可以將在文檔的索引中的文檔與搜索査詢中的一 個(gè)或多個(gè)詞語(yǔ)相匹配以確定分值?;诜种?,將相關(guān)文檔或文檔位置 的排名的列表提供給用戶。
搜索查詢可能具有各種目的和格式。 一種種類的格式與位置搜索 相對(duì)應(yīng)。傳統(tǒng)的位置搜索通常使用諸如模板的固定的格式。現(xiàn)有的模 板通常是固定的或可能僅允許有限數(shù)量的變化。例如,在現(xiàn)有的位置 搜索查詢中的詞或詞語(yǔ)可能具有預(yù)定的次序(街道名稱、州、郵政編 碼)和/或預(yù)定的拼寫(xiě)。因此,(在傳統(tǒng)的位置搜索中)提供包括拼寫(xiě) 錯(cuò)誤的寬泛的拼寫(xiě)、用于位置的可選的名稱以及諸如在不同的國(guó)家創(chuàng) 建的可選的地址格式是困難的或不可能的。
響應(yīng)于位置搜索査詢,許多現(xiàn)有的搜索引擎通常返回單個(gè)結(jié)果。 結(jié)合對(duì)位置搜索査詢的格式靈活性的缺乏,這使得適應(yīng)在位置搜索查 詢和/或返回用戶的結(jié)果中的不確定性或含混性是困難的。在現(xiàn)有的位置搜索査詢中的靈活性的缺乏也通常損害搜索引擎性 能,因?yàn)橥ǔR詥我粩?shù)據(jù)結(jié)構(gòu)來(lái)處理現(xiàn)有的位置搜索查詢。無(wú)法調(diào)整 數(shù)據(jù)結(jié)構(gòu)并且將該數(shù)據(jù)結(jié)構(gòu)分發(fā)到整個(gè)搜索引擎可以導(dǎo)致對(duì)位置搜索 査詢的處理較慢??朔@樣的瓶頸可能導(dǎo)致額外的搜索引擎復(fù)雜度及 費(fèi)用。
因此需要用于處理位置搜索査詢的改進(jìn)的格式和技術(shù)。另外,也 需要改進(jìn)向用戶報(bào)告位置搜索查詢的結(jié)果。
發(fā)明內(nèi)容
通過(guò)所公開(kāi)的過(guò)程和搜索引擎的實(shí)施例減少或消除了上述不足以 及與位置搜索査詢相關(guān)聯(lián)的其它問(wèn)題。
在一些實(shí)施例中,用于執(zhí)行位置搜索的方法包括接收位置搜索 査詢;確定與位置搜索査詢相對(duì)應(yīng)的關(guān)鍵詞;識(shí)別與位置搜索查詢中 的關(guān)鍵詞相對(duì)應(yīng)的一個(gè)或多個(gè)文檔;以及向客戶端系統(tǒng)提供識(shí)別與一 個(gè)或多個(gè)文檔相對(duì)應(yīng)的至少一個(gè)位置的信息。
確定關(guān)鍵詞可以包括從位置搜索査詢中移除標(biāo)點(diǎn)符號(hào)和非位置詞 語(yǔ)。關(guān)鍵詞可以包括位置搜索查詢中的一個(gè)或多個(gè)詞語(yǔ)的一個(gè)或多個(gè) 同義詞。關(guān)鍵詞可以包括與一個(gè)或多個(gè)詞語(yǔ)相對(duì)應(yīng)的預(yù)定的縮略詞。
識(shí)別一個(gè)或多個(gè)文檔可以包括確定與關(guān)鍵詞相對(duì)應(yīng)的典范式 (canonical expression)。識(shí)別一個(gè)或多個(gè)文檔可以包括確定一個(gè)或多 個(gè)文檔中的每一個(gè)的分值。各個(gè)分值可以依據(jù)關(guān)鍵詞在多個(gè)文檔中的 詞頻、在各個(gè)文檔中的一個(gè)或多個(gè)詞與一個(gè)或多個(gè)關(guān)鍵詞之間的匹配 以及與關(guān)鍵詞相對(duì)應(yīng)的地理特征的大小。識(shí)別一個(gè)或多個(gè)文檔可以獨(dú) 立于關(guān)鍵詞的次序。一個(gè)或多個(gè)文檔可以被存儲(chǔ)在包括與地理特征相對(duì)應(yīng)的多個(gè)文檔 的索引中。多個(gè)文檔可以包括與地理特征相對(duì)應(yīng)的參考坐標(biāo)。
提供識(shí)別與一個(gè)或多個(gè)文檔相對(duì)應(yīng)的至少一個(gè)位置的信息可以包 括如果在一個(gè)或多個(gè)文檔的前N個(gè)排名中,相應(yīng)的文檔的最佳分值 大于下一個(gè)文檔的次(next)最佳分值的預(yù)定倍數(shù),則提供識(shí)別一個(gè)位 置的信息。提供操作可以包括識(shí)別出與一個(gè)或多個(gè)文檔相對(duì)應(yīng)的前N 個(gè)最高排名的位置,其中最高排名的文檔具有在預(yù)定范圍內(nèi)的分值。 在一些實(shí)施例中,在前N個(gè)排名中的每一個(gè)位置包括位置標(biāo)識(shí)符。在 一些實(shí)施例中,在前N個(gè)排名中的每一個(gè)位置包括指向地像的相 應(yīng)的鏈接。
提供操作可以包括提供與至少一個(gè)位置相對(duì)應(yīng)的地像。地圖 圖像可以以至少一個(gè)位置為中心,并且可以包括小于在至少一個(gè)位置 周?chē)念A(yù)定大小的區(qū)域。在一些實(shí)施例中,至少一個(gè)位置可以包括其 相應(yīng)的文檔具有所有共同的關(guān)鍵詞的兩個(gè)或多個(gè)不同的位置。地 像可以包括與兩個(gè)或多個(gè)位置相對(duì)應(yīng)的標(biāo)記。
在另一個(gè)實(shí)施例中,存儲(chǔ)在存儲(chǔ)器中的數(shù)據(jù)結(jié)構(gòu)可以被用于執(zhí)行 位置搜索查詢。數(shù)據(jù)結(jié)構(gòu)可以包括與地理特征相對(duì)應(yīng)的多個(gè)文檔或記 錄(在下文中稱為文檔)。在多個(gè)文檔中的各個(gè)文檔可以包括位置信 息和補(bǔ)充信息。位置信息可以包括與一個(gè)或多個(gè)位置相對(duì)應(yīng)的關(guān)鍵詞 或標(biāo)志(token)、與一個(gè)或多個(gè)位置相關(guān)聯(lián)的一個(gè)或多個(gè)區(qū)域以及關(guān) 鍵詞的同義詞。補(bǔ)充信息可以包括與一個(gè)或多個(gè)位置相對(duì)應(yīng)的參考坐 標(biāo)。
參考坐標(biāo)可以包括一個(gè)或多個(gè)位置的緯度和經(jīng)度。參考坐標(biāo)可以 包括圍繞一個(gè)或多個(gè)位置的區(qū)域。區(qū)域可以小于預(yù)定的大小。
數(shù)據(jù)結(jié)構(gòu)可以與超文本標(biāo)記語(yǔ)言(HTML)相兼容。在各個(gè)文檔中的位置信息可以對(duì)位置搜索查詢中的詞語(yǔ)的次序不 敏感。
在另一個(gè)實(shí)施例中,圖形用戶界面包括響應(yīng)于位置搜索查詢而提 供的區(qū)域的地像。地像包括與區(qū)域中的具有與位置搜索査詢 相關(guān)聯(lián)的所有共同的詞語(yǔ)的兩個(gè)或多個(gè)不同的位置相對(duì)應(yīng)的兩個(gè)或多 個(gè)標(biāo)記。
在另一個(gè)實(shí)施例中,圖形用戶界面包括響應(yīng)于位置搜索査詢而提 供的區(qū)域的地像。地像以位置為中心。地像是獨(dú)立于與 位置搜索查詢相關(guān)聯(lián)的詞語(yǔ)的次序來(lái)提供的。
上述的方法、數(shù)據(jù)結(jié)構(gòu)和圖形用戶界面可以被包括在具有一個(gè)或 多個(gè)中央處理單元的搜索引擎系統(tǒng)、在一個(gè)或多個(gè)計(jì)算機(jī)中的存儲(chǔ)器、 以及存儲(chǔ)在存儲(chǔ)器中并且由一個(gè)或多個(gè)中央處理器執(zhí)行的一個(gè)或多個(gè) 程序中和/或由它們執(zhí)行。
為了更好地理解本發(fā)明的上述實(shí)施例以及其另外的實(shí)施例,應(yīng)當(dāng) 結(jié)合附圖來(lái)參考下面的實(shí)施例的描述,其中在所有附圖中相同的參考 數(shù)字指代對(duì)應(yīng)的部分。
圖1是示出了位置搜索過(guò)程的實(shí)施例的流程圖。
圖2是示出了處理位置搜索査詢的實(shí)施例的框圖。 圖3是示出了將地理特征文檔分布到多個(gè)索引上的實(shí)施例的框圖。 圖4是示出了地理特征文檔的實(shí)施例的框圖。 圖5A是示出了地像的實(shí)施例的框圖。 圖5B是示出了地像的實(shí)施例的框圖。
圖6是示出了響應(yīng)于位置搜索查詢而返回的結(jié)果的實(shí)施例的框圖。圖7是示出了搜索引擎系統(tǒng)的實(shí)施例的框圖。
圖8是示出了搜索引擎的實(shí)施例的框圖。
圖9是示出了客戶端系統(tǒng)的實(shí)施例的框圖。
圖IO是示出了地理特征文檔數(shù)據(jù)結(jié)構(gòu)的實(shí)施例的框圖。
圖11描述了關(guān)于當(dāng)前顯示窗口的一組地理區(qū)域。
圖12和圖13示出了如何以標(biāo)準(zhǔn)化的(normalized)角距離來(lái)測(cè)量
在地球的表面上的距離和區(qū)域,并且也示出了如何將在視口 (viewport)
邊緣(skirt)區(qū)域中的地理特征的位置轉(zhuǎn)換為比值。
圖14描述了用于根據(jù)視口區(qū)域的半徑確定邊緣區(qū)域的半徑的函數(shù)的圖。
圖15描述了用于根據(jù)相對(duì)于當(dāng)前視口區(qū)域和邊緣區(qū)域的地理特征 的位置來(lái)分配分值衰減因子的函數(shù)的圖。
具體實(shí)施例方式
現(xiàn)將詳細(xì)參考實(shí)施例,在附圖中示出了實(shí)施例的示例。在下面的 詳細(xì)描述中,闡述了大量的特定細(xì)節(jié),以提供對(duì)本發(fā)明的全面理解。 然而,對(duì)于本領(lǐng)域普通技術(shù)人員明顯地,沒(méi)有這些特定的細(xì)節(jié)也可以 實(shí)現(xiàn)本發(fā)明。在其它的實(shí)例中,沒(méi)有詳細(xì)描述眾所周知的方法、過(guò)程、 組件以及電路,以免不必要地模糊本發(fā)明的各個(gè)方面。
描述了用于執(zhí)行位置搜索査詢并且向用戶提供相應(yīng)的結(jié)果的系統(tǒng) 和方法的實(shí)施例。該處理有時(shí)被稱為地理編碼(geocoding)??梢允?用耦接到諸如因特網(wǎng)(也被稱為萬(wàn)維網(wǎng)或WWW)和/或一個(gè)或多個(gè)內(nèi) 聯(lián)網(wǎng)的網(wǎng)絡(luò)的搜索引擎來(lái)從用戶接收諸如城市中的街道地址的位置搜 索査詢。對(duì)位置搜索査詢進(jìn)行處理以確定典范式或布爾表達(dá)式。處理 可以包括確定在各個(gè)位置搜索查詢中的一個(gè)或多個(gè)關(guān)鍵詞、從各個(gè)位 置搜索査詢移除標(biāo)點(diǎn)符號(hào)和非位置詞語(yǔ)(諸如物品)、以及確定在各 個(gè)位置搜索査詢中的一個(gè)或多個(gè)詞語(yǔ)的一個(gè)或多個(gè)同義詞。同義詞可 以包括用于在各個(gè)位置搜索査詢中的一個(gè)或多個(gè)詞語(yǔ)的預(yù)定的縮略詞 和/或在各個(gè)位置搜索査詢中的一個(gè)或多個(gè)詞語(yǔ)的預(yù)定的錯(cuò)拼詞。典范式可以獨(dú)立于關(guān)鍵詞的次序,即對(duì)關(guān)鍵詞的次序不敏感。
可以將典范式與搜索引擎中的地理特征文檔的索引進(jìn)行比較。每 個(gè)地理特征文檔具有與地理特征相對(duì)應(yīng)的一組標(biāo)志,其可以是位置(例 如街道、城市、鄉(xiāng)村、州,國(guó)家)或地理實(shí)體(例如湖泊、河流、山 脈、陸地、海洋等等)。雖然單個(gè)地理特征可以與諸如一組街道地址 的一組位置相對(duì)應(yīng),但是在識(shí)別與位置搜索査詢最匹配的位置或地理 特征的環(huán)境中,可以將與地理特征相關(guān)聯(lián)的所有位置視作"一個(gè)位置"。 在本文檔的至少某些部分中,同義地使用詞語(yǔ)"地理特征"和"位置"。
可以將地理特征文檔的索引分布在搜索引擎中的多個(gè)計(jì)算機(jī)上。 索引可以包括位置信息和補(bǔ)充信息。位置信息可以包括關(guān)鍵詞、關(guān)鍵 詞的同義詞以及多個(gè)位置的鄰近物體。補(bǔ)充信息可以包括位置的參考 坐標(biāo),諸如緯度和經(jīng)度和/或范圍或街道號(hào)碼。
可以通過(guò)計(jì)算機(jī)返回與各個(gè)典范式緊密匹配的地理特征文檔的子 集的分值。可以確定前N個(gè)地理特征文檔的排名。如果最佳分值大于 次最佳分值的預(yù)定倍數(shù),則可以將與最佳分值相對(duì)應(yīng)的位置隨同相應(yīng) 位置的地像一起提供給用戶。地像可以以相應(yīng)的位置為中心 并且可以調(diào)整大小以包括環(huán)繞相應(yīng)位置的預(yù)定的邊界框、區(qū)域或窗口。 可選地,如果最佳分值小于預(yù)定倍數(shù),則可以將與分值的范圍相對(duì)應(yīng) 的幾個(gè)位置提供給用戶??梢蕴峁┲T如位置標(biāo)識(shí)符(城市、州、郵政 編碼和/或國(guó)家)和/或指向相應(yīng)的地像的鏈接的附加信息。
因此,實(shí)施例可以適應(yīng)(accommodate)廣泛的多種格式、允許在 位置搜索査詢中和/或在結(jié)果中的含混性(ambiguity)、以及可以使用 并行處理以提供位置搜索査詢(有時(shí)稱為位置搜索)的高速處理。因 此,實(shí)施例可以提供位置搜索査詢的改進(jìn)的處理。
現(xiàn)在將注意力轉(zhuǎn)向位置搜索過(guò)程。圖1是示出了位置搜索過(guò)程100的實(shí)施例的流程圖。雖然在下面描述的位置搜索過(guò)程100包括看起來(lái) 按照特定的次序出現(xiàn)的許多操作,但是明顯地,過(guò)程100可以包括可
以(例如使用并行處理器或多線程環(huán)境)串行或并行執(zhí)行的更多或更 少的操作,可以改變兩個(gè)或更多個(gè)操作的次序和/或可以將兩個(gè)或更多 個(gè)操作組合為單個(gè)操作。
可以接收位置搜索査詢(110)。可以確定關(guān)鍵詞(112)??梢?將位置搜索査詢轉(zhuǎn)換為典范式形式(114)。這可以包括從位置搜索查 詢中移除一個(gè)或多個(gè)非位置或噪聲詞或詞語(yǔ)、標(biāo)點(diǎn)符號(hào)、變音符(即 添加到字母上以指示特殊發(fā)音的符號(hào))和/或街道號(hào)碼??梢陨刹紶?br>
表達(dá)式(116)。布爾表達(dá)式可以包含位置搜索査詢中的一個(gè)或多個(gè)詞 或詞語(yǔ)的同義詞。將搜索査詢轉(zhuǎn)換為典范式形式也可以包括擴(kuò)展一個(gè) 或多個(gè)縮略詞,諸如將"st"或"st"擴(kuò)展為"street"。在一些實(shí)施例 中,通過(guò)用包括相應(yīng)正確拼寫(xiě)的詞的用于錯(cuò)拼詞的"同義詞"來(lái)補(bǔ)充 査詢,可以"校正"在位置搜索查詢中的錯(cuò)拼詞或詞語(yǔ)(例如査詢處 理過(guò)程確定很可能是錯(cuò)拼的詞語(yǔ))。確定關(guān)鍵詞(112)可以使結(jié)果査 詢獨(dú)立于關(guān)鍵詞的次序。可以從地理特征文檔數(shù)據(jù)庫(kù)識(shí)別N (例如10) 個(gè)最佳匹配的地理特征文檔(118)。可以提供與所識(shí)別的文檔相對(duì)應(yīng) 的至少一個(gè)地理特征或位置(120)。可選地,在一些情形中向發(fā)出請(qǐng)
求的用戶提供零個(gè)文檔。例如在一些實(shí)施例中,如果所有N個(gè)最佳匹 配的地理特征文檔具有小于第一閾值的分值(在下面描述分值),則 沒(méi)有地理特征或位置被識(shí)別。在另一個(gè)示例中,過(guò)濾N個(gè)最佳匹配的 地理特征文檔的列表,以移除(A)分值小于第一閾值的文檔,以及(B) SAF (在下面描述)小于第二閾值并且分值小于第三閾值(例如第三閾 值通常將高于(即更多限制的)第二閾值)的文檔。后面的"過(guò)濾" 將超過(guò)第一閾值但是遠(yuǎn)在當(dāng)前視口 (如在下面所定義的)之外的低質(zhì) 量匹配移除,從而允許將在當(dāng)前視口內(nèi)或更接近當(dāng)前視口的另一個(gè)地 理特征或位置識(shí)別為最佳匹配。
識(shí)別N個(gè)最佳匹配文檔118需要多個(gè)計(jì)算操作。首先,識(shí)別滿足搜索査詢的地理特征文檔118A。例如,這可以通過(guò)以下完成檢索具 有與査詢?cè)~語(yǔ)的每一個(gè)匹配的標(biāo)志的文檔的列表并且然后對(duì)所檢索的 列表執(zhí)行布爾與(AND)運(yùn)算以產(chǎn)生具有與所有查詢?cè)~語(yǔ)匹配的標(biāo)志
的文檔(如果有)的列表。在該環(huán)境中,每個(gè)標(biāo)志是與地理特征相關(guān) 聯(lián)的詞、符號(hào)或詞和/或符號(hào)的組合。為了彌補(bǔ)人為錯(cuò)誤,文檔的標(biāo)志 可以包括描述與文檔相關(guān)聯(lián)的地理特征的各種詞語(yǔ)的各種錯(cuò)拼,并且 可以包括鄰近的或附近的地理特征的名稱(以及其錯(cuò)拼)(例如萬(wàn)一 用戶的搜索查詢不正確地指定了鄰近的城市或類似物但卻精確地列出 了與地理特征相關(guān)聯(lián)的詞語(yǔ))。在另一個(gè)示例中,在識(shí)別滿足搜索查 詢的文檔之前,首先通過(guò)移除任何非位置的詞語(yǔ)和任何標(biāo)點(diǎn)來(lái)"重寫(xiě)" 搜索査詢。可選地,在搜索查詢中的各個(gè)單個(gè)詞語(yǔ)可以被包括該詞語(yǔ)
和一個(gè)或多個(gè)同義詞的布爾或(OR)表達(dá)式替換。在一些實(shí)施例中, 對(duì)于已經(jīng)為其預(yù)定義了一組同義詞的査詢中的每一個(gè)詞語(yǔ),將同義詞 添加到搜索查詢。被添加到搜索査詢作為布爾或(OR)表達(dá)式的一部 分的"同義詞"也可以包括復(fù)合詞語(yǔ)的單個(gè)組分的"類屬同義詞"。 例如,街道名稱"N Rengstorff"的第一組分的類屬同義詞是 "directional—keyword (方向關(guān)鍵詞)",其與包括N、 S、 E、 W、 North (北)、South (南)、East (東)以及West (西)的任何方向關(guān)鍵詞 相匹配。類屬同義詞的另一個(gè)示例是"affix—keyword (詞綴關(guān)鍵詞)", 其與諸如ave.、 avenue (大街)、blvd.、 boulevard (大道)、ln、 lane (巷)、rd、 road (路)、st、 street (街道)、rue (街)等等的詞(或 標(biāo)志)相匹配。類似的類屬同義詞也作為標(biāo)志被包括在文檔數(shù)據(jù)庫(kù)中, 在與相應(yīng)的"正確的"關(guān)鍵詞相同的地址組分位置。在重寫(xiě)的搜索査 詢中的類屬同義詞和文檔之間的匹配比在搜索査詢中的非同義詞的關(guān) 鍵詞和文檔中的非同義詞的標(biāo)志之間的匹配產(chǎn)生低得多的分值??蛇x 地,可以根據(jù)預(yù)定義的規(guī)則對(duì)搜索査詢進(jìn)行其它的修改,以便提高搜 索結(jié)果的質(zhì)量。
然后,為所識(shí)別的匹配的文檔計(jì)算分值118B。在下面較詳細(xì)地討 論了用于為每個(gè)匹配的文檔生成分值的示范性過(guò)程。通常,與搜索査詢有高質(zhì)量匹配的文檔比與搜索査詢有更低質(zhì)量匹配的文檔被賦值更 高的分值。諸如與匹配的文檔相對(duì)應(yīng)的地理特征的位置、相對(duì)于在其 中顯示了地圖或圖像的當(dāng)前視口、以及這些地理特征的相對(duì)重要性的 其它因子也可以是在計(jì)算分值中的因子。然后基于所計(jì)算的分值將匹
配的文檔進(jìn)行排名118C,并且識(shí)別N個(gè)最高排名的文檔118D。在一 些實(shí)施例中,將文檔的排名和選擇N個(gè)最高排名的文檔組合成單個(gè)操 作(例如通過(guò)在分值上運(yùn)行前N個(gè)過(guò)濾)。在一些實(shí)施例中,不對(duì)具 有比前N個(gè)文檔低的排名的文檔進(jìn)行排名。
圖2是示出了處理位置搜索査詢的實(shí)施例200的框圖。將諸如"155 Abe Ave. Great Neck NY"的位置搜索査詢210用作說(shuō)明性示例。在操 作114期間可以將街道號(hào)碼155和句點(diǎn)移除導(dǎo)致Abe Ave Great Neck NY。在操作116中,可以將位置搜索査詢轉(zhuǎn)換為布爾表達(dá)式,包括擴(kuò) 展縮略詞(諸如Ave)和同義詞。由此產(chǎn)生的布爾表達(dá)式是Abe AND (Ave OR Avenue OR Street OR Lane OR Court OR) AND (Great Neck) AND (NY OR (NEW YORK))。該布爾表達(dá)式獨(dú)立于在位置搜索査詢 210中的原始詞或詞語(yǔ)次序,即對(duì)在位置搜索查詢210中的原始詞或詞 語(yǔ)次序不敏感。這樣,其可以適應(yīng)關(guān)于位置搜索查詢210的廣泛的各 種格式。這樣的布爾表達(dá)式具有可以在使用分布式地理特征文檔數(shù)據(jù) 庫(kù)的搜索引擎中處理的形式。這將在下面進(jìn)一步討論。
現(xiàn)在將注意力轉(zhuǎn)向地理特征文檔數(shù)據(jù)庫(kù)的實(shí)施例。圖3是示出了 將地理特征文檔分布到多個(gè)索引上的實(shí)施例300的框圖,所述索引可 以被存儲(chǔ)在搜索引擎中的多個(gè)計(jì)算機(jī)上。地理特征文檔310可以包括 多個(gè)地理特征文檔312。諸如文檔312-1的各個(gè)地理特征文檔可以包括 特征類型(諸如街道、路、路線、城市、國(guó)家、十字路口等等)、特 征名稱(即位置的名稱)、主要的詞語(yǔ)或標(biāo)志(諸如與特征相關(guān)聯(lián)的 特定關(guān)鍵詞)、附近的特征詞語(yǔ)或標(biāo)志(諸如相鄰的或鄰近的地標(biāo)或 感興趣的位置)以及補(bǔ)充信息(諸如特征的緯度和經(jīng)度)。補(bǔ)充信息 可以由地圖或多級(jí)(tile)服務(wù)器使用,以展現(xiàn)與在各個(gè)地理特征文檔中的位置相對(duì)應(yīng)的地像。這將在下面參考圖5和7進(jìn)一步描述。
分區(qū)器(partitioner) 314可以經(jīng)由一個(gè)或多個(gè)索引器316將地理 特征文檔310的子集分布到在多個(gè)索引320中的各個(gè)索引,諸如索引 320-1。索引320-1可以與索引320 (其可以被集體視作整個(gè)地理特征文 檔數(shù)據(jù)庫(kù)的反向索引)的一個(gè)分區(qū)或子分區(qū)相對(duì)應(yīng)。索引320可以被 存儲(chǔ)在搜索引擎中的一個(gè)或多個(gè)計(jì)算機(jī)上。子集可以被這樣分布每 個(gè)索引320處理與各個(gè)位置搜索査詢相關(guān)聯(lián)的等價(jià)的處理部分或近似 等價(jià)的處理部分。例如,可以將文檔312-1隨機(jī)地或偽隨機(jī)地分布在索 引320上。例如,可以使用散列函數(shù)和取模函數(shù)來(lái)將地理特征文檔分 布到M個(gè)索引器上,其中M是索弓l(有時(shí)稱為索引分區(qū)或索引子分區(qū)) 的數(shù)量。在該示例中,將散列函數(shù)應(yīng)用于每個(gè)地理特征文檔(或應(yīng)用 于文檔的預(yù)定義的部分)以產(chǎn)生散列值,然后將"取模M"函數(shù)應(yīng)用 于散列值以產(chǎn)生在0和M-l之間的選擇值。選擇值確定M個(gè)索引器316 中的哪一個(gè)接收文檔用于索引。
當(dāng)處理各個(gè)搜索査詢時(shí),索引320的每一個(gè)可以提供在與各個(gè)査 詢匹配的文檔的子集中的一組前N個(gè)(諸如前IO個(gè))文檔。如在下面 進(jìn)一步討論的,前N個(gè)文檔可以是基于分值的排名。具體地,可以為 匹配搜索査詢的每個(gè)文檔確定分值。分值可以基于各個(gè)位置搜索査詢 的典范式和/或布爾表達(dá)式。參考圖7,由各個(gè)服務(wù)器730來(lái)處理索引 320的每個(gè)子分區(qū)的査詢處理,所述服務(wù)器返回識(shí)別匹配查詢的最高排 名文檔中的N個(gè)的信息。可以被稱為聚合器或分區(qū)級(jí)別査詢執(zhí)行管理 器的服務(wù)器726例如通過(guò)從由服務(wù)器730返回的結(jié)果之中選擇N個(gè)最 佳搜索結(jié)果將來(lái)自服務(wù)器730的搜索結(jié)果相組合。在層級(jí)中的下一個(gè) 較高級(jí)別的査詢執(zhí)行管理器720,通過(guò)從由聚合器720返回的結(jié)果之中 選擇N個(gè)最佳搜索結(jié)果將來(lái)自所有聚合器726的搜索結(jié)果相組合。更 一般地,在分布式層級(jí)中的每一個(gè)級(jí)別選擇最佳搜索結(jié)果的預(yù)定義的 數(shù)量并且將其傳遞到下一個(gè)級(jí)別。例如,如果在給定的級(jí)別接收了 10 組前10個(gè)文檔,則可以確定前IO個(gè)文檔并且將其傳遞。以這種方式,使用分布式實(shí)現(xiàn)可以確定和/或識(shí)別在文檔312中的前N個(gè)文檔。該方 法可以提高搜索引擎的性能并且可以減少系統(tǒng)費(fèi)用和/或復(fù)雜度。圖4是示出了諸如文檔312-1的地理特征文檔400的實(shí)施例的框 圖。文檔400可以與超文本標(biāo)記語(yǔ)言(HTML)和/或可擴(kuò)展標(biāo)記語(yǔ)言 (XML)兼容。文檔400可以包括與諸如位置(例如街道、十字路口、 城市、感興趣地點(diǎn)等等)的地理特征相對(duì)應(yīng)的信息。 一些文檔400可 以包括用于多于一個(gè)位置(例如街道、城市的多個(gè)分區(qū)或類似物)的 信息。這樣的位置信息可以包括與一個(gè)或多個(gè)位置相對(duì)應(yīng)的關(guān)鍵詞、 與一個(gè)或多個(gè)位置相關(guān)聯(lián)的一個(gè)或多個(gè)區(qū)域以及一個(gè)或多個(gè)關(guān)鍵詞的 同義詞。如在實(shí)施例400中所示,在HTML標(biāo)記〈CN〉之后的文本可以指 示位置的類型,在該情況中是route (路線)。在HTML標(biāo)記〈CNA〉 之后的文本可以指示位置的明確的名稱,在該情況中是Victoria Street(維多利亞街)。在HTML標(biāo)記〈CA〉之后的文本可以指示與位置相對(duì) 應(yīng)的關(guān)鍵詞,諸如Westminster(威斯敏斯特)、London(倫敦)和England(英格蘭)。在HTML標(biāo)記〈A〉之后的文本可以指示關(guān)鍵詞和/或位置 的明確名稱的同義詞,諸如Angleterre、 United Kingdom (聯(lián)合王國(guó)) 和VerenigdKoninkrijk。同義詞可以包括來(lái)自外語(yǔ)(即與關(guān)鍵詞的語(yǔ)言 不同的語(yǔ)言)的詞。在一些實(shí)施例中,同義詞可以包括在一個(gè)或多個(gè) 關(guān)鍵詞中和/或在位置的明確名稱中的縮略詞和/或普通錯(cuò)拼。在HTML 標(biāo)記<01>之后的文本可以指示在該位置附近的或鄰近該位置的其它位 置或區(qū)域。在該示例中,附近的位置或區(qū)域是Islington、 WestEnd(倫 敦西區(qū))和Covent Garden (考文特花園)??梢詫⒃谖臋n400中的標(biāo)記的文本或信息項(xiàng)稱為信息項(xiàng)或文本項(xiàng) 或標(biāo)志。由索引器316 (圖3)來(lái)處理信息項(xiàng)或文本項(xiàng)以產(chǎn)生索引320。文檔400可以包括包含更少或額外標(biāo)記的更少信息或額外信息。例如,文檔400可以包括諸如與地理特征相對(duì)應(yīng)的參考坐標(biāo)的補(bǔ)充信 息,其可以被地圖或多級(jí)服務(wù)器使用。在示范性實(shí)施例中,參考坐標(biāo) 可以包括一個(gè)或多個(gè)位置的緯度和經(jīng)度和/或?qū)⒁粋€(gè)或多個(gè)位置包括在 內(nèi)的街道號(hào)碼的范圍。在其它的實(shí)施例中,可以改變?cè)谖臋n400中的 信息的次序??梢詫⑽臋n400中的兩個(gè)或更多個(gè)項(xiàng)組成單個(gè)項(xiàng)。
在文檔400中的補(bǔ)充信息的一個(gè)特定的示例是用于街道或其它路 線的補(bǔ)充信息。在該示例中,補(bǔ)充信息包括一個(gè)或多個(gè)段,每一個(gè)對(duì) 應(yīng)于街道或路線的一部分。每個(gè)段指定與該段的第一和第二端點(diǎn)相對(duì) 應(yīng)的起始和結(jié)束街道號(hào)碼,并且也指定該段的每個(gè)端點(diǎn)的緯度和經(jīng)度。 當(dāng)包括街道號(hào)碼的位置搜索査詢與文檔400相匹配時(shí),將指定的街道 號(hào)碼用來(lái)識(shí)別在文檔的補(bǔ)充信息中的最佳匹配的段。如果指定的街道 號(hào)碼處于最佳匹配的段的起始和結(jié)束街道號(hào)碼之間,使用線性插值來(lái) 確定由位置搜索査詢所指定的位置的緯度和經(jīng)度。可選地,如果指定 的街道號(hào)碼與最佳匹配的段的起始或結(jié)束街道號(hào)碼相匹配,則將相應(yīng) 的緯度和經(jīng)度用于由位置搜索査詢所指定的位置的位置。
如先前所提及,當(dāng)將與各個(gè)位置搜索査詢相對(duì)應(yīng)的典范式和/或布 爾表達(dá)式與在地理特征文檔310 (圖3)中的文檔312 (圖3)相比較 時(shí),可以確定指示匹配的程度的分值。這些分值可以指示文檔212以 及因而相應(yīng)的位置與位置搜索査詢的相關(guān)性。這樣,響應(yīng)于位置搜索 査詢,搜索引擎可以使用分值來(lái)確定最佳結(jié)果(即最佳位置),或前N 個(gè)結(jié)果的列表(即前N個(gè)位置)。
在一些實(shí)施例中,可以僅為文檔312 (圖3)的子集確定分值,即 搜索引擎可以確定可以與位置搜索查詢相對(duì)應(yīng)的文檔的候選組。在示
范性實(shí)施例中,包含在文檔的該候選組中的標(biāo)準(zhǔn)可以包括如下要求 關(guān)鍵詞中的至少一個(gè)與特征的明確名稱(在圖4中的〈CNA〉標(biāo)記之后 的文本)相匹配以及在典范式和/或布爾表達(dá)式中的元素或詞語(yǔ)的每一 個(gè)在文檔中出現(xiàn)。在示范性實(shí)施例中,可以使用lExFRxQ來(lái)確定分值,其中IRi是與典范式和/或布爾表達(dá)式中的各個(gè)詞語(yǔ)或元素"i"相對(duì)應(yīng)的査詢 匹配分值(關(guān)于特定的候選文檔),F(xiàn)R是指示特征或位置的重要性的 "特征排名",E是標(biāo)準(zhǔn)值(normalization value)以及Q是可選的因 子。Q可以與在査詢和候選文檔之間的匹配的質(zhì)量相對(duì)應(yīng)、或其可以 與可以被用來(lái)提高搜索結(jié)果的質(zhì)量的任何其它度量相對(duì)應(yīng)。Q因子的 示例是在下面參考圖11-15描述的SAF因子。在另一個(gè)示例中,將Q 設(shè)置為等于3入?* 1"0(11^(&),其中SAF是在下面描述的分值衰減因子, 每個(gè)Pj是懲罰因子,以及Product(Pj)是所有懲罰因子的乘積(即乘法 積)。懲罰因子的每一個(gè)具有l(wèi).O的默認(rèn)值,并且如果相應(yīng)的懲罰可應(yīng) 用于所述的文檔將較低的值(例如0.7或類似值)賦值給懲罰因子。懲 罰因子的示例是A)當(dāng)文檔既不在用戶的國(guó)家也不在其當(dāng)前視口 (如 在下面所定義的)時(shí)應(yīng)用的懲罰因子;B)當(dāng)在文檔和査詢之間的匹配 是非精確匹配(例如,因?yàn)闁嗽儼鈦?lái)的或錯(cuò)誤的詞語(yǔ)或符號(hào),并 且在錯(cuò)誤的詞語(yǔ)或符號(hào)和文檔之間的唯一匹配是具有"類屬同義詞" 標(biāo)志(參見(jiàn)上述關(guān)于"類屬同義詞"的解釋)的匹配)時(shí)應(yīng)用的懲罰 因子;以及C)當(dāng)在査詢和文檔之間的匹配缺少關(guān)鍵元素(例如,當(dāng)査 詢與文檔的街道名稱標(biāo)志和國(guó)家標(biāo)志、而不是城市標(biāo)志相匹配時(shí))時(shí) 應(yīng)用的懲罰因子。在其它的實(shí)施例中可以使用其它的懲罰因子。通常, 懲罰因子與指示在地理特征文檔和搜索査詢之間的潛在低劣質(zhì)量匹配 的情況相關(guān)聯(lián)。在其它的實(shí)施例中,沒(méi)有使用Q,或等價(jià)地將Q設(shè)置 為等于1。在一些實(shí)施例中,標(biāo)準(zhǔn)值E是完美匹配的IR,分值的總和的最大 值、或等價(jià)地是搜索査詢中的關(guān)鍵詞的標(biāo)志量的總和。IRi值的總和可 以被稱為候選文檔的總匹配分值或IR分值。在搜索査詢中的特定關(guān)鍵 詞的IRi的值可以包括權(quán)重的乘積。權(quán)重可以包括在典范式和/或布爾表 達(dá)式中的相應(yīng)元素或詞語(yǔ)的標(biāo)志量、相關(guān)性分值以及元素量。標(biāo)志量 可以與詞語(yǔ)的類型相對(duì)應(yīng),其中詞語(yǔ)的類型可以包括停用詞(stop word)、街道詞綴關(guān)鍵詞(例 如諸如法語(yǔ)中的"rue"的街道前綴詞或諸如英語(yǔ)中的"street"、 "avenue" 、 "road"以及"place"的街道后綴詞)、號(hào)碼、同義詞以 及其它關(guān)鍵詞,詞語(yǔ)的每個(gè)預(yù)定義的類型被賦予預(yù)定義的標(biāo)志量。預(yù) 定義的標(biāo)志量值可以具有預(yù)定義的范圍,諸如0到1、或0到8或類似 范圍。在一些實(shí)施例中,默認(rèn)的標(biāo)志量(用于"其它的關(guān)鍵詞")是1, 而諸如同義詞、街道詞綴關(guān)鍵詞以及停用詞的標(biāo)志類型都被賦予較低 的標(biāo)志量值。在一些實(shí)施例中,同義詞比街道詞綴詞被賦予更大的標(biāo)相關(guān)性分值可以基于文本匹配的程度而改變,對(duì)于在查詢關(guān)鍵詞 和文檔的信息元素之間的完全文本匹配具有預(yù)定義的最大值。當(dāng)査詢 關(guān)鍵詞與文檔的信息元素的最佳匹配僅是部分匹配(例如,查詢關(guān)鍵 詞僅與多詞元素的一個(gè)詞相匹配)時(shí),相關(guān)性分值小于預(yù)定義的最大 值,并且反映文本匹配的程度。元素量可以作為與匹配査詢關(guān)鍵詞的信息項(xiàng)(在候選文檔中)相 關(guān)聯(lián)的地理特征的大小或類型的函數(shù)而改變。例如,作為國(guó)家名稱的 信息項(xiàng)比作為地點(diǎn)名稱(諸如城市名稱)的信息項(xiàng)可以被給予更高的 元素量,后者進(jìn)而比作為街道名稱的信息被給予更高的值。元素量也 可以反映與査詢關(guān)鍵詞匹配的信息項(xiàng)的類型。例如,包含地理特征的 明確名稱的信息項(xiàng)可以被賦予最高的元素量,作為"環(huán)境"項(xiàng)(例如 街道所位于的城市或國(guó)家)的信息項(xiàng)可以被賦予下一個(gè)最高的元素量, 以及包含附近城市的名稱、區(qū)域或其它地理特征的信息項(xiàng)可以被賦予 最低的元素量。在一些實(shí)施例中,用于候選文檔中的信息項(xiàng)的元素量 等于兩個(gè)元素量因子的乘積,其中一個(gè)基于通過(guò)信息項(xiàng)命名的地理特 征的大小或類型并且其中第二個(gè)基于與査詢關(guān)鍵詞相匹配的信息項(xiàng) (明確的名稱、環(huán)境或附近的特征)的類型。在一些其它的實(shí)施例中, 用于候選文檔中的信息項(xiàng)的元素量等于這兩個(gè)元素量因子的總和。用于候選文檔的特征排名FR可以基于文檔頻率(在圖3的數(shù)據(jù)庫(kù) 310中的文檔312中提及的特征的次數(shù)),或其可以基于地理特征的大 小,較大的特征(即地理廣度)被給予較高的特征排名值。在其它的 實(shí)施例中,特征排名可以基于(至少部分地)與候選文檔相對(duì)應(yīng)的地 理特征的重要性或普及性。例如,通過(guò)對(duì)地理特征的名稱的萬(wàn)維網(wǎng)搜 索或其它的數(shù)據(jù)庫(kù)搜索可以確定與候選文檔相對(duì)應(yīng)的地理特征的重要 性或普及性。
當(dāng)査詢關(guān)鍵詞具有一個(gè)或多個(gè)同義詞時(shí),為同義詞的每一個(gè)以及 査詢關(guān)鍵詞計(jì)算IR分值(關(guān)于候選文檔),然后當(dāng)為候選文檔計(jì)算組 合的IR分值時(shí)選擇并且使用這些IR分值中的最佳值。
在一些實(shí)施例中,修改了在上面示出的評(píng)分函數(shù),以增加一個(gè)或 個(gè)因子相對(duì)于其它因子的重要性。例如可以將評(píng)分函數(shù)變?yōu)?br>
<formula>formula see original document page 23</formula>
其中指數(shù)M是大于1的值(例如2、 2.5或3),并且其典型地在 2和5之間(2《M《5),以便在評(píng)分函數(shù)中給予規(guī)范化總匹配分值比 特征排名FR和Q因子更多的重要性。在一些實(shí)施例中,修改了上述的 評(píng)分函數(shù),以相對(duì)于其名稱與相同的詞語(yǔ)相匹配但具有不同的次序的 文檔更偏向于其名稱具有按照與在搜索查詢中放置的詞語(yǔ)相同的次序 的詞語(yǔ)的文檔。例如,可以用成對(duì)(pair-wise)匹配分值補(bǔ)充(例如, 總匹配分值+成對(duì)匹配分值)總匹配分值(例如,總匹配分值+成對(duì)匹 配分值),所述成對(duì)匹配分值基于與文檔名稱中的排序的詞語(yǔ)對(duì)相匹 配的在搜索査詢中的排序的詞語(yǔ)對(duì)(排序的、鄰近的詞語(yǔ))的數(shù)量。
現(xiàn)在將注意力轉(zhuǎn)向用于響應(yīng)于位置搜索査詢向用戶提供一個(gè)或多 個(gè)位置結(jié)果的過(guò)程的實(shí)施例。如果在前N個(gè)排名中第一文檔的最佳分 值大于第二文檔的次最佳分值的預(yù)定倍數(shù)(例如次最佳分值小于最佳 分值的70%)中,可以將與第一文檔相對(duì)應(yīng)的位置提供給用戶。使用與文檔一起存儲(chǔ)的補(bǔ)充信息,地圖或多級(jí)服務(wù)器可以將以該位置為中 心的區(qū)域的地像提供給用戶。例如,如果補(bǔ)充信息包括括入(bracket)該位置的街道地址,則可以使用線性插值來(lái)確定地像 的中心。圖5A是示出了提供給用戶的地像500的實(shí)施例的框圖。 將與位置相對(duì)應(yīng)的位置標(biāo)記512-1置于邊界框510的中心。調(diào)整邊界框 510的大小,以使得可以提供圍繞該位置的區(qū)域514??梢曰诘乩硖?征或位置的大小來(lái)確定邊界框510的大小。不同大小的特征(諸如城 市或國(guó)家)可以具有不同大小的邊界框。在一些情況中,在區(qū)域中多于一個(gè)的不同位置(即在空間上彼此 分離)可以具有相同或幾乎相同的分值。例如,多于一個(gè)的位置可以 與對(duì)應(yīng)于位置搜索査詢的典范式和/或布爾表達(dá)式中的所有關(guān)鍵詞相匹 配。在這樣的情況中,可以將這些結(jié)果提供給用戶。這在圖5B中示出, 所述圖5B是示出了地像550的實(shí)施例的框圖。將邊界框510定義 為包括滿足預(yù)定義的選擇標(biāo)準(zhǔn)的所有位置。與不同位置相對(duì)應(yīng)的位置 標(biāo)記512被包括在邊界框510中。在一些實(shí)施例中,標(biāo)記是鏈接。通 過(guò)在標(biāo)記中的一個(gè)上點(diǎn)擊,用戶可以選擇相應(yīng)的位置??梢詫⒃撐恢?與諸如地像500 (圖5A)的地像一起展現(xiàn)給用戶。在一些其 它的實(shí)施例中,挨著地圖550列出了最佳匹配位置的列表520。在列表 中的每一項(xiàng)可以包括指向與該位置相對(duì)應(yīng)的地圖的鏈接??梢杂蓙?lái)自 相應(yīng)的地理特征文檔的典范名稱(在圖4中的示例中通過(guò)CNA標(biāo)記識(shí) 別)和環(huán)境文本(在圖4中的示例中通過(guò)CA標(biāo)記識(shí)別)表示在列表 520中的每一項(xiàng)。如果最佳分值不大于次最佳分值的預(yù)定倍數(shù),則可以提供與前N 個(gè)排名中的范圍相對(duì)應(yīng)的位置。例如,可以提供具有大于或等于最佳 分值的50%的分值的位置(來(lái)自前N個(gè)結(jié)果之中)??梢詫⒏鞣N信息 與位置一起提供。在圖6中示出了用于顯示響應(yīng)于位置搜索查詢而返 回的多個(gè)搜索結(jié)果的示范性圖形用戶界面。在一個(gè)區(qū)域610或列中, 列出了最佳匹配地理特征或位置,并且在圖形用戶界面的另一個(gè)區(qū)域中示出了單個(gè)小地圖620,每一個(gè)用于在區(qū)域610中列出的最佳匹配地 理特征或位置中的每一個(gè)。在該示例中,位置搜索查詢是"San Antonio (圣安東尼奧)",其產(chǎn)生了多個(gè)可能相關(guān)的回答。所述回答可以與 諸如城市、州、郵政編碼和/或國(guó)家的一個(gè)或多個(gè)位置標(biāo)識(shí)符一起提供。 在一些實(shí)施例中,小地圖620每一個(gè)都包括指向相應(yīng)的、更大的地圖 的鏈接。類似地,在一些實(shí)施例中,在區(qū)域610中的所列出的最佳匹 配位置的每一個(gè)包括指向相應(yīng)的更大的地圖的鏈接。在回答或小地圖 中的一個(gè)上點(diǎn)擊可以允許將該位置與諸如地像500 (圖5A)的地 像一起展現(xiàn)給用戶。現(xiàn)在將注意力轉(zhuǎn)向用于實(shí)現(xiàn)先前所描述的方法、地理特征文檔和 圖形用戶界面的搜索引擎、客戶端計(jì)算機(jī)和數(shù)據(jù)結(jié)構(gòu)的實(shí)施例。圖7 是示出了搜索引擎系統(tǒng)700的框圖,該搜索引擎系統(tǒng)響應(yīng)于從一個(gè)或 多個(gè)客戶端710 (在本文也稱為客戶端裝置或客戶端系統(tǒng))(諸如客戶 端系統(tǒng)或裝置900 (圖9))接收的位置搜索査詢而生成位置搜索査詢 結(jié)果。每一個(gè)客戶端710可以具有諸如搜索助手模塊930 (圖9)的搜 索助手。應(yīng)當(dāng)理解,如在圖7中所示的搜索引擎系統(tǒng)700的布局僅是 示范性的并且可以采用任何其它適當(dāng)?shù)牟季只蚺渲谩R虼?,搜索引?系統(tǒng)700可以包括更少或額外的組件或模塊,可以以硬件和/或軟件實(shí) 現(xiàn),并且可以改變位置或一個(gè)或多個(gè)組件或模塊。搜索引擎系統(tǒng)700 被用于搜索諸如地理特征文檔310 (圖3)的文檔的索引。搜索引擎系統(tǒng)700可以包括使用通信網(wǎng)絡(luò)712與客戶端710通信 的制圖(mapping)應(yīng)用服務(wù)器714。通信網(wǎng)絡(luò)712可以是因特網(wǎng)和/或 內(nèi)聯(lián)網(wǎng)。制圖應(yīng)用服務(wù)器714可以將位置搜索査詢轉(zhuǎn)發(fā)到査詢服務(wù)器 716,并且從查詢服務(wù)器716接收位置結(jié)果。制圖應(yīng)用服務(wù)器714可以 使用位置結(jié)果中的補(bǔ)充信息來(lái)從多級(jí)服務(wù)器718訪問(wèn)適當(dāng)?shù)牡叵瘢?并且將這樣的地像與位置結(jié)果一起提供給客戶端710。査詢服務(wù)器716可以確定位置搜索查詢中的關(guān)鍵詞,包括將位置搜索査詢轉(zhuǎn)換為典范形式和/或生成布爾表達(dá)式。可以將典范式和/或布爾表達(dá)式轉(zhuǎn)發(fā)到査詢執(zhí)行管理器720用于處理。査詢執(zhí)行管理器720 可以將典范式和/或布爾表達(dá)式提供給地理特征文檔數(shù)據(jù)庫(kù)722中的多 個(gè)分區(qū)724。在諸如分區(qū)724-K的每一個(gè)分區(qū)724中,分區(qū)級(jí)別查詢執(zhí) 行管理器726可以將典范式和/或布爾表達(dá)式分布到用于一個(gè)分區(qū)的服 務(wù)器730。服務(wù)器730可以存儲(chǔ)索引320 (圖3)。如先前所討論的, 在地理特征文檔數(shù)據(jù)庫(kù)722中的服務(wù)器可以以分級(jí)的方式確定與位置 搜索査詢相對(duì)應(yīng)的前N個(gè)文檔。在接收了前N個(gè)文檔后,査詢執(zhí)行管理器720可以訪問(wèn)在文檔服 務(wù)器734中的諸如補(bǔ)充信息的相應(yīng)的地理或位置信息。在一些實(shí)施例 中,地理或位置信息可以被包括在地理特征文檔數(shù)據(jù)庫(kù)722中??梢詫⒅T如査詢服務(wù)器716的在搜索引擎系統(tǒng)700中的元素分散 在一組服務(wù)器上,以提供位置搜索査詢的非常快速的處理。在一些實(shí) 施例中,系統(tǒng)700可以在多個(gè)數(shù)據(jù)中心(例如位于不同的洲和/或在一 個(gè)或多個(gè)國(guó)家內(nèi)的不同位置)中在多個(gè)位置包括査詢服務(wù)器、査詢執(zhí) 行管理器、多級(jí)服務(wù)器以及地理特征文檔數(shù)據(jù)庫(kù)的復(fù)本(replica)。使 用域名系統(tǒng)(DNS)基于數(shù)據(jù)中心的每一個(gè)的當(dāng)前負(fù)載、地理地點(diǎn)和/ 或操作狀態(tài)將在客戶端710之一的用戶向搜索引擎系統(tǒng)700提交的位 置搜索査詢路由到適當(dāng)?shù)臄?shù)據(jù)中心。每一個(gè)后端優(yōu)選地包括連接到通信網(wǎng)絡(luò)712的多個(gè)査詢服務(wù)器, 諸如查詢服務(wù)器716。通信網(wǎng)絡(luò)712可以是因特網(wǎng),但是也可以是任意 的局域網(wǎng)(LAN)和/或廣域網(wǎng)(WAN)。在一些實(shí)施例中,每一個(gè)査 詢服務(wù)器716是經(jīng)由HTTP、 XML或類似的協(xié)議以網(wǎng)頁(yè)的形式接收位 置搜索査詢請(qǐng)求并且遞送搜索位置結(jié)果的服務(wù)器??蛇x地,如果査詢 服務(wù)器716用在LAN內(nèi),即內(nèi)部地而不被公眾使用,其可以是內(nèi)聯(lián)網(wǎng) 服務(wù)器。諸如査詢服務(wù)器716的査詢服務(wù)器被配置以控制搜索過(guò)程, 包括搜索文檔索引、分析和格式化搜索結(jié)果。在一些實(shí)施例中,后端包括連接到諸如査詢服務(wù)器716的多個(gè)査詢服務(wù)器的多個(gè)査詢執(zhí)行管 理器720。圖8是示出了搜索引擎800的實(shí)施例的框圖。搜索引擎800可以 包括至少一個(gè)數(shù)據(jù)處理器或中央處理單元(CPU) 810、用于與其它計(jì) 算機(jī)、服務(wù)器和/或客戶端通信的通信或網(wǎng)絡(luò)接口 820、存儲(chǔ)器822以 及用于將這些組件相互連接的一個(gè)或多個(gè)信號(hào)線812。 一個(gè)或多個(gè)信號(hào) 線812可以組成一個(gè)或多個(gè)通信總線。存儲(chǔ)器822可以包括高速隨機(jī)存取存儲(chǔ)器和/或非易失性存儲(chǔ)器, 諸如一個(gè)或多個(gè)磁盤(pán)存儲(chǔ)裝置。存儲(chǔ)器822可以存儲(chǔ)包括用于處理基 本系統(tǒng)服務(wù)和用于執(zhí)行依賴硬件的任務(wù)的程序的操作系統(tǒng)(或一組指 令)824,諸如LINUX、 UNIX或WINDOWS。存儲(chǔ)器822也可以將通 信程序(或一組指令)存儲(chǔ)在網(wǎng)絡(luò)通信模塊826中。通信程序被用于 與諸如客戶端710 (圖7)的客戶端、以及與搜索引擎系統(tǒng)700 (圖7) 中的其它服務(wù)器和計(jì)算機(jī)通信。存儲(chǔ)器822也可以存儲(chǔ)與査詢服務(wù)器716 (圖7)相對(duì)應(yīng)的查詢服 務(wù)器模塊(或一組指令)、地理特征文檔數(shù)據(jù)庫(kù)722、文檔832以及所 選擇的結(jié)果836。査詢服務(wù)器模塊716可以包括可以如上所述重寫(xiě)所接 收的搜索査詢的關(guān)鍵詞處理器828。地理特征文檔數(shù)據(jù)庫(kù)722可以包括 多個(gè)索引S30。文檔832可以包括包含地理或位置信息的多個(gè)文檔834。 所選擇的結(jié)果836可以包括一個(gè)或多個(gè)位置搜索査詢的結(jié)果838。雖然圖8 (類似于圖7)將搜索引擎800示出為多個(gè)分離的項(xiàng),但 是更多地意在把圖8作為可以在搜索引擎系統(tǒng)中存在的各種特征的功 能描述而不是作為在此所述的實(shí)施例的結(jié)構(gòu)性示意。實(shí)際上,如本領(lǐng) 域普通技術(shù)人員所認(rèn)識(shí)到的,搜索引擎800的功能可以分布在大量的 服務(wù)器或計(jì)算機(jī)上,所述服務(wù)器的各種群組執(zhí)行這些功能的特定子集。 在圖8中分離示出的項(xiàng)可以被組合并且一些項(xiàng)可以被分離。例如,可以在單個(gè)服務(wù)器上實(shí)現(xiàn)在圖8中分離示出的一些項(xiàng),并且可以由一個(gè) 或多個(gè)服務(wù)器來(lái)實(shí)現(xiàn)單個(gè)項(xiàng)。在搜索引擎系統(tǒng)中的服務(wù)器的實(shí)際數(shù)量 以及特征在它們中如何分配因?qū)崿F(xiàn)的不同而不同,并且可以部分地基 于系統(tǒng)所存儲(chǔ)的信息量和/或系統(tǒng)在高峰使用期間以及平均使用期間必 須處理的數(shù)據(jù)流量。圖9是示出了客戶端計(jì)算機(jī)、裝置或系統(tǒng)900的實(shí)施例的框圖。 客戶端系統(tǒng)900可以是臺(tái)式計(jì)算機(jī)、膝上型計(jì)算機(jī)、個(gè)人數(shù)字助理 (PDA)、蜂窩電話、個(gè)人導(dǎo)航裝置或類似物??蛻舳讼到y(tǒng)900通常 包括一個(gè)或多個(gè)處理單元(CPU) 910、用戶接口 914、 一個(gè)或多個(gè)網(wǎng) 絡(luò)或其它通信接口 912、存儲(chǔ)器922以及用于連接這些組件的一個(gè)或多 個(gè)通信總線920。用戶接口 914可以包括一個(gè)或多個(gè)鍵盤(pán)918、 一個(gè)或 多個(gè)顯示器916、和/或諸如鼠標(biāo)的一個(gè)或多個(gè)指示器(未示出)。存 儲(chǔ)器922可以包括諸如DRAM、 SRAM、 DDR RAM或其它隨機(jī)存取固 態(tài)存儲(chǔ)裝置的隨機(jī)存取存儲(chǔ)器;以及可以包括諸如一個(gè)或多個(gè)磁盤(pán)存 儲(chǔ)裝置、光盤(pán)存儲(chǔ)裝置、閃存裝置或其它非易失性固態(tài)存儲(chǔ)裝置的非 易失性存儲(chǔ)器。通信總線920可以包括互連并且控制系統(tǒng)組件之間的 通信的電路(有時(shí)稱為芯片集)。存儲(chǔ)器922可以包括位于遠(yuǎn)離中央 處理單元910的大容量存儲(chǔ)器。在一些實(shí)施例中,存儲(chǔ)器922可以包括操作系統(tǒng)(或一組指令) 924、網(wǎng)絡(luò)通信模塊(或一組指令)926、瀏覽器/工具模塊928和/或搜 索助手模塊(或一組指令)930。搜索助手模塊930可以包括輸入和選 擇監(jiān)控模塊(或一組指令)932、傳輸模塊(或一組指令)934、搜索 結(jié)果接收模塊(或一組指令)936和/或顯示模塊(或一組指令)936。諸如LINUX、 UNIX或WINDOWS的操作系統(tǒng)924可以包括用于 處理各種基本系統(tǒng)服務(wù)和用于執(zhí)行依賴硬件的任務(wù)的程序(或指令 集)。可以使用網(wǎng)絡(luò)通信模塊926來(lái)經(jīng)由一個(gè)或多個(gè)通信網(wǎng)絡(luò)接口 912 和諸如因特網(wǎng)、其它廣域網(wǎng)、局域網(wǎng)、城域網(wǎng)等等的一個(gè)或多個(gè)通信網(wǎng)絡(luò)將客戶端系統(tǒng)900連接到其它計(jì)算機(jī)(例如其它客戶端計(jì)算機(jī)和/
或搜索引擎)。
瀏覽器/工具模塊928可以是客戶端系統(tǒng)900的用戶可以使用來(lái)與 在一個(gè)或多個(gè)通信網(wǎng)絡(luò)上的一個(gè)或多個(gè)主機(jī)(諸如一個(gè)或多個(gè)網(wǎng)站和/ 或網(wǎng)頁(yè))通信和/或交換信息的web瀏覽器。例如,用戶可以使用瀏覽 器/工具模塊928在因特網(wǎng)上沖浪(例如顯示網(wǎng)頁(yè)和/或網(wǎng)站)。
用戶可以使用搜索助手模塊930 (例如瀏覽器擴(kuò)展、瀏覽器工具欄 或嵌在搜索引擎網(wǎng)頁(yè)中的指令)來(lái)利用搜索引擎執(zhí)行諸如位置搜索査 詢的一個(gè)或多個(gè)搜索査詢,并且接收相應(yīng)的搜索結(jié)果,包括一個(gè)或多 個(gè)位置、 一個(gè)或多個(gè)地像、 一個(gè)或多個(gè)URL和/或超鏈接。具體地, 輸入和選擇監(jiān)控模塊932可以監(jiān)控用戶輸入,傳輸模塊934可以將搜 索査詢發(fā)送到搜索引擎,搜索結(jié)果接收模塊936可以從搜索引擎接收 搜索結(jié)果,以及顯示模塊938可以顯示搜索結(jié)果(或可以幫助呈現(xiàn)用 于被瀏覽器模塊928顯示的搜索結(jié)果),諸如一個(gè)或多個(gè)文檔的排名 和/或包含與搜索査詢相對(duì)應(yīng)的所識(shí)別的內(nèi)容的文檔位置。用戶可以使 用用戶接口 914和瀏覽器/工具模塊928來(lái)訪問(wèn)或選擇搜索結(jié)果中的文 檔和/或文檔位置中的一個(gè)或多個(gè)。例如,用戶可以使用指示器(未示 出)來(lái)點(diǎn)擊超鏈接。
在客戶端系統(tǒng)900耦接到本地服務(wù)器計(jì)算機(jī)的實(shí)施例中,可以將 存儲(chǔ)器922中的模塊和/或應(yīng)用中的一個(gè)或多個(gè)存儲(chǔ)在服務(wù)器計(jì)算機(jī) 上,所述服務(wù)器計(jì)算機(jī)典型地位于與客戶端系統(tǒng)900不同的位置。上 述所識(shí)別的模塊和應(yīng)用中的每一個(gè)與用于執(zhí)行上述的一個(gè)或多個(gè)功能 的一組指令相對(duì)應(yīng)。不需要將這些模塊(即指令集)實(shí)現(xiàn)為分離的軟 件程序、程序或模塊??梢詫⒏鞣N模塊和子模塊重新排列和/或組合。 存儲(chǔ)器922可以包括額外的模塊和/或子模塊、或更少的模塊和/或子模 塊。例如,可以將搜索助手模塊930集成在瀏覽器/工具模塊928中。 因此,存儲(chǔ)器922可以包括上述所識(shí)別的模塊和/或子模塊的子集或超集。
圖IO是示出了地理特征文檔數(shù)據(jù)結(jié)構(gòu)1000的實(shí)施例的框圖。地
理特征文檔數(shù)據(jù)結(jié)構(gòu)1000可以包括地理特征文檔722。地理特征文檔 722可以包括被分布在多個(gè)計(jì)算機(jī)的多個(gè)分區(qū)上的多個(gè)記錄1010。每 個(gè)記錄1010可以與各個(gè)地理特征文檔相對(duì)應(yīng)。如上述所說(shuō)明的,地理 特征文檔可以與地理特征或位置相對(duì)應(yīng)。記錄可以包括關(guān)鍵詞1012、 一個(gè)或多個(gè)關(guān)鍵詞的同義詞1014、關(guān)聯(lián)詞1016(諸如位置出現(xiàn)的城市) 和/或近似對(duì)象1018。地理特征文檔數(shù)據(jù)結(jié)構(gòu)1000可以包括更少或額 外的元素,可以將兩個(gè)或更多個(gè)元素相組合并且可以改變一個(gè)或多個(gè) 元素的位置。例如,各個(gè)記錄1010可以進(jìn)一步包括補(bǔ)充信息1018,所 述補(bǔ)充信息包括一個(gè)或多個(gè)位置的緯度和經(jīng)度信息或與記錄1010所表 示的地理特征相關(guān)聯(lián)的邊界框。
來(lái)自位置搜索査詢的結(jié)果的相對(duì)于視口的評(píng)分 當(dāng)用戶例如使用在線制圖程序或服務(wù)來(lái)執(zhí)行一系列位置搜索時(shí), 用戶通常搜索地理特征(例如城市、街道、特定地址或類似物),所 述地理特征靠近在緊鄰的在先位置搜索中出現(xiàn)的地理特征。例如,在 搜索特定城市中的第一地理特征后,用戶將通常搜索在同一城市中或 在鄰近或附近城市中的第二地理特征。為了便于討論,有時(shí)將地理特 征稱為"位置",但是應(yīng)當(dāng)理解,諸如街道(與特定街道地址相對(duì)) 的一些地理特征對(duì)應(yīng)于大量位置。
在以下的討論中,參考圖11,"視口"或"當(dāng)前視口"與當(dāng)前在 用戶的客戶端裝置或系統(tǒng)上顯示的地理區(qū)域相對(duì)應(yīng)。例如,視口可以 是響應(yīng)于緊鄰的在前位置搜索而(例如由在線制圖程序或服務(wù))產(chǎn)生 的顯示窗口,或其可以是界定在用戶的客戶端系統(tǒng)上顯示的視口矩形 的圓形區(qū)域。從而,視口在形狀上可以是矩形的或圓形的。在該討論 的剩余部分中,將視口假設(shè)為在形狀上是圓形的并且圍繞并包括在用 戶的客戶端系統(tǒng)上顯示的視口矩形。另外,視口可以由將視口改變?yōu)橛脩糁付ǖ膮^(qū)域的用戶行為(例如平移(pan)和/或縮放命令或行為) 產(chǎn)生的結(jié)果。
當(dāng)用戶提交了導(dǎo)致多于一個(gè)結(jié)果的位置査詢時(shí),可以將結(jié)果進(jìn)行 評(píng)分,以偏向在當(dāng)前視口內(nèi)的結(jié)果(即位置)勝于在視口外的位置, 并且比起更遠(yuǎn)離視口的位置而偏向靠近視口的位置(例如在圍繞視口 的邊緣區(qū)域內(nèi),本文稱為"視口邊緣區(qū)域")。在一個(gè)實(shí)施例中,修 改上述用于對(duì)"文檔"(有時(shí)稱為位置描述文檔或位置描述數(shù)據(jù)庫(kù)條 目)進(jìn)行評(píng)分的評(píng)分函數(shù),以包括分值衰減因子(SAF) , SAF傾向于 將分值偏向與當(dāng)前視口相交的結(jié)果,并且偏向與圍繞視口的視口邊緣 區(qū)域相交的結(jié)果勝于既不與視口區(qū)域也不與視口邊緣區(qū)域相交的結(jié)果 (即其在視口邊緣區(qū)域外)。在該環(huán)境中,術(shù)語(yǔ)"相交"意為由搜索 結(jié)果識(shí)別的地理特征的至少一部分在特定區(qū)域內(nèi)。
如在圖12和13中所示,可以根據(jù)"角距離"測(cè)量在地球的表面 上的區(qū)域和距離的大小,"角距離"是由那些區(qū)域或距離對(duì)向的地球 表面上的弧的角大小??梢砸曰《然蚨葦?shù)為單位來(lái)測(cè)量角距離。標(biāo)準(zhǔn) 化的角距除以諸如2T的標(biāo)準(zhǔn)化因子,以使得最大的角距離是1 (或任 何其它預(yù)定義的值)并且最小的角距離是0。在圖12和13中,XI表 示基于視口區(qū)域的半徑R1的角距離的視口區(qū)域的標(biāo)準(zhǔn)化大小。X2是 基于視口邊緣區(qū)域的半徑R2的角距離的視口邊緣區(qū)域的標(biāo)準(zhǔn)化大小。 X2-X1表示視口邊緣區(qū)域的寬度。X3表示在地理特征和視口區(qū)域的最 近邊界(edge)之間的標(biāo)準(zhǔn)化角距離,或更一般地是在地理特征和視口 區(qū)域之間的距離。X表示(A)在地理特征和視口區(qū)域之間的距離,與 (B)視口邊緣區(qū)域的寬度的比值。
在一個(gè)實(shí)施例中,視口邊緣區(qū)域的大小取決于視口區(qū)域的大小。 具體地,當(dāng)視口區(qū)域的半徑較小(例如小于幾公里)時(shí),視口邊緣區(qū) 域的半徑是視口區(qū)域的半徑的1+SkirtFactor倍之大,其中SkirtFactor (邊緣因子)是可配置的參數(shù)。當(dāng)視口區(qū)域的半徑較大(例如大于幾百公里)時(shí),視口邊緣區(qū)域的半徑與視口區(qū)域的半徑近似相同。在示 范性實(shí)施例中,將視口邊緣區(qū)域的半徑定義為
SkirtRegionRadius = ViewportRadius X (1 + SkirtFactor X EV)
EV = A + BXe-MxX1
其中選擇A和B使得當(dāng)XI等于0時(shí)(即當(dāng)視口區(qū)域非常小時(shí)), EV等于其最大值1,并且當(dāng)X1等于其最大值1 (對(duì)應(yīng)于覆蓋整個(gè)地球 的視口區(qū)域)時(shí),EV等于其最小值0。 SkirtFactor是可配置的比例 (scaling)因子。SkirtFactor的示范性值是10;在其它的實(shí)施例中, SkirtFactor等于在4和20之間的值。M是可配置的指數(shù)率因子。M的 示范性值是50;在其它的實(shí)施例中,M等于在10和200之間的值。另 夕卜,M的值取決于角距離X1的比例。根據(jù)上述約束分解(solve) A和 B, EV的等式變?yōu)?br>
EV =
l-eM l-eM
當(dāng)M=50時(shí),e^非常接近0 (e—5G"1.9*l(y22),并且EV近似等 于e-固。
在示范性實(shí)施例中,可以根據(jù)以下評(píng)分函數(shù)來(lái)確定分值 1
Score
1:
xFRxSAF,
其中IRi是與典范式和/或布爾表達(dá)式中的各個(gè)詞語(yǔ)或元素"i"相 對(duì)應(yīng)的査詢匹配分值(關(guān)于特定候選文檔),F(xiàn)R是指示特征或位置的 重要性的"特征排名",E是標(biāo)準(zhǔn)化值,以及SAF是上述的評(píng)分衰減 因子。在上面更詳細(xì)地討論了 IR、 FR和E參數(shù),并且該討論同樣地可 應(yīng)用于在此所討論的評(píng)分函數(shù)。注意到,特定候選文檔(或地理特征) 的IR,值的總和可以被視作該候選文檔的信息檢索分值或査詢匹配分 值,并且評(píng)分函數(shù)的所有其它參數(shù)用于根據(jù)額外的因子比例、提升或 衰減分值以改善如何對(duì)搜索結(jié)果進(jìn)行排名(即,使得排名最高的搜索 結(jié)果是最有可能與由用戶所査找的地理特征相對(duì)應(yīng)的搜索結(jié)果)。在示范實(shí)施例中,根據(jù)以下函數(shù)來(lái)確定用于特定地理特征的SAF SAF=C+DXe-KxX
其中K是指數(shù)比例因子、以及X是(A)在地理特征和視口區(qū)域 (即視口區(qū)域的最近邊界)之間的距離,與(B)視口邊緣區(qū)域的寬度 的比值,如在上面參考圖13所說(shuō)明的。在上述等式中,C和D是這樣 的值,其被選擇使得當(dāng)X等于1時(shí)(即當(dāng)?shù)乩硖卣髟谶吘墔^(qū)域的最 外面部分時(shí)),SAF等于其最小值MinScore,并且當(dāng)X等于0時(shí)(即 當(dāng)?shù)乩硖卣髋c在視口區(qū)域和視口邊緣區(qū)域之間的線或分界線相交或鄰 近時(shí)),SAF等于其最大值1。根據(jù)上述約束分解C和D, SAF的等 式變?yōu)?br>
, ^ MinScore - e《 (1 - MinScore) x e《xX
當(dāng)K=3時(shí),e—K近似等于0.5,以及l(fā)-e—K近似等于0.95。當(dāng) MinScore=0.2并且K=3時(shí),對(duì)于與視口邊緣區(qū)域相交(但是不與視口 區(qū)域相交)的地理特征,SAF近似等于0.158+ 0.842*e—3X。注意到,當(dāng) X=0時(shí)根據(jù)該等式SAF等于1.0,并且當(dāng)X=l時(shí)SAF近似等于0.2。 如上述注意到的,對(duì)于與視口區(qū)域相交的地理特征,SAF等于1,以及 對(duì)于既不與視口區(qū)域也不與視口邊緣區(qū)域相交的地理特征,SAF等于 MinScore (例如0.2)。在其它的實(shí)施例中,MinScore是在0.1和0.5 之間的值,并且K是在2和IO之間的值。
為了說(shuō)明和描述的目的而提供了本發(fā)明的特定實(shí)施例的上述描 述。其并不意在窮舉或?qū)⒈景l(fā)明限制在所公開(kāi)的精確形式。相反地, 應(yīng)理解,鑒于上述教導(dǎo)可以做出許多修改和變化。選擇并且描述了這 些實(shí)施例是為了最好地說(shuō)明本發(fā)明的原理和其實(shí)際應(yīng)用,從而使本領(lǐng) 域技術(shù)人員能夠最好地利用本發(fā)明和具有適合于特定用戶預(yù)期的各種 修改的各種實(shí)施例。
權(quán)利要求
1.一種用于執(zhí)行位置搜索的方法,包括接收位置搜索查詢;確定與所述位置搜索查詢相對(duì)應(yīng)的關(guān)鍵詞;識(shí)別與在所述位置搜索查詢中的所述關(guān)鍵詞相對(duì)應(yīng)的一個(gè)或多個(gè)文檔;以及提供與所述一個(gè)或多個(gè)文檔相對(duì)應(yīng)的至少一個(gè)位置。
2. 如權(quán)利要求l所述的方法,其中所識(shí)別的一個(gè)或多個(gè)文檔中的 每一個(gè)文檔具有與所述搜索査詢的所確定的關(guān)鍵詞語(yǔ)相對(duì)應(yīng)的標(biāo)志。
3. 如權(quán)利要求l所述的方法,其中所述關(guān)鍵詞的所述確定包括從 所述位置搜索査詢中移除標(biāo)點(diǎn)符號(hào)和非位置詞語(yǔ)。
4. 如權(quán)利要求l所述的方法,其中所述關(guān)鍵詞包括在所述位置搜 索查詢中的一個(gè)或多個(gè)詞語(yǔ)的一個(gè)或多個(gè)同義詞。
5. 如權(quán)利要求l所述的方法,其中所述識(shí)別所述一個(gè)或多個(gè)文檔 包括確定與所述關(guān)鍵詞相對(duì)應(yīng)的典范式。
6. 如權(quán)利要求l所述的方法,其中所述一個(gè)或多個(gè)文檔是在包括 與地理特征相對(duì)應(yīng)的多個(gè)文檔的索引中。
7. 如權(quán)利要求6所述的方法,其中所述多個(gè)文檔包括與所述地理 特征相對(duì)應(yīng)的參考坐標(biāo)。
8. 如權(quán)利要求l所述的方法,其中所述一個(gè)或多個(gè)文檔的所述識(shí) 別包括為所述一個(gè)或多個(gè)文檔的每一個(gè)確定分值。
9. 如權(quán)利要求8所述的方法,其中各個(gè)分值是依據(jù)所述關(guān)鍵詞在 多個(gè)文檔中的詞頻、在各個(gè)文檔中的一個(gè)或多個(gè)詞與所述關(guān)鍵詞的一 個(gè)或多個(gè)之間的匹配以及與所述關(guān)鍵詞相對(duì)應(yīng)的地理特征的大小。
10. 如權(quán)利要求8所述的方法,其中如果在所述一個(gè)或多個(gè)文檔 的前N個(gè)排名中,相應(yīng)的文檔的最佳分值大于下一個(gè)文檔的次最佳分 值的預(yù)定倍數(shù),則所述提供包括一個(gè)位置。
11. 如權(quán)利要求8所述的方法,其中所述提供包括與所述一個(gè)或 多個(gè)文檔相對(duì)應(yīng)的位置的前N個(gè)排名,并且其中所述前N個(gè)排名包括 具有在預(yù)定范圍內(nèi)的分值的文檔。
12. 如權(quán)利要求ll所述的方法,其中在所述前N個(gè)排名中的所述 位置的每一個(gè)包括位置標(biāo)識(shí)符。
13. 如權(quán)利要求ll所述的方法,其中在所述前N個(gè)排名中的所述 位置的每一個(gè)包括指向地像的相應(yīng)的鏈接。
14. 如權(quán)利要求1所述的方法,其中所述提供包括與所述至少一 個(gè)位置相對(duì)應(yīng)的地像。
15. 如權(quán)利要求14所述的方法,其中所述地像以所述至少一 個(gè)位置為中心并且包括小于在所述至少一個(gè)位置周?chē)念A(yù)定大小的區(qū) 域。
16. 如權(quán)利要求15所述的方法,其中所述至少一個(gè)位置包括在區(qū) 域中的具有所有共同的關(guān)鍵詞的兩個(gè)或多個(gè)不同的位置,并且其中所述地像包括與所述兩個(gè)或多個(gè)位置相對(duì)應(yīng)的標(biāo)記。
17. 如權(quán)利要求1所述的方法,其中所述一個(gè)或多個(gè)文檔的所述識(shí)別獨(dú)立于所述關(guān)鍵詞的次序。
18. —種搜索引擎系統(tǒng),包括 一個(gè)或多個(gè)中央處理單元,以執(zhí)行程序; 存儲(chǔ)器;以及存儲(chǔ)在所述存儲(chǔ)器中并且由所述處理器執(zhí)行的程序,所述程序包括用于接收位置搜索查詢的指令;用于確定與所述位置搜索査詢相對(duì)應(yīng)的關(guān)鍵詞的指令; 用于確定與在所述位置搜索查詢中的所述關(guān)鍵詞相對(duì)應(yīng)的一個(gè)或多個(gè)文檔的指令;以及用于向客戶端系統(tǒng)提供識(shí)別與所述一個(gè)或多個(gè)文檔相對(duì)應(yīng)的至少一個(gè)位置的信息的指令。
19. 一種用于與計(jì)算機(jī)系統(tǒng)協(xié)同使用的計(jì)算機(jī)程序產(chǎn)品,所述計(jì) 算機(jī)程序產(chǎn)品包括用于接收位置搜索查詢的指令;用于確定與所述位置搜索查詢相對(duì)應(yīng)的關(guān)鍵詞的指令; 用于確定與在所述位置搜索査詢中的所述關(guān)鍵詞相對(duì)應(yīng)的一個(gè) 或多個(gè)文檔的指令;以及用于向客戶端系統(tǒng)提供識(shí)別與所述一個(gè)或多個(gè)文檔相對(duì)應(yīng)的至少 一個(gè)位置的信息的指令。
20. —種搜索引擎系統(tǒng),包括 用于執(zhí)行程序的處理裝置; 存儲(chǔ)器;以及存儲(chǔ)在所述存儲(chǔ)器中并且由所述處理器執(zhí)行的程序,所述程序包括用于接收位置搜索查詢的指令;用于確定與所述位置搜索查詢相對(duì)應(yīng)的關(guān)鍵詞的指令;用于確定與在所述位置搜索査詢中的所述關(guān)鍵詞相對(duì)應(yīng)的一個(gè)或 多個(gè)文檔的指令;以及用于向客戶端系統(tǒng)提供識(shí)別與所述一個(gè)或多個(gè)文檔相對(duì)應(yīng)的至少 一個(gè)位置的信息的指令。
21. —種存儲(chǔ)在存儲(chǔ)器中的數(shù)據(jù)結(jié)構(gòu),所述數(shù)據(jù)結(jié)構(gòu)用于在執(zhí)行 位置搜索查詢中使用,包括與地理特征相對(duì)應(yīng)的多個(gè)文檔,其中在所述多個(gè)文檔中的各個(gè)文 檔包括位置信息和補(bǔ)充信息,所述位置信息包括與一個(gè)或多個(gè)位置相 對(duì)應(yīng)的關(guān)鍵詞、與所述一個(gè)或多個(gè)位置相關(guān)聯(lián)的一個(gè)或多個(gè)區(qū)域以及 所述關(guān)鍵詞的同義詞,并且其中所述補(bǔ)充信息包括與所述一個(gè)或多個(gè) 位置相對(duì)應(yīng)的參考坐標(biāo)。
22. 如權(quán)利要求21所述的數(shù)據(jù)結(jié)構(gòu),其中所述參考坐標(biāo)包括所述 一個(gè)或多個(gè)位置的緯度和經(jīng)度。
23. 如權(quán)利要求21所述的數(shù)據(jù)結(jié)構(gòu),其中所述參考坐標(biāo)包括圍繞 所述一個(gè)或多個(gè)位置的區(qū)域,并且其中所述區(qū)域小于預(yù)定的大小。
24. 如權(quán)利要求21所述的數(shù)據(jù)結(jié)構(gòu),其中所述數(shù)據(jù)結(jié)構(gòu)與超文本 標(biāo)記語(yǔ)言(HTML)相兼容。
25. 如權(quán)利要求21所述的數(shù)據(jù)結(jié)構(gòu),其中在所述各個(gè)文檔中的所 述位置信息對(duì)在位置搜索査詢中的詞語(yǔ)的次序不敏感。
26. —種包括響應(yīng)于位置搜索查詢而提供的區(qū)域的地像的圖 形用戶界面,其中所述地像包括與在所述區(qū)域中的具有與所述位 置搜索査詢相關(guān)聯(lián)的所有共同的詞語(yǔ)的兩個(gè)或多個(gè)不同位置相對(duì)應(yīng)的 兩個(gè)或多個(gè)標(biāo)記。
27. —種包括響應(yīng)于位置搜索査詢而提供的區(qū)域的地像的圖 形用戶界面,其中所述地像以位置為中心,并且其中所述地 像是獨(dú)立于與所述位置搜索査詢相關(guān)聯(lián)的詞語(yǔ)的次序來(lái)提供的。
28. —種用于執(zhí)行位置搜索的方法,包括 接收位置搜索查詢;識(shí)別滿足所述位置搜索查詢的一個(gè)或多個(gè)地理特征文檔,其中所述地理特征文檔中的每一個(gè)與地理特征相對(duì)應(yīng);以及根據(jù)分值對(duì)所識(shí)別的文檔進(jìn)行排名以產(chǎn)生一組已排名的文檔,所 述分值至少部分地基于與所識(shí)別的文檔相對(duì)應(yīng)的所述地理特征到客戶端系統(tǒng)的地理視口區(qū)域的接近性;以及根據(jù)所述已排名的文檔提供結(jié)果,所述結(jié)果識(shí)別與所述已排名的 文檔的至少一個(gè)相對(duì)應(yīng)的至少一個(gè)地理特征。
29. 如權(quán)利要求1所述的方法,其中所述地理視口區(qū)域與在所述 客戶端系統(tǒng)上顯示的地理區(qū)域相對(duì)應(yīng)。
30. 如權(quán)利要求1所述的方法,其中所述地理視口區(qū)域與響應(yīng)于 在先位置搜索查詢而在所述客戶端系統(tǒng)上顯示的地理區(qū)域相對(duì)應(yīng)。
31. 如權(quán)利要求1所述的方法,其中所述地理視口區(qū)域包括包圍 在所述客戶端系統(tǒng)上顯示的矩形地理區(qū)域的圓形地理區(qū)域。
32. 如權(quán)利要求1所述的方法,包括確定與所述位置搜索査詢相 對(duì)應(yīng)的關(guān)鍵詞、以及識(shí)別與在所述位置搜索査詢中的所述關(guān)鍵詞相匹 配的一個(gè)或多個(gè)地理特征文檔;其中所述關(guān)鍵詞包括在所述位置搜索査詢中的一個(gè)或多個(gè)詞語(yǔ)的 一個(gè)或多個(gè)同義詞。
33. —種搜索引擎系統(tǒng),包括一個(gè)或多個(gè)中央處理單元以執(zhí)行程序; 存儲(chǔ)器;以及存儲(chǔ)在所述存儲(chǔ)器中并且由所述處理器執(zhí)行的一個(gè)或多個(gè)程序, 所述一個(gè)或多個(gè)程序包括用于接收位置搜索查詢的指令;用于識(shí)別滿足所述位置搜索查詢的一個(gè)或多個(gè)地理特征文檔的指 令,其中所述地理特征文檔中的每一個(gè)與地理特征相對(duì)應(yīng);用于根據(jù)分值對(duì)所識(shí)別的文檔進(jìn)行排名以產(chǎn)生一組已排名的文檔 的指令,所述分值至少部分地基于與所識(shí)別的文檔相對(duì)應(yīng)的所述地理 特征到客戶端系統(tǒng)的地理視口區(qū)域的接近性;以及用于根據(jù)所述已排名的文檔提供結(jié)果的指令,所述結(jié)果識(shí)別與所 述已排名的文檔的至少一個(gè)相對(duì)應(yīng)的至少一個(gè)地理特征。
34. —種用于執(zhí)行位置搜索的方法,包括 接收位置搜索査詢;識(shí)別滿足所述位置搜索査詢的一個(gè)或多個(gè)地理特征; 根據(jù)分值對(duì)所識(shí)別的地理特征進(jìn)行排名以產(chǎn)生一組已排名的地理特征,所述分值至少部分地基于所述地理特征到客戶端系統(tǒng)的地理視口區(qū)域的接近性;以及根據(jù)所述已排名的文檔提供結(jié)果,所述結(jié)果識(shí)別與所述已排名的地理特征的至少一個(gè)相對(duì)應(yīng)的至少一個(gè)地理特征。
35. 如權(quán)利要求34所述的方法,其中所述地理視口區(qū)域與在所述 客戶端系統(tǒng)上顯示的地理區(qū)域相對(duì)應(yīng)。
36. 如權(quán)利要求34所述的方法,其中所述地理視口區(qū)域與響應(yīng)于 在先位置搜索查詢而在所述客戶端系統(tǒng)上顯示的地理區(qū)域相對(duì)應(yīng)。
37. 如權(quán)利要求34所述的方法,包括 確定與所述位置搜索査詢相對(duì)應(yīng)的關(guān)鍵詞;以及識(shí)別與在所述位置搜索查詢中的所述關(guān)鍵詞相匹配的一個(gè)或多個(gè) 地理特征;其中所述關(guān)鍵詞包括在所述位置搜索査詢中的一個(gè)或多個(gè)詞語(yǔ)的 一個(gè)或多個(gè)同義詞。
38. —種搜索引擎系統(tǒng),包括 一個(gè)或多個(gè)中央處理單元以執(zhí)行程序; 存儲(chǔ)器;以及存儲(chǔ)在所述存儲(chǔ)器中并且由所述處理器執(zhí)行的一個(gè)或多個(gè)程序, 所述一個(gè)或多個(gè)程序包括用于接收位置搜索査詢的指令;用于識(shí)別滿足所述位置搜索査詢的一個(gè)或多個(gè)地理特征的指令; 用于根據(jù)分值對(duì)所識(shí)別的地理特征進(jìn)行排名以產(chǎn)生一組已排名的地理特征的指令,所述分值至少部分地基于所述地理特征到客戶端系統(tǒng)的地理視口區(qū)域的接近性;以及用于根據(jù)所述已排名的文檔提供結(jié)果的指令,所述結(jié)果識(shí)別與所述已排名的地理特征的至少一個(gè)相對(duì)應(yīng)的至少一個(gè)地理特征。
全文摘要
一種用于執(zhí)行位置搜索的方法,包括接收位置搜索查詢、確定與位置搜索查詢相對(duì)應(yīng)的關(guān)鍵詞、識(shí)別與在位置搜索查詢中的關(guān)鍵詞相對(duì)應(yīng)的一個(gè)或多個(gè)文檔、以及向客戶端系統(tǒng)提供識(shí)別與一個(gè)或多個(gè)文檔相對(duì)應(yīng)的至少一個(gè)位置的信息。
文檔編號(hào)G06F17/30GK101410833SQ200780010615
公開(kāi)日2009年4月15日 申請(qǐng)日期2007年1月26日 優(yōu)先權(quán)日2006年1月27日
發(fā)明者弗洛里安·米歇爾·布龍, 拉爾斯·埃爾斯特魯普·拉斯穆森, 拉梅什·巴拉科利什南, 泰·陳, 詹姆斯·克里斯托弗·諾利斯, 詹姆斯·羅伯特·穆勒 申請(qǐng)人:谷歌公司