两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種搜索方法和系統(tǒng)的制作方法

文檔序號(hào):8528166閱讀:581來(lái)源:國(guó)知局
一種搜索方法和系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本申請(qǐng)涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別是涉及一種搜索方法和一種搜索系統(tǒng)。
【背景技術(shù)】
[0002]查詢(xún)改寫(xiě)是在搜索引擎查詢(xún)過(guò)程中,對(duì)用戶(hù)輸入的原始查詢(xún)?cè)~進(jìn)行改寫(xiě),以返回更好的搜索結(jié)果。現(xiàn)有技術(shù)中,查詢(xún)改寫(xiě)主要是糾正用戶(hù)輸入錯(cuò)誤。如:用戶(hù)輸入“走結(jié)論”、“zoujielun”或者“zhoujielun”,搜索引擎很難給用戶(hù)找到正確的網(wǎng)頁(yè)。對(duì)查詢(xún)進(jìn)行糾錯(cuò)后,即根據(jù)“zoujielun”在糾錯(cuò)模型中進(jìn)行分析,分析得到的結(jié)果中,“周杰倫”對(duì)應(yīng)的文本匹配的結(jié)果的比例較大,則修改成符合用戶(hù)原本意圖的查詢(xún)?cè)~“周杰倫”,在用戶(hù)不干預(yù)的情況下,搜索引擎就可以返回符合用戶(hù)意圖的網(wǎng)頁(yè),提升用戶(hù)體驗(yàn)。
[0003]現(xiàn)有網(wǎng)頁(yè)搜索技術(shù)主要是基于關(guān)鍵詞進(jìn)行查詢(xún)。當(dāng)用戶(hù)輸入查詢(xún)?cè)~查找信息時(shí),搜索引擎對(duì)查詢(xún)?cè)~進(jìn)行中文分詞,將查詢(xún)?cè)~轉(zhuǎn)換成幾個(gè)關(guān)鍵詞,然后去網(wǎng)頁(yè)的倒排索引庫(kù)中進(jìn)行查找,將命中關(guān)鍵字的網(wǎng)頁(yè)返回,再采用一定的排序算法,從相關(guān)度、時(shí)效性、用戶(hù)意圖等幾個(gè)方面對(duì)命中的網(wǎng)頁(yè)進(jìn)行排序,按順序?qū)⑦@些網(wǎng)頁(yè)鏈接返回給用戶(hù)。
[0004]現(xiàn)有的基于關(guān)鍵詞的搜索技術(shù),S卩“查詢(xún)?cè)~_>關(guān)鍵字_>查找”的這種依賴(lài)字符串匹配的檢索方式,簡(jiǎn)單地將查詢(xún)?cè)~進(jìn)行切分,容易損失一部分信息,偏離用戶(hù)的意圖,從而無(wú)法通過(guò)關(guān)鍵字獲得有效的結(jié)果。
[0005]例如,如圖1所示,搜索引擎檢索查詢(xún)?cè)~“謝霆鋒是誰(shuí)的兒子”時(shí),分詞后得到的關(guān)鍵字為“謝霆鋒”、“誰(shuí)”、“兒子”,使用這三個(gè)關(guān)鍵字進(jìn)行檢索,由于網(wǎng)絡(luò)中“l(fā)ucas”的出現(xiàn)頻率遠(yuǎn)比“謝賢”出現(xiàn)的頻率要高,則以單純依靠文本匹配返回的網(wǎng)頁(yè)大多是描述“謝霆鋒的兒子”,即Iucas相關(guān)的網(wǎng)頁(yè),這樣單純依靠匹配得到的搜索結(jié)果對(duì)應(yīng)的匹配成功率往往較低,難以滿(mǎn)足用戶(hù)需求。

【發(fā)明內(nèi)容】

[0006]本申請(qǐng)所要解決的技術(shù)問(wèn)題是提供一種搜索方法和系統(tǒng),解決現(xiàn)有技術(shù)中對(duì)于問(wèn)題的解答搜索過(guò)程中出現(xiàn)的搜索結(jié)果匹配成功率低,難以滿(mǎn)足用戶(hù)需求問(wèn)題。
[0007]為了解決上述問(wèn)題,本申請(qǐng)公開(kāi)了一種搜索方法,包括:
[0008]當(dāng)接收到查詢(xún)?cè)~串時(shí),對(duì)所述查詢(xún)?cè)~串進(jìn)行語(yǔ)義分析,得到所述查詢(xún)?cè)~串對(duì)應(yīng)的語(yǔ)義表達(dá)式;
[0009]結(jié)合所述語(yǔ)義表達(dá)式進(jìn)行匹配分析,確定當(dāng)前所述查詢(xún)?cè)~串中各詞所屬的語(yǔ)義標(biāo)簽;
[0010]根據(jù)所述語(yǔ)義標(biāo)簽對(duì)所述查詢(xún)?cè)~串進(jìn)行改寫(xiě);
[0011]以改寫(xiě)后的查詢(xún)?cè)~串進(jìn)行搜索,得到匹配的網(wǎng)絡(luò)信息。
[0012]優(yōu)選地,所述當(dāng)接收到查詢(xún)?cè)~串時(shí),對(duì)所述查詢(xún)?cè)~串進(jìn)行語(yǔ)義分析,得到所述查詢(xún)?cè)~串對(duì)應(yīng)的語(yǔ)義表達(dá)式的步驟包括:
[0013]在知識(shí)庫(kù)預(yù)置的實(shí)體詞列表中查找所述查詢(xún)?cè)~串對(duì)應(yīng)的實(shí)體詞;
[0014]在知識(shí)庫(kù)預(yù)置的屬性詞列表中查找所述查詢(xún)?cè)~串對(duì)應(yīng)的屬性詞。
[0015]優(yōu)選地,所述確定當(dāng)前所述查詢(xún)?cè)~串中各詞所屬的語(yǔ)義標(biāo)簽的步驟包括:
[0016]提取所述屬性詞的預(yù)置的語(yǔ)義標(biāo)簽;
[0017]對(duì)所述實(shí)體詞標(biāo)記一個(gè)或多個(gè)原始語(yǔ)義標(biāo)簽;
[0018]分別判斷被標(biāo)記原始語(yǔ)義標(biāo)簽的所述實(shí)體詞,與被標(biāo)記語(yǔ)義標(biāo)簽的所述屬性詞是否存在預(yù)定義的關(guān)聯(lián)關(guān)系;若是,則確定存在所述預(yù)定義關(guān)聯(lián)關(guān)系的原始語(yǔ)義標(biāo)簽為當(dāng)前所述實(shí)體詞所屬的語(yǔ)義標(biāo)簽。
[0019]優(yōu)選地,所述根據(jù)所述語(yǔ)義標(biāo)簽對(duì)所述查詢(xún)?cè)~串進(jìn)行改寫(xiě)的步驟包括:
[0020]采用所述語(yǔ)義標(biāo)簽查找預(yù)置的標(biāo)識(shí)實(shí)體詞;
[0021]將所述實(shí)體詞替換為預(yù)置的標(biāo)識(shí)實(shí)體詞;
[0022]和/ 或,
[0023]將所述屬性詞替換為預(yù)置的標(biāo)識(shí)屬性詞;
[0024]和/ 或,
[0025]判斷所述查詢(xún)?cè)~串是否符合逆向表達(dá)的句法規(guī)則;若是,則獲取對(duì)應(yīng)的在服務(wù)器存儲(chǔ)的符合正向表達(dá)的句法規(guī)則對(duì)應(yīng)的預(yù)置表達(dá)式;所述預(yù)置表達(dá)式具有使用頻次;
[0026]當(dāng)所述預(yù)置表達(dá)式的使用頻次高于預(yù)設(shè)閾值時(shí),將所述查詢(xún)?cè)~串按照正向表達(dá)的句法規(guī)則進(jìn)行改寫(xiě)。
[0027]優(yōu)選地,所述標(biāo)識(shí)實(shí)體詞為與所述實(shí)體詞具有相同的語(yǔ)義標(biāo)簽,且使用頻次最多的實(shí)體詞;
[0028]所述標(biāo)識(shí)屬性詞為與所述屬性詞描述同一類(lèi)實(shí)體詞,且使用頻次最多的屬性詞。
[0029]優(yōu)選地,所述判斷所述查詢(xún)?cè)~串是否符合逆向表達(dá)的句法規(guī)則的步驟包括:
[0030]對(duì)所述查詢(xún)?cè)~串進(jìn)行句法分析,獲得主語(yǔ)和修飾語(yǔ),以及,所述主語(yǔ)和所述修飾語(yǔ)之間的依賴(lài)關(guān)系;所述依賴(lài)關(guān)系包括所述主語(yǔ)依賴(lài)所述修飾詞的依賴(lài)關(guān)系;
[0031]當(dāng)所述主語(yǔ)為所述實(shí)體詞、所述修飾詞為所述屬性詞,并且,所述依賴(lài)關(guān)系為所述主語(yǔ)依賴(lài)所述修飾詞的依賴(lài)關(guān)系時(shí),則所述查詢(xún)?cè)~串符合逆向表達(dá)的句法規(guī)則。
[0032]本申請(qǐng)還公開(kāi)了一種搜索系統(tǒng),包括:
[0033]詞性解析模塊,用于在接收到查詢(xún)?cè)~串時(shí),對(duì)所述查詢(xún)?cè)~串進(jìn)行語(yǔ)義分析,得到所述查詢(xún)?cè)~串對(duì)應(yīng)的語(yǔ)義表達(dá)式;
[0034]語(yǔ)義標(biāo)簽確定模塊,用于結(jié)合所述語(yǔ)義表達(dá)式進(jìn)行匹配分析,確定當(dāng)前所述查詢(xún)?cè)~串中各詞所屬的語(yǔ)義標(biāo)簽;
[0035]改寫(xiě)模塊,用于根據(jù)所述語(yǔ)義標(biāo)簽對(duì)所述查詢(xún)?cè)~串進(jìn)行改寫(xiě);
[0036]查詢(xún)模塊,用于以改寫(xiě)后的查詢(xún)?cè)~串進(jìn)行搜索,得到匹配的網(wǎng)絡(luò)信息。
[0037]優(yōu)選地,所述詞性解析模塊包括:
[0038]實(shí)體詞查找模塊,用于在知識(shí)庫(kù)預(yù)置的實(shí)體詞列表中查找所述查詢(xún)?cè)~串對(duì)應(yīng)的實(shí)體詞;
[0039]屬性詞查找模塊,用于在知識(shí)庫(kù)預(yù)置的屬性詞列表中查找所述查詢(xún)?cè)~串對(duì)應(yīng)的屬性詞。
[0040]優(yōu)選地,所述語(yǔ)義標(biāo)簽確定模塊包括:
[0041]提取子模塊,用于提取所述屬性詞的預(yù)置的語(yǔ)義標(biāo)簽;
[0042]標(biāo)記子模塊,用于對(duì)所述實(shí)體詞標(biāo)記一個(gè)或多個(gè)原始語(yǔ)義標(biāo)簽;
[0043]關(guān)聯(lián)關(guān)系判斷模塊,用于分別判被標(biāo)記原始語(yǔ)義標(biāo)簽的所述實(shí)體詞,與被標(biāo)記語(yǔ)義標(biāo)簽的所述屬性詞是否存在預(yù)定義的關(guān)聯(lián)關(guān)系;若是,則調(diào)用確定子模塊;
[0044]確定子模塊,用于確定存在所述預(yù)定義關(guān)聯(lián)關(guān)系的原始語(yǔ)義標(biāo)簽為當(dāng)前所述實(shí)體詞所屬的語(yǔ)義標(biāo)簽。
[0045]優(yōu)選地,所述改寫(xiě)模塊包括:
[0046]標(biāo)識(shí)實(shí)體詞查找子模塊,用于采用所述語(yǔ)義標(biāo)簽查找預(yù)置的標(biāo)識(shí)實(shí)體詞;
[0047]標(biāo)識(shí)實(shí)體詞替換子模塊,用于將所述實(shí)體詞替換為預(yù)置的標(biāo)識(shí)實(shí)體詞;
[0048]和/ 或,
[0049]標(biāo)識(shí)屬性詞替換子模塊,用于將所述屬性詞替換為預(yù)置的標(biāo)識(shí)屬性詞;
[0050]和/ 或,
[0051]逆向表達(dá)判斷子模塊,用于判斷所述查詢(xún)?cè)~串是否符合逆向表達(dá)句法規(guī)則;若是,則調(diào)用預(yù)置表達(dá)式獲取子模塊;
[0052]預(yù)置表達(dá)式獲取子模塊,用于獲取對(duì)應(yīng)的在服務(wù)器存儲(chǔ)的符合正向表達(dá)句法規(guī)則的預(yù)置表達(dá)式;所述預(yù)置表達(dá)式具有使用頻次;
[0053]正向表達(dá)改寫(xiě)子模塊,用于在所述預(yù)置表達(dá)式的使用頻次高于預(yù)設(shè)閾值時(shí),將所述查詢(xún)?cè)~串按照正向表達(dá)句法規(guī)則進(jìn)行改寫(xiě)。
[0054]優(yōu)選地,所述標(biāo)識(shí)實(shí)體詞為與所述實(shí)體詞具有相同的語(yǔ)義標(biāo)簽,且使用頻次最多的實(shí)體詞;
[0055]所述標(biāo)識(shí)屬性詞為與所述屬性詞描述同一類(lèi)實(shí)體詞,且使用頻次最多的屬性詞。
[0056]優(yōu)選地,所述逆向表達(dá)判斷子模塊包括:
[0057]句法分析子模塊,用于對(duì)所述查詢(xún)?cè)~串進(jìn)行句法分析,獲得主語(yǔ)和修飾語(yǔ),以及,所述主語(yǔ)和所述修飾語(yǔ)之間的依賴(lài)關(guān)系;所述依賴(lài)關(guān)系包括所述主語(yǔ)依賴(lài)所述修飾詞的依賴(lài)關(guān)系;
[0058]判定子模塊,用于在所述主語(yǔ)為所述實(shí)體詞、所述修飾詞為所述屬性詞,并且,所述依賴(lài)關(guān)系為所述主語(yǔ)依賴(lài)所述修飾詞的依賴(lài)關(guān)系時(shí),則所述查詢(xún)?cè)~串符合逆向表達(dá)的句法規(guī)則。
[0059]與現(xiàn)有技術(shù)相比,本申請(qǐng)包括以下優(yōu)點(diǎn):
[0060]本申請(qǐng)通過(guò)對(duì)查詢(xún)?cè)~串進(jìn)行語(yǔ)義分析,得到語(yǔ)義表達(dá)式,進(jìn)而確定符合當(dāng)前語(yǔ)境的語(yǔ)義表達(dá)式中各詞所屬的語(yǔ)義標(biāo)簽,基于該語(yǔ)義標(biāo)簽進(jìn)行查詢(xún)?cè)~串的改寫(xiě),更為符合用戶(hù)意圖,使得在搜索時(shí)信息匹配的成功率高,提高了搜索的質(zhì)量和搜索的效率。
[0061]本申請(qǐng)將實(shí)體詞、屬性詞改寫(xiě)為與搜索引擎友好的標(biāo)識(shí)實(shí)體詞、標(biāo)識(shí)屬性詞,將不常用的逆向表達(dá)的查詢(xún)?cè)~串改寫(xiě)為常用的正向表達(dá)的查詢(xún)?cè)~串,提高了搜索引擎搜索信息的覆蓋率,進(jìn)一步提高了信息匹配的成功率。
【附圖說(shuō)明】
[0062]圖1是一種現(xiàn)有技術(shù)的一種搜索結(jié)果示例圖;
[0063]圖2是本申請(qǐng)的一種搜索方法實(shí)施例的步驟流程圖;
[0064]圖3是本申請(qǐng)的一種正向表達(dá)改寫(xiě)的示例圖;
[0065]圖4是本申請(qǐng)的一種搜索結(jié)果示例圖;
[0066]圖5是本申請(qǐng)的一種搜索系統(tǒng)實(shí)施例的結(jié)構(gòu)框圖。
【具體實(shí)施方式】
[0067]為使本申請(qǐng)的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和【具體實(shí)施方式】對(duì)本申請(qǐng)作進(jìn)一步詳細(xì)的說(shuō)明。
[0068]知識(shí)庫(kù)是知識(shí)工程中結(jié)構(gòu)化、易操作、易利用、全面有組織的知識(shí)集群,是針對(duì)某一(或某些)領(lǐng)域問(wèn)題求解的需要,采用某種(或若干)知識(shí)表示方式在計(jì)算機(jī)存儲(chǔ)器中存儲(chǔ)、組織、管理和使用的互相聯(lián)系的知識(shí)片集合。這些知識(shí)片包括與領(lǐng)域相關(guān)的理論知識(shí)、事實(shí)數(shù)據(jù),由專(zhuān)家經(jīng)驗(yàn)得到的啟發(fā)式知識(shí),如某領(lǐng)域內(nèi)有關(guān)的定義、定理和運(yùn)算法則以及常識(shí)性知識(shí)等。
[0069]本申請(qǐng)的核心思想之一在于,基于知識(shí)庫(kù)對(duì)查詢(xún)?cè)~串進(jìn)行符合語(yǔ)法規(guī)范的改寫(xiě),以獲取更加全面的符合用戶(hù)意圖的搜索結(jié)果。
[0070]參照?qǐng)D2,示出了本申請(qǐng)的一種搜索方法實(shí)施例的步驟流程圖。
當(dāng)前第1頁(yè)1 2 3 4 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
大连市| 大兴区| 珠海市| 肥城市| 密山市| 渭源县| 明溪县| 宜宾县| 分宜县| 房产| 清远市| 西充县| 从化市| 哈尔滨市| 石柱| 缙云县| 林西县| 观塘区| 兰溪市| 藁城市| 五大连池市| 定结县| 合山市| 淮安市| 穆棱市| 邵阳市| 大宁县| 吴桥县| 嘉善县| 泽库县| 额济纳旗| 临武县| 怀仁县| 赣州市| 金堂县| 宣恩县| 阿瓦提县| 普安县| 曲水县| 富源县| 汤阴县|