技術(shù)特征:
技術(shù)總結(jié)
本申請(qǐng)?zhí)峁┮环N將目標(biāo)字符串轉(zhuǎn)化為規(guī)范化字符串的方法及裝置,其中的方法包括:基于指定的切分長(zhǎng)度針對(duì)目標(biāo)字符串進(jìn)行遍歷切分得到第一切分單元集合;在索引列表中查找與第一切分單元集合中各切分單元關(guān)聯(lián)的規(guī)范化字符串,得到與第一切分單元集合對(duì)應(yīng)的規(guī)范化字符串集合;索引列表包括針對(duì)規(guī)范化字符串進(jìn)行遍歷切分得到的切分單元、以及切分單元關(guān)聯(lián)的規(guī)范化字符串;計(jì)算目標(biāo)字符串與規(guī)范化字符串集合中各字符串的相似度;基于計(jì)算出的相似度在規(guī)范化字符串集合中查找與目標(biāo)字符串對(duì)應(yīng)的規(guī)范化字符串;將該目標(biāo)字符串轉(zhuǎn)化為查找到的規(guī)范化字符串。本申請(qǐng)?jiān)诓檎遗c目標(biāo)字符串對(duì)應(yīng)的規(guī)范化字符串時(shí)可以減少計(jì)算量,提升規(guī)范化字符串的查找效率。
技術(shù)研發(fā)人員:趙科科
受保護(hù)的技術(shù)使用者:阿里巴巴集團(tuán)控股有限公司
技術(shù)研發(fā)日:2016.03.03
技術(shù)公布日:2017.09.12