技術(shù)編號:9631534
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術(shù)詳細信息。 隨著大數(shù)據(jù)時代的到來,文本識別是信息提取、數(shù)據(jù)分析和數(shù)據(jù)處理中的慣用手 段,例如,在建立電影和演員數(shù)據(jù)庫過程中,往往需要準確識別并提取演員的名稱信息。 目前,正則匹配法是文本識別的慣用手段,通過建立正則表達式,可以識別滿足該 正則表達式的特定文本,對于不滿足該正則表達式的其他文本,往往無法識別或識別出錯。 在實際應用中,正則匹配法具有極大的局限性,缺乏通用性,尤其對于復雜的、非 結(jié)構(gòu)化的網(wǎng)絡(luò)文本,正則匹配法更是難以適用,例如,在演員名稱的識別過程中,假如...
注意:該技術(shù)已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識儲備,不適合論文引用。
請注意,此類技術(shù)沒有源代碼,用于學習研究技術(shù)思路。