1.一種文檔查錯方法,其特征在于,包括:
根據(jù)同義字詞句庫,檢查并記錄文檔中出現(xiàn)的同義字詞句;
將記錄的同義字詞句修改為統(tǒng)一用詞。
2.如權(quán)利要求1所述的方法,其特征在于,在將記錄的同義字詞句修改為統(tǒng)一用詞之前,還包括:
通過語句比對的方式,檢查文檔中出現(xiàn)的同義字詞句,并對檢查到的同義字詞句中不屬于同義字詞句庫中的同義字詞句進(jìn)行記錄。
3.如權(quán)利要求2所述的方法,其特征在于,所述通過語句比對的方式,檢查文檔中出現(xiàn)的同義字詞句,包括:
根據(jù)配置信息,確定語句長度及語句比對方式;
確定搜索起始位置,得到起始語句,將起始語句與該語句之后的所有語句進(jìn)行比對,以確定起始語句與該語句之后的所有語句中是否存在同義字詞句;其中,起始語句之后的所有語句為:在起始語句后,起始位置以字符為單位逐漸向后推移得到的各語句;
將搜索起始位置向后移動一個字符,得到新的搜索起始位置后返回上述語句比對步驟。
4.如權(quán)利要求3所述的方法,其特征在于,所述語句比對方式包括:
將語句劃分為同義字詞句前端字符串+同義字詞句字符串+同義字詞句后端字符串;
將兩個語句相同位置的字符串進(jìn)行比對,若兩個語句的前端字符串相同、后端字符串相同且同義字詞句字符串不同,則判定兩個語句中的同義字詞句字符串為同義字詞句字符串。
5.如權(quán)利要求2至4任意一項所述的方法,其特征在于,所述方法還包括:將通過語句對比方式記錄的同義字詞句寫入同義字詞句庫。
6.如權(quán)利要求1至4任意一項所述的方法,其特征在于,根據(jù)同義字詞句 庫,檢測并記錄文檔中出現(xiàn)的同義字詞句之前,還包括:
調(diào)取歷史修改數(shù)據(jù)庫;
將所述歷史修改數(shù)據(jù)庫中記錄的被修改的內(nèi)容進(jìn)行全文檔搜索;
呈現(xiàn)搜索到的內(nèi)容,并根據(jù)用戶的指示按歷史修改方式進(jìn)行修改或忽略。
7.如權(quán)利要求6所述的方法,其特征在于,所述方法中,將記錄的同義字詞句修改為統(tǒng)一用詞時,還包括:將被修改的內(nèi)容和修改后的內(nèi)容記錄到所述歷史修改數(shù)據(jù)庫。
8.如權(quán)利要求1或2或3或4或7任意一項所述的方法,其特征在于,所述將記錄的同義字詞句修改為統(tǒng)一用詞,具體包括:
呈現(xiàn)記錄的同義字詞句信息;
基于用戶的修改指示,將文檔中出現(xiàn)的同義字詞句修改為統(tǒng)一用詞;其中,所述統(tǒng)一用詞為默認(rèn)的或者用戶指定的某一同義字詞句。
9.一種文檔差錯裝置,其特征在于,包括:
同義字詞句檢查模塊,用于根據(jù)同義字詞句庫,檢查并記錄文檔中出現(xiàn)的同義字詞句;
同義字詞句處理模塊,用于將記錄的同義字詞句修改為統(tǒng)一用詞。
10.如權(quán)利要求9所述的裝置,其特征在于,所述同義字詞句檢查模塊,還用于通過語句比對的方式,檢查文檔中出現(xiàn)的同義字詞句,并對檢查到的同義字詞句中不屬于同義字詞句庫中的同義字詞句進(jìn)行記錄。
11.如權(quán)利要求10所述的裝置,其特征在于,所述同義字詞句檢查模塊,具體包括:
信息獲取子模塊,用于根據(jù)配置信息,確定語句長度及語句比對方式;
語句比對子模塊,用于確定搜索起始位置,得到起始語句,將起始語句與該語句之后的所有語句進(jìn)行比對,以確定起始語句與該語句之后的所有語句中是否存在同義字詞句;其中,起始語句之后的所有語句為:在起始語句后,起始位置以字符為單位逐漸向后推移得到的各語句;
輪詢處理子模塊,用于將搜索起始位置向后移動一個字符,得到新的搜索起始位置后,觸發(fā)所述語句比對子模塊。
12.如權(quán)利要求9或10或11所述的裝置,其特征在于,還包括:
歷史修改內(nèi)容檢查模塊,用于調(diào)取歷史修改數(shù)據(jù)庫,將所述歷史修改數(shù)據(jù)庫中記錄的被修改的內(nèi)容進(jìn)行全文檔搜索,呈現(xiàn)搜索到的內(nèi)容,并根據(jù)用戶的指示按歷史修改方式進(jìn)行修改或忽略。