介紹,顯而易見地,下面描述中的附圖是本申請的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0054]圖1為本申請一實施例提供的頁面文案的處理方法的流程示意圖;
[0055]圖2為本申請另一實施例提供的頁面文案的處理裝置的結(jié)構(gòu)示意圖。
【【具體實施方式】】
[0056]為使本申請實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本申請實施例中的附圖,對本申請實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是本申請一部分實施例,而不是全部的實施例?;诒旧暾堉械膶嵤├绢I(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的全部其他實施例,都屬于本申請保護的范圍。
[0057]需要說明的是,本申請實施例中所涉及的終端可以包括但不限于手機、個人數(shù)字助理(Personal Digital Assistant, PDA)、無線手持設(shè)備、平板電腦(Tablet Computer)>個人電腦(Personal Computer, PC)、MP3播放器、MP4播放器等。
[0058]另外,本文中術(shù)語“和/或”,僅僅是一種描述關(guān)聯(lián)對象的關(guān)聯(lián)關(guān)系,表示可以存在三種關(guān)系,例如,A和/或B,可以表示:單獨存在A,同時存在A和B,單獨存在B這三種情況。另外,本文中字符“/”,一般表示前后關(guān)聯(lián)對象是一種“或”的關(guān)系。
[0059]圖1為本申請一實施例提供的頁面文案的處理方法的流程示意圖,如圖1所示。
[0060]11、確定待處理的頁面文案中所包括的至少一個詞匯。
[0061]其中,詞匯,可以理解為是一種語言里所有的或特定范圍的詞或固定短語等。對于不同語言來說,可以有不同的詞匯,例如,漢語詞匯、英語詞匯等。
[0062]需要說明的是,頁面文案的內(nèi)容可以包括固定內(nèi)容和變化內(nèi)容,由于變化內(nèi)容的不可預(yù)測性和不確定性,例如,商品信息等,一般來說,在101中,具體可以對固定內(nèi)容進行掃描,以確定頁面文案的固定內(nèi)容中所包括的至少一個詞匯。
[0063]可選地,在本實施例的一個可能的實現(xiàn)方式中,本申請所涉及的頁面文案可以包括但不限于郵件文案、文檔文案或Web頁面文案,本實施例對此不進行特別限定。
[0064]其中,郵件文案為以郵件形式展現(xiàn)內(nèi)容的文案,郵件可以包括但不限于純文本類型郵件和超文本標記語言(HyperText Markup Language, HTML)類型郵件。
[0065]其中,文檔文案為以文檔形式展現(xiàn)內(nèi)容的文案。文檔可以包括但不限于WORD文檔、EXCEL文檔或PDF文檔。
[0066]其中,萬維網(wǎng)(World Wide Web,Web)頁面文案為以Web頁面形式展現(xiàn)內(nèi)容的文案。Web頁面可以包括由一個或者多個超文本標記語言(HyperText Markup Language,HTML)標簽組成的一個顯示區(qū)塊,稱為頁面元素,例如,文本、標簽、超鏈接、按鈕、輸入框、下拉框等。
[0067]需要說明的是,待處理的頁面文案可以為內(nèi)容變化的頁面文案,或者還可以為新增加的頁面文案,本實施例對此不進行特別限定。
[0068]102、獲得每個詞匯在所述頁面文案所屬第一語言版本系統(tǒng)中的當前密度值。
[0069]可選地,在本實施例的一個可能的實現(xiàn)方式中,在102中,具體可以根據(jù)Di= (t.+a,) / (T+A),獲得每個詞匯在所述第一語言版本系統(tǒng)中的當前密度值。
[0070]其中,
[0071]i表示第i個詞匯,取值為自然數(shù);
[0072]ti表示第i個詞匯在所述頁面文案中出現(xiàn)的次數(shù);
[0073]a,表示第i個詞匯在所述第一語言版本系統(tǒng)中出現(xiàn)的歷史次數(shù);
[0074]T表示所述頁面文案中的詞匯總量;
[0075]A表示所述第一語言版本系統(tǒng)中的歷史詞匯總量;
[0076]Di表示第i個詞匯在所述第一語言版本系統(tǒng)中的當前密度值。
[0077]103、根據(jù)所述每個詞匯在所述第一語言版本系統(tǒng)中的歷史密度值和所述每個詞匯在第二語言版本系統(tǒng)中的歷史密度值中的至少一項,以及所述獲得的每個詞匯在所述第一語言版本系統(tǒng)中的當前密度值,確定所述頁面文案是否存在異?,F(xiàn)象。
[0078]其中,所述第一語言版本系統(tǒng)與所述第二語言版本系統(tǒng)為屬于同一個多語言系統(tǒng)的不同語言版本系統(tǒng)。多語言系統(tǒng),就是能夠以多種語言(而不是一種語言)為用戶提供信息服務(wù),讓使用不同語言的用戶都能夠從多語言系統(tǒng)獲得內(nèi)容相同的信息。
[0079]具體地,所述系統(tǒng)可以是網(wǎng)站,多語言系統(tǒng)則可以為多語言網(wǎng)站。例如,全球速賣通(aliexpress)網(wǎng)站,該多語言網(wǎng)站可以有多個語言版本網(wǎng)站,例如,法語版本網(wǎng)站fr.aliexpress.com、德語版本網(wǎng)站 de.aliexpress.com、俄語版本網(wǎng)站 ru.aliexpress.com、日語版本網(wǎng)站 ja.aliexpress.com 等。
[0080]可以理解的是,第二語言版本系統(tǒng)可以為多語言系統(tǒng)中除了第一語言版本系統(tǒng)之外的其他所有系統(tǒng),或者還可以為多語言系統(tǒng)中除了第一語言版本系統(tǒng)之外的其他部分系統(tǒng),本實施例對此不進行特別限定。
[0081]可選地,在本實施例的一個可能的實現(xiàn)方式中,在103之前,還可以進一步獲得所述每個詞匯在所述第一語言版本系統(tǒng)中的歷史密度值。具體可以利用第一語言版本系統(tǒng)中的歷史頁面文案,獲得所述每個詞匯在所述第一語言版本系統(tǒng)中的歷史密度值。具體地,具體可以根據(jù)D'獲得所述每個詞匯在所述第一語言版本系統(tǒng)中的歷史密度值。
[0082]其中,
[0083]i表示第i個詞匯,取值為自然數(shù);
[0084]a,表示第i個詞匯在所述第一語言版本系統(tǒng)中出現(xiàn)的歷史次數(shù);
[0085]A表示所述第一語言版本系統(tǒng)中的歷史詞匯總量;
[0086]D',表示第i個詞匯在所述第一語言版本系統(tǒng)中的當前密度值。
[0087]可選地,在本實施例的一個可能的實現(xiàn)方式中,在103之前,還可以進一步獲得所述每個詞匯在所述第二語言版本系統(tǒng)中的歷史密度值。具體可以利用第二語言版本系統(tǒng)中的歷史頁面文案,獲得所述每個詞匯在所述第二語言版本系統(tǒng)中的歷史密度值。具體的獲得方法,可以參考所述每個詞匯在所述第一語言版本系統(tǒng)中的歷史密度值的獲得方法,詳細描述可以參見前一個可能的實現(xiàn)方式中的相關(guān)內(nèi)容,此處不再贅述。
[0088]可以理解的是,在本實施例的一個可能的實現(xiàn)方式中,在103之前,還可以進一步執(zhí)行上述兩個可能的實現(xiàn)方式中的操作,即獲得所述每個詞匯在所述第一語言版本系統(tǒng)中的歷史密度值,以及獲得所述每個詞匯在所述第二語言版本系統(tǒng)中的歷史密度值。詳細描述可以參見前述兩個可能的實現(xiàn)方式中的相關(guān)內(nèi)容,此處不再贅述。
[0089]本實施例中,在103中,具體可以根據(jù)所述每個詞匯的密度的變化情況,確定所述頁面文案是否存在異?,F(xiàn)象,下面可以例舉幾種但不是全部的可能的實現(xiàn)方式,本實施例對此不進行特別限定。
[0090]可選地,在本實施例的一個可能的實現(xiàn)方式中,在103中,若詞匯在所述第一語言版本系統(tǒng)中的當前密度值大于0,且在所述第一語言版本系統(tǒng)中的歷史密度值為0,則可以確定所述頁面文案是否存在異?,F(xiàn)象。此時,說明待處理的頁面文案中的這個詞匯沒有在第一語言版本系統(tǒng)的歷史頁面文案中出現(xiàn)過,則可以確定風(fēng)險較大。例如,可能是這個詞匯是亂碼,或者也可能是語言翻譯的錯亂等。例如,“手機”這個詞匯之前在第一語言版本系統(tǒng)中已有頁面文案沒有出現(xiàn)過,即“手機”這個詞匯在第一語言版本系統(tǒng)中的歷史密度值為O,而“手機”這個詞匯在第一語言版本系統(tǒng)中待處理的頁面文案中出現(xiàn),即“手機”這個詞匯在第一語言版本系統(tǒng)中的當前密度值則為0.05,說明待處理的頁面文案中的“手機”這個詞匯的風(fēng)險較大。
[0091]可選地,在本實施例的一個可能的實現(xiàn)方式中,在103中,若詞匯在所述第一語言版本系統(tǒng)中的當前密度值大于0,且在所述第二語言版本系統(tǒng)中部分系統(tǒng)中的歷史密度值大于0,則可以確定所述頁面文案是否存在異?,F(xiàn)象。此時,說明待處理的頁面文案中的這個詞匯在兩個語言版本系統(tǒng)或兩個以上語言版本系統(tǒng)出現(xiàn),則可以確定翻譯有問題,因為正常情況下應(yīng)該一個詞匯只出現(xiàn)在一個語言版本系統(tǒng)即語言特定文本,或者出現(xiàn)在全部語言版本系統(tǒng)即公