1.一種數(shù)據(jù)處理方法,其特征在于,所述方法由存儲系統(tǒng)中的備份服務(wù)器執(zhí)行,所述存儲系統(tǒng)中包括所述備份服務(wù)器以及多個存儲器,所述存儲系統(tǒng)中存儲有多個指紋表,所述多個指紋表中記錄有已存儲于所述多個存儲器中的數(shù)據(jù)塊的指紋,所述方法包括:
根據(jù)指紋索引表中的索引指紋以及待存儲數(shù)據(jù)塊的指紋確定第一指紋集合,其中,所述第一指紋集合中包含有第一索引指紋、第二索引指紋,所述第一索引指紋用于代表第一指紋表中的多個指紋,所述第二索引指紋用于代表第二指紋表中的多個指紋,所述待存儲數(shù)據(jù)塊的指紋屬于所述第一索引指紋所代表的多個指紋以及所述第二索引指紋所代表的多個指紋的指紋范圍;
根據(jù)所述第一索引指紋獲得第一指紋表中包含有與所述待存儲數(shù)據(jù)塊的指紋相同的指紋的第一概率,并根據(jù)所述第二索引指紋獲得所述第二指紋表中包含有與所述待存儲數(shù)據(jù)塊的指紋相同的指紋的第二概率,其中,所述第一概率是根據(jù)所述第一索引指紋代表的多個指紋確定的,所述第二概率是根據(jù)所述第二索引指紋代表的多個指紋確定的;
根據(jù)所述第一概率和第二概率確定第二指紋集合,其中,所述第二指紋集合中至少包含有所述第一索引指紋,根據(jù)所述第一索引指紋確定的第一概率不小于預(yù)設(shè)閾值;
獲得所述第一索引指紋所代表的多個指紋與所述待存儲數(shù)據(jù)塊的指紋的匹配結(jié)果。
2.如權(quán)利要求1所述的方法,其特征在于,所述第一指紋表存儲在所述多個存儲器中的第一存儲器中,所述第二指紋表存儲在所述多個存儲器中的第二存儲器中;所述根據(jù)所述第一索引指紋獲得第一指紋表中包含有與所述待存儲數(shù)據(jù)塊的指紋相同的指紋的第一概率,包括:
將所述待存儲數(shù)據(jù)塊的指紋以及所述第一索引指紋發(fā)送至所述第一存儲 器;
接收所述第一存儲器返回的所述第一概率,所述第一概率用于表示在所述第一索引指紋所代表的多個指紋中包含有與所述待存儲數(shù)據(jù)塊的指紋相同的指紋的概率;
所述根據(jù)所述第二索引指紋獲得所述第二指紋表中包含有與所述待存儲數(shù)據(jù)塊的指紋相同的指紋的第二概率,包括:
將所述待存儲數(shù)據(jù)塊的指紋以及所述第二索引指紋發(fā)送至所述第二存儲器;
接收所述第二存儲器返回的所述第一概率,所述第一概率用于表示在所述第二索引指紋所代表的多個指紋中包含有與所述待存儲數(shù)據(jù)塊的指紋相同的指紋的概率。
3.如權(quán)利要求1所述的方法,其特征在于,所述備份服務(wù)器包括輔助存儲器,所述第一指紋表以及所述第二指紋表存儲在所述輔助存儲器中;
所述根據(jù)所述第一索引指紋獲得第一指紋表中包含有與所述待存儲數(shù)據(jù)塊的指紋相同的指紋的第一概率,并根據(jù)所述第二索引指紋獲得所述第二指紋表中包含有與所述待存儲數(shù)據(jù)塊的指紋相同的指紋的第二概率,包括:
將所述待存儲數(shù)據(jù)塊的指紋以及所述第一索引指紋、所述第二索引指紋發(fā)送至所述輔助存儲器;
接收所述輔助存儲器返回的在所述第一索引指紋所代表的多個指紋中包含有與所述待存儲數(shù)據(jù)塊的指紋相同的指紋的所述第一概率,以及在所述第二索引指紋所代表的多個指紋中包含有與所述待存儲數(shù)據(jù)塊的指紋相同的指紋的所述第二概率。
4.如權(quán)利要求1至3任一項所述的方法,其特征在于,所述第一指紋表中的每個指紋包含M位,每個M位指紋包含N個區(qū)間,所述N個區(qū)間中的每個區(qū)間包括M位中連續(xù)的S位,所述N個區(qū)間中任意兩個區(qū)間不重疊,所述N個區(qū)間的位數(shù)之和為M,N為大于或者等于2的自然數(shù),S為自然數(shù);
所述存儲系統(tǒng)中存儲有第一統(tǒng)計表,所述第一統(tǒng)計表包含有所述第一索引指紋所代表的多個指紋在所述N個區(qū)間的數(shù)值的統(tǒng)計信息,所述第一概率的確定方式包括:
根據(jù)所述第一統(tǒng)計表確定ai在所述第一索引指紋所代表的多個指紋的所述第i區(qū)間的數(shù)值中的出現(xiàn)頻次ti,其中,ai為待存儲數(shù)據(jù)塊的指紋的第i個區(qū)間的數(shù)值,i的取值范圍為1至N;
根據(jù)獲得的t1至tN中的最小值確定所述第一概率。
5.如權(quán)利要求1至3任一項所述的方法,其特征在于,所述存儲系統(tǒng)中存儲有第一統(tǒng)計表,所述第一統(tǒng)計表包含所述第一索引指紋所代表的多個指紋的第一區(qū)間的數(shù)值的統(tǒng)計信息,以及所述第一索引指紋所代表的多個指紋的第二區(qū)間的數(shù)值的統(tǒng)計信息,所述第一區(qū)間為各指紋的第h位至第i位的區(qū)間,所述第二區(qū)間為各指紋的第j位至第k位的區(qū)間,其中,h、i、j、k均為自然數(shù),h的值不大于i的值,j的值不大于k的值,所述第一區(qū)間和所述第二區(qū)間不重疊;所述第一概率的確定方式包括:
根據(jù)所述第一統(tǒng)計表確定a在所述第一索引指紋所代表的多個指紋的所述第一區(qū)間的數(shù)值中的出現(xiàn)頻次t1以及b在所述第一索引指紋所代表的多個指紋的所述第二區(qū)間的數(shù)值中出現(xiàn)的頻次t2,其中,a為待存儲數(shù)據(jù)塊的指紋的第h位至第i位的數(shù)值,b為待存儲數(shù)據(jù)塊的指紋的第j位至第k位的數(shù)值;
根據(jù)所述t1和t2中的最小值確定所述第一概率。
6.一種備份服務(wù)器,其特征在于,所述備份服務(wù)器應(yīng)用于存儲系統(tǒng)中,所述存儲系統(tǒng)包括所述備份服務(wù)器以及多個存儲器,所述存儲系統(tǒng)中存儲有多個指紋表,所述多個指紋表中記錄有已存儲于所述多個存儲器中的數(shù)據(jù)塊的指紋,所述備份服務(wù)器包括:
確定模塊,用于根據(jù)指紋索引表中的索引指紋以及待存儲數(shù)據(jù)塊的指紋確定第一指紋集合,其中,所述第一指紋集合中包含有第一索引指紋、第二索引指紋,所述第一索引指紋用于代表第一指紋表中的多個指紋,所述第二索引指 紋用于代表第二指紋表中的多個指紋,所述待存儲數(shù)據(jù)塊的指紋屬于所述第一索引指紋所代表的多個指紋以及所述第二索引指紋所代表的多個指紋的指紋范圍;
獲得模塊,用于根據(jù)所述第一索引指紋獲得第一指紋表中包含有與所述待存儲數(shù)據(jù)塊的指紋相同的指紋的第一概率,并根據(jù)所述第二索引指紋獲得所述第二指紋表中包含有與所述待存儲數(shù)據(jù)塊的指紋相同的指紋的第二概率,其中,所述第一概率是根據(jù)所述第一索引指紋代表的多個指紋確定的,所述第二概率是根據(jù)所述第二索引指紋代表的多個指紋確定的;
所述確定模塊,還用于根據(jù)所述第一概率和第二概率確定第二指紋集合,其中,所述第二指紋集合中至少包含有所述第一索引指紋,根據(jù)所述第一索引指紋確定的第一概率不小于預(yù)設(shè)閾值;
處理模塊,用于獲得所述第一索引指紋所代表的多個指紋與所述待存儲數(shù)據(jù)塊的指紋的匹配結(jié)果。
7.如權(quán)利要求6所述的備份服務(wù)器,其特征在于,所述第一指紋表存儲在所述多個存儲器中的第一存儲器中,所述第二指紋表存儲在所述多個存儲器中的第二存儲器中;
所述獲得模塊具體用于:將所述待存儲數(shù)據(jù)塊的指紋以及所述第一索引指紋發(fā)送至所述第一存儲器;并接收所述第一存儲器返回的所述第一概率,所述第一概率用于表示在所述第一索引指紋所代表的多個指紋中包含有與所述待存儲數(shù)據(jù)塊的指紋相同的指紋的概率;以及
將所述待存儲數(shù)據(jù)塊的指紋以及所述第二索引指紋發(fā)送至所述第二存儲器;并接收所述第二存儲器返回的所述第二概率,所述第二概率用于表示在所述第二索引指紋所代表的多個指紋中包含有與所述待存儲數(shù)據(jù)塊的指紋相同的指紋的概率。
8.如權(quán)利要求6所述的備份服務(wù)器,其特征在于,所述備份服務(wù)器還包括:
輔助存儲器,用于存儲第一指紋表以及所述第二指紋表;
所述獲得模塊具體用于:將所述待存儲數(shù)據(jù)塊的指紋以及所述第一索引指紋、所述第二索引指紋發(fā)送至所述輔助存儲器;接收所述輔助存儲器返回的在所述第一索引指紋所代表的多個指紋中包含有與所述待存儲數(shù)據(jù)塊的指紋相同的指紋的所述第一概率,以及在所述第二索引指紋所代表的多個指紋中包含有與所述待存儲數(shù)據(jù)塊的指紋相同的指紋的所述第二概率。
9.如權(quán)利要求8所述的備份服務(wù)器,其特征在于:
所述第一指紋表中的每個指紋包含M位,每個M位指紋包含N個區(qū)間,所述N個區(qū)間中的每個區(qū)間包括M位中連續(xù)的S位,所述N個區(qū)間中任意兩個區(qū)間不重疊,所述N個區(qū)間的位數(shù)之和為M,N為大于或者等于2的自然數(shù),S為自然數(shù);所述輔助存儲器中還用于存儲第一統(tǒng)計表,所述第一統(tǒng)計表包含所述第一索引指紋所代表的多個指紋的所述N個區(qū)間的數(shù)值的統(tǒng)計信息;
所述輔助存儲器還用于:根據(jù)所述第一統(tǒng)計表確定ai在所述第一索引指紋所代表的多個指紋的所述第i區(qū)間的數(shù)值中的出現(xiàn)頻次ti,其中,ai為待存儲數(shù)據(jù)塊的指紋的第i區(qū)間的數(shù)值,i的取值范圍為1至N,并根據(jù)所t1至tN中的最小值確定所述第一概率。
10.如權(quán)利要求8所述的備份服務(wù)器,其特征在于,所述輔助存儲器還用于存儲第一統(tǒng)計表,所述第一統(tǒng)計表包含所述第一索引指紋所代表的多個指紋的第一區(qū)間的數(shù)值的統(tǒng)計信息,以及所述第一索引指紋所代表的多個指紋的第二區(qū)間的數(shù)值的統(tǒng)計信息,所述第一區(qū)間為各指紋的第h位至第i位的區(qū)間,所述第二區(qū)間為各指紋的第j位至第k位的區(qū)間,其中,h、i、j、k均為自然數(shù),h的值不大于i的值,j的值不大于k的值,所述第一區(qū)間和所述第二區(qū)間不重疊;
所述輔助存儲器還用于:根據(jù)所述第一統(tǒng)計表確定a在所述第一索引指紋所代表的多個指紋的所述第一區(qū)間的數(shù)值中的出現(xiàn)頻次t1以及b在所述第一索引指紋所代表的多個指紋的所述第二區(qū)間的數(shù)值中出現(xiàn)的頻次t2,其中,a為 待存儲數(shù)據(jù)塊的指紋的第h位至第i位的數(shù)值,b為待存儲數(shù)據(jù)塊的指紋的第j位至第k位的數(shù)值;并根據(jù)所述t1和t2中的最小值確定所述第一概率。
11.一種存儲系統(tǒng),其特征在于,包括備份服務(wù)器以及多個存儲器,所述存儲系統(tǒng)中存儲有多個指紋表,所述多個指紋表中記錄有已存儲于所述多個存儲器中的數(shù)據(jù)塊的指紋;
所述備份服務(wù)器用于:
根據(jù)指紋索引表中的索引指紋以及待存儲數(shù)據(jù)塊的指紋確定第一指紋集合,其中,所述第一指紋集合中包含有第一索引指紋、第二索引指紋,所述第一索引指紋用于代表第一指紋表中的多個指紋,所述第二索引指紋用于代表第二指紋表中的多個指紋,所述待存儲數(shù)據(jù)塊的指紋屬于所述第一索引指紋所代表的多個指紋以及所述第二索引指紋所代表的多個指紋的指紋范圍;
根據(jù)所述第一索引指紋獲得第一指紋表中包含有與所述待存儲數(shù)據(jù)塊的指紋相同的指紋的第一概率,并根據(jù)所述第二索引指紋獲得所述第二指紋表中包含有與所述待存儲數(shù)據(jù)塊的指紋相同的指紋的第二概率,其中,所述第一概率是根據(jù)所述第一索引指紋代表的多個指紋確定的,所述第二概率是根據(jù)所述第二索引指紋代表的多個指紋確定的;
根據(jù)所述第一概率和第二概率確定第二指紋集合,其中,所述第二指紋集合中至少包含有所述第一索引指紋,根據(jù)所述第一索引指紋確定的第一概率不小于預(yù)設(shè)閾值;
獲得所述第一索引指紋所代表的多個指紋與所述待存儲數(shù)據(jù)塊的指紋的匹配結(jié)果。
12.如權(quán)利要求11所述的存儲系統(tǒng),其特征在于,所述第一指紋表存儲在所述多個存儲器中的第一存儲器中,所述第二指紋表存儲在所述多個存儲器中的第二存儲器中;所述備份服務(wù)器具體用于:
將所述待存儲數(shù)據(jù)塊的指紋以及所述第一索引指紋發(fā)送至所述第一存儲器;以及接收所述第一存儲器返回的所述第一概率,所述第一概率用于表示在 所述第一索引指紋所代表的多個指紋中包含有與所述待存儲數(shù)據(jù)塊的指紋相同的指紋的概率;
將所述待存儲數(shù)據(jù)塊的指紋以及所述第二索引指紋發(fā)送至所述第二存儲器;以及接收所述第二存儲器返回的所述第一概率,所述第一概率用于表示在所述第二索引指紋所代表的多個指紋中包含有與所述待存儲數(shù)據(jù)塊的指紋相同的指紋的概率;
所述第一存儲器具體用于:接收所述備份服務(wù)器發(fā)送的第一索引指紋以及所述待存儲數(shù)據(jù)塊的指紋,并確定在所述第一索引指紋代表的多個指紋中包含與所述待存儲數(shù)據(jù)塊的指紋相同的指紋的第一概率,并將所述第一概率發(fā)送至所述備份服務(wù)器;
所述第二存儲器具體用于:接收所述備份服務(wù)器發(fā)送的第二索引指紋以及所述待存儲數(shù)據(jù)塊的指紋,并確定在所述第二索引指紋代表的多個指紋中包含與所述待存儲數(shù)據(jù)塊的指紋相同的指紋的第二概率,并將所述第二概率發(fā)送至所述備份服務(wù)器。
13.如權(quán)利要求11或12所述的存儲系統(tǒng),其特征在于,所述第一指紋表中的每個指紋包含M位,每個M位指紋包含N個區(qū)間,所述N個區(qū)間中的每個區(qū)間包括M位中連續(xù)的S位,所述N個區(qū)間中任意兩個區(qū)間不重疊,所述N個區(qū)間的位數(shù)之和為M,N為大于或者等于2的自然數(shù),S為自然數(shù);所述第一存儲器上存儲有第一統(tǒng)計表,所述第一統(tǒng)計表包含所述第一索引指紋所代表的多個指紋的所述N個區(qū)間的數(shù)值的統(tǒng)計信息;
所述第一存儲器具體用于:根據(jù)所述第一統(tǒng)計表確定ai在所述第一索引指紋所代表的多個指紋的所述第i區(qū)間的數(shù)值中的出現(xiàn)頻次ti,其中,ai為待存儲數(shù)據(jù)塊的指紋的第i區(qū)間的數(shù)值,i的取值范圍為1至N;
根據(jù)所t1至tN中的最小值確定所述第一概率。
14.如權(quán)利要求11或12所述的存儲系統(tǒng),其特征在于:所述第一存儲器上存儲有第一統(tǒng)計表,所述第一統(tǒng)計表包含所述第一索引指紋所代表的多個指 紋的第一區(qū)間的數(shù)值的統(tǒng)計信息,以及所述第一索引指紋所代表的多個指紋的第二區(qū)間的數(shù)值的統(tǒng)計信息,所述第一區(qū)間為各指紋的第h位至第i位的區(qū)間,所述第二區(qū)間為各指紋的第j位至第k位的區(qū)間,其中,h、i、j、k均為自然數(shù),h的值不大于i的值,j的值不大于k的值,所述第一區(qū)間和所述第二區(qū)間不重疊;
所述第一存儲器具體用于:
根據(jù)所述第一統(tǒng)計表確定a在所述第一索引指紋所代表的多個指紋的所述第一區(qū)間的數(shù)值中的出現(xiàn)頻次t1以及b在所述第一索引指紋所代表的多個指紋的所述第二區(qū)間的數(shù)值中出現(xiàn)的頻次t2,其中,a為待存儲數(shù)據(jù)塊的指紋的第h位至第i位的數(shù)值,b為待存儲數(shù)據(jù)塊的指紋的第j位至第k位的數(shù)值;
根據(jù)所述t1和t2中的最小值確定所述第一概率。