專(zhuān)利名稱(chēng):備份信息管理的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般地涉及電子信息,更具體地說(shuō),涉及信息管理。
技術(shù)背景一般通過(guò)調(diào)度備份設(shè)置數(shù)目(諸如每天一個(gè)備份)來(lái)使用計(jì)算機(jī)備 份與恢復(fù)工具。傳統(tǒng)的備份系統(tǒng)的一個(gè)潛在的問(wèn)題是若用戶(hù)需要 恢復(fù)數(shù)據(jù),那么,在最后一次備份之后建立的數(shù)據(jù)一般將被丟失。 需要有效地保護(hù)和管理信息,使得甚至在各預(yù)定備份之間也可以恢 復(fù)所述信息。
在以下的詳細(xì)iJt明和附圖中^^開(kāi)了本發(fā)明的各種不同的實(shí)施例。 圖l是在某些實(shí)施例中用于信息保護(hù)和管理的部件的框圖。 圖2是在某些實(shí)施例中攔截器的框圖。圖3示出在某些實(shí)施例中可以包括在分配器中的路由選擇部件的 實(shí)例。圖4是某些實(shí)施例中用于保護(hù)和管理信息的系統(tǒng)的例圖。 圖5是用于某些實(shí)施例中的SAN(存儲(chǔ)區(qū)網(wǎng)絡(luò))或基于交換的配置 的例圖。
圖6示出某些實(shí)施例中用于信息保護(hù)和管理的系統(tǒng)的另一個(gè)實(shí)例。圖7示出某些實(shí)施例中用于信息保護(hù)和管理的系統(tǒng)的另一個(gè)實(shí)例。圖8A-8C是某些實(shí)施例中保護(hù)和管理信息的方法的流程圖。 圖9是截取和存儲(chǔ)信息的方法的流程圖。 圖IO是某些實(shí)施例中用于存儲(chǔ)器編索引的方法的流程圖。 圖11 A-l 1B是某些實(shí)施例中由日志引擎執(zhí)行的方法的流程圖。 圖12是某些實(shí)施例中用于塊和文件版本控制的方法的流程圖。 圖13是某些實(shí)施例中用于存儲(chǔ)數(shù)據(jù)的恢復(fù)方法的流程圖。 圖14是某些實(shí)施例中用于備份數(shù)據(jù)的方法的流程圖。
具體實(shí)施方式
可以通過(guò)許多途徑來(lái)實(shí)現(xiàn)本發(fā)明,這些途徑包括過(guò)程、裝置、系 統(tǒng)、實(shí)體組合、諸如計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的計(jì)算機(jī)可讀介質(zhì)或其中 通過(guò)光學(xué)或電子通信鏈路發(fā)送程序指令的計(jì)算機(jī)網(wǎng)絡(luò)。在本說(shuō)明書(shū) 中,這些實(shí)現(xiàn)或本發(fā)明可以采用的任何其它形式可以稱(chēng)作技術(shù)???以在本發(fā)明的范圍內(nèi)改變所公開(kāi)的處理過(guò)程的步驟次序。下面與舉例說(shuō)明本發(fā)明原理的附圖 一起,提供對(duì)本發(fā)明的一個(gè)或多個(gè)實(shí)施例的詳細(xì)說(shuō)明。聯(lián)系這樣的實(shí)施例來(lái)描述本發(fā)明,但是本 發(fā)明不限于任何實(shí)施例。本發(fā)明的范圍僅僅受權(quán)利要求書(shū)限制,并 且本發(fā)明包括許多可供選擇的方案,修改和等效物。為了提供對(duì)本 發(fā)明的透徹理解,在以下的描述中提出許多具體細(xì)節(jié)。這些細(xì)節(jié)是 為舉例說(shuō)明的目的而設(shè)置的,可以在沒(méi)有某些或全部具體細(xì)節(jié)的情 況下按照權(quán)利要求書(shū)來(lái)實(shí)施本發(fā)明。為了清晰的目的,對(duì)在涉及本 發(fā)明的技術(shù)領(lǐng)域中已知的技術(shù)資料不作詳細(xì)描述,以免不必要地使 本發(fā)明的闡述不清晰。圖1是某些實(shí)施例中用于信息保護(hù)和管理的部件的框圖。當(dāng)結(jié)合圖2和3討論時(shí)可以較好地理解圖1。圖2是某些實(shí)施例中攔截器的 框圖。圖3示出某些實(shí)施例中可以包括在分配器中的路由選擇部件 的實(shí)例。在圖1所示的實(shí)例中,通過(guò)攔截器102來(lái)監(jiān)視用戶(hù)應(yīng)用程序100。 用戶(hù)應(yīng)用程序的實(shí)例包括文件系統(tǒng)、數(shù)據(jù)庫(kù)和諸如財(cái)政或字處理的 應(yīng)用程序。可以選擇要由攔截器102監(jiān)視的所有應(yīng)用程序或者可以 選擇要監(jiān)視的應(yīng)用程序的子集。攔截器可以截取從應(yīng)用程序至操作 系統(tǒng)的輸入/輸出(1/0)。在某些實(shí)施例中,攔截器102連續(xù)地監(jiān)視來(lái) 自應(yīng)用程序的I/O。在某些實(shí)施例中,若攔截器102駐留在主機(jī)上,那么,可以在把 信息寫(xiě)入到存儲(chǔ)器之前捕獲所述信息。若攔截器102駐留在SAN中, 那么,可以在操作系統(tǒng)準(zhǔn)備把信息寫(xiě)入存儲(chǔ)器的時(shí)候捕獲所述信息。 若攔截器102處在NAS中或在TCP/IP(傳輸控制協(xié)議/網(wǎng)間協(xié)議)交換 上,那么,可以截取TCP/IP包。在圖2所示的實(shí)例中,把攔截器102'表示為包括文件攔截器200、 協(xié)議包攔截器202和塊攔截器204。在某些實(shí)施例中,攔截器102'中 僅僅包括攔截器部件200-204中的一個(gè)。在某些實(shí)施例中,攔截器102' 中包括攔截器部件200-204中的兩個(gè)或兩個(gè)以上。在一個(gè)實(shí)施例中,攔截器102'駐留在主機(jī)上并且利用可以俘獲文 件I/O并根據(jù)文件I/O產(chǎn)生元信息的文件攔截器。在另 一個(gè)實(shí)施例中, 攔截器102'駐留在NAS中并且利用協(xié)議包攔截器,該協(xié)議包攔截器 在EP平臺(tái)中伴獲信息包,諸如NFS、 CIFS或iSCSI包。在另一個(gè)實(shí) 施例中,扭截器102'或者駐留在SAN中或者駐留在主機(jī)上并且利用 可以截取對(duì)數(shù)據(jù)塊的改變的塊攔截器。隨后將結(jié)合圖12討論利用文 件攔截器200和塊攔截器204的進(jìn)一步的細(xì)節(jié)?;氐綀D1,攔截器102可以產(chǎn)生表示重大信息事件的元信息包(本 文中稱(chēng)作里程碑標(biāo)記)。本文中使用的元信息包括關(guān)于信息的信息。 可以觸發(fā)里程碑標(biāo)記的事件的實(shí)例包括建立文件、刪除文件和備份
里程碑標(biāo)記??梢允褂脗浞堇锍瘫畼?biāo)記的時(shí)間的實(shí)例是按照預(yù)置時(shí) 間表插入備份標(biāo)記的時(shí)間。另 一個(gè)實(shí)例是適時(shí)地使用里程碑標(biāo)記的 時(shí)間,諸如系統(tǒng)靜止并且可以確定為良好的恢復(fù)數(shù)據(jù)的時(shí)刻的時(shí)間。在某些實(shí)施例中,攔截器102接收信息,把它放入一個(gè)或多個(gè)包 中,并把它傳到分配器104。分配器104可以接收包并且按照各種不同的路由選擇方案把它們 發(fā)送到日志采集器106。分配器104可以使用的不同路由選擇方案的 實(shí)例包括網(wǎng)絡(luò)路由選擇和SAN路由選擇。在圖3所示的實(shí)例中,把分配器104'表示成包括網(wǎng)絡(luò)路由選擇部 件250和SAN路由選擇部件252。在某些實(shí)施例中,分配器104'可 以包括單個(gè)路由選擇部件,諸如網(wǎng)絡(luò)路由選擇250或SAN路由選擇 252。在某些實(shí)施例中,分配器104'可以包括一個(gè)以上路由選擇部件, 諸如網(wǎng)絡(luò)路由選擇250和SAN路由選擇252??梢杂删W(wǎng)絡(luò)路由選擇 部件250使用的協(xié)議的實(shí)例包括RPC、 TCP/IP和iSCSI??梢杂蒘AN 路由選擇部件252使用的協(xié)議的實(shí)例包括SCSCI和光纖信道協(xié)議 (FCP)?;氐綀D1,分配器104可以是遠(yuǎn)離攔截器102設(shè)置的或者是攔截 器102的本地部件。因此,圖1中舉例說(shuō)明的信息保護(hù)和管理技術(shù) 可以應(yīng)用于由應(yīng)用程序100使用的任何操作系統(tǒng)并且可適應(yīng)于任何 網(wǎng)絡(luò)配置。分配器104把信息發(fā)送到日志采集器106。在某些實(shí)施例中,日 志釆集器106轉(zhuǎn)換所截取的包并且將它們標(biāo)準(zhǔn)化,使得這些包的進(jìn) 一步的存儲(chǔ)和管理與攔截器102和分配器104的類(lèi)型無(wú)關(guān)。在某些 實(shí)施例中,日志采集器可以把接收到的信息轉(zhuǎn)換成元信息并且濾出 有效信息。還可以利用諸如XML或XDR的技術(shù)把它標(biāo)準(zhǔn)化成預(yù)定 的格式。例如,分配器104能以TCP/IP格式發(fā)送包,而日志采集器 106可以把TCP/IP包轉(zhuǎn)換成預(yù)定的格式、諸如XML??梢园褦r截器102、分配器104和日志采集器106結(jié)合到高性能 現(xiàn)有部件中,諸如路由器和多協(xié)議交換機(jī)中(諸如由Cisco或Brocade 制造的路由器和多協(xié)議交換機(jī))??梢园研畔⒋鎯?chǔ)在永久存儲(chǔ)器110中,示出的永久存儲(chǔ)器110包 括多個(gè)存儲(chǔ)器112A-112F(包括元數(shù)據(jù)庫(kù)112A.)。在某些實(shí)施例中, 把數(shù)據(jù)存儲(chǔ)在存儲(chǔ)器112B-112F中,同時(shí),把與所述數(shù)據(jù)相關(guān)聯(lián)的 元數(shù)據(jù)存儲(chǔ)在元數(shù)據(jù)庫(kù)IUA.中。永久存儲(chǔ)器110可以是具有處理能 力的智能永久存儲(chǔ)器。日志采集器106可以利用高速緩沖存儲(chǔ)器108和/或永久存儲(chǔ)器 110與日志引擎114通信。在某些實(shí)施例中,永久存儲(chǔ)器110是智能數(shù)據(jù)存儲(chǔ)裝置,所述智 能數(shù)據(jù)存儲(chǔ)裝置可以給與存儲(chǔ)的數(shù)據(jù)有關(guān)的并且給數(shù)據(jù)信息編索引 (諸如涉及所述存儲(chǔ)的數(shù)據(jù)的時(shí)間和版本)的版本信息加注解并且更新 所述版本信息。永久存儲(chǔ)器110還可以與虛擬化存儲(chǔ)器諸如虛擬的 LUN —起工作。它也可以作為可以與各種不同的實(shí)現(xiàn)一起工作的多 版本信息系統(tǒng),諸如利用各種不同技術(shù)的文件系統(tǒng)或?qū)ο蟠鎯?chǔ)器。 例如,可以通過(guò)以下方法來(lái)實(shí)現(xiàn)這個(gè)特征添加可插才莫塊和層以便 支持版本控制,諸如由Carnegie Mellon University開(kāi)發(fā)的全面的版本 控制文件系統(tǒng)(CVFS)、 Reiser4 FS或版本控制FS??梢杂脕?lái)實(shí)現(xiàn)多 版本控制信息系統(tǒng)的技術(shù)的另 一個(gè)實(shí)例是在"有效的多版本訪(fǎng)問(wèn)結(jié)構(gòu) "("An Efficient Multiversion Access Structure"作者Peter J. Varman, Rakesh M. Verma , IEEE Transactions on Knowledge and Data Engineering , Vol.9 No.3,pp391-409,May/June 1997)中描述的多版本 訪(fǎng)問(wèn)結(jié)構(gòu)。永久存儲(chǔ)器110可以使用任何存儲(chǔ)介質(zhì),諸如SATA、 ATA、 SCSI和FC盤(pán)。曰志引擎114可以管理存儲(chǔ)在永久存儲(chǔ)器110中的信息。日志引 擎114可以包括響應(yīng)用戶(hù)請(qǐng)求的查詢(xún)處理引擎。它還可以確定并保存 特定數(shù)據(jù)的副本數(shù)目、那些副本位于何處以及建立各種不同的版本 的時(shí)間。
日志引擎114還可以包括實(shí)施諸如企業(yè)策略或SEC順應(yīng)策略的 策略的策略引擎。例如,日志引擎114可以管理可以存儲(chǔ)多少數(shù)據(jù)版 本、何時(shí)把數(shù)據(jù)移到另一個(gè)存儲(chǔ)裝置、保留特定文檔的多少副本等 等。它還可以保存原始數(shù)據(jù)源信息,諸如什么程序建立所述數(shù)據(jù)和 它的各種不同特性,諸如誰(shuí)建立它、什么時(shí)間建立它、它的大小以 及與所述數(shù)據(jù)相關(guān)聯(lián)的存儲(chǔ)器實(shí)體和存儲(chǔ)堆棧才莫式,諸如文件系統(tǒng)、 巻管理器或LUNS。日志引擎114還可以管理里程碑標(biāo)記,例如通過(guò) 把標(biāo)記登記在永久存儲(chǔ)器中并確定所述里程碑標(biāo)記意味著什么。例 如,里程碑標(biāo)記可以表示良好的備份時(shí)刻或者它可以表示有意義版 本。日志引擎114還可以保存元數(shù)據(jù)信息。這樣的元數(shù)據(jù)信息的實(shí)例 包括如下信息諸如已經(jīng)由特定文檔構(gòu)成兩^f分副本以及其中的一份 已經(jīng)在什么時(shí)間和由誰(shuí)刪除。日志引擎114還可以管理用于存儲(chǔ)優(yōu)化的日志壓縮以及特定數(shù)據(jù) 的管理加密。日志引擎114還可以管理虛擬快照,以便使用戶(hù)可以》見(jiàn) 看任何時(shí)刻的數(shù)據(jù)。能以各種不同格式,諸如NFS、 CIFS文件系統(tǒng) 或作為L(zhǎng)UN提供虛擬快照選項(xiàng)。例如,若用戶(hù)請(qǐng)求查看2:00p.m.的 D驅(qū)動(dòng)器,那么,日志引擎114可以在2:00p.m.從永久存儲(chǔ)器IIO(必 要時(shí),為了優(yōu)化的目的從各種不同的輔助存儲(chǔ)器(如果數(shù)據(jù)已經(jīng)移到 這些裝置的話(huà)))為D驅(qū)動(dòng)器構(gòu)建完整的數(shù)據(jù)組。隨后將結(jié)合其余附圖 討論日志引擎114的進(jìn)一步的細(xì)節(jié)。虛擬存取接口 116能以各種不同格式諸如LUN、文件系統(tǒng)、或 網(wǎng)絡(luò)文件系統(tǒng)或應(yīng)用對(duì)象向用戶(hù)提供請(qǐng)求信息。虛擬存取^:口 116可 以結(jié)合服務(wù)和管理控制臺(tái)118(服務(wù)和管理控制臺(tái)可以起諸如圖形用 戶(hù)接口的用戶(hù)接口的作用)來(lái)工作,以便使用戶(hù)可以設(shè)置策略、配置、 查詢(xún)選擇和用于瀏覽和恢復(fù)的與用戶(hù)連接的通用接口 。圖4是某些實(shí)施例中用于保護(hù)和管理信息的系統(tǒng)的例圖。在該實(shí) 例中,示出的應(yīng)用服務(wù)器300A與局域網(wǎng)308A耦合。示出的所述應(yīng) 用服務(wù)器還與主存儲(chǔ)系統(tǒng)304A耦合。示出的局域網(wǎng)308A還與數(shù)據(jù) 保護(hù)設(shè)備302A耦合。數(shù)據(jù)保護(hù)設(shè)備302A可以是能夠托管圖4的至 少一個(gè)數(shù)據(jù)保護(hù)部件102-110的任何處理機(jī)。示出的數(shù)據(jù)保護(hù)設(shè)備 302A還與存儲(chǔ)器306A耦合。存儲(chǔ)器306A可以是包括多個(gè)存儲(chǔ)裝置 的 <呆護(hù)室(protection vault)。在某些實(shí)施例中,攔截器102和分配器104可以駐留在應(yīng)用服務(wù) 器300A中。日志采集器106、日志引擎114和永久存儲(chǔ)器110可以 駐留在數(shù)據(jù)保護(hù)設(shè)備中。另外,虛擬存取接口 116(圖1中)以及月良務(wù) 和管理控制臺(tái)118(也在圖1中)可以駐留在數(shù)據(jù)保護(hù)設(shè)備302A中。 在另一個(gè)實(shí)例中,攔截器102可以駐留在主存儲(chǔ)系統(tǒng)304A中。 圖5是用于某些實(shí)施例中的SAN或基于交換的配置的例圖。在 該實(shí)例中,示出的局域網(wǎng)308B與應(yīng)用服務(wù)器300B以及數(shù)據(jù)保護(hù)設(shè) 備302B耦合。示出的應(yīng)用服務(wù)器300B和數(shù)據(jù)保護(hù)設(shè)備302B兩者 都與交換機(jī)320耦合。示出的交換機(jī)320與存儲(chǔ)系統(tǒng)304B和保護(hù)室 306B耦合。在一種變型中,數(shù)據(jù)保護(hù)設(shè)備302B可以直接與保護(hù)室 306B耦合。在某些實(shí)施例中,攔截器102、分配器104和日志采集器106可 以駐留在交換機(jī)320中。日志引擎114和永久存儲(chǔ)器110可以駐留在 數(shù)據(jù)保護(hù)設(shè)備302B中。在某些實(shí)施例中,攔截器102、分配器104和日志采集器106可 以駐留在存儲(chǔ)系統(tǒng)304B中。在某些實(shí)施例中,日志采集器可以駐留 在數(shù)據(jù)保護(hù)設(shè)備302B中。在某些實(shí)施例中,攔截器102、分配器104 和曰志采集器106可以駐留在應(yīng)用服務(wù)器300B中。圖6示出某些實(shí)施例中用于信息保護(hù)和管理的系統(tǒng)的另一個(gè)實(shí) 例。在該實(shí)例中,示出應(yīng)用服務(wù)器300C與局域網(wǎng)308C耦合,示出 局域網(wǎng)308C與網(wǎng)絡(luò)附加存儲(chǔ)器330A和數(shù)據(jù)保護(hù)設(shè)備302C耦合。 示出數(shù)據(jù)保護(hù)設(shè)備302C與保護(hù)室306C耦合。在某些實(shí)施例中,攔截器102、分配器104、日志采集器106、 日志引擎114和永久存儲(chǔ)器110也可以駐留在數(shù)據(jù)保護(hù)設(shè)備302C中。
在其他實(shí)施例中,攔截器102和分配器104可以駐留在應(yīng)用服務(wù)器 300C中,而日志采集器106、日志引擎114和永久存儲(chǔ)器110駐留 在數(shù)據(jù)保護(hù)設(shè)備302C中。在其他實(shí)施例中,攔截器102、分配器104 和日志采集器106可以駐留在網(wǎng)絡(luò)附加存儲(chǔ)器330A中,而日志引擎 114和永久存儲(chǔ)器110駐留在數(shù)據(jù)保護(hù)設(shè)備302C中。在還有另一些 實(shí)施例中,攔截器102、分配器104和日志采集器106可以駐留在應(yīng) 用服務(wù)器300C中。在還有另一些實(shí)施例中,交換機(jī)(未示出)也可以 與局域網(wǎng)308C耦合,并且所述交換機(jī)可以使攔截器102和分配器104 駐留在它里面。圖7示出某些實(shí)施例中用于信息保護(hù)和管理的系統(tǒng)的另一個(gè)實(shí) 例。在該實(shí)例中,示出局域網(wǎng)308D與多個(gè)應(yīng)用服務(wù)器300D-300E以 及數(shù)據(jù)保護(hù)設(shè)備302D和網(wǎng)絡(luò)附加存儲(chǔ)器330B耦合。示出應(yīng)用服務(wù) 器300D和數(shù)據(jù)保護(hù)設(shè)備302D與交換機(jī)340耦合,示出交換機(jī)340 與存儲(chǔ)器306D和304D耦合。在某些實(shí)施例中,全部保護(hù)部件102-114可以駐留在數(shù)據(jù)保護(hù)設(shè) 備302D中。在其他實(shí)施例中,攔截器102和分配器104可以駐留在 應(yīng)用服務(wù)器300D-E之一中。在其他實(shí)施例中,攔截器102、分配器 104和日志采集器106可以駐留在交換機(jī)340中。在還有另一些實(shí)施 例中,局域網(wǎng)交換機(jī)(未示出)可以與局域網(wǎng)308D耦合,而攔截器102 和分配器104可以駐留在局域網(wǎng)交換機(jī)中。圖4-7中所描述的系統(tǒng)僅僅是可能的配置的實(shí)例。在其他實(shí)施例 中設(shè)想另一些配置,包括駐留在裝置的任何組合中的保護(hù)部件102-114 的任何組合。圖8A-8C是某些實(shí)施例中用于保護(hù)和管理信息的方法的流程圖。 在該實(shí)例中,連續(xù)地監(jiān)視從應(yīng)用程序到操作系統(tǒng)400的輸入/輸出 (I/O)。在步驟402,截取所述I/0。例如,若要連續(xù)地監(jiān)視驅(qū)動(dòng)器D, 那么,截取從驅(qū)動(dòng)器D中的應(yīng)用程序到操作系統(tǒng)的I/O。類(lèi)似地,若 要監(jiān)視特定文件,那么,連續(xù)地監(jiān)視并截取與所述文件相關(guān)聯(lián)的I/O。
在某些實(shí)施例中,在404,確定是否已經(jīng)建立有意義版本。例如, 若用戶(hù)正在處理文字文檔,那么,可以連續(xù)地監(jiān)^L并截取對(duì)所述文 字文檔的改變。確定對(duì)所述文檔的這種特定改變是不是有意義版本。 有意義版本的一個(gè)實(shí)例是,當(dāng)用戶(hù)進(jìn)行改變時(shí),保存所述改變并且 關(guān)閉所述文檔。若在404確定這是一個(gè)有意義版本,那么,在406,保存所述數(shù) 據(jù)和元數(shù)據(jù)。本文中使用的元數(shù)據(jù)是指與所述數(shù)椐有關(guān)的信息。元 數(shù)據(jù)的實(shí)例包括建立所述數(shù)據(jù)的時(shí)間、誰(shuí)建立所述數(shù)據(jù)、所述數(shù)據(jù) 與什么應(yīng)用程序相關(guān)聯(lián)等等。然后,在408,更新和保存存儲(chǔ)元數(shù)據(jù)。 本文中使用的存儲(chǔ)元數(shù)據(jù)是指存儲(chǔ)的與數(shù)據(jù)有關(guān)的信息。存儲(chǔ)元數(shù) 據(jù)的實(shí)例包括所述數(shù)據(jù)的存儲(chǔ)位置、已經(jīng)存儲(chǔ)這種特定數(shù)據(jù)的多少 份副本、已經(jīng)存儲(chǔ)這種文檔或文件的多少種版本等等。在410,也可以確定這種截取的I/O是不是里程碑。本文中使用 的里程碑是指重大信息事件,諸如文件的建立、文件的刪除和制作 備份的良好時(shí)刻。若在410確定是里程碑事件,那么,在412,把里 程碑標(biāo)記與所述數(shù)據(jù)相關(guān)聯(lián)。在422,還可以確定是否要存入高性能介質(zhì)中。例如,可以把特 定文件指定為足夠重要而總是存儲(chǔ)在高性能介質(zhì)中,或者可以指定 某些類(lèi)型的文檔,諸如PowerPoint Presentations(高級(jí)技巧演示)總是 被存儲(chǔ)在較低性能介質(zhì)中。因此,若在422確定這種數(shù)椐不應(yīng)當(dāng)被 存儲(chǔ)在高性能介質(zhì)中,那么,在424 ,將其存儲(chǔ)在較低性能介質(zhì)中。 但是,若確定應(yīng)當(dāng)將其存儲(chǔ)在高性能介質(zhì)中,那么,在426,將其存 儲(chǔ)在高性能介質(zhì)中。然后,在428更新存儲(chǔ)元數(shù)據(jù),以便指示所述 數(shù)據(jù)在所述存儲(chǔ)介質(zhì)中的位置。在414,還可以確定數(shù)據(jù)是否正在定期改變??梢詫⒍ㄆ诨蝾l繁 改變的級(jí)別配置為一種策略,以便確定在什么利用率條件下應(yīng)當(dāng)把 文件存儲(chǔ)在較低性能的低成本存儲(chǔ)器中。若數(shù)據(jù)不是定期改變的, 那么,在416,可以將它移到低成本的低性能存儲(chǔ)器中。但是,若在414確定數(shù)據(jù)是定期改變的,那么,在420,將所述數(shù)據(jù)保存在高性 能存儲(chǔ)器中。在450,還可以確定是否正在刪除文件。若截取的I/O用于刪除 文件,那么,在456確定策略是否允許刪除這個(gè)文件。若預(yù)定的策 略不允許刪除這個(gè)文件,那么,在458保存所述文件的副本。例如, 企業(yè)策略或SEC策略可能要求在若干年內(nèi)保存所有財(cái)政文檔。若用 戶(hù)正企圖刪除的文件是財(cái)政文檔,那么,可以在所述用戶(hù)的計(jì)算機(jī) 中刪除所述文件,但是可以把所述文件的副本保存在低性能歸檔存 儲(chǔ)器中。若在456,策略允許刪除這個(gè)文件,那么,在460刪除所述文件。 在462,還可以確定,當(dāng)在用戶(hù)機(jī)器上刪除所述文件時(shí)所述策略是否 指示刪除所述文件的所有副本和版本。若策略未指示刪除所有副本 和版本,那么,在464保存所述文件的副本和版本。但是,若在462 策略指示刪除所有副本和版本,那么,在466,刪除所述文件的所有 副本和版本。例如,若用戶(hù)刪除PowerPoint Presentation(高級(jí)技巧演 示)并且存在10個(gè)所述演示的保存版本,那么,當(dāng)用戶(hù)刪除當(dāng)前演示 時(shí),將刪除所有IO個(gè)保存的版本。在468,還可以^定策略是否要求特定的動(dòng)作,如果是的話(huà),在 470,可以按照策略執(zhí)行所述動(dòng)作。例如,公司可以有把所有電子郵 件保存在特定電子郵件庫(kù)的策略。在所述實(shí)例中,將確定截取的I/O 是否與電子郵件有關(guān),若是有關(guān),則將它保存在規(guī)定的電子郵件庫(kù) 內(nèi)。圖9是某些實(shí)施例中用于截取并存儲(chǔ)信息的方法的流程圖。在這 個(gè)實(shí)例中,在500,截取從應(yīng)用程序到操作系統(tǒng)的I/O。在502,產(chǎn) 生元數(shù)據(jù)包。元數(shù)據(jù)的實(shí)例包括發(fā)生改變的時(shí)間、所述改變發(fā)生在 哪個(gè)應(yīng)用程序中以及所述改變發(fā)生在哪個(gè)計(jì)算才幾系統(tǒng)中。在504,確 定該事件是不是里程碑。若它是里程碑,那么,在506,將里程碑標(biāo) 記包括在元數(shù)據(jù)包中。
在508,還確定是否應(yīng)當(dāng)借助于網(wǎng)絡(luò)路由選擇協(xié)議發(fā)送數(shù)據(jù)和元 數(shù)據(jù)包。若不應(yīng)當(dāng)借助于網(wǎng)絡(luò)路由選擇協(xié)議發(fā)送它,那么,在該實(shí) 例中,在510,利用SAN路由選擇協(xié)議或共享存儲(chǔ)器策略來(lái)發(fā)送所 述包。但是,若在508應(yīng)當(dāng)使用網(wǎng)絡(luò)路由選擇協(xié)議,那么,在512, 網(wǎng)絡(luò)路由選擇協(xié)議用來(lái)發(fā)送所述包。在某些實(shí)施例中,把所述包發(fā) 送到日志采集器,諸如圖1的日志采集器106。在514,可以將包轉(zhuǎn)換成所需格式。例如,可以將包變換成XML 并且將其以FC包格式發(fā)送到存儲(chǔ)介質(zhì)。然后,在516存儲(chǔ)所述包。圖10是某些實(shí)施例中用于存儲(chǔ)器編索引的方法的流程圖。在該 實(shí)例中,在600,接收用于存儲(chǔ)的數(shù)據(jù)包。在602,確定這些包是不 是元數(shù)據(jù)。若在602所述包是元數(shù)據(jù),那么,在604,把包存儲(chǔ)在元 數(shù)據(jù)庫(kù)中。若在602所迷包不是元數(shù)據(jù),那么,在606,確定是否已 經(jīng)有這個(gè)文件的副本。如本文中使用的文件是指任何數(shù)據(jù)組,諸如 文件、文檔、Excel電子數(shù)據(jù)#^、數(shù)據(jù)庫(kù)或文件系統(tǒng)或目錄。然后,在606確定是否已經(jīng)有這種數(shù)據(jù)的副本。若在606已經(jīng)有 存儲(chǔ)在存儲(chǔ)介質(zhì)中的副本,那么,在608,在存儲(chǔ)器索引中更新副本 信息和存儲(chǔ)位置。在某些實(shí)施例中,保存存儲(chǔ)器索引,所述存儲(chǔ)器 索引包括諸如以下信息存儲(chǔ)多少份文件副本、存儲(chǔ)多少個(gè)文件版 本、以及這些副本和版本中的每一個(gè)的存儲(chǔ)位置。在610,還可以確定是否有這種數(shù)據(jù)的老版本。若有老版本,那 么.,在612,在存儲(chǔ)器索引中更新各種不同版本的版本信息和存儲(chǔ)位 置。在614,還可以確定這些接收到的包是否表明正在刪除文件。若 正在刪除,那么,在616,更新正在4皮刪除的副本或版本的存儲(chǔ)器索 引。在某些實(shí)施例中,跟蹤這種類(lèi)型的信息便于應(yīng)答涉及存儲(chǔ)數(shù)據(jù)的 查詢(xún)以及協(xié)助SEC順應(yīng)(compliance)或企業(yè)策略順應(yīng)。圖11A-11B是某些實(shí)施例中通過(guò)日志引擎執(zhí)行的方法的流程圖。
在該實(shí)例中,在700確定是否已經(jīng)達(dá)到最大的版本數(shù)目。例如,策 略可以規(guī)定,可以保存文檔的最多10個(gè)版本。若已經(jīng)達(dá)到最大的版 本數(shù)目,那么,在該實(shí)例中,在702刪除最老的版本。
在704,還可以確定,這種特定情況是不是良好的恢復(fù)點(diǎn)。良好 的恢復(fù)點(diǎn)的一個(gè)實(shí)例是所有或大部分應(yīng)用程序都未在使用中或處在 靜止?fàn)顟B(tài)的時(shí)候,諸如半夜,系統(tǒng)中幾乎沒(méi)有改變的時(shí)候?;謴?fù)點(diǎn) 的另一個(gè)實(shí)例是預(yù)定的恢復(fù)點(diǎn),諸如預(yù)定每隔兩小時(shí)一次的恢復(fù)點(diǎn)。
在某些實(shí)施例中,若在704這種情況是恢復(fù)點(diǎn),那么,在706可 以使應(yīng)用程序靜止。當(dāng)使應(yīng)用程序靜止時(shí),在這段時(shí)間內(nèi)保存I/O, 以便獲得可以制作備份的清楚點(diǎn)。在某些實(shí)施例中,此時(shí)不制作備 份。在708,使應(yīng)用程序靜止并且設(shè)置備份里程碑標(biāo)記。在某些實(shí)施 例中,因?yàn)椴蛔鰧?shí)際的備份,所以,可以快速和有效地完成使應(yīng)用 程序靜止和設(shè)置備份里程碑標(biāo)記的操作。
在710,還可以確定特定的存儲(chǔ)數(shù)據(jù)是不是老的存儲(chǔ)數(shù)據(jù)??梢?在策略中規(guī)定認(rèn)為數(shù)據(jù)是老的數(shù)椐的年齡。例如,可以規(guī)定一個(gè)星 期前的數(shù)據(jù)是老的數(shù)據(jù)。若數(shù)據(jù)是老的數(shù)據(jù),那么,在712可以將 其歸檔到較4氐性能存儲(chǔ)器中。在750,還可以確定永久存儲(chǔ)器中的數(shù)據(jù)是否已經(jīng)達(dá)到預(yù)定的空 間量。在某些實(shí)施例中,若存儲(chǔ)的數(shù)據(jù)已經(jīng)填充預(yù)定的空間量,那 么,在752,可以將數(shù)據(jù)移到較低性能存儲(chǔ)器中。在某些實(shí)施例中, 可以對(duì)移到較低性能存儲(chǔ)器的數(shù)據(jù)設(shè)置優(yōu)先級(jí),使得某些類(lèi)型的數(shù) 據(jù)在其它類(lèi)型的數(shù)椐之前被移到較低性能存儲(chǔ)器中。例如,可以在 電子郵件之前將PowerPoint Presentations(高級(jí)技巧演示)移到較低性 能存儲(chǔ)器,又可以在Word文檔之前將電子郵件移到較低性能存儲(chǔ)器。
在754,還可以確定存儲(chǔ)的數(shù)據(jù)是不是機(jī)密的。若數(shù)據(jù)^^機(jī)密的, 那么,在756,可以將加密應(yīng)用于這樣的數(shù)據(jù)。在758,還可以確定存儲(chǔ)的數(shù)據(jù)是不是可壓縮的。若某些數(shù)椐是 可壓縮的,那么,在760,可以將壓縮過(guò)程應(yīng)用于這樣的數(shù)據(jù)。
圖12是某些實(shí)施例中用于塊和文件版本控制的方法的流程圖。 在該實(shí)例中,在800確定是否執(zhí)行文件版本控制。若應(yīng)當(dāng)出現(xiàn)文件 版本控制,那么,在802,標(biāo)識(shí)要監(jiān)視的文件。例如,可以將整個(gè)文 件系統(tǒng)指定為要監(jiān)視的,或者,可以將特定文件或文件組標(biāo)識(shí)為要 監(jiān)^L的。然后,在804,監(jiān)視并截取選定文件的塊改變。然后保存這 些改變,以便使所述改變與已經(jīng)進(jìn)行所述改變的文件相關(guān)聯(lián)。若在800確定不應(yīng)當(dāng)出現(xiàn)文件版本控制,那么,在808,識(shí)別要 監(jiān)視的數(shù)據(jù)塊。在某些實(shí)施例中,要監(jiān)視的數(shù)據(jù)塊與數(shù)據(jù)關(guān)聯(lián)的文 件無(wú)關(guān)。然后,在810,監(jiān)視并截取這些塊的改變。在812,保存這 些塊的改變并且還更新與這些改變相關(guān)聯(lián)的元數(shù)據(jù)。與改變的塊相 關(guān)聯(lián)的元數(shù)據(jù)的實(shí)例包括哪些文件與數(shù)據(jù)塊相關(guān)聯(lián)。在814,可以利 用保存的元數(shù)據(jù)重構(gòu)保存的塊屬于的那些文件。因此,可以執(zhí)行塊和文件版本控制??梢酝ㄟ^(guò)利用文件或塊或兩 者的組合選擇適當(dāng)?shù)牟呗詫⑵渑渲脼榻⑦^(guò)程的一部分。圖13是某些實(shí)施例中用于恢復(fù)存儲(chǔ)數(shù)據(jù)的方法的流程圖。在該 實(shí)例中,在900接收觀看文件的請(qǐng)求。例如,可能接收到觀看名為 D: /A.Tex的文件的請(qǐng)求。在902,可以找到具有里程碑特性的多個(gè) 版本。例如,可以在永久存儲(chǔ)器、諸如圖1的永久存儲(chǔ)器110中搜索 請(qǐng)求的文件的多個(gè)版本。還找到與那些版本相關(guān)聯(lián)的里程碑特性。 所述里程碑特性的實(shí)例包括版本的日期和時(shí)間。在904,可以顯示具有其里程碑特性的這些版本。因此,用戶(hù)可 以觀看具有時(shí)間、版本和表示這個(gè)特定版本是備份質(zhì)量版本的靜止 時(shí)刻的版本的列表。然后,在906可以接收到對(duì)恢復(fù)所述版本之一 的請(qǐng)求,并且在908恢復(fù)選定的版本。圖14是某些實(shí)施例中用于建立數(shù)據(jù)的備份的方法的流程圖。在 該實(shí)例中,接收到執(zhí)行備份的請(qǐng)求。然后,在952,定位恢復(fù)點(diǎn)里程 碑標(biāo)記。然后,在954選定恢復(fù)點(diǎn)。例如,可以定位具有恢復(fù)點(diǎn)里 程碑標(biāo)記的版本并且將其向用戶(hù)顯示,而用戶(hù)可以選擇備份的恢復(fù) 點(diǎn)。作為另一方案,在954,可以調(diào)度備份,以便自動(dòng)地選定來(lái)自特 定時(shí)刻的版本。在956,利用存儲(chǔ)元數(shù)據(jù),定位與選定的恢復(fù)點(diǎn)里程碑標(biāo)記相關(guān) 聯(lián)的存儲(chǔ)數(shù)據(jù)。例如,所述存儲(chǔ)元數(shù)據(jù)可以表示選定的數(shù)據(jù)存儲(chǔ)在 什么位置。在該實(shí)例中,在958,利用選定的存儲(chǔ)數(shù)據(jù)執(zhí)行備份。在 某些實(shí)施例中,利用存儲(chǔ)數(shù)據(jù)執(zhí)行備份,允許在正常性能級(jí)別條件 下執(zhí)行應(yīng)用程序。雖然為清楚地理解起見(jiàn)已經(jīng)相當(dāng)詳細(xì)地描述了上述實(shí)施例,但 是,本發(fā)明不限于所提供的細(xì)節(jié)。有許多實(shí)現(xiàn)本發(fā)明的可供選擇的 方法。所述公開(kāi)的實(shí)施例是示范性的而不是限制性的。
權(quán)利要求
1.一種用于信息管理的方法,包括監(jiān)視來(lái)自應(yīng)用程序的輸出,其中基本上連續(xù)監(jiān)視所述輸出;確定所述輸出是否與預(yù)定類(lèi)型的版本相關(guān)聯(lián);以及如果所述輸出與所述預(yù)定類(lèi)型的版本相關(guān)聯(lián)則保存與所述輸出相關(guān)聯(lián)的數(shù)據(jù)。
2. 如權(quán)利要求1所述的方法,其中所述輸出是從所述應(yīng)用程序 至操作系統(tǒng)的輸出。
3. 如權(quán)利要求1所述的方法,其中所述預(yù)定類(lèi)型的版本是有意 義版本。
4. 如權(quán)利要求1所述的方法,其中如果已經(jīng)執(zhí)行了保存和關(guān)閉, 則所述輸出與所述預(yù)定類(lèi)型的版本相關(guān)聯(lián)。
5. 如權(quán)利要求1所述的方法,其中還包括更新存儲(chǔ)元數(shù)據(jù)。
6. 如權(quán)利要求l所述的方法,其中保存數(shù)據(jù)與數(shù)椐保護(hù)相關(guān)聯(lián)。
7. 如權(quán)利要求1所述的方法,其中數(shù)據(jù)保存在駐留有所述應(yīng)用 程序的裝置的外部的介質(zhì)中。
8. 如權(quán)利要求1所述的方法,其中還包括確定所述數(shù)據(jù)是否與 里程碑相關(guān)聯(lián)。
9. 如權(quán)利要求8所述的方法,其中所述里程碑是用于備份的候 選者。
10. 如權(quán)利要求8所述的方法,其中所述里程碑是有意義版本。
11. 一種用于信息管理的系統(tǒng),包括 處理器,所述處理器配置成監(jiān)視來(lái)自應(yīng)用程序的輸出,其中基本上連續(xù)監(jiān)視所述輸出; 確定所述輸出是否與預(yù)定類(lèi)型的版本相關(guān)聯(lián);和 與所述處理器耦合的存儲(chǔ)器,其中所述存儲(chǔ)器配置成如果所述輸出與所述預(yù)定類(lèi)型的版本相關(guān)聯(lián)則保存與所述輸 出相關(guān)聯(lián)的數(shù)據(jù)。
12. 如權(quán)利要求11所述的系統(tǒng),其中所述存儲(chǔ)器遠(yuǎn)離所述處理器。
13. 如權(quán)利要求11所述的系統(tǒng),其中所述存儲(chǔ)器是所述處理器 的本地存儲(chǔ)器。
14. 如權(quán)利要求11所述的系統(tǒng),其中經(jīng)由局域網(wǎng)把所述存儲(chǔ)器 耦合到所述處理器。
15. 如權(quán)利要求11所述的系統(tǒng),其中預(yù)定類(lèi)型的版本是有意義 版本。
16. 如權(quán)利要求11所述的系統(tǒng),其中如果已經(jīng)執(zhí)行了保存和關(guān) 閉,則所述輸出與所述預(yù)定類(lèi)型的版本相關(guān)聯(lián)。
17. —種用于信息管理的計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品包含在計(jì)算機(jī)可讀介質(zhì)中并且包括用于以下操作的計(jì)算機(jī)指令 監(jiān)視來(lái)自應(yīng)用程序的輸出,其中基本上連續(xù)監(jiān)視所述輸出; 確定所述輸出是否與預(yù)定類(lèi)型的版本相關(guān)聯(lián); 如果所述輸出與所述預(yù)定類(lèi)型的版本相關(guān)聯(lián),則保存與所述輸出相關(guān)聯(lián)的數(shù)據(jù)。
18. 如權(quán)利要求17所述的計(jì)算機(jī)程序產(chǎn)品,其中所述預(yù)定類(lèi)型 的版本是有意義版本。
19. 如權(quán)利要求17所述的計(jì)算機(jī)程序產(chǎn)品,其中如果已經(jīng)執(zhí)行 了保存和關(guān)閉,則所述輸出與所述預(yù)定類(lèi)型的版本相關(guān)聯(lián)。
20. 如權(quán)利要求17所述的計(jì)算機(jī)程序產(chǎn)品,其中還包括確定所 述數(shù)據(jù)是否與里程碑相關(guān)聯(lián),以及所述里程碑是用于備份的候選者。
全文摘要
在一個(gè)實(shí)施例中,一種管理信息的方法包括監(jiān)視應(yīng)用程序的輸出,其中基本上連續(xù)監(jiān)視輸出;確定所述輸出是否與預(yù)定類(lèi)型的版本相關(guān)聯(lián);和若所述輸出與所述預(yù)定類(lèi)型的版本相關(guān)聯(lián)則保存與所述輸出相關(guān)聯(lián)的數(shù)據(jù)。
文檔編號(hào)G06F17/30GK101133413SQ200580044663
公開(kāi)日2008年2月27日 申請(qǐng)日期2005年12月19日 優(yōu)先權(quán)日2004年12月31日
發(fā)明者A·考施克, J·J·刑, M·喬施, P·庫(kù)馬, R·敘爾亞納拉亞南, S·佩里亞加拉姆, Y·比亞尼 申請(qǐng)人:Emc公司