如何过滤不需要变形的数据
在典型的重复数据删除技术中,根据不同的数据备份场景选择适合的重删策略与粒度方案。在确定重删策略与粒度后,会根据输入侧不同粒度(卷级、文件级、块级)的数据采取不同的数据切分策略,并依据任务级与全局指纹库提供自适应源端的全局重删算法与策略,当前支持源端块级、文件级重删和并行重删技术。源端重删是采用基于内容的可变长数据切分算法,通过对数据块进行哈希算法的***标记,即指纹(Fingerprint),在指纹库中寻找相同的指纹。如果存在相同指纹,则表示已保存了相同的数据块,ADM则不再保存此数据块,而是引用已存在的数据块,从而节省更多的备份空间。该算法还可以智能识别已修改的数据和未修改的数据,从而避免因修改数据位移而导致的未修改数据切分到新数据块中的问题,比较大限度地提升重删性能和重删率,为避免数据备份过程中冗余网络传输与存储开销,在源端设置粗粒度前置数据校验可以明显缩小备份传输过程中的数据冗余,目的在于不备份任意一个冗余数据。哪个产品支持向导式的敏感数据处理流程?如何过滤不需要变形的数据
并行重删技术是在多个不同的节点上构建指纹库,并将指纹并行分布于多个节点,采用内存级指纹库进行重删,所有指纹读写全部保存于内存中,从而提升指纹查询和处理效率,并且减少了因磁盘中指纹库增大所导致的随机IO压力。以此识别并消除数据备份过程中数据源中重复的数据,该技术适用于不同平台中的文件、数据库、虚拟机等不同应用类型的数据,可以大幅度减少需要传输的数据量,从而极大地节省数据传输带宽,解决单点性能和存储空间压力。能源行业如何选择CDM上讯信息的敏捷数据管理平台ADM产品怎么样?
混合IT环境下兼容性***的数据保护平台ADM***兼容物理服务器、虚拟化、云平台的备份源,降低因混合IT环境而需要多套数据保护方案带来的成本压力和管理复杂性。支持国产化操作系统,支持主流平台下的数据库、文件数据保护,支持主流虚拟化平台的保护,支持国产云平台的保护。通过数据库虚拟化技术快速创建副本实现对备份数据的即时挂载恢复,提供业务应急响应能力和数据快速恢复能力,挂载恢复***缩短了备份数据恢复的时间,可用于验证备份数据的有效性,直接提升了数据恢复验证的频率。同时,ADM可与第三方备份系统对接,改变传统手动编写脚本恢复数据的方式,通过设置定时策略,自动化实现备份数据恢复的有效性验证,**终,协助企业建立***高效的数据保护平台。
ADM产品生产数据备份恢复与异地容灾对生产数据包括数据库、文件、虚拟化平台、容器、云服务器等进行备份,对带库进行数据归档,支持长久增量备份、数据压缩存储、加密传输、重复数据删除等技术,采用挂载恢复方式,恢复时间为分钟级、恢复粒度为秒级。支持数据远程复制实现异地容灾,对备份数据进行双重保护。
ADM产品备份数据自动化恢复与有效性验证ADM可以对接备份系统如NetBackup、CommVault、NetWorker等,检索备份策略自动恢复备份数据和备份文件,完成验证输出结果。全自动化恢复验证,可以满足用户对当前备份数据的可恢复性验证、恢复后的完整性验证,覆盖备份数据和备份文件的恢复,支持虚拟挂载恢复和物理恢复双重方式。 上讯敏捷数据管理平台ADM产品高效压缩存储池,节省大量存储资源。
通过网络远程挂载的方式,ADM将TB量级数据拉起时间控制在分钟级,数据恢复的响应速度极快,有效满足开发测试、查询分析、合规审计、应急恢复等场景对数据交付效率的要求。数据库虚拟化技术可延伸应用到文件、虚拟机的副本创建,其优势在于多份虚拟数据副本之间的读写操作单独,完全满足测试环境多场景同步测试的需求,ADM内置的智能读写缓存机制,能够满足压力测试的性能要求;高效的数据副本管理功能,通过可视化的虚拟数据副本拓扑结构图可对系统全局数据使用关系进行预览,有助于完善测试数据的组织关系,优化测试数据的资源分配,同时,通过对拓扑结构的定位点击可自动跳转到相关数据副本的管理页面并检索出对应条目。国内较早发布CDM领域的平台型产品是上讯敏捷数据管理平台ADM产品。能源行业如何选择CDM
上讯ADM产品能解决数据备份恢复、备份数据恢复验证、敏感数据处理、测试数据多副本快速交付等问题吗?如何过滤不需要变形的数据
功能节点统一管理,支持弹性扩展ADM采用多节点高可用部署架构,保障数据服务高可用,并消除单节点故障导致的业务不可用问题,确保数据服务连续性。采用Scale-out架构,根据业务发展规模,按需扩展集群节点,无需停止服务,灵活满足业务需求。同时,ADM支持存储池容量的弹性扩充,满足不断增长的数据存储需求。(2)数据存储成本倍数级节约,提升数据存储环节的效能首先,数据备份面临存储成本高的问题,ADM采用内置高效的压缩存储池存放数据,压缩比约为3:1,存储即压缩,***降低了备份数据的存储成本;其次,通过ADM的数据库虚拟化技术,一份基础数据即可快速拉起多份虚拟数据库,由于虚拟数据库90%的数据均与原始数据相同,因此拉起时几乎不占用额外的物理存储空间,*对新增的写操作计入容量占用,因此,随着数据分发使用的场景和频率增加,虚拟库的数量越来越多,而存储成本将会呈倍数级节约,例如针对同一份数据创建N个虚拟库,传统方法需要N倍的存储空间占用,而通过ADM只需要占用近乎0TB的存储空间,**节约了数据存储环节的资源和成本。如何过滤不需要变形的数据