返回首页 加入收藏 联系我们
产品展示
当前位置:首页 > 产品中心 > 美国WILKERSON威尔克森 > 威尔克森过滤器 > 双布鲁姆WILKERSON威尔克森过滤器

产品名称:双布鲁姆WILKERSON威尔克森过滤器

产品型号:

产品报价:

产品特点:双布鲁姆WILKERSON威尔克森过滤器
随着近年来数据总量呈现出的爆炸增长趋势,数据备份系统存储的数据越来越多。经研究发现,在备份、归档等集中存储系统中存在大量冗余数据,有的甚至占到存储空间的60%,导致存储成本过高,数据访问性能下降。数据排重是减少数据冗余、节省存储空间的有效手段。

双布鲁姆WILKERSON威尔克森过滤器的详细资料:

双布鲁姆WILKERSON威尔克森过滤器数
随着近年来数据总量呈现出的爆炸增长趋势,数据备份系统存储的数据越来越多。经研究发现,在备份、归档等集中存储系统中存在大量冗余数据,有的甚至占到存储空间的60%,导致存储成本过高,数据访问性能下降。数据排重是减少数据冗余、节省存储空间的有效手段。

双布鲁姆WILKERSON威尔克森过滤器
现有排重算法中,文件级排重尽管排重开销小,但排重粒度过粗,难以取得存储空间的高效利用;数据块级排重算法能实现高效存储,但其附带的存储开销过高,排重的时间开销大。研究分层排重结构,应用双布鲁姆WILKERSON过滤器实现数据排重,优化数据排重性能,主要工作如下:针对数据重复有文件级的重复和数据块级的重复之分,提出一种基于双布鲁姆WILKERSON过滤器的数据排重算法。该算法使用两个布鲁姆WILKERSON过滤器构成二级排重结构,将排重过程分解成文件排重和数据块排重两部分。算法首先进入*级进行文件排重,然后将*级排重判定为不重复的文件分割成块进行第二级数据块排重。利用这种分层排重结构,通过*级将重复文件直接过滤掉,不进入第二级排重,减少了数据块排重的工作量;通过第二级进入不重复文件内部进行数据块排重,获得了数据块级的排重粒度。将上述算法应用于文档备份系统中,实现对文档的排重,由于算法采用布鲁姆WILKERSON过滤器对数据进行压缩表达,存在误判可能,即假阳性误判问题。本文设计通过查询元数据(保存数据相关信息)来为误判纠错。当布鲁姆WILKERSON过滤器判断数据为重复时,首先将元数据预读到内存中,在内存中匹配元数据信息,若没有找到,再读取保存元数据的文件—索引文件查询元数据。通过内存、索引文件两级元数据查询,杜绝了假阳性误判的情况。由于为假阳性误判纠错需要对元数据进行大量访问,增加了排重时间开销,设计将索引文件缓存,保证元数据操作的高效,以此提高排重效率。但系统的句柄数限制了同时缓存的索引文件数目,若索引文件过多,则不能同时缓存全部索引文件,需要进行更多的磁盘IO,此时排重开销与耗时都急剧升高,针对这种情况,采用动态哈希算法来分配元数据地址,将元数据保存在少数几个索引文件内,从而克服了句柄限制问题。

双布鲁姆WILKERSON威尔克森过滤器
实验结果表明,在文档备份系统中,使用该排重算法对不同重复率的文档文件集合排重,相比其他两种备份工具,在保持较好排重率的前提下,耗时平均缩短了10%左右。

 如果你对双布鲁姆WILKERSON威尔克森过滤器感兴趣,想了解更详细的产品信息,填写下表直接与厂家联系:

留言框

  • 产品:

  • 您的单位:

  • 您的姓名:

  • 联系电话:

  • 常用邮箱:

  • 省份:

  • 详细地址:

  • 补充说明:

  • 验证码:

    请输入计算结果(填写阿拉伯数字),如:三加四=7
联系人:周经理
电话:
021-13321956356
手机:
19121166298
  • 点击这里给我发消息

化工仪器网

推荐收藏该企业网站
Baidu
map