张文娅
- 作品数:6 被引量:9H指数:1
- 供职机构:华中科技大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 一种大规模图数据的压缩存储方法
- 本发明公开了一种大规模图数据的压缩存储方法,包括:(1)将原始图数据以行为单位用二进制邻接矩阵M存储;(2)根据邻接矩阵M中每行的偏移值建立散列索引;(3)将邻接矩阵M中每行中的起点按照出度进行升序排序;(4)记录入度为...
- 袁平鹏金海张文娅吴步文
- 文献传递
- 高可扩展的RDF数据存储系统被引量:9
- 2012年
- 由于资源描述框架(resource description framework,RDF)具有表达灵活、简洁等优点,已被接受为表达元数据及万维网上数据互联的规范.近年来,其数据量在以飞快的速度增长.相应地,要求存储RDF数据的系统应具有高扩展性.介绍了一个高可扩展的RDF数据存储系统TripleBit.为尽可能降低存储空间消耗,采用了增量压缩和变长整数编码方法.并采用了数据分块的存储方法,既使得存储管理方便又使得存储结构紧凑,加速了数据读取.系统提供了基于启发式规则的动态查询计划生成方法,所产生的查询计划在执行过程中根据中间结果会相应作调整,以保持最优的执行顺序.对于多变量的查询,使用二步执行策略以减少查询过程中产生的中间结果.与目前流行RDF数据存储系统相比较,在存储空间上RDF-3X比TripleBit至少多40%;在查询性能上,比RDF-3X和MonetDB获得数倍的提升.
- 袁平鹏刘谱张文娅吴步文
- 关键词:资源描述框架数据编码查询处理查询计划
- 以路径为中心的大规模图数据处理系统
- 图是一种较为复杂的数据模型。与线性表和树相比,图能表达更多种类的信息。现实生活中很多场景都能用图表示,如最短路径的生成,疾病的传播,参考文献的引用等。图也能用来表示一些新型的模型,如网页链接关系,蛋白质分子的组成, RD...
- 张文娅
- 文献传递
- 一种大规模图数据的压缩存储方法
- 本发明公开了一种大规模图数据的压缩存储方法,包括:(1)将原始图数据以行为单位用二进制邻接矩阵M存储;(2)根据邻接矩阵M中每行的偏移值建立散列索引;(3)将邻接矩阵M中每行中的起点按照出度进行升序排序;(4)记录入度为...
- 袁平鹏金海张文娅吴步文
- 文献传递
- 以路径为中心的大规模图数据处理系统
- 图数据之间关联错综复杂,图数据处理一般存在局部性较差的问题.因此,高效的处理大规模图数据一直是一个挑战.介绍能够高效处理10亿级别图数据的系统——以路径为中心的TripleGraph.在该系统中,为充分保留路径,图首先转...
- 张文娅谢昌凤袁平鹏
- 关键词:并行处理
- 高可扩展的RDF数据存储系统
- 由于资源描述框架(RESOURCE DESCRIPTION FRAMEWORK,RDF)具有表达灵活、简洁等优点,已被接受为表达元数据及万维网上数据互联的规范.近年来,其数据量在以飞快的速度增长.相应地,要求存储RD...
- 袁平鹏刘谱张文娅吴步文
- 关键词:资源描述框架数据编码查询处理查询计划
- 文献传递网络资源链接