郑苏杭
- 作品数:5 被引量:5H指数:1
- 供职机构:杭州电子科技大学更多>>
- 发文基金:浙江省科技攻关计划国家自然科学基金浙江省重点科技计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 多核环境下基于海量日志的类似行为模式用户识别方法
- 本发明公开了一种多核环境下基于海量日志的类似行为模式用户识别方法。现有的方法运算量巨大、I/O操作繁重。本发明方法首先在WEB服务器端设置单独的日志数据库,用于存放记录用户访问信息的日志数据集;其次读入日志数据集中的部分...
- 俞东进李万清郑苏杭
- 基于多核并行的海量数据序列模式挖掘被引量:4
- 2012年
- 为了在多核处理器上充分利用多核资源以提升挖掘性能,提出了一种动态与静态任务分配机制相结合的基于多核的并行序列模式挖掘算法。该算法采用数据并行与任务并行相结合的策略,在各处理器核生成局部序列模式后,再与其他处理器核协同,以最终获得所有的全局序列模式。算法通过并行局部归约技术消除了局部序列的重复生成与计算,并可结合静态与动态任务分配机制解决处理器的负载不均衡问题。理论分析和实验都证实了该算法可有效利用多核计算平台及多核体系结构优势,具有较高的运行效率和加速比。
- 俞东进郑苏杭李万清
- 关键词:多核海量数据挖掘
- 面向海量交通信息流的分布式序列模式挖掘研究
- 近年来,随着我国经济建设持续不断的高速发展和人们生活水平的不断提高,城市机动车保有量连年持续增长,机动车已成为各城镇居民出行的主要交通工具之一。但与此同时,利用机动车进行的违法犯罪活动也越来越多,如:机动车假牌假证、机动...
- 郑苏杭
- 关键词:城市机动车序列模式挖掘算法分布式计算车辆识别HADOOP平台
- 多核环境下基于海量日志的类似行为模式用户识别方法
- 本发明公开了一种多核环境下基于海量日志的类似行为模式用户识别方法。现有的方法运算量巨大、I/O操作繁重。本发明方法首先在WEB服务器端设置单独的日志数据库,用于存放记录用户访问信息的日志数据集;其次读入日志数据集中的部分...
- 俞东进李万清郑苏杭
- 基于BIDE的多核并行闭合序列模式挖掘被引量:1
- 2012年
- 基于经典的BIDE算法,提出一种多核并行闭合序列模式挖掘算法——MT_BIDE。该算法在频繁序列扩展判断前进行剪枝,在扩展过程中动态调整频繁序列及其伪投影数据集,平衡不同线程间挖掘闭合序列模式的计算量差异。实验结果表明,该算法具有较高的运行效率和加速比。
- 俞东进郑苏杭李万清吴为
- 关键词:多核序列模式挖掘