王永超
- 作品数:2 被引量:36H指数:2
- 供职机构:山东大学齐鲁生物医学大数据研究中心更多>>
- 发文基金:国家自然科学基金山东省自然科学基金更多>>
- 相关领域:医药卫生更多>>
- 基于社区2型糖尿病患者的心脑血管事件5年风险预测模型被引量:5
- 2017年
- 目的构建新诊断的2型糖尿病患者5年内首次发生心脑血管事件的预测模型。方法研究对象选自青岛市黄岛区疾病预防控制中心慢性病管理系统,选择未发生过心脑血管事件的2型糖尿病患者2 899例作为训练样本,建立Cox模型和评分模型,并对模型进行内部验证;用"山东多中心健康管理纵向观察队列"中的1 016例2型糖尿病患者作为验证样本,对模型进行外部验证。结果随访期间训练样本共发生228例心脑血管事件,发病密度为16.86‰。模型变量包括年龄、性别、收缩压、低密度脂蛋白、高密度脂蛋白和心脑血管病家族史。训练样本Cox模型ROC曲线下面积(AUC)为0.678(95%CI:0.660~0.695),评分模型AUC为0.663(95%CI:0.648~0.680);外部验证Cox模型AUC为0.640(95%CI:0.608~0.676),评分模型AUC为0.631(95%CI:0.600~0.661)。结论研究建立的2型糖尿病患者心脑血管事件5年预测模型可以为社区糖尿病患者管理初期提供参考。
- 张振堂杨洋韩福俊陈向华季晓康王永超王淑康孙苑潆李敏陈亚飞王丽薛付忠刘言训
- 关键词:糖尿病并发症心脑血管病社区管理
- 基于网络爬虫技术的健康医疗大数据采集整理系统被引量:31
- 2017年
- 目的快速、准确地获得公共卫生服务系统的医疗数据,并进行数据整理,为建立人群健康风险评估模型提供数据基础。方法运用聚焦网络爬虫技术,设计算法并编程,在自动记录和修正URL异常、原始数据存档、保持登录方式3个方面进行算法改进。将设计好的爬虫应用于爬取已获得授权网站的医疗数据,通过医学数据库系统,对数据进行解析、整理与导出。结果获得多个公共卫生服务基地数据,为当地政府部门提供数据分析报告,利用整理分析的数据完成多项健康风险评估模型建立。结论基于网络爬虫技术建立的数据采集整理系统,可以解决获取及整理网络许可数据的难题,将此技术应用于医药卫生领域,可使现有丰富的医学数据资源得以充分利用并提高利用效率。
- 卞伟玮王永超崔立真郭伟李晖周苗薛付忠刘静
- 关键词:网络爬虫数据库系统聚焦爬虫数据采集数据解析