刘峥 作品数:37 被引量:201 H指数:9 供职机构: 中国科学院文献情报中心 更多>> 发文基金: 国家科技支撑计划 中国科学院知识创新工程重要方向项目 中央级公益性科研院所基本科研业务费专项 更多>> 相关领域: 文化科学 自动化与计算机技术 医药卫生 航空宇航科学技术 更多>>
科技情报智慧数据:方法、体系与应用 被引量:8 2024年 [目的/意义]分析智慧数据建设现状,认识人工智能时代科技情报智慧数据建设的方法与框架。[方法/过程]界定科技情报智慧数据的概念内涵,提出“明确定位与价值、数据架构体系、建设知识语料、数据质量控制、嵌入业务流程的协同建设模式、数据权益约束及安全分级”7个方面的建设原则,设计“技术与功能逻辑、数据分类组织、数据建设流程、数据协同加工工具、运营服务策略”体系框架,拓展智慧数据的示范应用。[结果/结论]通过研发具有“收、存、治、管、用”一体化的科情数据平台,建立了覆盖“情报动态、科研成果、创新活动、创新主体及多类功能型知识实体”等类型的科技情报智慧数据中心,并在“科技人才自动发现、重大科技问题的自动生成以及语义查重查新”等场景中开展应用。 钱力 刘细文 刘细文 常志军 张智雄 李杰 刘峥 丁洁兰 李欣 刘峥 谢子纯关键词:科技情报 人工智能 一种基于动态多级匹配的大规模文献机构消歧方法 本发明提供了一种基于动态多级匹配的大规模文献机构消歧方法,涉及数据挖掘技术领域,包括:获取大规模文献机构原始数据,按照字段处理模板进行处理,并按照预设格式文件进行存储后生成消歧原始数据,建立多级匹配层,每个匹配层均包括重... 于倩倩 董智鹏 刘峥 邓彩虹 张建勇关联数据研究的主题结构和研究进展解析 被引量:2 2019年 [目的/意义]通过调研关联数据的研究文献,分析关联数据的研究的主题结构与研究进展。[方法/过程]综合采用文献综述方法、文献计量方法与可视化工具对Web of Science中的关联数据研究进行分析。其中,利用Citespace可视化软件分析了关联数据研究主体,利用VOSviewer将构建的关键词矩阵可视化。以关联数据的生命周期阶段为线索,结合关键词共现图谱,探寻了关联数据研究的主题结构与研究进展。[结果/结论]分析结果显示欧洲为关联数据研究的主阵地,Tim Berners-Lee等人在关联数据领域具备深厚的影响力。目前关联数据的研究覆盖了发布、优化、评价、应用等生命周期各个方面,但也存在一些薄弱环节,如在研究推动关联数据发布的进一步规范、实现实体自动丰富与链接、构建全面的质量评价体系与工具等方面存在挑战。 周毅 刘峥 张建勇关键词:关联数据 主题结构 融合多层次数据的问答知识图谱本体模型构建 被引量:11 2022年 [目的/意义]针对基于问答对的智能问答准确率和解决率低、用户满意度差等问题,研究构建知识图谱本体模型,构建基于知识图谱的智能问答,解决基于问答对的智能问题所面临的问题。[方法/过程]首先,分析当前智能问答面临的问题及原因,提出构建知识图谱支撑智能问答的方案。其次,在已有本体模型构建方法的基础上,提出一种融合多层次数据的多轮循环方法,该方法分别以业务数据、用户数据和业务系统动态数据等多层次数据为数据来源,核心步骤为搭建基本框架、完善知识结构、对齐知识结构三轮循环。最后,以退换货领域为例阐述本体模型构建的具体步骤,从无到有,增量叠加,构建知识图谱本体模型。[结果/结论]将以退换货本体模型为模式层的知识图谱部署在智能问答系统中进行试验,试验结果显示退换货知识图谱上线后智能问答的准确率提升50%,解决率提升300%。其中准确率是指回答正确的问题数量与回答的全部问题数量的比例,解决率是指答案精准解决了用户问题的数量与回答的全部问题数量的比例。本文提出的本体模型构建方法从零散的领域知识中梳理出完整的、细粒度的领域知识结构,支持智能问答为用户提供精准的答案,能够有效解决基于问答对的智能问答困境。 周毅 刘峥 粟小青 金体成关键词:知识图谱 本体模型 生物医学语义关系抽取方法综述 被引量:9 2017年 深度学习在自然语言处理方面取得了显著成效,为生物医学领域的信息抽取带来新的研究范式。本研究旨在系统调研生物医学语义关系抽取方法、分析其发展历程,为深度学习方法的进一步运用提供基础和启示。通过检索Pub Med、Web of Science和IEEE数据库,以及Bio Creative、Sem Eval等重要测评网站,遴选出具有代表性的抽取方法,并从目的、方法、数据集和效果四个维度进行分析。经过系统梳理,可将生物医学语义关系抽取方法分为三个阶段:基于知识、传统机器学习和深度学习。将先验知识和领域资源恰当地融入到深度学习模型中,是进一步提升语义关系抽取效果的探索方向。 李芳 刘胜宇 刘峥关键词:语义关系抽取 生物医学 卷积神经网络 自然语言处理 叙词表标准的数据模型研究 被引量:2 2013年 追踪叙词表国际标准的发展历程,以叙词表数据模型的变化为切入点,分析比较叙词表数据结构的变化,以重点讨论在语义网环境下,叙词表标准在互操作和计算机处理上显现出的新特点,为专业人员编制、维护、管理、利用叙词表提供参考。 刘峥 纪姗姗关键词:叙词表 数据结构 互操作 内容本体设计模式构建及应用研究综述 被引量:1 2011年 基于模式的本体设计是近几年本体研究的热点之一,内容本体设计模式是其中重要一类,是基于模式的本体构建的基础和复用的重要内容。它的创建方法有两种:从非本体知识资源重组而来;从现存本体中抽取而来。得到的模式主要用于本体精炼和本体构建。对这两方面内容进行综述,介绍相关研究现状,并提出问题和研究展望。 李晓辉 孙坦 刘峥语义出版本体模型的构成分析——以SPAR本体和Nature本体为例 被引量:6 2017年 [目的 /意义]构建一个良好的本体可为语义出版提供机器可读的数据架构,支持出版物内容的结构化组织和语义化描述,支持出版工作流的术语规范控制,实现网络范围的增值效应。前瞻性思考其合理构成可为我国语义出版本体的构建实践提供参考。[方法 /过程]选取国际学术出版领域分别具有理论和实践代表意义的SPAR本体和Nature本体,深入阐述其构建原则、逻辑结构和内容构成特点,并从多维度进行对比分析,梳理其优势与不足。[结果 /结论]SPAR本体类目全面、属性丰富,突出语义内容的描述。Nature本体结构简洁,灵活实用,注重与外部资源的关联和映射。基于系统分析,认为语义出版本体的构成主要包括出版物和出版工作两方面信息。其中,对出版物重要构成要素(如参考文献与引用信息、学术贡献等)进行深入的建模描述,可增强本体表示能力,更好地支持语义出版的实现;同时,注意做好顶层设计,以实现本体模型的结构简洁与功能高效。 李芳 纪姗姗 周毅 刘峥学科领域本体建设的一个实证研究--兼论杜威分类法与中图分类法的再次比较 被引量:6 2010年 中国科学院国家科学图书馆专业领域知识环境建设,采用本体的知识组织方法,其中的学科领域本体利用分类法进行改造。对22版杜威法和第四版中图法进行基于网络知识组织需要的比较后,依据杜威法重视与学科同步发展等的特点,选用杜威法(四级类目)构建学科领域本体,以学科树的方式向用户显示学科领域所关联的信息资源。 黄金霞 宋文 刘峥 景丽关键词:知识组织体系 杜威法 中图法 场景驱动下组合多维度服务要素的先进制造业科技服务体系研究 周毅 纪姗姗 刘峥 于倩倩 张建勇