晁浩 作品数:48 被引量:56 H指数:4 供职机构: 河南理工大学计算机科学与技术学院 更多>> 发文基金: 国家自然科学基金 河南省基础与前沿技术研究计划项目 河南省科技攻关计划 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
基于谱信息熵和互补模型的声效模式检测 2018年 提出了一种基于模型融合的声效检测方法.首先提取对所有声效模式都具有良好辨识能力的谱信息熵特征,并进行声效辨识度分析;然后引入互补模型进行声效识别,从模型层面实现了整体谱特征、梅尔频率倒谱系数和谱信息熵的融合.对孤立词测试集进行了声效检测实验,识别精度为81.6%,实验结果表明,谱信息熵在3类特征中具有最好的分类能力,而互补模型能够有效集成3种特征蕴含的显著性信息. 晁浩 鲁保云 刘永利 刘志中 宋成关键词:声效 支持向量机 高斯混合模型 多层感知器 基于元音模板匹配的声效多级检测 被引量:4 2016年 针对鲁棒语音识别中的声效模式检测问题,提出了一种分级检测方法.首先使用整体谱特征训练高斯混合模型来判定语音信号是否耳语.对于非耳语的语音信号,通过声学界标点检测来获取信号中的元音段,然后通过元音模板匹配来确定语音信号具体的声效模式.在863-test测试集上进行的声效检测实验结果显示,除耳语识别精度略有下降外,其他4种声效模式的识别精度均有大幅度的提高.实验结果表明了将语音信号整体特征与局部元音特征相结合在声效检测中的有效性. 晁浩 宋成 刘志中关键词:语音识别 声效 元音 高斯混合模型 基于ESN-RBF框架的声效模式检测 被引量:1 2019年 针对声效检测过程中基于帧的谱特征不能描述语音现象中固有的时间相关性和动态变化信息的问题,提出一种结合回声状态网络和径向基函数网络的声效检测方法。首先将声学观测特征序列输入到回声状态网络,根据回声状态网络中储备池的节点状态对输入的观测矢量序列进行编码,从而将基于语音帧的声学观测矢量序列映射到高维编码空间;然后径向基函数网络被用于拟合每种声效模式编码后的概率密度函数;最后使用最小错误率贝叶斯决策方法来确定声效模式。对拥有5 000个孤立词的测试集进行声效检测试验,获得79.5%的识别精度。结果表明,所提方法可以有效获取语音帧之间的相关性信息,克服帧间独立假设的缺陷。 晁浩 董亮关键词:回声状态网络 径向基函数 支持向量机 一种基于改进社会学习算法的云任务调度方法 本发明提出一种基于改进社会学习算法的云任务调度方法,该方法模拟人类社会智能演化过程,具有较好的优化机理与优化性能。本发明设计了适用于云任务调度的学习算子,并利用SPV方法将具有连续本质的学习算子离散化用于离散型的云任务调... 刘志中 赵珊 张维怡 宋成 晁浩文献传递 汉语语音识别中融合发音信息的随机段模型研究 被引量:1 2014年 提出了一种基于随机段模型的发音信息集成方法。根据随机段模型的模型特性,建立了阶层式人工神经网络来获取语音段信号属于各类音素的后验概率,并通过一遍解码的方式集成到随机段模型系统中。在"863-test"测试集上进行的汉语连续语音识别实验显示汉语字的相对错误率下降了5.93%。实验结果表明了将发音信息应用到随机段模型的可行性。 晁浩 杨占磊 刘文举关键词:语音识别 发音特征 一种基于特征融合的语音声效模式检测方法 本发明公开了一种基于特征融合的语音声效模式检测方法。该方法包括如下步骤:接收语音信号;检测出所述语音信号中的元音,生成元音集合;提取元音集合中每一个元音的谱特征矢量序列;提取元音集合中每一个元音的频率特征矢量序列;根据元... 晁浩 智慧来 刘永利 刘志中 鲁保云 余琼霞文献传递 脑电情感识别中多上下文向量优化的卷积递归神经网络 2024年 目前的脑电(EEG)情感识别模型忽略了不同时段情感状态的差异性,未能强化关键的情感信息。针对上述问题,提出一种多上下文向量优化的卷积递归神经网络(CR-MCV)。首先构造脑电信号的特征矩阵序列,通过卷积神经网络(CNN)学习多通道脑电的空间特征;然后利用基于多头注意力的递归神经网络生成多上下文向量进行高层抽象特征提取;最后利用全连接层进行情感分类。在DEAP(Database for Emotion Analysis using Physiological signals)数据集上进行实验,CR-MCV在唤醒和效价维度上分类准确率分别为88.09%和89.30%。实验结果表明,CR-MCV在利用电极空间位置信息和不同时段情感状态显著性特征基础上,能够自适应地分配特征的注意力并强化情感状态显著性信息。 晁浩 封舒琪 刘永利关键词:情感识别 基于Web服务的医疗资源推荐方法及系统 本发明公开了一种基于Web服务的医疗资源推荐方法及系统。其中,医疗服务资源推荐方法为:接收客户发送的需求信息;将需求信息与预置的封装为Web服务的医疗服务资源进行匹配,确定符合客户需求的多个候选Web服务,生成候选Web... 薛霄 王淑芳 晁浩 刘志中 鲁保云融合引导概率的语音识别解码算法研究 被引量:1 2012年 语音帧在声学特征空间中的位置信息可以辅助解码器对潜在路径进行筛选。传统的语音识别系统缺乏利用这种位置信息。针对这种不足,本文提出一种引导概率模型,用于描述语音帧属于声学特征空间不同局部的概率,并将其用于识别。使用引导概率后,解码器更强调对声学特征空间中最有希望的局部进行搜索,保留并扩展通过此局部空间的路径,同时弱化不经过此局部空间的路径。实验结果显示,融合引导概率的解码算法在不显著增加解码复杂度的情形下,使汉字相对错误率下降10.95%。结果分析表明,融合了语音帧声学位置信息的解码方法能够更有效地鉴别潜在路径,从而降低误识率。 杨占磊 刘文举 晁浩关键词:语音识别系统 解码算法 位置信息 基于特征融合的声调识别方法 本发明公开了一种基于特征融合的声调识别方法。该方法包括如下步骤:提取待识别语音信号中每一帧的倒谱特征矢量,得到倒谱特征矢量序列;获取待识别语音信号的韵律特征矢量;根据倒谱特征矢量序列计算待识别语音信号中每一帧的段统计量特... 晁浩 刘永利 鲁保云 智慧来 刘志中文献传递