国家自然科学基金(61003311) 作品数:37 被引量:172 H指数:7 相关作者: 郑啸 方木云 王小林 邰伟鹏 刘辉 更多>> 相关机构: 安徽工业大学 东南大学 中国矿业大学 更多>> 发文基金: 国家自然科学基金 安徽省高校省级自然科学研究项目 安徽省教育厅重点基金 更多>> 相关领域: 自动化与计算机技术 理学 文化科学 更多>>
改进的基于知网的词语相似度算法 被引量:40 2011年 词语相似度计算在文本分类、问答系统、机器翻译、文本聚类等有着广泛的应用。词语相似度计算的研究工作一般都是基于《知网》的义原的层面上,根据义原之间的距离和义原本身的层次深度,进行词语相似度的计算。基于以上研究,提出了一种新的改进的词语相似度算法,首先根据义项中各类义原的个数不同,提出了一种新的变系数义项相似度计算方法;其次从词性的角度,认为词语义项中的不同词性对词语相似度的贡献度不同,剔除不同词性义项之间的组合。实验结果证明,改进的算法结果在原有基础上得到较好的提升,大幅度降低了相似度计算的复杂度,提高了运算效率。 王小林 王义关键词:词语相似度 知网 词性 一种新的三环网络TL(N;1,s,s+1)直径求解方法 被引量:3 2012年 基于多环网络的直径是衡量网络效率的重要指标,提出了一种新的有向三环网络TL(N;1,s,s+1)的直径求解方法——等价三叉树方法,并得到了一种新的直观图——三叉树.采用C#语言和SQL Server2000仿真实现了三叉树的结构模型.研究了该三叉树的性质,给出了三叉树的构造算法.找到了该族三环网络直径d(N;1,s,s+1)最大值、最小值的分布规律.仿真结果表明:直径的最大值随N值的增加呈有规律的锯齿状波动增加,直径的最小值随N值的增加呈有规律的阶梯状增加,并给出了直径d(N;1,s,s+1)的上界与下界的显式公式. 邰伟鹏 岳建华 方木云关键词:三环网络 三叉树 直径 有向三环网络的六角环模型构造法 2014年 多环网络的直径是衡量网络效率的重要指标,提出一种新的有向三环网络TL(N;s1,s2,s3)(其中N=s1+s2+s3,s1≠s2≠s3,gcd(N;s1,s2,s3)=1)构造方法,得到其直观模型———六角环.研究并证明了六角环的一些性质,给出了有向三环网络直径d(N;s1,s2,s3)的显式公式.利用C#和SQL SERVER2008仿真出若干结果,实验结果显示该三环网络的构造方法实用有效.通过对仿真结果的分析,得到了一类特殊的三环网络TL(N;s1,s2,s3),当N=1+6(1+…+c),s1=c2,s2=(c+1)2,s3=N-s1-s2时,其直径d(N;s1,s2,s3)=2c,宽直径为d3(N;s1,s2,s3)=2c+2.该构造方法较传统的超L型瓦方法简单,又较三叉树构造法实用,在二维平面上就能得到一个简单、直观模型,并且仅需要分析环数c与位数pos这2个参数,就能求解出有向三环网络的直径. 邰伟鹏 徐宏 王小林关键词:直径 仿真 双环网络G(N;1,s)的L形瓦仿真算法改进 被引量:1 2012年 利用仿真来研究双环网络L形瓦,在国内外文献中尚不多见,文献[1]提出了一种仿真算法,文献[2]使用数组对文献[1]的算法作了改进.其不足之处是使用了过多过长的中间数组,影响了仿真速度.针对这一不足,根据L形瓦的h边特性,使用了更少更短的数组改进了文献[2]的算法,实验结果表明,改进的算法极大地提高了仿真速度.此外还给出了L形瓦的h边分布特点,并作了进一步分析. 苏小虎 方木云 邰伟鹏 郑啸关键词:双环网络 仿真 紧优 Phishing detection method based on URL features 被引量:2 2013年 In order to effectively detect malicious phishing behaviors, a phishing detection method based on the uniform resource locator (URL) features is proposed. First, the method compares the phishing URLs with legal ones to extract the features of phishing URLs. Then a machine learning algorithm is applied to obtain the URL classification model from the sample data set training. In order to adapt to the change of a phishing URL, the classification model should be constantly updated according to the new samples. So, an incremental learning algorithm based on the feedback of the original sample data set is designed. The experiments verify that the combination of the URL features extracted in this paper and the support vector machine (SVM) classification algorithm can achieve a high phishing detection accuracy, and the incremental learning algorithm is also effective. 曹玖新 董丹 毛波 王田峰一种基于Markov随机场的图像分割方法 2012年 提出一种基于Markov随机场图像分割方法。在K-Means图像分割的基础上,建立标记场和特征场,构造Markov随机场模型,再利用条件迭代模型(ICM)算法逐点更新图像标记,实现图像的最大后验概率(MAP)估计,从而实现图像的有效分割。实验结果表明,该方法比直接采用Markov方法有着更好的分割效果。 任然 刘宏申关键词:图像分割 MARKOV随机场 最大后验概率 基于节点相似度的社团发现算法 被引量:3 2014年 对现有的社会网络社团发现算法进行研究,发现存在算法时间复杂度高、准确率低和没有充分利用节点属性信息等问题,提出了一种基于节点相似度的社团发现算法以解决这些问题。综合考虑图的拓扑结构和节点属性信息,结合构造属性扩展图的思想和基于结构情境相似度的思想得到节点的相似度,利用改进的K-means算法对所有节点进行聚类得到社团结构。编程实验结果表明,使用该算法得到的社团准确率较高,算法的时间复杂度为线性的,在带属性的数据集上和不带属性的数据集上的测试结果均验证了算法的有效性。 程泽凯 张佳玉关键词:社会网络 社团发现 三维直角坐标系下三环网络的超L型瓦仿真 2012年 传统的超L型瓦仿真算法主要采用穷举的方法,效率较低,且有一定的局限性。针对上述问题,将三维直角坐标系引入三环网络,在三维直角坐标系下,提出广义三环网络G(N;s1,s2,s3)的超L型瓦仿真算法,利用C++和OpenGL实现超L型仿真,并求得其相关参数l、m、n,以及三环网络的直径D。实验结果表明,该算法具有较高的执行效率和更强的通用性。 苏小虎 邰伟鹏 方木云关键词:三环网络 直径 计算周期为p^n的二元序列k错线性复杂度及误差向量的一个算法 2013年 k错线性复杂度是密钥流序列稳定性的重要度量指标,误差向量的计算有非常重要的作用。在王-张-肖算法的基础上,改写cost向量的结构,给出了计算pn周期二元序列k错线性复杂度的新算法,该算法更容易理解。同时给出了计算相应误差向量的算法,即在该误差向量下,能实现原始序列的k错线性复杂度。这里p为奇素数,2为模p2的本原根。 周建钦 欧阳孔礼 赵起关键词:线性复杂度 K错线性复杂度 基于增量式贝叶斯模型的中文问句分类研究 被引量:7 2014年 固定训练集生成的分类器性能不理想且不能跟踪用户需求,为此,提出一种将增量式贝叶斯思想用于问句分类的方法。采用遗传算法选取最优特征子集优化分类器,从而避免训练集特征过分冗余,使分类器在学习过程中动态地扩大训练集并修改分类器参数。在对问句进行分类时,提取问句的疑问词、句法结构、疑问意向词和疑问意向词在知网的首项义原作为分类特征。为了验证增量式贝叶斯方法的有效性,从语料库中随机抽取不同规模的问句构成增量集,基于不同的增量集对同一测试集中的问句进行分类。实验结果表明,增量式贝叶斯分类器较朴素贝叶斯分类器有更高的分类精度,大类和小类的准确率分别达到90.2%和76.3%,在提高准确率的同时优化了运行效率。 王小林 镇丽华 杨思春 邰伟鹏 郑啸关键词:问句分类 问答系统 朴素贝叶斯 改进贝叶斯