期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
用于垃圾邮件识别的“词频-筛”混合特征选择方法 预览
1
作者 陈俊颖 周顺风 闵华清 《华南理工大学学报:自然科学版》 CSCD 北大核心 2017年第3期82-88,共7页
文中针对当下愈发泛滥的垃圾邮件,分别使用朴素贝叶斯分类和支持向量机分类法对当前日益泛滥的垃圾邮件进行识别、分类,将“词频-筛”混合特征选择方法应用于分类器模型中,以提高分类器的识别性能.同时,通过考虑更全面的分类概率情况,... 文中针对当下愈发泛滥的垃圾邮件,分别使用朴素贝叶斯分类和支持向量机分类法对当前日益泛滥的垃圾邮件进行识别、分类,将“词频-筛”混合特征选择方法应用于分类器模型中,以提高分类器的识别性能.同时,通过考虑更全面的分类概率情况,改进朴素贝叶斯分类模型,进一步提升朴素贝叶斯分类器的识别性能.最后通过实验得到了该垃圾邮件识别系统的准确率、召回率和F1值等分类识别性能指标.实验结果表明,“词频-筛”混合特征选择方法能有效提高垃圾邮件分类器的识别性能,而且使用成本敏感方法的分类输出调节模块也能大大降低分类器将正常邮件误判为垃圾邮件的概率,因此,文中设计的垃圾邮件识别系统具有较强的实用性,可以在实际工作、生活中使用. 展开更多
关键词 垃圾邮件识别 混合特征选择方法 朴素贝叶斯 支持向量机
在线阅读 免费下载
Modeling Chinese Microblogs with Five Ws for Topic Hashtags Extraction
2
作者 Zhibin Zhao Jiahong Sun +4 位作者 Lan Yao Xun Wang Jiahong Chu Huan Liu Ge Yu 《清华大学学报:自然科学英文版》 EI CAS CSCD 2017年第2期135-148,共14页
Hashtags are important metadata in microblogs and are used to mark topics or index messages. However,statistics show that hashtags are absent from most microblogs. This poses great challenges for the retrieval and ana... Hashtags are important metadata in microblogs and are used to mark topics or index messages. However,statistics show that hashtags are absent from most microblogs. This poses great challenges for the retrieval and analysis of these tagless microblogs. In this paper, we summarize the similarity between microblogs and shortmessage-style news, and then propose an algorithm, named 5WTAG, for detecting microblog topics based on a model of five Ws(When, Where, Who, What, ho W). As five-W attributes are the core components in event description, it is guaranteed theoretically that 5WTAG can properly extract semantic topics from microblogs. We introduce the detailed procedure of the algorithm in this paper including spam microblog identification, microblog segmentation, and candidate hashtag construction. In addition, we propose a novel recommendation computing method for ranking candidate hashtags, which combines syntax and semantic analysis and observes the distribution of artificial topic hashtags. Finally, we conduct comprehensive experiments to verify the semantic correctness and completeness of the candidate hashtags, as well as the accuracy of the recommendation method using real data from Sina Weibo. 展开更多
关键词 标签 提取 建模 中文 垃圾邮件识别 语义分析 分割算法 综合性实验
基于增量学习和主动学习的垃圾邮件识别新方法 预览
3
作者 王友卫 朱建明 +1 位作者 李洋 凤丽洲 《计算机科学》 CSCD 北大核心 2015年第B10期23-27,共5页
垃圾邮件识别是计算机取证领域的重要研究内容。多数垃圾邮件识别方法未能有效地考虑用户兴趣邮件识别结果的影响。提出了一种基于增量学习和主动学习的垃圾邮件识别新方法。为获得最有效特征,在特征选择阶段综合考虑了单词信息和非单... 垃圾邮件识别是计算机取证领域的重要研究内容。多数垃圾邮件识别方法未能有效地考虑用户兴趣邮件识别结果的影响。提出了一种基于增量学习和主动学习的垃圾邮件识别新方法。为获得最有效特征,在特征选择阶段综合考虑了单词信息和非单词信息;接着,为减少待标注样本选择时间,提出了一种基于投影的不确定样本选择方法;最后,在样本标注过程中,提出了自动推荐样本类别及用户兴趣度的样本标注新方法。多种对比实验表明,算法针对垃圾邮件识别精度高,待标注样本选择速度较快,用户标注负担较小,具有较高的应用价值。 展开更多
关键词 垃圾邮件识别 计算机取证 增量学习 主动学习 样本标注 用户兴趣度
在线阅读 免费下载
基于社会计算和机器学习的垃圾邮件识别方法的研究
4
作者 董源 徐雅斌 +1 位作者 李卓 李艳平 《山东大学学报:理学版》 CAS CSCD 北大核心 2013年第7期72-78,共7页
在对目前各种垃圾邮件识别方法进行研究分析的基础上,结合社会计算的理论和机器学习的方法,提出了一种新的垃圾邮件识别方法。通过利用邮件头部中能反映联系人社会关系的特征来构造一张联系人来往关系图对垃圾邮件进行初次识别,对于... 在对目前各种垃圾邮件识别方法进行研究分析的基础上,结合社会计算的理论和机器学习的方法,提出了一种新的垃圾邮件识别方法。通过利用邮件头部中能反映联系人社会关系的特征来构造一张联系人来往关系图对垃圾邮件进行初次识别,对于无法确定存在社会关系的联系人的邮件再利用机器学习的方法进行识别。实验结果表明,采用该方法进行垃圾邮件识别较之单纯采用贝叶斯方法,识别准确率有了较大的提高,同时,识别时间得到降低.. 展开更多
关键词 社会计算 垃圾邮件识别 社会关系 机器学习
基于聚类的垃圾邮件识别技术研究 被引量:2
5
作者 蒋盛益 庞观松 张建军 《山东大学学报:理学版》 CAS CSCD 北大核心 2011年第5期71-76,共6页
随着垃圾邮件数量日益攀升,如何有效识别垃圾邮件已成为一项非常重要的课题。为克服k最近邻(k-nea-rest neighbor,kNN)分类法在垃圾邮件识别中的缺陷,本文基于聚类算法提出了一种改进kNN识别方法。首先使用基于最小距离原则的一趟聚... 随着垃圾邮件数量日益攀升,如何有效识别垃圾邮件已成为一项非常重要的课题。为克服k最近邻(k-nea-rest neighbor,kNN)分类法在垃圾邮件识别中的缺陷,本文基于聚类算法提出了一种改进kNN识别方法。首先使用基于最小距离原则的一趟聚类算法将训练邮件集合划分为大小几乎相同的超球体,每个超球体包含一个类别或多个类别的文本;其次,采用投票机制对得到的聚类结果进行簇标识,即以簇中最多文本的类别作为簇的类别,得到的识别模型由具有标识的簇组成;最后,结合最近邻分类思想,对输入的邮件进行自动识别。实验结果表明,该方法可大幅度地降低邮件相似度的计算量,较TiMBL、Nave Bayesian、Stacking等算法效果要好。同时,该方法是一种可增量式更新识别模型的方法,具有一定的实用性。 展开更多
关键词 垃圾邮件识别 k最近邻文本分类 一趟聚类算法 增量式建模
基于用户反馈和增量学习的垃圾邮件识别方法 被引量:2
6
作者 王鑫 陈光英 +1 位作者 段海新 李学农 《清华大学学报:自然科学版》 EI CAS CSCD 北大核心 2006年第1期70-73,共4页
为了提高垃圾邮件识别的准确度,减少识别中的错判,提出了一种交互式垃圾邮件识别方法。该方法用一组具有特定权重的规则识别垃圾邮件,规则权重分布用改进遗传算法训练得到。增加用户与服务器间的交互,收集用户反馈的错判信息,根据... 为了提高垃圾邮件识别的准确度,减少识别中的错判,提出了一种交互式垃圾邮件识别方法。该方法用一组具有特定权重的规则识别垃圾邮件,规则权重分布用改进遗传算法训练得到。增加用户与服务器间的交互,收集用户反馈的错判信息,根据反馈信息用增量学习动态调整规则权重。通过对SpamAssassin扩展实现了该方法,并应用在邮件服务器上进行了测试。实验中在不影响垃圾邮件识别率的前提下,降低误判率约10%。实验结果表明:该方法不但能有效减少识别中的误判,而且避免了繁琐的重新训练,加快了规则权重的更新速度。 展开更多
关键词 模式识别 电子邮件 垃圾邮件识别 改进遗传算法 用户反馈 增量学习
邮件接收管理 预览
7
作者 王志军 《视窗世界》 2004年第4期 51-52,共2页
成天在办公室工作.其实事情也蛮繁杂的一会儿是起草个文件.一会儿是通知某项事件,再过一会儿可能去干什么事了.这邮件的接收管理嘛还是让系统自动去完成吧。
关键词 电子邮件 邮件接收管理 FOXMAIL5.0 OUTLOOK Express6.00 Microsoft OUTLOOK2003 自动接牧 垃圾邮件识别 “黑名单” “白名单” 贝叶斯过滤法 邮件病毒
在线阅读 下载PDF
反垃圾邮件管理系统的设计与实现 预览
8
作者 李凯 邵连杰 秦志宇 《科技风》 2019年第8期76-76,共1页
在信息技术飞速发展的今天,电子邮件作为一种快捷,经济的通信方式得到了普及,但随之而来垃圾邮件问题也愈加严重。邮件中包含的广告、不良信息甚至是病毒,会对用户造成更大的危害。本文通过对当前反垃圾邮件技术的研究,选取关键字过滤... 在信息技术飞速发展的今天,电子邮件作为一种快捷,经济的通信方式得到了普及,但随之而来垃圾邮件问题也愈加严重。邮件中包含的广告、不良信息甚至是病毒,会对用户造成更大的危害。本文通过对当前反垃圾邮件技术的研究,选取关键字过滤、黑白名单过滤与贝叶斯过滤三种过滤法来实现一个反垃圾邮件管理系统,旨在帮助用户过滤垃圾邮件,获取更好的邮件使用体验。 展开更多
关键词 垃圾邮件识别 特征选择 贝叶斯算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部 意见反馈