期刊文献+
共找到142篇文章
< 1 2 8 >
每页显示 20 50 100
基于大数据的设施农业管理系统设计 预览
1
作者 李自荣 《农机化研究》 北大核心 2020年第7期245-248,共4页
针对设施农业管理系统工作效率低、数据更新慢的特点,设计了基于大数据的设施农业管理系统,由感知层、网络层、应用层和执行层组成。通过对软件系统进行改进,采用机会协作机制对数据进行可靠性传输,采用加权的聚类算法进行农业安全预警... 针对设施农业管理系统工作效率低、数据更新慢的特点,设计了基于大数据的设施农业管理系统,由感知层、网络层、应用层和执行层组成。通过对软件系统进行改进,采用机会协作机制对数据进行可靠性传输,采用加权的聚类算法进行农业安全预警。试验结果表明:该设备管理系统可以有效提高数据处理的速度和精确度,并有效进行农业安全预警,能够满足农户对设施农业管理系统的要求。 展开更多
关键词 设施农业管理系统 大数据 机会协作机制 加权的聚类算法
在线阅读 下载PDF
聚类算法综述 预览 被引量:5
2
作者 章永来 周耀鉴 《计算机应用》 CSCD 北大核心 2019年第7期1869-1882,共14页
大数据时代,聚类这种无监督学习算法的地位尤为突出。近年来,对聚类算法的研究取得了长足的进步。首先,总结了聚类分析的全过程、相似性度量、聚类算法的新分类及其结果的评价等内容,将聚类算法重新划分为大数据聚类与小数据聚类两个大... 大数据时代,聚类这种无监督学习算法的地位尤为突出。近年来,对聚类算法的研究取得了长足的进步。首先,总结了聚类分析的全过程、相似性度量、聚类算法的新分类及其结果的评价等内容,将聚类算法重新划分为大数据聚类与小数据聚类两个大类,并特别对大数据聚类作了较为系统的分析与总结。此外,概述并分析了各类聚类算法的研究进展及其应用概况,并结合研究课题讨论了算法的发展趋势。 展开更多
关键词 聚类 相似性度量 大数据聚类 小数据聚类 聚类评价
在线阅读 下载PDF
云计算平台上的Canopy-Kmeans并行聚类算法研究 预览
3
作者 孙秀娟 《现代电子技术》 北大核心 2019年第19期78-81,共4页
针对大数据的高维特性及海量性,提出云计算平台中的Canopy-Kmeans并行聚类算法,通过三角不等式原理,能够使计算冗余降低,使算法执行速度得到提高。对Canopy-Kmeans并行聚类算法进行深入的研究,并且在大量不同大小数据集中的实验结果表明... 针对大数据的高维特性及海量性,提出云计算平台中的Canopy-Kmeans并行聚类算法,通过三角不等式原理,能够使计算冗余降低,使算法执行速度得到提高。对Canopy-Kmeans并行聚类算法进行深入的研究,并且在大量不同大小数据集中的实验结果表明,所设计的并行聚类算法具有良好的加速比、数据伸缩率及扩展率等特点,能够在海量数据挖掘及分析中使用。 展开更多
关键词 云计算平台 Canopy-Kmeans算法 并行聚类算法 大数据挖掘 集群数据 数据分析
在线阅读 下载PDF
基于大数据的最优招标方案选取算法 预览
4
作者 王鹏 皮水江 《现代电子技术》 北大核心 2019年第4期105-108,共4页
传统招标方案选取算法通过建立指标属性矩阵和直觉模糊线性评价模型进行最优招标方案选取,没有考虑大数据处理上的时间性,导致选取结果效率低,准确性差。为此提出基于大数据的最优招标方案选取算法,对全部招标方案进行聚类,通过大数据... 传统招标方案选取算法通过建立指标属性矩阵和直觉模糊线性评价模型进行最优招标方案选取,没有考虑大数据处理上的时间性,导致选取结果效率低,准确性差。为此提出基于大数据的最优招标方案选取算法,对全部招标方案进行聚类,通过大数据抽样加快对招标方案的大数据处理进程;选用Single方法对大数据抽样结果进行聚类,确定大数据自然簇质心方位;利用均值更新方法对大数据自然簇质心的方位进行修改以确定大数据自然簇质心的实质方位,在此基础上对招标方案集进行划分聚类。实现招标方案的聚类后,构建投影寻踪模型进行最优招标方案的选取。实验结果表明,所提算法聚类误差低于7%,准确性高达93%,并且在计算速度方面具有较大优势。 展开更多
关键词 大数据 最优选取算法 招标方案 大数据处理 聚类 投影寻踪模型
在线阅读 下载PDF
基于激光扫描的电网高压线故障检测系统设计
5
作者 卢瑛 张仁永 谢箭 《激光杂志》 北大核心 2019年第8期125-129,共5页
电网高压线在高压变电网络中的随机扰动和耦合性较大,故障发生概率较高,为了提高对电网高压线的故障检测能力,提出一种基于激光扫描的电网高压线故障检测方法。采用激光扫描技术进行电网高压线的故障分布式大数据采集,采集的电网高压线... 电网高压线在高压变电网络中的随机扰动和耦合性较大,故障发生概率较高,为了提高对电网高压线的故障检测能力,提出一种基于激光扫描的电网高压线故障检测方法。采用激光扫描技术进行电网高压线的故障分布式大数据采集,采集的电网高压线故障样本数据有短路数据、线路断路数据、线路视觉信息数据等,构建电网高压线故障样本数据的传感信息组网结构模型,采用关联规则重组方法进行电网高压线故障样本数据结构重组,根据结构相似性特征进行电网高压线的故障判别,采用相关性融合滤波检测方法实现电网高压线的故障性融合和特征检测,根据特征提取结果进行信息分类,采用激光扫描样本空间聚类方法,实现电网高压线故障检测。在嵌入式的DSP中进行系统硬件设计,使用Workbench软件对电网高压线故障测量数据进行导出分析,仿真结果表明,采用该方法进行电网高压线故障检测的准确性较高,稳定性较好。 展开更多
关键词 激光扫描 电网高压线 故障检测 大数据聚类
山东大数据网络舆情发展方向分析与建模 预览
6
作者 黄静 葛永军 +1 位作者 肖宏丽 刘倩琦 《科技通报》 2019年第9期75-78,84共5页
通过对山东大数据网络舆情发展方向分析,进行舆情监督和管理,提出基于统计特征信息融合的山东大数据网络舆情发展方向建模方法。构建山东舆情发展方向分布大数据的统计序列模型,采用大数据空间区域结构重组方法进行预测,提取描述性统计... 通过对山东大数据网络舆情发展方向分析,进行舆情监督和管理,提出基于统计特征信息融合的山东大数据网络舆情发展方向建模方法。构建山东舆情发展方向分布大数据的统计序列模型,采用大数据空间区域结构重组方法进行预测,提取描述性统计特征量,结合量化回归分析方法,对提取的山东舆情发展方向分布大数据的关联特征集进行分类融合,构建基于模糊C均值聚类山东大数据网络舆情信息融合模型,采用分段检验方法进行数据聚类中心寻优控制,实现山东舆情发展方向预测与建模。实证分析结果表明,该模型能有效预测山东大数据网络舆情发展方向,大数据融合性能较好。 展开更多
关键词 山东大数据 网络舆情 发展方向 数据聚类 融合
在线阅读 下载PDF
大数据技术在建筑节能中的应用案例研究 预览
7
作者 陈庆财 鹿伟 +1 位作者 王福林 窦强 《建筑节能》 CAS 2019年第10期105-108,116共5页
大数据技术在商业﹑金融﹑医疗﹑互联网等领域都有了较多的成功应用,但是在建筑节能领域的应用尚不多见.对使用大数据技术分析和优化建筑运行﹑促进建筑节能进行了初探,通过三个案例分别尝试了数据聚类﹑数据关联和数据融合三种典型的... 大数据技术在商业﹑金融﹑医疗﹑互联网等领域都有了较多的成功应用,但是在建筑节能领域的应用尚不多见.对使用大数据技术分析和优化建筑运行﹑促进建筑节能进行了初探,通过三个案例分别尝试了数据聚类﹑数据关联和数据融合三种典型的数据挖掘技术在建筑节能运行管理中的应用效果,分析了大数据技术在建筑运行管理中可以取得的效果.案例分析表明,通过数据聚类,可以容易地发现建筑机电设备中出现的问题,帮助运行管理人员改善运行﹑提高能效;通过数据关联,可以发现室内环境数据与室内人数间的关联关系,可用于提高运行管理效率﹑促进行为节能;通过数据融合,可以提高运行关键参数的识别精度,特别是室内人数的识别,将识别出的人数用于空调通风系统的预测性控制,可以降低空调系统的能耗. 展开更多
关键词 大数据技术 建筑节能运行优化 数据聚类 数据关联 数据融合
在线阅读 下载PDF
大数据环境下基于狼群优化的聚类算法分析与研究 预览
8
作者 杨文静 《现代电子技术》 北大核心 2019年第17期106-108,共3页
为了提高大数据环境下数据聚类的准确性,文中采用狼群优化算法实现数据聚类。对大数据集合进行狼群模拟训练,将数据结合中的多个数据采用狼群游走及围攻策略进行数据训练,不断更新数据在多维空间中的位置分布,根据数据所处位置与中心点... 为了提高大数据环境下数据聚类的准确性,文中采用狼群优化算法实现数据聚类。对大数据集合进行狼群模拟训练,将数据结合中的多个数据采用狼群游走及围攻策略进行数据训练,不断更新数据在多维空间中的位置分布,根据数据所处位置与中心点的距离来判断数据所属类别,从而完成数据聚类。经过实验证明,相比于K Means聚类算法和DBSCAN聚类算法,文中所提算法聚类优势明显。 展开更多
关键词 大数据 狼群优化算法 数据聚类 数据位置更新 狼群模拟训练 数据训练
在线阅读 下载PDF
临床数据发布中心集成与开发 预览
9
作者 李恺 吕寻伟 《医学信息学杂志》 CAS 2019年第6期22-26,共5页
以北京怀柔医院为例,介绍临床数据发布中心集成与开发,具体阐述平台的关键技术、体系结构、功能设计、应用效果,指出该平台有助于改善患者就医体验,提高医疗效率与质量。
关键词 大数据平台 数据发布 数据集成与开发 HADOOP ETL
在线阅读 下载PDF
MapReduce框架下常用聚类算法比较研究 预览
10
作者 张占峰 耿珊珊 《河北省科学院学报》 CAS 2019年第2期1-6,共6页
大数据处理在各个行业的应用中占有越来越重要的地位。本文以基于MapReduce框架的大数据处理平台为基础,分析了MapReduce计算框架的工作流程及在该框架下四种常用的聚类算法,包括K-means算法、密度聚类算法、FCM算法与层次聚类算法的原... 大数据处理在各个行业的应用中占有越来越重要的地位。本文以基于MapReduce框架的大数据处理平台为基础,分析了MapReduce计算框架的工作流程及在该框架下四种常用的聚类算法,包括K-means算法、密度聚类算法、FCM算法与层次聚类算法的原理与优缺点,并对这些算法的进一步优化进行了分析。 展开更多
关键词 大数据处理 MAPREDUCE 聚类 聚类算法 算法描述
在线阅读 下载PDF
电力系统非结构化数据处理方法研究 预览
11
作者 高明 陆宏治 梁雪青 《现代信息科技》 2019年第17期9-11,14共4页
本文首先简述了非结构化数据的背景以及电力系统非结构化数据的特点,然后阐述了对非结构化数据挖掘利用时所遇到的问题,回顾了电力系统不同应用层面非结构化数据的处理方法及优缺点。在此基础上,从非结构化数据处理中的数据提取、数据... 本文首先简述了非结构化数据的背景以及电力系统非结构化数据的特点,然后阐述了对非结构化数据挖掘利用时所遇到的问题,回顾了电力系统不同应用层面非结构化数据的处理方法及优缺点。在此基础上,从非结构化数据处理中的数据提取、数据过滤、数据转化和利用方面进行归纳和分析。最后根据电力系统战略规划,提出了未来非结构化数据处理的发展方向。 展开更多
关键词 非结构化数据 大数据处理 电力系统 聚类 智能算法
在线阅读 下载PDF
基于自组织神经网络的火电厂健康状态数据提取算法 预览
12
作者 吴胜聪 陈雨轩 +1 位作者 沈可心 程浩轩 《电工电气》 2019年第9期27-32,共6页
火电厂设备健康数据提取是火电厂设备状态评估数据处理的一个关键步骤,有利于提高设备状态评估的准确性与效率。将设备状态数据首先利用R型层次聚类进行特征参数选取与冗余数据清除,再采用自组织神经网络筛选异常值。利用所诉方法对某... 火电厂设备健康数据提取是火电厂设备状态评估数据处理的一个关键步骤,有利于提高设备状态评估的准确性与效率。将设备状态数据首先利用R型层次聚类进行特征参数选取与冗余数据清除,再采用自组织神经网络筛选异常值。利用所诉方法对某发电厂的汽泵前置泵设备的监测数据进行健康状态数据提取,发现清除的异常数据远远大于提取出的健康数据,表明该方法清除的数据满足预期,为后续健康状态评估提供了准确的参照数据,并且降低监测数据维度提高评估效率。 展开更多
关键词 大数据 自组织神经网络 R型聚类 电力设备状态数据
在线阅读 下载PDF
大数据挖掘中的MapReduce并行聚类优化算法研究 预览
13
作者 吕国 肖瑞雪 +1 位作者 白振荣 孟凡兴 《现代电子技术》 北大核心 2019年第11期161-164,共4页
针对传统数据挖掘算法只适用于小规模数据挖掘处理,由于数据规模不断增大,其存在计算效率低、内存不足等问题,文中将MapReduce用于数据挖掘领域,对大数据挖掘中的MapReduce进行了并行化改进,并设计相应的并行化实现模型,以期满足大数据... 针对传统数据挖掘算法只适用于小规模数据挖掘处理,由于数据规模不断增大,其存在计算效率低、内存不足等问题,文中将MapReduce用于数据挖掘领域,对大数据挖掘中的MapReduce进行了并行化改进,并设计相应的并行化实现模型,以期满足大数据分析需求,完成低成本、高性能的数据并行挖掘与处理。 展开更多
关键词 大数据 MAPREDUCE 并行化处理 聚类算法 数据挖掘 Map任务
在线阅读 下载PDF
利用导航大数据挖掘城市热点区域关联性
14
作者 陈锐 陈明剑 +1 位作者 姚翔 王建光 《地球信息科学学报》 CSCD 北大核心 2019年第6期826-835,共10页
导航大数据是大量与导航相关且具有泛在导航、定位、授时特征的数据集合。城市环境的特性影响居民的出行活动,而居民出行活动中产生的导航大数据则蕴含了城市环境的时空信息。热点区域空间分布以及热点区域之间的关联性特征是城市环境... 导航大数据是大量与导航相关且具有泛在导航、定位、授时特征的数据集合。城市环境的特性影响居民的出行活动,而居民出行活动中产生的导航大数据则蕴含了城市环境的时空信息。热点区域空间分布以及热点区域之间的关联性特征是城市环境时空特性的重要组成部分,由客观的环境现状和主观的人为活动造成。通过挖掘导航大数据可以揭示这些特征。本文提出了利用导航大数据的城市热点区域关联性挖掘方法。首先,通过对居民出行的起点和终点坐标进行空间聚类,挖掘城市中的热点区域,并依据点的分布特点对城市热点区域进行离散化;然后,利用基于谱聚类和蚁群算法的方法分析居民出行特征,揭示城市中热点区域之间存在的关联性。本文提出的方法能够充分利用导航大数据对城市动态的感知能力。以上海市2007年2月20日的出租车轨迹数据为例进行分析,结果表明:利用导航大数据分析城市热点区域之间的关联性,可以得到具有紧密关联性的热点区域的空间分布特征;上海市居民出行活动频繁的热点区域被划分为15个内部紧密关联的子图,形成该分布特征的内在机制以及居民流通规律与上海市的土地资源利用及道路交通建设现状密切相关。分析方法和结果可为合理的城市功能区域规划,智慧城市建设等提供决策支持和参考信息。 展开更多
关键词 导航大数据 出租车轨迹 聚类分析 蚁群算法 热点区域关联性 上海市
基于客流规律的地铁车站客流风险分析
15
作者 李子浩 田向亮 +3 位作者 黎忠文 周炜 周志杰 钟茂华 《清华大学学报:自然科学版》 EI CAS CSCD 北大核心 2019年第10期854-860,共7页
地铁车站类型识别和客流风险识别对地铁安全运营管理有着重要的作用。基于深圳地铁AFC(automatic fare collection)系统数据,采用无关值和异常值清理、聚合、均值滤波、标准化、主成分分析等数据清洗步骤,提取不同时段客流比例、不同天... 地铁车站类型识别和客流风险识别对地铁安全运营管理有着重要的作用。基于深圳地铁AFC(automatic fare collection)系统数据,采用无关值和异常值清理、聚合、均值滤波、标准化、主成分分析等数据清洗步骤,提取不同时段客流比例、不同天数客流比例和换乘客流比例等特征。运用Gauss混合模型(GMM)对工作日和周末客流进行聚类,分析客流出行规律,辨识车站类型及其对应的客流风险时段,提出车站客流风险分析方法,通过大数据分析对车站类型和客流风险进行识别。分析结果对掌握车站大客流风险情况,避免大客流冲击造成的拥挤踩踏等群体性事件的发生,保障乘客安全具有指导意义。 展开更多
关键词 地铁 大数据 聚类 出行规律 风险分析
输变电设备集中监控大数据研究及应用 预览
16
作者 高强 郑乐为 童存智 《电力大数据》 2019年第3期13-18,共6页
随着智能电网的快速发展和调控一体化运行体系的深入推进,接入调控中心的输变电设备集中监控信息数据成倍增长,如何从海量的监控信息数据中挖掘出需要的信息,直接指导监控员的工作,由被动监控转为主动监控,显得尤为迫切。国网浙江省电... 随着智能电网的快速发展和调控一体化运行体系的深入推进,接入调控中心的输变电设备集中监控信息数据成倍增长,如何从海量的监控信息数据中挖掘出需要的信息,直接指导监控员的工作,由被动监控转为主动监控,显得尤为迫切。国网浙江省电力有限公司针对现状率先开展了输变电设备集中监控信息大数据技术的研究与应用,基于智能电网调控技术支持系统搭建了一个由各类监控信息分析模块组成的信息分析中心,通过对输变电设备告警信息进行挖掘分析实现集中监控信息的优化整合和分类处置,可以显著提升监控员的日常工作效率。文章首先概述了输变电设备集中监控信息分析中心的总体结构,然后介绍了其采用的优化算法,最后结合浙江电网的实际运行情况,对各类监控信息分析模块进行了具体应用,其分析结果可为监控员提供相应的辅助决策,为浙江电网的安全运行提供保障。 展开更多
关键词 输变电设备 智能电网:集中监控 大数据分析 聚类算法
在线阅读 下载PDF
供电客户诉求智能分析系统的应用 预览
17
作者 李建芬 魏坤 《河北电力技术》 2019年第1期57-59,共3页
依托95598客户诉求平台,通过应用大数据理论来挖掘客户诉求信息,扩展系统数据挖掘与分析功能,根据客户关注点及请求频率等特征,按照偏好标签库和交互频次设置,提供个性化的交互服务,解决了人工分析效率低下等问题,提高了客户诉求服务的... 依托95598客户诉求平台,通过应用大数据理论来挖掘客户诉求信息,扩展系统数据挖掘与分析功能,根据客户关注点及请求频率等特征,按照偏好标签库和交互频次设置,提供个性化的交互服务,解决了人工分析效率低下等问题,提高了客户诉求服务的整体水平。 展开更多
关键词 大数据 客户诉求 客户分群 交互服务
在线阅读 免费下载
复杂属性环境非关系型分布式大数据挖掘仿真 预览
18
作者 邹静昭 赵宁 +1 位作者 卢翠荣 武琳 《计算机仿真》 北大核心 2019年第10期334-338,共5页
对复杂属性环境的数据识别有利于充分挖掘大数据包含的信息与价值,提出一种非关系型分布式大数据挖掘算法.首先,引入分布式的最大频繁项算法模型,在物理分散逻辑下,对非关系型数据应用分布式方法进行数据分析,利用建立候选频繁项的搜索... 对复杂属性环境的数据识别有利于充分挖掘大数据包含的信息与价值,提出一种非关系型分布式大数据挖掘算法.首先,引入分布式的最大频繁项算法模型,在物理分散逻辑下,对非关系型数据应用分布式方法进行数据分析,利用建立候选频繁项的搜索条件降低数据检测次数,并采取划分投影法,计算各频繁项对应的分区编号,将其规划到不同的分区中,从而优化冗余频繁项,然后针对数据库中大数据的数据特征建立各个属性的关联度,根据Boosting聚类方法,把由弱聚类得到的局部模型在每次迭代过程中升级为全局模型,再对其进行区块划分,并利用划分质量重新调整迭代采样率,最终得到聚类结果,完成数据挖掘.通过仿真验证了非关系型分布式大数据挖掘具有显著的准确性、稳定性和实用性. 展开更多
关键词 复杂属性环境 非关系型 大数据 聚类算法 分布式最大频繁项算法
在线阅读 下载PDF
基于大数据处理技术的界面交互设计研究 预览 被引量:1
19
作者 李慧真 《现代电子技术》 北大核心 2019年第1期38-41,45共5页
为了提高界面的信息交互和数据处理能力,提出基于大数据处理技术的界面交互设计方法。构建界面交互系统的数据库,采用过程约束的层次式结构设计方法进行界面信息交互和大数据融合处理,采用模糊聚类方法进行界面检索数据库的信息聚类。在... 为了提高界面的信息交互和数据处理能力,提出基于大数据处理技术的界面交互设计方法。构建界面交互系统的数据库,采用过程约束的层次式结构设计方法进行界面信息交互和大数据融合处理,采用模糊聚类方法进行界面检索数据库的信息聚类。在Linux内核源码控制下进行界面的程序调度和交叉编译,界面的交互设计系统主要包括进程管理、程序控制和内源文件管理等模块,结合大数据处理技术,实现界面交互系统优化设计。系统测试结果表明,设计的界面交互系统具有很好的大数据信息处理和调度能力,数据的召回性较好。 展开更多
关键词 大数据处理 界面交互设计 过程约束 数据库 模糊聚类 交叉编译
在线阅读 下载PDF
基于知识图谱的包装产业大数据智能问答系统研究 预览
20
作者 黄贤明 《现代电子技术》 北大核心 2019年第14期148-151,共4页
为了提高包装产业大数据分析和信息化管理能力,提出一种基于知识图谱的包装产业大数据智能问答系统设计方法,结合大数据挖掘技术和知识图谱特征提取技术,实现包装产业大数据智能融合和优化问答检索。构建包装产业大数据分布结构模型,采... 为了提高包装产业大数据分析和信息化管理能力,提出一种基于知识图谱的包装产业大数据智能问答系统设计方法,结合大数据挖掘技术和知识图谱特征提取技术,实现包装产业大数据智能融合和优化问答检索。构建包装产业大数据分布结构模型,采用关联规则调度方法进行大数据自适应融合调度,实现包装产业大数据的分块区域匹配,提取包装产业大数据的知识图谱集,对提取的包装产业大数据知识图谱采用子空间融合技术进行信息聚类处理,实现包装产业大数据的智能问答和检索设计。采用程序加载控制方法,将算法加载到DSP集成信息处理器中,实现包装产业大数据智能问答系统的集成开发。测试结果表明,该系统能有效实现包装产业大数据智能问答,大数据图谱的特征表达能力较强。 展开更多
关键词 知识图谱 包装产业 大数据 智能问答系统 分块区域匹配 信息聚类处理 集成开发
在线阅读 下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部 意见反馈