中国科学院大学重庆学院信息公开网站地图联系我们English中国科学院内网
  机构设置
  您现在的位置:首页 > cigit2019 > 机构设置 > 研究中心
电子信息技术研究所——大数据挖掘及应用中心
2017-03-27| 编辑: | 【

一、中心简介

大数据挖掘与应用中心致力于大规模数据感知与获取、存储与管理、分析与挖掘等方面基础理论、关键技术与应用系统研究,以国家与重庆经济社会发展重大科技需求为牵引,重点布局生态环境、智慧城市、医疗健康等行业示范应用。

中心拥有一支高水平多学科交叉科研团队,研究人员20余人,其中高级职称人员7。中心已出版学术专著3部,发表论文50余篇,申请国家发明专利20余项。

中心承担了包括国家科技重大专项、国家自然科学基金等多项国家级、省部级科研项目20余项,科研经费达2000余万元。目前已建成“大数据与智能计算重庆市重点实验室”、“国务院三峡办三峡工程生态环境监测系统在线监测中心”和“重庆市生态环境遥感监测大数据应用技术协同创新中心”3个省部级创新平台。此外,还联合企业共建了“洛丁智慧城市技术研发中心”、“中科院重庆研究院-深信服大数据智能安全联合实验室”等研发基地。

二、研究方向

主要包括1个基础理论,2项关键技术,3项示范应用。

1 中心主要研究方向

1.大数据基础理论

针对大数据高维、高速、变化快、价值密度低等特征,对大数据收集、处理、存储、分析和理解中的基础理论进行研究,特别是针对大规模稀疏数据的高效计算理论和方法的研究。

2.大数据共性关键技术

主要包括大数据分析和大数据管理两个关键技术,并形成相应的共性技术基础平台。

1)大数据存储与管理关键技术

重点解决海量数据高并发接入、数据高效存储和安全访问、数据中心的高效管理和运维等关键技术问题,开展数据中心资源和能耗优化方面的研究,研发大数据管理平台。

2)大数据分析与挖掘关键技术

主要研究针对大数据分析的高效计算方法,实现和集成包括常用数据挖掘算法、先进的大数据分析算法,以及一些针对具体应用的大数据分析算法,研发大数据分析平台。

3.大数据行业示范应用

研发面向应用的大数据应用系统,主要围绕生态环境、智慧城市、医疗健康等行业并开展示范应用。

1)生态环境大数据

围绕三峡工程生态与环境监测系统信息分析中心建设,研发生态与环境大数据平台和核心应用系统,推进实现数据融合、数据共享和数据运用。开展生态与环境监测新技术、新方法和新仪器研究,提升监测自动化、智能化水平。开展生态与环境大数据的分析研究,为公众科普教育、生态环境监管和生态环境决策提供服务。

2)智慧城市大数据

以智慧照明作为切入点,在照明系统中集成WIFI、摄像头、充电桩等多种设备和传感器,开发智慧城市大数据平台和应用系统,实现智慧照明、智慧市政、智慧安防、环保监测、智慧旅游、智慧交通等多个应用子系统智慧城市应用平台。开展智慧城市大数据分析研究和应用服务。

3)医疗健康大数据

研究针对医疗健康海量数据的采集、清洗、存储、挖掘、安全隐私保护等关键技术,研发医疗健康大数据平台和应用系统。面向低成本医疗需求,重点开展针对慢病创新服务的研究,构建慢病链式服务体系,研发相应的设备和软件系统。

三、研究成果

1、大数据理论与关键技术

1)高维稀疏数据分析理论与关键技术。高维稀疏的碎片化数据是大数据应用中的普适数据形态。针对高维稀疏数据的高速分析、特征构建、知识发现和模式获取等问题,开展了深入研究,提出了包括增量隐特征分析、非负隐特征分析、非负张量分析、超限张量分析等一系列理论模型,并适配时变趋势分析、知识图谱构建、模糊概率图分析等具体应用场景形成系列实际应用技术。

2 高维稀疏矩阵的隐特征分析

2)网络信息推荐理论与关键技术。发展了网络推荐系统这一研究方向,提出了多个有效的网络信息推荐算法,提出了推荐算法个性化的新概念,以及长期有效的推荐系统、数据特征与推荐算法效果的关联性、推荐网络的骨架等新问题,进行了系统深入研究并得到系列有意义的结果。

3 信息骨架提取过程 4 不同推荐算法的性能对比

 

3)多粒度时间序列数据挖掘技术。时间序列数据是实际应用中的复杂类型数据之一,针对时间序列的高维度性、模糊性、不完整性、动态性等数据特性,研究了时间序列表示、预测和异常检测等问题,提出了包括二维正态云表示的降维方法、多粒度模糊时间序列预测模型、时间序列的在线异常检测方法等多个多粒度智能分析方法,并将其应用于生态环境时间序列数据的分析。

5 时间序列的二维正态云表示

2、大数据管理平台:已完成的大数据管理平台具有如下特性:(1)具备基于Docker的云计算2.0技术框架;(2)具备自动监控、分配、迁移和综合管理系统虚拟机等资源的功能;(3)具备高级负载均衡、绿色节能等智能调度算法; (3)具有对大数据处理平台进行高级负载均衡、平衡加速的先进并行调度技术;(4)提供直连文件系统,大幅降低分布式文件系统的使用难度,提高文件在分布式系统中的存储效率;(5)提供物联网网关和数据处理功能,能够解决海量传感器同时上传数据时的高并发,高吞吐需求;(6)提供基于HBaseNoSQL数据库动态索引特性;(7)提供图形界面化的平台管理系统提供便利的综合管理功能,以及多种自动化平台管理机制,大幅降低大数据平台使用难度和所需的IT运维人员作业量。

6 云计算集群控制框架

7 作业调度算法性能

3、大数据分析平台:已研制的大数据分析挖掘系统实现了常规的数据挖掘算法,以及中心特有的粗糙集相关数据挖掘算法。

8 大数据分析平台

4、三峡库区水生态环境感知示范系统:在国家重大科技专项子课题“三峡库区水生态环境感知平台研制及业务化运行”支持下,已建设开县汉丰湖水质在线监测站;初步建成三峡库区水生态环境感知示范系统;建成多源异构水环境监测数据汇聚共享平台,实现对海量自动站水质数据、卫星及浮空器遥感监测水质数据、人工监测水质数据、视频数据、水文气象数据等的存储与分析;已研制数据驱动的水生态环境感知推演模型一套,包括水质预测模型、富营养化评价模型、生物生态综合毒性模型、遥感反演模型。

9 三峡水生态环境在线监测示范平台

5、智慧照明云管理系统:研发了智慧照明云管理系统,实现城市中的海量照明终端管理和智能化照明控制。该项成果可直接应用于城市公共照明领域,有效地降低城市照明能耗和运行维护的费用。同时,通过在照明系统中拓展和集成环境传感器、无线WIFI、摄像头等多种感知和应用终端,进而实现包含智慧市政、智慧安防、环保监测、智慧旅游、智慧交通等多种智慧应用,为智慧城市建设提供切实可行的解决方案。

10 智慧照明云管理系统

   联系人:袁野 yuanye@cigit.ac.cn

 


 
中国科学院重庆绿色智能技术研究院 版权所有
地址:重庆市北碚区方正大道266号 邮编:400714
联系电话:(023)65935555 传真:023-65935000