一、实验室简介
中国科学院重庆绿色智能技术研究院在2012年成立之初就组建了数据挖掘与认知研究中心,其后于2013年成立了大数据应用工程技术中心,2014年两中心合并成立了大数据挖掘及应用研究中心。围绕大数据与智能计算领域,重庆研究院相继成立了高性能计算、智能多媒体、精准医疗、北斗导航、智慧城市、生态环境等研究中心或实验室,由这些研究单元组建成大数据与智能计算重庆市重点实验室。
目前,实验室已经组建了一支高水平、多学科交叉、汇聚多位高层次人才的研究团队,聚集了强大的学术带头人和骨干组成的研究队伍,如图1所示。目前,实验室固定研究人员25人,具有高级职称的研究人员19人,绝大多数具有博士学位和海外留学经历。团队成员的背景涉及计算机、数学、物理、自动控制、环境生态学等进行大数据挖掘与应用研发所需的多学科交叉领域,研究实力雄厚,具备开展基础理论研究、应用基础研究、高新技术攻关以及成果应用转化等创新研究工作的能力。
近3年来,实验室共申请专利90余项,发明专利获得授权17项;实用新型专利获得授权3项;软件著作权登记6项。发表高水平论文100余篇。出版专著4本。共承担省部级以上项目20余项,项目经费超过5000万元。获得省部级以上奖励4人次。
实验室致力于大数据感知与获取、存储与管理、分析与挖掘等方面的基础理论、关键技术与应用研究。实验室以国家与重庆市经济社会发展重大科技需求为牵引,重点开展应用导向的应用基础和关键技术研究。主要研究方向包括:
(1)大数据与智能计算的基础理论研究,重点针对高维度稀疏数据的新型计算理论和计算方法开展研究;
(2)大数据与智能计算的关键技术研究,重点针对大数据智能分析与挖掘的高效计算方法,以及针对大数据存储与管理方面的关键技术和数据平台开展研究;
(3)大数据与智能计算的应用研究,重点围绕生态环境、智慧城市和医疗健康等领域和行业开展大数据应用研究与示范。
二、代表性成果
1.理论创新
(1)基于复杂网络的个性化推荐
在信息推荐理论方面做出了比较系统的工作,不仅提出多个新的推荐算法,而且还对理解推荐系统本身进行了深入探索,开辟和引领了推荐系统新的研究方向,使得网络推荐技术成为推荐系统领域研究的一个重要分支。提出一系列信息推荐算法,在复杂度、推荐精度、多样性等指标具有优势;针对现有算法趋向推荐流行项目的不足,提出长期有效的推荐算法概念和多个算法;提出基于网络结构的信息核概念和信息核提取算法,在保证推荐质量的同时实现大规模数据压缩;提出推荐系统从个性化算法到算法个性化的概念和算法,最大程度地提供个性化服务;提出协同聚集系数指标,实现可以预先根据数据集特征来选择合适的推荐算法。基于上述研究,发表相关高水平学术论文近百篇,申请国家发明专利十余项,获得中国计算机学会2014年自然科学二等奖(一等奖至今空缺)。
(2)稀疏高维动态数据多尺度建模与智能分析理论框架
针对真实复杂应用场景中大规模数据存在的稀疏、动态和高维特性,综合运用高维稀疏张量分析、非线性动力学、深度学习、强化学习、超限学习和集成学习等智能数据分析理论和方法,实验室首次提出适用于稀疏高维动态数据智能分析的增量隐特征模型、单特征依赖非负隐特征模型、恒定非负隐特征模型、免Hessian二阶稀疏张量分析、交替强化稀疏张量分析、超限隐特征分析、免求逆高速超限学习机和深度超限隐特征分析等一系列兼具理论创新和应用价值的理论模型和应用方法,形成了对真实复杂应用场景中稀疏高维动态数据进行多尺度建模与智能分析理论的完整框架,并应用于大规模网络数据分析、生态环境大数据分析和工业大数据控制领域。基于上述研究,实验室共发表相关高水平学术论文20余篇,申请国家发明专利7项。
稀疏高维动态数据多尺度建模与智能分析
(3)大数据中心资源管理与优化调度
针对数据中心存在的负载均衡、绿色节能和高性能大数据处理等若干挑战性问题,创新性地提出预分割负载均衡方法、动态优化配置大数据处理Hadoop集群算法、实时在线分配资源、考虑生命周期特征实时云仿真等方法;提出的预分割负载均衡方法突破传统负载均衡限制,分别比业界最佳方法提升离线和在线负载均衡30%和90%;首次提出了动态配置大数据处理Hadoop集群方法,分别减少离线和在线总完工时间(总能耗)35%和55%。
(4)粗糙集多粒度学习理论
首次提出大规模粗糙集多粒度学习理论,针对大规模粗糙集分析与知识发现问题兼具模糊和精确的特点,结合非线性多粒度学习、深度模糊神经网络等先进模型和理论,实现对大规模粗糙集的多粒度、多层级的知识挖掘;共发表相关高水平学术论文7篇,申请相关发明专利8项
2.技术突破
大数据与智能计算实验室近3年取得的技术突破主要包括:
(1)跨场景人脸识别技术
针对跨场景人脸识别问题,提出了基于多场景深度卷积神经网络(DCNN)的人脸识别技术。该技术通过领域自适应算法缩小不同场景之间的差异、同时最大化异类样本之间的可区分性以及最小化同类样本之间的离散性,能够将不同场景的图像映射到具有更好表达能力的同一特征空间进行比较。在权威人脸识别数据库LFW上的实验表明:当错误接受率为1%时,正确率>98%;当错误接受率为0.1%时,正确率>95%;该技术已达到国际前沿水平。该技术目前已成功运用于人脸识别智能通关系统,已在重庆、上海、成都、北京、广州、乌鲁木齐等大中型城市的边防、海关、火车站、银行、社会保险、驾校考试等领域应用示范。
(2)三峡库区水生态环境感知
研发出包括智慧三峡库区实景三维仿真、遥感反演与在线监测对比分析、水质统计及预测、污染物扩散模拟等功能的三峡库区水生态环境感知示范系统,实现对三峡库区水生态环境的在线监测、数据分析、知识获取和决策支持。
三峡库区水生态环境感知系统
(3)智慧照明云平台
研发有自主知识产权的大数据平台及适用于大数据平台的核心应用系统,特别是需要低成本海量数据的高速收集、高可靠性存储及高性能访问的应用系统,提供应用及平台一体化的大数据解决方案及服务。将该平台应用于城市公共照明系统,构建了基于云平台的智慧照明系统;进一步基于在灯杆布置各种传感器,实现城市智能感知,并进而通过多源数据融合,构建智慧城市大数据系统。
智慧照明云平台
(4)服务绩效
大数据与智能计算实验室近3年取得的服务绩效主要体现在利用大数据分析和高性能计算实现精细化天气预报。实验室依托在大数据智能分析与挖掘方向的研究成果,与重庆市气象科学研究所、美国俄克拉荷马大学风暴分析和预测中心合作研发的“精细化数值天气预报系统”,基于85万亿次计算能力的高性能计算平台,采用风暴尺度预报模式,首次建立针对三峡等复杂山地地形的气象雷达和观测数据同化模型,提高了天气预报准确度。该系统在“9.1~9.3”渝东北和“9.12~9.15”长江以北的暴雨过程预报服务中提供了重要支撑,黄奇帆市长批示:“气象局预报准确,预警信息发布及时,为各区县救灾减灾提供了准确、实时的信息,避免了人民群众生命财产有可能蒙受的巨大损失”。
精细化天气预报
联系人:罗辛luoxin21@cigit.ac.cn