近日,中国科学院重庆绿色智能技术研究院大数据挖掘及应用中心研究团队在时间序列的多粒度预测模型的研究方面取得进展,相关研究成果发表在《Chemometrics and Intelligent Laboratory Systems》和《Neurocomputing》国际期刊上发表。
具有不确定性特征的数据集一直以来都是数据挖掘领域的难点和热点问题,传统的时间序列预测模型几乎都是采用数据填充等不确定性的方法处理不确定性数据集,这使得这些模型在许多领域得不到预期的预测精度。大数据挖掘研究团队通过分析不同领域的时间序列数据的共同基本特征,以粒计算理论为基础,分别建立了基于水平粒化(属性粒化)和垂直粒化(样本值粒化)的多粒度知识空间,然后结合模糊时间序列预测、时间序列近似周期和粒子群优化算法等,提出了两种时间序列的多粒度预测模型。该模型通过在不同粒度层次上的切换,实现了以确定性方法处理不确定性数据集的构想,并且在“台湾加权股票指数(TAIEX)”、“城市失业率”等经典的时间序列预测数据集上的模拟实验中获得了高精度的预测结果。另外,在三峡库区长江干流的水质预测模拟试验中表明,该模型完全可以适应三峡库区复杂的时间序列水质预测,为库区的水质预测预警提供依据。
该研究得到国家科技重大专项“水体污染控制与治理”(2014ZX07104-006)的资助。 (邓伟辉供稿)
文章链接http://www.sciencedirect.com/science/article/pii/S0169743915002427
ttp://www.sciencedirect.com/science/article/pii/S092523121501348X