大数据背景下采用互信息与随机森林算法的空气质量预测
doi: 10.13205/j.hjgc.201903034
-
摘要: 为了实现城市空气质量的精准预测,针对与城市空气质量预测相关的大数据种类多、规模大、维度高和生成速度快等特点,在研究城市不同区域空气质量评价指标的基础上,提出不同区域空气质量子空间聚类分析方法,挖掘不同区域空气质量的特征。通过对不同区域进行群体划分,并利用互信息矩阵从城市功能、地形、气象条件等方面辨识与不同区域空气质量相关联的因素,构建基于随机森林算法的城市空气质量预测模型。该方法可以有效识别城市不同区域空气质量的强关联因素,避免由于关联因素的差异性对空气质量预测造成的不利影响。仿真结果表明:该方法适用于大数据的分析与处理,并具有较高的预测精度。
点击查看大图
计量
- 文章访问数: 165
- HTML全文浏览量: 11
- PDF下载量: 14
- 被引次数: 0