基于网格服务的Nu-支持向量回归时间序列预测
时间序列预测是时间序列分析的主要组成部分,它根据事物的变化规律寻求未来发展趋势,在科研、工商业等各个领域中发挥着重要作用。在众多时间序列预测实际问题中,个人计算机的数据处理能力难以同时满足高效率和低误差的要求,超级计算机虽然处理能力强大,但是造价极高,难以普及。网格计算模式[1]的产生为时间序列预测提供了低成本,高性能的实现途径。目前影响较广泛的网格体系结构是 Web 服务资源框架(WS-ResourceFramework[2,3])。网格兼容和利用Web服务[4]的功能,将“有状态”概念加入到Web服务中,形成了网格服务[5]。本文讨论了使用网格服务解决时间序列预测问题的有效途径。支持向量机[6](Support Vector Machine, SVM)是基于统计学习理论的结构风险最小化原则发展而来的。它具有简洁的数学形式,直观的几何解释以及良好的推广能力,避免了局部最优解。在众多分类与回归的实际应用问题中,SVM表现出很多优于已有方法的性能,取得了大量的研究成果,推动了各领域的发展。Nu-支持向量回归[7](Nu-SVR,Nu-Support Vector Regression)是一种改进的支持向量回归方法,回归预测模型的泛化性和误差不仅取决于数据集特征,也取决于模型参数的选择。如何针对特定时间序列数据集,优化预测模型以提高推广性能,是应用 Nu-SVR解决时间序列预测的关键问题。本文提出了用 Nu-SVR 解决时间序列预测的系统化解决方案,设计了相应的网格服务框架并实现了原型系统。
1 时间序列预测解决方案
1.1 数据集的缩放
在训练 Nu-SVR 模型之前,先对数据集进行缩放是非常必要的,这与使用神经网络时考虑的因素[8]是相同的。没有经过缩放的原始数据,其属性值通常很大,容易加重数值计算的负担,很难得到令人满意的结果。这种情况下回归误差通常很高,因为大多数核函数只对有限的数据区间反应灵敏。所以,训练数据集与预测数据集都应该缩放到同一个目标区间,本文使用的缩放方法如下:
对于同一个数据集, 是定位数据特征的一个关键参数,直接影响着预测模型的推广性能。很难直接给出最适合的 以准确定位数据特征,所以将d作为一个变量,由使用者给出这个变量的先验区间,通过下面 1.4 节给出的搜索策略,在先验区间内选择最佳值。
1.3 基于 Nu-SVR 的建模过程
在求解以上问题的过程中, 决定着目标函数的拟合性能,是一个非常重要的参数,但是很难先验确定。Scholkopf等人[7]为了自动确定 的值,引入一个新的参数 (nu)来控制支持向量的数目以及训练误差,由此产生了一种新型支持向量回归算法Nu-SVR,对应的优化问题形式如下:
相关文章
- 2023-03-02智能化色谱分析软件的研究与应用探讨
- 2024-07-31铁路客车提速轴承外圈非基准端面挡边平行度测量仪的研制
- 2022-04-27监控摄像机日夜及彩色黑白转换两用简析
- 2024-07-09多CCD拼接相机中图像传感器不均匀性校正
- 2024-02-26实现同一分析周期内两流路并行分析的技术改造



请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。