基于统计信号处理的时间序列预测模型选择方法

xiaoxiao2020-10-23 15

基于统计信号处理的时间序列预测模型选择方法
【技术领域】
[0001] 本发明涉及一种时间序列预测模型的选择方法。
【背景技术】
[0002] 时间序列预测模型与时间序列特性之间的匹配程度决定了预测效果，因此需要针对时间序列为其选择适合的时间序列预测模型进行预测分析。然而，在现有研宄中，主要基于经验或少量的实验进行预测模型的选择，在选择过程中主观因素影响较多，并且即使采用实验方式进行模型选择，往往也只是使用单一的评价指标进行片面的适用性评价并基于这种片面的评价结果进行模型的选择，这样选择出的模型往往不是综合性能最优的。
[0003] 因此，当前缺少一种高效、全面的对时间序列预测模型选择方法，能够综合考虑时间序列特性与预测模型之间的匹配性以及对时间序列预测模型适用性的全面量化评价，实现时间序列预测模型的快速、准确选择，为无专业背景知识的人提供一定的模型选择建议。

【发明内容】

[0004] 本发明目的是为了解决现有时间序列预测模型的选择效率低、准确度低，专业背景浅薄的工作人员无法快速、准确地选择时间序列预测模型的问题，提供了一种基于统计信号处理的时间序列预测模型选择方法。
[0005] 本发明所述基于统计信号处理的时间序列预测模型选择方法，该选择方法的具体过程为：
[0006] 步骤1、获取输入时间序列的特性，根据时间序列种类和时间序列特性的对应关系，确定输入时间序列的种类；
[0007] 所述输入时间序列的特性包括幅值连续性、长记忆特性、季节性和趋势性；
[0008] 步骤2、对输入时间序列进行特性分析，获取时间序列种类与候选预测模型的映射关系；
[0009] 步骤3、根据确定的种类与候选预测模型的映射关系，将对应种类的m个候选预测模型作为定性选择预测模型；
[0010] 步骤4、采用与定性选择预测模型相同的建模时间序列，对定性选择预测模型进行相同步长的预测，根据预测结果获取定性选择预测模型的适用性量化评价指标，所述适用性量化评价指标包括整体误差指标、局部误差指标、无量纲准则性指标和实验性能指标；
[0011] 步骤5、根据步骤4中获取的适用性量化评价指标，获取整体误差指标中性能指标最优的两个预测模型，获取局部误差指标中性能指标最优的两个预测模型，获取无量纲准则性指标中性能指标最优的两个预测模型，获取实验性能指标中性能指标最优的两个预测丰旲型；
[0012] 步骤6、对步骤5获取的八个预测模型进行统计，统计每个预测模型被选为最优预测模型的次数；
[0013] 步骤7、选择被选为最优预测模型次数最多的两个预测模型，作为最优预测模型的备选模型；
[0014] 步骤8、采用DM检验法对步骤7获取的两个备选模型进行预测能力差异检验，判断两个备选模型的预测能力的优劣及优劣程度，选择性能最优的模型作为最终的最优预测模型，完成时间序列预测模型的选择。
[0015] 本发明的优点：本发明提出了一种结合定性选择和定量选择的时间序列预测模型选择方法，能够基于时间序列特性实现定性模型选择、快速缩小候选预测模型的范围，能够基于预测模型适用性量化评价体系实现预测模型适用性的全面、准确的量化评价实现定量选择，从定性选择给出的候选预测模型中选择最优、最适合当前时间序列及预测需求的预测模型，为实际的时间序列预测应用提供一定的模型选择建议，尤其为无专业背景知识的人提供模型选择建议。本发明通过结合时间序列特性分析和量化的模型适用性评价，完成包含定性和定量两个环节的模型选择，实现最优模型的选择。通过定性选择完成候选模型范围的快速缩小和划定，通过定量选择完成客观、全面的量化评价和最优模型选择。最终可以为无经验人员在实际的时间序列预测应用中提供针对当前时间序列和预测需求的最优预测模型的参考建议。
【附图说明】
[0016] 图1是本发明所述基于统计信号处理的时间序列预测模型选择方法的原理图；
[0017] 图2是基于统计信号处理的时间序列预测的分类关系。
【具体实施方式】
【具体实施方式】 [0018] 一：下面结合图1说明本实施方式，本实施方式所述基于统计信号处理的时间序列预测模型选择方法，该选择方法的具体过程为：
[0019] 步骤1、获取输入时间序列的特性，根据时间序列种类和时间序列特性的对应关系，确定输入时间序列的种类；
[0020] 所述输入时间序列的特性包括幅值连续性、长记忆特性、季节性和趋势性；
[0021] 步骤2、对输入时间序列进行特性分析，获取时间序列种类与候选预测模型的映射关系；
[0022] 步骤3、根据确定的种类与候选预测模型的映射关系，将对应种类的m个候选预测模型作为定性选择预测模型；
[0023] 步骤4、采用与定性选择预测模型相同的建模时间序列，对定性选择预测模型进行相同步长的预测，根据预测结果获取定性选择预测模型的适用性量化评价指标，所述适用性量化评价指标包括整体误差指标、局部误差指标、无量纲准则性指标和实验性能指标；
[0024] 步骤5、根据步骤4中获取的适用性量化评价指标，获取整体误差指标中性能指标最优的两个预测模型，获取局部误差指标中性能指标最优的两个预测模型，获取无量纲准则性指标中性能指标最优的两个预测模型，获取实验性能指标中性能指标最优的两个预测丰旲型；
[0025] 步骤6、对步骤5获取的八个预测模型进行统计，统计每个预测模型被选为最优预测模型的次数；
[0026] 步骤7、选择被选为最优预测模型次数最多的两个预测模型，作为最优预测模型的备选模型；
[0027] 步骤8、采用DM检验法对步骤7获取的两个备选模型进行预测能力差异检验，判断两个备选模型的预测能力的优劣及优劣程度，选择性能最优的模型作为最终的最优预测模型，完成时间序列预测模型的选择。
[0028] 本实施方式中，步骤8所述的DM检验法时指Diebold-Mariano检验，是通过输出的统计量DM和假设机率p-value来判断两个模型是否存在明显的预测能力差异。假设对模型1和模型2的预测能力进行比较，若输出DM统计量为负值，表明模型2的预测能力比模型1的预测能力差，且DM统计量绝对值越大，二者预测能力相差越多。DM检验以两个预测模型存在明显预测能力差异为默认的假设，通过假设检验得到P-value取值，p-value越小表明显著度越高，则接受原假设，即两个模型的预测能力差异性越大。一般，P-value小于0. 05即为显著，p-value小于0. 01即为非常显著，即二者预测能力差异非常明显。
[0029] 本实施方式中，根据时间序列的幅值的连续性将其分为连续时间序列和离散时间序列；根据长记忆性的存在与否将时间序列分为长记忆性和短记忆性序列；根据时间序列季节性和趋势性的存在与否将时间序列分为相应的种类；按照稳定性分类，可以分为平稳时间序列和非平稳时间序列；按照时间序列中是否包含不确定性因素可以将时间序列分为确定性时间序列和随机性时间序列，随机性时间序列又可以分为平稳随机序列、非平稳随机序列和白噪声序列。现有的时间序列种类划分，一般依照一个或两个特性对时间序列进行简单的种类划分。而对于预测模型而言，往往对时间序列的要求要更为细化，简单的单指标对时间序列进行的二分类得到的种类与时间序列预测模型的对应性不好，使得某一类时间序列对应大量的预测模型。因此，有必要对现有的分类方法进行汇总，综合实际的预测需求以及模型的一般需求，采用多指标实现对时间序列的分类。时间序列的变动特征可以划分为四类：长期趋势、季节变动、循环变动和不规则变动。此外，时间序列的特性往往用随机性、平稳性和季节性进行刻画。因此，时间序列特性指标需要考虑到趋势性、季节性、随机性等特性。本实施方式采用的特性有：幅值连续性、长记忆性、趋势性、季节性。
【具体实施方式】 [0030] 二：本实施方式对实施方式一作进一步说明，步骤1所述时间序列种类和时间序列特性的对应关系为：
[0031] 时间序列特性为幅值连续、随机游走性的时间序列为种类1;
[0032] 时间序列特性为幅值连续、短记忆性的时间序列为种类2;
[0033] 时间序列特性为幅值连续、趋势性、季节性的时间序列为种类3;
[0034] 时间序列特性为幅值连续、趋势性、指数趋势的时间序列为种类4;
[0035] 时间序列特性为幅值连续、趋势性、非指数趋势的时间序列为种类5;
[0036] 时间序列特性为幅值连续、趋势性、复杂趋势的时间序列为种类6 ;
[0037] 时间序列特性为幅值连续、长记忆性、季节性的时间序列为种类7;
[0038] 时间序列特性为幅值连续、长记忆性、无季节性的时间序列为种类8;
[0039] 时间序列特性为幅值离散的时间序列为种类9。
【具体实施方式】 [0040] 三：本实施方式对实施方式一作进一步说明，步骤2所述对输入时间序列进行特性分析的具体过程为：
[0041] 回归预测模型，结合时间序列特性，回归预测模型能够预测幅值连续的时间序列，能够预测长记忆性或趋势增强性时间序列，尤其是具有线性趋势的时间序列，不能对指数趋势和复杂趋势的时间序列进行预测，对于季节特性的时间序列，将季节特性进行分离，对无季节的趋势特性进行回归拟合，并与季节特性叠加后能够进行预测，不能对单纯无趋势无季节特性的长记忆性时间序列进行预测，因此，回归预测模型用于预测种类3、5和7的时间序列；
[0042] 指数平滑模型，结合时间序列特性，指数平滑模型能够预测幅值连续的时间序列，指数平滑模型需要利用历史数据对当前数据进行预测，因此适用于趋势增强性的时间序列的预测，趋势包括上升趋势和下降趋势，指数平滑模型适用于预测带有水平、线性、二次、三次和指数规律性趋势特性的时间序列，能够预测有季节性的时间序列，因此，指数平滑模型用于预测种类3、4和5的时间序列；
[0043] 季节调整模型，适用于预测有季节性的时间序列，适用于单季节性的时间序列，季节调整模型用于预测种类3和7的时间序列；
[0044] 卡尔曼滤波模型，卡尔曼滤波模型是基于状态空间模型的最优递归滤波算法，适用于能够建立状态空间模型的时间序列的预测，能够建立状态空间模型的时间序列具备规律性特征，并且，卡尔曼滤波模型能够处理噪声，卡尔曼滤波模型适用于线性系统的预测，因此，卡尔曼滤波模型能够预测的时间序列不是随机或短记忆的，卡尔曼滤波模型能够预测趋势性数据的线性趋势，线性趋势包括上升趋势和下降趋势，还能够预测水平趋势且具备波动性的时间序列，因此，卡尔曼滤波模型用于预测种类5的时间序列；
[0045] 灰色模型，灰色模型能够对不确定性因素进行预测，适用于有指数变化趋势的时间序列，能够预测有指数趋势特征、波动性小、无季节性波动的时间序列，因此，灰色模型用于预测种类4的时间序列；
[0046]SARIMA模型，SARIMA模型是基于历史记录数据和误差数据实现对当前时间序列进行预测，能够预测经过季节性差分和邻近差分后能够平稳的时间序列，适用于预测幅值连续的时间序列，适用于预测有趋势增强特性、有季节特性的时间序列，不能预测无趋势的长记忆特性时间序列，因此，SARIMA模型用于预测种类3、4、5和6的时间序列；
[0047]HMM模型，能够预测双重随机过程，时间序列需要符合马尔科夫特性，因此能够预测随机游走时间序列，能够预测短记忆序列和离散序列，因此，HMM模型用于预测种类1、2 和9的时间序列；
[0048]BATS组合预测模型，是结合了指数状态空间模型、Box-Cox变换、ARMA残差、趋势模型和季节模型的组合预测模型，BATS组合预测模型用于预测种类3、4和5的时间序列；
[0049]ARFIMA模型，是利用分数阶差分实现时间序列长记忆性的模型，并利用ARMA模型对差分后的时间序列进行建模预测，对其短记忆性进行模型化，能够预测长记忆性的时间序列，因此，ARFIMA模型用于预测种类8的时间序列；
[0050] 季节分整ARFIMA模型，通过分数阶差分对长记忆性进行建模，利用季节性差分对季节特性进行处理，实现对含季节性的长记忆时间序列的建模预测，因此，季节分整ARFIMA 模型用于预测种类7的时间序列；
[0051] 双季节性Holt-Winters模型，对趋势性时间序列进行预测，因此，双季节性 Holt-Winters模型用于预测种类3的时间序列。
[0052] 本实施方式中，BATS组合预测模型为结合了Box-Cox变换、ARMA残差、趋势性和季节性特征组件的指数状态空间法的预测模型，BATS，Exponentialsmoothingstatespace modelwithBox-Coxtransformation，ARMAerrors，TrendandSeasonalcomponents〇
【具体实施方式】 [0053] 四：本实施方式对实施方式一作进一步说明，步骤2所述时间序列种类与候选预测模型的映射关系为：
[0054] 时间序列种类1对应的预测模型为HMM模型；
[0055] 时间序列种类2对应的预测模型为HMM模型；
[0056] 时间序列种类3对应的预测模型为回归预测模型、指数平滑模型、季节调整模型、 SARIMA模型、BAT组合预测模型和双季节性Holt-Winters模型；
[0057] 时间序列种类4对应的预测模型为指数平滑模型、灰色模型、SARIMA模型和BAT组合预测模型；
[0058] 时间序列种类5对应的预测模型为回归预测模型、指数平滑模型、卡尔曼滤波模型、SARIMA模型和BAT组合预测模型；
[0059] 时间序列种类6对应的预测模型为SARIMA模型；
[0060] 时间序列种类7对应的预测模型为回归预测模型、季节调整模型和季节分整 ARFIMA模型；
[0061] 时间序列种类8对应的预测模型为ARFIMA模型；
[0062] 时间序列种类9对应的预测模型为HMM模型。
【具体实施方式】 [0063] 五：本实施方式对实施方式一作进一步说明，步骤5所述获取整体误差指标中性能指标最优的两个预测模型的具体过程为：
[0064] 分别对每个预测模型的整体误差指标进行百分比分数计算，获得所有预测模型在整体误差指标下的适用性分数，并对所有预测模型在整体误差指标下进行加权平均，获得所有预测模型的综合适用性分数，对所有预测模型的综合适用性分数由低至高排序，并将综合适用性分数最低的两个预测模型作为第一组相对最优的两个模型。
[0065]
【具体实施方式】六：本实施方式对实施方式一作进一步说明，步骤5所述获取局部误差指标中性能指标最优的两个预测模型，的具体过程为：
[0066] 对预测模型在局部误差指标下的各项指标进行综合排名，获得每个预测模型在局部误差指标下的平均排名，并将平均排名最小的两个预测模型作为第二组相对最优的两个模型。
[0067]
【具体实施方式】七：本实施方式对实施方式一作进一步说明，步骤5所述获取无量纲准则性指标中性能指标最优的两个预测模型的具体过程为：
[0068] 对预测模型在无量纲准则指标下的各项指标进行综合排名，获得每个预测模型在无量纲准则指标下的平均排名，并将在平均排名最小的两个预测模型作为第三组相对最优的两个模型。
【具体实施方式】 [0069] 八：本实施方式对实施方式一作进一步说明，步骤5所述获取实验性能指标中性能指标最优的两个预测模型的具体过程为：
[0070] 对预测模型在多次实验性能指标下的各项指标进行综合排名，获得每个预测模型在多次实验性能指标下的平均排名，并将平均排名最小的两个预测模型作为第四组相对最优的两个模型。
[0071] 本发明中，时间序列种类、时间序列特性与候选预测模型的关系为：
[0072] 时间序列种类1的时间序列特性为幅值连续、随机游走性，对应的预测模型为HMM 模型；
[0073] 时间序列种类2的时间序列特性为幅值连续、短记忆性，对应的预测模型为HMM模型；
[0074] 时间序列种类3的时间序列特性为幅值连续、趋势性、季节性，对应的预测模型为回归预测模型、指数平滑模型、季节调整模型、SARIMA模型、BATS组合预测模型和双季节性 Holt-Winters模型；
[0075] 时间序列种类4的时间序列特性为幅值连续、趋势性、指数趋势，对应的预测模型为指数平滑模型、灰色模型、SARIMA模型和BATS组合预测模型；
[0076] 时间序列种类5的时间序列特性为幅值连续、趋势性、非指数趋势，对应的预测模型为回归预测模型、指数平滑模型、卡尔曼滤波模型、SARIMA模型和BATS组合预测模型；
[0077] 时间序列种类6的时间序列特性为幅值连续、趋势性、复杂趋势，对应的预测模型为SARIMA模型；
[0078] 时间序列种类7的时间序列特性为幅值连续、长记忆性、季节性，对应的预测模型为回归预测模型、季节调整模型和季节分整ARFIMA模型；
[0079] 时间序列种类8的时间序列特性为幅值连续、长记忆性、无季节性，对应的预测模型为ARFIMA模型；
[0080] 时间序列种类9的时间序列特性为幅值离散，对应的预测模型为HMM模型；
[0081] 上述对应关系如下：
[0082] 表1时间序列种类、时间序列特性和预测模型的对应关系
[0084] 其中：预测模型1表示回归预测模型，预测模型2表示指数平滑模型，预测模型3 表示季节调整模型，预测模型4表示卡尔曼滤波模型，预测模型5表示灰色模型，预测模型6 表示SARIMA模型，预测模型7表示HMM模型，预测模型8表示BATS组合预测模型，预测模型9表示ARFIMA模型，预测模型10表示季节分整ARFIMA模型，预测模型11表示双季节性Holt-Winters模型。
[0085] 本发明中，根据时间序列的特性将时间序列划分为九个种类，统计预测是应用最为广泛的预测方法，是对大量的数据资料进行统计特性分析以实现预测的理论和方法。基于统计信号处理的时间序列预测算法主要分为定性预测和定量预测两类，而本发明所关注的是定量预测问题。有些研宄中将统计定量预测分为回归预测法、经济计量模型法和时间序列预测法三类。其中，回归预测法根据回归模型是否为线性模型还分为线性回归与非线性回归两类。而时间序列预测法是最为常用的，根据所处理的时间序列是否为确定性时间序列，又可以分为确定性时间序列预测法和不确定性时间序列预测法。其中确定性时间序列预测法主要针对可以根据过去的历史数据变化特征外推将来时刻的时间序列变化特征的预测问题，主要包含移动平均法、指数平滑法、趋势外推法等方法。而不确定性预测方法主要针对包含一定不确定性和未知因素的时间序列，其未来时刻的状态无法完全通过历史数据特性获得，主要有灰色法、博克斯-詹金斯法等。此外，也有文献将统计预测方法分为定性预测法、回归预测法（包括经济计量模型法）、时间序列预测法和组合预测法四类。其中，时间序列预测法基于历史数据资料建立数学模型实现外推预测，如时间序列分解分析法、移动平均法、指数平滑法、趋势外推法、灰色预测法、状态空间模型法和卡尔曼滤波法等。也有研宄中将定量统计预测方法分为时间序列法（包含移动平均法、指数平滑法、季节周期法等确定性时间序列预测方法和ARIMA、回归预测法、马尔科夫法和系统动力学预测法等随机性时间序列预测方法）、模糊预测法和灰色系统预测法。
[0086] 本发明初步选择的预测类型及分类关系如图2所示，从图2中可以看出，选择的模型有：回归预测模型（包含趋势模型）、指数平滑模型、季节调整模型、卡尔曼滤波模型、灰色模型、SARIMA模型、HMM模型等单预测算法以及结合了Box-Cox变换模型、ARMA模型、趋势模型和季节周期法的BATS模型（组合预测算法代表）。增加ARFIMA模型、季节分整 ARFIMA模型和双季节性Holt-Winters模型。
[0087] 下面对选用的统计预测模型对于时间序列的特性要求进行分析，选择适合相应预测算法的时间序列特性。
[0088] 1、回归预测模型（包含趋势模型）：结合时间序列特性指标，回归预测法既适合幅值连续的时间序列的预测。由于回归预测适合能够用明确函数表征或有明显趋势的时间序列，时间序列前后时刻之间的关联性较大，必然不是完全随机的时间序列，因此对应的 Hurst指数应位于0. 5到1的范围内，为长记忆性或趋势增强性时间序列。所适用的时间序列应为能采用一定解析方程对其进行模型化的时间序列，这里所关注的主要是线性回归，因此更适合具有线性趋势的时间序列的预测，对于指数趋势和复杂趋势的适用性暂无法保证。对于含有季节特性的时间序列，经过一定处理，将季节特性进行分离，对无季节的趋势特性进行回归拟合，并与季节特性进行叠加，即可进行合理预测。此外，回归预测法主要刻画两个参量之间的相互关系，无法对时间序列内部呈现出的非趋势性的长记忆特性进行模型化，因此对于单纯无趋势无季节特性的长记忆性时间序列没有良好的预测能力。适合第 3、5、7类时间序列。
[0089] 2、指数平滑模型：结合时间序列特性指标，指数平滑法适合幅值连续的时间序列。由于指数平滑法与移动平均法类似，需要借助历史数据对当前数据进行预测，因此适合趋势增强性时间序列（上升或下降趋势）。指数平滑法适合处理带有水平、线性、二次、三次、指数等规律性趋势特性的时间序列，能够处理带有季节性的时间序列。适合的时间序列种类有第3、4、5类。
[0090] 3、季节调整模型：适合有季节性的时间序列，一般而言这类时间序列可能是趋势增强或长记忆性的。对于一般的季节调整法，适合单季节性的时间序列，适合的时间序列种类有第3、7种。
[0091] 4、卡尔曼滤波模型：卡尔曼滤波法是基于状态空间模型的一种最优递归滤波算法，适用于能够建立状态空间模型的时间序列。能够建立状态空间模型的时间序列都具备一定的规律性特征，并且卡尔曼滤波法算法能够处理较大的噪声。卡尔曼滤波算法主要处理线性系统的预测问题，内部隐含状态及状态和观测值之间均为线性关系。因此，卡尔曼滤波算法所能够处理的时间序列不可能是随机或短记忆的，这样，当前状态与历史状态之间才能建立相应的关系，卡尔曼滤波算法对于趋势性数据具备一定的预测能力，如上升、下降等线性趋势，对于水平趋势且具备一定波动性的时间序列也具有良好的预测能力。适合第 5类时间序列的预测。
[0092] 5、灰色预测模型：灰色预测法能够对不确定性因素进行预测，适合隐含有指数变化趋势的时间序列的预测。灰色预测法主要研宄部分信息已知、部分信息未知的小样本，具有需求信息少，无需考虑原始数据先验特性，可以对任意光滑的时间序列进行建模，但是对于中长期预测和波动性较强的时间序列的拟合度较差。也就是说，灰色模型建模预测的对象最好具备指数趋势特征、波动性小、无季节性波动等特征，主要适合的时间序列种类是第 4类时间序列。
[0093] 6、SARIMA预测模型：基于历史记录数据和误差数据实现对当前时间序列的预测，能够处理经过季节性差分和一般邻近差分后能够平稳的时间序列。SARIMA模型适合幅值连续的时间序列，适合具备趋势增强特性、季节特性等规律性特性的时间序列的预测，对于趋势的特性没有特殊要求，不能处理无趋势的长记忆特性时间序列。因此，SARIMA模型适合的时间序列种类有3、4、5、6类。
[0094] 7、HMM模型：适合双重随机过程，要求时间序列符合马尔科夫特性，因此适合随机游走时间序列的预测，此外适合短记忆序列和离散序列，所适合的时间序列种类为第1、2、9 类。
[0095] 8、组合模型-BATS模型：结合了指数状态空间模型、Box-Cox变换、ARMA残差、趋势模型和季节模型等方法，是一种组合式的预测模型，BATS组合模型能处理的时间序列的种类有3、4、5种。
[0096] 9、ARFIMA模型：利用分数阶差分实现时间序列长记忆性的模型化，并利用ARMA模型对差分后的时间序列进行建模预测，对其短记忆性进行模型化，主要适合长记忆性时间序列的预测问题，ARFIMA模型适合的时间序列为第8类时间序列。
[0097] 10、季节分整ARFIMA模型：通过分数阶差分对长记忆性进行建模，利用季节性差分对季节特性进行处理，实现对含季节性的长记忆时间序列的建模预测。适合的时间序列种类为第7类。
[0098] 11、双季节Holt-Winters模型：对于趋势性时间序列具备良好的预测能力，所能处理的时间序列是第3类。
[0099] 综合上述11种对预测模型的分析，可以得到九种时间序列与11种预测模型的对应关系如下：
[0100] 表2时间序列与预测模型的对应关系
[0102] 。
【主权项】
1. 基于统计信号处理的时间序列预测模型选择方法，其特征在于，该选择方法的具体过程为：步骤1、获取输入时间序列的特性，根据时间序列种类和时间序列特性的对应关系，确定输入时间序列的种类；所述输入时间序列的特性包括幅值连续性、长记忆特性、季节性和趋势性；步骤2、对输入时间序列进行特性分析，获取时间序列种类与候选预测模型的映射关系；步骤3、根据确定的种类与候选预测模型的映射关系，将对应种类的m个候选预测模型作为定性选择预测模型；步骤4、采用与定性选择预测模型相同的建模时间序列，对定性选择预测模型进行相同步长的预测，根据预测结果获取定性选择预测模型的适用性量化评价指标，所述适用性量化评价指标包括整体误差指标、局部误差指标、无量纲准则性指标和实验性能指标；步骤5、根据步骤4中获取的适用性量化评价指标，获取整体误差指标中性能指标最优的两个预测模型，获取局部误差指标中性能指标最优的两个预测模型，获取无量纲准则性指标中性能指标最优的两个预测模型，获取实验性能指标中性能指标最优的两个预测模型；步骤6、对步骤5获取的八个预测模型进行统计，统计每个预测模型被选为最优预测模型的次数；步骤7、选择被选为最优预测模型次数最多的两个预测模型，作为最优预测模型的备选丰旲型；步骤8、采用DM检验法对步骤7获取的两个备选模型进行预测能力差异检验，判断两个备选模型的预测能力的优劣及优劣程度，选择性能最优的模型作为最终的最优预测模型，完成时间序列预测模型的选择。2. 根据权利要求1所述的基于统计信号处理的时间序列预测模型选择方法，其特征在于，步骤1所述时间序列种类和时间序列特性的对应关系为：时间序列特性为幅值连续、随机游走性的时间序列为种类1 ; 时间序列特性为幅值连续、短记忆性的时间序列为种类2 ; 时间序列特性为幅值连续、趋势性、季节性的时间序列为种类3 ; 时间序列特性为幅值连续、趋势性、指数趋势的时间序列为种类4 ; 时间序列特性为幅值连续、趋势性、非指数趋势的时间序列为种类5 ; 时间序列特性为幅值连续、趋势性、复杂趋势的时间序列为种类6 ; 时间序列特性为幅值连续、长记忆性、季节性的时间序列为种类7 ; 时间序列特性为幅值连续、长记忆性、无季节性的时间序列为种类8 ; 时间序列特性为幅值离散的时间序列为种类9。3. 根据权利要求1所述的基于统计信号处理的时间序列预测模型选择方法，其特征在于，步骤2所述对输入时间序列进行特性分析的具体过程为：回归预测模型，结合时间序列特性，回归预测模型能够预测幅值连续的时间序列，能够预测长记忆性或趋势增强性时间序列，尤其是具有线性趋势的时间序列，不能对指数趋势和复杂趋势的时间序列进行预测，对于季节特性的时间序列，将季节特性进行分离，对无季节的趋势特性进行回归拟合，并与季节特性叠加后能够进行预测，不能对单纯无趋势无季节特性的长记忆性时间序列进行预测，因此，回归预测模型用于预测种类3、5和7的时间序列；指数平滑模型，结合时间序列特性，指数平滑模型能够预测幅值连续的时间序列，指数平滑模型需要利用历史数据对当前数据进行预测，因此适用于趋势增强性的时间序列的预测，趋势包括上升趋势和下降趋势，指数平滑模型适用于预测带有水平、线性、二次、三次和指数规律性趋势特性的时间序列，能够预测有季节性的时间序列，因此，指数平滑模型用于预测种类3、4和5的时间序列；季节调整模型，适用于预测有季节性的时间序列，适用于单季节性的时间序列，季节调整模型用于预测种类3和7的时间序列；卡尔曼滤波模型，卡尔曼滤波模型是基于状态空间模型的最优递归滤波算法，适用于能够建立状态空间模型的时间序列的预测，能够建立状态空间模型的时间序列具备规律性特征，并且，卡尔曼滤波模型能够处理噪声，卡尔曼滤波模型适用于线性系统的预测，因此，卡尔曼滤波模型能够预测的时间序列不是随机或短记忆的，卡尔曼滤波模型能够预测趋势性数据的线性趋势，线性趋势包括上升趋势和下降趋势，还能够预测水平趋势且具备波动性的时间序列，因此，卡尔曼滤波模型用于预测种类5的时间序列；灰色模型，灰色模型能够对不确定性因素进行预测，适用于有指数变化趋势的时间序列，能够预测有指数趋势特征、波动性小、无季节性波动的时间序列，因此，灰色模型用于预测种类4的时间序列； SARIMA模型，SARIMA模型是基于历史记录数据和误差数据实现对当前时间序列进行预测，能够预测经过季节性差分和邻近差分后能够平稳的时间序列，适用于预测幅值连续的时间序列，适用于预测有趋势增强特性、有季节特性的时间序列，不能预测无趋势的长记忆特性时间序列，因此，SARIMA模型用于预测种类3、4、5和6的时间序列； HMM模型，能够预测双重随机过程，时间序列需要符合马尔科夫特性，因此能够预测随机游走时间序列，能够预测短记忆序列和离散序列，因此，HMM模型用于预测种类1、2和9的时间序列； BATS组合预测模型，是结合了指数状态空间模型、Box-Cox变换、ARMA残差、趋势模型和季节模型的组合预测模型，BATS组合预测模型用于预测种类3、4和5的时间序列； ARFIMA模型，是利用分数阶差分实现时间序列长记忆性的模型，并利用ARMA模型对差分后的时间序列进行建模预测，对其短记忆性进行模型化，能够预测长记忆性的时间序列，因此，ARFIMA模型用于预测种类8的时间序列；季节分整ARFIMA模型，通过分数阶差分对长记忆性进行建模，利用季节性差分对季节特性进行处理，实现对含季节性的长记忆时间序列的建模预测，因此，季节分整ARFIMA模型用于预测种类7的时间序列；双季节性Holt-Winters模型，对趋势性时间序列进行预测，因此，双季节性Holt-Winters模型用于预测种类3的时间序列。4.根据权利要求1所述的基于统计信号处理的时间序列预测模型选择方法，其特征在于，步骤2所述时间序列种类与候选预测模型的映射关系为：时间序列种类1对应的预测模型为HMM模型；时间序列种类2对应的预测模型为HMM模型；时间序列种类3对应的预测模型为回归预测模型、指数平滑模型、季节调整模型、SARIMA模型、BAT组合预测模型和双季节性Holt-Winters模型；时间序列种类4对应的预测模型为指数平滑模型、灰色模型、SARIMA模型和BAT组合预测模型；时间序列种类5对应的预测模型为回归预测模型、指数平滑模型、卡尔曼滤波模型、SARIMA模型和BAT组合预测模型；时间序列种类6对应的预测模型为SARIMA模型；时间序列种类7对应的预测模型为回归预测模型、季节调整模型和季节分整ARFIMA模型；时间序列种类8对应的预测模型为ARFIMA模型；时间序列种类9对应的预测模型为HMM模型。5. 根据权利要求1所述的基于统计信号处理的时间序列预测模型选择方法，其特征在于，步骤5所述获取整体误差指标中性能指标最优的两个预测模型的具体过程为：分别对每个预测模型的整体误差指标进行百分比分数计算，获得所有预测模型在整体误差指标下的适用性分数，并对所有预测模型在整体误差指标下进行加权平均，获得所有预测模型的综合适用性分数，对所有预测模型的综合适用性分数由低至高排序，并将综合适用性分数最低的两个预测模型作为第一组相对最优的两个模型。6. 根据权利要求1所述的基于统计信号处理的时间序列预测模型选择方法，其特征在于，步骤5所述获取局部误差指标中性能指标最优的两个预测模型，的具体过程为：对预测模型在局部误差指标下的各项指标进行综合排名，获得每个预测模型在局部误差指标下的平均排名，并将平均排名最小的两个预测模型作为第二组相对最优的两个模型。7. 根据权利要求1所述的基于统计信号处理的时间序列预测模型选择方法，其特征在于，步骤5所述获取无量纲准则性指标中性能指标最优的两个预测模型的具体过程为：对预测模型在无量纲准则指标下的各项指标进行综合排名，获得每个预测模型在无量纲准则指标下的平均排名，并将在平均排名最小的两个预测模型作为第三组相对最优的两个模型。8. 根据权利要求1所述的基于统计信号处理的时间序列预测模型选择方法，其特征在于，步骤5所述获取实验性能指标中性能指标最优的两个预测模型的具体过程为：对预测模型在多次实验性能指标下的各项指标进行综合排名，获得每个预测模型在多次实验性能指标下的平均排名，并将平均排名最小的两个预测模型作为第四组相对最优的两个模型。
【专利摘要】基于统计信号处理的时间序列预测模型选择方法，涉及一种时间序列预测模型的选择方法，本发明为解决现有时间序列预测模型的选择效率低、准确度低，专业背景浅薄的工作人员无法快速、准确地选择时间序列预测模型的问题。本发明的具体过程为：获取输入时间序列特性，确定种类；根据种类与候选预测模型映射关系，将候选预测模型作为定性选择预测模型；获取适用性量化评价指标；分别获取整体误差指标、局部误差指标、无量纲准则性指标和实验性能指标中性能指标最优的两个；统计每个预测模型被选为最优的次数；选择次数最多的两个预测模型；进行预测能力差异检验，选择性能最优的模型作为最终的最优预测模型。本发明用于时间序列预测模型选择。
【IPC分类】G06F19/00
【公开号】CN104899451
【申请号】CN201510320604
【发明人】彭宇, 刘大同, 郭力萌, 彭喜元
【申请人】哈尔滨工业大学
【公开日】2015年9月9日
【申请日】2015年6月12日

2012-2014专利技术

最新回复(0)