时间:2023-01-19 | 标签: | 作者:Q8 | 来源:网络
小提示:您能找到这篇{用数据预测未来:时间序列分析}绝对不是偶然,我们能帮您找到潜在客户,解决您的困扰。如果您对本页介绍的用数据预测未来:时间序列分析内容感兴趣,有相关需求意向欢迎拨打我们的服务热线,或留言咨询,我们将第一时间联系您! |
应用背景: 通过分析序列进行合理预测,做到提前掌握未来的发展趋势,为业务决策提供依据,这也是决策科学化的前提。 时间序列分析: 时间序列就是按时间顺序排列的一组数据序列。 时间序列分析就是发现这组数据的变动规律并用于预测的统计技术。 分析工具: SPSS(数据分析的重量级应用,与SAS二选一) 实践案例:通过历史数据预测未来数据,所涉及的都是最简单的实践,抛砖引玉,重在方法,不论多复杂的数据,方法是一样的。 如已知前几年每月的销售量,预测未来的销售量。 一、时间序列分析简介时间序列分析有三个基本特点:
并不是所有的时间序列都一定包含四种因素,如以年为单位的诗句就可能不包含季节变动因素。 四种因素通常有两种组合方式:
其中,原始时间序列值和长期趋势可用绝对数表示;季节变动、循环变动、不规则变动可用相对数(变动百分比)表示。 二、季节分解法当我们对一个时间序列进行预测时,应该考虑将上述四种因素从时间序列中分解出来。 为什么要分解这四种因素?
所有的时间序列都要分解这四种因素吗? 通常情况下,我们考虑进行季节因素的分解,也就是将季节变动因素从原时间序列中去除,并生成由剩余三种因素构成的序列来满足后续分析需求。 为什么只进行季节因素的分解?
综上所述:当一个时间序列具有季节变动特征时,在预测值钱会先将季节因素进行分解。 步骤:
1、定义日期标示变量 时间序列的特点就是数据根据时间点的顺序进行排列,因此分析之前,SPSS需要知道序列的时间定义,然后才能进行分析时间特征。 根据源数据的格式进行选择,并输入第一个个案的具体数值。 此时会在源文件中生成三个新的变量。 2、了解序列发展趋势 完成日期标示变量的定义之后,需要先对时间序列的变化趋势有所了解,便于选择合适的模型。即通过序列图,确定模型是乘性还是加性。 变量为”销售数据“,时间轴标签为”DATE–“,也就是我们自定义的时间。 数据销量序列图 如何根据序列图来判断模型的乘性或加性?
本例很明显:随着时间变化,销售数据的季节波动越来越大,那么使用乘法模型会更精确。 3、进行季节因素分解 靠谱网站建设变量为”销售数据“,且根据序列图我们知道时间序列模型为乘性。 提示您会新生成四个变量
如图,周期为12个月,季节因子12个月循环一次。 完成季节因素分解后的序列和原始序列之间有什么差异? 通过回执序列图的方法把原始序列和除去季节因子的三个序列(误差序列、季节因素校正后序列、长期无视和循环变动序列)进行比较。 要做四个序列图,会有四个变量:
因为误差序列数值非常小,所以长期趋势和循环变动序列(长期趋势+循环变动)与季节因素校正后序列(长期趋势+循环变动+不规则变动,即误差)能够基本重合。 在单独做”季节因子SAF“的序列图: 因为是做”季节因子“的序列图,所以只有一个变量”季节因子SAF“ 我们看出:季节因素的周期是12个月,先下降,然后上升到第一个顶点,再有略微的下降后,出现明显的上升趋势,到第七个月时达到峰值,然后一路下跌,直到最后一个月份有所回升,之后进入第二个循环周期。 通过对原始序列的季节分解,我们更好的掌握了原始序列所包含的时间特征,从而选用适当的模型进行预测。 三、专家建模法时间序列的预测步骤有四步:
平稳性主要是指时间序列的所有统计性质都不会随着时间的推移而发生变化。 对于一个平稳的时间序列,具备以下特征:
自相关系数是研究序列中不同时期的相关系数,也就是对时间序列计算其当前和不同滞后期的一系列相关系数。 平稳化的方法——差分。 差分就是指序列中相邻的两期数据之差。
具体的平稳化操作过程会有专家建模法自动处理,我们只需要哼根据模型结果独处序列经过了几阶差分即可。 时间序列分析操作: 要分析所有变量,所以选择”销售数据“。 【专家建模器】–【条件】,勾选”专家建模器考虑季节性模型“。 勾选”预测值“,目的是生成预测值,并保存模型。 时间序列分析结果解读该表显示了经过分析得到的最优时间序列模型及其参数,最优时间U型猎魔性为ARIMA(0,1,1)(0,1,1) 求和自回归移动平均模型ARIMA(p,d,q)(P,D,Q)
P,D,Q分别表示包含季节性变化的序列所做的事情。 因此本例可解读为:对除去季节性变化的序列和包含季节性变化的序列分别进行了一阶差分和一次移动平均,综合两个模型而建立出来的时间序列模型。 该表主要通过R方或平稳R方来评估模型拟合度,以及在多个模型时,通过比较统计量找到最优模型。 由于原始变量具有季节性变动因素,所以平稳的R方更具有参考意义,等于32.1%,拟合效果一般。 该表提供了更多的统计量可以用来评估时间序列模型的拟合效果。 虽然平稳R方仅仅是32.1%,但是”杨-博克斯Q(18)“统计量的显著性P=0.706,大于0.05(此处P>0.05是期望得到的结果),所以接受原假设,认为这个序列的残差符合随机分布,同时没有离群值出现,也都反映出数据的拟合效果还可以接受。 时间序列应用预测: 未来一年是到2016年12月,手动输入即可。 这是未来一年的销售趋势。 如果想从全局来观察预测趋势,可以在把这一年的趋势和以前的数据连接起来 此时的变量应该是”原始的销售数量“和”2016年的预测销售数量“。 结果如下: 也可以在表中查看具体的数值:
作者:膝盖哥,是一枚“跪着提需求”的产品经理。常说“不用不用,真的不用了,我跪着就好!” 本文由 @膝盖哥 于。,。 |
上一篇:以数据分析师的视角,该如何做竞品分析?
下一篇:支付风控系统设计:风控数据仓库建设(二)
小提示:您应该对本页介绍的“用数据预测未来:时间序列分析”相关内容感兴趣,若您有相关需求欢迎拨打我们的服务热线或留言咨询,我们尽快与您联系沟通用数据预测未来:时间序列分析的相关事宜。
关键词:数据分析, 时间序列分析