本文概述
时间序列是在特定时间段或时间间隔内构建或索引的数据点的字符串。更具体地说, 它是在连续相等间隔的时间点获取的变量的有序数据点序列。时间序列分析包含用于检查和分析时间序列数据的技术, 以便从数据中获得雄辩的见解。它有助于获得对导致特定趋势的数据点内在作用力的理解。这进一步有助于预测未来的数据点。这是通过基于先前的数据点创建模型以预测未来的数据点来实现的。
主要有四个因素或元素负责时间序列数据的任何变化。这些因素通常称为时间序列分析的组成部分, 如下所示:
- 发展趋势
- 季节性运动
- 循环运动
- 随机或不规则运动
可以应用时间序列的某些领域是-销售预测, 股票市场分析, 库存管理, 天气分析, 趋势识别等。如建议的那样, 在对时间序列数据进行任何测试之前, 建议以图形方式分析数据。
在本教程中, 你将学习时间序列分析, 并将涵盖以下主题:
- ACF和PCF
- 移动平均线
- 电子表格中的移动平均线
- 霍尔特线性
- 电子表格中的Holt Linear
- 总结
ACF和PCF
顾名思义, 自相关是变量在两个不同数据时间点与其自身的线性相关性。此函数用于确定系列的当前值与其过去的值之间的关联度。 ACF在找到相关性时会考虑时间序列的所有组成部分, 即趋势, 季节性, 周期性和随机(残差)。因此, 这是一个完整的自相关图。 ACF是确认任何积极或消极趋势的好方法;对于积极的趋势, 你将看到ACF永远不会下降。
确定任何两个变量之间的线性关系的另一种方法是通过部分自相关函数。测量两个随机项x和xt-1之间的相关性的另一种方法是仅关注相关性部分, 这由xt和xt + 1解释并消除了介于xt之间的随机变量的线性影响+1, …, xt + n, 然后确定转换后的随机变量的相关性。该过程称为部分自相关函数。
移动平均线
移动平均线使时间序列数据变得平滑, 从而清楚地指示趋势在哪里。移动平均值通过消除噪声来帮助平滑数据。为了计算移动平均值, 你将采用数据变量的算术平均值。移动平均分为两种类型, 分别为:
- 简单移动平均线:简单移动平均线通过采用一组给定值的算术平均值来计算。例如, 要计算收盘价的5天基本移动平均线, 你需要将过去5天的收盘价加起来, 然后将结果除以5。移动平均线的主要功能之一是确定趋势(资源)。
资源
其中, m = 2k + 1。也就是说, 通过对t个k周期内的时间序列值进行平均(源), 可以得到t时刻趋势周期的估计值。
第1-30天
第2天-50
第3天-100
第四天-40
第5天-35天
简单移动平均线= 30 + 50 +100 + 40 + 35/5
= 255/5
= 51
-指数移动平均线:指数移动平均线(EMA)是一种权重并强调最新数据点的移动平均线(MA), 因为如果存在带有尖峰的数据点, 则可以操纵简单的移动平均线。因此, 指数移动平均线也称为指数加权移动平均线。例如, 如果要计算以上数据, 则将使用以下公式:
对于给定的n序列, 其中N = 5
EMA = [系列中的最后一个值-倒数第二个值](2 / n + 1)+倒数第二个值,
EMA =(35-40)(2/6)+ 40
均线= 35.33
电子表格中的移动平均线
将简单移动平均值应用于电力销售数据。让我们计算3MA或3均线:
1.首先绘制数据并查看趋势。
2.添加一个名为”三个移动平均线(3MA)”的列, 然后应用该公式。对于3 MA, k值为-1、0、1。你取前三个术语, 当前术语和下一个术语的平均值。对于第一项和最后一项, 无法计算3MA, 因为我们没有考虑前一项和后一项。
3.我们将在C3, = AVERAGE(B2:B4)中应用该函数。这将得到3 MA的值。
4.将此公式从单元格C4复制并粘贴到C20。你将拥有价值。
5.现在选择数据和3MA列并绘制时间序列。要在同一图形中绘图, 请选择数据并添加系列名称3MA。取消选择第一个和第20个条目, 因为在3MA中, 这些值为零, 然后单击”确定”。
同样, 你可以执行5 MA, 7MA等操作。
霍尔特线性
到目前为止, 你已经看到了各种预测方法, 但是你可以看到这些模型不适用于变化较大的数据。例如, 如果你要预测未来的比特币价格(目前正在上涨), 则使用上述方法不是一个好的选择。
如果你使用上述任何一种方法, 这些方法将不会考虑趋势。如前所述, 趋势是时间序列数据的组成部分, 它代表时间序列的长期移动。因此, 你需要一种无需任何假设即可精确确定趋势的方法。因此, 你将使用Holt的线性趋势方法。
Holt的线性方法也被称为双指数平滑技术。此方法包含三个方程, 分别是预测方程和两个平滑方程,
对于第一个方程, lt表示在时间t处时间序列水平的评估, bt表示在时间t处时间序列斜率的评估。
对于第二个方程式并确定当前数据的趋势, 首先通过将bt-1添加到最后的平滑值lt-1来确定上一个周期的趋势。这有助于消除滞后并使当前数据达到近似水平。由于数据中可以包含一些随机性或误差项, 因此为了消除该误差, 可以通过使用β(lt-lt-1)(最后一个周期的趋势)进行平滑并将其添加到先前的值中来对趋势进行调整。趋势。最后一个方程用于预测最终趋势。
电子表格中的Holt Linear
让我们使用电子表格解决此问题。你要从霍尔特线性方法的书” Spyros G. Makridakis, Steven C. Wheelwright, Rob J Hyndman-Forecasting_Methods and Applications-Wiley(1997)”中获取数据集。
- 要初始化该过程, 你需要两个估计值-一个用于获得L1的第一个平滑值, 另一个获得趋势b1的值。一种替代方案是设置L1 = Y1且b1 = Y2-Y1或(Y4-Y1)/ 3。
- 在初始水平, 你认为α= 0.501和β= 0.072。这些你需要优化。无论你获得最小MSE的α和β值是多少, 都可以使用MSE(均方误差)进行优化, 将其视为超参数值。
- 让我们将这些公式放入excel以获取预测值。在第三等式中, 滞后1(平均m = 1)。
- 至于初始阶段, L1 = Y1, b1 = Y2 – Y1。让我们在excel中分配这些值。
- 让我们使用公式来计算L2, b2和F2的值。
- 现在, 将所有三个公式复制并粘贴到文件中可用数据的末尾。
你将拥有所有这些值。现在, 如果要预测第25个周期, 则应考虑m = 1, 如果要预测第26个周期, 则应考虑m = 2, 依此类推。
- 让我们计算不同时期的预测值。
对于m = 1,
对于m = 2,
同样, 你可以在不同的时期进行计算。
总结
恭喜, 你已完成本教程的结尾!
在本教程中, 你涵盖了有关时间序列分析的许多详细信息。你已经了解了ACF和PCF, 移动平均值, 电子表格中的移动平均值, 电子表格中的Holt Linear和Holt Linear。
希望你现在可以利用时间序列分析概念来检验假设。感谢你阅读本教程!
如果你想了解更多有关电子表格的信息, 请查看srcmini的”电子表格统计简介”课程。
评论前必须登录!
注册