本文概述
时间序列数据被定义为重要的信息来源, 该信息提供了可用于各种业务的策略。从传统的金融行业到教育行业, 它包含许多有关时间的细节。
时间序列预测是一种处理时间序列数据的机器学习模型, 用于通过时间序列建模预测未来值。
Pandas具有与所有域的时间序列数据一起使用的广泛功能。通过使用NumPy datetime64和timedelta64 dtype。 Pandas整合了与其他Python库(如scikits.timeseries)不同的功能, 并创建了大量用于处理时间序列数据的新功能。
例如, Pandas支持解析来自各种来源和格式的时间序列信息。
导入包和数据
在开始之前, 你必须导入一些将使用numpy, pandas, matplotlib和seaborn的软件包。
你可以通过在代码中添加%matplotlib内联代码来附加要在Jupyter Notebook中绘制的图像, 也可以使用sns.set()切换到Seaborn默认设置:
# import packages
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline
sns.set()
日期和时间
Pandas提供了日期, 时间, 增量和时间跨度的功能数量。它主要用于数据科学应用。
本地日期和时间
我们在datetime模块中有两个可用的本地日期和时间。通过使用dateutil函数, 我们还可以在日期和时间上执行许多有用的功能。你还可以使用多种字符串格式解析日期:
范例1:
import pandas as pd
# Create the dates with frequency
info = pd.date_range('5/4/2013', periods = 8, freq ='S')
info
输出
DatetimeIndex(['2013-05-04 00:00:00', '2013-05-04 00:00:01', '2013-05-04 00:00:02', '2013-05-04 00:00:03', '2013-05-04 00:00:04', '2013-05-04 00:00:05', '2013-05-04 00:00:06', '2013-05-04 00:00:07'], dtype='datetime64[ns]', freq='S')
范例1:
import pandas as pd
# Create the Timestamp
p = pd.Timestamp('2018-12-12 06:25:18')
# Create the DateOffset
do = pd.tseries.offsets.DateOffset(n = 2)
# Print the Timestamp
print(p)
# Print the DateOffset
print(do)
输出
2018-12-12 06:25:18
<2 * DateOffsets>
评论前必须登录!
注册