个性化阅读
专注于IT技术分析

Pandas时间序列最全面的解析——

本文概述

时间序列数据被定义为重要的信息来源, 该信息提供了可用于各种业务的策略。从传统的金融行业到教育行业, 它包含许多有关时间的细节。

时间序列预测是一种处理时间序列数据的机器学习模型, 用于通过时间序列建模预测未来值。

Pandas具有与所有域的时间序列数据一起使用的广泛功能。通过使用NumPy datetime64和timedelta64 dtype。 Pandas整合了与其他Python库(如scikits.timeseries)不同的功能, 并创建了大量用于处理时间序列数据的新功能。

例如, Pandas支持解析来自各种来源和格式的时间序列信息。

导入包和数据

在开始之前, 你必须导入一些将使用numpy, pandas, matplotlib和seaborn的软件包。

你可以通过在代码中添加%matplotlib内联代码来附加要在Jupyter Notebook中绘制的图像, 也可以使用sns.set()切换到Seaborn默认设置:

# import packages
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline
sns.set()

日期和时间

Pandas提供了日期, 时间, 增量和时间跨度的功能数量。它主要用于数据科学应用。

本地日期和时间

我们在datetime模块中有两个可用的本地日期和时间。通过使用dateutil函数, 我们还可以在日期和时间上执行许多有用的功能。你还可以使用多种字符串格式解析日期:

范例1:

import pandas as pd   
# Create the dates with frequency   
info = pd.date_range('5/4/2013', periods = 8, freq ='S')   
info

输出

DatetimeIndex(['2013-05-04 00:00:00', '2013-05-04 00:00:01', '2013-05-04 00:00:02', '2013-05-04 00:00:03', '2013-05-04 00:00:04', '2013-05-04 00:00:05', '2013-05-04 00:00:06', '2013-05-04 00:00:07'], dtype='datetime64[ns]', freq='S')

范例1:

import pandas as pd 
# Create the Timestamp 
p = pd.Timestamp('2018-12-12 06:25:18') 
# Create the DateOffset 
do = pd.tseries.offsets.DateOffset(n = 2) 
# Print the Timestamp 
print(p) 
# Print the DateOffset 
print(do)

输出

2018-12-12 06:25:18
<2 * DateOffsets>

赞(0)
未经允许不得转载:srcmini » Pandas时间序列最全面的解析——

评论 抢沙发

评论前必须登录!