Fork me on GitHub

python-for-data-时间序列基础

Python-for-data-时间序列、频率和移位

本文中主要介绍的是pandas中时间序列基础、日期生成及选择、频率和移位等。

时间序列基础

pandas中的基础时间序列种类是时间戳索引的Series;在pandas的外部则表现为Python字符串或者datatime对象。

时间序列作为S型数据索引(不连续)

生成连续的S型数据索引

通过date_range方法实现,4个参数:

  • 开始时间
  • 结束时间
  • 频率,默认是天
  • 指定的长度

image-20200510203750237

时间序列算术上的对齐

索引、选择、子集

索引

image-20200510204103807

选择

重复索引的处理

image-20200510204456405

日期范围、频率和移位

日期范围

两个主要的函数:

  • date_range:生成的是DatetimeIndex格式的日期序列
  • period_range:生成PeriodIndex的时期日期序列

频率别名和偏置类型

频率和日期偏置

pandas中的频率由基础频率和倍数频率组成。

  • 基础频率通常会有字符串别名
  • 基础频率前面放置一个倍数,形成倍数频率

image-20200510204841523

生成带频率的数据

锚定偏置量

频率描述点的时间并不是均匀分布的,'M’表示月末,'BM’表示月内最后的工作日,取决于当月天数

移位shift

Shift用法

使用偏置进行移位日期

pandas日期偏置可以使用datetime或者Timestamp对象完成

锚定偏置量

移位和groupby连用

本文标题:python-for-data-时间序列基础

发布时间:2020年05月10日 - 21:05

原始链接:http://www.renpeter.cn/2020/05/10/python-for-data-%E6%97%B6%E9%97%B4%E5%BA%8F%E5%88%97%E5%9F%BA%E7%A1%80.html

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。

Coffee or Tea