本文中记录Pandas
操作技巧,包含:
- 导入数据
- 导出数据
- 查看、检查数据
- 数据选取
- 数据清洗
- 数据处理:Filter、Sort和GroupBy
- 数据合并
常识
1 | # 导入pandas |
导入数据
1 | pd.read_csv(filename) # 从CSV文件导入数据 |
导出数据
1 | df.to_csv(filename) # 导出数据到CSV文件 |
查看、检查数据
1 | df.head(n) # 查看DataFrame对象的前n行 |
数据选取
1 | df[col] # 根据列名,并以Series的形式返回列 |
数据清理
1 | df.columns = ['a','b','c'] # 重命名列名(需要将所有列名列出,否则会报错) |
数据处理:Filter、Sort和GroupBy
1 | df[df[col] > 0.5] # 选择col列的值大于0.5的行 |
数据合并
1 | df1.append(df2) # 将df2中的行添加到df1的尾部 |
数据统计
1 | df.describe() #查看数据值列的汇总统计 |