博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
pandas 数据处理实例
阅读量:5739 次
发布时间:2019-06-18

本文共 749 字,大约阅读时间需要 2 分钟。

描述:行标签为日期,列标签为时间,表哥的值是 float 的数值

# 一、 读取 csv 文件
df=pd.read_csv("delay_3.csv",encoding = "utf-8")
# 二、 默认读取是行索引是 0 开始计数的,datestr 被作为文本读成了单元格数据,将datestr 转换成时间,并建立索引
# 2.1 要把 datestr 列转换成时间格式
df['datestr'] = pd.to_datetime(df['datestr'])
# 2.2 通过 set_index 重新设置新的列
df.set_index("datestr", inplace=True)
# 三、数据预处理,因为数据本身存在很多 空白数据,空白数据是 - (减号)
# 3.1 转换数据为数字类型,转换错误的数据,自动填充为 NAN
df=df.apply(pd.to_numeric, errors='coerce')
# 3.2 通过填充命令将数据填充 填充的规则是按照前一行,同一列进行填充
#print df.isnull().sum()
df=df.fillna(method='ffill')‘
# 查看下为 仍然为 null 的数据数量
#print df.isnull().sum()
#四、 通过切片进行访问,切出 这些天,每天的这些时刻的数据
df['2018-01-08':'2018-01-15','06:00':'20:00']
#五、分行和分列进行聚集操作
# 5.1 按列(时段)聚集
df.mean()
# 5.2 按日期(行)聚集
df_new=df.T
df_new.mean()
# 5.3 所有的数据取一个平均值
df.mean().mean()

转载地址:http://dwfzx.baihongyu.com/

你可能感兴趣的文章
Spring 拦截器 学习
查看>>
Nginx Location配置总结
查看>>
nodejs 完成mqtt服务端
查看>>
在ASP.NET MVC 中获取当前URL、controller、action
查看>>
Spring IoC容器初的初始化过程
查看>>
ScrollView has ambiguous scrollable content height
查看>>
linux下启动mysql的命令
查看>>
Windows 2003 AD 单域环境的实现(多站点) 基本
查看>>
《JAVA编程思想》学习笔记——第十章 内部类
查看>>
第57课:Spark SQL on Hive配置及实战
查看>>
redis 问题
查看>>
冒泡排序法
查看>>
IOS 编译ffmpeg
查看>>
如何实现jqGrid数据导出
查看>>
开源 java CMS - FreeCMS2.8 数据对象 infoImg
查看>>
最近要读的文章
查看>>
文件系统管理 之 有关ext2文件系统下反删除(Undelete)操作恢复数据的文档
查看>>
UITextField 文本框
查看>>
iOS app 审核 重大bug快速发布修改通道
查看>>
Android组件化与插件化开发
查看>>