df['timestamp'] = pd.to_datetime(df['timestamp'])
df['hour'] = df['timestamp'].dt.hour
df['month'] = df['timestamp'].dt.month
# mean取平均值
df_agg = df.groupby("month")["hum"].mean().reset_index()
print(df_agg)
2、运行结果
month hum
0 1 77.543376
1 2 74.905813
2 3 71.903781
3 4 67.532337
4 5 66.367272
5 6 68.945148
6 7 64.383525
7 8 67.289420
8 9 71.753228
9 10 77.639621
10 11 78.732517
11 12 81.032345
菜鸟实战,持续学习!
# 这段代码可以将时间序列的
数据
进行汇总,日->
月
->年
# 使用时,先读入文件,然后保留字段到仅有时间列和值列,通过对时间列的切片,以实现分组汇总功能
import
pandas
as pd
# 读取文件
file = r'D:\Desktop\Statistical_index.xlsx'
df = pd.read_excel(file)
# 查看原始字段
print(df.head())
#删除无关字段
del df['keyword']
del df['type'
1、加载nc
数据
import xarray as xr
ds=xr.open_dataset(r'E:\Allmode\salem_russia\russia_pr\salemtrans_0.5_pr_Amon_BCC-CSM2-MR_ssp126_r1i1p1f1_gn_2020_2050.nc.nc').load()
pr=ds.pr*86400*30
lon=ds.lon
lat=ds.lat
打印一下:
2、截取研究时间段并按
月
2021,已经过去了。在整理当年工作输出时,想量化下当年开发的报表数量,以及看下上半年集成
数据
后,报表开发的工作占比是否下降。
想了下,可以用项目组下个人目录下的各
月
报表数量,来量化下上述情况。
思路很简单,用
Python
的 os / pathlib 库,拿到个人目录下的文件路径及其创建的时间,再按
月
汇总计数即可,代码如下:
import os
from datetime import datetime
import
pandas
as pd
# 输入参数
FILE_PATH = '你的个人目录绝
先观察一下要处理的
数据
是怎样的,原始文件是有五组分隔开的
数据
,第一行是表示组名,第二行是列标签,第三行开始才是真正的
数据
。很容易就会想到使用
pandas
来处理这个文件了。
首先读取文件并创建一个dataframe对象
import
pandas
as pd
df = pd.read_excel('use_nofillvalue(1).xlsx')
查看df的内容,可以看到列标签很多都是Unamed,是因为本来文件表格就是空的,因此也读取不到内容。而后面使用mean()求平均时,要使用标签Year和Mon
#求'ave_time'这一列的
平均值
aveTime=df['ave_time'].mean()
#把ave_time这列的缺失值进进行填充,填充的方法是按这一列的
平均值
进行填充
df2=df.fillna(aveTime)
# 把处理过的这一列的
数据
取出来
col=df2.iloc[:,
「销售订单excel物料」https://www.aliyundrive.com/s/8yihmUZPhWK
数据
分析的三大作用:现状分析、原因分析、预测分析,现状分析可以表明当前的业务状况,对当前的业务状况做分析,可以给决策者提供一个
数据
支撑和参考。
本节使用一组销售订单明细
数据
,研究不同产品的订单数和销量情况,同时研究每个分拨中心的销量占比以及哪些
月
份订单量最多,综合
数据
分析的结果给业务决策热提供
数据
支持。
1、使用
pandas
包导入
数据
,其中parse_dates用于解析日期。
2、订单前
@创建于:20210716
@修改于:20210716
文章目录1、
pandas
.Series.dt.year() 和
pandas
.Series.dt.month() 方法提取
月
份和年份2、strftime() 方法提取年份和
月
份3、
pandas
.DatetimeIndex.month 和
pandas
.DatetimeIndex.year 提取年份和
月
份4、参考资料
1、
pandas
.Series.dt.year() 和
pandas
.Series.dt.month() 方法提取
月
份和年份
应用于 Da