需求:需要将间隔为1小时的数据通过线性插值转为以5分钟为间隔的数据
思路:利用pandas,先进行重采样,再进行线性插值即可,最后将数据以表格形式输出。
import
pandas
as
pd
df
=
pd
.
read_excel
(
r"D:\Testnumber\PM10day.xlsx"
,
sheet_name
=
'PM10'
)
df
.
index
=
pd
.
period_range
(
'2021/6/1 8:00:00'
,
freq
=
"H"
,
periods
=
11
)
df
=
df
.
resample
(
'5min'
,
convention
=
'start'
)
.
asfreq
(
)
df
=
df
.
interpolate
(
)
print
(
df
)
writer
=
pd
.
ExcelWriter
(
'D:\Testnumber\PM10results8.xlsx'
)
df
.
to_excel
(
writer
)
writer
.
save
(
)
writer
.
close
(
)
一切文章皆为原创,转载请注明来源@小小梁的实验室
https://blog.csdn.net/weixin_41685388/article/details/103860881?utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7Edefault-2.no_search_link&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7Edefault-2
将下面的csv
数据
对应到每
间隔
五
分钟
的时间序列上保证
数据
完整
详细描述: 时间区间
数据
对应 主要是将把每五
分钟
区间内的
数据
对应到五
分钟
倍数的区间上:example 将0,1 ,2
分钟
数据
对应到00:00, 将3, 4, 5到10
分钟
之间的
数据
,将5, 6 ,7
分钟
数据
对应到第五
分钟
,将7, 8 ,9, 10, 11 12
分钟
数据
对应到第10
分钟
, 13, 14, 15, 16, 17对应到第15
分钟
依此类推
原始
数据
没有用于timedelta对象的内置格式化程序,但您自己很容易做到:days, seconds = duration.days, duration.secondshours = days * 24 + seconds // 3600minutes = (seconds % 3600) // 60seconds = seconds % 60或者,等价地说,如果您
使用
的是
Python
2.7+或3.2...
写在前面的话:拿到每一份
数据
时请认真思考我们应该做些什么怎么做。
在真实
数据
中,我们拿到的
数据
可能包含了大量的缺失值,可能包含大量的噪音,也可能因为人工录入错误导致有异常点存在,非常不利于算法模型的训练。因此
数据
的预处理也就变得格外重要!
首先,需要明白插值问题和拟合的区别和联系
虽然两者都是根据实际中一组已知
数据
来构造一个能够反映
数据
变化规律的近似函数的方法。
拟合需要得到近似函数...
Period
Pandas
的Period可以定义一个时期,或者说具体的一个时段。有这个时段的起始时间start_time、终止时间end_time等属性信息,其参数freq和之前的date_range里的freq参数类似,可以取'S'、'D'等。
import
pandas
as pd
p = pd.Period('2018-12-15', freq = "A")
print p.start_time, p.end_time, p + 1, p
print pd.Period('2013-1-9 11
1.首先
使用
excel中的HOUR()函数,将日期
数据
(年/月/日 时:分:秒)
转换
为
小时
,表格命名为hour.xlsx:
2.
使用
python
读取excel
数据
hour.xlsx,将
小时
列
转换
为列表hour, 将列表hour
转换
为集合myset,
使用
count函数统计24
小时
各
小时
区间点的个数:
#读取excel
小时
数据
,统计各
小时
区间点的数量
import matplotlib as mpl
import
pandas
as pd
import numpy as np
from collections
问题群友提问:请问用
python
语言,怎么求这个故障
时长
?想了好久,总不对。严小样儿:安排!安排(原始
数据
)一、导包读数1import
pandas
aspd2importdatetime3data=pd.read_excel("工作簿1.xlsx",usecols=[iforiinrange(6)])二、时差计算1#先求出现在时间,便于做时间差值2now=date...