• 主页
  • 当你的数据不是在偶数时间间隔时,有没有一种快速的方法来以偶数时间间隔对Pandas Dataframe进行滚动求和?

当你的数据不是在偶数时间间隔时,有没有一种快速的方法来以偶数时间间隔对Pandas Dataframe进行滚动求和?

假设我有一个数据帧,其中的索引是时间戳。但是,时间戳的时间间隔不均匀,所以我想让它均匀一些。例如,我想将时间间隔设置为1分钟时间间隔。我想求和所有从t0到t1的值,并将其和为t1的值。

我一直使用的方法是通过一个循环。首先,我创建了一个带有开始和结束时间的时间戳列表。然后,我将我的数据帧子集成一个小数据帧,然后在这个小数据帧上进行我的计算(在本例中是总和)。然后我将我的值保存到一个列表中。再重复一遍。

不幸的是,这需要很长时间。

有没有更快的方法来做这件事?我在一个非常小的时间尺度上处理数据,所以我认为用0数据创建额外的行并使用内置的滚动和函数是没有意义的……

数据示例如下:

2020-04-01 00:03:48.197028     1
2020-04-01 00:24:07.186631    11
2020-04-01 00:24:07.200361     5
2020-04-01 00:24:07.204382     1
2020-04-01 00:24:07.208525    13

我想把它转换成类似这样的东西:

2020-04-01 00:24:00.000000     sum(23:59 to 24:00)
2020-04-01 00:24:01.000000     sum(24:00 to 24:01)
2020-04-01 00:24:02.000000     sum(24:01 to 24:02)
2020-04-01 00:24:03.000000     sum(24:02 to 24:03)
2020-04-01 00:24:04.000000     sum(24:03 to 24:04)

转载请注明出处:http://www.jubohx.com/article/20230504/1767588.html