PHP前端开发

如何检测 pandas DataFrame 中是否存在间隔两个月以上的记录?

百变鹏仔 1个月前 (01-15) #Python
文章标签 两个月

如何检测 pandas dataframe 中间隔两个月以上的记录

在处理时序数据时,判断数据之间的日期间隔可能至关重要。比如,在下面的示例中,我们有一个包含日期信息的 dataframe:

namedate
foo2022-01-01
foo2022-01-23
foo2022-03-01

在这种情况下,我们想知道 dataframe 中是否有间隔两个月以上的记录。为了解决这个问题,我们可以采取以下步骤:

  1. 计算相邻记录之间的天数差:
df['day'] = (df.date.shift(-1) - df.date).dt.days

这将在 dataframe 中为每一行创建一个“day”列,包含与前一行日期的差值(以天为单位)。

  1. 判断是否存在间隔超过两个月(60 天)的记录:
(df.day > 60).any()

这会返回一个布尔值,指示 dataframe 中是否存在任何间隔超过 60 天的记录。