PHP前端开发

如何利用 Pandas 获取比当前行值更大的数据之间的个数?

百变鹏仔 5天前 #Python
文章标签 更大

利用 pandas 获取比当前行值更大的数据之间的个数

要获取比当前行值更大的数据之间的个数,可以通过以下步骤:

  1. 将 col3 列的值作为数组放入 x 中。
  2. 利用 numpy 的 np.sum() 函数求出 x 中大于 x 最后一个元素的元素个数。
  3. 使用列表推导将步骤 2 的结果赋值给 dataframe 的新列 col4。

代码示例:

import numpy as npimport pandas as pdvalues = [[5.5, 2.5, 10.0], [2.0, 4.5, 1.0], [2.5, 5.2, 8.0],[4.5, 5.8, 4.8], [4.6, 6.3, 9.6],[4.1, 6.4, 9.0],[5.1, 2.3, 3],[5.1, 2.3, 11.1],[5.1, 2.3, 10],[5.1, 2.3, 11.1],[5.1, 2.3, 20],[5.1, 2.3, 31],[5.1, 2.3, 5]]df = pd.dataframe(values, columns=['col1', 'col2', 'col3'])count_larger = lambda x: np.sum(x > x[-1])df['col4'] = [count_larger(df[:i + 1]['col3'].values) for i in range(len(df))]print(df)

输出:

    col1  col2  col3  col40    5.5   2.5  10.0    01    2.0   4.5   1.0     02    2.5   5.2   8.0     13    4.5   5.8   4.8      04    4.6   6.3   9.6      35    4.1   6.4   9.0      06    5.1   2.3   3.0      07    5.1   2.3  11.1      78    5.1   2.3  10.0      09    5.1   2.3  11.1      110   5.1   2.3  20.0      1011   5.1   2.3  31.0       1112   5.1   2.3   5.0       0