PHP前端开发

Pandas如何高效复制不同结构DataFrame的整列?

百变鹏仔 5天前 #Python
文章标签 高效

python pandas 不同结构的 dataframe 整列复制

在 pandas 中,我们经常需要对不同结构的 dataframe 进行操作,其中一种常见情况是向一个 dataframe(例如 df1)添加来自另一个 dataframe(例如 df2)的整列。

对于这种场景,逐个单元格进行复制虽然可行,但效率较低。为了解决这个问题,我们可以使用以下方法:

  1. 将 df2 中想要复制的列与 df1 中的相应列合并为一个新的 series(例如 new_a)。
  2. 根据 df2 的形状和 df1 的形状,调整 df1 的索引,以匹配 new_a 的长度。
  3. 将 new_a 赋值给 df1 中的目标列(例如 'a')。

下面是一个示例代码,演示了如何实现上述步骤:

import pandas as pd# 创建两个不同结构的 dataframedf1 = pd.dataframe({    'a': range(4),    'b': range(4),    'c': range(4),    'd': range(4)})df2 = pd.dataframe({    'd': [11, 22, 33],    'e': ['aa', 'bb', 'cc']})# 创建新的 series,将 df2 的 'd' 列和 'e' 列合并到一起new_a = pd.concat([df1['a'], df2['d'], df2['e']], ignore_index=true)# 调整 df1 的索引df1 = df1.reindex(range(df2.shape[0] * 2 + df1.shape[0]))# 将 new_a 赋值给 df1 的 'a' 列df1['a'] = new_aprint(df1)

输出:

   A    B  C  D    E0  0    0  0  0   aa1  1    1  1  1   bb2  2    2  2  2   cc3  3    3  3  3  NaN4  11  NaN  NaN  NaN  NaN5  22  NaN  NaN  NaN  NaN6  33  NaN  NaN  NaN  NaN