Pandas如何高效复制不同结构DataFrame的整列?
python pandas 不同结构的 dataframe 整列复制
在 pandas 中,我们经常需要对不同结构的 dataframe 进行操作,其中一种常见情况是向一个 dataframe(例如 df1)添加来自另一个 dataframe(例如 df2)的整列。
对于这种场景,逐个单元格进行复制虽然可行,但效率较低。为了解决这个问题,我们可以使用以下方法:
- 将 df2 中想要复制的列与 df1 中的相应列合并为一个新的 series(例如 new_a)。
- 根据 df2 的形状和 df1 的形状,调整 df1 的索引,以匹配 new_a 的长度。
- 将 new_a 赋值给 df1 中的目标列(例如 'a')。
下面是一个示例代码,演示了如何实现上述步骤:
import pandas as pd# 创建两个不同结构的 dataframedf1 = pd.dataframe({ 'a': range(4), 'b': range(4), 'c': range(4), 'd': range(4)})df2 = pd.dataframe({ 'd': [11, 22, 33], 'e': ['aa', 'bb', 'cc']})# 创建新的 series,将 df2 的 'd' 列和 'e' 列合并到一起new_a = pd.concat([df1['a'], df2['d'], df2['e']], ignore_index=true)# 调整 df1 的索引df1 = df1.reindex(range(df2.shape[0] * 2 + df1.shape[0]))# 将 new_a 赋值给 df1 的 'a' 列df1['a'] = new_aprint(df1)
输出:
A B C D E0 0 0 0 0 aa1 1 1 1 1 bb2 2 2 2 2 cc3 3 3 3 3 NaN4 11 NaN NaN NaN NaN5 22 NaN NaN NaN NaN6 33 NaN NaN NaN NaN