不借助Pandas,如何快速分组二维列表中的连续元素?
不借助 pandas 快速分组二维列表
问题:
给定一个二维列表,如何快速分组其元素,使得连续的元素属于同一组,且组名根据元素的首个元素确定?
解决方案:
itertools 模块
对于大数组,我们推荐使用高效的 itertools 模块。
import itertoolsdef group_large_array(data): grouped_data = {} for key, group in itertools.groupby(data, lambda x: x[0]): grouped_data[key] = [item[1] for item in group] return [grouped_data[key] for key in grouped_data]
使用方法:
data = [['A', 33], ['A', 0], ['A', 12], ['A', 3], ['B', 3], ['B', 0], ['B', 77], ['C', 1], ['C', 2], ['C', 5], ['C', 0], ['C', 11], ['C', 19]]result = group_large_array(data)print(result)
解释:
优点: