不依赖Pandas,如何快速分组二维列表?
二维列表如何快速分组,不依赖 pandas
在不使用 pandas 的情况下,快速对二维列表进行分组是一个常见问题。现在让我们探讨一种有效的方法:
为了按照组名对列表进行分组并保持顺序,我们可以使用自定义函数:
def group_name_fun(lst): last = '' arr = [] for ii in range(len(lst)): if not lst[ii][0] == last: arr.append(ii) last = lst[ii][0] arr.append(len(lst)) lst = [lst[arr[ii - 1]:arr[ii]] for ii in range(1, len(arr))] return lst
对于大数组,出于效率考虑,建议采用另一种方法:
import itertoolsdef group_large_array(data): grouped_data = {} for key, group in itertools.groupby(data, lambda x: x[0]): grouped_data[key] = [item[1] for item in group] # 转换为列表形式 result = [grouped_data[key] for key in grouped_data] return result
该方法使用 itertools.groupby 依次对数据进行分组,并通过列表推导式将每组提取出来,从而有效地减少了内存占用并提高了效率。