PHP前端开发

python多线程拆分文件进度条

百变鹏仔 3天前 #Python
文章标签 多线程
使用 concurrent.futures 模块中的 ThreadPoolExecutor 可以轻松实现多线程文件拆分:计算每个 chunk 的大小。创建一个线程池。对于每个 chunk,创建一个拆分任务,并将其添加到 futures 列表中。获取每个任务的进度更新,并根据进度更新进度条。将每个 chunk 写入新的文件中。

Python 多线程拆分文件并显示进度条

问题:如何在 Python 中使用多线程拆分大文件并显示进度条?

回答:

使用 concurrent.futures 模块中的 ThreadPoolExecutor 我们可以轻松实现多线程文件拆分:

立即学习“Python免费学习笔记(深入)”;

import concurrent.futuresimport osdef split_file(filepath, n_chunks):    # 计算每个 chunk 的大小    chunk_size = os.path.getsize(filepath) // n_chunks    # 创建一个线程池    with concurrent.futures.ThreadPoolExecutor() as executor:        # 创建一个 futures 列表来跟踪每个 chunk 的拆分任务        futures = []        # 对于每个 chunk,创建一个拆分任务        for i in range(n_chunks):            start = i * chunk_size            end = start + chunk_size            futures.append(executor.submit(                _split_chunk, filepath, i, start, end            ))        # 获取每个 chunk 拆分任务的进度更新        for future in concurrent.futures.as_completed(futures):            # 获取进度百分比            progress = future.result()            # 更新进度条            update_progress(progress)def _split_chunk(filepath, chunk_index, start, end):    with open(filepath, "rb") as f:        # 跳转到 chunk 的开始位置        f.seek(start)        # 读取 chunk 的内容        data = f.read(end - start)    # 将 chunk 写入新的文件中    with open(f"chunk_{chunk_index}.txt", "wb") as out:        out.write(data)    # 计算进度百分比    progress = (chunk_index + 1) / n_chunks * 100    return round(progress, 2)def update_progress(progress):    # 更新进度条的实现细节,如使用 tqdm 或 curses    # 这里为了演示,我们直接打印在控制台上    print(f"Progress: {progress}%")