PHP前端开发

Python爬取商品详情时如何避免数据溢出到CSV文件其他行?

百变鹏仔 1个月前 (01-15) #Python
文章标签 详情

python爬取数据时如何正确导出商品详情到csv中

在爬取商品详情并导出到csv文件时,有时会遇到商品详情信息溢出到其他行的问题。导致这种情况的原因可能是:

因为数据中包含未转义的双引号

当商品详情中包含双引号时,csv解析器会将双引号视为列分隔符,导致数据溢出到下一行。为了解决这个问题,可以将数据中的双引号转义为双重双引号("")。

如果识别不了utf8,可以添加bom头

立即学习“Python免费学习笔记(深入)”;

如果csv文件无法正确识别utf8编码,可以添加以下bom头字节:

import codecsimport csvwith codecs.open('output.csv', 'w', encoding="utf-8-sig") as csvfile:    writer = csv.writer(csvfile, dialect='excel')    writer.writerow(['H列商品详情'])