如何使用 Python 从法兰克福证券交易所下载 Blob 数据?
使用 python 从法兰克福证券交易所下载 blob 数据
在本问题中,一位用户希望使用 python 从法兰克福证券交易所的主数据文件 下载链接 下载 excel 文件。然而,使用 urlib 和 wget 检索时,结果是一个指向 blob 的 url,下载的文件只有 289 字节且不可读。
用户面临以下疑问:
对于第一个问题,答案是肯定的。解决这个问题的关键是指定用户代理。如果不指定用户代理,服务器会返回一个 403 forbidden 页面,这就是用户只收到 289 字节 html 代码的原因。
立即学习“Python免费学习笔记(深入)”;
可以通过在 python 脚本中使用以下代码指定用户代理:
# 使用 Safari 的伪造用户代理fake_useragent = 'Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5355d Safari/8536.25'
关于第二个问题,揭开 blob 背后的“真实”url 并不是必需的。但是,如果希望直接访问文件,而不必使用 blob url,则可以使用以下步骤: