scrapy crawlspider中的deny设置无效?问题:使用rule设置了deny参数,但发现运行时仍然爬取了包含deny关键词的链接。例如,设置了deny=(“guba”、“data”...),但发现爬取了包含“guba”的链接。...
scrapy crawlspider 中的 deny 设置为何无效问题中提到的 deny 设置无效是因为 deny 参数的值没有采用正则表达式。在 scrapy 的 crawlspider 中,deny 参数用于指定不应被爬取的 url 模...