scrapy怎么总是只采集第一页,代码怎么改? - 知否问答 - 万象云+社区

import scrapy import json from douyu.items import DouyuItem class MeinvSpider(scrapy.Spider): name = 'meinv' allowed_domains = ['capi.douyucdn.cn'] offset = 0 url = "http://capi.douyucdn.cn/api/v1/getVerticalRoom?limit=20&offset=" start_urls = [url + str(offset)] def parse(self, response): res = json.loads(response.text) for each in res['data']: item = DouyuItem() item["nickname"] = each["nickname"] item["imagelink"] = each["vertical_src"] yield item self.offset += 20 yield scrapy.Request(self.url+str(self.offset),callable=self.parse)

#获取设置 import scrapy from scrapy.utils.project import get_project_settings from scrapy.pipelines.images import ImagesPipeline import os class DouyuPipeline(ImagesPipeline): #获取settings文件里设置的变量值 IMAGES_STORE = get_project_settings().get("IMAGES_STORE") #获取图片链接，并发送请求 def get_media_requests(self,item,info): image_url = item["imagelink"] yield scrapy.Request(image_url,meta={ "item":item }) #处理图片 def item_completed(self,results,item,info): # ok判断是否下载成功 image_paths = [x["path"] for ok, x in results if ok] if not image_paths: raise DropItem("Item contains no images") #os.rename(self.IMAGES_STORE + image_path[0], self.IMAGES_STORE + item["nickname"] + ",jpg") item["imagePath"] = image_paths[0] return item

回答动态

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器更新之后。服务器里面有部分玩家要重新创建角色是怎么回事啊？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题函数计算不同地域的是不能用内网吧？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题ARMS可以创建多个应用嘛?预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题在ARMS如何申请加入公测呀？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题前端小程序接入这个arms具体是如何接入监控的，这个init方法在哪里进行添加？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器刚到期，是不是就不能再导出存档了呢？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器的游戏版本不兼容尝试更新怎么解决？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器服务器升级以后就链接不上了，怎么办？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器转移以后服务器进不去了，怎么解决？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器修改参数后游戏进入不了，是什么情况？预计能赚取 0积分收益

在 万象知否，学习技能、解决问题

回答动态

在万象知否，学习技能、解决问题