账号密码登录

忘记密码注册账号

微信安全登录

微信扫描二维码登录

登录后绑定QQ、微信即可实现信息互通

手机验证码登录

找回密码返回

注册账号返回

其他登录方式

登录即同意《用户使用协议》和《用户隐私条款》

在万象知否，学习技能、解决问题

每个月，我们帮助 1000 万的开发者解决各种各样的技术问题。并助力他们在技术能力、职业生涯、影响力上获得提升。

问答主页 -> 电脑网络

分享 收藏: X

scrapy Crawspider 在什么情况下使用

五项小萝莉2020-01-01 00:00

普通会员

44: 0

CrawlSpiders
通过下面的命令可以快速创建 CrawlSpider模板的代码：

scrapy genspider -t crawl tencent tencent.com

上一个案例中，我们通过正则表达式，制作了新的url作为Request请求参数，现在我们可以换个花样...

class scrapy.spiders.CrawlSpider

它是Spider的派生类，Spider类的设计原则是只爬取start_url列表中的网页，而CrawlSpider类定义了一些规则(rule)来提供跟进link的方便的机制，从爬取的网页中获取link并继续爬取的工作更适合。

0

打赏

收藏

点击回答

全部回答

共 0 条

宝藏小仙女普通会员 1楼
Scrapy是一个用于爬取网页的 Python 框架，它非常适合用来进行大规模的、复杂的爬取任务。在以下情况下，Scrapy可能会被用来爬取：
1. 大规模的数据爬取：Scrapy可以处理大量的数据，可以轻松地爬取大量数据，如社交媒体数据、新闻网站数据等。
2. 多个页面爬取：Scrapy可以爬取多个页面，这样可以避免爬取到重复的数据。
3. 网页结构复杂：Scrapy可以处理网页结构复杂的情况，例如，如果一个网站有多个子页面，Scrapy可以很容易地爬取到所有的子页面。
4. 数据的实时性：Scrapy可以处理数据的实时性，如果数据是实时的，Scrapy可以快速地爬取到最新的数据。
5. 数据的结构化：Scrapy可以处理数据的结构化，例如，如果数据是JSON格式的，Scrapy可以轻松地解析和存储。
6. 网页的反爬机制：Scrapy可以处理网页的反爬机制，例如，如果一个网站有反爬机制，Scrapy可以避免被网站封禁。
7. 有权限爬取的网站：Scrapy有权限爬取一些特定的网站，例如，如果一个网站有爬虫程序，Scrapy可以使用这些程序来爬取网站。

0 打赏回复

更多回答

网站公告

扫一扫访问手机版

回答动态

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器更新之后。服务器里面有部分玩家要重新创建角色是怎么回事啊？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题函数计算不同地域的是不能用内网吧？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题ARMS可以创建多个应用嘛?预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题在ARMS如何申请加入公测呀？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题前端小程序接入这个arms具体是如何接入监控的，这个init方法在哪里进行添加？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器刚到期，是不是就不能再导出存档了呢？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器的游戏版本不兼容尝试更新怎么解决？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器服务器升级以后就链接不上了，怎么办？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器转移以后服务器进不去了，怎么解决？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器修改参数后游戏进入不了，是什么情况？预计能赚取 0积分收益

回到顶部

回到顶部