- 54
- 0
考虑到爬虫的稳定性还需要测试,如果写成多线程,会增加系统不稳定。目前解决方案是,利用pycharm本身的run功能,同时运行多个相同脚本(类似开多个窗口)。(用redis共享待抓取列。)类似这样的“分布式方案”不知道是否合理?有没有更好的办法?
0
打赏
收藏
点击回答
- 共 0 条
- 全部回答
-
洒了囚心酒 普通会员 1楼
您没有提供具体的半手动爬虫方案,所以我无法直接评价其合理性。但一般来说,半手动爬虫结合了自动化爬虫和人工干预两部分,比如:
-
自动化爬虫:通过编写代码(如Python的Scrapy、BeautifulSoup等)自动抓取网络数据,定期或持续地进行数据更新。
-
人工干预:在某些需要判断、决策或者应对复杂反爬策略的情况下,加入人工操作步骤,例如验证码识别、登录验证、动态加载内容获取等。
如果您的方案是在遵守相关法律法规以及网站Robots协议的前提下,合理且适度地运用了上述方式,并尽可能减小对目标网站服务器的影响,那么这个方案可以说是相对合理的。但如果存在违反规定、过度采集、影响网站正常运行等情况,则是不合理的。
建议您在设计爬虫时,始终遵循合法、合规、尊重隐私、不影响网站正常运营的原则。
-
更多回答
网站公告
- 扫一扫访问手机版
回答动态

- 神奇的四哥:发布了悬赏问题阿里云幻兽帕鲁服务器更新之后。服务器里面有部分玩家要重新创建角色是怎么回事啊?预计能赚取 0积分收益

- 神奇的四哥:发布了悬赏问题函数计算不同地域的是不能用内网吧?预计能赚取 0积分收益

- 神奇的四哥:发布了悬赏问题ARMS可以创建多个应用嘛?预计能赚取 0积分收益

- 神奇的四哥:发布了悬赏问题在ARMS如何申请加入公测呀?预计能赚取 0积分收益

- 神奇的四哥:发布了悬赏问题前端小程序接入这个arms具体是如何接入监控的,这个init方法在哪里进行添加?预计能赚取 0积分收益

- 神奇的四哥:发布了悬赏问题阿里云幻兽帕鲁服务器刚到期,是不是就不能再导出存档了呢?预计能赚取 0积分收益

- 神奇的四哥:发布了悬赏问题阿里云幻兽帕鲁服务器的游戏版本不兼容 尝试更新怎么解决?预计能赚取 0积分收益

- 神奇的四哥:发布了悬赏问题阿里云幻兽帕鲁服务器服务器升级以后 就链接不上了,怎么办?预计能赚取 0积分收益

- 神奇的四哥:发布了悬赏问题阿里云幻兽帕鲁服务器转移以后服务器进不去了,怎么解决?预计能赚取 0积分收益

- 神奇的四哥:发布了悬赏问题阿里云幻兽帕鲁服务器修改参数后游戏进入不了,是什么情况?预计能赚取 0积分收益
- 回到顶部
- 回到顶部

