账号密码登录

忘记密码注册账号

微信安全登录

微信扫描二维码登录

登录后绑定QQ、微信即可实现信息互通

手机验证码登录

找回密码返回

注册账号返回

其他登录方式

登录即同意《用户使用协议》和《用户隐私条款》

万象素材 › 万象专栏 › 人工智能专栏

Crawler：基于urllib库+实现爬虫有道翻译【图文】

推荐

萌态尤物 2021-06-15 21:14 2021/06/15 ©著作权读给你听

文章标签 Crawler 人工智能爬虫其他人工智能万象人工智能专栏 专栏分类人工智能 阅读数12051 评论数0 点赞数6 收藏数0

导读：Crawler：基于urllib库+实现爬虫有道翻译目录输出结果设计思路实现步骤输出结果后期更新……..

Crawler：基于urllib库+实现爬虫有道翻译

目录

输出结果

后期更新……

设计思路

第一步：首先要知道，data里面的内容是都需要在代码中发送给服务器的。
第二步：理解反爬虫机制，找出加密参数。大多数网站的反爬虫的机制是对向服务器提交表单的动态值进行加密，所以，我们每翻译一次，就观察data里面有哪些参数是动态变化的。从这个网址来看，参数salt、sign对应的值是动态变化。
第三步：找出动态参数的实现方式。根据反爬虫经验可知，一般网站生成的反爬加密值都是采用的时间戳，以及将一下字符串使用加密算法加密一下，我们可以从网页源代码中进行查找理解。

实现步骤

点击有道翻译网页源代码，查看NetWork栏下的相关数据的相关参数：
依次提取url、User-Agent、data
url =
head['User-Agent']=
data =

Crawler：基于urllib库+实现爬虫有道翻译_人工智能

Crawler：基于urllib库+实现爬虫有道翻译_人工智能_02

Crawler：基于urllib库+实现爬虫有道翻译_Crawler_03

更多文章请关注《万象专栏》

转载请注明出处：https://www.wanxiangsucai.com/read/cv16629

话题推荐： #Crawler# #人工智能# #爬虫# #其他# #人工智能# #万象人工智能专栏#

打赏
6 赞
收藏
评论
举报

上一篇：

下一篇：四个月内掌握AI快速入门人工智能的关键技能与学习路径

发布评论

全部评论(0)

相关文章