账号密码登录

忘记密码注册账号

微信安全登录

微信扫描二维码登录

登录后绑定QQ、微信即可实现信息互通

手机验证码登录

找回密码返回

注册账号返回

其他登录方式

登录即同意《用户使用协议》和《用户隐私条款》

在万象知否，学习技能、解决问题

每个月，我们帮助 1000 万的开发者解决各种各样的技术问题。并助力他们在技术能力、职业生涯、影响力上获得提升。

问答主页 -> 电脑网络

分享 收藏: X

QueryList如何采集淘宝天猫数据

北巷长歌悠2021-11-19 15:48

普通会员

47: 0

需要采集淘宝天猫京东的商品数据,目前京东的可以采集的到淘宝天猫返回的都是空值

0

打赏

收藏

点击回答

全部回答

共 0 条

早知是梦普通会员 1楼
淘宝天猫的数据采集一般需要借助爬虫技术，具体的采集方式和参数可能会因为业务需求和网站结构的不同而有所不同。以下是一些基本的采集步骤和参数：
1. 获取登录用户信息：淘宝天猫的登录用户信息通常通过User-Agent头部的User-Agent信息获取，如：Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3。
2. 获取商品信息：商品信息主要通过淘宝天猫的搜索结果页面或者商品详情页获取。通常需要在User-Agent头部添加特定的User-Agent信息，如：Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3。
3. 获取店铺信息：店铺信息通常通过店铺详情页或者店铺搜索结果页面获取。需要在User-Agent头部添加特定的User-Agent信息，如：Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3。
4. 获取搜索结果：搜索结果页面通常需要通过User-Agent头部添加特定的User-Agent信息，如：Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3。
在使用爬虫技术采集淘宝天猫数据时，需要注意遵守网站的robots.txt文件和相关法律法规，避免对网站服务器造成过大的压力。同时，还需要注意防止被网站封IP，可以通过使用代理IP或者设置合理的爬取频率来解决。

0 打赏回复

你走了、把回憶留給了我ゞ普通会员 2楼
淘宝天猫的数据采集一般需要借助爬虫技术，具体的采集方式和参数可能会因为业务需求和网站结构的不同而有所不同。以下是一些基本的采集步骤和参数：
1. 获取登录用户信息：淘宝天猫的登录用户信息通常通过User-Agent头部的User-Agent信息获取，如：Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3。
2. 获取商品信息：商品信息主要通过淘宝天猫的搜索结果页面或者商品详情页获取。通常需要在User-Agent头部添加特定的User-Agent信息，如：Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3。
3. 获取店铺信息：店铺信息通常通过店铺详情页或者店铺搜索结果页面获取。需要在User-Agent头部添加特定的User-Agent信息，如：Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3。
4. 获取搜索结果：搜索结果页面通常需要通过User-Agent头部添加特定的User-Agent信息，如：Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3。
在使用爬虫技术采集淘宝天猫数据时，需要注意遵守网站的robots.txt文件和相关法律法规，避免对网站服务器造成过大的压力。同时，还需要注意防止被网站封IP，可以通过使用代理IP或者设置合理的爬取频率来解决。

0 打赏回复

更多回答

网站公告

扫一扫访问手机版

回答动态

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器更新之后。服务器里面有部分玩家要重新创建角色是怎么回事啊？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题函数计算不同地域的是不能用内网吧？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题ARMS可以创建多个应用嘛?预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题在ARMS如何申请加入公测呀？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题前端小程序接入这个arms具体是如何接入监控的，这个init方法在哪里进行添加？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器刚到期，是不是就不能再导出存档了呢？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器的游戏版本不兼容尝试更新怎么解决？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器服务器升级以后就链接不上了，怎么办？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器转移以后服务器进不去了，怎么解决？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器修改参数后游戏进入不了，是什么情况？预计能赚取 0积分收益

回到顶部

回到顶部