- 20
- 0
import requests
from lxml import html
from requests.exceptions import RequestException
import time
import queue
import threading
class MyThread(threading.Thread):
def __init__(self, func):
threading.Thread.__init__(self)
self.func = func
def run(self):
self.func()
def worker():
while not q.empty():
page = q.get() # 获得任务
print('成功获取 : 第' + str(page) + '页url列表')
headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36'}
main_page_url = 'https://www.qiushibaike.com/hot/page/' + str(page)
url_list = []
try:
rep = requests.get(main_page_url, headers = headers)
time.sleep(1)
if rep.status_code == 200:
print("第" +str(page) + "页链接成功")
con = rep.content
sel = html.fromstring(con)
urls = sel.xpath('//a[@class="contentHerf"]/@href')
for url in urls:
message_url = 'https://www.qiushibaike.com' + url
url_list.append(message_url)
print(url_list)
**#return url_list**
except RequestException:
print("链接失败")
return None
time.sleep(1)
def main():
threads = []
#all_url = []
#url_list = worker()
for page in range(1, 7): #爬前6页
q.put(page)
for i in range(threadNum): #开启2个线程
thread = MyThread(worker)
thread.start()
#all_url.append(url_list)
threads.append(thread)
for thread in threads:
thread.join() #运行2个线程后再运行2个线程
if name == '__main__':
q = queue.Queue()
threadNum = 2 #线程数量
main()
worker里面每次return就只运行前两个线程然后结束 正常来说 是运行两个线程之后继续运行两个线程。还是我返回数据的方法不对 望解答
0
打赏
收藏
点击回答
网站公告
- 扫一扫访问手机版
回答动态

- 神奇的四哥:发布了悬赏问题阿里云幻兽帕鲁服务器更新之后。服务器里面有部分玩家要重新创建角色是怎么回事啊?预计能赚取 0积分收益

- 神奇的四哥:发布了悬赏问题函数计算不同地域的是不能用内网吧?预计能赚取 0积分收益

- 神奇的四哥:发布了悬赏问题ARMS可以创建多个应用嘛?预计能赚取 0积分收益

- 神奇的四哥:发布了悬赏问题在ARMS如何申请加入公测呀?预计能赚取 0积分收益

- 神奇的四哥:发布了悬赏问题前端小程序接入这个arms具体是如何接入监控的,这个init方法在哪里进行添加?预计能赚取 0积分收益

- 神奇的四哥:发布了悬赏问题阿里云幻兽帕鲁服务器刚到期,是不是就不能再导出存档了呢?预计能赚取 0积分收益

- 神奇的四哥:发布了悬赏问题阿里云幻兽帕鲁服务器的游戏版本不兼容 尝试更新怎么解决?预计能赚取 0积分收益

- 神奇的四哥:发布了悬赏问题阿里云幻兽帕鲁服务器服务器升级以后 就链接不上了,怎么办?预计能赚取 0积分收益

- 神奇的四哥:发布了悬赏问题阿里云幻兽帕鲁服务器转移以后服务器进不去了,怎么解决?预计能赚取 0积分收益

- 神奇的四哥:发布了悬赏问题阿里云幻兽帕鲁服务器修改参数后游戏进入不了,是什么情况?预计能赚取 0积分收益
- 回到顶部
- 回到顶部

