账号密码登录
微信安全登录
微信扫描二维码登录

登录后绑定QQ、微信即可实现信息互通

手机验证码登录
找回密码返回
邮箱找回 手机找回
注册账号返回
其他登录方式
分享
  • 收藏
    X
    python3 url读取
    56
    0
    import urllib.request,urllib.parse,urllib.error
    from bs4 import BeautifulSoup
    import ssl
    
    # Ignore SSL certificate errors
    ctx = ssl.create_default_context()
    ctx.check_hostname = False
    ctx.verify_mode = ssl.CERT_NONE
    
    urlname = input('Enter URL:')
    count=input('Enter count:')
    pos=input('Enter position:')
    count=int(count)
    pos=int(pos)
    urls=list()
    
    for times in range(count+1):
        print('Retrieving:', urlname)
        respon = urllib.request.urlopen(urlname, context=ctx)
        html = respon.read()
        soup = BeautifulSoup(html, 'html.parser')
        tags = soup('a')
        for tag in tags:
            urls.append(tag.get('href',None))
        urlname=urls[pos-1]
        

    本意是输入一个URL,然后读取该URL下的第pos个URL,重复该行为count次。
    在循环体里面,urlname虽然变了,但是respon = urllib.request.urlopen(urlname, context=ctx)似乎并没有受到影响。。尝试每次都适用close()来关闭也没变化。。。是不是我的理解有问题。。麻烦各位大大帮忙看下。。。初学者。。有点懵。。

    0
    打赏
    收藏
    点击回答
        全部回答
    • 0
    更多回答
    网站公告
    扫一扫访问手机版
    • 回到顶部
    • 回到顶部