账号密码登录
微信安全登录
微信扫描二维码登录

登录后绑定QQ、微信即可实现信息互通

手机验证码登录
找回密码返回
邮箱找回 手机找回
注册账号返回
其他登录方式
分享
  • 收藏
    X
    beautifulsoap如何只获取特定范围的<a>link
    27
    0

    练习爬取 billibili 的页面,在该页面的<ul>中,包含了100个<li>,每个<li></li>的内容如下

    <li>
        <div class="rank-item">
            <div class="num">1</div>
            <div class="content clearfix">
                <a href="/video/av16568807/" target="_blank">
                    <div class="preview"><img data-img="" src="//i1.hdslb.com/bfs/archive/aaac671f55f8fce8a8a9f87a57ca71d32e8ffdf6.jpg@.webp" loaded="loaded" style="opacity: 0.9879;" /></div>
                </a><i class="watch-later" aid="16568807"></i>
                <div class="info info-border">
                    <a href="/video/av16568807/" target="_blank">
                        <div class="title">小猪佩奇:你吹你MMP你吹</div>
                    </a>
                    <div class="detail"><span class="data-box play"><i class="b-icon b-icon-v-play"></i>26.8万</span><span class="data-box dm"><i class="b-icon b-icon-v-dm"></i>1119</span><a href="//space.bilibili.com/548824" target="_blank"><span class="data-box author"><i class="b-icon b-icon-v-author"></i>鸡鸡·夫斯基</span></a></div>
                    <div class="pts" title="综合评分">
                        <div>666386</div>综合评分</div>
                </div>
                <div class="other">
                    <p><a href="/video/av16833578" target="_blank">小猪佩奇第三弹:我捡你MMP我捡</a><span>综合评分</span><strong>286673</strong></p>
                    <p><a href="/video/av16713556" target="_blank">小猪佩奇第二弹:你跳你MMP你跳</a><span>综合评分</span><strong>178434</strong></p>
                </div><a class="more-data">显示UP主全部上榜视频<i></i></a></div>
        </div>
    </li>

    现在只想获取每个 li 标签下的第一个<a>标签
    在这里,我只需要<a href="/video/av16568807/" target="_blank">这个链接中的 href,后面的链接暂时不需要,请问应该如何做?
    如果直接find_all('a')的话,会出现很多无效或者重复的链接

    0
    打赏
    收藏
    点击回答
        全部回答
    • 0
    更多回答
    扫一扫访问手机版
    • 回到顶部
    • 回到顶部