[原]Python爬虫编程思想(59): 用Beautiful Soup CSS选择器获取属性值与文本
蒙娜丽宁 2021-10-29 22:21:07 2021-10-29 23:21:07 Author: blog.csdn.net(查看原文) 阅读量:43 收藏

蒙娜丽宁 2021-10-29 22:21:07 2 收藏

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

60 篇文章 2 订阅 ¥29.90 ¥99.00

        由于select方法同样会返回Tag对象的集合,所以可以使用Tag对象的方式获取节点属性值和文本内容。获取属性值可以使用attrs,也可以直接使用[...]方式引用节点的属性。获取节点的文本内容可以使用get_text方法,也可以使用string属性。

下面的例子使用CSS选择器选取特定的a节点,并获取a节点的href属性值和文本内容。

from bs4 import BeautifulSoup
html = '''
<div>
    <ul>
        <li class="item1" value1="1234" value2 = "hello world">
            <a href="https://geekori.com"> geekori.com</a>
        </li>
        <li class="item">
           <a href="https://www.jd.com"> 京东商城</a>
           <a href="https://www.google.com">谷歌</a>
        </li>        
    </ul>
    <ul>
        <li class="item3"&g

文章来源: https://blog.csdn.net/nokiaguy/article/details/121043948
如有侵权请联系:admin#unsafe.sh