如何用python爬取数据

1、find_all()的爬取

find_all():提取所有符合要求的数据,搜索当前tag的所有tag子节点,并判断是否符合过滤器的条件。

2、用法

bs对象.find_all(标签,属性)

3、注意

bs对象、标签和属性使用都与find()一致。但是,从find_all()中提取的数据类型与find()是不同的。通过find()方法提取的数据类型通常是Tag,而通过find_all提取的数据类型通常是ResultSet。碰到了Tag类型的数据,我们可以通过Tag.text()来进一步提取纯文本格式的内容,通过Tag['PropertyName']来提取特定属性的值。当遇到了ResultSet类型的数据时,我就会想办法通过遍历进一步提取所有符合条件的数据。

4、实例

#最灵活的使用方式
li_quick=soup.find_all(attrs={'class':'item-1'})
forli_quickinli_quick:
print('最灵活的查找方法:',li_quick)

以上就是用python爬取数据的方法,在之前我们已经对find方法有所学习,那么本篇find_all()也是比较简单和快速的爬取方法之一。更多Python学习指路:Python基础教程

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。