python模块BeautifulSoup网页解析

文章目录 [ 隐藏 ]

Python模块BeautifulSoup简介

BeautifulSoup最主要的功能是解析网页源码数,使用BeautifulSoup可以非常方便的把网页源码转换成对象,可以很轻松的拿到我们所需要的数据类型和数据。

BeautifulSoup模块的安装

使用pip命令安装

使用easy_instal命令安装

BeautifulSoup模块的的简单用法

BeautifulSoup模块常用函数介绍

find_all( name , attrs , recursive , string , **kwargs )

find_all()方法搜索当前标签的所有标签子节点,并判断是否符合过滤器的条件find_all()所接受的参数如

find_all也有简写方法,以下代码等价:

find_all参数举例:

get_text()

如果得到只想tag中包含的文本内容,可以用get_text()方法,方法,这个方法获取到 tag 中包含的所有文版内容包括子孙 tag 中的内容,并将结果作为 Unicode 字符串返回

更多内容请查看:Beautiful Soup 4.4.0 文档 (中文文档)

未经允许不得转载:Python在线学习 » python模块BeautifulSoup网页解析

赞 (0)

来吐槽吧 0

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址