python培训之怎么解析网页数据

发布时间:2022-10-10 09:35:44 人气:127 作者:多测师

  python网页解析器

  1、常见的python网页

  常见的python网页解析工具有:re正则匹配、python自带的html.parser模块、第三方库BeautifulSoup(重点学习)以及lxm库。

  2、常见网页解析器分类

  以上四种网页解析器,是两种不同类型的解析器:

python培训之怎么解析网页数据

  (1)模糊匹配

  re正则表达式即为字符串式的模糊匹配模式;

  (2)结构化解析

  BeatufiulSoup、html.parser与lxml为“结构化解析”模式,他们都以DOM树结构为标准,进行标签结构信息的提取。()(3)结构化解析

  我们在了解什么是结构化解析之前,需要先了解下什么是DOM树这个概念。

  DOM树解释:即文档对象模型(Document Object Model),其树形标签结构,而所谓结构化解析,就是网页解析器它会将下载的整个HTML文档当成一个Doucment对象,然后在利用其上下结构的标签形式,对这个对象进行上下级的标签进行遍历和信息提取操作。

  以上内容为大家介绍了python培训之怎么解析网页数据,希望对大家有所帮助,如果想要了解更多Python相关知识,请关注多测师。https://www.e70w.com/xwzx/


返回列表
在线客服
联系方式

热线电话

17727591462

上班时间

周一到周五

二维码
线