python爬虫中lxml读取的方法

这篇文章将为大家详细讲解有关python爬虫中lxml读取的方法,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。

创新互联专注于丰林网站建设服务及定制,我们拥有丰富的企业做网站经验。 热诚为您提供丰林营销型网站建设,丰林网站制作、丰林网页设计、丰林网站官网定制、小程序制作服务,打造丰林网络公司原创品牌,更为您提供丰林网站排名全网营销落地服务。

除了直接读取字符串,还支持从文件读取内容。比如我们新建一个文件叫做 hello.html,内容为

    
             
  • first item
  •          
  • second item
  •          
  • third item
  •          
  • fourth item
  •          
  • fifth item
  •      
 

利用 parse 方法来读取文件。

from lxml import etree
html = etree.parse('hello.html')
result = etree.tostring(html, pretty_print=True)
print(result)

同样可以得到相同的结果。

关于python爬虫中lxml读取的方法就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。


本文名称:python爬虫中lxml读取的方法
文章路径:http://csruizhi.cn/article/jjjsji.html

其他资讯

Copyright © 2007-2024 成都优众联杰科技有限公司 All Rights Reserved 蜀ICP备2024116266号
友情链接: 温江网站设计 手机网站制作 外贸网站建设 成都网站建设 成都网站设计 网站制作 网站设计制作报价 梓潼网站设计 网站制作 四川成都网站建设 重庆外贸网站建设 成都响应式网站建设 成都定制网站建设 网站建设方案 成都网站设计 定制网站设计 手机网站建设套餐 自适应网站设计 LED网站设计方案 成都网站建设 外贸营销网站建设 成都品牌网站设计