导语:
本文主要介绍了关于如何使用python中beautifulsoup库?的相关知识,希望可以帮到处于编程学习途中的小伙伴
之前教过大家解析页面的方法,很多朋友都喜欢。很多朋友问我如何学习和理解可以解析的基础库。让我在这里想一想。
requests库的兄弟beautifulsoup库,可以提取页面信息,提取有用的信息。现在也是人们经常使用的图书馆。你可以看一看就明白了。
老规矩,先学会安装:
方式:pip install beautifulsoup4
测试
是否安装成功
:
import requests
r = requests.get("链接")
demo = r.text
form bs4 import BeautifulSoup
soup = BeautifulSoup(demo, "html.parser")
实例案例演示:
html = bs4.BeautifulSoup(response.text, features='lxml')
note_list = html.find_all('ul', class_='note-list', limit=1)[0]
for a in note_list.select('li>div.content>a.title'):
title = a.contents[0]
link = f'链接{a["href"]}'
print(f'《{title}》,{link}')
虽然BeautifulSoup也有中文文档,
还有一些比较落后的小版本,但是影响不是太大,足够大家需要解析页面的时候调用。相信通过上面的描述,大家都知道这个库的用处了。学到更多
~
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
你可能也喜欢
- ♥ 如何理解python中列表的索引?10/25
- ♥ python程序是如何工作的?10/11
- ♥ Python pass 函数是什么11/16
- ♥ Python函数有几种类型的参数08/30
- ♥ python字符串的常用方法有哪些09/12
- ♥ 如何在python中使用conftest?10/23
内容反馈