导语:
本文主要介绍了关于python中htmlparser解析html的相关知识,包括html调用python,以及chatgpt github这些编程知识,希望对大家有参考作用。
说明
1、htmlparser提供了一种方便简洁的处理html文件的方法。
它将html页面中的标签按照树形结构解析成一个节点,一种类型的节点对应一个类,调用它可以方便的访问到标签中的内容。
2、HTML本质上是xml的一个子集,但是html的语法没有html那么严格,不能用标准的DOM或者SAX来解析html。
实例
from html.parser import HTMLParser
from html.entities import name2codepoint
class MyHTMLParser(HTMLParser):
def handle_starttag(self, tag, attrs):
print('<%s>' % tag)
def handle_endtag(self, tag):
print('</%s>' % tag)
def handle_startendtag(self, tag, attrs):
print('<%s/>' % tag)
def handle_data(self, data):
print(data)
def handle_comment(self, data):
print('<!--', data, '-->')
def handle_entityref(self, name):
print('&%s;' % name)
def handle_charref(self, name):
print('&#%s;' % name)
parser = MyHTMLParser()
parser.feed('''<html>
<head></head>
<body>
<!-- test html parser -->
<p>Some <a href=\"#\">html</a> HTML tutorial...<br>END</p>
</body></html>''')
//test结果
<html>
<head>
</head>
<body>
<!-- test html parser -->
<p>
Some
<a>
html
</a>
HTML tutorial...
<br>
END
</p>
</body>
</html>
本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
你可能也喜欢
- ♥ 将新键值添加到 python 字典09/04
- ♥ pycharm如何安装python3.609/30
- ♥ java还是python哪个更快?11/14
- ♥ python有哪些功能08/12
- ♥ 如何在 Python 中创建一个固定长度的列表09/13
- ♥ python2和3哪个常用01/04
内容反馈