节点包括如下信息。
- 节点名称
- 节点属性
- 节点文本
- 整个节点的HTML代码
- 节点内部的HTML代码
现在以下面的HTML代码为例说明如何获取上述5类信息。
html = '''
<div id="panel">
<ul class="list1">
<li class="item" value1="1234" value2 = "hello world">
Hello
123
<a href="https://geekori.com"> geekori.c
