添加链接
link管理
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接

xml中节点Element类的函数

1 tag 当前节点标签名
2 attrib 当前节点属性
3 text 当前节点内容
4 append 添加一个子节点
5 clear 清空节点
6 extend 为当前节点添加 n 个子节点
7 find 获取第一个寻找到的子节点
8 findall 获取所有的子节点
9 findtext 获取第一个寻找到的子节点的内容
10 get 获取当前节点的属性
11 insert 在当前节点创建子节点,然后插入指定位置
12 items 获取当前节点的所有属性,和字典中的items一样,内容都是健值对
13 iter 在根据节点名称寻找所有指定的节点,并返回一个迭代器
14 iterfind 获取所有指定的节点,并放在一个迭代器中
15 itertext 在子孙中根据节点名称寻找所有指定的节点的内容,并返回一个迭代器
16 keys 获取当前节点的所有属性的 key
17 makeelement 创建一个新节点
18 remove 删除某个节点
19 set 设置当前节点属性

当XML文件较大或者其中的子节点tag非常多的时候,一个一个获取是比较麻烦,我们可以通过find(‘nodeName’)或者findall(‘nodeName’)方法来查找指定tag的节点。

find(‘nodeName’):表示在该节点下,查找其中第一个tag为nodeName的节点。
findall(‘nodeName’):表示在该节点下,查找其中所有tag为nodeName的节点。

from xml.etree import ElementTree  as ET  #引入ElementTree的包
tree=ET.parse("test.xml")
root=tree.getroot()
for child in root:
    print(child.tag,child.text,child.attrib)
    for sub in child:
        print(sub.tag,sub.text,sub.attrib)
        for sub1 in sub:
            print(sub1.tag,sub1.text,sub1.attrib)
            for sub2 in sub1:
                print(sub2.tag,sub2.text,sub2.attrib)
                .........
单独提取相应的数据
for value in root.iter("object"):   #直接通过标题获取内容、标题等
    print(value.tag, value.text, value.attrib)
    for child in root:
        print(root[0].tag)  #### 0、1、2、3.。。。代表目录级,tag:类似标题,text:类似内容,attrib:类似属性
   可以写成root[0].tag.get('eNB')、root[0][1]。。等
案例三:批量导入XML并写到TXT或CSV 
import os
import sys
import xml.etree.ElementTree as ET
import glob
indir='D:\\(D-drive)\\GZ\\VOLTE专项\\TOOL\\P编程\\程序\\2019\\XML\\inputfile\\'
outdir='D:\\(D-drive)\\GZ\\VOLTE专项\\TOOL\\P编程\\程序\\2019\\XML\\outputfile\\'
os.chdir(indir)
infile = os.listdir('.')
infile = glob.glob(str(infile)+'*.xml')
for i, file in enumerate(infile):
    file_txt = os.path.join(outdir, 'test.csv')
    f_w = open(file_txt, 'w')
    # actual parsing
    in_file = open(file)
    print(file)
    tree = ET.parse(in_file)
    root = tree.getroot()
    root1=root[1][0]
    for sub1 in root1:
        eci=sub1.attrib.get('id')
        for sub2 in sub1:
            vl=sub2.text
            print(eci,vl)
            f_w.write(eci +","+ vl+ '\n')

另一个例子

import os
import sys
import xml.etree.ElementTree as ET
import glob
indir='D:\\(D-drive)\\GZ\\VOLTE专项\\TOOL\\P编程\\程序\\2019\\XML\\inputfile\\'
outdir='D:\\(D-drive)\\GZ\\VOLTE专项\\TOOL\\P编程\\程序\\2019\\XML\\outputfile\\'
os.chdir(indir)
infile = os.listdir('.')
infile = glob.glob(str(infile)+'*.xml')
file_txt = os.path.join(outdir, 'test.csv')
f_w = open(file_txt, 'w')
f_w.write("。。。。。。。。。。。。。。。。。。。+'\n')
f_w.closed
for i, file in enumerate(infile):
    f_w = open(file_txt, 'a')
    # actual parsing
    in_file = open(file)
    print("正在解析文件:"+file)
    tree = ET.parse(in_file)
    root = tree.getroot()
    for obj1 in root.iter('eNB'):
        enb=obj1.attrib.get('userLabel')
        enbid=obj1.attrib.get('id')
    root1=root[1][0]
    for sub1 in root1:
        eci=sub1.attrib.get('id')
        rtime=sub1.attrib.get("TimeStamp")
        for sub2 in sub1:
            v1=sub2.text
            v1=v1.split()[0]+","+v1.split()[1]+","+v1.split()[4]+","+v1.split()[5]+","+v1.split()[7]+","+v1.split()[8]+","+v1.split()[9]+","+v1.split()[10]+","+v1.split()[11]
            #print(eci,v1)
            f_w.write(rtime+","+enb+","+enbid+","+eci +","+ v1+ '\n')
Python有三种方法解析xml:SAX,DOM,Elementree。本文记录ElementTree方法解析xml。
目前自己用的是Python3.6,但在该版本中并没有xml的缩进函数ET.indent,不过就我所知3.9版本是有的,所以当前3.6写出来的xml是无法调用函数来美化xml排版,文中的xml排版是手动挡 :),当然,也可以写个函数来自动优化。
xml是一种固有的分层数据格式,最好的描述方式就是使用树形结构。在ElementTree模块中,使用ElementTree对象来表示一棵
				
python有三种方法解析XML,SAX,DOM,以及ElementTree ###1.SAX (simple API for XML )        pyhton 标准库包含SAX解析器,SAX是一种典型的极为快速的工具,在解析XML时,不会占用大量内存。 但是这是基于回调机制的,因此在某些数据中,它会调用某些方法进行传递。这意味着必须为数据指定句柄, 以维持自己的状态,这是非常困难的
ElementTreePython解析 XML 原文: http://eli.thegreenplace.net/2012/03/15/processing-xml-in-python-with-elementtree/ 译者: TheLover_Z 当你需要解析和处理 XML 的时候,Python 表现出了它 “batteries included” ...
解析XML文件,使用ElementTree模块,并根据流程图设计合适的数据结构保存解析结果-使用Python ElementTree模块解析XML文件并设计数据结构-含源代码及解释
from xml.etree import ElementTree as ET 2.初始化一个ElementTree类。初始化ElementTree类常用两种方式:一种通过xml文件,一种通过字符串。 #通过xml文件初始化,test.xml是根文件夹的一个xml文件...
Python 有三种方法解析 XML,SAX,DOM,以及 ElementTree: 1.SAX (simple API for XML ) Python 标准库包含 SAX 解析器,SAX 用事件驱动模型,通过在解析XML的过程中触发一个个的事件并调用用户定义的回调函数来处理XML文件。 2.DOM(Document Object Model) 将 XML 数据在内存中解析成一个树,通过对树的操作来操作XML。 3.ElementTree(元素树) ElementTree就像一个轻量级的DOM,具有方便友