dom4j解析xml字符串实例[转]

news/2024/10/3 19:55:31

DOM4J

    与利用DOM、SAX、JAXP机制来解析xml相比,DOM4J 表现更优秀,具有性能优异、功能强大和极端易用使用的特点,只要懂得DOM基本概念,就可以通过dom4j的api文档来解析xml。dom4j是一套开源的api。实际项目中,往往选择dom4j来作为解析xml的利器。

先来看看dom4j中对应XML的DOM树建立的继承关系

针对于XML标准定义,对应于图2-1列出的内容,dom4j提供了以下实现:

同时,dom4j的NodeType枚举实现了XML规范中定义的node类型。如此可以在遍历xml文档的时候通过常量来判断节点类型了。

常用API

class org.dom4j.io.SAXReader

  • read  提供多种读取xml文件的方式,返回一个Domcument对象

interface org.dom4j.Document

  • iterator  使用此法获取node
  • getRootElement  获取根节点

interface org.dom4j.Node

  • getName  获取node名字,例如获取根节点名称为bookstore
  • getNodeType  获取node类型常量值,例如获取到bookstore类型为1——Element
  • getNodeTypeName  获取node类型名称,例如获取到的bookstore类型名称为Element

interface org.dom4j.Element

  • attributes  返回该元素的属性列表
  • attributeValue  根据传入的属性名获取属性值
  • elementIterator  返回包含子元素的迭代器
  • elements  返回包含子元素的列表

interface org.dom4j.Attribute

  • getName  获取属性名
  • getValue  获取属性值

interface org.dom4j.Text

  • getText  获取Text节点值

interface org.dom4j.CDATA

  • getText  获取CDATA Section值

interface org.dom4j.Comment

  • getText  获取注释

实例一:

//先加入dom4j.jar包 
import java.util.HashMap;
import java.util.Iterator;
import java.util.Map;import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;/**   
* @Title: TestDom4j.java
* @Package 
* @Description: 解析xml字符串
* @author 无处不在
* @date 2012-11-20 下午05:14:05
* @version V1.0   
*/
public class TestDom4j {public void readStringXml(String xml) {Document doc = null;try {// 读取并解析XML文档// SAXReader就是一个管道,用一个流的方式,把xml文件读出来// // SAXReader reader = new SAXReader(); //User.hbm.xml表示你要解析的xml文档// Document document = reader.read(new File("User.hbm.xml"));// 下面的是通过解析xml字符串的doc = DocumentHelper.parseText(xml); // 将字符串转为XML
Element rootElt = doc.getRootElement(); // 获取根节点System.out.println("根节点:" + rootElt.getName()); // 拿到根节点的名称
Iterator iter = rootElt.elementIterator("head"); // 获取根节点下的子节点head// 遍历head节点while (iter.hasNext()) {Element recordEle = (Element) iter.next();String title = recordEle.elementTextTrim("title"); // 拿到head节点下的子节点title值System.out.println("title:" + title);Iterator iters = recordEle.elementIterator("script"); // 获取子节点head下的子节点script// 遍历Header节点下的Response节点while (iters.hasNext()) {Element itemEle = (Element) iters.next();String username = itemEle.elementTextTrim("username"); // 拿到head下的子节点script下的字节点username的值String password = itemEle.elementTextTrim("password");System.out.println("username:" + username);System.out.println("password:" + password);}}Iterator iterss = rootElt.elementIterator("body"); ///获取根节点下的子节点body// 遍历body节点while (iterss.hasNext()) {Element recordEless = (Element) iterss.next();String result = recordEless.elementTextTrim("result"); // 拿到body节点下的子节点result值System.out.println("result:" + result);Iterator itersElIterator = recordEless.elementIterator("form"); // 获取子节点body下的子节点form// 遍历Header节点下的Response节点while (itersElIterator.hasNext()) {Element itemEle = (Element) itersElIterator.next();String banlce = itemEle.elementTextTrim("banlce"); // 拿到body下的子节点form下的字节点banlce的值String subID = itemEle.elementTextTrim("subID");System.out.println("banlce:" + banlce);System.out.println("subID:" + subID);}}} catch (DocumentException e) {e.printStackTrace();} catch (Exception e) {e.printStackTrace();}}/*** @description 将xml字符串转换成map* @param xml* @return Map*/public static Map readStringXmlOut(String xml) {Map map = new HashMap();Document doc = null;try {// 将字符串转为XMLdoc = DocumentHelper.parseText(xml); // 获取根节点Element rootElt = doc.getRootElement(); // 拿到根节点的名称System.out.println("根节点:" + rootElt.getName()); // 获取根节点下的子节点headIterator iter = rootElt.elementIterator("head"); // 遍历head节点while (iter.hasNext()) {Element recordEle = (Element) iter.next();// 拿到head节点下的子节点title值String title = recordEle.elementTextTrim("title"); System.out.println("title:" + title);map.put("title", title);// 获取子节点head下的子节点scriptIterator iters = recordEle.elementIterator("script"); // 遍历Header节点下的Response节点while (iters.hasNext()) {Element itemEle = (Element) iters.next();// 拿到head下的子节点script下的字节点username的值String username = itemEle.elementTextTrim("username"); String password = itemEle.elementTextTrim("password");System.out.println("username:" + username);System.out.println("password:" + password);map.put("username", username);map.put("password", password);}}//获取根节点下的子节点bodyIterator iterss = rootElt.elementIterator("body"); // 遍历body节点while (iterss.hasNext()) {Element recordEless = (Element) iterss.next();// 拿到body节点下的子节点result值String result = recordEless.elementTextTrim("result"); System.out.println("result:" + result);// 获取子节点body下的子节点formIterator itersElIterator = recordEless.elementIterator("form"); // 遍历Header节点下的Response节点while (itersElIterator.hasNext()) {Element itemEle = (Element) itersElIterator.next();// 拿到body下的子节点form下的字节点banlce的值String banlce = itemEle.elementTextTrim("banlce"); String subID = itemEle.elementTextTrim("subID");System.out.println("banlce:" + banlce);System.out.println("subID:" + subID);map.put("result", result);map.put("banlce", banlce);map.put("subID", subID);}}} catch (DocumentException e) {e.printStackTrace();} catch (Exception e) {e.printStackTrace();}return map;}public static void main(String[] args) {// 下面是需要解析的xml字符串例子String xmlString = "<html>" + "<head>" + "<title>dom4j解析一个例子</title>"+ "<script>" + "<username>yangrong</username>"+ "<password>123456</password>" + "</script>" + "</head>"+ "<body>" + "<result>0</result>" + "<form>"+ "<banlce>1000</banlce>" + "<subID>36242519880716</subID>"+ "</form>" + "</body>" + "</html>";/** Test2 test = new Test2(); test.readStringXml(xmlString);*/Map map = readStringXmlOut(xmlString);Iterator iters = map.keySet().iterator();while (iters.hasNext()) {String key = iters.next().toString(); // 拿到键String val = map.get(key).toString(); // 拿到值System.out.println(key + "=" + val);}}}

实例二:

/*** 解析包含有DB连接信息的XML文件* 格式必须符合如下规范:* 1. 最多三级,每级的node名称自定义;* 2. 二级节点支持节点属性,属性将被视作子节点;* 3. CDATA必须包含在节点中,不能单独出现。** 示例1——三级显示:* <db-connections>*         <connection>*            <name>DBTest</name>*            <jndi></jndi>*            <url>*                <![CDATA[jdbc:mysql://localhost:3306/db_test?useUnicode=true&characterEncoding=UTF8]]>*             </url>*            <driver>org.gjt.mm.mysql.Driver</driver>*             <user>test</user>*            <password>test2012</password>*            <max-active>10</max-active>*            <max-idle>10</max-idle>*            <min-idle>2</min-idle>*            <max-wait>10</max-wait>*            <validation-query>SELECT 1+1</validation-query>*         </connection>* </db-connections>** 示例2——节点属性:* <bookstore>*         <book category="cooking">*            <title lang="en">Everyday Italian</title>*            <author>Giada De Laurentiis</author>*            <year>2005</year>*            <price>30.00</price>*         </book>**         <book category="children" title="Harry Potter" author="J K. Rowling" year="2005" price="$29.9"/>* </bookstore>** @param configFile* @return* @throws Exception*/
public static List<Map<String, String>> parseDBXML(String configFile) throws Exception {List<Map<String, String>> dbConnections = new ArrayList<Map<String, String>>();InputStream is = Parser.class.getResourceAsStream(configFile);SAXReader saxReader = new SAXReader();Document document = saxReader.read(is);Element connections = document.getRootElement();Iterator<Element> rootIter = connections.elementIterator();while (rootIter.hasNext()) {Element connection = rootIter.next();Iterator<Element> childIter = connection.elementIterator();Map<String, String> connectionInfo = new HashMap<String, String>();List<Attribute> attributes = connection.attributes();for (int i = 0; i < attributes.size(); ++i) { // 添加节点属性
            connectionInfo.put(attributes.get(i).getName(), attributes.get(i).getValue());}while (childIter.hasNext()) { // 添加子节点Element attr = childIter.next();connectionInfo.put(attr.getName().trim(), attr.getText().trim());}dbConnections.add(connectionInfo);}return dbConnections;
}

转载于:https://www.cnblogs.com/zhangdb/p/3711499.html


https://dhexx.cn/news/show-18593.html

相关文章

C++ 21 set容器

目录 一、set容器 1.1 简介 1.2 构造和赋值 1.3 大小和交换 1.4 插入和删除 1.5 查找和统计 1.6 set和multiset区别 1.7 内置类型指定排序规则 1.8 自定义数据类型指定排序规则 一、set容器 1.1 简介 ① set容器中所有元素在插入时自动被排序。 ② set容器和multise…

linux系统 文件属性和权限更改--

文件的属性&#xff1a;ls -lrti 135088935 -rw-------. 1 root root 1778 Oct 1 2020 yum.log 第一列&#xff1a;i节点&#xff1b;i节点可以理解文件id&#xff0c;一个i节点号可以对应多个文件&#xff0c;一个文件只能对应一个i节点号 第二列&#xff1a;文件的类型与权限…

cug上的几道dp题

题目链接&#xff1a;http://acm.cug.edu.cn/JudgeOnline/problem.php?id1317 思路&#xff1a;dp[i][j]表示以a[i]为结尾的串与以b[j]为结尾的串的最小编辑距离&#xff0c;则 若a[i]a[j],有dp[i][j]dp[i-1][j-1]; 否则dp[i][j]min{dp[i-1][j-1]2,dp[i-1][j]3,dp[i][j-1]3} 1…

TableLayoutPanel居中和单元格内元素居中

在后台程序新建一个TableLayoutPanel 添加到form中&#xff0c;默认显示在左上角&#xff0c;想了很多让它居中的办法&#xff0c;在网上找了不少 最好的是&#xff1a; winform要设置控件的位置有3种&#xff1a; 1.控件的anchor属性属性&#xff0c;&#xff0c;瞄定。。。。…

图像拼接的c语言程序,c – 使用OpenCV进行图像拼接细节

这确实是一个非常有趣的问题.正如hatboyzero指出的那样,变量的含义相当简单&#xff1a;> Nm是匹配的数量(在重叠区域中,因此已经删除了明显的异常值).> Ni是找到Ransac单应性后的​​内部数.> C是两张图像匹配的信心.匹配的背景通过在所有图像中找到兴趣点并为它们计…

linux系统 文件归档与解压缩--

文件归档&#xff1a; 文件归档也称之为打包&#xff0c;指的是一个文件或者多个文件或者目录的一个集合&#xff0c;这个集合储存在一个文件中。 归档文件是没有进行压缩的&#xff0c;所以占用的空间是所有文件或者目录的总和。 工作中经常与压缩结合在一起使用 …

微信小程序语言c#,微信小程序推出最新脚本语言WXS,你需要知道的全在这里了...

原标题&#xff1a;微信小程序推出最新脚本语言WXS&#xff0c;你需要知道的全在这里了感谢“造程序”(微信ID&#xff1a;zaochengxucom)的授权发布。责编&#xff1a;陈秋歌&#xff0c;关注微信开发等领域&#xff0c;寻求报道或者投稿请发邮件至chenqg#csdn.net。WXS脚本语…

演示报告关于当前数据库环境的信息

本文内容 软件环境 演示报告关于当前数据库环境的信息 软件环境 Windows Server 2008 R2 Oracle 11g Release 1 (11.1) 演示报告关于当前数据库环境的信息 SQL> set termout off SQL> store set store rep 已写入 file store SQL> set head off SQL> set pause …

几种通过JDBC操作数据库的方法,以及返回数据的处理

1.SQL TO String &#xff1a;只返回一个查询结果 例如查询某条记录的总数 rs stmt.executeQuery(replacedCommand); if (rs ! null && rs.next()) // rs only contains one row and one column { String tempStr rs.get…

linux搜索神器find命令高级用法--

基本用法&#xff1a;find 路径 选项 -type #根据文件类型 find /var/log -type f -name "*.log" &#xff1b;find /var/log -type d -name #根据文件名 find /var/log -type f -name "*.log" -perm #根据文件权限 find /var/log -perm 600 -…