麦田技术博客

与 DOM 建立树形结构的方式不同，SAX 采用事件模型来解析 XML 文档，是解析 XML 文档的一种更快速、更轻量的方法。利用 SAX 可以对 XML 文档进行有选择的解析和访问，而不必像 DOM 那样加载整个文档，因此它对内存的要求较低。但 SAX 对 XML 文档的解析为一次性读取，不创建任何文档对象，很难同时访问文档中的多处数据。在解析xml文件之前，我们要先了解xml文件的节点的种类，一种是ElementNode，一种是TextNode。

如下面代码片段

<root>
   <person>
      <username>张三</username>
      <age>22</age>
      <idcard>320105197903082216</idcard>
   </person>
</root>

其中<root>、<person>属于ElementNode，张三、22属于TextNode,然后还要知道SAX解析XML的执行顺序，看下面这张图

License Badge

xml文件被Sax解析器载入，由于Sax解析是按照xml文件的顺序来解析，首先会调用startDocument()方法，当读入的时候，由于它是ElementNode,所以会调用startElement(String uri, String localName, String qName,Attributes attributes)方法，其中第三个参数是节点的名称，图中3的位置会调用characters(char[] ch, int start, int length)方法虽然是空白，Sax解析器也会把它认为是一个TextNode,由于空白不是我们想要的数据，我们需要的是节点下的文本信息，所以这就要定义一个标识来记录上一节点的名称在characters()方法中，判断当前节点是不是username，如果是，就取出里面的文本信息

简单概括一下执行顺序

1、startDocument
2、startElement <root>
3、characters 空白
4、startElement <person>
5、characters 空白
6、startElement <username>
7、characters 张三
8、endElement </username>

首先定义Person类，封装Person对象

public class Person {
	private String username;
	private String age;
	private String idcard;

	public String getUsername() {
		return username;
	}

	public void setUsername(String username) {
		this.username = username;
	}

	public String getAge() {
		return age;
	}

	public void setAge(String age) {
		this.age = age;
	}

	public String getIdcard() {
		return idcard;
	}

	public void setIdcard(String idcard) {
		this.idcard = idcard;
	}

	public String toString() {
		StringBuffer buf = new StringBuffer();
		buf.append("username: " + username);
		buf.append(", age: " + age);
		buf.append(", idcard: " + idcard);
		return buf.toString();
	}
}

SAX解析代码如下：

import java.io.File;
import java.util.ArrayList;
import java.util.List;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
import com.home.bean.Person;

public class SaxParseService extends DefaultHandler {
	private List<Person> persons = null; // 保存Person
	private Person person = null;
	private String preTag = null;// 作用是记录解析时的上一个节点名称

	public List<Person> getPersons(File file) throws Exception {
		SAXParserFactory factory = SAXParserFactory.newInstance();
		SAXParser parser = factory.newSAXParser();
		SaxParseService handler = new SaxParseService();
		parser.parse(file, handler);
		return handler.getPersons();
	}

	public List<Person> getPersons() {
		return persons;
	}

	@Override
	public void startDocument() throws SAXException {
		persons = new ArrayList<Person>();
	}

	@Override
	public void startElement(String uri, String localName, String qName,
			Attributes attributes) throws SAXException {
		if ("person".equals(qName)) {
			person = new Person(); // 如果节点为<person> 就实例化一个对象
		}
		preTag = qName;// 将正在解析的节点名称赋给preTag
	}

	@Override
	public void endElement(String uri, String localName, String qName)
			throws SAXException {
		if ("person".equals(qName)) {
			persons.add(person);
			person = null;
		}
		preTag = null; // 当解析结束时设置为空，以便执行characters()方法时进行匹配
	}

	@Override
	public void characters(char[] ch, int start, int length)
			throws SAXException {
		if (preTag != null) {
			String content = new String(ch, start, length);
			if ("username".equals(preTag)) {
				person.setUsername(content);
			} else if ("age".equals(preTag)) {
				person.setAge(content);
			} else if ("idcard".equals(preTag)) {
				person.setIdcard(content);
			}
		}
	}

	public static void main(String[] args) {
		SaxParseService sax = new SaxParseService();
		File file = new File("person.xml");
		try {
			List<Person> persons = sax.getPersons(file);
			for (Person person : persons) {
				System.out.println(person.toString());
			}
		} catch (Exception e) {
			e.printStackTrace();
		}
	}
}

最新文章

链接

标签云

2016年11月22日 - Java SAX 解析 XML

首先定义Person类，封装Person对象

SAX解析代码如下：