解析XML的4种方式及优缺点比较
dom, sax是解析xml的底層接口
而jdom和dom4j則是基于底層api的更高級封裝???
dom是通用的,而jdom和dom4j則是面向java語言的
?
(方法一). DOM解析說明:為?XML?文檔的已解析版本定義了一組接口。解析器讀入整個文檔,然后構(gòu)建一個駐留內(nèi)存的樹結(jié)
構(gòu), 然后代碼就可以使用?DOM?接口來操作這個樹結(jié)構(gòu)。優(yōu)點:整個文檔樹在內(nèi)存中,便于操作;支持刪除、修改、重新排列等多種功能;缺點:將整個文檔調(diào)入內(nèi) 存(包括無用的節(jié)點),浪費時間和空間;使用場合:一旦解析了文檔還需多次訪問這些數(shù)據(jù);硬件資源充足(內(nèi)存、CPU).
(方法二)SAX解析說明:為解決DOM的問題,出現(xiàn)了SAX。SAX?,事件驅(qū)動。當解析器發(fā)現(xiàn)元素開始、元素結(jié)束、文本、文檔的
開 始或結(jié)束等時,發(fā)送事件,程序員編寫響應(yīng)這些事件的代碼,保存數(shù)據(jù)。優(yōu)點:不用事先調(diào)入整個文檔,占用資源少;SAX解析器代碼比DOM解析器代碼小,適 于Applet,下載。缺點:不是持久的;事件過后,若沒保存數(shù)據(jù),那么數(shù)據(jù)就丟了;無狀態(tài)性;從事件中只能得到文本,但不知該文本屬于哪個元素;使用場 合:Applet;只需XML文檔的少量內(nèi)容,很少回頭訪問;機器內(nèi)存少
1 <?xml version="1.0" encoding="UTF-8"?> 2 <BOM Code="LM4029"> 3 <Child Code="LM4029MC"> 4 <Quantity>2.000000</Quantity> 5 </Child> 6 <Child Code="LM4029D"> 7 <Quantity>1.000000</Quantity> 8 </Child> 9 <Child Code="LM4029PH"> 10 <Quantity>1.000000</Quantity> 11 </Child> 12 <Child Code ="LM4029PS"> 13 <Quantity>1.000000</Quantity> 14 </Child> 15 <Child Code="LM4029SB"> 16 <Quantity>1.000000</Quantity> 17 </Child> 18 </BOM> XML 1 import java.util.Stack; 2 3 import javax.xml.parsers.SAXParser; 4 import javax.xml.parsers.SAXParserFactory; 5 6 import org.xml.sax.Attributes; 7 import org.xml.sax.SAXException; 8 import org.xml.sax.helpers.DefaultHandler; 9 10 public class SAXDemo { 11 12 private final static String uri = "D:\\bom.xml"; 13 14 public static void main(String[] args) { 15 SAXParserFactory factory = SAXParserFactory.newInstance(); 16 try { 17 SAXParser parser = factory.newSAXParser(); 18 parser.parse(uri, new MyHandler()); 19 } catch (Exception e) { 20 e.printStackTrace(); 21 } 22 } 23 } 24 25 class Child { 26 private String code; 27 private double quantity; 28 29 public String getCode() { 30 return code; 31 } 32 33 public void setCode(String code) { 34 this.code = code; 35 } 36 37 public double getQuantity() { 38 return quantity; 39 } 40 41 public void setQuantity(double quantity) { 42 this.quantity = quantity; 43 } 44 45 } 46 47 class MyHandler extends DefaultHandler { 48 49 Stack<String> stack = null; 50 Child child = null; 51 52 @Override 53 public void startDocument() throws SAXException { 54 System.out.println("start document"); 55 stack = new Stack<String>(); 56 } 57 58 @Override 59 public void endDocument() throws SAXException { 60 System.out.println("end document"); 61 stack = null; 62 } 63 64 @Override 65 public void startElement(String uri, String localName, String qName, 66 Attributes attributes) throws SAXException { 67 stack.push(qName); 68 if ("Child".equals(qName)) { 69 child = new Child(); 70 child.setCode(attributes.getValue("Code")); 71 } 72 } 73 74 @Override 75 public void endElement(String uri, String localName, String qName) 76 throws SAXException { 77 stack.pop(); 78 if ("Child".equals(qName)) { 79 System.out.println("Code -> " + child.getCode() + ", Quantity -> " 80 + child.getQuantity()); 81 child = null; 82 } 83 } 84 85 @Override 86 public void characters(char[] ch, int start, int length) 87 throws SAXException { 88 if ("Quantity".equals(stack.peek())) { 89 child.setQuantity(Double.parseDouble(new String(ch, start, length))); 90 } 91 } 92 } View Code(方法三)JDOM解析說明:為減少DOM、SAX的編碼量,出現(xiàn)了JDOM;優(yōu)點:20-80原則,極大減少了代碼量。使用場合:要實現(xiàn)的功能
簡單,如解析、創(chuàng)建等,但在底層,JDOM還是使用SAX(最常用),DOM
(方法四)DOM4J解析說明:DOM4J?是一個非常非常優(yōu)秀的Java?XML?API,具有性能優(yōu)異、功能強大和極端易用使用的特點,同
時它也是一個開放源代碼的軟件。如今你可以看到越來越多的?Java?軟件都在使用?DOM4J?來讀寫?XML
1 import java.io.File; 2 import java.io.IOException; 3 import java.util.Iterator; 4 5 import javax.xml.parsers.DocumentBuilder; 6 import javax.xml.parsers.DocumentBuilderFactory; 7 import javax.xml.parsers.ParserConfigurationException; 8 9 import org.dom4j.Attribute; 10 import org.dom4j.Document; 11 import org.dom4j.DocumentException; 12 import org.dom4j.Element; 13 import org.dom4j.io.DOMReader; 14 import org.dom4j.io.SAXReader; 15 import org.xml.sax.SAXException; 16 17 public class Dom4jDemo { 18 19 private final static String xmlPath = "D:\\bom.xml"; 20 21 public static void parseElement() throws DocumentException, 22 ParserConfigurationException, SAXException, IOException { 23 // 方式一 DOM 24 // DocumentBuilderFactory factory = 25 // DocumentBuilderFactory.newInstance(); 26 // DocumentBuilder builder = factory.newDocumentBuilder(); 27 // org.w3c.dom.Document domDoc = builder.parse(xmlPath); 28 // DOMReader domReader = new DOMReader(); 29 // Document document = domReader.read(domDoc); 30 31 //方式二 SAX(常用) 32 SAXReader saxReader = new SAXReader(); 33 Document document = saxReader.read(new File(xmlPath)); 34 Element rootEl = document.getRootElement(); 35 36 for (Iterator iterator = rootEl.elementIterator("Child"); iterator 37 .hasNext();) { 38 Element e = (Element) iterator.next(); 39 System.out.print("Code -> " + e.attributeValue("Code")); 40 System.out.println(" Quantity -> " + e.elementText("Quantity")); 41 } 42 } 43 44 } View Code總結(jié):
1.DOM, JDOM在性能上不如SAX, DOM4J, 在小文檔情況下還值得考慮使用 DOM 和 JDOM。
2.DOM 實現(xiàn)廣泛應(yīng)用于多種編程語言。它還是許多其它與 XML 相關(guān)的標準的基礎(chǔ),因為它正式獲得 W3C 推薦(與基于非標準的 Java 模型相對),所以在某些類型的項目中可能也需要它(如在 javascript 中使用 DOM)。
3.SAX?的高效取決于特定的解析方式,不用事先調(diào)入整個文檔,占用資源少。
4.如果不考慮可移植性,?首先考慮使用DOM4J。
轉(zhuǎn)載于:https://www.cnblogs.com/darkdog/p/4279382.html
總結(jié)
以上是生活随笔為你收集整理的解析XML的4种方式及优缺点比较的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: OCulus Rift 游戏开发六原则
- 下一篇: [分享]运维分享一一阿里云linux系统