Java XML — Обзор

XML — это простой текстовый язык, разработанный для хранения и передачи данных в текстовом формате. Это означает расширяемый язык разметки. Ниже приведены некоторые характерные особенности XML.

XML — это язык разметки.
XML — это язык на основе тегов, такой как HTML.
Теги XML не предопределены как HTML.
Вы можете определить свои собственные теги, поэтому он называется расширяемым языком.
XML-теги предназначены для самоописания.
XML — Рекомендация W3C для хранения и передачи данных.

XML — это язык разметки.

XML — это язык на основе тегов, такой как HTML.

Теги XML не предопределены как HTML.

Вы можете определить свои собственные теги, поэтому он называется расширяемым языком.

XML-теги предназначены для самоописания.

XML — Рекомендация W3C для хранения и передачи данных.

пример

<?xml version = "1.0"?>
<Class>
   <Name>First</Name>
   <Sections>
      <Section>
         <Name>A</Name>
         <Students>
            <Student>Rohan</Student>
            <Student>Mohan</Student>
            <Student>Sohan</Student>
            <Student>Lalit</Student>
            <Student>Vinay</Student>
         </Students>
      </Section>
      
      <Section>
         <Name>B</Name>
         <Students>
            <Student>Robert</Student>
            <Student>Julie</Student>
            <Student>Kalie</Student>
            <Student>Michael</Student>
         </Students>
      </Section>
   </Sections>
</Class>

преимущества

Ниже приведены преимущества, которые предоставляет XML:

Независимость от технологии — XML, будучи простым текстом, не зависит от технологии. Может использоваться любой технологией для хранения и передачи данных.
Удобный для чтения — XML использует простой текстовый формат. Он читабелен и понятен человеку.
Расширяемость — в XML настраиваемые теги можно создавать и использовать очень легко.
Разрешить проверку — Использование структур XSD, DTD и XML можно легко проверить.

Независимость от технологии — XML, будучи простым текстом, не зависит от технологии. Может использоваться любой технологией для хранения и передачи данных.

Удобный для чтения — XML использует простой текстовый формат. Он читабелен и понятен человеку.

Расширяемость — в XML настраиваемые теги можно создавать и использовать очень легко.

Разрешить проверку — Использование структур XSD, DTD и XML можно легко проверить.

Недостатки

Ниже приведены недостатки использования XML —

Избыточный синтаксис. Обычно XML-файлы содержат много повторяющихся терминов.
Verbose. Будучи многословным языком, размер файла XML увеличивает стоимость передачи и хранения.

Избыточный синтаксис. Обычно XML-файлы содержат много повторяющихся терминов.

Verbose. Будучи многословным языком, размер файла XML увеличивает стоимость передачи и хранения.

Java XML — парсеры

Синтаксический анализ XML относится к просмотру XML-документа для доступа к данным или их изменения.

Что такое XML Parser?

XML Parser предоставляет способ доступа или изменения данных в документе XML. Java предоставляет несколько опций для анализа XML-документов. Ниже приведены различные типы синтаксических анализаторов, которые обычно используются для анализа XML-документов.

Dom Parser — анализирует XML-документ, загружая все содержимое документа и создавая его полное иерархическое дерево в памяти.
SAX Parser — анализирует XML-документ по триггерам на основе событий. Не загружает полный документ в память.
Анализатор JDOM — анализирует XML-документ аналогично анализатору DOM, но более простым способом.
StAX Parser — анализирует XML-документ аналогично SAX-анализатору, но более эффективным способом.
Анализатор XPath — анализирует XML-документ на основе выражения и широко используется в сочетании с XSLT.
DOM4J Parser — библиотека Java для анализа XML, XPath и XSLT с использованием Java Collections Framework. Он обеспечивает поддержку DOM, SAX и JAXP.

Dom Parser — анализирует XML-документ, загружая все содержимое документа и создавая его полное иерархическое дерево в памяти.

SAX Parser — анализирует XML-документ по триггерам на основе событий. Не загружает полный документ в память.

Анализатор JDOM — анализирует XML-документ аналогично анализатору DOM, но более простым способом.

StAX Parser — анализирует XML-документ аналогично SAX-анализатору, но более эффективным способом.

Анализатор XPath — анализирует XML-документ на основе выражения и широко используется в сочетании с XSLT.

DOM4J Parser — библиотека Java для анализа XML, XPath и XSLT с использованием Java Collections Framework. Он обеспечивает поддержку DOM, SAX и JAXP.

Доступны API-интерфейсы JAXB и XSLT для обработки синтаксического анализа XML объектно-ориентированным способом. Мы подробно рассмотрим каждый синтаксический анализатор в последующих главах этого урока.

Java DOM Parser — Обзор

Объектная модель документа (DOM) является официальной рекомендацией Консорциума World Wide Web (W3C). Он определяет интерфейс, который позволяет программам получать доступ и обновлять стиль, структуру и содержимое документов XML. XML-парсеры, поддерживающие DOM, реализуют этот интерфейс.

Когда использовать?

Вы должны использовать DOM-парсер, когда —

Вам нужно много знать о структуре документа.
Вам нужно перемещать части XML-документа (например, вы можете отсортировать определенные элементы).
Вам необходимо использовать информацию в документе XML более одного раза.

Вам нужно много знать о структуре документа.

Вам нужно перемещать части XML-документа (например, вы можете отсортировать определенные элементы).

Вам необходимо использовать информацию в документе XML более одного раза.

Что вы получаете?

Когда вы анализируете документ XML с помощью анализатора DOM, вы получаете древовидную структуру, которая содержит все элементы вашего документа. DOM предоставляет множество функций, которые вы можете использовать для проверки содержимого и структуры документа.

преимущества

DOM — это общий интерфейс для управления структурами документов. Одна из целей разработки заключается в том, чтобы код Java, написанный для одного DOM-совместимого синтаксического анализатора, работал на любом другом DOM-совместимом синтаксическом анализаторе без каких-либо изменений.

DOM интерфейсы

DOM определяет несколько интерфейсов Java. Вот наиболее распространенные интерфейсы —

Узел — базовый тип данных DOM.
Элемент — Подавляющее большинство объектов, с которыми вы будете иметь дело, это Элементы.
Attr — представляет атрибут элемента.
Текст — фактическое содержание элемента или атрибута.
Документ — представляет весь документ XML. Объект Document часто называют деревом DOM.

Узел — базовый тип данных DOM.

Элемент — Подавляющее большинство объектов, с которыми вы будете иметь дело, это Элементы.

Attr — представляет атрибут элемента.

Текст — фактическое содержание элемента или атрибута.

Документ — представляет весь документ XML. Объект Document часто называют деревом DOM.

Общие методы DOM

Когда вы работаете с DOM, вы часто будете использовать несколько методов:

Document.getDocumentElement () — возвращает корневой элемент документа.
Node.getFirstChild () — Возвращает первого потомка данного узла.
Node.getLastChild () — Возвращает последнего потомка данного узла.
Node.getNextSibling () — Эти методы возвращают следующего брата данного узла.
Node.getPreviousSibling () — Эти методы возвращают предыдущего родственного элемента данного узла.
Node.getAttribute (attrName) — для данного узла он возвращает атрибут с запрошенным именем.

Document.getDocumentElement () — возвращает корневой элемент документа.

Node.getFirstChild () — Возвращает первого потомка данного узла.

Node.getLastChild () — Возвращает последнего потомка данного узла.

Node.getNextSibling () — Эти методы возвращают следующего брата данного узла.

Node.getPreviousSibling () — Эти методы возвращают предыдущего родственного элемента данного узла.

Node.getAttribute (attrName) — для данного узла он возвращает атрибут с запрошенным именем.

Java DOM Parser — разбирать XML-документ

Шаги к использованию JDOM

Ниже приведены шаги, используемые при синтаксическом анализе документа с использованием JDOM Parser.

Импорт пакетов, связанных с XML.
Создать DocumentBuilder
Создать документ из файла или потока
Извлечь корневой элемент
Изучить атрибуты
Изучить подэлементы

Импорт пакетов, связанных с XML

import org.w3c.dom.*;
import javax.xml.parsers.*;
import java.io.*;

Создать DocumentBuilder

DocumentBuilderFactory factory =
DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();

Создать документ из файла или потока

StringBuilder xmlStringBuilder = new StringBuilder();
xmlStringBuilder.append("<?xml version="1.0"?>  ");
ByteArrayInputStream input = new ByteArrayInputStream(
   xmlStringBuilder.toString().getBytes("UTF-8"));
Document doc = builder.parse(input);

Извлечь корневой элемент

Element root = document.getDocumentElement();

Изучить атрибуты

//returns specific attribute
getAttribute("attributeName");

//returns a Map (table) of names/values
getAttributes();

Изучить подэлементы

//returns a list of subelements of specified name
getElementsByTagName("subelementName");

//returns a list of all child nodes
getChildNodes();

Демо-пример

Вот входной XML-файл, который нам нужно проанализировать —

<?xml version = "1.0"?>
<class>
   <student rollno = "393">
      <firstname>dinkar</firstname>
      <lastname>kad</lastname>
      <nickname>dinkar</nickname>
      <marks>85</marks>
   </student>
   
   <student rollno = "493">
      <firstname>Vaneet</firstname>
      <lastname>Gupta</lastname>
      <nickname>vinni</nickname>
      <marks>95</marks>
   </student>
   
   <student rollno = "593">
      <firstname>jasvir</firstname>
      <lastname>singn</lastname>
      <nickname>jazz</nickname>
      <marks>90</marks>
   </student>
</class>

DomParserDemo.java

package com.tutorialspoint.xml;

import java.io.File;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.DocumentBuilder;
import org.w3c.dom.Document;
import org.w3c.dom.NodeList;
import org.w3c.dom.Node;
import org.w3c.dom.Element;

public class DomParserDemo {

   public static void main(String[] args) {

      try {
         File inputFile = new File("input.txt");
         DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
         DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();
         Document doc = dBuilder.parse(inputFile);
         doc.getDocumentElement().normalize();
         System.out.println("Root element :" + doc.getDocumentElement().getNodeName());
         NodeList nList = doc.getElementsByTagName("student");
         System.out.println("----------------------------");
         
         for (int temp = 0; temp < nList.getLength(); temp++) {
            Node nNode = nList.item(temp);
            System.out.println("\nCurrent Element :" + nNode.getNodeName());
            
            if (nNode.getNodeType() == Node.ELEMENT_NODE) {
               Element eElement = (Element) nNode;
               System.out.println("Student roll no : " 
                  + eElement.getAttribute("rollno"));
               System.out.println("First Name : " 
                  + eElement
                  .getElementsByTagName("firstname")
                  .item(0)
                  .getTextContent());
               System.out.println("Last Name : " 
                  + eElement
                  .getElementsByTagName("lastname")
                  .item(0)
                  .getTextContent());
               System.out.println("Nick Name : " 
                  + eElement
                  .getElementsByTagName("nickname")
                  .item(0)
                  .getTextContent());
               System.out.println("Marks : " 
                  + eElement
                  .getElementsByTagName("marks")
                  .item(0)
                  .getTextContent());
            }
         }
      } catch (Exception e) {
         e.printStackTrace();
      }
   }
}

Это даст следующий результат —

Root element :class
----------------------------

Current Element :student
Student roll no : 393
First Name : dinkar
Last Name : kad
Nick Name : dinkar
Marks : 85

Current Element :student
Student roll no : 493
First Name : Vaneet
Last Name : Gupta
Nick Name : vinni
Marks : 95

Current Element :student
Student roll no : 593
First Name : jasvir
Last Name : singn
Nick Name : jazz
Marks : 90

Java DOM Parser — запрос XML-документа

Демо-пример

Вот входной XML-файл, который нам нужно запросить —

<?xml version = "1.0"?>
<cars>
   <supercars company = "Ferrari">
      <carname type = "formula one">Ferarri 101</carname>
      <carname type = "sports car">Ferarri 201</carname>
      <carname type = "sports car">Ferarri 301</carname>
   </supercars>
   
   <supercars company = "Lamborgini">
      <carname>Lamborgini 001</carname>
      <carname>Lamborgini 002</carname>
      <carname>Lamborgini 003</carname>
   </supercars>
   
   <luxurycars company = "Benteley">
      <carname>Benteley 1</carname>
      <carname>Benteley 2</carname>
      <carname>Benteley 3</carname>
   </luxurycars>
</cars>

QueryXmlFileDemo.java

package com.tutorialspoint.xml;

import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.DocumentBuilder;
import org.w3c.dom.Document;
import org.w3c.dom.NodeList;
import org.w3c.dom.Node;
import org.w3c.dom.Element;
import java.io.File;

public class QueryXmlFileDemo {

   public static void main(String argv[]) {
 
      try {
         File inputFile = new File("input.txt");
         DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
         DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();
         Document doc = dBuilder.parse(inputFile);
         doc.getDocumentElement().normalize();
         System.out.print("Root element: ");
         System.out.println(doc.getDocumentElement().getNodeName());
         NodeList nList = doc.getElementsByTagName("supercars");
         System.out.println("----------------------------");
         
         for (int temp = 0; temp < nList.getLength(); temp++) {
            Node nNode = nList.item(temp);
            System.out.println("\nCurrent Element :");
            System.out.print(nNode.getNodeName());
            
            if (nNode.getNodeType() == Node.ELEMENT_NODE) {
               Element eElement = (Element) nNode;
               System.out.print("company : ");
               System.out.println(eElement.getAttribute("company"));
               NodeList carNameList = eElement.getElementsByTagName("carname");
               
               for (int count = 0; count < carNameList.getLength(); count++) {
                  Node node1 = carNameList.item(count);
                  
                  if (node1.getNodeType() == node1.ELEMENT_NODE) {
                     Element car = (Element) node1;
                     System.out.print("car name : ");
                     System.out.println(car.getTextContent());
                     System.out.print("car type : ");
                     System.out.println(car.getAttribute("type"));
                  }
               }
            }
         }
      } catch (Exception e) {
         e.printStackTrace();
      }
   }
}

Это даст следующий результат —

Root element: cars
----------------------------

Current Element :
supercarscompany : Ferrari
car name : Ferarri 101
car type : formula one
car name : Ferarri 201
car type : sports car
car name : Ferarri 301
car type : sports car

Current Element :
supercarscompany : Lamborgini
car name : Lamborgini 001
car type : 
car name : Lamborgini 002
car type : 
car name : Lamborgini 003
car type :

Java DOM Parser — Создание XML-документа

Демо-пример

Вот XML, который нам нужно создать —

<?xml version = "1.0" encoding = "UTF-8" standalone = "no"?>
<cars>
   <supercars company = "Ferrari">
      <carname type = "formula one">Ferrari 101</carname>
      <carname type = "sports">Ferrari 202</carname>
   </supercars>
</cars>

Sr.No.	Выражение и описание
1	имя-узла Выберите все узлы с заданным именем «nodename»
2	/ Выбор начинается с корневого узла
3	// Выбор начинается с текущего узла, соответствующего выбору
4	, Выбирает текущий узел
5	.. Выбирает родителя текущего узла
6	@ Выбирает атрибуты
7	ученик Пример — выбираются все узлы с именем «студент»
8	класс / студент Пример — выбираются все элементы ученика, которые являются потомками класса
9	//ученик Выбирает все элементы ученика независимо от того, где они находятся в документе

выражение	Результат
/ Класс / студент [1]	Выбирает первый элемент ученика, который является дочерним элементом элемента класса.
/ Класс / студент [последняя ()]	Выбирает последний элемент студента, который является дочерним элементом элемента класса.
/ Класс / студент [последняя () — 1]	Выбирает последний, кроме одного студенческого элемента, который является дочерним элементом элемента класса.
// студент [@rollno = ‘493’]	Выбирает все элементы ученика, которые имеют атрибут с именем rollno со значением ‘493’

Java XML — Краткое руководство

Java XML — Обзор

пример

преимущества

Недостатки

Java XML — парсеры

Что такое XML Parser?

Java DOM Parser — Обзор

Когда использовать?

Что вы получаете?

преимущества

DOM интерфейсы

Общие методы DOM

Java DOM Parser — разбирать XML-документ

Шаги к использованию JDOM

Импорт пакетов, связанных с XML

Создать DocumentBuilder

Создать документ из файла или потока

Извлечь корневой элемент

Изучить атрибуты

Изучить подэлементы

Демо-пример

DomParserDemo.java

Java DOM Parser — запрос XML-документа

Демо-пример

QueryXmlFileDemo.java

Java DOM Parser — Создание XML-документа

Демо-пример

CreateXmlFileDemo.java

Java DOM Parser — Изменить XML-документ

Демо-пример

ModifyXmlFileDemo.java

Java SAX Parser — Обзор

Когда использовать?

Недостатки SAX

Интерфейс ContentHandler

Интерфейс атрибутов

Java SAX Parser — разбирать XML-документ

Демо-пример

UserHandler.java

SAXParserDemo.java

Java SAX Parser — запрос XML-документа

Демо-пример

UserHandler.java

SAXQueryDemo.java

Java SAX Parser — Создание XML-документа

Java SAX Parser — Изменить XML-документ

Демо-пример

SAXModifyDemo.java

Java JDOM Parser — Обзор

Настройка среды

Когда использовать?

Что вы получаете?

преимущества

Классы JDOM

Общие методы JDOM

Java JDOM Parser — разбирать XML-документ

Шаги к использованию JDOM

Импорт пакетов, связанных с XML

Создать DocumentBuilder

Создать документ из файла или потока

Извлечь корневой элемент

Изучить атрибуты

Изучить подэлементы

Демо-пример

DomParserDemo.java

Java JDOM Parser — Запрос XML-документа

Демо-пример

QueryXmlFileDemo.java

Java JDOM Parser — Создание XML-документа

Демо-пример

CreateXmlFileDemo.java

Java JDOM Parser — Изменить XML-документ

Демо-пример

ModifyXmlFileDemo.java

Java StAX Parser — Обзор

Настройка среды

Когда использовать?

Недостатки SAX

Класс XMLEventReader