DOM4J — это библиотека на основе Java с открытым исходным кодом для анализа XML-документов. Это очень гибкий и энергоэффективный API. Он оптимизирован для Java и использует коллекции Java, такие как List и Arrays.
DOM4J работает с DOM, SAX, XPath и XSLT. Он может анализировать большие XML-документы с очень низким объемом памяти.
Настройка среды
Чтобы использовать анализатор DOM4J, вы должны иметь dom4j-1.6.1.jar и jaxen.jar в пути к классам вашего приложения. Скачайте dom4j-1.6.1.zip.
Когда использовать?
Вы должны использовать парсер DOM4J, когда —
-
Вам нужно много знать о структуре XML-документа.
-
Вам нужно перемещать части XML-документа (например, вы можете отсортировать определенные элементы).
-
Вам необходимо использовать информацию в документе XML более одного раза.
-
Вы — разработчик Java и хотите использовать оптимизированный для Java синтаксический анализ XML.
Вам нужно много знать о структуре XML-документа.
Вам нужно перемещать части XML-документа (например, вы можете отсортировать определенные элементы).
Вам необходимо использовать информацию в документе XML более одного раза.
Вы — разработчик Java и хотите использовать оптимизированный для Java синтаксический анализ XML.
Что вы получаете?
Когда вы анализируете документ XML с помощью синтаксического анализатора DOM4J, вы получаете гибкость, чтобы получить древовидную структуру, которая содержит все элементы вашего документа без влияния на объем памяти приложения.
DOM4J предоставляет множество служебных функций, которые можно использовать для проверки содержимого и структуры документа XML в случае, если документ хорошо структурирован и его структура известна.
DOM4J использует выражение XPath для навигации по документу XML.
преимущества
DOM4J предоставляет разработчикам Java гибкость и простоту обслуживания кода синтаксического анализа XML. Это легкий и быстрый API.
DOM4J Классы
DOM4J определяет несколько классов Java. Вот самые распространенные занятия —
-
Документ — представляет весь документ XML. Объект Document часто называют деревом DOM.
-
Элемент — представляет элемент XML. Элемент объекта имеет методы для управления его дочерними элементами, текстом, атрибутами и пространствами имен.
-
Атрибут — представляет атрибут элемента. Атрибут имеет метод для получения и установки значения атрибута. У него есть родительский тип и тип атрибута.
-
Узел — представляет элемент, атрибут или инструкцию обработки.
Документ — представляет весь документ XML. Объект Document часто называют деревом DOM.
Элемент — представляет элемент XML. Элемент объекта имеет методы для управления его дочерними элементами, текстом, атрибутами и пространствами имен.
Атрибут — представляет атрибут элемента. Атрибут имеет метод для получения и установки значения атрибута. У него есть родительский тип и тип атрибута.
Узел — представляет элемент, атрибут или инструкцию обработки.
Общие методы DOM4J
Когда вы работаете с DOM4J, вы часто будете использовать несколько методов:
SAXReader.read (xmlSource) () — Сборка документа DOM4J из источника XML.
Document.getRootElement () — Получить корневой элемент документа XML.
Element.node (index) — получает узел XML по определенному индексу в элементе.
Element.attributes () — Получить все атрибуты элемента.
Node.valueOf (@Name) — Получить значения атрибута с заданным именем элемента.