Учебники

Apache Xerces — Обзор анализатора DOM

Объектная модель документа является официальной рекомендацией Консорциума World Wide Web (W3C). Он определяет интерфейс, который позволяет программам получать доступ и обновлять стиль, структуру и содержимое документов XML. XML-парсеры, которые поддерживают DOM, реализуют этот интерфейс.

Когда использовать?

Вы должны использовать DOM-парсер, когда —

  • Вам нужно много знать о структуре документа.

  • Вам нужно перемещать части документа (например, вы можете отсортировать определенные элементы).

  • Вам необходимо использовать информацию в документе более одного раза.

Вам нужно много знать о структуре документа.

Вам нужно перемещать части документа (например, вы можете отсортировать определенные элементы).

Вам необходимо использовать информацию в документе более одного раза.

Что вы получаете?

Когда вы анализируете документ XML с помощью анализатора DOM, вы получаете древовидную структуру, которая содержит все элементы вашего документа. DOM предоставляет множество функций, которые вы можете использовать для проверки содержимого и структуры документа.

преимущества

DOM — это общий интерфейс для управления структурами документов. Одна из целей разработки заключается в том, чтобы код Java, написанный для одного DOM-совместимого парсера, работал на любом другом DOM-совместимом парсере без изменений.

DOM интерфейсы

DOM определяет несколько интерфейсов Java. Вот наиболее распространенные интерфейсы —

  • Узел — базовый тип данных DOM.

  • Элемент — Подавляющее большинство объектов, с которыми вы будете иметь дело, являются Элементами.

  • Attr — представляет атрибут элемента.

  • Текст — фактическое содержание элемента или атрибута.

  • Документ — представляет весь документ XML. Объект Document часто называют деревом DOM.

Узел — базовый тип данных DOM.

Элемент — Подавляющее большинство объектов, с которыми вы будете иметь дело, являются Элементами.

Attr — представляет атрибут элемента.

Текст — фактическое содержание элемента или атрибута.

Документ — представляет весь документ XML. Объект Document часто называют деревом DOM.

Общие методы DOM

Когда вы работаете с DOM, есть несколько методов, которые часто используются —

Document.getDocumentElement () — возвращает корневой элемент документа.

Node.getFirstChild () — Возвращает первого потомка данного узла.

Node.getLastChild () — Возвращает последнего потомка данного узла.

Node.getNextSibling () — Эти методы возвращают следующего брата данного узла.

Node.getPreviousSibling () — Эти методы возвращают предыдущего родственного элемента данного узла.

Node.getAttribute (attrName) — для данного узла возвращает атрибут с запрошенным именем.