Учебники

XML — Персонажи

В этой главе описываются объекты символов XML. Прежде чем мы поймем символьные сущности, давайте сначала разберемся, что такое сущность XML.

В соответствии с консорциумом W3 определение сущности выглядит следующим образом:

«Сущность документа служит корнем дерева сущностей и отправной точкой для процессора XML».

Это означает, что сущности являются заполнителями в XML. Они могут быть объявлены в прологе документа или в DTD. Существуют различные типы сущностей, и в этой главе мы обсудим сущность персонажа.

Оба, HTML и XML, имеют некоторые символы, зарезервированные для их использования, которые нельзя использовать в качестве содержимого в коде XML. Например, знаки < и > используются для открытия и закрытия тегов XML. Для отображения этих специальных символов используются символьные объекты.

Есть несколько специальных символов или символов, которые не могут быть набраны непосредственно с клавиатуры. Символы также могут использоваться для отображения этих символов / специальных символов.

Типы персонажей

Есть три типа персонажей —

  • Предопределенные персонажи
  • Нумерованные персонажи
  • Именованные персонажи

Предопределенные персонажи

Они введены, чтобы избежать неоднозначности при использовании некоторых символов. Например, неоднозначность наблюдается, когда символ угла меньше ( < ) или больше ( > ) используется с тегом угла ( <> ). Символьные объекты в основном используются для разделения тегов в XML. Ниже приведен список предварительно определенных символьных объектов из спецификации XML. Их можно использовать для выражения символов без двусмысленности.

  • Амперсанд — & amp;

  • Одинарная кавычка — & apos;

  • Больше чем — & gt;

  • Менее чем — & lt;

  • Двойная кавычка — & quot;

Амперсанд — & amp;

Одинарная кавычка — & apos;

Больше чем — & gt;

Менее чем — & lt;

Двойная кавычка — & quot;

Числовые символы

Числовая ссылка используется для ссылки на символьную сущность. Числовая ссылка может быть в десятичном или шестнадцатеричном формате. Поскольку доступны тысячи числовых ссылок, их немного сложно запомнить. Цифровая ссылка относится к символу по его номеру в наборе символов Unicode.

Общий синтаксис для десятичной числовой ссылки —

&# decimal number ;

Общий синтаксис шестнадцатеричной числовой ссылки —

&#x Hexadecimal number ;

В следующей таблице перечислены некоторые предопределенные символьные объекты с их числовыми значениями.

Имя сущности символ Десятичная ссылка Шестнадцатеричная ссылка
Quot « & # 34; & # X22;
ампер & & # 38; & # X26;
APOS & # 39; & # X27;
л < & # 60; & # X3C;
GT > & # 62; & # X3e;

Объект именованного персонажа

Поскольку трудно запомнить числовые символы, наиболее предпочтительным типом символьной сущности является именованная символьная сущность. Здесь каждый объект идентифицируется с именем.

Например —

«Aacute» представляет капитал персонаж с острым акцентом.

«Угроза» представляет маленький с серьезным акцентом.