В этой главе описываются объекты символов XML. Прежде чем мы поймем символьные сущности, давайте сначала разберемся, что такое сущность XML.
В соответствии с консорциумом W3 определение сущности выглядит следующим образом:
«Сущность документа служит корнем дерева сущностей и отправной точкой для процессора XML».
Это означает, что сущности являются заполнителями в XML. Они могут быть объявлены в прологе документа или в DTD. Существуют различные типы сущностей, и в этой главе мы обсудим сущность персонажа.
Оба, HTML и XML, имеют некоторые символы, зарезервированные для их использования, которые нельзя использовать в качестве содержимого в коде XML. Например, знаки < и > используются для открытия и закрытия тегов XML. Для отображения этих специальных символов используются символьные объекты.
Есть несколько специальных символов или символов, которые не могут быть набраны непосредственно с клавиатуры. Символы также могут использоваться для отображения этих символов / специальных символов.
Типы персонажей
Есть три типа персонажей —
- Предопределенные персонажи
- Нумерованные персонажи
- Именованные персонажи
Предопределенные персонажи
Они введены, чтобы избежать неоднозначности при использовании некоторых символов. Например, неоднозначность наблюдается, когда символ угла меньше ( < ) или больше ( > ) используется с тегом угла ( <> ). Символьные объекты в основном используются для разделения тегов в XML. Ниже приведен список предварительно определенных символьных объектов из спецификации XML. Их можно использовать для выражения символов без двусмысленности.
-
Амперсанд — & amp;
-
Одинарная кавычка — & apos;
-
Больше чем — & gt;
-
Менее чем — & lt;
-
Двойная кавычка — & quot;
Амперсанд — & amp;
Одинарная кавычка — & apos;
Больше чем — & gt;
Менее чем — & lt;
Двойная кавычка — & quot;
Числовые символы
Числовая ссылка используется для ссылки на символьную сущность. Числовая ссылка может быть в десятичном или шестнадцатеричном формате. Поскольку доступны тысячи числовых ссылок, их немного сложно запомнить. Цифровая ссылка относится к символу по его номеру в наборе символов Unicode.
Общий синтаксис для десятичной числовой ссылки —
&# decimal number ;
Общий синтаксис шестнадцатеричной числовой ссылки —
&#x Hexadecimal number ;
В следующей таблице перечислены некоторые предопределенные символьные объекты с их числовыми значениями.
Имя сущности | символ | Десятичная ссылка | Шестнадцатеричная ссылка |
---|---|---|---|
Quot | « | & # 34; | & # X22; |
ампер | & | & # 38; | & # X26; |
APOS | ‘ | & # 39; | & # X27; |
л | < | & # 60; | & # X3C; |
GT | > | & # 62; | & # X3e; |
Объект именованного персонажа
Поскольку трудно запомнить числовые символы, наиболее предпочтительным типом символьной сущности является именованная символьная сущность. Здесь каждый объект идентифицируется с именем.
Например —
«Aacute» представляет капитал персонаж с острым акцентом.
«Угроза» представляет маленький с серьезным акцентом.