Учебники

Java NIO — CharSet

В Java для каждого символа есть четко определенные единицы кода Unicode, которые внутренне обрабатываются JVM. Поэтому пакет Java NIO определяет абстрактный класс с именем Charset, который в основном используется для кодирования и декодирования charset и UNICODE.

Стандартные кодировки

Поддерживаемые Charset в Java приведены ниже.

  • US-ASCII — Семиразрядные символы ASCII.

  • ISO-8859-1 — ISO Латинский алфавит.

  • UTF-8 — это 8-битный формат преобразования UCS.

  • UTF-16BE — это 16-битный формат преобразования UCS с порядком байтов с прямым порядком байтов.

  • UTF-16LE — это 16-битное преобразование UCS с байтовым порядком байтов.

  • UTF-16 — 16-битный формат преобразования UCS.

US-ASCII — Семиразрядные символы ASCII.

ISO-8859-1 — ISO Латинский алфавит.

UTF-8 — это 8-битный формат преобразования UCS.

UTF-16BE — это 16-битный формат преобразования UCS с порядком байтов с прямым порядком байтов.

UTF-16LE — это 16-битное преобразование UCS с байтовым порядком байтов.

UTF-16 — 16-битный формат преобразования UCS.

Важные методы класса Charset

  • forName () — Этот метод создает объект charset для данного имени charset. Имя может быть каноническим или псевдонимом.

  • displayName () — Этот метод возвращает каноническое имя данной кодировки.

  • canEncode () — Этот метод проверяет, поддерживает ли данный набор символов кодировку или нет.

  • decode () — этот метод декодирует строку заданного набора символов в буферный код набора символов Unicode.

  • encode () — Этот метод кодирует charbuffer кодировки unicode в буфер байтов данной кодировки.

forName () — Этот метод создает объект charset для данного имени charset. Имя может быть каноническим или псевдонимом.

displayName () — Этот метод возвращает каноническое имя данной кодировки.

canEncode () — Этот метод проверяет, поддерживает ли данный набор символов кодировку или нет.

decode () — этот метод декодирует строку заданного набора символов в буферный код набора символов Unicode.

encode () — Этот метод кодирует charbuffer кодировки unicode в буфер байтов данной кодировки.

пример

Следующий пример иллюстрирует важные методы класса Charset.