Учебники

Apache POI Word — Обзор

Часто для создания справочных документов в формате файла Microsoft Word требуется программное приложение. Иногда даже ожидается, что приложение получит файлы Word в качестве входных данных.

Любой Java-программист, который хочет создавать файлы MS-Office в качестве выходных данных, должен использовать для этого предопределенный API только для чтения.

Что такое Apache POI?

Apache POI — это популярный API, который позволяет программистам создавать, изменять и отображать файлы MS-Office с помощью программ на Java. Это библиотека с открытым исходным кодом, разработанная и распространяемая Apache Software Foundation для разработки или изменения файлов MS-Office с использованием программы Java. Он содержит классы и методы для декодирования введенных пользователем данных или файла в документы MS-Office.

Компоненты Apache POI

Apache POI содержит классы и методы для работы со всеми составными документами OLE2 MS-Office. Список компонентов этого API приведен ниже —

  • POIFS (Файловая система реализации плохой обфускации) — этот компонент является основным фактором всех других элементов POI. Он используется для явного чтения разных файлов.

  • HSSF (ужасный формат электронной таблицы) — используется для чтения и записи в формате .xls файлов MS-Excel.

  • XSSF (XML SpreadSheet Format) — используется для формата файлов .xlsx в MS-Excel.

  • HPSF (формат набора ужасных свойств) — используется для извлечения наборов свойств из файлов MS-Office.

  • HWPF (формат ужасного текстового процессора) — используется для чтения и записи файлов расширений .doc MS-Word.

  • XWPF (XML-формат текстового процессора) — используется для чтения и записи файлов расширения .docx MS-Word.

  • HSLF (ужасный формат макета слайда) — используется для чтения, создания и редактирования презентаций PowerPoint.

  • HDGF (формат Horrible DiaGram) — содержит классы и методы для двоичных файлов MS-Visio.

  • HPBF (формат Horrible PuBlisher) — используется для чтения и записи файлов MS-Publisher.

POIFS (Файловая система реализации плохой обфускации) — этот компонент является основным фактором всех других элементов POI. Он используется для явного чтения разных файлов.

HSSF (ужасный формат электронной таблицы) — используется для чтения и записи в формате .xls файлов MS-Excel.

XSSF (XML SpreadSheet Format) — используется для формата файлов .xlsx в MS-Excel.

HPSF (формат набора ужасных свойств) — используется для извлечения наборов свойств из файлов MS-Office.

HWPF (формат ужасного текстового процессора) — используется для чтения и записи файлов расширений .doc MS-Word.

XWPF (XML-формат текстового процессора) — используется для чтения и записи файлов расширения .docx MS-Word.

HSLF (ужасный формат макета слайда) — используется для чтения, создания и редактирования презентаций PowerPoint.

HDGF (формат Horrible DiaGram) — содержит классы и методы для двоичных файлов MS-Visio.

HPBF (формат Horrible PuBlisher) — используется для чтения и записи файлов MS-Publisher.

Этот учебник проведет вас через процесс работы с файлами MS-Word с использованием Java. Поэтому обсуждение ограничивается компонентами HWPF и XWPF.

Примечание. Старые версии двоичных файлов формата поддержки POI, такие как DOC, XLS, PPT, ETC. ВЕРСИЯ 3.5 ​​ВПЕРЕД, POI ПОДДЕРЖИВАЕТ ФОРМАТЫ OOXML-ФАЙЛОВ MS-OFFICE ТАКИМИ КАК DOCX, XLSX, PPTX, ETC.