Часто для создания справочных документов в формате файла Microsoft Word требуется программное приложение. Иногда даже ожидается, что приложение получит файлы Word в качестве входных данных.
Любой Java-программист, который хочет создавать файлы MS-Office в качестве выходных данных, должен использовать для этого предопределенный API только для чтения.
Что такое Apache POI?
Apache POI — это популярный API, который позволяет программистам создавать, изменять и отображать файлы MS-Office с помощью программ на Java. Это библиотека с открытым исходным кодом, разработанная и распространяемая Apache Software Foundation для разработки или изменения файлов MS-Office с использованием программы Java. Он содержит классы и методы для декодирования введенных пользователем данных или файла в документы MS-Office.
Компоненты Apache POI
Apache POI содержит классы и методы для работы со всеми составными документами OLE2 MS-Office. Список компонентов этого API приведен ниже —
-
POIFS (Файловая система реализации плохой обфускации) — этот компонент является основным фактором всех других элементов POI. Он используется для явного чтения разных файлов.
-
HSSF (ужасный формат электронной таблицы) — используется для чтения и записи в формате .xls файлов MS-Excel.
-
XSSF (XML SpreadSheet Format) — используется для формата файлов .xlsx в MS-Excel.
-
HPSF (формат набора ужасных свойств) — используется для извлечения наборов свойств из файлов MS-Office.
-
HWPF (формат ужасного текстового процессора) — используется для чтения и записи файлов расширений .doc MS-Word.
-
XWPF (XML-формат текстового процессора) — используется для чтения и записи файлов расширения .docx MS-Word.
-
HSLF (ужасный формат макета слайда) — используется для чтения, создания и редактирования презентаций PowerPoint.
-
HDGF (формат Horrible DiaGram) — содержит классы и методы для двоичных файлов MS-Visio.
-
HPBF (формат Horrible PuBlisher) — используется для чтения и записи файлов MS-Publisher.
POIFS (Файловая система реализации плохой обфускации) — этот компонент является основным фактором всех других элементов POI. Он используется для явного чтения разных файлов.
HSSF (ужасный формат электронной таблицы) — используется для чтения и записи в формате .xls файлов MS-Excel.
XSSF (XML SpreadSheet Format) — используется для формата файлов .xlsx в MS-Excel.
HPSF (формат набора ужасных свойств) — используется для извлечения наборов свойств из файлов MS-Office.
HWPF (формат ужасного текстового процессора) — используется для чтения и записи файлов расширений .doc MS-Word.
XWPF (XML-формат текстового процессора) — используется для чтения и записи файлов расширения .docx MS-Word.
HSLF (ужасный формат макета слайда) — используется для чтения, создания и редактирования презентаций PowerPoint.
HDGF (формат Horrible DiaGram) — содержит классы и методы для двоичных файлов MS-Visio.
HPBF (формат Horrible PuBlisher) — используется для чтения и записи файлов MS-Publisher.
Этот учебник проведет вас через процесс работы с файлами MS-Word с использованием Java. Поэтому обсуждение ограничивается компонентами HWPF и XWPF.
Примечание. Старые версии двоичных файлов формата поддержки POI, такие как DOC, XLS, PPT, ETC. ВЕРСИЯ 3.5 ВПЕРЕД, POI ПОДДЕРЖИВАЕТ ФОРМАТЫ OOXML-ФАЙЛОВ MS-OFFICE ТАКИМИ КАК DOCX, XLSX, PPTX, ETC.