Учебники

PDFBox — Удаление страниц

Давайте теперь узнаем, как удалить страницы из документа PDF.

Удаление страниц из существующего документа

Вы можете удалить страницу из существующего документа PDF, используя метод removePage () класса PDDocument .

Шаг 1. Загрузка существующего PDF-документа

Загрузите существующий документ PDF, используя статический метод load () класса PDDocument . Этот метод принимает объект файла в качестве параметра, поскольку это статический метод, который можно вызвать, используя имя класса, как показано ниже.

File file = new File("path of the document") 
PDDocument.load(file);

Шаг 2: перечисление количества страниц

Вы можете перечислить количество страниц в PDF-документе, используя метод getNumberOfPages (), как показано ниже.

int noOfPages= document.getNumberOfPages();
System.out.print(noOfPages);

Шаг 3: Удаление страницы

Вы можете удалить страницу из документа PDF с помощью метода removePage () класса PDDocument . Для этого метода вам нужно передать индекс страницы, которая должна быть удалена.

При указании индекса для страниц в документе PDF, имейте в виду, что индексация этих страниц начинается с нуля, т. Е. Если вы хотите удалить первую страницу, тогда значение индекса должно быть 0.

document.removePage(2);

Шаг 4: Сохранение документа

После удаления страницы сохраните документ PDF с помощью метода save () класса PDDocument, как показано в следующем блоке кода.

document.save("Path");

Шаг 5: Закрытие документа

Наконец, закройте документ с помощью метода close () класса PDDocument, как показано ниже.

document.close();

пример

Предположим, у нас есть документ PDF с именем sample.pdf, и он содержит три пустых страницы, как показано ниже.

Удаление страницы перед

Этот пример демонстрирует, как удалить страницы из существующего документа PDF. Здесь мы загрузим указанный выше PDF-документ с именем sample.pdf , удалим из него страницу и сохраним его по пути C: / PdfBox_Examples / . Сохраните этот код в файле с именем Removing_pages.java .

import java.io.File;
import java.io.IOException;

import org.apache.pdfbox.pdmodel.PDDocument;

public class RemovingPages {

   public static void main(String args[]) throws IOException {

      //Loading an existing document
      File file = new File("C:/PdfBox_Examples/sample.pdf");
      PDDocument document = PDDocument. load (file);
       
      //Listing the number of existing pages
      int noOfPages= document.getNumberOfPages();
      System.out.print(noOfPages);
       
      //Removing the pages
      document.removePage(2);
      
      System.out.println("page removed");

      //Saving the document
      document.save("C:/PdfBox_Examples/sample.pdf");

      //Closing the document
      document.close();

   }
}

Скомпилируйте и выполните сохраненный файл Java из командной строки, используя следующие команды.

javac RemovingPages.java 
java RemovingPages 

После выполнения вышеуказанная программа создает документ PDF с пустыми страницами, отображающими следующее сообщение.

3
page removed

Если вы проверите указанный путь, вы обнаружите, что требуемая страница была удалена, и в документе остались только две страницы, как показано ниже.