Entfernen Sie Wasserzeichen aus PDF-Dokumenten mit Java

Das Wasserzeichenbild oder der Text wird verwendet, um den Autor oder die Copyright-Informationen des Dokuments zu identifizieren. Sie können alle verfügbaren Wasserzeichen in einem Dokument erkennen und dann entfernen. Als Java-Entwickler können Sie Wasserzeichen problemlos programmgesteuert aus Dokumenten entfernen. In diesem Artikel erfahren Sie, wie Sie mit Java Wasserzeichen aus PDF-Dokumenten entfernen.

Die folgenden Themen werden in diesem Artikel behandelt/behandelt:

Java-API zum Entfernen von Wasserzeichen

Ich werde die API GroupDocs.Watermark for Java verwenden, um Wasserzeichen aus PDF-Dokumenten zu entfernen. Es ermöglicht die Durchführung von Bild- und Text-Wasserzeichenoperationen. Es ermöglicht Ihnen auch, neue Wasserzeichen anzuwenden, vorhandene Wasserzeichen in Dateien unterstützter Formate wie Word, Excel, Powerpoint und PDF zu suchen und zu löschen.

Sie können die JAR-Datei der API herunterladen oder einfach die folgende pom.xml-Konfiguration zu Ihren Maven-basierten Java-Anwendungen hinzufügen, um die unten aufgeführten Codebeispiele auszuprobieren.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-watermark</artifactId>
        <version>20.5</version> 
</dependency>

Alle Wasserzeichen aus PDF mit Java entfernen

Sie können ganz einfach alle Wasserzeichen aus Ihren PDF-Dokumenten entfernen, indem Sie die folgenden einfachen Schritte ausführen:

  • Erstellen Sie eine Instanz der Klasse Watermarker.
  • Geben Sie den Pfad zur PDF-Eingabedatei an
  • Füllen Sie PossibleWatermarkCollection aus, indem Sie die Methode search() aufrufen
  • Rufen Sie die Methode clear() auf, um alle Wasserzeichen zu entfernen
  • Speichern Sie die aktualisierte Datei

Das folgende Codebeispiel zeigt, wie alle in einem PDF-Dokument verfügbaren Wasserzeichen mit Java entfernt werden.

// Erstellen Sie eine Instanz
Watermarker watermarker = new Watermarker("C:\\Files\\sample.pdf");

// Durchsuchen Sie alle möglichen Wasserzeichen
PossibleWatermarkCollection possibleWatermarks = watermarker.search();

// Entfernen Sie alle gefundenen Wasserzeichen
possibleWatermarks.clear();

// Aktualisierte Datei speichern
watermarker.save("C:\\Files\\output.pdf");

watermarker.close();
Alle Wasserzeichen aus PDF mit Java entfernen

Alle Wasserzeichen aus PDF mit Java entfernen

Die Klasse Watermarker erleichtert das Hinzufügen, Entfernen und Suchen von Wasserzeichen in einem Dokument.

Die Klasse PossibleWatermarkCollection stellt eine Sammlung möglicher Wasserzeichen dar, die in einem Inhalt gefunden werden.

Die Methode search() der Watermarker-Klasse durchsucht alle möglichen Wasserzeichen im Dokument. Es gibt die Ergebnismenge als PossibleWatermarkCollection zurück.

Nur-Text-Wasserzeichen-Entfernung aus PDF mit Java

Sie können ganz einfach alle Nur-Text-Wasserzeichen aus Ihren PDF-Dokumenten entfernen, indem Sie die folgenden einfachen Schritte ausführen:

  • Erstellen Sie eine Instanz der Klasse Watermarker.
  • Geben Sie den Pfad zur PDF-Eingabedatei an
  • Füllen Sie PossibleWatermarkCollection aus, indem Sie die Methode search() aufrufen
  • Überprüfen Sie, ob getText() nicht für alle PossibleWatermarks null oder leer ist
  • Übergeben Sie dann den Index an die Methode removeAt(), um ihn zu entfernen
  • Speichern Sie die aktualisierte Datei

Das folgende Codebeispiel zeigt, wie nur die in einem PDF-Dokument verfügbaren Textwasserzeichen mit Java entfernt werden.

// Erstellen Sie eine Instanz
Watermarker watermarker = new Watermarker("C:\\Files\\sample.pdf");

// Durchsuchen Sie alle möglichen Wasserzeichen
PossibleWatermarkCollection possibleWatermarks = watermarker.search();

// Entfernen Sie alle gefundenen Wasserzeichen
for (int i = possibleWatermarks.getCount() - 1; i >= 0; i--)
{
  if(possibleWatermarks.get_Item(i).getText() != null && possibleWatermarks.get_Item(i).getText() != "")
  {
    possibleWatermarks.removeAt(i);
  }
}

// Aktualisiertes Dokument speichern
watermarker.save("C:\\Files\\output.pdf");

watermarker.close();
Nur-Text-Wasserzeichen-Entfernung aus PDF mit Java

Nur-Text-Wasserzeichen-Entfernung aus PDF mit Java

Die Methode removeAt() entfernt das Element am angegebenen Index aus der PossibleWatermarksCollection.

Entfernen Sie Wasserzeichen mit einer bestimmten Textformatierung

Sie können Textwasserzeichen, die mit einer bestimmten Formatierung verfügbar sind, aus Ihren PDF-Dokumenten entfernen, indem Sie die folgenden einfachen Schritte ausführen:

Das folgende Codebeispiel zeigt, wie die Textwasserzeichen mit bestimmten Textformatierungen aus einem PDF-Dokument mit Java entfernt werden.

// Erstellen Sie eine Instanz
Watermarker watermarker = new Watermarker("C:\\Files\\sample.pdf");

// Definieren Sie Suchkriterien für die Textformatierung
TextFormattingSearchCriteria criteria = new TextFormattingSearchCriteria();
criteria.setFontName("Arial");
criteria.setMinFontSize(19);
criteria.setMaxFontSize(42);
criteria.setFontBold(false);

// Suche nach möglichen Wasserzeichen
PossibleWatermarkCollection watermarks = watermarker.search(criteria);
watermarks.clear();

// Aktualisiertes Dokument speichern
watermarker.save("C:\\Files\\output.pdf");

watermarker.close();
Entfernen Sie Wasserzeichen mit einer bestimmten Textformatierung

Entfernen Sie Wasserzeichen mit einer bestimmten Textformatierung

Nur-Bild-Wasserzeichen-Entfernung aus PDF mit Java

Sie können ganz einfach alle Nur-Bild-Wasserzeichen aus Ihren PDF-Dokumenten entfernen, indem Sie die folgenden einfachen Schritte ausführen:

  • Erstellen Sie eine Instanz der Klasse Watermarker.
  • Geben Sie den Pfad zur PDF-Eingabedatei an
  • Füllen Sie PossibleWatermarkCollection aus, indem Sie die Methode search() aufrufen
  • Überprüfen Sie, ob getImageData() nicht für alle PossibleWatermarks null ist
  • Übergeben Sie dann den Index an die Methode removeAt(), um ihn zu entfernen
  • Speichern Sie die aktualisierte Datei

Das folgende Codebeispiel zeigt, wie nur die in einem PDF-Dokument verfügbaren Bildwasserzeichen mit Java entfernt werden.

// Erstellen Sie eine Instanz
Watermarker watermarker = new Watermarker("C:\\Files\\sample.pdf");

// Durchsuchen Sie alle möglichen Wasserzeichen
PossibleWatermarkCollection possibleWatermarks = watermarker.search();

// Entfernen Sie alle Bildwasserzeichen
for (int i = possibleWatermarks.getCount() - 1; i >= 0; i--)
{
  if(possibleWatermarks.get_Item(i).getImageData() != null)
  {
    possibleWatermarks.removeAt(i);
  }
}

// Aktualisiertes Dokument speichern
watermarker.save("C:\\Files\\output.pdf");

watermarker.close();
Nur-Bild-Wasserzeichen-Entfernung aus PDF mit Java

Nur-Bild-Wasserzeichen-Entfernung aus PDF mit Java

Holen Sie sich eine kostenlose Lizenz

Sie können die API ohne Evaluierungseinschränkungen testen, indem Sie eine kostenlose temporäre Lizenz anfordern.

Fazit

In diesem Artikel haben Sie gelernt, wie Sie mit Java Text- oder Bildwasserzeichen aus einem PDF-Dokument entfernen. Außerdem haben Sie gelernt, wie Sie Nur-Text- oder Nur-Bild-Wasserzeichen aus Dokumenten entfernen. Weitere Informationen zu GroupDocs.Watermark for Java API finden Sie in der Dokumentation. Bei Unklarheiten können Sie uns gerne im Forum kontaktieren.

Siehe auch