La modification du contenu PDF par programme peut être essentielle dans les scénarios où des informations sensibles ou obsolètes doivent être remplacées avant distribution. L’une des fonctionnalités les plus pratiques dans la manipulation de PDF est la capacité de rechercher une phrase ou un motif spécifique et de le remplacer par un contenu alternatif. Dans ce guide détaillé, nous allons démontrer comment vous pouvez trouver et remplacer du texte dans des fichiers PDF en utilisant C#. L’accent sera mis sur l’utilisation du puissant Conholdate.Total pour .NET SDK, qui permet aux développeurs d’effectuer des tâches de manipulation de documents robustes, y compris la rédaction et le remplacement en seulement quelques lignes de code.

Nous couvrirons deux scénarios importants. Le premier expliquera comment localiser un mot ou une phrase exacts dans un PDF et le remplacer. Le second expliquera comment utiliser des expressions régulières pour correspondre et substituer des motifs variables tels que des numéros de téléphone, des numéros de compte ou d’autres formats de données personnalisés.

Pourquoi rechercher et remplacer du texte dans des fichiers PDF

  • Assurer la confidentialité et la conformité : Supprimez facilement les données personnelles ou confidentielles avant de publier ou de partager des fichiers PDF.

  • Mettre à jour les documents efficacement : remplacez automatiquement les termes ou contenus obsolètes dans de grands lots de fichiers.

  • Options de recherche de texte flexibles : utilisez à la fois la correspondance exacte de phrases et les expressions régulières pour un redaction complète.

  • Preserve Document Integrity: Maintenez la mise en page et le formatage d’origine tout en remplaçant le contenu.

Trouver et remplacer du texte dans un PDF en utilisant C# - Installation du SDK

Vous devez configurer Conholdate.Total for .NET pour trouver et remplacer du texte dans des documents PDF. Téléchargez le fichier DLL à partir de la section Nouvelles versions ou utilisez la commande d’installation NuGet ci-dessous dans MS Visual Studio :

Install-Package Conholdate.Total

Trouver et remplacer des mots dans un PDF en utilisant C#

Lorsque vous traitez des documents PDF contenant des informations sensibles telles que des noms, des coordonnées ou des identifiants d’organisation, il est souvent nécessaire de supprimer ou de remplacer ces mots avant de partager le fichier. Conholdate.Total pour .NET SDK fournit un moyen simple d’accomplir cela. L’exemple suivant montre comment rechercher une correspondance exacte d’un mot ou d’une phrase et le substituer par un espace réservé ou un texte alternatif.

// Find exact phrase and replace it with some other text using C#
using (Redactor redactor = new Redactor(@"path/document.pdf"))
{
  redactor.Apply(new ExactPhraseRedaction("John Doe", new ReplacementOptions("[censored]")));
  redactor.Save(new SaveOptions() { AddSuffix = true, RasterizeToPDF = false });
}

Dans cet extrait, le SDK scanne le fichier PDF à la recherche de l’expression "John Doe" et remplace chaque instance par le terme "[censored]". Cette opération est particulièrement utile pour automatiser la suppression des informations personnellement identifiables dans les documents. L’option AddSuffix garantit que le fichier original reste inchangé en enregistrant la version modifiée en tant que nouveau fichier, tandis que le drapeau RasterizeToPDF maintient la sortie en tant que PDF basé sur du texte plutôt que de le convertir en image.

Trouver et remplacer du texte dans un PDF avec des expressions régulières en C#

Parfois, le texte qui doit être remplacé dans un PDF ne suit pas un format fixe. Par exemple, des motifs comme les numéros de facture, les codes postaux ou les numéros d’identification peuvent varier d’un document à l’autre. Dans de telles situations, les expressions régulières offrent une solution dynamique. Le Conholdate.Total pour .NET SDK permet aux développeurs de définir des motifs regex pour détecter et remplacer des structures de texte complexes dans un PDF.

// Find text using regular expression and replace it with some other text using C#
using (Redactor redactor = new Redactor(@"path/document.pdf"))
{
  redactor.Apply(new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions("[censored]")));
  redactor.Save(new SaveOptions() { AddSuffix = true, RasterizeToPDF = false });
}

L’expression régulière utilisée dans ce code correspond à un motif couramment utilisé pour les codes formatés, tels que les références bancaires ou les identifiants de transaction. Tout texte correspondant à ce motif est automatiquement localisé et remplacé par une étiquette prédéfinie comme "[censored]". Ce niveau de flexibilité garantit que vous pouvez protéger des informations sensibles même si vous ne connaissez pas son contenu exact à l’avance.

Conclusion

Trouver et remplacer du texte dans des documents PDF en utilisant C# n’a jamais été aussi facile, grâce aux capacités offertes par Conholdate.Total pour .NET. Que vous remplaciez un mot spécifique ou recherchiez des motifs variables avec des expressions régulières, ce SDK garantit que vous pouvez manipuler le contenu de votre PDF avec précision et contrôle. La capacité de masquer des informations sensibles, d’automatiser des mises à jour et de préserver la mise en forme des documents en fait un outil puissant pour les développeurs de divers secteurs. Intégrez-le dans vos projets C# dès aujourd’hui et rationalisez vos flux de traitement de documents en toute confiance.

Voir aussi