eliminar marcas de agua de PDF C#

En muchos casos, los documentos PDF incluyen marcas de agua que pueden ocultar contenido importante o restarle valor a la presentación. Ya sea que se trate de texto, imágenes o incluso marcas de agua basadas en hipervínculos, puede eliminarlas fácilmente. En esta publicación, lo guiaremos a través de dos escenarios comunes: eliminar marcas de agua generales de un PDF y eliminar específicamente marcas de agua de hipervínculos en C#.

Cómo eliminar marcas de agua de un PDF: instalación de la API de C#

Para eliminar las marcas de agua de un documento PDF, debe instalar la API Conholdate.Total for .NET en su entorno. Descargue el archivo DLL o utilice el siguiente comando de instalación de NuGet:

PM> NuGet\Install-Package Conholdate.Total

Eliminar marca de agua de un PDF en C#

Para eliminar las marcas de agua de un documento PDF, utilizaremos la clase Watermarker. Esta potente herramienta permite buscar y eliminar cualquier marca de agua presente en el documento.

  • Cargar el PDF: Comenzamos cargando el documento PDF con la clase Watermarker.
  • Búsqueda de marcas de agua: el método de búsqueda identifica posibles marcas de agua presentes en el documento.
  • Eliminar la marca de agua: luego, el código elimina la marca de agua especificando su índice (RemoveAt(0)) o pasando directamente el objeto de marca de agua (Remove(possibleWatermarks[0])).
  • Guardar el documento: Finalmente, el documento se guarda sin la marca de agua.

A continuación se muestra el código que demuestra cómo eliminar una marca de agua de un PDF usando C#.

using (Watermarker watermarker = new Watermarker("document.pdf"))
{
    PossibleWatermarkCollection possibleWatermarks = watermarker.Search();

    // Eliminar la posible marca de agua en el índice especificado del documento.
    possibleWatermarks.RemoveAt(0);

    // Eliminar la marca de agua posible especificada del documento.
    possibleWatermarks.Remove(possibleWatermarks[0]);

    watermarker.Save("document.pdf");
}

Este enfoque es flexible y le permite eliminar varios tipos de marcas de agua, como marcas de agua basadas en texto o imágenes, de forma rápida y eficaz.

Cómo eliminar la marca de agua de hipervínculo de un PDF en C#

Algunos documentos PDF contienen marcas de agua de hipervínculos, que consisten en una URL en la que se puede hacer clic. Estas marcas se pueden eliminar seleccionando específicamente los hipervínculos. A continuación, se muestra un ejemplo de cómo se pueden buscar y eliminar marcas de agua de hipervínculos en función de patrones de URL específicos.

  • Búsqueda de hipervínculos: este código primero utiliza un TextSearchCriteria con una expresión regular para encontrar hipervínculos que coincidan con una URL específica (por ejemplo, “someurl.com”).
  • Filtrar hipervínculos: Comprueba si la marca de agua identificada es un hipervínculo (HyperlinkPossibleWatermark).
  • Eliminar hipervínculo: si es un hipervínculo, el código envía su URL a la consola y elimina el hipervínculo del documento.
  • Guardar el documento: el documento PDF actualizado se guarda sin las marcas de agua de hipervínculo.
using (Watermarker watermarker = new Watermarker("document.pdf"))
{
    PossibleWatermarkCollection watermarks = watermarker.Search(new TextSearchCriteria(new Regex(@"someurl\.com")));
   for (int i = watermarks.Count - 1; i >= 0; i--)
    {
        // Asegúrese de que sólo se eliminen los hipervínculos.
        if (watermarks[i] is HyperlinkPossibleWatermark)
        {
            // Mostrar la URL completa del hipervínculo
            Console.WriteLine(watermarks[i].Text);

            // Eliminar hipervínculo del documento
            watermarks.RemoveAt(i);
        }
    }

    watermarker.Save("document.pdf");
}

Este método es especialmente útil si necesita limpiar documentos que contienen URL como marcas de agua, garantizando que solo se eliminen las marcas de agua de hipervínculos especificados.

Licencia de evaluación gratuita

Puede obtener una licencia temporal gratuita para evaluar diferentes funciones sin ninguna limitación.

Terminando

Ya sea que trabaje con texto general o marcas de agua basadas en imágenes o marcas de agua de hipervínculos más específicos, la API ofrece una solución potente y flexible. Puede identificar y eliminar rápidamente las marcas de agua no deseadas, lo que garantiza que sus archivos PDF estén limpios y sean profesionales. El proceso es simple y permite un control preciso sobre el tipo de marca de agua eliminada, ya sea por índice o patrón de URL, lo que le brinda la capacidad de adaptar el documento exactamente a sus necesidades. En caso de cualquier ambigüedad, comuníquese con nosotros en forum.

Ver también