在编辑和审阅过程中,经常会将注释、突出显示和标记等注释添加到 PDF 文档中。但是,在某些情况下,您可能需要在完成文档之前删除这些注释。在这篇博文中,我们将演示如何使用 C# 以编程方式从 PDF 中删除注释。
为什么要从 PDF 中删除注释?
注释在编辑过程中很有用,但在与客户共享或最终发布时,它们会使文档显得杂乱且不专业。删除这些注释可确保 PDF 整洁、精美,可供分发,同时保护敏感的审阅数据不被无意共享。
从 PDF 中删除注释 - C# API 安装
您可以通过在系统中安装 Conholdate.Total for .NET 来从任何 PDF 文档中删除注释。只需通过下载 DLL 文件或运行以下 NuGet 安装命令进行配置即可:
PM> NuGet\Install-Package Conholdate.Total
使用 C# 从 PDF 中删除注释
以下步骤概述了从 PDF 文档中删除注释的算法:
- 加载 PDF 文档:我们启动 Redactor 类从指定路径加载 PDF 文件。
- 应用注释删除:我们使用 DeleteAnnotationRedaction 方法删除包含特定单词(如“use"、“show"或“describe")的注释。该方法使用正则表达式来查找包含这些关键字的注释。
- 保存文档:应用编辑后,我们保存更新后的文档。SaveOptions 允许我们在文件名中添加后缀,并以原始格式保存输出 PDF(不进行栅格化)。
以下代码片段演示了如何使用 C# 从 PDF 中删除注释:
// 加载输入 PDF 文档
using (GroupDocs.Redaction.Redactor redactor = new GroupDocs.Redaction.Redactor("sample.pdf"))
{
// 删除文档中的所有注释,包括
// 正文中包括“使用"、“展示"或“描述"等文字
redactor.Apply(new GroupDocs.Redaction.Redactions.DeleteAnnotationRedaction("(?im:(use|show|describe))"));
// 保存输出 PDF 文件
redactor.Save(new GroupDocs.Redaction.Options.SaveOptions()
{
AddSuffix = true,
RasterizeToPDF = false
});
}
免费评估许可证
您可以请求 免费临时许可证 来测试 API 公开的不同方法,并在处理 PDF 文档中的注释时测试自定义要求。
总结
在准备分发或发布文件时,从 PDF 文档中删除注释是至关重要的一步。您可以按照以下指南轻松自动执行此任务并确保您的 PDF 干净且专业。如有任何疑问,请在 forum 上写信给我们。
常见问题解答
我可以根据内容删除特定注释吗?
是的,您可以使用正则表达式删除包含特定文本或模式的注释。
此方法适用于包含许多注释的大型 PDF 吗?
是的,它可以有效地处理大型 PDF,甚至是带有大量注释的 PDF。
如果我没有指定注释删除模式会发生什么?
如果没有提供模式,您仍然可以从文档中删除所有注释,无论其内容如何。
我可以撤消注释的删除吗?
一旦删除注释并保存文档,该操作将无法撤消,因此建议保留备份。