
Преобразование PDF в текст в Java
Форматы файлов PDF и MS Word являются наиболее популярными и полезными форматами файлов на текущий момент времени. PDF-документы нелегко редактировать, и иногда для их редактирования требуется сторонний инструмент. Принимая во внимание, что файлы Word предлагают многое в этом отношении. Однако во многих сценариях вам необходимо выполнить преобразование PDF в Word. В этом сообщении блога мы будем использовать эту библиотеку .NET PDF для программного преобразования PDF в Word с помощью C#. Мы напишем фрагменты кода, чтобы подробно продемонстрировать эту функциональность.
Мы рассмотрим следующие моменты:
- Установка библиотеки .NET PDF
- Преобразование PDF в Word с помощью C#
- Преобразование PDF в Word — дополнительные параметры
Установка библиотеки .NET PDF
Эта библиотека C# PDF поможет вам программно создать конвертер PDF в Word. Тем не менее, вы можете найти множество мощных функций, предоставляемых этой библиотекой. Таким образом, вы можете либо скачать API, либо установить его с помощью Диспетчера пакетов NuGet в своем проекте.
Преобразование PDF в Word с помощью C#
Вы можете преобразовать файлы PDF в документы Word, написав пару строк в приложении .NET.
Вы можете выполнить следующие шаги и фрагмент кода:
- Инициализируйте объект класса Document и загрузите исходный файл PDF.
- Сохраните файл в формате DOC, вызвав метод Сохранить.
// Инициализировать объект класса Document и загрузить исходный PDF-файл.
Document pdfDocument = new Document( "sample.pdf");
// Сохраните файл в формате DOC, вызвав метод Save.
pdfDocument.Save( "PDFToDOC_out.doc", SaveFormat.Doc);
Вы можете увидеть результат на изображении ниже:

Преобразование PDF в Word — дополнительные параметры
В этом разделе мы рассмотрим некоторые расширенные методы, предлагаемые этой библиотекой C# PDF.
Пожалуйста, следуйте инструкциям и фрагменту кода ниже:
- Откройте исходный PDF-документ, инициализировав экземпляр класса Document.
- Создайте экземпляр класса DocSaveOptions, чтобы получить доступ к параметрам сохранения для экспорта в формат Doc.
- Установите значение этого свойства Format, чтобы сохранить выходной файл в формате Doc.
- Установите режим распознавания «Поток», установив свойство Mode.
- Присвойте значение свойству RelativeHorizontalProximity, чтобы установить близость по горизонтали на 2,5.
- Включите значение для распознавания маркеров в процессе преобразования, задав значение свойства RecognizeBullets.
- Вызовите метод Сохранить, чтобы сохранить файл в формате документа MS.
/ Open the source PDF document by initializing an instance of Document class
Document pdfDocument = new Document( "sample.pdf");
// Создайте экземпляр класса DocSaveOptions, чтобы получить доступ к параметрам сохранения для экспорта в формат Doc.
DocSaveOptions saveOptions = new DocSaveOptions
{
// Установите значение этого свойства Format, чтобы сохранить выходной файл в формате Doc.
Format = DocSaveOptions.DocFormat.Doc,
// Установите режим распознавания как Flow, установив свойство Mode
Mode = DocSaveOptions.RecognitionMode.Flow,
// Присвойте значение свойству RelativeHorizontalProximity. Задайте для горизонтальной близости значение 2,5.
RelativeHorizontalProximity = 2.5f,
// Включите значение для распознавания маркеров в процессе преобразования, установив значение свойства RecognizeBullets.
RecognizeBullets = true
};
// Вызовите метод Save, чтобы сохранить файл в формате документа MS.
pdfDocument.Save( "PDFToDOC_out.doc", saveOptions);
Получить бесплатную лицензию
Вы можете получить бесплатную временную лицензию, чтобы опробовать API без ограничений пробной версии.
Подведение итогов
Мы можем закончить этот пост в блоге, надеясь, что он позволил вам программно преобразовать PDF в Word с помощью C#. Эта библиотека .NET PDF, несомненно, поможет вам создать конвертер PDF в Word для вашего бизнес-приложения. Кроме того, вы можете посетить документацию этой библиотеки, чтобы узнать о других функциях. Установите эту библиотеку в свой проект .NET и программно выполните преобразование PDF в Word. Наконец, оставайтесь на связи с conholdate.com для получения регулярных обновлений.
Задайте вопрос
Вы можете сообщить нам о своих вопросах или запросах на нашем форуме.
Часто задаваемые вопросы
Как конвертировать PDF в Word в сети С#?
Установите эту библиотеку C# PDF для программного преобразования PDF в Word. Вы можете посетить документацию для получения сведений об установке и функциях.
Как вы можете преобразовать PDF в документ Word?
Вы можете создать экземпляр класса Document для загрузки исходного PDF-файла и вызвать метод Save для его сохранения в виде файла Word.