
Konwertuj plik PDF na tekst w Javie
Formaty plików PDF i MS Word to obecnie najpopularniejsze i najbardziej przydatne formaty plików. Dokumenty PDF nie są łatwe do edycji i czasami do ich edycji potrzebne jest narzędzie innej firmy. Natomiast pliki Word oferują pod tym względem bardzo wiele. Jednak w wielu scenariuszach konieczne jest wykonanie konwersji pliku PDF na Word DOCX. W tym poście na blogu użyjemy [biblioteki] pliku PDF .NET 3 do konwersji pliku PDF na program Word przy użyciu programowego języka C#. Napiszemy fragmenty kodu, aby szczegółowo zademonstrować tę funkcjonalność.
Omówimy następujące punkty:
- Konwerter plików .NET PDF na DOCX — instalacja biblioteki
- Konwertuj plik PDF na Word DOCX za pomocą C#
- Konwersja plików PDF do Word DOCX w języku C# — opcje zaawansowane
Konwerter plików .NET PDF na DOCX — instalacja biblioteki
Ta biblioteka PDF w języku C# może pomóc w programowym tworzeniu konwertera plików PDF na Word. Można jednak znaleźć wiele zaawansowanych funkcji udostępnianych przez tę bibliotekę. Możesz więc pobrać interfejs API lub zainstalować go przy użyciu Menedżera pakietów NuGet w swoim projekcie.
Konwertuj plik PDF na Word DOCX za pomocą C#
Możesz konwertować pliki PDF na dokumenty programu Word, pisząc kilka wierszy w aplikacji .NET.
Możesz wykonać następujące kroki i fragment kodu:
- Zainicjuj obiekt klasy Document i załaduj źródłowy plik PDF.
- Zapisz plik w formacie DOC, wywołując metodę Save.
Poniższy fragment kodu pokazuje, jak przekonwertować plik PDF na dokument Word DOCX w języku C#:
// Zainicjuj obiekt klasy Document i załaduj źródłowy plik PDF
Document pdfDocument = new Document( "sample.pdf");
// Zapisz plik w formacie DOC, wywołując metodę Save
pdfDocument.Save( "PDFToDOC_out.doc", SaveFormat.Doc);
Wynik możesz zobaczyć na obrazku poniżej:

Konwersja plików PDF do Word DOCX w języku C# — opcje zaawansowane
W tej sekcji omówimy niektóre zaawansowane metody oferowane przez tę bibliotekę PDF w języku C#.
Postępuj zgodnie z instrukcjami i fragmentem kodu poniżej:
- Otwórz źródłowy dokument PDF, inicjując instancję klasy Document.
- Utwórz instancję klasy DocSaveOptions, aby uzyskać dostęp do opcji zapisywania w celu eksportu do formatu Doc.
- Ustaw wartość tej właściwości Format, aby zapisać plik wyjściowy w formacie Doc.
- Ustaw tryb rozpoznawania na Flow, ustawiając właściwość Mode.
- Przypisz wartość do właściwości RelativeHorizontalProximity, aby ustawić bliskość poziomą na 2,5.
- Włącz wartość rozpoznawania punktorów podczas procesu konwersji, ustawiając wartość właściwości RecognizeBullets.
- Wywołaj metodę Save, aby zapisać plik w formacie dokumentu MS
Poniższy przykładowy kod demonstruje, jak przekonwertować plik PDF na Word w języku C#:
/ Open the source PDF document by initializing an instance of Document class
Document pdfDocument = new Document( "sample.pdf");
// Utwórz instancję klasy DocSaveOptions, aby uzyskać dostęp do opcji zapisywania eksportu do formatu Doc
DocSaveOptions saveOptions = new DocSaveOptions
{
// Ustaw wartość tej właściwości Format, aby zapisać plik wyjściowy w formacie Doc.
Format = DocSaveOptions.DocFormat.Doc,
// Ustaw tryb rozpoznawania jako Przepływ, ustawiając właściwość Mode
Mode = DocSaveOptions.RecognitionMode.Flow,
// Przypisz wartość do właściwości RelativeHorizontalProximity Ustaw bliskość poziomą na 2,5
RelativeHorizontalProximity = 2.5f,
// Włącz wartość rozpoznawania punktorów podczas procesu konwersji, ustawiając wartość właściwości RecognizeBullets
RecognizeBullets = true
};
// Wywołaj metodę Save, aby zapisać plik w formacie dokumentu MS
pdfDocument.Save( "PDFToDOC_out.doc", saveOptions);
Zdobądź bezpłatną licencję
Możesz uzyskać bezpłatną licencję tymczasową, aby wypróbować interfejs API bez ograniczeń ewaluacyjnych.
Podsumowując
W tym miejscu możemy zakończyć ten wpis z nadzieją, że umożliwił on konwersję plików PDF do programu Word przy użyciu programowego języka C#. Ta biblioteka .NET PDF z pewnością pomoże Ci zbudować konwerter PDF na Word DOCX dla Twojej aplikacji biznesowej. Ponadto możesz odwiedzić dokumentację tej biblioteki, aby poznać inne funkcje. Zainstaluj tę bibliotekę w swoim projekcie .NET i programowo wykonaj konwersję plików PDF do Word. Wreszcie, pozostań w kontakcie z conholdate.com, aby otrzymywać regularne aktualizacje.
Zadać pytanie
Możesz dać nam znać o swoich pytaniach lub wątpliwościach na naszym forum.
Często zadawane pytania
Jak przekonwertować plik PDF na Word w sieci C#?
Zainstaluj tę [bibliotekę] PDF w języku C#, aby programowo przekonwertować plik PDF na Word. Możesz odwiedzić [dokumentację] dotyczącą jej instalacji i funkcji.
Jak przekonwertować plik PDF na dokument Word w C#?
Możesz utworzyć instancję klasy Document, aby załadować źródłowy plik PDF i wywołać metodę Save, aby zapisać go jako plik Word.