Văn bản có định dạng để đánh dấu

Là nhà phát triển C#, bạn thường phải đối mặt với nhu cầu chuyển đổi văn bản có định dạng thành nhiều định dạng khác nhau cho các mục đích khác nhau. Trong bài đăng blog này, chúng ta sẽ khám phá câu chuyện của người dùng về việc trích xuất văn bản có định dạng dưới dạng cú pháp Markdown trong C#, tận dụng thư viện Conholdate.Total mạnh mẽ cho .NET. Cuối cùng, bạn sẽ hiểu rõ ràng về quy trình và sẵn sàng tích hợp liền mạch tính năng này vào các dự án của mình

Câu chuyện người dùng:

Với tư cách là nhà phát triển C# làm việc trên hệ thống quản lý nội dung, tôi muốn trao quyền cho người dùng nhập văn bản đa dạng thức và chuyển đổi nó thành cú pháp Markdown. Điều này sẽ cung cấp cho họ sự linh hoạt và đơn giản của định dạng Markdown. Hãy xem xét các bước liên quan để đạt được mục tiêu này bằng cách sử dụng thư viện Conholdate.Total cho .NET.

Bước 1: Cài đặt Conholdate.Total cho .NET

Để bắt đầu, hãy lấy thư viện Conholdate.Total for .NET. Tải xuống từ trang web chính thức của Conholdate hoặc cài đặt nó bằng trình quản lý gói như NuGet.

Install-Package Conholdate.Total 

Bước 2: Khởi tạo thư viện

Sau khi cài đặt thư viện, hãy khởi tạo nó trong dự án C# của bạn. Định cấu hình các cài đặt và tham chiếu cần thiết để tích hợp liền mạch với cơ sở mã hiện có của bạn.

Bước 3: Tải tài liệu văn bản đa dạng thức

Truy xuất tài liệu văn bản đa dạng thức cần chuyển đổi sang cú pháp Markdown. Tài liệu này có thể được lưu trữ dưới dạng tệp, mục nhập cơ sở dữ liệu hoặc được tạo động trong ứng dụng của bạn. Conholdate.Total for .NET hỗ trợ các định dạng tệp phổ biến chẳng hạn như DOCX, RTF, HTML, v.v., tạo điều kiện tương thích với các nguồn văn bản phong phú đa dạng.

Bước 4: Trích xuất nội dung văn bản đa dạng thức

Sử dụng Conholdate.Total cho .NET để trích xuất nội dung từ tài liệu văn bản đa dạng thức đã tải. Thư viện cung cấp các phương pháp trực quan để truy cập và thao tác các khía cạnh khác nhau của tài liệu, chẳng hạn như đoạn văn, tiêu đề, kiểu, v.v.

Để trích xuất văn bản đa dạng thức từ tài liệu, chỉ cần gọi phương thức GetFormattedText:

TextReader GetFormattedText(FormattedTextOptions options);

Bước 5: Chuyển đổi Rich Text sang Markdown

Tận dụng các khả năng của Conholdate.Total, chuyển đổi nội dung văn bản đa dạng thức được trích xuất sang cú pháp Markdown. Thư viện cung cấp lớp FormattedTextOptions. Hàm tạo của lớp khởi tạo nó với chế độ được chỉ định từ enum FormattedTextMode. Bạn cần đặt FormattedTextMode.Markdown.

FormattedTextOptions(FormattedTextMode.Markdown)

Do đó, đây là các bước đơn giản bạn cần làm theo:

  1. Đầu tiên, khởi tạo đối tượng Parser cho tài liệu ban đầu.
  2. Tiếp theo, khởi tạo đối tượng FormattedTextOptions bằng chế độ văn bản Markdown.
  3. Sau đó, gọi phương thức GetFormattedText và lấy đối tượng TextReader.
  4. Cuối cùng, kiểm tra xem trình đọc có rỗng hay không và đọc văn bản từ trình đọc.

Mã nguồn sẽ trông như thế này:

// Create an instance of Parser class
using (Parser parser = new Parser("sample.docx"))
{
    // Extract a formatted text into the reader
    using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown)))
    {
        // Print a formatted text from the document
        // If formatted text extraction isn't supported, a reader is null
        Console.WriteLine(reader == null ? "Formatted text extraction isn't supported" : reader.ReadToEnd());
    }
}

Bước 6: Trình bày mức giảm giá đã chuyển đổi

Sau khi văn bản đa dạng thức được chuyển đổi thành công sang Markdown, hãy hiển thị kết quả đầu ra cho người dùng. Điều này có thể liên quan đến việc cung cấp bản xem trước, lưu nội dung đã chuyển đổi vào tệp hoặc tích hợp nội dung đó vào trình chỉnh sửa Markdown. Sau đó, người dùng có thể tinh chỉnh và nâng cao hơn nữa nội dung của mình bằng các tính năng Markdown quen thuộc.

Đầu vào:

Giả sử file đầu vào có nội dung như hình sau:

Văn bản có định dạng để đánh dấu

Đầu ra:

Đầu ra sẽ là:

**Rich Text**

Lorem ipsum **dolor sit amet**, consectetuer adipiscing elit. Maecenas porttitor congue massa. *Fusce posuere*, magna sed pulvinar ultricies, *purus lectus malesuada libero*, sit amet commodo magna eros quis urna.

1. Nunc viverra imperdiet enim. Fusce est. Vivamus a tellus.
2. Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas.
3.  Proin pharetra nonummy pede. Mauris et orci.

Aenean nec lorem

* In porttitor. Donec laoreet nonummy augue.
* Suspendisse dui purus, scelerisque at, vulputate vitae, pretium mattis, nunc.
* Mauris eget neque at sem venenatis eleifend. Ut nonummy.

Tổng hợp

Chúc mừng! Bạn đã hoàn thành thành công câu chuyện của người dùng về trích xuất văn bản có định dạng dưới dạng cú pháp Markdown trong C# bằng cách sử dụng thư viện Conholdate.Total mạnh mẽ cho .NET. Bằng cách khai thác các khả năng của thư viện, bạn có thể dễ dàng chuyển đổi các tài liệu văn bản đa dạng thức sang định dạng Markdown, mở ra các khả năng mới về thao tác và định dạng nội dung. Chúc mừng mã hóa!

Conholdate.Total cho tài nguyên .NET:

Vui lòng tham khảo các tài nguyên sau để khám phá thêm về thư viện:

Nhận giấy phép miễn phí:

Bạn có thể tải xuống giấy phép tạm thời miễn phí để kiểm tra thư viện mà không bị giới hạn đánh giá.

Đặt một câu hỏi:

Bạn có thể đăng câu hỏi hoặc nhận xét của mình về thư viện trong diễn đàn này.

Xem thêm: