Create a PDF document using Python

Định dạng tệp PDF thường được sử dụng để trình bày và trao đổi tài liệu. Ngoài ra, nó còn mang lại nhiều lợi ích, chẳng hạn như giảm MB và hiển thị văn bản, hình ảnh, bảng, chú thích, dấu trang và siêu liên kết mà không làm mất bố cục và định dạng. Các nhà phát triển Python có thể xem xét những lợi thế này và tìm cách xuất bản dữ liệu của họ dưới dạng PDF. Nếu bạn là một trong những nhà phát triển đó, bài viết này sẽ giúp bạn tìm hiểu cách tạo tài liệu PDF bằng Python.

Các điểm sau đây sẽ được đề cập trong bài viết này:

Cài đặt gói Python PDF Creator

Để tạo tài liệu PDF theo chương trình, chúng tôi sẽ sử dụng gói Python PDF Creator, cho phép các nhà phát triển tạo, đọc, chuyển đổi và thao tác với các tệp PDF mà không cần sử dụng Adobe Acrobat.

Vui lòng tải xuống hoặc cài đặt gói từ PyPI bằng lệnh pip bên dưới:

pip install aspose-pdf

Cách dễ dàng tạo tài liệu PDF bằng Python

Đầu tiên, chúng tôi sẽ giải thích cách tạo tài liệu PDF chứa một đoạn văn bản. Sau đây là các bước để tạo một tài liệu PDF đơn giản từ đầu.

  1. Tạo một thể hiện của lớp Document.
  2. Thêm Trang mới vào bộ sưu tập trang của tài liệu.
  3. Tạo và thêm TextFragment mới vào các đoạn văn của PDF.
  4. Tạo tệp PDF bằng phương thức Document.Save().

Đoạn mã sau đây trình bày cách tạo tài liệu PDF bằng Python.

# Khởi tạo đối tượng tài liệu
document = aspose.pdf.Document()
# Thêm trang
page = document.pages.add()
# Khởi tạo đối tượng đoạn văn bản
text= "Lorem ipsum dolor sit amet, consectetur adipiscing elit, " \
      "sed do eiusmod tempor incididunt ut labore et dolore magna aliqua." \
      " Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris" \
      " nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in " \
      "reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur." \
      " Excepteur sint occaecat cupidatat non proident, sunt in culpa qui " \
      "officia deserunt mollit anim id est laborum."
text_fragment = aspose.pdf.text.TextFragment (text)
# Thêm đoạn văn bản vào trang mới
page.paragraphs.add(text_fragment)
# Lưu bản PDF đã cập nhật
document.save("output.pdf")

Bạn sẽ thấy đầu ra như sau.

Tạo tài liệu PDF bằng Python

Áp dụng Định dạng văn bản trong tệp PDF bằng Python

Sau khi tạo tài liệu, hãy tìm hiểu cách áp dụng định dạng văn bản trong tệp PDF bằng thư viện Python PDF. Vui lòng làm theo các bước được đưa ra dưới đây.

  • Đầu tiên, tạo một tài liệu PDF mới bằng lớp Tài liệu.
  • Thứ hai, chọn trang nơi bạn muốn đặt văn bản.
  • Sau đó, tạo các đối tượng của TextFragment và đặt văn bản của chúng cũng như các tùy chọn định dạng khác như vị trí, phông chữ, màu sắc, kích thước, v.v.
  • Sau đó, thêm các đoạn văn bản vào trang bằng phương thức Page.paragraphs.add().
  • Cuối cùng, gọi phương thức Document.Save() để tạo tài liệu PDF.

Đoạn mã sau đây cho thấy cách áp dụng định dạng văn bản trong tệp PDF theo chương trình bằng Python.

# Khởi tạo đối tượng tài liệu
document = aspose.pdf.Document()
# Thêm trang
page = document.pages.add()
# Tạo đoạn văn bản
text1= "Text1: Lorem ipsum dolor sit amet, consectetur adipiscing elit, " \
      "sed do eiusmod tempor incididunt ut labore et dolore magna aliqua." \
      " Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris" \
      " nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor"
text2= "Text2: Lorem ipsum dolor sit amet, consectetur adipiscing elit, " \
      "sed do eiusmod tempor incididunt ut labore et dolore magna aliqua."
text_fragment1 = aspose.pdf.text.TextFragment (text1)
text_fragment1.position= aspose.pdf.text.Position(100, 700)
text_fragment2 = aspose.pdf.text.TextFragment (text2)
text_fragment2.position= aspose.pdf.text.Position(100, 600)

# Đặt thuộc tính văn bản
text_fragment1.text_state.font_size = 12;
text_fragment1.text_state.font = aspose.pdf.text.FontRepository.find_font("TimesNewRoman");
text_fragment1.text_state.background_color=aspose.pdf.Color().aqua

text_fragment2.text_state.underline = True
text_fragment2.text_state.strike_out = True

# Thêm đoạn văn bản vào trang
page.paragraphs.add(text_fragment1)
page.paragraphs.add(text_fragment2)
# Lưu bản PDF đã cập nhật
document.save("output.pdf")

Bạn sẽ thấy bản PDF đầu ra như sau.

Áp dụng định dạng văn bản trong PDF bằng Python

Python: Chèn hình ảnh vào tệp PDF

Chúng ta đã học cách thay đổi định dạng văn bản ở phần trước. Do đó, trong phần này, chúng tôi sẽ giải thích cách thêm hình ảnh vào tài liệu PDF. Thực hiện theo các bước dưới đây để thực hiện công việc.

  1. Đầu tiên, tạo một tài liệu PDF mới bằng lớp Tài liệu.
  2. Thứ hai, lấy trang mong muốn nơi bạn muốn chèn hình ảnh.
  3. Thứ ba, thêm hình ảnh vào trang bằng cách sử dụng Page.addimage(filepath, Rectangle), trong khi lớp Rectangle được sử dụng để đặt hình ảnh trên trang.
  4. Cuối cùng, tạo tài liệu PDF bằng phương thức Document.Save().

Mẫu mã sau đây cho biết cách thêm hình ảnh vào PDF bằng Python.

# Khởi tạo đối tượng tài liệu
document = aspose.pdf.Document()
# Thêm trang
page = document.pages.add()
# Đặt tọa độ hình ảnh
lowerLeftX = 400;
lowerLeftY = 400;
upperRightX = 150;
upperRightY = 150;

rectangle= aspose.pdf.Rectangle(lowerLeftX,lowerLeftY,upperRightX,upperRightY,True)
# Thêm hình ảnh vào trang
page.add_image("aspose-logo.jpg", rectangle)

# Lưu bản PDF đã cập nhật
document.save("output.pdf")

Bạn sẽ thấy bản PDF đầu ra như sau.

Chèn hình ảnh vào tệp PDF bằng Python

Thêm bảng trong PDF bằng Python

Sau khi chèn hình ảnh, hãy thêm bảng vào tệp PDF của bạn. Vui lòng viết mã bằng các bước được đưa ra dưới đây:

  1. Tạo một đối tượng của lớp Document để tạo một tệp PDF mới.
  2. Lấy trang mà bạn muốn tạo bảng.
  3. Tạo một thể hiện của lớp Bảng.
  4. Chỉ định đường viền của bảng và ô bằng lớp BorderInfo.
  5. Tạo và thêm Hàng mới vào bộ sưu tập Table.Rows.
  6. Thêm ô vào bộ sưu tập Row.Cells.
  7. Thêm bảng vào trang bằng phương thức Page.paragraphs.add().
  8. Lưu tài liệu PDF bằng phương thức Document.Save().

Mẫu mã sau đây cho biết cách thêm bảng vào tệp PDF bằng Python.

# Khởi tạo đối tượng tài liệu
document = aspose.pdf.Document()
# Thêm trang
page = document.pages.add()
# Tạo bảng
table = aspose.pdf.Table()
# Xác định đường viền bảng và ô
table.border=aspose.pdf.BorderInfo(aspose.pdf.BorderSide.ALL,2,aspose.pdf.Color().dark_gray)
table.default_cell_border= aspose.pdf.BorderInfo(aspose.pdf.BorderSide.ALL,2,aspose.pdf.Color().black)
# Thêm hàng trong bảng
for i in range(1, 11):
    row = table.rows.add()
    # Thêm ô bảng
    row.cells.add("Column (" + str(i) + ", 1)");
    row.cells.add("Column (" + str(i) + ", 2)");
    row.cells.add("Column (" + str(i) + ", 3)");

# Thêm bảng vào trang
page.paragraphs.add(table);

# Lưu bản PDF đã cập nhật
document.save("D:\\AsposeSampleResults\\output.pdf")

Bạn sẽ thấy bản PDF đầu ra như sau.

Thêm bảng vào PDF bằng Python

Nhận giấy phép miễn phí

Bạn có thể nhận giấy phép tạm thời miễn phí để dùng thử API mà không bị giới hạn về đánh giá.

Tổng hợp

Trong bài viết này, chúng tôi đã giải thích quy trình tạo tệp PDF bằng Python. Tương tự, chúng tôi đã mô tả cách thêm hình ảnh, bảng và định dạng văn bản trong tài liệu PDF.

Bạn có thể truy cập tài liệu để tìm hiểu thêm về thư viện trình tạo PDF Python.

Vui lòng theo dõi tại conholdate.com để biết thông tin cập nhật thường xuyên.

Đặt một câu hỏi

Bạn có thể cho chúng tôi biết câu hỏi hoặc thắc mắc của bạn trên diễn đàn của chúng tôi.

Xem thêm