Trích xuất mã vạch PDF Java

Mã vạch cung cấp một cách nhanh chóng và hiệu quả để mã hóa dữ liệu theo định dạng có thể đọc được bằng máy. Trích xuất mã vạch từ các tệp PDF có thể rất cần thiết cho quá trình xử lý dữ liệu tự động trong các ngành như hậu cần, chăm sóc sức khỏe và bán lẻ. Trong bài đăng trên blog này, chúng ta sẽ khám phá cách trích xuất mã vạch từ các tài liệu PDF bằng Java.

Tại sao phải trích xuất mã vạch từ tệp PDF?

Có nhiều lý do khiến bạn muốn trích xuất mã vạch từ tài liệu PDF, bao gồm:

Thu thập dữ liệu tự động: Trích xuất mã vạch từ nhãn vận chuyển, hóa đơn hoặc phiếu sản phẩm có thể tự động hóa quy trình nhập dữ liệu.

Quản lý tài liệu hiệu quả: Mã vạch nhúng trong PDF có thể chứa siêu dữ liệu như số sê-ri hoặc mã sản phẩm, giúp việc sắp xếp tài liệu hiệu quả hơn.

Tích hợp với Hệ thống Doanh nghiệp: Trích xuất mã vạch có thể cho phép doanh nghiệp tích hợp tài liệu PDF của mình với hệ thống kiểm kê, quản lý tài sản hoặc hậu cần.

Đọc mã vạch trong PDF - Cấu hình API Java

Để đọc mã vạch trong tài liệu PDF, bạn cần cài đặt Conholdate.Total for Java trong môi trường của bạn. Chỉ cần tải xuống tệp JAR hoặc sử dụng cấu hình Maven bên dưới trong tệp pom.xml:

<dependency>
<groupId>com.conholdate</groupId>
<artifactId>conholdate-total</artifactId>
<version>24.6</version>
<type>pom</type>
</dependency>

Trích xuất mã vạch từ tài liệu PDF trong Java

Các bước dưới đây hướng dẫn cách trích xuất mã vạch từ tài liệu PDF bằng Java:

  • Khởi tạo lớp Parser: Chúng tôi tạo một thể hiện của lớp Parser để tải tệp PDF có chứa mã vạch.
  • Kiểm tra hỗ trợ mã vạch: Phương thức getFeatures() được gọi để kiểm tra xem tài liệu PDF có hỗ trợ trích xuất mã vạch hay không. Nếu không, một thông báo sẽ hiển thị và quá trình kết thúc.
  • Trích xuất mã vạch: Nếu tài liệu hỗ trợ trích xuất mã vạch, chúng tôi sử dụng phương thức getBarcodes() để trích xuất thông tin mã vạch từ tài liệu.
  • Lặp lại và in: Chúng tôi lặp lại từng mã vạch được trích xuất và in chỉ mục trang và giá trị mã vạch.

Mã mẫu bên dưới minh họa cách trích xuất mã vạch từ tệp PDF trong Java:

// Tạo một thể hiện của lớp Parser
try(com.groupdocs.parser.Parser parser = new com.groupdocs.parser.Parser("Barcode.pdf"))
{
	// Kiểm tra xem tài liệu có hỗ trợ trích xuất mã vạch không
	if (!parser.getFeatures().isBarcodes()) {
		System.out.println("Document doesn't support barcodes extraction.");
		return;
	}

	// Trích xuất mã vạch từ tài liệu.
	Iterable<com.groupdocs.parser.data.PageBarcodeArea> barcodes = parser.getBarcodes();

	// Lặp lại mã vạch
	for(com.groupdocs.parser.data.PageBarcodeArea barcode : barcodes)
	{
		// In chỉ mục trang
		System.out.println("Page: " + barcode.getPage().getIndex());
		// In giá trị mã vạch
		System.out.println("Value: " + barcode.getValue());
	}
}

Giấy phép đánh giá miễn phí

Bạn có thể yêu cầu giấy phép tạm thời miễn phí để trích xuất tất cả các loại và định dạng mã vạch mà không có bất kỳ hạn chế nào.

Tóm tắt

Trích xuất mã vạch từ tài liệu PDF trong Java là một quá trình đơn giản. Chức năng này có thể cải thiện đáng kể quy trình xử lý tài liệu của bạn bằng cách tự động thu thập dữ liệu và cho phép tích hợp liền mạch với các hệ thống doanh nghiệp. Trong khi hiểu tất cả thông tin được tóm tắt trong bài viết này, bạn có thể dễ dàng trích xuất dữ liệu mã vạch từ bất kỳ tài liệu PDF nào. Trong trường hợp có bất kỳ thắc mắc nào, vui lòng liên hệ với chúng tôi tại diễn đàn.

Câu hỏi thường gặp

Tôi có thể trích xuất nhiều mã vạch từ một tệp PDF không?

Có, đoạn mã được cung cấp có thể trích xuất nhiều mã vạch nếu chúng có trong tệp PDF.

Có cách nào để lưu dữ liệu mã vạch đã trích xuất không?

Có, sau khi trích xuất mã vạch, bạn có thể lưu dữ liệu vào tệp hoặc cơ sở dữ liệu để sử dụng sau này.

Tôi có thể trích xuất mã vạch từ hình ảnh nhúng trong tệp PDF không?

Có, API có thể phát hiện và trích xuất mã vạch từ hình ảnh trong tệp PDF.

Xem thêm