Java'daki PDF'den Tablo Çıkarma

Java’daki PDF’den Tablo Çıkarma

Yakın geçmişte, Java’daki bir PDF Dosyasından programlı olarak nasıl metin çıkarılacağıyla ilgili bir makale yayınladık. Bu blog yazısında, PDF için bu Java’yı API kullanarak Java’da PDF’den tablo çıkarmayı öğreneceğiz. Bu kitaplık, PDF belgelerini ayrıştırmak ve değiştirmek için güçlü özellikler sağlar. Ayrıca bu kütüphaneyi kullanarak bir PDF tablo çıkarıcı oluşturarak veri çıkarmayı otomatikleştirebilirsiniz. Ancak devam etmeden önce lütfen Java’yı yerel makinenize yüklediğinizden emin olun.

Bu kılavuzda aşağıdaki hususlar ele alınacaktır:

PDF tablo çıkarıcı - API kurulumu

Bu kütüphanenin kurulum süreci düz ve basittir. Aslında, API’yi indirebilir veya aşağıdaki Maven yapılandırmalarını kullanarak yükleyebilirsiniz.

 <repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-pdf</artifactId>
    <classifier>jdk17</classifier>
</dependency>

Java’daki PDF’den Tablo Çıkarma

API yüklendikten sonra program aracılığıyla bir PDF tablo çıkarıcı oluşturmak için kod yazmaya başlayabilirsiniz.

Aşağıda belirtilen adımları ve kod parçasını takip edebilirsiniz:

  1. Document sınıfının bir nesnesini oluşturun ve kaynak PDF dosyasını yükleyin.
  2. Bir arama gerçekleştiren ve arama sonuçlarına erişim sağlayan TableAbsorber sınıfının bir örneğini oluşturun.
  3. getPages yöntemini çağırarak PDF belgesi sayfalarında döngü yapın.
  4. Tabloyu sayfadan çıkarmak için visit yöntemini çağırın.
  5. Bulunan tabloları içeren salt okunur IList’i döndüren getTableList yöntemini çağırın.
  6. Satır listesini yineleyerek getRowList yöntemini çağırarak satırları alın.
  7. getCellList yöntemini çağırarak hücre listesini yineleyin.
  8. Hücrede bulunan metni tanımlayan TextFragment nesnelerinin bir koleksiyonunu elde etmek için getTextFragments yöntemini çağırın.
  9. Geçerli TextFragment için metin bölümlerini alan getSegments yöntemini çağırın.
  10. Sonuçları yazdırın.

Aşağıdaki kodu kopyalayıp ana dosyanıza yapıştırın:

String filePath = "table.pdf";
// Document sınıfının bir nesnesini oluşturun ve kaynak PDF dosyasını yükleyin 
Document pdfDocument = new Document(filePath);
// Aramayı gerçekleştiren ve arama sonuçlarına erişim sağlayan TableAbsorber sınıfının bir örneğini oluşturun  
TableAbsorber absorber = new TableAbsorber();
// GetPages yöntemini çağırarak PDF belgesi sayfaları arasında dolaşın 
for (Page page : pdfDocument.getPages()) {
    // Sayfadan tablo çıkarmak için ziyaret yöntemini çağırın 
        absorber.visit(page);
        // Bulunan tabloları içeren salt okunur IList'i döndüren getTableList yöntemini çağırın 
       for (AbsorbedTable table : absorber.getTableList()) {
                System.out.println("Table");
                // getRowList yöntemini çağırarak satırları alın Satır listesi boyunca yineleyin  
               for (AbsorbedRow row : table.getRowList()) {
                        // getCellList yöntemini çağırarak hücre listesi boyunca yineleme yapın 
                       for (AbsorbedCell cell : row.getCellList()) {
                            // Hücrede bulunan metni tanımlayan TextFragment nesnelerinin koleksiyonunu almak için getTextFragments yöntemini çağırın 
                               for (TextFragment fragment : cell.getTextFragments()) {
                                        StringBuilder sb = new StringBuilder();
                                        // Geçerli TextFragment için metin segmentlerini alan getSegments yöntemini çağırın. 
                                       for (TextSegment seg : fragment.getSegments())
                                                sb.append(seg.getText());
                                        System.out.print(sb.toString() + "|");
                                }
                        }
                        System.out.println();
                }
        }
}

Ücretsiz Lisans Alın

API’yi değerlendirme sınırlamaları olmadan denemek için ücretsiz geçici lisans’tan yararlanabilirsiniz.

Özetliyor

Bu bizi bu blog yazısının sonuna getiriyor. Java’da PDF’den tabloyu programlı olarak nasıl çıkaracağınızı öğrendiniz. İş uygulamanız için bir PDF tablo çıkarıcı oluşturmak istiyorsanız bu kılavuz size gerçekten yardımcı olacaktır. Ayrıca diğer özellikleri öğrenmek için belgeleri ziyaret edebilirsiniz.

Ayrıca Başlangıç kılavuzumuzu takip etmenizi öneririz.

Son olarak, conholdate.com yeni blog yazıları yazıyor. Bu nedenle, en son güncellemeler için lütfen iletişim halinde kalın.

Bir soru sor

Sorularınızı veya sorularınızı forumumuz üzerinden bize bildirebilirsiniz.

SSS

Tabloları PDF’den çıkarabilir miyim?

Tabloyu bir PDF belgesinden programlı olarak çıkaran adımları ve kod pasajını öğrenmek için lütfen burayı bağlantı ziyaret edin.

Ayrıca bakınız