C# kullanarak PDF Belgelerini sınıflandırma

IAB-2, Belgeler ve Duygu sınıflandırmaları içindeki önceden tanımlanmış etiketleri veya kategorileri kullanarak belgeleri programlı bir şekilde sınıflandırabilirsiniz. Belgelerin sınıflandırılması, ilgili bilgilerin doğru zamanda bulunmasını kolaylaştırır. Ayrıca önemli bilgilerin aranması ve alınması için belgelerin yönetilmesine ve sıralanmasına da yardımcı olur. Bu makalede, C# kullanarak PDF belgelerini nasıl sınıflandıracağınızı öğreneceksiniz.

Bu makalede aşağıdaki konular tartışılmaktadır/kapsanmaktadır:

PDF Sınıflandırması için C# API’si

PDF dosyalarının sınıflandırılması için GroupDocs.Classification for .NET API’sini kullanacağım. Önceden tanımlanmış kategorilerde gelişmiş bir belge ve metin sınıflandırması sunar. API, IAB-2, Belgeler ve Duygu sınıflandırması gibi farklı sınıflandırma türlerini destekler. Metni analiz eder ve en iyi sınıfı içeren sınıflandırma bilgilerini olasılık puanıyla birlikte gösterir. PDF, Word, OpenDocument, RTF ve TXT gibi çeşitli endüstri standardı belge formatlarını sınıflandırabilirsiniz. API ayrıca dilin otomatik algılanmasıyla Duyarlılık analizi sunar ve İngilizce, Çince, İspanyolca ve Almanca dillerini destekler. .NET platformunu hedefleyen herhangi bir geliştirme ortamında uygulamalar geliştirmek için kullanılabilir.

API’nin DLL dosyasını indirebilir veya NuGet kullanarak yükleyebilirsiniz.

Install-Package GroupDocs.Classification

C# kullanarak PDF Belgelerini IAB-2 Taksonomisiyle Sınıflandırma

Aşağıda verilen basit adımları izleyerek PDF belgelerini IAB-2 taksonomisine göre programlı olarak kolayca sınıflandırabilirsiniz:

Aşağıdaki kod örneği, C# kullanarak PDF’nin IAB-2 sınıflandırmasıyla nasıl sınıflandırılacağını gösterir.

// sınıflandırıcı oluştur
var classifier = new Classifier();

// Belgeyi IAB-2 ile sınıflandırın
var response = classifier.Classify("sample.pdf", @"C:\Files\", 3, Taxonomy.Iab2);

// sınıflandırma bilgilerini göster
foreach (var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.Name);
    Console.WriteLine("ClassProbability: " + r.Probability);
    Console.WriteLine("--------------------------------");
}
C# kullanarak PDF Belgelerini IAB-2 Taksonomisiyle Sınıflandırma

C# kullanarak PDF Belgelerini IAB-2 Taksonomisiyle Sınıflandırma

Classifier sınıfı, belgeleri sınıflandırmak için çeşitli yöntemler sağlayan ana sınıftır. Bu sınıfın Classify() yöntemi, belgeleri dosya adına ve dizin adına göre sınıflandırır. bestClassesCount parametresi döndürülecek en iyi eşleşen sınıfların sayısını tanımlar. Yukarıdaki kod örneğinde sınıflandırma için Taxonomy.IAB2 taksonomisini kullandım.

ClassificationResponse sınıfı, alınan sınıflandırma bilgilerini göstermek için özellikler ve yöntemler sağlar.

C# kullanarak Belge Taksonomisi ile PDF Sınıflandırması

Aşağıda verilen kolay adımları izleyerek PDF belgelerini Belgeler sınıflandırmasıyla programlı olarak sınıflandırabilirsiniz:

Aşağıdaki kod örneği, C# kullanarak PDF’nin Belgeler sınıflandırmasıyla nasıl sınıflandırılacağını gösterir.

// sınıflandırıcı oluştur
var classifier = new Classifier();

// Belgeyi Belge sınıflandırmasıyla sınıflandırın
var response = classifier.Classify("sample.pdf", @"C:\Files\", 4, Taxonomy.Documents, PrecisionRecallBalance.Precision);
                
// sınıflandırma bilgilerini göster
foreach (var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.Name);
    Console.WriteLine("ClassProbability: " + r.Probability);
    Console.WriteLine("--------------------------------");
}
C# kullanarak PDF'yi Belge Taksonomisiyle Sınıflandırma

C# kullanarak PDF’yi Belge Taksonomisiyle Sınıflandırma

C# kullanarak Akıştan PDF Belgesi Sınıflandırması

Aşağıda verilen birkaç adımı izleyerek PDF belgelerini dosya akışından programlı olarak sınıflandırabilirsiniz:

  • FileStream örneğindeki bir dosyayı okuyun
  • Classifier sınıfının bir örneğini oluşturun
  • FileStream örneğiyle Classifier.Classify() yöntemini çağırın
  • BestClassesCount ve Taxonomy’yi girdi olarak ayarlayın
  • ClassificationResponse sınıf nesnesindeki sonuçları alın

Aşağıdaki kod örneği, C# kullanarak PDF’nin belge akışından nasıl sınıflandırılacağını gösterir.

using (var fs = File.OpenRead(Path.Combine(@"C:\Files\", "sample.pdf")))
{
    // sınıflandırıcı oluştur
    var classifier = new Classifier();
    
    // belgeyi sınıflandırmak
    var response = classifier.Classify(fs, "sample.pdf", 2, Taxonomy.Documents);
    
    // sınıflandırma bilgilerini göster
    Console.WriteLine($"{"sample.pdf"}: {response.BestClassName}, {response.BestClassProbability}");
}

C# kullanarak Parola Korumalı PDF Dosyalarını Sınıflandırma

Aşağıda verilen basit adımları izleyerek şifre korumalı PDF belgelerini programlı olarak kolayca sınıflandırabilirsiniz:

Aşağıdaki kod örneği, C# kullanılarak parola korumalı PDF dosyasının nasıl sınıflandırılacağını gösterir.

// sınıflandırıcı oluştur
var classifier = new Classifier();

// parola korumalı belgeyi sınıflandır
var response = classifier.Classify("password-protected.pdf", @"C:\Files\", password: "password");

// sınıflandırma bilgilerini göster
Console.WriteLine(response.BestClassName, response.BestClassProbability);

Ücretsiz Lisans Alın

Ücretsiz bir geçici lisans talep ederek API’yi değerlendirme sınırlamaları olmadan deneyebilirsiniz.

Çözüm

Bu makalede, C# kullanarak PDF belgelerini nasıl sınıflandıracağınızı öğrendiniz. Ayrıca belgeleri IAB-2 sınıflandırması ve Belgeler sınıflandırması ile nasıl sınıflandıracağınızı da öğrendiniz. Ayrıca, C#’ta dosya yolu yerine dosya akışını kullanarak belgeleri yüklerken nasıl sınıflandıracağınızı öğrendiniz. Belgeleri kullanarak GroupDocs.Classification for .NET API hakkında daha fazla bilgi edinebilirsiniz. Herhangi bir belirsizlik durumunda lütfen forum üzerinden bizimle iletişime geçmekten çekinmeyin.

Ayrıca bakınız