Klasifikasi Dokumen PDF menggunakan C#

Anda dapat mengklasifikasikan dokumen menggunakan tag atau kategori yang telah ditentukan sebelumnya dalam taksonomi IAB-2, Dokumen, dan Sentimen secara terprogram. Klasifikasi dokumen memudahkan untuk menemukan informasi yang relevan pada waktu yang tepat. Ini juga membantu mengelola dan menyortir dokumen untuk mencari dan mengambil informasi yang penting. Pada artikel ini, Anda akan mempelajari cara mengklasifikasikan dokumen PDF menggunakan C#. Topik-topik berikut dibahas/dibahas dalam artikel ini:

C# API untuk Klasifikasi PDF

Saya akan menggunakan GroupDocs.Classification for .NET API untuk klasifikasi file PDF. Ini menawarkan klasifikasi dokumen dan teks tingkat lanjut dalam kategori yang telah ditentukan. API mendukung berbagai jenis taksonomi seperti taksonomi IAB-2, Dokumen, dan Sentimen. Ini menganalisis teks dan menampilkan informasi klasifikasi termasuk kelas terbaik dengan skor probabilitasnya. Anda dapat mengklasifikasikan berbagai format dokumen standar industri seperti PDF, Word, OpenDocument, RTF, dan TXT. API juga menawarkan analisis Sentimen dengan deteksi otomatis bahasa dan mendukung bahasa Inggris, China, Spanyol, dan Jerman. Ini dapat digunakan untuk mengembangkan aplikasi di lingkungan pengembangan apa pun yang menargetkan platform .NET. Anda dapat mengunduh DLL API atau menginstalnya menggunakan NuGet.

Install-Package GroupDocs.Classification

Klasifikasi Dokumen PDF dengan Taksonomi IAB-2 menggunakan C#

Anda dapat dengan mudah mengklasifikasikan dokumen PDF dengan taksonomi IAB-2 secara terprogram dengan mengikuti langkah-langkah sederhana yang diberikan di bawah ini:

  • Buat instance dari kelas Classifier
  • Panggil metode Classifier.Classify() dengan jalur file
  • Tetapkan bestClassesCount dan Taxonomy sebagai masukan
  • Dapatkan hasil di objek kelas ClassificationResponse Contoh kode berikut menunjukkan cara mengklasifikasikan PDF dengan taksonomi IAB-2 menggunakan C#.
    Klasifikasi Dokumen PDF dengan Taksonomi IAB-2 menggunakan C#

    Klasifikasi Dokumen PDF dengan Taksonomi IAB-2 menggunakan C#

Kelas Classifier adalah kelas utama yang menyediakan berbagai metode untuk mengklasifikasikan dokumen. Metode Classify() dari kelas ini mengklasifikasikan dokumen berdasarkan nama file dan nama direktori. Parameter bestClassesCount menentukan jumlah kelas yang paling cocok untuk dikembalikan. Pada contoh kode di atas, saya menggunakan taksonomi Taxonomy.IAB2 untuk klasifikasi. Kelas ClassificationResponse menyediakan properti dan metode untuk menampilkan informasi klasifikasi yang diambil.

Klasifikasi PDF dengan Taksonomi Dokumen menggunakan C#

Anda dapat mengklasifikasikan dokumen PDF dengan taksonomi Dokumen secara terprogram dengan mengikuti langkah-langkah mudah yang diberikan di bawah ini:

  • Buat instance dari kelas Classifier
  • Panggil metode Classifier.Classify() dengan jalur file
  • Tetapkan BestClassesCount, Taksonomi, dan PrecisionRecallBalance sebagai masukan
  • Dapatkan hasil di objek kelas ClassificationResponse Contoh kode berikut menunjukkan cara mengklasifikasikan PDF dengan taksonomi Dokumen menggunakan C#.
    Klasifikasikan PDF dengan Taksonomi Dokumen menggunakan C#

    Klasifikasikan PDF dengan Taksonomi Dokumen menggunakan C#

Klasifikasi Dokumen PDF dari Stream menggunakan C#

Anda dapat mengklasifikasikan dokumen PDF dari aliran file secara terprogram dengan mengikuti beberapa langkah di bawah ini:

  • Baca file dalam contoh FileStream
  • Buat instance dari kelas Classifier
  • Panggil metode Classifier.Classify() dengan instance FileStream
  • Tetapkan bestClassesCount dan Taxonomy sebagai masukan
  • Dapatkan hasil di objek kelas ClassificationResponse Contoh kode berikut menunjukkan cara mengklasifikasikan PDF dari aliran dokumen menggunakan C#.

Klasifikasi File PDF yang Dilindungi Kata Sandi menggunakan C#

Anda dapat dengan mudah mengklasifikasikan dokumen PDF yang dilindungi kata sandi secara terprogram dengan mengikuti langkah-langkah sederhana yang diberikan di bawah ini:

  • Buat instance dari kelas Classifier
  • Panggil metode Classifier.Classify() dengan jalur file
  • Tetapkan bestClassesCount dan Password file sebagai input
  • Dapatkan hasil di objek kelas ClassificationResponse Contoh kode berikut menunjukkan cara mengklasifikasikan file PDF yang dilindungi kata sandi menggunakan C#.

Dapatkan Lisensi Gratis

Anda dapat mencoba API tanpa batasan evaluasi dengan meminta lisensi sementara gratis.

Kesimpulan

Pada artikel ini, Anda telah mempelajari cara mengklasifikasikan dokumen PDF menggunakan C#. Anda juga telah mempelajari cara mengklasifikasikan dokumen dengan taksonomi IAB-2 dan taksonomi Dokumen. Selain itu, Anda telah mempelajari cara mengklasifikasikan dokumen saat memuatnya menggunakan aliran file alih-alih jalur file di C#. Anda dapat mempelajari lebih lanjut tentang GroupDocs.Classification untuk .NET API menggunakan dokumentasi. Jika ada ambiguitas, jangan ragu untuk menghubungi kami di forum.

Lihat juga