مدارک PDF را با استفاده از C# طبقه بندی کنید

شما می‌توانید اسناد را با استفاده از برچسب‌ها یا دسته‌بندی‌های از پیش تعریف شده در IAB-2، اسناد و طبقه‌بندی احساسات به‌صورت برنامه‌نویسی طبقه‌بندی کنید. طبقه‌بندی اسناد یافتن اطلاعات مربوطه در زمان مناسب را آسان‌تر می‌کند. همچنین به مدیریت و مرتب‌سازی اسناد برای جستجو و بازیابی اطلاعات مهم کمک می‌کند. در این مقاله، شما یاد خواهید گرفت که چگونه اسناد PDF را با استفاده از C# طبقه‌بندی کنید.

موضوعات زیر در این مقاله مورد بحث قرار گرفته‌اند:

C# API برای طبقه‌بندی PDF

من از API GroupDocs.Classification for .NET برای طبقه‌بندی فایل‌های PDF استفاده خواهم کرد. این API یک طبقه‌بندی پیشرفته اسناد و متن در دسته‌بندی‌های از پیش تعیین شده را ارائه می‌دهد. این API از انواع مختلف طبقه‌بندی‌ها مانند IAB-2، اسناد و طبقه‌بندی احساسات پشتیبانی می‌کند. این ابزار متن را تحلیل کرده و اطلاعات طبقه‌بندی را شامل بهترین کلاس با نمره احتمال آن نمایش می‌دهد. شما می‌توانید انواع فرمت‌های استاندارد اسناد صنعتی مانند PDF، Word، OpenDocument، RTF و TXT را طبقه‌بندی کنید. این API همچنین تحلیل احساسات را با تشخیص خودکار زبان ارائه می‌دهد و از زبان‌های انگلیسی، چینی، اسپانیایی و آلمانی پشتیبانی می‌کند. می‌توان از آن برای توسعه برنامه‌ها در هر محیط توسعه‌ای که هدف آن پلتفرم .NET باشد، استفاده کرد.

شما می‌توانید یا دانلود DLL API را انجام دهید یا آن را با استفاده از NuGet نصب کنید.

Install-Package GroupDocs.Classification

طبقه بندی اسناد PDF با استفاده از طبقه بندی IAB-2 با C#

شما می‌توانید به‌راحتی مستندات PDF را با استفاده از طبقه‌بندی IAB-2 به‌صورت برنامه‌نویسی با دنبال کردن مراحل ساده زیر طبقه‌بندی کنید:

کد نمونه زیر نشان می‌دهد که چگونه می‌توان پی‌دی‌اف را با استفاده از طبقه‌بندی IAB-2 با C# طبقه‌بندی کرد.

// create classifier
var classifier = new Classifier();

// document را با IAB-2 طبقه‌بندی کنید
var response = classifier.Classify("sample.pdf", @"C:\Files\", 3, Taxonomy.Iab2);

// اطلاعات طبقه‌بندی را نمایش بده
foreach (var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.Name);
    Console.WriteLine("ClassProbability: " + r.Probability);
    Console.WriteLine("--------------------------------");
}
کلاس‌بندی اسناد PDF با استفاده از طبقه‌بندی IAB-2 با C#

طبقه‌بندی اسناد PDF با استفاده از طبقه‌بندی IAB-2 با C#

کلاس Classifier کلاس اصلی است که روش‌های مختلفی را برای دسته‌بندی اسناد فراهم می‌کند. روش Classify() این کلاس اسناد را بر اساس نام فایل و نام دایرکتوری دسته‌بندی می‌کند. پارامتر bestClassesCount تعداد بهترین کلاس‌های مطابقت‌یافته برای بازگشت را تعریف می‌کند. در مثال کد بالا، من از رده‌بندی Taxonomy.IAB2 برای دسته‌بندی استفاده کردم.

کلاس ClassificationResponse ویژگی‌ها و متودهایی را ارائه می‌دهد تا اطلاعات طبقه‌بندی بازیابی شده را نمایش دهد.

طبقه بندی PDF با استفاده از طبقه بندی مدارک با C#

شما می‌توانید اسناد PDF را به صورت برنامه‌نویسی با طبقه‌بندی مستندات طبقه‌بندی کنید با دنبال کردن مراحل ساده زیر:

  • یک نمونه از کلاس Classifier ایجاد کنید
  • Call the Classifier.Classify() method with the file path
  • مقدار bestClassesCount، Taxonomy و PrecisionRecallBalance را به عنوان ورودی تنظیم کنید
  • نتایج را در شیء کلاس ClassificationResponse دریافت کنید

کد نمونه زیر نحوه طبقه بندی PDF با استفاده از طبقه بندی اسناد را با C# نشان می دهد.

// create classifier
var classifier = new Classifier();

// سند را با طبقه‌بندی اسناد طبقه‌بندی کنید.
var response = classifier.Classify("sample.pdf", @"C:\Files\", 4, Taxonomy.Documents, PrecisionRecallBalance.Precision);
                
// اطلاعات طبقه‌بندی را نمایش دهید
foreach (var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.Name);
    Console.WriteLine("ClassProbability: " + r.Probability);
    Console.WriteLine("--------------------------------");
}
طبقه بندی PDF با استفاده از C# و رده بندی اسناد

طبقه‌بندی PDF با استفاده از طبقه‌بندی اسناد با C#

طبقه‌بندی سند PDF از جریان با استفاده از C#

شما می‌توانید اسناد PDF را به صورت برنامه‌نویسی از جریان فایل طبقه‌بندی کنید با دنبال کردن مراحل زیر:

  • یک فایل را در نمونه FileStream بخوانید
  • یک نمونه از کلاس Classifier ایجاد کنید
  • متد Classifier.Classify() را با نمونه FileStream فراخوانی کنید
  • Set bestClassesCount and Taxonomy as input
  • نتایج را در شیء کلاس ClassificationResponse دریافت کنید

نمونه کد زیر نشان می‌دهد که چگونه PDF را از جریان سند با استفاده از C# طبقه‌بندی کنیم.

using (var fs = File.OpenRead(Path.Combine(@"C:\Files\", "sample.pdf")))
{
    // create classifier
    var classifier = new Classifier();
    
    // classify document
    var response = classifier.Classify(fs, "sample.pdf", 2, Taxonomy.Documents);
    
    // اطلاعات طبقه‌بندی را نشان بدهید
    Console.WriteLine($"{"sample.pdf"}: {response.BestClassName}, {response.BestClassProbability}");
}

فایل‌های PDF محافظت شده با رمز را با استفاده از C# طبقه‌بندی کنید

شما می‌توانید به راحتی مدارک PDF محافظت شده با کلمه عبور را به صورت برنامه‌نویسی با دنبال کردن مراحل ساده زیر طبقه‌بندی کنید:

  • یک نمونه از کلاس Classifier ایجاد کنید
  • Call the Classifier.Classify() method with the file path
  • مقدار bestClassesCount و Password فایل را به عنوان ورودی تنظیم کنید.
  • نتایج را در شیء کلاس ClassificationResponse دریافت کنید

نمونه کد زیر نشان می‌دهد که چگونه یک فایل PDF دارای رمز عبور را با استفاده از C# طبقه‌بندی کنید.

// create classifier
var classifier = new Classifier();

// مدرک محافظت شده با رمز را طبقه بندی کنید
var response = classifier.Classify("password-protected.pdf", @"C:\Files\", password: "password");

// اطلاعات طبقه بندی را نشان دهید
Console.WriteLine(response.BestClassName, response.BestClassProbability);

یک لایسنز رایگان بگیرید

شما می‌توانید بدون محدودیت‌های ارزیابی API را با درخواست مجوز موقت رایگان امتحان کنید.

نتیجه گیری

در این مقاله، شما یاد گرفته‌اید که چگونه مستندات PDF را با استفاده از C# طبقه‌بندی کنید. همچنین یاد گرفته‌اید که چگونه مستندات را با استفاده از طبقه‌بندی IAB-2 و طبقه‌بندی مستندات طبقه‌بندی کنید. علاوه بر این، شما یاد گرفته‌اید که چگونه مستندات را در حین بارگذاری آن‌ها با استفاده از جریان فایل به جای مسیر فایل در C# طبقه‌بندی کنید. می‌توانید در مورد GroupDocs.Classification برای API .NET بیشتر بیاموزید با استفاده از documentation. در صورت وجود هرگونه ابهام، لطفاً با ما در forum تماس بگیرید.

ببینید همچنین