
شما میتوانید اسناد را با استفاده از برچسبها یا دستهبندیهای از پیش تعریف شده در IAB-2، اسناد و طبقهبندی احساسات بهصورت برنامهنویسی طبقهبندی کنید. طبقهبندی اسناد یافتن اطلاعات مربوطه در زمان مناسب را آسانتر میکند. همچنین به مدیریت و مرتبسازی اسناد برای جستجو و بازیابی اطلاعات مهم کمک میکند. در این مقاله، شما یاد خواهید گرفت که چگونه اسناد PDF را با استفاده از C# طبقهبندی کنید.
موضوعات زیر در این مقاله مورد بحث قرار گرفتهاند:
- C# API برای طبقهبندی PDF
- PDF ها را با استفاده از طبقه بندی IAB-2 در C# طبقه بندی کنید
- طبقهبندی PDF با استفاده از طبقهبندی اسناد با C#
- طبقهبندی مستندات PDF از جریان با استفاده از C#
- طبقه بندی فایل های PDF با رمزگذاری شده با C#
C# API برای طبقهبندی PDF
من از API GroupDocs.Classification for .NET برای طبقهبندی فایلهای PDF استفاده خواهم کرد. این API یک طبقهبندی پیشرفته اسناد و متن در دستهبندیهای از پیش تعیین شده را ارائه میدهد. این API از انواع مختلف طبقهبندیها مانند IAB-2، اسناد و طبقهبندی احساسات پشتیبانی میکند. این ابزار متن را تحلیل کرده و اطلاعات طبقهبندی را شامل بهترین کلاس با نمره احتمال آن نمایش میدهد. شما میتوانید انواع فرمتهای استاندارد اسناد صنعتی مانند PDF، Word، OpenDocument، RTF و TXT را طبقهبندی کنید. این API همچنین تحلیل احساسات را با تشخیص خودکار زبان ارائه میدهد و از زبانهای انگلیسی، چینی، اسپانیایی و آلمانی پشتیبانی میکند. میتوان از آن برای توسعه برنامهها در هر محیط توسعهای که هدف آن پلتفرم .NET باشد، استفاده کرد.
شما میتوانید یا دانلود DLL API را انجام دهید یا آن را با استفاده از NuGet نصب کنید.
Install-Package GroupDocs.Classification
طبقه بندی اسناد PDF با استفاده از طبقه بندی IAB-2 با C#
شما میتوانید بهراحتی مستندات PDF را با استفاده از طبقهبندی IAB-2 بهصورت برنامهنویسی با دنبال کردن مراحل ساده زیر طبقهبندی کنید:
- یک نمونه از کلاس Classifier ایجاد کنید
- Call the Classifier.Classify() method with the file path
- Set the bestClassesCount و Taxonomy as input
- نتایج را در شیء کلاس ClassificationResponse دریافت کنید
کد نمونه زیر نشان میدهد که چگونه میتوان پیدیاف را با استفاده از طبقهبندی IAB-2 با C# طبقهبندی کرد.
// create classifier
var classifier = new Classifier();
// document را با IAB-2 طبقهبندی کنید
var response = classifier.Classify("sample.pdf", @"C:\Files\", 3, Taxonomy.Iab2);
// اطلاعات طبقهبندی را نمایش بده
foreach (var r in response.BestResults)
{
Console.WriteLine("ClassName: " + r.Name);
Console.WriteLine("ClassProbability: " + r.Probability);
Console.WriteLine("--------------------------------");
}

طبقهبندی اسناد PDF با استفاده از طبقهبندی IAB-2 با C#
کلاس Classifier کلاس اصلی است که روشهای مختلفی را برای دستهبندی اسناد فراهم میکند. روش Classify() این کلاس اسناد را بر اساس نام فایل و نام دایرکتوری دستهبندی میکند. پارامتر bestClassesCount تعداد بهترین کلاسهای مطابقتیافته برای بازگشت را تعریف میکند. در مثال کد بالا، من از ردهبندی Taxonomy.IAB2 برای دستهبندی استفاده کردم.
کلاس ClassificationResponse ویژگیها و متودهایی را ارائه میدهد تا اطلاعات طبقهبندی بازیابی شده را نمایش دهد.
طبقه بندی PDF با استفاده از طبقه بندی مدارک با C#
شما میتوانید اسناد PDF را به صورت برنامهنویسی با طبقهبندی مستندات طبقهبندی کنید با دنبال کردن مراحل ساده زیر:
- یک نمونه از کلاس Classifier ایجاد کنید
- Call the Classifier.Classify() method with the file path
- مقدار bestClassesCount، Taxonomy و PrecisionRecallBalance را به عنوان ورودی تنظیم کنید
- نتایج را در شیء کلاس ClassificationResponse دریافت کنید
کد نمونه زیر نحوه طبقه بندی PDF با استفاده از طبقه بندی اسناد را با C# نشان می دهد.
// create classifier
var classifier = new Classifier();
// سند را با طبقهبندی اسناد طبقهبندی کنید.
var response = classifier.Classify("sample.pdf", @"C:\Files\", 4, Taxonomy.Documents, PrecisionRecallBalance.Precision);
// اطلاعات طبقهبندی را نمایش دهید
foreach (var r in response.BestResults)
{
Console.WriteLine("ClassName: " + r.Name);
Console.WriteLine("ClassProbability: " + r.Probability);
Console.WriteLine("--------------------------------");
}

طبقهبندی PDF با استفاده از طبقهبندی اسناد با C#
طبقهبندی سند PDF از جریان با استفاده از C#
شما میتوانید اسناد PDF را به صورت برنامهنویسی از جریان فایل طبقهبندی کنید با دنبال کردن مراحل زیر:
- یک فایل را در نمونه FileStream بخوانید
- یک نمونه از کلاس Classifier ایجاد کنید
- متد Classifier.Classify() را با نمونه FileStream فراخوانی کنید
- Set bestClassesCount and Taxonomy as input
- نتایج را در شیء کلاس ClassificationResponse دریافت کنید
نمونه کد زیر نشان میدهد که چگونه PDF را از جریان سند با استفاده از C# طبقهبندی کنیم.
using (var fs = File.OpenRead(Path.Combine(@"C:\Files\", "sample.pdf")))
{
// create classifier
var classifier = new Classifier();
// classify document
var response = classifier.Classify(fs, "sample.pdf", 2, Taxonomy.Documents);
// اطلاعات طبقهبندی را نشان بدهید
Console.WriteLine($"{"sample.pdf"}: {response.BestClassName}, {response.BestClassProbability}");
}
فایلهای PDF محافظت شده با رمز را با استفاده از C# طبقهبندی کنید
شما میتوانید به راحتی مدارک PDF محافظت شده با کلمه عبور را به صورت برنامهنویسی با دنبال کردن مراحل ساده زیر طبقهبندی کنید:
- یک نمونه از کلاس Classifier ایجاد کنید
- Call the Classifier.Classify() method with the file path
- مقدار bestClassesCount و Password فایل را به عنوان ورودی تنظیم کنید.
- نتایج را در شیء کلاس ClassificationResponse دریافت کنید
نمونه کد زیر نشان میدهد که چگونه یک فایل PDF دارای رمز عبور را با استفاده از C# طبقهبندی کنید.
// create classifier
var classifier = new Classifier();
// مدرک محافظت شده با رمز را طبقه بندی کنید
var response = classifier.Classify("password-protected.pdf", @"C:\Files\", password: "password");
// اطلاعات طبقه بندی را نشان دهید
Console.WriteLine(response.BestClassName, response.BestClassProbability);
یک لایسنز رایگان بگیرید
شما میتوانید بدون محدودیتهای ارزیابی API را با درخواست مجوز موقت رایگان امتحان کنید.
نتیجه گیری
در این مقاله، شما یاد گرفتهاید که چگونه مستندات PDF را با استفاده از C# طبقهبندی کنید. همچنین یاد گرفتهاید که چگونه مستندات را با استفاده از طبقهبندی IAB-2 و طبقهبندی مستندات طبقهبندی کنید. علاوه بر این، شما یاد گرفتهاید که چگونه مستندات را در حین بارگذاری آنها با استفاده از جریان فایل به جای مسیر فایل در C# طبقهبندی کنید. میتوانید در مورد GroupDocs.Classification برای API .NET بیشتر بیاموزید با استفاده از documentation. در صورت وجود هرگونه ابهام، لطفاً با ما در forum تماس بگیرید.