
Dalam dunia data tidak terstruktur dan input pengguna yang tidak konsisten saat ini, pencocokan yang tepat dalam operasi pencarian sering kali tidak memadai. Apakah Anda sedang mengerjakan sistem manajemen dokumen, alat analisis konten, atau mesin pencari perusahaan, menerapkan pencarian fuzzy memungkinkan Anda untuk mendapatkan hasil yang relevan bahkan ketika kueri pencarian memiliki kesalahan ketik, variasi ejaan, atau perbedaan kecil. Dalam posting blog ini, kami akan menjelaskan bagaimana cara menerapkan pencarian fuzzy di C# menggunakan Conholdate.Total untuk .NET SDK. Anda akan belajar bagaimana cara mencari di berbagai file yang disimpan di berbagai folder menggunakan tingkat kesamaan yang dapat disesuaikan untuk akurasi dan fleksibilitas yang lebih besar.
Mengapa Menggunakan Pencarian Fuzzy?
Fuzzy search adalah fitur penting untuk aplikasi modern mana pun yang menangani konten yang dihasilkan pengguna atau bekerja dengan sumber teks yang beragam. Tidak seperti pencarian yang tepat, yang hanya mengembalikan hasil yang cocok dengan kueri secara tepat, fuzzy search mengambil dokumen yang cukup dekat dengan kueri pencarian berdasarkan tingkat kesamaan yang ditentukan. Pendekatan ini secara signifikan meningkatkan pengalaman pengguna dengan mempertimbangkan kesalahan ketik, inkonsistensi ejaan, atau variasi linguistik yang sedikit.
Sebagai contoh, dalam skenario di mana pengguna mencari kata "reciept" alih-alih "receipt," pencarian yang tepat akan gagal, sementara pencarian yang fuzzy masih akan menghasilkan hasil yang relevan. Ini sangat berguna di bidang seperti pengambilan dokumen hukum, penelitian akademik, dan penambangan data perusahaan, di mana ketepatan dan fleksibilitas keduanya sangat penting.
Fuzzy Search - Konfigurasi .NET
Anda perlu menginstal Conholdate.Total for .NET dengan perintah instalasi NuGet berikut:
Install-Package Conholdate.Total
Pencarian Fuzzy di Beberapa File dan Folder dalam C#
Anda dapat melakukan pencarian fuzzy di seluruh kumpulan dokumen yang disimpan di berbagai folder. Anda dapat dengan mudah mengonfigurasi tingkat kesamaan dan mendefinisikan struktur untuk pengindeksan dan pencarian.
// Creating an index folder and add document's folder to it
Index index = new Index("indexing-folder-path");
index.Add("path/parent-folder");
SearchOptions options = new SearchOptions();
options.FuzzySearch.Enabled = true; // Enabling the fuzzy search
options.FuzzySearch.FuzzyAlgorithm = new SimilarityLevel(0.7);
string query = "nulla"; // search approximate matches of the provided query
SearchResult result = index.Search(query, options);
Dalam cuplikan kode ini:
Sebuah indeks baru dibuat yang mengarah ke direktori yang digunakan untuk pengindeksan.
Sebuah folder induk yang berisi semua dokumen ditambahkan ke indeks ini.
Fuzzy search diaktifkan melalui kelas SearchOptions.
The SimilarityLevel is set to 0.7, which corresponds to a 70% match or 30% error tolerance.
Kueri pencarian "nulla" diteruskan, dan sistem mengambil hasil yang memenuhi ambang kesamaan.
Anda dapat menyesuaikan tingkat kesamaan tergantung pada seberapa ketat atau longgar Anda menginginkan hasil pencarian Anda. Ambang yang lebih rendah memungkinkan lebih banyak fleksibilitas, sementara ambang yang lebih tinggi memastikan pencocokan yang lebih ketat.
Manfaat Tingkat Kesamaan yang Dapat Disesuaikan
Salah satu fitur unggulan dari Conholdate.Total untuk .NET SDK adalah kemampuan untuk mengontrol ambang kesamaan untuk pencarian fuzzy. Tingkat kustomisasi ini memberikan kontrol yang tepat atas proses pencocokan, memastikan bahwa hasilnya relevan dan dapat diandalkan.
Higher Similarity (e.g., 0.9): Gunakan ketika presisi sangat penting, dan Anda menginginkan hasil yang sangat mendekati kueri asli.
Lower Similarity (e.g., 0.6): Cocok untuk pencarian eksploratif atau ketika pengguna mungkin memasukkan data dengan kesalahan yang sering.
Kemampuan untuk mengubah nilai ini secara pemrograman memberikan fleksibilitas bagi pengembang untuk beradaptasi dengan berbagai kasus penggunaan bisnis tanpa perlu melakukan reindeks atau mengonfigurasi ulang seluruh sistem.
Lisensi Evaluasi Gratis
Anda dapat memperoleh lisensi sementara gratis untuk menghindari batasan percobaan dari SDK dan dapat mengujinya hingga kapasitas penuh.
Kesimpulan
Pencarian fuzzy adalah fitur penting untuk aplikasi yang perlu menawarkan kemampuan pencarian yang cerdas, toleran, dan ramah pengguna. Dengan menggunakan Conholdate.Total untuk .NET SDK, pengembang dapat mengintegrasikan fungsionalitas pencarian fuzzy yang kuat ke dalam aplikasi C# mereka dengan sedikit usaha. Apakah Anda sedang mencari di ribuan dokumen hukum atau menyaring melalui konten yang dihasilkan pengguna, SDK ini menyediakan alat untuk menanganinya dengan presisi dan fleksibilitas. Sesuaikan tingkat kesamaan, cari di folder, dan ambil hasil yang paling relevan, bahkan ketika inputnya tidak sempurna.