জ্যাকার্ড সূচক: সমস্যার সমাধান
সার্জারির জ্যাকার্ড সূচক দুটি সেটের (A এবং B) ছেদগুলির আকারের অনুপাত তাদের মিলনের আকার দ্বারা বিভক্ত হিসাবে গণনা করা যেতে পারে। গাণিতিক ভাষায়, জ্যাকার্ড সূচককে এভাবে প্রকাশ করা যেতে পারে:
জ্যাকার্ড সূচক (A, B) = |A ∩ B| / |A ∪ B|
জ্যাকার্ড সূচক 0 থেকে 1 পর্যন্ত, যেখানে 0 মানে সেটগুলির মধ্যে কোন মিল নেই এবং 1 মানে সেটগুলি অভিন্ন৷ জ্যাকার্ড সূচক গণনা করতে, আমাদের নিম্নলিখিত পদক্ষেপগুলি সম্পাদন করতে হবে:
1. দুটি সেটের (A এবং B) ছেদ গণনা করুন।
2. A এবং B এর মিলন নির্ণয় কর।
3. ছেদটির আকারকে ইউনিয়নের আকার দ্বারা ভাগ করুন।
আসুন দেখি কিভাবে এই ধাপগুলো পাইথনে প্রয়োগ করা যায়।
পাইথনে জ্যাকার্ড সূচক কোডিং
def jaccard_index(set_a, set_b): intersection = set_a.intersection(set_b) union = set_a.union(set_b) return len(intersection) / len(union)
উপরের ফাংশন, jaccard_index(), ইনপুট হিসাবে দুটি সেট নেয় এবং পূর্বে উল্লিখিত পদক্ষেপ অনুসারে তাদের ছেদ এবং মিলন গণনা করে। তারপর, এটি জ্যাকার্ড সূচক গণনা করে ছেদটির আকারকে ইউনিয়নের আকার দ্বারা ভাগ করে। আসুন আরও ভাল বোঝার জন্য কোডটি ভেঙে দেওয়া যাক।
- ফাংশনের সংজ্ঞায়, আমরা আর্গুমেন্ট হিসাবে দুটি সেট পাস করি, set_a এবং set_b।
- আমরা তারপর set_a.intersection(set_b) ব্যবহার করে set_a এবং set_b এর ছেদ গণনা করি এবং এটিকে পরিবর্তনশীল ছেদ-এ সংরক্ষণ করি।
- একইভাবে, ইউনিয়ন সেট_a.union(set_b) ব্যবহার করে গণনা করা হয় এবং পরিবর্তনশীল ইউনিয়নে সংরক্ষণ করা হয়।
- অবশেষে, আমরা ইউনিয়নের আকার দ্বারা ছেদ আকার বিভক্ত ফলাফল ফেরত.
এখানে কিভাবে ব্যবহার করবেন তার একটি উদাহরণ jaccard_index() ফাংশন:
set1 = {1, 2, 3, 4} set2 = {3, 4, 5, 6} result = jaccard_index(set1, set2) print(result) # Output: 0.3333333333333333
জ্যাকার্ড সূচকের জন্য পাইথন লাইব্রেরি এবং ফাংশন
যদিও পাইথনে জ্যাকার্ড সূচক গণনা বাস্তবায়ন করা মোটামুটি সহজ, কিছু লাইব্রেরি জ্যাকার্ডের সাদৃশ্য গণনা করার জন্য অন্তর্নির্মিত ফাংশন প্রদান করে।
এরকম একটি লাইব্রেরি বহুল ব্যবহৃত scikit-শিখতে লাইব্রেরি, যা বিভিন্ন মেশিন লার্নিং অ্যালগরিদম এবং সাদৃশ্য পরিমাপের জন্য ফাংশন প্রদান করে। কাজ jaccard_score() scikit-learn-এর মেট্রিক্স মডিউল থেকে বাইনারি বা মাল্টিলেবেল শ্রেণিবিন্যাসের সমস্যার জন্য জ্যাকার্ড সূচক গণনা করতে ব্যবহার করা যেতে পারে। এখানে একটি উদাহরণ:
from sklearn.metrics import jaccard_score y_true = [0, 1, 1, 1, 0] y_pred = [1, 1, 1, 0, 0] result = jaccard_score(y_true, y_pred) print(result) # Output: 0.5
উপরের উদাহরণে, আমরা জ্যাকার্ড সূচক ব্যবহার করে ভবিষ্যদ্বাণীকৃত লেবেলের (y_pred) সাথে সত্যিকারের লেবেল (y_true) তুলনা করি।
উপসংহারে, এই নিবন্ধটি জ্যাকার্ড সূচকের ধারণা, এর ব্যবহার এবং ধাপে ধাপে পাইথন বাস্তবায়নের সূচনা করেছে। আমরা লাইব্রেরি এবং ফাংশনগুলিও অন্বেষণ করেছি যা জ্যাকার্ড সূচক গণনার জন্য অন্তর্নির্মিত সমর্থন অফার করে। ডেটা নিয়ে কাজ করার সময় জ্যাকার্ড সূচক বোঝা অপরিহার্য হতে পারে এবং এটি প্রাকৃতিক ভাষা প্রক্রিয়াকরণ, ডেটা মাইনিং, সার্চ ইঞ্জিন এবং এমনকি ফ্যাশনের মতো ক্ষেত্রে বিশেষভাবে প্রাসঙ্গিক।