
আমি আপনাকে পাইথনে একাধিক ভেরিয়েবলের জন্য স্ক্যাটার প্লট তৈরি করার বিষয়ে একটি বিশদ ব্যাখ্যা প্রদান করব। স্ক্যাটার প্লটগুলি একাধিক ডেটা পয়েন্টের মধ্যে সম্পর্কগুলি কল্পনা করার একটি দুর্দান্ত উপায়। তারা আমাদের বুঝতে সাহায্য করে যে কীভাবে ভেরিয়েবলগুলি পারস্পরিক সম্পর্কযুক্ত, কীভাবে সেগুলি বিতরণ করা হয় এবং তাদের বাইরের বিন্দু আছে কিনা।
পাইথনে, একাধিক লাইব্রেরি আমাদেরকে ব্যবহার করার জন্য প্রস্তুত ফাংশন প্রদান করে যাতে একাধিক ভেরিয়েবলের জন্য স্ক্যাটার প্লট তৈরি করা যায়, যেমন Matplotlib এবং Seaborn। একাধিক ডেটা পয়েন্টের মধ্যে সম্পর্ক বোঝানোর আমাদের সমস্যার সমাধান করার সময় আমরা এই দুটি লাইব্রেরিতে ফোকাস করব।
matplotlib এবং seaborn পরিচিতি
ম্যাটপ্লটলিব হল সবচেয়ে জনপ্রিয় পাইথন প্লটিং লাইব্রেরিগুলির মধ্যে একটি যা বিভিন্ন ফর্ম্যাটে গুণমানের পরিসংখ্যান তৈরি করে। এটি আমাদেরকে প্লট, হিস্টোগ্রাম, পাওয়ার স্পেকট্রা, বার চার্ট, ত্রুটি চার্ট, স্ক্যাটার প্লট ইত্যাদি তৈরি করতে দেয়, কোডের মাত্র কয়েকটি লাইন দিয়ে।
অন্যদিকে, Seaborn ম্যাটপ্লটলিবের উপর ভিত্তি করে এবং পান্ডা ডেটা স্ট্রাকচারের সাথে ঘনিষ্ঠভাবে একত্রিত। এটি আকর্ষণীয় এবং তথ্যপূর্ণ পরিসংখ্যানগত গ্রাফিক্স আঁকার জন্য একটি উচ্চ-স্তরের ইন্টারফেস প্রদান করে।
# Required Libraries import matplotlib.pyplot as plt import seaborn as sns
সমাস্যার সমাধান
এই নিবন্ধটির উদ্দেশ্যে, ধরা যাক আপনার কাছে তিনটি ভেরিয়েবল, a, b, এবং c সহ একটি ডেটাসেট রয়েছে। আপনি স্ক্যাটার প্লট তৈরি করতে চান যা এই ভেরিয়েবলের মধ্যে সম্পর্ক দেখাতে পারে।
সমাধানটি সোজা, আমরা স্ক্যাটার প্লট তৈরি করতে সীবোর্নে স্ক্যাটারপ্লট() ফাংশন বা ম্যাটপ্লটলিবে স্ক্যাটার() ফাংশন ব্যবহার করতে পারি। একাধিক ভেরিয়েবলের স্ক্যাটার প্লট তৈরি করতে আমাদের আরও pairplot() ফাংশন ব্যবহার করতে হবে।
ধাপে ধাপে ব্যাখ্যা
# Importing libraries import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # Create a pandas DataFrame df = pd.DataFrame({ 'a': [1, 2, 3, 4, 5], 'b': [5, 4, 3, 2, 1], 'c': [1, 3, 5, 7, 9] }) # Create a pair plot sns.pairplot(df) plt.show()
উপরের কোডে, আমরা প্রথমে প্রয়োজনীয় লাইব্রেরি আমদানি করি। তারপরে আমরা আমাদের ডেটা রাখার জন্য একটি ডেটাফ্রেম তৈরি করি। অবশেষে, স্ক্যাটার প্লট তৈরি করতে আমরা seaborn লাইব্রেরি থেকে pairplot() ফাংশনকে কল করি।
sns.pairplot() ফাংশনটি Axes-এর একটি গ্রিড তৈরি করে যাতে আপনার ডেটার প্রতিটি ভেরিয়েবল একক সারি জুড়ে y-অক্ষে এবং একটি একক কলাম জুড়ে x-অক্ষে ভাগ করে নেয়। সারমর্মে, এটি আমাদের জন্য ভেরিয়েবলের প্রতিটি জোড়ার জন্য স্ক্যাটার প্লট তৈরি করছে।
অতিরিক্ত লাইব্রেরি এবং কার্যাবলী
পান্ডাস আরেকটি লাইব্রেরি যা প্রায়শই Matplotlib এবং Seaborn-এর সাথে হাত মিলিয়ে যায়। এটি একটি ওপেন-সোর্স ডেটা বিশ্লেষণ এবং ম্যানিপুলেশন টুল, যা ডেটা ম্যানিপুলেশন এবং বিশ্লেষণের জন্য পাইথনের মূল লাইব্রেরির উপরে তৈরি করা হয়েছে।
এটি ডেটা স্ট্রাকচার এবং স্ট্রাকচার্ড ডেটা ম্যানিপুলেট করার জন্য প্রয়োজনীয় ফাংশনগুলি প্রদান করে, যার মধ্যে ডেটা পড়া এবং লেখার ফাংশন, হারিয়ে যাওয়া ডেটা পরিচালনা করা, ডেটা ফিল্টার করা এবং ডেটা রিশেপ করা।
# Import library import pandas as pd # Create a DataFrame data = pd.read_csv('filename.csv')
pd.read_csv() ফাংশনটি একটি CSV ফাইল পড়ে এবং এটিকে একটি পান্ডাস ডেটাফ্রেমে রূপান্তর করে, যা পরে বিভিন্ন পান্ডাস ফাংশন ব্যবহার করে ম্যানিপুলেট করা যেতে পারে। এই ডেটাফ্রেমটি scatterplot() ফাংশন বা pairplot() ফাংশন ব্যবহার করে প্লট করা যেতে পারে যেমনটি আগে দেখানো হয়েছে।