
পান্ডাস একটি ব্যাপক জনপ্রিয় পাইথন লাইব্রেরি যা ডেটা বিশ্লেষণ এবং ম্যানিপুলেশন ক্ষেত্রে ব্যবহৃত হয়। আজকাল, বিশ্লেষণ করা এবং বিপুল পরিমাণ ডেটা নিয়ে কাজ করা আগের চেয়ে অনেক বেশি গুরুত্বপূর্ণ, এবং এই উদ্দেশ্যে প্রয়োজনীয় সরঞ্জামগুলি সরবরাহ করতে পান্ডাস একটি অপরিহার্য ভূমিকা পালন করে। ডেটা বিশ্লেষণের সময় প্রায়শই সম্পাদিত উল্লেখযোগ্য কাজগুলির মধ্যে একটি হল নির্দিষ্ট তথ্য অনুসন্ধান করার এবং নির্দিষ্ট শর্তের উপর ভিত্তি করে একটি কলাম ফেরত দেওয়ার ক্ষমতা। এই নিবন্ধে, আমরা কোড, ফাংশন, এবং প্রয়োজনীয় লাইব্রেরিগুলির একটি বিশদ ব্যাখ্যা সহ শক্তিশালী পান্ডাস লাইব্রেরি ব্যবহার করে কীভাবে এই জাতীয় ফলাফলগুলি পেতে হয় তা নিয়ে আলোচনা করব।
পূর্বশর্ত: পান্ডা ইনস্টল করা
সমাধানে ডুব দেওয়ার আগে, আপনার সিস্টেমে অবশ্যই পান্ডাস ইনস্টল থাকতে হবে। যদি আপনার কাছে ইতিমধ্যেই পান্ডাস ইনস্টল না থাকে, আপনি পাইথনের প্যাকেজ ম্যানেজার, পিপের মাধ্যমে এটি ইনস্টল করতে নিম্নলিখিত কমান্ডটি ব্যবহার করতে পারেন:
pip install pandas
সফলভাবে পান্ডাস ইনস্টল করার পরে, এটি ব্যবহার করে আপনার পাইথন স্ক্রিপ্টে আমদানি করতে এগিয়ে যান:
import pandas as pd
এখন আমাদের স্ক্রিপ্টে পান্ডাস ইনস্টল এবং আমদানি করা হয়েছে, আসুন সমস্যাটি সমাধানের দিকে এগিয়ে যাই।
সমস্যার সমাধান: একটি ডেটাফ্রেম জিজ্ঞাসা করা এবং একটি কলাম ফেরত দেওয়া
ধরে নিচ্ছি যে আমাদের একটি ডেটাফ্রেম আছে এবং নির্দিষ্ট শর্তের উপর ভিত্তি করে নির্দিষ্ট তথ্য অনুসন্ধান করতে হবে, উদাহরণস্বরূপ, "বয়স" নামে একটি কলাম খুঁজে বের করা যেখানে মান একটি প্রদত্ত সংখ্যার চেয়ে বেশি। আমরা পান্ডাদের ব্যবহার করে এটি অর্জন করতে পারি প্রশ্ন() ফাংশন.
আসুন প্রথমে প্রদর্শনের উদ্দেশ্যে কিছু ডেটা সহ একটি নমুনা ডেটাফ্রেম তৈরি করি:
data = { "Name": ["Alice", "Bob", "Charlie", "David", "Eve"], "Age": [25, 32, 29, 41, 38], "City": ["New York", "San Francisco", "Los Angeles", "Chicago", "Miami"] } df = pd.DataFrame(data)
ধাপে ধাপে ব্যাখ্যা: পান্ডাস কোয়েরি ফাংশনের সাথে কাজ করা
এখন যেহেতু আমরা একটি নমুনা DataFrame তৈরি করেছি, আসুন প্রশ্ন করার ধাপগুলি ভেঙে দেওয়া যাক এবং প্রয়োজনীয় ডেটা ফেরত দেওয়া যাক:
1। ব্যবহার করুন প্রশ্ন() প্রদত্ত শর্তের উপর ভিত্তি করে ডেটাফ্রেম ফিল্টার করার ফাংশন:
age_filter = df.query('Age > 30')
সার্জারির প্রশ্ন() ফাংশন সেই অনুযায়ী ডেটাফ্রেম ফিল্টার করতে 'বয়স > 30' শর্ত সহ একটি স্ট্রিং গ্রহণ করে।
2. ফিল্টার করা ডেটাফ্রেমের শুধুমাত্র 'বয়স' কলাম ফেরত দিতে, ব্যবহার করুন:
result = age_filter['Age']
3. অবশেষে, ফলাফল প্রিন্ট করুন:
print(result)
অন্যান্য উল্লেখযোগ্য অনুরূপ ফাংশন এবং লাইব্রেরি
ছাড়াও প্রশ্ন() ফাংশন, পান্ডাসে অন্যান্য অনুরূপ বিকল্প উপলব্ধ রয়েছে, যেমন অবস্থান [] এবং iloc[] ফাংশন, যা ফিল্টারিং এবং ডেটা পুনরুদ্ধারের একই উদ্দেশ্য পরিবেশন করতে পারে। ফাংশনের পছন্দ সমস্যাটির জটিলতা এবং কোডের সরলতার উপর নির্ভর করে।
তদ্ব্যতীত, ডাটা বিশ্লেষণ ক্ষমতা আরও উন্নত করতে পান্ডাগুলিকে প্রায়শই অন্যান্য লাইব্রেরির সাথে যুক্ত করা হয়। নম্র এটি সংখ্যাসূচক ক্রিয়াকলাপের জন্য একটি লাইব্রেরি, যা পান্ডাদের কর্মক্ষমতা অপ্টিমাইজেশানকে উপকৃত করে। সমান্তরালভাবে, ম্যাটপ্ল্লোব লাইব্রেরি ডেটার আকর্ষক ভিজ্যুয়ালাইজেশন তৈরি করতে সহায়তা করে, ব্যবহারকারীদের ডেটা প্যাটার্ন বোঝা সহজ করে তোলে।
উপসংহারে, পান্ডাস লাইব্রেরি নমনীয় এবং দক্ষ ডেটা ম্যানিপুলেশন কৌশল প্রদানের জন্য NumPy এবং Matplotlib-এর মতো অন্যান্য প্রয়োজনীয় লাইব্রেরির সাথে মিলিত ডেটা বিশ্লেষণ এবং ফিল্টারিংয়ের একটি মৌলিক হাতিয়ার হিসেবে কাজ করে।