पैंडास पर व्याख्यान के नोट्स
पैंडास क्या है?
- डेटा एनालिसिस की ओपन-सोर्स लाइब्रेरी है, जो पाइथन में लिख ी गई है।
- यह एक टेबलर डेटा स्ट्रक्चर के रूप में डेटा को व्यवस्थित करता है।
पैंडास के फायदे
- डेटा को आसानी से प्री-प्रोसेस और एनालाइज कर सकता है।
- CSV और एक्सेल शीट्स के साथ काम करना आसान है।
पैंडास का इंस्टॉलेशन
- कमांड:
pip install pandas
- अपडेट करने के लिए:
pip install --upgrade pandas
- जुपिटर नोटबुक को खोलने के लिए:
jupyter notebook
पैंडास में डेटा संरचनाएँ
1. सीरीज (Series)
- एक डाइमेंशनल डेटा संरचना है।
- एकल कॉलम डेटा को संग्रहित करने के लिए।
2. डेटा फ्रेम (DataFrame)
- दो डाइमेंशनल डेटा संरचना है।
- एक या अधिक कॉलम्स हो सकते हैं।
पैंडास का उपयोग कैसे करें
डिक्शनरी से डेटा फ्रेम बनाना
import pandas as pd
data = {'Name': ['Harry', 'Rohan', 'Skill F', 'Shub'],
'Marks': [12, 34, 24, 67],
'City': ['Rampur', 'Kolkata', 'Bareilly', 'Antarctica']}
df = pd.DataFrame(data)
CSV में डेटा निर्यात करना
- CSV में डेटा निर्यात करने के लिए:
df.to_csv('filename.csv')
- बिना इंडेक्स:
df.to_csv('filename.csv', index=False)
डेटा को पढ़ना
- CSV पढ़ने के लिए:
pd.read_csv('filename.csv')
महत्वपूर्ण फंक्शन
df.head()
: शुरुआती 5 पंक्तियाँ दिखाता है।
df.tail()
: अंतिम 5 पंक्तियाँ दिखाता है।
df.describe()
: सांकेतिक आँकड़े देता है।
df.info()
: डेटा फ्रेम की जानकारी देता है।
जुपिटर नोटबुक में काम करना
- शिफ्ट + एंटर दबाकर सेल को रन करें।
- नए सेल बनाने के लिए "Insert Cell Below" का उपयोग करें।
एक्सेल शीट्स के साथ काम करना
निष्कर्ष
- पैंडास डेटा एनालिसिस के लिए एक महत्वपूर्ण उपकरण है।
- डेटा को संभालने और विश्लेषण करने के लिए विभिन्न कार्यक्षमताएँ प्रदान करत ा है।
क्विज़
- एक डेटा फ्रेम बनाएं जिसमें केवल पूर्णांक हो, 3 पंक्तियाँ और 2 कॉलम हों।
- विभिन्न सांकेतिक कार्यों का उपयोग करके डेटा का विश्लेषण करें।
- जैसे कि
df.describe()
, df.mean()
, df.count()
आदि।
यह नोट्स पैंडास की प्रारंभिक समझ और उसके मुख्य कार्यों का सारांश प्रस्तुत करते हैं।