पैंडास पुस्तकालय की जानकारी

Sep 13, 2024

पैंडास पर व्याख्यान के नोट्स

पैंडास क्या है?

  • डेटा एनालिसिस की ओपन-सोर्स लाइब्रेरी है, जो पाइथन में लिखी गई है।
  • यह एक टेबलर डेटा स्ट्रक्चर के रूप में डेटा को व्यवस्थित करता है।

पैंडास के फायदे

  • डेटा को आसानी से प्री-प्रोसेस और एनालाइज कर सकता है।
  • CSV और एक्सेल शीट्स के साथ काम करना आसान है।

पैंडास का इंस्टॉलेशन

  • कमांड: pip install pandas
  • अपडेट करने के लिए: pip install --upgrade pandas
  • जुपिटर नोटबुक को खोलने के लिए: jupyter notebook

पैंडास में डेटा संरचनाएँ

1. सीरीज (Series)

  • एक डाइमेंशनल डेटा संरचना है।
  • एकल कॉलम डेटा को संग्रहित करने के लिए।

2. डेटा फ्रेम (DataFrame)

  • दो डाइमेंशनल डेटा संरचना है।
  • एक या अधिक कॉलम्स हो सकते हैं।

पैंडास का उपयोग कैसे करें

डिक्शनरी से डेटा फ्रेम बनाना

import pandas as pd

data = {'Name': ['Harry', 'Rohan', 'Skill F', 'Shub'],
        'Marks': [12, 34, 24, 67],
        'City': ['Rampur', 'Kolkata', 'Bareilly', 'Antarctica']}
df = pd.DataFrame(data)

CSV में डेटा निर्यात करना

  • CSV में डेटा निर्यात करने के लिए: df.to_csv('filename.csv')
  • बिना इंडेक्स: df.to_csv('filename.csv', index=False)

डेटा को पढ़ना

  • CSV पढ़ने के लिए: pd.read_csv('filename.csv')

महत्वपूर्ण फंक्शन

  • df.head(): शुरुआती 5 पंक्तियाँ दिखाता है।
  • df.tail(): अंतिम 5 पंक्तियाँ दिखाता है।
  • df.describe(): सांकेतिक आँकड़े देता है।
  • df.info(): डेटा फ्रेम की जानकारी देता है।

जुपिटर नोटबुक में काम करना

  • शिफ्ट + एंटर दबाकर सेल को रन करें।
  • नए सेल बनाने के लिए "Insert Cell Below" का उपयोग करें।

एक्सेल शीट्स के साथ काम करना

  • एक्सेल फाइल पढ़ने के लिए: pd.read_excel('filename.xlsx')
  • एक्सेल फाइल में लिखने के लिए:
    df.to_excel('filename.xlsx', sheet_name='Sheet1')
    

निष्कर्ष

  • पैंडास डेटा एनालिसिस के लिए एक महत्वपूर्ण उपकरण है।
  • डेटा को संभालने और विश्लेषण करने के लिए विभिन्न कार्यक्षमताएँ प्रदान करता है।

क्विज़

  • एक डेटा फ्रेम बनाएं जिसमें केवल पूर्णांक हो, 3 पंक्तियाँ और 2 कॉलम हों।
  • विभिन्न सांकेतिक कार्यों का उपयोग करके डेटा का विश्लेषण करें।
  • जैसे कि df.describe(), df.mean(), df.count() आदि।

यह नोट्स पैंडास की प्रारंभिक समझ और उसके मुख्य कार्यों का सारांश प्रस्तुत करते हैं।