📊

Python Pandas पर विस्तार से जानकारी

Sep 13, 2024

Python Pandas Lecture Notes

परिचय

  • इस वीडियो में Python Pandas की शुरुआत से अंत तक सिखाई जाएगी।
  • पैंडा एक बहुत ही उपयोगी और शक्तिशाली लाइब्रेरी है।

प्रारंभिक सेटअप

  • लाइब्रेरी इंस्टॉल करना:

    • pip install pandas
    • पुराने वर्जन को अपग्रेड करने के लिए:
      • pip install --upgrade pandas
  • Jupyter Notebook लॉन्च करना:

    • jupyter notebook कमांड से नोटबुक सर्वर खुल जाएगा।
    • Python 3 वर्शन चुनें।

Pandas का परिचय

  • Pandas क्या है?
    • डेटा विश्लेषण के लिए एक ओपन-सोर्स लाइब्रेरी।
    • इसे Python में लिखा गया है।

डेटा फ्रेम और सीरीज

  • Series:

    • एक-आयामी एरे जो इंडेक्स के साथ आता है।
  • DataFrame:

    • दो-आयामी डेटा संरचना।
    • इसमें एक या एक से अधिक कॉलम होते हैं।

डेटा फ्रेम का निर्माण

  • एक Dictionary बनाकर डेटा फ्रेम तैयार किया जा सकता है।
    • उदाहरण: dict1 = {'name': ['Harry', 'Rohan', 'Shub'], 'marks': [12, 34, 56], 'city': ['Rampur', 'Kolkata', 'Bareilly']} df = pd.DataFrame(dict1)

CSV और Excel फाइलों के साथ काम करना

  • CSV में डेटा एक्सपोर्ट करना:

    • df.to_csv('friends.csv', index=False)
  • CSV फाइल से डेटा रीड करना:

    • pd.read_csv('friends.csv')
  • Excel फाइल के साथ काम करना:

    • Excel फाइल पढ़ने के लिए:
      • pd.read_excel('data.xlsx')
    • Excel फाइल में लिखने के लिए:
      • df.to_excel('data.xlsx', sheet_name='Sheet1')

Pandas के अन्य महत्वपूर्ण फ़ंक्शंस

  • head(): पहले n पंक्तियाँ दिखाता है।
  • tail(): अंतिम n पंक्तियाँ दिखाता है।
  • describe(): सांख्यिकीय जानकारी देता है।
  • isnull(): null मान की पहचान करता है।
  • drop_duplicates(): डुप्लिकेट पंक्तियों को हटाता है।

महत्वपूर्ण नोट्स

  • डेटा फ़्रेम की इंडेक्स को reset करने के लिए:
    • df.reset_index(drop=True, inplace=True)
  • डेटा मैनिपुलेट करते समय chaining का ध्यान रखें।
  • हमेशा loc और iloc का सही उपयोग करें।
  • Pandas की डोक्यूमेंटेशन से संबंधित फ़ंक्शंस को देखना सीखें।

क्विज़

  • एक डेटा फ्रेम बनाएँ जिसमें केवल पूर्णांक हों, 3 पंक्तियाँ और 2 कॉलम हों।
  • विभिन्न सांख्यिकीय फ़ंक्शंस का उपयोग करके डेटा का विश्लेषण करें।

ये नोट्स Python Pandas पर इस लेक्चर के मुख्य बिंदुओं का सारांश हैं। अब आप इनका उपयोग कर सकते हैं अपने अध्ययन के लिए।