📊

Python Pandas पर विस्तृत विवरण

Aug 5, 2024

Python Pandas पर लेक्चर नोट्स

परिचय

  • इस वीडियो में Python Pandas के बारे में स्टार्टिंग से लेकर एडवांस तक जानकारी दी जाएगी।
  • सभी आवश्यक लाइब्रेरी और फाइल्स एक ही फोल्डर में रखी जाएँगी।

Pandas की स्थापना

  • Jupyter Notebook खोलें।
  • Pandas इंस्टॉल करने के लिए कमांड: pip install pandas
  • यदि पुराने वर्जन में हैं, तो अपडेट करने के लिए: pip install --upgrade pandas
  • Jupyter Notebook का उपयोग करने के लिए Python और pip को PATH में ऐड करना होगा।

Pandas का उपयोग

  • Pandas को इंपोर्ट करने के लिए: import pandas as pd
  • Pandas DataFrame बनाने के लिए एक डिक्शनरी का उपयोग किया जाएगा।
  • उदाहरण: dict1 = { 'name': ['Harry', 'Rohan', 'Skill', 'Shubh'], 'marks': [12, 34, 24, 67], 'city': ['Rampur', 'Kolkata', 'Bareilly', 'Antarctica'] } df = pd.DataFrame(dict1)
  • DataFrame को CSV में एक्सपोर्ट करने के लिए: df.to_csv('friends.csv', index=False)

DataFrame के साथ कार्य

  • DataFrame को देखने के लिए df.head() और df.tail() का उपयोग करें।
  • Statistical summary के लिए df.describe() का उपयोग करें।
  • किसी CSV फाइल को रीड करने के लिए: df = pd.read_csv('filename.csv')

Series और DataFrame के बीच अंतर

  • Series एक एकल कॉलम का एक-आयामी डेटा होता है।
  • DataFrame एक टेबल जैसी संरचना होती है जिसमें एक या एक से अधिक कॉलम होते हैं।

Jupyter Notebook का लाभ

  • Jupyter Notebook डेटा एनालिसिस के लिए सबसे अच्छा माना जाता है।
  • कोड को रन करते समय सेल्स का उपयोग करके आसानी से प्रबंधन किया जा सकता है।

महत्वपूर्ण फंक्शंस

  • pd.Series() का उपयोग करें Series बनाने के लिए।
  • DataFrame की विशेषताएँ जैसे की index, columns देखे।
  • df.drop() का उपयोग करके किसी भी रो या कॉलम को हटा सकते हैं।
  • df.reset_index(drop=True) का उपयोग करके index को रीसेट करें।
  • df.isnull() का इस्तेमाल NULL वैल्यू की पहचान के लिए करें।

Excel फ़ाइलों के साथ कार्य

  • Pandas में एक्सेल फ़ाइल पढ़ने के लिए: pd.read_excel('filename.xlsx')
  • एक्सेल में लिखने के लिए data.to_excel('filename.xlsx', sheet_name='Sheet1') का उपयोग करें।

निष्कर्ष

  • Pandas डेटा एनालिसिस के लिए एक शक्तिशाली टूल है।
  • विभिन्न प्रकार के डेटा को संभालने के लिए कई फंक्शंस उपलब्ध हैं।
  • कोडिंग में दक्षता के लिए Pandas का उपयोग किया जाना चाहिए।
  • वीडियो के अंत में एक क्विज दिया गया है जिससे छात्र अपने ज्ञान का परीक्षण कर सकते हैं।

क्विज़

  • एक DataFrame बनाएं जिसमें केवल संख्याएँ हों, तीन पंक्तियाँ और दो कॉलम हों।
  • दिए गए मेथड्स का उपयोग करते हुए विभिन्न सांख्यिकीय विश्लेषण करें।

यह नोट्स आपको Pandas की मूल बातें और इसके उपयोग के बारे में दृष्टिकोण प्रदान करेंगे।