Transcript for:
पैंडास पुस्तकालय की जानकारी

Guys इस वीडियो में मैं आप लोगों को Python Panda स्टार्टिंग से लेके एंड तक बताऊंगा इस वीडियो में मैं आप लोगों को वो चीज़े कफ़र करूँगा जो कि मुझे सीखने में काफ़ी टाइम लग गया मैं सीधे यहाँ पर बिना टाइम वेस्ट की अपन पैंडा सारी की सारी लाइबरिटी फटाक्स हम लोग इंस्टॉल करेंगे और उसी के साथ साथ मैं यही पर सारी की सारी अपनी CSV फाइल्स, Excel शीट्स, सारा का सारा डेट है जिसके साथ हम लोग काम करने वाले हैं वो सब मैं इसी फोल्डर के अंदर रखूँगा और यही प का सारा काम करेंगे तो चलते हैं फोल्डर बनाएंगे सबसे पहले लाइबरेरीज इंस्टॉल करेंगे जुपिटा नोटबुक खोलेंगे पैंडास का हैंड सॉन लेंगे कि कैसा होता है पैंडास क्यों चाहिए एक्सप्लोडेटिल एक आउसम फैंटास्टिक लाइबरेरी क्यों है ये चीज आप लोगों को तो कुछ नहीं है कोई भी आपको नाम जो सूट करें वह आप दे सकते हैं मैंने शिफ्ट दबाकर राइट क्लिक किया मैं विंडोस के अंदर रूप आइट अवे तो शिफ्ट दबाकर राइट क्लिक करके मैं यहां पर लिख रहा हूं ओपन मैं क्लिक करा पाइप इंस्टॉल पैंडा आप यह कर लेना मुझे बता रहा है क्वाइट्स ऑलरेडी सेटिसफाइड आप यहां पर यह भी कर सकते हैं पेप स्टॉल माइनस इस माइनस अब ग्रेट पांडास यह करेंगे आपका पांडा जो है वह अपग्रेड हो जाएगा तो अगर आप लोग किसी पुराने वर्जन में तो यह वाला कमांड जरूर रन करें और आप लोग इंचर करें कि लेटेस्ट वर्जन में आप है हालांकि चीजें अगर आपके पास नहीं है जो पिटा नोटबुक पेप इंस्टॉल जुबिटर रन कर लेना आप लोग जैसे पेप इंस्टॉल जुबिटर दिखा रहा है तो मैं यहां पर क्या करूंगा जो पिटन नोटबुक लिख दूंगा सिंपल सा कमांड है जो पिटन नोटबुक यह लिखकर एंटर मानना है एक नोटबुक सर्वर लॉन्च हो जाता है तो जैसे यह नोटबुक सर्वर आपको लॉन्च होगा आप लोग का यह नोटबुक सर्वर खुल जाएगा और उसके बाद होगा क्या कि आप अपने ब्राउजर में ऑटोमेटिकल आप लोग को ये interface देखने को मिलेगा, इससे डरना बिल्कुल मत अगर आप लोग को नहीं मालूम, new में क्लिक करके python 3 में क्लिक कर देना, और python install होना चाहिए आपके system में, इस चीज को use करने के लिए python होना चाहिए, क्योंकि jupiter python से ही connect करेगा, आप लोग python और टू आज में चले जाना पाइट नहीं है तो और आप लोग पाइट डाउनलोड करें एकदम सिंपल स्ट्रेटफॉर्वर्ड से प्रोसेस है डाउनलोड करके अपने कंप्यूटर में इंस्टॉल कर लेना और पाइट और पिप दोनों को एड टू पाथ करने का लिखोंगा इंपोर्ट नंपा एजन पी और मैं यहां पर लिखोंगा इंपोर्ट पैंडर्स पीडी अ जो पीटर में होता क्या है कि अगर मैं कुछ इस तरह से लिख दूं कोड मैं एंटर दबाऊंगा तो कुछ ऐसा होगा लेकिन अगर मैं शिफ्ट एंटर दबाऊंगा तब यह क्या होगा एक्जिक्यूट हो जाएगा कोड मेरा तो मैं यही चाहता हूं मैं चाहता हूं कि मे लेट कर रहा है कनेक्ट होने का कुछ टाइम लगेगा कभी-कभी पहले वाला जो होता है आपका ऑपरेशन उसमें टाइम लगता है इंपोर्ट में तो टाइम लगा और नंबर एजन पी पैंडा स्पीडी अब यह हम कस्टम अरेली इस तरह से इंपोर्ट करते हैं कस्टम है अब हम करेंगे क्या यहां पर डिशनरी बनाएंगे सिंपल सी पाइटिन की एक सिंपल सी चीज पैंडास का डेटा फ्रेम का तो काम करते हैं डिशनरी बनाते अब आप लोगों जिस तरह से आपने सुना नहीं है पैंडास के बारे में उस हिसाब से आप लोगों को बताऊंगा कि आप लोग चीजें इजी लगने लगेंगे अभी आपको जैसा लोगों की मैंने डिशनरी बनाई है नेम में मैंने दिया है हैरी दूसरा मैंन कि रोहन तीसरा मैं दे रहा हूं स्किल एफ और एक और मैं आप दे रहा हूं शुब ठीक है कॉमा लगाऊंगा यहां पर अब मैं यहां पर क्या करूंगा इनके मार्क्स लिख दूंगा मार्क्स में क्या करूंगा इनके मार्क्स लिख दूंगा इस प्लीट डिशने� वैल्यू पे ठीक है 12 और 34 और इसके बाद 24 और इसके बाद 67 शुब के मार्क्स तो मैं काम करता हूं अपने मार्क्स थोड़े लिखूंगा इन सब की तो यहां पर मैं सबसे पहले अपनी सिटी लिखूंगा रामपूर उसके बाद मैं आप इस लिखूंगा रोहन की जो की है कोलकाता और उसके बाद मैं आप रिसिटी लिखूंगा स्किल ऐफ की जो की मैं अजय करूंगा बरेली है उसके बाद शुभ की सिटी तो यहां पर हमारी एंटाक्टिका है अ ठीक है, simple सी चीज है, मैंने यहाँ पर assumed values डाल दी है, कुछ भी यहाँ पर मैंने ऐसा नहीं किया है काम कि आप लोग को लगेगी बहुत जारा difficult है कोई चीज, simply एक dictionary बनाई है, अब यहाँ पर shift enter दबा दूँगा, अब यह number आप लोग देख रहे हो न, 1, 2, यह जो Jupiter notebook होती है उससे होता है convenience हो जाती है, आपको पता चल जाएगा कि कौन सी चीज पहले execute हुई है, तो ये number जो है, ये order को आप maintain करके चलोगे, तो आप फायदे में रहोगे, अब मैं क्या करूँगा, अब मैं लिखूँगा PD, यानि कि PD मैंने as PD pandas को import किया है, तो data frame, आप यहाँ पर दे� कोई इसमें बड़ी चीज नहीं है, df is equal to, मैंने ही कर दिया, एक variable बना लिया df का, और मैंने कहा, pd.dataframe dict1, यह करेगा क्या, एक data frame बना देगा, अब यह data frame नाम थोड़ा सा confusing लगता है, लगता है कि यार बता नहीं क्या बड़ी चीज है, simple चीज और data frame कुछ नहीं है, यह इसको एक एक्सल चीट में कनवर्ट कर देगा, फास्टर इंडेक्सिंग के लिए, नमपाई के हम फंक्शन्स को यूज़ कर पाएंगे, यानि कि पैंडास के अंदर जो होता है, जिस तरह वो बनता है, उसका बैक एंड कुछ इस तरह लिखा है, कि सारी चीज़ें यह फा चलो बढ़िया, अब मुझे DF को अगर देखना है, तो मैं कुछ इस तरह ना देख सकता हूँ, और आप देखो यहाँ पर, इसने क्या किया, इसने यहाँ पर name दे दिया, marks दे दिया, city दे दिया, यहाँ पर जैसे मैंने यहाँ पर dict 1 में दिया था, name, marks, city, उसी तरह इसने column के बात कर रहा हूं यह हमेशा जरूरी नहीं है 0123 हूं मैं इनकी index को change भी कर सकता हूं वो सब अभी technicalities में मैं जा नहीं रहा हूं मैं अभी simple सी चीज आप लोगों करके दिखाऊंगा यही data frame को अगर आपको एक CSV में export करना यानि कि एक excel sheet में export करना है तो कैसे करोगे simple सा function है to CSV और यहां पर आप लोग को CSV का नाम लिखना है ठीक है तो मैं यहां पर लिख दूंगा फ्रेंड्स डॉट सीएसवी और यह मैं इसको जरूर ठीक करूंगा स्पेलिंग को शिफ्ट एंटर किया मैंने एग्जिक्यूट हो गया अब यह पर आओगे ना आपको यहां पर एक फ्रेंड्स डॉट सीएसवी नाम की फाइल मिल जाएगी और यह फाइल एक्� कि यह क्या है यह मेरे फोल्डर ही तो है तो मैं अब अपनी फ्रेंड्स टो चीज पिछला खोलूंगा तो उसमें मुझे यह सारा का सारा डिटा मिलेगा और उसी के साथ सारा इंडेक्स और कॉलम भी मिलेंगे तो यह मेरी इंडेक्स है मैं अगर इसको थोड़ा सा आप लोगों के लिए इंडेक्स है और यह क्या है यह मेरे कॉलम से ठीक है तो इंडेक्स कॉलम मैंने आप लो� चलो इसको बंद कर देता हूं तो सिंपली किसी भी डाटा को एनेलाइज करने के बाद आपको एक्सल चीट में डालना है सिंपल से टू सी ऐसी फंक्शन का यूज कर सकते हो मैं भी एक करके आप लोग को सिरीज क्या होता है डाटा फ्रेम जैसा चाहते हो आपको सिर्फ इस तरह से एक्सल चीज चाहिए आप चाहते होगी यार कुछ इस तरह से मुझे दिखे सॉरी अ मुझे यहाँ पर इसको delete करना था, अगर आप चाहते होंगे इस तरह से यह CSV दिखे, तो आप लोग यहाँ पर क्या करोगे, आप लोग आजाओगे अपने Jupiter notebook के अंदर, और आपको index is equal to false दे देना, अगर मैं यहाँ पर कुछ इस तरह index is equal to false लिखूं, इसका मतलब यह है कि मैं चाहता हूँ कि मैं अपनी CSV में Index ना देख पूँ, तो मैं काम करता हूँ, इसको friends underscore index false कर देता हूँ, ठीक है, और index, friends.csv क्या करेगा, यह, उसमें मेरे rows रहेंगे, यानि कि मेरी index रहेंगी, इसमें क्या होगा, मेरी index नहीं रहेंगी, मैं आपलोग को और इसमें होगा क्योंकि इसमें मैंने index is equal to false नहीं लिखा था, तो कभी भी CSV को export कर रहे हो आप लोग, तब इस चीज़ का आप लोगों को दिहान रखना है, index is equal to false अगर नहीं लिखा तो यह 0, 1, 2, 3, 4 या फिर जो भी आपकी index है वो आ जाएगी, ठीक है, index का मतलब row और column को column अगर मेरा data frame बहुत बड़ा होता है, 1-2 million rows होती, तब यह सारी 1 million rows तो दिखा नहीं सकता, तो यह क्या करता है, थोड़ा सा दिखाता है, अगर आप देखना जाते हो, मानलो शुरू की 3 rows, तो आप लोगों को लिखना है कुछ इस तरह से, df.head, मैं 2 लिखोंगा तो मुझे शुरू की 2 rows दिखाएगा, उसी तरह अगर आप लोग df.tail के अंदर आप लोग मानलो लिखोगे, df.tail के अंदर आप लोग 2 लिख दिया, तब ये आखरी की दो दिखाएगा, अब data frame अगर बहुत जारा बड़ा है, तब आप लोग को ये शुरू की कुछ रोज दिखाएगा, अगर df.head करा आपने सिर्फ बिना किसी argument के, और df.tail का अगर करा तो last की कुछ रोज दिखाएगा, उसी ही सासद हमारा होता है df.describe, अ mean, standard deviation, minimum 25th percentile ये सारी चीज़े calculate करेगा आपके लिए एक statistical analysis करेगा, maximum बताएगा आप लोगों कितना है तो ये सब चीज़े अगर आप लोगों जानना है तो आप df.describe का use कर सकते हो, मैं जाता हूँ ये सारे commands आप लोग quickly note कर लो, अब मान लो मेरे पास एक csv है और मैं उसका नाम रख देता हूँ मान लो harry.csv है और मैं सीएसवी में यह सिंपल सा एक सीएसवी बना रहा हूं सीएसवी सिंपली कॉमर सेपरेटेड वैल्यूज की शीट होती है मैं आपको सिंपली क्या करूंगा लिख दूंगा मान लो मैंने यहां पर लिख दिया आ ट्रेन नंबर फिर मैंने यहां पर लिख दिया मान लो स्पीड और मान लो उसके बाद मैंने यहां पर लिख दिया सिटी ठीक है सिटी लिख दिया आप मैं ज्यादा दिमाग नहीं लगा रहा हूं मलो ट्रेन नंबर में मैंने वन टू अब ट्रेन नंबर भी वैलेड नहीं होंगे बट अगेन मैं कुछ रैंडम चीज भर रहा हूं ठीक है अब मैंने आप इसको सेव कर दिया इसको ठीक है तो मैं इसको इस करूंगा कहूंगा कि हां भाई सेव कर दो बंद कर दूंगा सेव मैं इसको कर दूंगा सेव करने के बाद सिंपली मैं करूंगा इसको बंद कर दूंगा भी करा है लोग चीज भरी प्लेस आप लोग सेव कर ले ठीक है सेव करने के बाद अ यह मेरा आ चुका है कहाँ पर यहां पर आ चुका है इस फोल्डर में फ्रेंड्स सॉरी हैरी डॉट सीएसवी अगर आपको इसको रीड करना है तो आप एक हैरी नाम का डाटा फ्रेम बना सकते हैं अब बताऊंगा डाटा फ्रेम टेक्निकली क्या होता है लेकिन अभी है और यहां पर मुझे कुछ इशू मिला है वह इशू क्या है दो एक्ट्रिब्यूट रीड अंडर्सकोशिएसी ओके सो मुझे पीडी डॉट रीड सीएस फी लिखना है सॉरी डीएफ नहीं पीडी तो पीडी डॉट रीड सीएस लिखना है कि पैंडा का मैं मिल गया अभी इसमें सिर्फ तीन रोज है चार रोज सॉरी अगर इसमें बहुत सारी रोज होती है तो अगर इसमें बहुत सारी rows हो थी, तब भी मैं अपने Python के अंदर इसमें data analysis कर सकता था, अब मान लो मुझे train number, मुझे पता चला कि ये train number जो 1, 2, 3, 2, 2 है, उसकी speed ये नहीं है, मान लो मुझे कुछ ऐसा लगा, उसकी speed 50 है, तब मैं क्या करूँगा, मैं आपको कुछ इस तरह 0 क्या है? 0 मेरी index है, इस index पर क्या value है? 34, तब मुझे 34 मिल जाएगा, लेकिन अगर मैं आप पर कुछ ऐसे लिख दूँ 50, यानि कि इस value को मैं change करना चाहूँ, तो मैं कोई जिस तरह change कर सकता हूँ, तो जैसे ही मैं shift enter दबाओंगा, यह मुझे एक warning दे रहा है, और warning में यह मुझे से यह कहने की कोशिश कर रहा है, कि आप लोग जो है, एक slice पर इस तरह value को set ना करें, मैं आप लोग को आगे बताओं तो मैं क्या करूँगा, लिख दूँगा harry.csv और इसके अंदर मैं आपको value, sorry, नाम दे दूँगा harry.csv, shift enter करूँगा और यहाँ पर देखो मेरी harry.csv change हो चुकी है, तो मैं इसको खोल रहा हूँ अपनी harry.csv को और आप लोग देखो यहाँ पर 50 हो गई है, speed मैं index as equal to false न के साथ साथ आप लोग यहाँ पर और भी बहुत सारे काम कर सकते हैं अगर आप लोगों को index change करनी है मालो आप लोगों को 0, 1, 2, 3 को बनाना है कुछ और तब वो कैसे करेंगे तो simply आपको करना किया है यहाँ पर लिखना है harry.index is equal to first, second और उसके बाद मालो मैं यहाँ पर दे देता हूँ third और फोर्थ, अब अगर मैं यहाँ पर हैरी को आपको प्रिंट करके दिखाओं तो आप देखो फर्स्ट सेकंड थर्ड फोर यहाँ पर आ गया है, तो जरूरी नहीं है कि जो आपकी इंडेक्स है, वो आपकी 0, 1, 2, 3, 4 ही रहेंगी, यहाँ को इंटीजर ही रहेंगे, आप य इंडेक्स होती है कॉलम को एक्सेस करने के लिए कॉलम का नाम होता है तो यह आशा करते हो एकदम क्लियर हो गया होगा यह था एक बहुत ही क्विक ओवरव्यू पैंडेस के ऊपर किस तरह एक सीएसवी को रिड राइड करते हैं किस तरह वैल्यूस लॉसी होता है आई लॉसी होता है किस तरह किस वैल्यू को चेंज करके डूप्लिकेट्स को ड्रॉप करके क्या-क्या हम कर सकते हैं पैंडेस से अब हम देखेंगे, लेकिन हम उसके लिए एक deep understanding लेंगे pandas की सबसे पहले, और चलते हैं, हम और लेते हैं deep understanding, समझते हैं कि series object क्या होता है, data frame क्या होता है, और इसको समझके हम वापस से Jupiter notebook में आकर, कुछ code लिखकर चीज़ों को अच्छी तरह समझेंगे, ताकि हम एक अच्छे data scientist बन पाए, और pandas में हम लोग क्या क्या करने वाले हैं, तो पैंडा सबसे पहले क्या चीज है यह डेटा अनैलिसिस की एक ओपन सोर्स लाइब्रेरी है जो कि पाइथन में लिखी गई है अब आप लोग कहेंगे कि मैं एक्सल क्यों नहीं यूज करूं मैं पैंडा क्यों यूज करूं मैं आप लोग को सीधा सच्चा जवाब यह लिस्ट होती है या फिर कोई डिक्शनरी होती है या फिर टपल होता है जो भी आपके पाइथन ऑप्चेक्ट्स होते हैं वो मेरे हिसाब से इतनी फंक्शनालिटी प्रोवाइड नहीं कर पाते हैं कि आप लोग उसमें एक सक्सेसफुली अच्छा डेट अनैलाइज कर सकें अपना तो होता गया है यहां पर यह आप लोग को एक एक्सटरनल लाइब्रेडी पर डिपेंड होना पड़ता है पाइथन के अंदर इसको इस्तेमाल कर सकते हैं और यह पार और स्पीड इस्तेमाल करता है किसकी नमपाई की अब हमें पता है कि नमपाई C में लिखी गई है और आपको अगर स्पीड चाहिए तब आप नमपाई यूज करते हैं इस बार इसमें आईड कर लें अब क्या है कि डेटा अनैलेसिस और प्री प्रोसेसिंग की बहुत अच्छे अच्छे फंक्शंस देता है इस बार इस बा अच्छा होता है आप लोगों के लिए अब यहां पर रिच एंड हाइली रोबस डेटा ऑपरेशन आप लोग को मिलते हैं यानि कोई भी काम आप करवाना चाहते हैं अपने पाइथन प्रोग्राम से एक बड़े डेटा पर तो आप लोग उसको बहुत ही हाइली रोबस तरीके में कर सकते हैं और बहुत ही आसानी से कर सकते हैं क्योंकि ऑलमोस्ट हर काम को करने के हो या फिर वह किसी वाल्यू में कोई चीज अपेंड करना हो या फिर उसको सीएसवी में एक्सपोर्ट या सीएसवी से रीड करने का कुछ हो even excel की sheets भी आप one by one read कर सकते हैं panda से इसलिए ये एक बहुत अच्छी library है और आप लोग को इसको इस्तेमाल करना चाहिए अब यहाँ पर जो मैं आप लोगो बताने जा रहा हूँ वो बहुत जादा important नहीं ये जिसने समझ लिया उसने समझ लिया की pandas किस तरह काम कर रहा है क्योंकि ये foundation है ये basic है पांडाज में प्रमारिली दो तरह के डेटा स्ट्रक्चर्स होते हैं, सिरीज और डेटा फ्रेम, अगर मैंने अभी आप लोगों क्या बताएं, मैंने कहा कि जो आपका पांडाज में डेटा लोड हो रहा है, आप लोगों करना क्या है, उसको आप लोग समझ लोगे कि एक् एक स्प्राइट चीट है जरूरी नहीं है एक्सलो ठीक है यहां पर कॉलम वन या कॉलम टू या कॉलम थ्री यह रोवन है यह रोटू है यह रोथ रिहम ए लाइंस नहीं बना रहा हूं डर्टी हो जाएगा थोड़ा रोवन रोटू रोथ री कॉलम एक ऑलम थी मनो यह डीवन या 22 है इसी तरह यहां भी वैल्यूज है यहां पर मनो 27 है अब मैंने आप लोगों को बताए इसको बोलते हैं कॉलम्स और इसको बोलते हैं इंडेक्स जरूरी नहीं है कि इंडेक्स 01234 यह कोई आपकी स्ट्रिंग्स भी हो सकती है आप लोग इसको कुछ भी सेट कर सकते मैंने करके दिखाया था भी थोड़ी दिल पहले अब क्या होता है कि यह जो आपका एक कॉलम होता है इसके अंदर आपका बॉम होता है ठीक है इसे कहते हैं एक सीरीज अब सीरीज क्या है पाइट में देखो इट्स अवन डामेशनल एरेड इंडिस इंडेक्स इस आपकी इंडेक्स का इंडेक्स के साथ आने वाला एक वन डामेशनल एरे है जो कि सिंगल कॉल वाला में रोग को क्या करता है स्टोर करता है डाटा फ्रेम के अंदर डाटा फ्रेम क्या होता है डाटा फ्रेम यह होता है यह पूरा डाटा फ्रेम है जो मैंने बनाकर दिखाया एक टाबिलर स्प्रेडशीप लाइट स्ट्रक्चर रिप्रेजेंटिंग प्रोजी चॉपिट कंटेंट वन और मल्टिपल कॉलम्स इसमें एक या फिर मल्टिपल कॉलम्स हो सकते हैं और हर कॉलम का क्या होता है डाटा टाइप जो होता है वह सीम होता है अब अगर मैं एक बार और इसको समराइज करूं बहुत ही सिंपल जो की capable होता है एक तरह का data किसी भी तरह का, किसी भी एक तरह का data hold करने के, और यह क्या होता है two dimensional data होता है, data structure होता है जो की क्या है, potentially different types of data को hold करने के capable होता है तो simply इतना है अब इसकी implementation जादा आप detail में ना समझें, बस यह समझ ले यह पता होना चाहिए index क्या है, column क्या है series और data frame में कम से कम अंतर पता होना चाहिए df is equal to लिखा है, अगर आप df C2 का type चेक करोगे, तो आपको वो सीरीज बताएगा, लेकिन डीएफ का टाइप चेक करोगे तो डेटा फ्रेम बताएगा, तो पता होना चाहिए कि सीरीज और डेटा फ्रेम क्या है, कई सीरीज एक दम से आपके सामने पॉप हो और आपको लोग कंफ्यूस हो चाहें, तो वो नहीं होना चाहिए जुपिटर बेबी बट अगेंड मैं सिंपली बताना चाहता हूं कि डेट अनैलिसिस के लिए सबसे अच्छा है वीजियल स्टूडियो को एक अच्छी आईडीए पाइचा में अच्छी आईडीए है लेकिन हर चीज का जो यूज होता है वह अलग-अलग होता है जुपिटर को डेट अनैलिसिस में सबसे अच्छा माना जाता है क्योंकि आप लोग अपने डेटा फ्रेम्स अपने एरेज और इससे बच रहे हैं तो मैं कहूंगा कि जरूर जुपिटर में आप स्विच करें ज्यादा कुछ इसमें खतरनाक सीखने लाइक है नहीं सिंपली आपको सेल्स में रन करते जाना है आपको पाइथन आता है मतलब आपको जुपिटर आता है तो चलते हैं अब नोडबुक के अगर मैं यहाँ पर कुछ इस तरह लिखूं, मैं लिखूं SCR is equal to, और मैं यहाँ पर लिखूं PD.Series, अब PD.Series लिखने के बाद मान लो, मैं यहाँ पर लिखता हूँ, numpy.random.rand, और जैसे ही मैं यहाँ पर shift enter तबाउँगा, यह execute हो जाएगा, और मैं यहाँ पर करूँगा क्या, शुरू से मेरी सारी की सारी cells को run करने के लिए इस पर click करूँगा, और इस पर click करने के बाद मैं restart, enter, all cells कर दूँगा, उससे होगा क्या कि शुरू से लेकर आखिर तक जितने cells हैं सब run हो जाएंगे, यहाँ पर यह कभी-कभी थोड़ा सा time ले लेता है लेकिन अब आप लोग यहाँ पर देख सकते हैं कि मैंने यहाँ पर numpy.random.randend के अंदर मालो 34 अगर दे दिया तब होगा क्या कि यह मुझे 0 से लेके 33 तक एक series मुझे दे देगा अगर मैं आपको type करके SCR लिखूं pandas.co.series.series series एक data structure होता है pandas का जो कि क्या होता है कि pandas की एक basic index होती है तो जब आप data देते हैं पैंडास को तो और एक सीरीज बना देता वो करता क्या है कि आपके डेटा की एक इंडेक्स बना लेता है जिस तरह डेटाबेस की इंडेक्सिंग की जाती है ताकि आप बाद में सर्च कर सकें इंसर्ट कर सकें डेटाबेस को क्वेरी कर सकें उसी तरह यहाँ पर भी इंडेक् लिखूंगा pd.data frame और pd.data frame लिखने के बाद मैं लिखूंगा numpy.random.rand या फिर अब rand n भी उसकर सकते हैं, rand भी उसकर सकते हैं, उसके बाद अगर मैं यहाँ पर देता हूँ, इसको 334,5 मैंने को जिस सारा से दिया है, थोड़ी सी बड़ी मैं number of rows इसमें 334 लेना चाहता ए रेंज एंट्रूट ए रेंज क्या होता है फंक्शन होता है रेंज की तरह पाइथन में जैसे रेंज होता है फंक्शन उसी तरह नमपाई में ए रेंज होता है और ऑबिटिशल थी रेडीफोर्स क्योंकि हमारे पास रिडीफोर रोज होने रही है शिफ्ट एंटर किया न्यूडीएफ डॉट हैड कर दिया तो क्या होगा मुझे यह पांच रोज दिखाएगा लेकिन अगर आपका जो data frame है उसमें 334 rows हैं, 5 columns हैं तो इसने पूरी detail मुझे बता दी इस data frame के बारे में अब मैं यहाँ पर करूँगा क्या, मैंने इस data frame बना लिया अगर मैं यहाँ पर इसका type print करूँ सिर्फ सिर्फ type print करूँ कि इसका new df का तो मैं इसका सिर्फ type print करती दिखाता हूँ, आपको देखो यह बता रहा है, pandas.code.frame.dataframe, यानि कि यह एक data frame है, तो series और data frame में difference जिस तरह मैंने आपको बताया था, वो आपको code में भी समझ में आ गया.

तो newdf नाम का एक data frame बन चुका है, newdf.describe मैं कर सकता हूँ, जैसे मैंने पहले आप लोग को करके बताया, newdf.describe किया तो count, mean, standard deviation वगैरा सारे के सारे statistical measures हमको यहाँ पर मिल गए हैं, उसी के साथ सा newdf.dtypes अगर मैं करूँ यहाँ पर, तो यह मुझे बताएगा क्या क्या data type है, म new df.head भी कर लेता हूँ यहाँ पर, मैं उपर करता हूँ new df.head, उससे होगा क्या new df.head करने से, तो यह आपको बता सकता है कि यह अपना विशेष डाटा फ्रेम था और उसके साथ साथ डीटाइप इसमें सबके इसका इसका इसका इन सबका सेम डीटाइप रहेगा अगर आपने यह स्ट्रिंग डाल दिये तो यह ऑब्जेक्ट हो जाएगा इसका डीटाइप इसको data type को change करके object बनाना पड़ेगा इस वाले column को, zero वाले column को, क्योंकि यहाँ पर एक hairy आ गया है, new df.head अगर करूँ, तब क्या होगा, देखो यहाँ पर hairy आ गया, एक string डाल दी मैंने बीच में, integer, sorry, floating point numbers के बीच में एक string डाल दी, जिससे क्या हुआ, कि इसकी जो zero वाला column था, वहाँ पर क्या हुआ, कि उसका data type object बन गया, ठीक है, तो आप लोग change करके d type को देख सकते हो, और D type को देखने के बाद आप लोगों पता चल जाएगा की कौन सा उसका D type है ठीक है तो अब यहाँ पर करेंगे क्या हम लोग यहाँ पर index को print करेंगे ठीक है तो अगर मैं new df.index कर दूँ तो जैसे ही मैं new df.index करूँगा, तो मुझे क्या मिलेगा, मुझे यहाँ पर मिलेगा, index 0 से लेके 334 तक, sorry, 333 तक, कुल इसमें length इसकी 334 है, 0 से start होगा, 333 तक, कुल होंगे 334, और उसी तरह अगर मैं new df.column कर दूँ, और इस columns, तो यहाँ पर क्या होगा 0 से लेके 5 तक column है तो यह एक range index object है simply 0 से लेके 5 तक हमने यहाँ पर columns बनाए हुए हैं अब अगर मान लो मैं इस data frame को मेरा जो new df है यह data frame जो मैंने आपको भी दिखाया मैं चाहता हूँ कि यार इसमें यह नमपा एरे में convert हो जाए क्योंकि simply यह integers, sorry floating point numbers का समाहार है मैं क्या करूँगा चाहूँगा कि इसको नमपा एरे में convert कर दूँ तो मुझे लिखना होगा new df.2 underscore numpy और shift enter दबाउगा तो देखो एक numpy array बन गया है अब यहाँ पर इसका d type object इसको रखना पड़ा क्योंकि यहाँ पर एक harry था लेकिन again मैं चाहूँगा कि इसको मैं वापस से change करके harry ना करके कुछ और कर दू तो मैं आपको simply लिख दूँगा 34 और 34 नहीं बस 0.2 लिखूँगा अब अगर मैं new df डॉट हेड करूंगा तब आप लोग देखो यहाँ पर 0.3 आ गया है और उसी के साथ साथ इस बार अब मैं अगर 2 numpy करूंगा इसको यहीं पर मैं इसको execute कर देता हूँ तब आप देखो इसका d type यहाँ पर वापस से object ही है अब यहाँ पर थोड़ी सी यहाँ पर हम लोग बा पहले हमारे पास 334 rows थे, अब वो column में बदल चुके हैं, और column rows में बदल चुका है, जिस तरह matrix का transformation होता है, sorry, transpose होता है, उसी तरह यहाँ पर आप लोग इसको कर सकते हैं, अब यहाँ पर आप क्या कर सकते हो, यहाँ पर index को आप sort भी कर सकते हो, ठीक है, अब index को अगर आप लोग sort करोगे, खेर यहाँ पर तो already sorted है, हमारा new data frame जो है, वो यहाँ पर है, हमारा original data frame, new df, shift enter किया, यह मेरा, डाटा फ्रेम आ गया ठीक है और डॉट हैड ही कर लेता हूं क्योंकि डॉट हैड करने से थोड़ा कम दिखेगा डाटा फ्रेम ज्यादा टेंशन नहीं रहेगी अब यहाँ पर आप लोग देखो अगर तो इसमें पांच रोज है पांच कॉलम्स है ठीक है अब मानों मैं सॉर्ट करना चाहता हूं ठीक है तो मैं अब आप कहेंगे तो अलरेडी इंडेक्स के साथ सॉर्टेड है मैं इसको उल्टा सॉर्ट करूँगा इंडेक्स के साथ तो जिसको आप एक axis देंगे, आप कहेंगे, मैं axis 0, axis 0 कौन सी होती है? axis 0 rows होती है, ठीक है? axis is equal to 0, ascending is equal to false कर दूँगा, by default ascending true होता है, ठीक है?

तो मैं ascending false करूँगा, तो ये क्या करेगा? उल्टा sort कर देगा इसको, ठीक है? अगर मैं यहाँ पर ये नहीं लिखता है, ascending is equal to false, तो आप लोग यहाँ पर देखो, axis is equal to 0, row होती है, axis is equal to 1 column होती है, एक two dimensional numpy array के लिए, तो numpy वाले वीडियो में बताया था, मैंने आप लोगों को कि, किस तरह हम लोग axis से deal करते हैं, एकदम copy pencil से समझा रखा है, मैंने detail में, anyways, कि यह type क्या है हमारा new df 0 का, तो new df, अगर मैं फिर से new df dot head करूं, न्यूडीएफ डॉट हैड कर दिया मैंने यहाँ पर, अब मैं यहाँ पर करूँगा क्या, अगर मैं न्यूडीएफ जीरो को अक्सेस करूँ, तब क्या होगा, मुझे यह वाला एक वो मिल जाएगा, कॉलम, और यह एक सिरीज होगी, ठीक है, तो यहाँ पर अगर एंड में तो यहाँ पर देखो यह कह रहा है एक सीरीज है तो सीरीज के कॉम्बिनेशन से डाटा फ्रेम बनता है अब यहाँ पर मैंने आप लोगों को बताया था कि अगर आप लोगों किसी वैल्यू को चेंज करना है तब एक एरर हमको एरर नहीं था वो एक वार्निंग थी इसको से� तब क्या है मेरा कुछ ऐसे दिखता है newdf उसी के साथ साथ अगर मैं यही पर नीचे इसके मैं कुछ ऐसा करूं मैं काम करता हूं यहां पर एक cell insert करता हूं मैं यहां पर एक cell insert करके करूंगा कि इसको नीचे ले आया है in fact मैंने cell insert नहीं किया नीचे ले आया है newdf.head को मैं करूँगा क्या आप मैं simply यहाँ पर new df को मैं आपको लिखूँगा new df 0 को मैं इस तरह access कर सकता हूँ new df 0 को इस तरह मैंने access कर लिया उसी के साथ साथ अगर मालो मैं new df 2 is equal to new df लिख देता हूँ तो आप लोगो क्या लगता है क्या new df पूरा का पूरा copy होके एक नया बनेगा ऐसा नहीं होगा new df 2 जो है वो एक view है अगर मैं new df 0 0 इस इकॉल टू कुछ एक बड़ा सा नंबर लिख दो ठीक है शिफ्ट एंटर और इसको अभी इग्नोर करें आप सेटिंग विद कॉपी वार्निंग को मैं आप लोगों को व्यू के बारे में बता रहा हूं ठीक है अब मैं अगर न्यू डी एफ को प्रिंट करूं तो आप लोग देखो यहां पर 9783 आ गया जो कि मैंने न्यू डी एफ टू में सेट किया था तब जब मैंने यहां पर यह लिखा न्यू डी एफ टू इकॉल टू न्यू डी एफ तब हुआ क्या कि न्यू डी एफ ट� आप लोगों को शायद पता नहीं होगा व्यू क्या होता है लेकिन मैं आपको बताता हूं व्यू का मतलब कि वह सिर्फ उसी है तो मेमोरी लोकेशन में तो वहीं पर है बस उसको पॉइंट कर रहा है एक तरह से पॉइंटर की तरह आप तो समझ लो न्यूडी ऐप को न्यू डीएफ टू आपको पॉइंट कर रहा है न्यू डीएफ जहां पर भी कर रहा है वहां पर अब करना गया है आप लोगों यहां पर न्यू डीएफ टू अगर एक व्यू हुआ अगर न्यू डीएफ टू एक व्यू हुआ न्यू डीएफ का तो जहां जहां न्यू कर दिया था, मैं काम करता हूँ, 97835 कर देता हूँ यहाँ पर, ठीक है, newdf.copy हो गया, मैंने newdf2 को कर दिया, 00 को, 97835, अब newdf को print करूँगा, तो यहाँ पर नहीं है कि 97835, क्यों?

क्योंकि मैंने copy बना लिये, तो यह है copy, तो इसलिए data frame को अगर आप equal to और के नया बनाते हो, तो copy हमेशे नहीं बनती है, जब तक आप dot copy का इस्तेमाल ना करो, और यह warning कुछ उसी से related है. अब होता क्या है कि मान लो आप chaining कर रहे हो ठीक है आपने बोला कि इस data frame का ये, data frame के 0 का 0 का 0 इस तरह से आपने कुछ इस तरह से लिखा और आपने equate कर दिया उसको किसी value से, तब बीच में कहा view return होगा और कहा copy return होगी, कोई guarantee नहीं होती है कभी-कभी, आप लोगों ये track करन अभी भी हम सेट करते हैं किसी value को, तब हम लोग इस तरह से सेट नहीं करते हैं, हम lock function का इस्तेमाल करते हैं, जिसको loc, dot loc करके हम लोग लिखेंगे, तो यहाँ पर आप लोग करना क्या है, कुछ इस तरह से लिखना होगा, new df.loc, मालो मुझे 0,0 पर सेट करना है, row में 0, column में 0, मालो 654 करना है, तो new df.head, तो आप लोग देखो यहाँ पर 654 आ गया, अब यह एक string भी हो सकती थी, अगर यह string होती, यह वाला 0, यह वाला 0 है, और यह वाला 0, यह वाला 0 है, इसका नाम अगर कुछ और होता, मालो ABCD होता, तब यहाँ पर क्या होता, ABCD अगर मैं कर दू, मालो मैं new df.columns is equal to कुछ इस तरह से, मैं list of ABCDE, और अब new df को print करू, और यह बीसीडी हो गया मैंने इसलिए किया ताकि आप जीरो से कंफ्यूज नहीं हो जाए अब अगर मान लो मुझे इसको सिक्स 57 करना है न्यूडीएफ की पहली वाली को मैं डॉट हेड टू कर लेता हूं अब मान लो मुझे करना है तो इसलिए मैं वापस से आऊंगा यहां पर मैप करूंगा कि अ न्यूडीएप डॉट लॉक अ इसको ए कर दूंगा और 654 की जगह 650 को चाहिए कर दूंगा बड़ा नंबर एक लिखा है मैंने अब मैं इसको df.head करूँगा तो देखो यहाँ पर यह चेंज हो गया है ठीक है अब मैं चाहता हूं कि यार यह मैं ड्रॉप कर दूं ठीक है क्योंकि मुझे अच्छा नहीं लगा जीरो मैंने यहाँ पर अनेसेसारिली इसको मैंने डाल दिया यहाँ पर तो मैं करूँगा क्या मैं यहाँ पर लिखूंगा new df.drop और उसके बाद मैं यहाँ पर लिखूंगा और new df.drop 0 के साथ साथ मुझे यहाँ पर axis भी देना पड़ेगा, axis is equal to 1, और मैं axis is equal to 1 यहाँ पर दूँगा, तो देखो यहाँ पर, यह column में से हटाएगा, axis is equal to, अगर मैं नहीं दूँगा 1, तब क्या होगा, रो में से हटाएगा, ठीक है, तो axis बहुत important है, axis 1 का मतलब होता है column, axis 0 का मतलब होता है row, मैं new df.head करूँगा, तो आप लोग देखो यहाँ पर ABCDE ही आ रहा है और 0 से लेके 300 जितना में मैंने बताया था उतने इसमें मुझे याद नहीं है 300 something था not sure 334 था उतनी रूज आपकी आ गई हैं तो इस तरह आप लोग lock function का इस्तेमाल करके change कर सकते है values को अब होता क्या है कि कभी कभी आप लोग चाहते हैं कि कुछ set of columns आप लोग को मिले वो आप कैसे करेंगे आप लोग जिस तरह करो new df.loc और उसके बाद आपको करने के लिए करना कि एलो सी के बाद आप लोगों को इस तरह से लिखना मालों वन कॉमा टू लिख दूं यहां पर और यहां पर मैं लिख दूं सिर्फ सी कॉमा और डी मुझे सी और डी चाहिए तब मैं एंटर करूंगा तो मुझे यह सिर्फ वन टू रोज में देखा और सीडी कॉलम में देगा और यह क्या करेगा यह मुझे अगर इसको सेट करना है अपने पुराने वाले डाटा फ्रेम में तब यह न्यूडी एफ इसी को लिखना पड़ेगा इस तरह यह नहीं चलेगा मेरा न्यूडी अफ चेंज नहीं हुआ अगर मैं आप लोग को रन करके दिखाओ न्यूडी एफ डॉट है अ चेंज नहीं हुआ है मेरा new df पुराना का पुराना वैसे का वैसे ही retained है, तो यह क्या करता है, यह यहाँ पर एक copy को return कर रहा है, view को return, in place चेंज नहीं कर रहा है उसको, यह सिर्फ return कर रहा है एक नया data frame, ठीक है, आशा करता हूँ, clear हो गया होगा आप लोगों को, सारे के सारे रोज आ गईं, अगर यही मैं colon यहां लगाता, तो सारे के सारे columns मिल जाते हैं, one or two rows मिलती हैं, तो इस तरह से आप लोग कर सकते हो, ठीक है, आशा करता हूँ यह एकदम clear हो गया होगा आप लोग को, अब यहाँ पर मैं आप लोग को बताऊँगा कि किस तरह आप लोग, complex query जैसे database में run करते हैं, newdf.loc, आप लोग को यह square brackets खोलने हैं, newdf 0, और newdf 0 के बाद, आप लोग या करना है लिखना है लेस्ट देन जीरो पॉइंट टू जीरो पॉइंट थी रख देता हूं कि भाई जहां जहां पर रोज मेरी जीरो पॉइंट मैंने की मेरे जीरो पॉलम पर जीरो पॉइंट थी से कम आ रही है वैल्यू यहां पर इस वाले में और उसी के साथ सब मैं सिर्फ इतना भी आपको रन करके दिखाता हूं और यहां पर मुझे कुछ इशू मिल रहा है और मैं तो ये सारी rows मुझे यहाँ पर अभी मिल चुकी हैं और मैं आशा करता हूँ कि आप लोगों को ये समझ में आ गया होगा किस तरह ये काम कर रहा है अब मैं यहाँ पर क्या कर सकता था और complex query भी run कर सकता था मैं एक condition और लगा सकता था, और मैं कह सकता था कि new df c जो है वो बड़ा हो किस से, वो बड़ा हो 0.1 से, मैंने एक और condition लगा दी, अब मैं यहाँ पर करूँगा तो change हो गई, तो मेरा यह जो है 0.1 से बड़ा होना चाहिए, new df c, तो मुझे यहाँ पर वो सारी instances मिल गए हैं, तो अगर आप लोग के बारे में बताया उसी तरह एक आई लॉक भी होता है जिस तरह लॉक के बारे में बताया उस तरह आई लॉक भी होता है ठीक है तो एलोसी के बारे में आप लोग को बताया है कि आप लोग रो और कॉलम को उनके इंडेक्स का नाम और कॉलम के नाम से सेल और मैं कुछ इस तरह लिख दूँ, 0, 4, तब क्या होगा, यहाँ से गिनेगा 0, यहाँ से गिनेगा 0, 1, 2, 3, 4, और यह value मुझे print करके दे देगा, तो अगर मुझे index से गिनती करनी है, नहीं कि यहाँ से 0 से start करके गिनती करनी है, करनी है इसका नाम कुछ भी हो तब मैं आई लॉक यूज करूंगा लेकिन अगर मुझे गिंती करनी है किससे मुझे नाम अगर चाहिए गिंती नहीं करनी मुझे तिव नाम चाहिए तो एलोसी का इस्तेमाल करूंगा अब यह एबीसीडीए है यहां पर भी एबीसीडीए हो सकता था या फिर कोई और नाम हो सकता था लेकिन अब यहां बस जीडो कॉम वन है और भी है जीडो वन ट तो iLock का इस्तेमाल करें, अगर आप लोग को index से गिंटी करके value को target करना है, LOC का इस्तेमाल करें, अगर आप लोग को सीधा नाम डालना है, column का नाम, जो कि ABCD यहाँ पर है, 01 जो है row का नाम है, नाम यूज़ करना है तो lock, वरना iLock, that's it. तो मैं आप लोग को use करके दिखा देता हूँ एक चीज, अगर मैं आप बार new df.ilock करूँ, और मैं आप बार 0,1 कर दूँ, और फिर यहाँ पर मैं कर दूँ 1,2. तो मुझे कुछ इस तरह से view मिलेगा, 1,2 मेरा b और c है, 0 से गिनती करें, अगर आप यहाँ पर 0,1,2,b और c मिलेगा मुझे, और यहां से 0 और 1 को लें, फिर आप 0 और 5 को भी ले सकते हैं, आपकी मरजी रहेगी, वो यहाँ पर आपको मिल जाएंगे, अब यह नाम हैं अगर, महलो यहाँ पर Apple, Orange लिखा हुआ है, तब भी मैं यहाँ पर number use कर सकता हूँ, अगर मैं I log इस्तेमाल कर रहा हूँ, लेकिन log न्यूडीएफ डॉट हेड और यहाँ पर मैं थ्री लिख दूँगा न्यूडीएफ डॉट हेड थ्री लिखने से क्या हुआ तीन रोज मुझे दिख जाएंगी और उसी के साथ साथ मैं यहाँ पर अब क्या करूँगा मालों मुझे ड्रॉप करनी है एक रोज मालों यह मु� वन डू थी वोर फाइब सेवन बाकी जो है वह ऐसे दिखा रहा है नॉर्मली ठीक है अब अगर मान लो मुझे कॉलम ड्रॉप करना है तब मैं क्या करूंगा यहां पर लिख दूंगा एक्सिस इज इक्वल टू वन बाय डिफल्ड एक्सिस जीरो है एक्सिस इक्वल टू वन तो आप यहां पर देख सकते हैं, तो आप यहां पर देख सकते हैं, तो आप यहां पर देख सकते ��ैं, तो आप यहां पर देख सकते हैं, तो आप यहां पर देख सकते हैं, तो आप यहां पर देख सकते हैं, तो आप यहां पर देख सकते हैं, तो आप यहां पर देख सकते ह इस इकुल टू न्यू डीएफ डॉप एक हॉमां सी एक्सिस देखो लूंगा न कर दूं तब मेरा नया डाटा फ्रेम चेंज हो जाएगा ठीक है तो मैं अगर यहां पर एक हॉमां डी करूंगे सी वापस देखने को मिलेगा चुके अपनी ऑरिजिनल डाटा फ्रेम को हैं तो यह आप लोगों कर देना है ठीक है अब कोई-कोई डाटा फ्रेम के फंक्शन होते इसमें इन प्लेस नाम का एक ऑप्शन होता है अ अगर आप in place is equal to true यहाँ पर लिख दें, तब क्या होगा? तब new df अगर मैं यहाँ पर लिखूंगा, तो वो new df में originally उसमें जो है drop कर देगा, तो मेरा a और d जा चुका है, मैंने उड़ा दिया a और d, तो b, c और e बचा है भी मेरे पास सिर्फ, तो in place is equal to true लिखने से क्या होता है?

यानि कि मेरे original कोई modify कर दो, यह मतलब होता है in place is equal to true का. तो आप लोग drop कर सकते हो, किसी भी axis से, और आप drop कर सकते हो, मालों मैंने drop कर दिया, axis is equal to 0 से, ठीक है, 1,5 को drop कर दिया, और अब मैं new df करूँगा अगर, shift enter, तो यह देखो यहाँ पर जा चुका है 1 और 5, 0 और 2 आ गया, अब मालों मुझे लगता है कि यार मुझे इसकी जो तब एक function होता है, मैं यहाँ पर head लिख रहा हूँ इसलिए, ताकि मुझे सिर्फ कुछ rows दिखें, head 3 लिख रहा हूँ, ताकि यहाँ पर space आ जाए, एक बात है new df, यानि किसी भी data frame में, dot, reset underscore index अगर आपने कर दिया, ठीक है, तब क्या होगा, यहाँ पर reset index करने से, 0 से चलू हो जाएगी index, लेकिन यह क्या करता है न, index नाम का, तब मैं करूँगा क्या, तब मैं drop is equal to true लिख दूँगा, ठीक है drop is equal to true लिखने से क्या होगा वो जो index का आ रहा था बनके column वो नहीं आएगा और मैं यहाँ पर in place is equal to true भी कर दूँगा ठीक है अब मैं new df.head करूँगा तो यहाँ पर देखो मेरा reset हो चुकी index वापस से तो इस तरह आप लोग क्या कर सकते हैं index को reset कर सकते हैं 0 से start होगी और जितनी rows होंगी उसकी minus 1 तक जाएगा यानि कि 0 से 5 तक जा रहा है तो मतलब 6 rows है ठीक है अब उसी के साथ साथ एक is null नाम का function होता है, in fact, data frame के बारे में एक चीज़ अब आपको बताओंगा यहाँ पर, basic सिर्फ इतना ही है, ठीक है, जिस तरह मैंने reset index बताया आप लोगों को, जिस तरह मैंने आप लोगों को head बताया, lock और i-lock का concept थोड़ा important था, लेकिन, most of the cases में, you should be good, चालू हो सकते हैं, access आ गया समझ में आपको क्या drop करना है, कैसे, तो आप लोग जो है अपना काम कर सकते हैं, CSV वगरा तो मैंने वीडियो के starting में बता दिया था, अब आपको कोई भी काम करना है, तो आप how to लिख सकते हैं यहाँ पर, जैसे मालू मुझे यहाँ पर लिखना है, how to remove nulls from pandas, DF, तो dropn function में यहाँ पर example देखके इसका use कर लूँगा, अच्छा, तो यहाँ पर यह data frame इन्होंने sample बनाया, df ऐसा दिखता है, इनका इन्होंने dropn किया, तो जहाँ जहाँ इनके ns थे, वो जा चुके हैं अब इनके, ठीक है, तो सिर्फ एक इनकी row बची, तो इस तरह से आप आप कितने भी functions है जितने भी एक एक करके सब को देख सकते हैं कोई भी आपको functionality चाहिए पांडा से आप सर्च करने हैं हाउ टो डू दिस पर पांडा और आप लोगों पता चल जाएगा जैसे ड्रॉप डूप्लिकेट जाएगा मैं लिखूं हाउ टो रिमूव डूप्लिकेट इन पांडा स्टेट ऐसे लिख दिया मैंने है तो क्या होगा यह पता को ड्रॉप डूप्लिकेट्स आ गया मेरे पास मैं दोक्यूमेंटेशन यह आप लोग खोलें और लेटेस्ट वर्जन खोलें जो भी चल रहा है इन फैक्ट यह तो आपका होता क्या है कि जब भी आप लोग यूज करें पुराने फंक्शन भी बहुत ही कॉमन है उसमें ऑलमोस से होता है क्रॉस वर्जन लेकिन तब भी नया जो जो भी वर्जन उसी की documentation देखें और मैं कहूँगा नया version ही इस्तेमाल करो वापस आओगा notebook मैं लिखूँगा यहाँ पर new df और यहाँ पर मैं लिख दूँगा new df का b और मैं यहाँ पर dot is null function का इस्तेमाल करूँगा यह क्या करता है यह यहाँ पर मुझे return करता है वो सारी values जहाँ जहाँ पर यह null है तो जहाँ पर भी true आएगा वहाँ पर यह zero है ठीक है एक और चीज आप लोगों को बताना चाहता हूँ, मालों मुझे ना बी में सारे ना जीरो करने है, ठीक है, या बिल्कुल मालों नन करने है, तब मैं क्या करूँगा, तब मैं यहाँ पर करूँगा new df b is equal to none, तो अगर मैं यहाँ पर करूँगा new df b is equal to none, और मैं new df को इसक तब क्या होगा यहाँ पर यह सारे मिनट मुझे true दिखाएगा अब यहाँ पर आप इस तरह set कभी ना करें एलोसी की मदद से करें और डॉट एलोसी करें आप और उसके बाद आप कुछ इस तरह से कर दें आप कहें कि मुझे कॉलम सारी रोज में और बी कॉलम में नन करना है और इस तरह आप लोग करोगे और उसके बाद यहाँ पर मुझे कुछ इशू आ गया है और मैं देखता हू तो आप लोग देखो यहाँ पर मुझे नन नन नन मिल गया, अगर मैं इसको मान लो 56 भी करके रन कर दूं तो यहाँ 56 हो जाएगा, तो यह सही तरीके है, LOC का इस्तेमाल करें, आप लोग कभी भी इस तरह directly set ना करें value को, क्योंकि कभी होगी, कभी नहीं होगी, जब आप chaining क इस्तेमाल करना है यह बात आप लोग एक गांठ बांधे कि एलोसी ही इस्तेमाल करना है सेटिंग करते समय या फिर आई एलोसी तो इस दरहां आप लोग कर सकते हैं इस चीज का इस्तेमाल मैं यहां पर इसको कोई वाल्यू देता हूं 34 और यहां पर सिम्मी में डॉट हैड कर देता हूं अ ताकि मुझे दिख जाए मेरा data frame, तो इस तरह से मेरा भी data frame है, अब मैं यहाँ पर करूँगा क्या, यहाँ पर आराम से आप लोगों को कुछ और functions के बारे में बताओंगा, तो एक काम करते हैं न, एक नए डाटा फ्रेम बना लेते हैं, मैं एक काम करूँगा, मैं बनाऊंगा df is equal to, और मैं आपको लिखूँगा pd.data frame, यहाँ एक काम करूँगा कि पैंडाज की documentation से ही copy कर लूँगा, तो मैं simply इसको यहाँ से copy करूँगा, और यहाँ पर मैं इसको paste कर दूँगा, तो मैंने df is equal to यह लिखा, और ये सारे मैं हटा देता हूँ यहाँ से फालतो की lines अब मैं यहाँ पर shift enter दबाता हूँ df यहाँ पर लिखकर dot head करूँगा अगर तो मुझे यहाँ पर दी जाएगा पूरा df उसी के साथ साथ अगर मैं यहाँ पर लिखूँगा drop any तो आप लोग देखो कि जहां जहां NA था कहीं भी इसने drop कर दिया है, तो यहाँ पर आप लोग देखो, मैंने यहाँ पर यह function देखा और चला दिया, ठीक है, अब यह क्या कह रहा है, यह यहाँ पर कह रहा है कि आप यहाँ पर क्या क्या चीज़े कर सकते हो, determine if row or column is removed from data frame, when we have at least one NA or all NA, तो any, if any, any values are present, drop that row or column, all, if all values are NA, drop that row or column, जो डिफॉल्ट है वो एन है तो मैं काम करूंगा यहां पर करूंगा क्या यहां पर हॉइस इकल टू ऑल कर दूंगा तो मैं यहां पर हॉइस इकल टू ऑल कर दूंगा और यहां पर देखो जब तक सारे के सारे एन ही नहीं होगी तब तक वह रो और कॉलम रिमूव नहीं होगा ठीक है अब मान लो मैं यहां पर क्या करूं बैट मोबाइल की जगह क्या कर और उसी के साथ साथ bullwhip के जगह भी np.nan कर दूँ, np.nan, और यहाँ पर df.head को जैसा दिख रहा है, और how is equal to all मैंने करा, तो यहाँ पर column removal के लिए मुझे axis is equal to 1 भी रिखना पड़ेगा, तो axis is equal to 1 कर देता हूँ यहाँ पर, और अब मैं इसको run करूँगा, drop any function कर, इस्तेमाल कर सकता हूँ, अब मान लो मुझे duplicates remove करने है, ठीक है, by the way, एक बात बताना चाहूँगा आप लोगों को, df.head करूँगा, तब अभी भी यही मिलेगा मुझे, क्योंकि मैंने यहाँ पर क्या किया है, मैंने यहाँ पर सिर्फ change जो किया है, मैंने यहाँ पर वो क्या किया है, मैंने यहाँ पर अपने original data frame को change नहीं किया है, एक जाक्टली सेम चीज मैं क्या करूँगा, मैं copy कर दूंगा ठीक है, तो मैं एक काम करता हूँ यहाँ पर duplicates, मैं एक काम करता हूँ यहाँ पर nan-nan-nan मेरे duplicates ही हैं, तो मैं इसको इस तरह रखता हूँ, और आप लोग देखो यहाँ पर nan यहाँ पर है, और मैं Alfred, यहाँ Catwoman की जगह Alfred कर देता हूँ वापस से, तो जहाँ मेरा Catwoman है वहाँ पर Alfred कर दिया मैंने, मैं यहाँ पर कुछ इस तरह लिख दूँ, drop duplicates, तो मैं इसको copy करूँगा, drop underscore duplicate से sorry, drop underscore duplicate से, और मैं यहाँ पर इसको हटा दूँगा सारे parameters को, अब आप लोग देखो यहाँ पर, drop duplicate मैंने किया यहाँ पर तो कुछ नहीं हुआ, लेकिन अगर मैं यहाँ पर axis is equal to 1 कर देता हूँ, तब मुझे error मिलेगा, क्योंकि यह axis parameter नहीं लेता, यह axis is an argument लेता नहीं है, तो मैं यहाँ पर subset दूँगा इसको, ठीक है अब नीम मेरा small n है तब यहाँ पर इसने क्या किया नेम में से duplicate को remove कर दिया ठीक है अब मैं यहाँ पर अगर keep is equal to यहाँ पर इसनों ने एक argument दिया कि first यहाँ पर last हो सकता है अगर आपने false कर दिया तो यह कुछ रखेगा नहीं अगर आपने first किया तो पहला वाला record रखेगा पहली row आपकी रखेगा लास्ट आपने कर दिया तो आपकी लास्ट वाली रो रखेगा तो स्टार्ट करना चाहूँगा keep is equal to first से keep is equal to first तो by default होता ही है तो कुछ नहीं हुआ लास्ट करूँगा तो देखो Alfred ये वाला टू वाला आ गया मेरा और उसी के साथ अगर keep is equal to मैंने false कर दिया तब यह रिकॉर्डी पूरा गाया हो जाएगा ठीक है तो इस तरह से आप लोग यह कर सकते हैं डिफिकेट्स का इस्तेमाल कर सकते हैं अब यहां पर मैं आप लोगों को बताऊंगा कुछ और फंक्शंस के बारे में नमपाई के और काफी फंक्शंस देता फंक्शनालिटी लिमिट एंडलेस है लेकिन उसके बावजूद भी मैं आप लोगों को कुछ अगर मानों आपको डाटा सेट दिया है ठीक है उसको इंस्पेक्ट किस तरह करना है दिए प्रोट्ट हेड में आप लोगों को बताया दिए प्रोट्ट टेल में आप लोगों को बताएं डिए प्रोट्ट डिस्क्राइब बताया आप डिए प्रोट्ट शेप भी कर सकते हैं बता रहा है शेप तीरों थी कॉलम्स यह शेप होता है उसी के साथ दिए प्रोटिन फॉर आप करोगे यह मैथड होता है तो आप लोग इसको यहां पर जैसे डिएप टोट इनफोर्ट उसके बारे में काफी चीजें आ जाएंगी कि कौन सी क्लास को यह बिलॉंग करता है फिर उसके बाद क्या-क्या इसमें कॉलम्स है तो और आप कर सकते हो जिस तरह से dot value और underscore count, so मैंने यहाँ पर क्या किया, टाब दबाए, और आप लोग देखो यहाँ पर यह calculation कर रहा है, कुछ मेरे लिए सारे के सारे, जो भी recommendations हैं वो fetch करेगा, तो देखो value counts मैं use कर लूँगा, और, उसी के साथ साथ यहाँ पर drop n a is equal to false लिख दूँगा मैं यहाँ पर और drop n a is equal to false लिखने से क्या हो यह मुझे unique count दे रहा है n a को हटा दो n a को मत गिनो यह मतलब है तो अगर मान लो मैंने यह नहीं लिखा होता है यहाँ पर टॉइ के ये मुझे कितने दे रहा है मैं यहाँ पर नेम में काम करता हूँ टॉइ लिखता हूँ यहाँ पर ठीक है टॉइ में ये मुझे तीनों के 111 दे रहा है ठीक है अब यहाँ पर मैं क्या करूँगा dropna is equal to true कर दूँगा यहाँ पर तो यह 11 मुझे सिर्फ दे रहा है तो dropna is equal to false करने से क्या होगा na को मत हटाओ ठीक है यह फॉल्स एंड ट्रू करके आप हटाओ या ना हटाओ का जो है कमांड दे सकते हैं तो यह होता है हमारा simple सी जीज़ ठीक है आशा करता हूँ आप लोग क्लियर हो गई होगी LOC, ILOC बात कर चुके हैं अलड़ी हम जिस तरह मैंने is null के बारे में बताया उस तरह not null भी होता है और यहाँ पर जहां जहां null नहीं है वहाँ true होता है और जहां पर null है वहाँ false हो जाता है इस तरह से true false और false वह यहाँ पर इसको आप इस्तेमाल कर सकते हो अब मैं आप आप लोगों को एक quiz देना चाहता हूँ, और आप लोगों करना क्या है, एक data frame बनाना है, मैं चाहता हूँ कि सब लोग इस quiz का answer नीचे comment में देंगे मुझे, मैं आप लोगों को quiz दे रहा हूँ, create a data frame which contains only integers with three rows and two columns, ठीक है, आप लोगों को ये करना है, और ये करन आप लोगों को यह डाटा फ्रेम के मेथड्स को रन करना है ठीक है नंबर एक है डिएफ डॉट डिस्क्राइव डिएफ डिस्क्राइव करना है डिएफ डॉट मीन आप लोगों को करना है डिएफ डॉट कॉल आप लोगों को करना है डिएफ डॉट काउंट आप लोगों को करना है डिएफ डॉट मैक्स करना है डिएफ डॉट मिन करना है और उसी के साथ साथ आप लोग क्या करना है डिएफ डॉट मीडियन और डिएफ डॉट स्टीडी भी कर लेना है यह सब स्टाटिस्टिक्स के अ आप लोग किस तरह अपने डाटा स्टाइटिस्टिकल एनालिसिस कर सकते हैं यह इन पंग्यों के द्वारा आप लोग कर सकते हैं तो जाता हूं सब लोग रन करें इसको और अभी मैं अगर इस तरह से रन कर दो अपने लिए तो पता नहीं कि मुझे रिटर्न करा डाटा फ्रेम मनाएं और उसके बाद यही एक्सरसाइज दोबारा से उस डाटा फ्रेम के लिए रिपीट करें अ है तो अब हम लोग क्या करेंगे हम लोग देखेंगे एक्सेल शीट को किस तरह हैंडल करना पैंडास की मदद तो मैं यहां पर क्या करूंगा पैंडास रीड एक और मुझे function मिल जाएगा read excel तो आप लोगों सिंपल एक google search करना है और इस page पर आ जाना है क्योंकि मैं कभी आप लोगों को यह नहीं बोलूंगा कि आप लोगों को यह सब चीज़े याद रखनी है लेकिन आप लोगों को understanding होनी चाहिए कि क्या होता है आपका जैसे ही log और i log की बात करें view और copy की बात करें वो सब चीज़े आप लोगों को आनी चाहिए मैं कभी आप लोगों से नहीं बोलूंगा कि कौन कौन से functions में क्या क्या parameters होते हैं नहीं यह सब आप लोगों को याद नहीं रखना है देखाऊंगा मैं आपको यह भी बताऊंगा फंक्शन कहां से आ रहे हैं तो यह पैंडा इसकी डॉक्यूमेंटेशन से आया यह खुल गया अब मुझे गरना गया एक्सल चीज बनानी है तो मैं यहां पर आ जाऊंगा और मैं काम करता हूं इस हैरी एसवी को खोलता हूं और आप लोग खोल रही है बड़ा कि इसको मैंने और अब मैं यहां पर करूंगा क्या फाइल में जाऊंगा इन वेडियो में काम करता हूं एक शीट वन शीट नाम से दो शीट बना लेता हूं अ ठीक है और इसका नाम में शीट वन रख देता हूं इसको मैं डिलीट कर देता हूं इन फैक्ट में हैरी वाली शीट को शीट वन पुकारना चाहता हूं है और यह वाली शीट को मैं डिलीट करता हूं ठीक है एक्सल चलाना सबको आता है और नहीं भी आता है तो कोई बड़ी चीज नहीं है एक्सल चलाने में ठीक है कंट्रोल माइनस किया मैंने इसको अब मैं करूंगा कि यहां पर कॉपी करूंगा और यहां पर इसको क्या करूंगा यहां पर काम करता हूं इस ट्रेस्ट लिख देता है यह पर ठीक है कि पता चल जाएगी शीट में से बाकी रिटा में सेम रख रहा हूं थोड़ा सा डिफरेंट करते तो ऐसी बात है तो अ तो यह तो रहा है जिसके दादा कुछ चेंज नहीं किया डेटा में योगी मैं सिर्फ आप लोगों को एक डेमोंस्ट्रेशन देना चाहता हूं डेमो दिखाना चाहता हूं किस तरह एक्सएल को इस्तेमाल करना है तो मैं इसको सेव करूं सिंपली है मैं आपको यह करूंगा इसको ऐसे एक्सेल सेव करूंगा ब्राउस पर क्लिक किया मैंने यहां पर और इसको मैं सेव कर देता हूं यहीं पर और इसका नाम में रख देता हूं एक्सेल के नाम से इसको सेव कर रहा हूं ठीक है और इन एक्सेल के नाम से नहीं करता हूं मैं डाटा के नाम से सेव कर देता हूं अ डेटा के राम से मैंने इसको सेव कर दिया, अब मैं इस workbook को बंद कर देता हूँ, तो data.excel.sx मेरे पास एक workbook है, अब मैं अपनी notebook में जाओंगा, और यहाँ पर लिखूँगा, data is equal to pd.readexcel, एक्सेल डाट एक्सेल से और मैं इसके बाद यहां पर कहा है कि मॉड्यूल नोट फाउंड एरर यह क्या रहा है एक्सेल आर्डी तो यह आता है आप लोगों का जब आपके वस्तेब एक्सेल आर्डी मॉड्यूल नहीं होता है और पैंडा इसको खोलेंगे और फटक से एक पेप इंस्टॉल मारेंगे एक्सेल आर्डी का अ ए शिंपल सा पेप इंस्टॉल एक्सल आर्डी देट सेट तो अगर आप इस टाइम देता डाउनलोड होने में और जल्दी से हो जाता है लेकिन हो गया इंस्टॉल कोई ज्यादा बड़ा काम नहीं हुआ बट एगेन यहां पर आप लोग को एक बार यह करने बाद आपको एरर नहीं आता है और यह यहां पर इसने मेरी पहली वाली श मान लो मैं चाहता हूँ sheet2 को read करना, तब मैं यहाँ पर क्या करूँगा, मैं लिखूँगा comma sheet name is equal to, मैं यहाँ पर in fact देखूँगा, मैं ऐसे नहीं लिखूँगा, मैं यहाँ पर देखूँगा कि किस तरह मैं sheet का नाम यहाँ पर दे सकता हूँ, sheet underscore name है, sheet underscore name लिखूँगा, मै शीट टू करूंगा तो देखो यह S2 S2 मैंने लगाया था याद है तो शीट टू रीड हो गई इस तरह मैं multiple sheets को रीड कर सकता हूँ और मैं multiple sheets मैं write भी कर सकता हूँ ठीक है तो क्या करूँगा मैं pandas का 2xl google करूँगा इन फैक्ट मैं करूँगा क्या कि यहीं से see also में देखूंगा 2xl और यहाँ पर यह लिंक नहीं है लेकिन तब भी मैं एक काम करता हूँ इसको सर्च कर लेता हूँ 2xl और pandas ही गुलता है most of the times तो यहाँ पर आप लोग देख सकते हैं, 2XL का एक example भी दिया हुआ, और किस sheet में आप लिखना चाते हैं, वो भी आप दे सकते हैं, तो मान लोगी मैं क्या करना चाता हूँ, मैं इस data frame खुद change करना चाता हूँ, मैं लिखूँगा data.ilog, और मान लोग मैंने इसके बाद यहाँ पर लिख दिया, 0,0, और is equal to मान लोग मैंने 34 कर दिया, लिखे, और मैं data.2XL कर सकता हूँ, है और मैं एक्जैक्ट्री सेम चीज दे दूंगा यहां पर मैं खूंगा कि डेटा और एक्सल सेव कर दो इसको शीट टू के अंदर और यह कहा है मॉडी नोट पाउंड एरर और अभी क्या प्रॉब्लम आ गई तो ओपन पाइएक्सल चीज होता है तो राइट करने के लिए और मैं आपको करूंगा क्या पावरशल में जाऊंगा फटाक से पेप इंस्टॉल मार� टाइम नहीं लेगा जैसे कि एक्सएल आर्डी हो गया था अच्छे बच्चे की तरह ओपन पाइक्सएल भी हो जाएगा तो यह स्टॉल हो रहा है डाउनलोड हो गया यह अपना काम करेगा और आराम से स्टॉल हो जाएगा ऑल राइड सो यह स्टॉल अभी भी हो रहा है तो बेसिकली आपको इसकी जिस समझ में आगे कि आधे को हो गया इंस्टॉल ठीक है अब मैं यहां पर क मुझे वो error नहीं देगा जो कि ये पहले दे रहा था, ये write कर रहा है उस excel sheet में जाकर, अब उस excel sheet को अगर मैं खोलूं तो मुझे sheet 2 के अंदर पहला cell जो है वो 34 दिखना चाहिए, तो ये देखो यहाँ पर 34 दिखरा है, ठीक है, अब एक गर्बड हो गई यहाँ पर, sheet 1 मेरी करना पड़ेगा इसे कि मैंने आप लोगों भी दिखा है यहां पर तो आप लोग एकदम समझ चुके हैं और मैं आशा करता हूं कि यह पैंडास का डिटो आप लोगों बहुत अच्छा लगा होगा और अगर आप लोगों ने नमपाई का नहीं देखा टूटोरियल जरूर इसको देखें और मैं चाहता हूँ कि ज़्यादा से ज़्यादा लोग मैं जो ही मेहनत कर रहा हूँ आप लोग के लिए बना रहा हूँ वीडियो उसका बेनिफिट ले पाएं इसको शेयर करें वीडियो को इस वीडियो को लाइक भी जरूर करें अभी के लिए इस वी प्रस्तुति प्रस्तुति