Transcript for:

आप किसी कंपनी में काम कर रहे हैं और कंपनी आपको एक डटा प्रोवाइड करती है और कंपनी आपसे पूछती है कि किस महीने के अंदर हमारी सेल्स सबसे कम हुई है और आप उस डाटा के अंदर से आप एक इंसाइट्स को निकालते हैं मतलब आप कंपनी को यह बताते हैं कि किस महीने के अंदर हमारी सेल्स सबसे कम हुई है जी हां डटा साइंस के अंदर आप क्या करते हैं कि किसी भी डाटा के अंदर से उसके अंदर मीनिंगफुल इंसाइट्स को निकालते हैं और इस मीनिंगफुल इंसाइट्स को निकालने के लिए आप डिफरेंट डिफरेंट ऑपरेशन को लगाते हैं ये डिफरेंट डिफरेंट ऑपरेशन डिफरेंट डिफरेंट पाइथन के मॉड्यूल से किया जाता है बिल्कुल डटा साइंस के अंदर हमारा काम होता है डाटा की एनालिसिस करना और उसके अंदर से मीनिंगफुल इंसाइट्स को निकालना यदि आज के टाइम के अंदर सबसे ज्यादा आईटी की ट्रेंडिंग फील्ड के अंदर बात करें तो वो है डाटा साइंस और इस चीज को सीखने के लिए आपको जरूरत पड़ती है कुछ कांसेप्ट की जैसे कि डेटा साइंस की मैथमेटिक्स मशीन लर्निंग डीप लर्निंग डेटा क्लीयरिंग इस कंप्लीट प्लेलिस्ट के जरिए हम यहां पर डाटा साइंस को कंप्लीट सीखने वाले हैं बिगनर टू एडवांस लेवल तक तो इस कंप्लीट प्लेलिस्ट के जरिए हम इन सारी चीजों को कवर अप करेंगे ताकि आप एक बहुत अच्छे डाटा साइंटिस्ट बन सकें यदि आपको पाइथन मशीन लर्निंग डाटा साइंस एंड डेटा एनालिस जैसी फील्ड में अपने आपको को ग्रो करना है तो इसके लिए डब्ल्यू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टूडे फ्री क्लासेस ले सकते हैं और आज के इस वीडियो के जरिए हम बात करेंगे पॉपुलेशन एंड सैंपल के बारे में देखिए गाइस पॉपुलेशन डाटा कब कहा जाता है किसी डेटा सेट को तो देखिए जब भी आप कोई डेटा सेट ले रहे हैं यस किसी भी तरह का डेटा सेट है उसके अंदर चाहे आपके पास 10 रो हो चाहे 10000 रो हो या 1 लाख रो हो भले कितने भी लो हो सकते हैं यहां पर यदि वो एनटायर डटा यदि आप कैप्चर कर रहे हैं तो उसको हम बोलते हैं पॉपुलेशन डाटा यस उस डेटा सेट का नाम क्या है गाइज यहां पर पॉपुलेशन डाटा कहा जाता है लेकिन यदि हमारे पास जो डेटा सेट है मतलब जितने भी डेटा सेट हैं उस डेटा सेट में से हम कुछ पार्ट ऑफ डाटा निकाल ते हैं मतलब मेरे पास देखिए 10000 रो है उस 10000 रो में से मैंने क्या किया रैंडम क्या किया 5000 रो निकाल दी राइट या फिर 5000 डाटा निकाल दिया तो दैट डाटा इज कॉलिंग ऑफ सैंपल डाटा यस सैंपल डाटा क्या होता है गाइज यहां पर पॉपुलेशन डाटा का एक सबसेट होता है सबसेट मतलब उसी का एक पार्ट होता है दैट इज कॉल सल डाटा तो किस सिनेरियो के अंदर हम पॉपुलेशन डाटा इस्तेमाल करते हैं और किस सिनेरियो के अंदर हम सैंपल डाटा इस्तेमाल करते हैं अब हम इसे डिटेल के साथ समझेंगे तो सबसे पहले हम यह जानते हैं कि भाई पॉपुलेशन डाटा क्या होता है तो देखिए पॉपुलेशन डाटा उस डाटा को बोलते हैं जिसके अंदर आपके पास जो भी आपका डाटा दे रखा है उस एंटायस इज कॉल ऑफ पॉपुलेशन डाटा राइट इस पॉपुलेशन डाटा के ऊपर हम बहुत सारे पैरामीटर्स निकाल सकते हैं जैसे कि मीन स्टैंडर्ड डिवीजन पॉपुलेशन मीडियन परसेंटाइल्स वगैरह बहुत कुछ चीजें यहां पर निकाली जा सकती है लेकिन अब बात करी जाती है कि पॉपुलेशन डाटा कब इस्तेमाल किया जाता है तो देखिए जब भी आपके पास लार्ज अमाउंट ऑफ डाटा हो तो आप उसमें पॉपुलेशन डाटा इस्तेमाल नहीं करेंगे जब आपके पास बिग डाटा हो तब आपको एनालिसिस करनी है तो आप पॉपुलेशन डाटा का इस्तेमाल नहीं करेंगे उस समय आप सैंपल डाटा का इस्तेमाल करेंगे जब आपके पास स्मॉल अमाउंट ऑफ डाटा हो जहां पे आप एनालिसिस बहुत अच्छे से कर सकते हैं आपका सिस्टम कैपेबल है उस एनालिसिस को करने के लिए तो वहां पे आप पॉपुलेशन डाटा को इस्तेमाल करेंगे मतलब सिंपल सा ये है गाइस यहां पर कि यदि आप आपके पास स्मॉल अमाउंट ऑफ डाटा है तब आप क्या करेंगे पॉपुलेशन डाटा को इस्तेमाल करेंगे लेकिन इन केस यदि आपके पास लार्ज अमाउंट ऑफ डेटा सेट है और उसके अंदर से आपको क्या करना है आपको चीजें निकालनी है मतलब आपको चीजें फाइंड आउट करनी है उसमें कुछ एनालिसिस करनी है तो वहां पे पॉपुलेशन डाटा काम नहीं लेना है क्यों क्योंकि यदि आपने लार्ज अमाउंट ऑफ डेटा सेट के साथ काम किया तो बेसिकली उस डाटा सेट के ऊपर आपका परफेक्टली काम नहीं हो पाएगा मतलब बेसिकली गाइज यहां पे बात करूं तो आप यहां पर बहुत ही फास्ट वे में उसका काम नहीं कर पाएंगे तब आपको क्या इस्तेमाल करना पड़ता है सैंपल डाटा सैंपल डाटा क्या होता है गाइस यहां पर कि आपका जो भी पॉपुलेशन डाटा है उस पॉपुलेशन डाटा का एक सबसेट होता है मतलब एक पार्ट होता है यहां पर अब ये पार्ट आप चाहे तो रैंडम कलेक्ट कर सकते हैं आप चाहे तो सीक्वेंस कलेक्ट कर सकते हैं या फिर आप चाहें तो आप एक कोई पैटर्न या सीक्वेंस के अनुसार यहां पर कनेक्ट कलेक्ट कर सकते हैं अब आपके पास जो पॉपुलेशन डेटा है उसमें से आपने क्या किया छोटे-छोटे छोटे-छोटे कुछ डेटा आपने निकाल लिए दैट इज कॉल ऑफ सैंपल डाटा ये आपके पास क्या गलता सैंपल डाटा और फिर आप क्या करते हैं इसके ऊपर एनालिसिस करते हैं राइट तो यह आपके लिए थोड़ा सा इजी रहता है इजी टू कन्वेनिएंट रहता है आप इसमें आराम से काम कर सकते हैं और चीजों को एनालिसिस कर सकते हैं अब किस समय किस सिचुएशन के अंदर इसको इस्तेमाल करना चाहिए जरा उसको समझते हैं एक एग्जांपल के थ्रू लेट्स सपोज मैं आपको बोलूं कि आप इंडिया के अंदर यस आपके पास जो भी इंडिया का डाटा है यहां पर इंडिया के अंदर बहुत सारे लोग रहते हैं ठीक है इंडिया के अंदर जाके आप क्या करें उनकी एवरेज एज फाइंड आउट करें अब एवरेज एज इंडिया की फाइंड आउट करनी है तो उसके लिए क्या करना चाहिए मुझे पॉपुलेशन डटा पे काम करना चाहिए लेकिन पॉपुलेशन डेटा पे काम करना थोड़ा सा डिफिकल्ट होता है क्यों क्योंकि देखिए इंडिया की जो आपके पास यहां पे पॉपुलेशन है उस पॉपुलेशन के हिसाब से यदि मैं पॉपुलेशन कौन सी मैं यहां पे पीपल की बात कर रहा हूं यहां पर नॉट अ पॉपुलेशन डाटा की बात कर रहा हूं यहां पर यस इंडिया की जो पॉपुलेशन है मतलब आपके पास यहां पर बात करें हिंदी में जन संख्या जितनी भी है यहां पर ठीक है उनके ऊपर जाके यदि मैं एनालिसिस करूं कि उनकी एवरेज एज क्या है तो ये मेरे लिए थोड़ा डिफिकल्ट हो जाएगा और इसको कैलकुलेट करने में मुझे बहुत ज्यादा यूज ऑफ टाइम लगने वाला है राइट इसकी जगह मैं क्या करूं यहां पर कि इंडिया के अंदर जितनी भी हमारी पॉपुलेशन है उस पापुलेशंस में से कुछ-कुछ पापुलेशंस को मैं यहां पर सेलेक्ट करूं यस कुछ-कुछ पॉपुलेशन को मैं सेलेक्ट करूं और पॉपुलेशन को सेलेक्ट करने के बाद में उसकी एनालिसिस करूं यहां पर उनके एज की एनालिसिस करूं तो दैट इज अ इजी यस ये मेरे लिए इजी रहेगा इजी टू कन्वेनिएंट रहेगा हम आराम से इसके ऊपर क्या कर सकते हैं वर्किंग कर सकते हैं तो यहां पर बात करें कि यह जो सैंपल डाटा है राइट इस सैंपल डाटा पे काम करना आसान है और आज की इस वीडियो के जरिए हम बात करेंगे स्टैटिक्स के बारे में देखिए डेटा साइंस के मैथमेटिक्स के अंदर यस डेटा साइंस की जो मैथमेटिक्स है जो कि बहुत ज्यादा यूजफुल होती है वो चाहे आप मशीन लर्निंग में इस्तेमाल करें या फिर डेटा साइंस में इस्तेमाल करें या फिर डीप लर्निंग में इस्तेमाल करें कहीं पे भी आप इस्तेमाल करें तो वहां पे जो मैथमेटिक्स जो बहुत ही ज्यादा यूजफुल होती है उनके बारे में आज हम यहां पर डिस्कस करने वाले हैं और उसी के अंदर जो सबसे इंपोर्टेंट पार्ट होता है हमारा वो होता है हमारा स्टैटिक्स का यस स्टैटिक्स वन ऑफ द मोस्ट इंपॉर्टेंट चीज है डटा साइंस की मैथमेटिक्स के अंदर तो आज की इस वीडियो के जरिए हम स्टैटिक्स को डिटेल के साथ देखने वाले हैं राइट तो सबसे पहले स्टैटिक्स को देखने से पहले यदि आपने हमारे पॉपुलेशन एंड सैंपल वाला वीडियो नहीं देखा है तो प्लीज पहले उस वीडियो को जरूर जाके देखें क्योंकि वहीं से आप स्टैटिक के डिफरेंट डिफरेंट पार्ट्स को समझ पाएंगे यदि आपको पाइथन मशीन लर्निंग डेटा साइंस एंड डेटा एनालिसिस फील में अपने आपको को ग्रो करना है तो इसके लिए स् कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपने स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो बेसिकली मैं आपको यहां पर रिकमेंड करूंगा कि पहले आप पॉपुलेशन और सैंपल चीजों को देखें अब बात करते हैं व्हाट इज अ स्टैटिक्स स्टैटिक्स है क्या तो देखिए स्टैटिक्स को यदि मैं सिंपल सेंटेंस के अंदर यहां पर क्लियर करूं या फिर सिंपल से वे के अंदर मैं आपको बताऊ हूं यहां पर कि स्टैटिक्स क्या है तो स्टैटिक्स आपके पास क्या है कि किसी भी तरीके का जो डाटा है उस डाटा के अंदर से से इंफॉर्मेशन निकालने को हम स्टैटिक्स कहते हैं मतलब सिंपल सा है कि यदि आप कोई डेटा सेट यहां पर इस्तेमाल करते हैं चाहे वो एक्सेल फॉर्मेट में हो चाहे वो एसक्यूएल फॉर्मेट में हो एक बार आप उस डाटा को लेके आते हैं उस डाटा के अंदर बहुत सारे कॉलम्स होते हैं यदि आप उन पर्टिकुलर कॉलम के अंदर आप एनालास करना चाहते हैं किस तरह के एनालिसिस करना चाहते हैं तो वहां पे आप बहुत सारी तरह के एनालिसिस कर सकते हैं कि उस डाटा का एवरेज स्कोर क्या है उस डाटा के अंदर सबसे ज्यादा रिपीटिंग डाटा कौन सा है उस डाटा के अंदर आपके पास डाटा नॉर्मल डिस्ट श है या नहीं है राइट उसका रिलेशन किस डाटा के साथ है ऐसी बहुत सारी मैथमेटिकल एनालिसिस जब आप करते हैं किसी डाटा के ऊपर तो उस पूरे प्रोसेस को या फिर उस सिस्टम को हम क्या बोलते हैं गाइज यहां पर स्टैटिक्स बोलते हैं यस तो स्टैटिक्स क्या है यहां पर सेट ऑफ मैथमेटिकल क्या है मेथड्स है यस या फिर आप बोल सकते हैं टूल्स है जिसके थ्रू आप क्या करते हैं किसी भी तरीके के जो इंपॉर्टेंट क्वेश्चंस के जो आंसर्स होते हैं या फिर मैं बात करूं उस पर्टिकुलर डाटा की जो एनालिसिस होती है वो आप बहुत अच्छे तरीके से कर पाते हैं अब ये जो स्टैटिक्स है गाइ यहां पर इस स्टैटिक्स को हमने दो पार्ट के अंदर तोड़ रखा है पहला है आपका डिस्प्रिन स्टैटिक्स और दूसरा है आपका इन्फ्राट्रक्चरल स्टैटिक्स अब ये डिस्प्रेक्सिया होता है इसको जरा आप समझते हैं यहां पर देखिए इसको समझने से पहले जैसा कि मैंने आपको बोला था कि पहले आपको क्या करना चाहिए पॉपुलेशन एंड सैंपल वाला जो वीडियो है पहले आप उसे कवर अप कर लें देन उसके बाद इस प्रोसीजर पर राइट तो पॉपुलेशन सैंपल वाले वीडियो के अंदर हमने क्या देखा था कि जो भी हम डेटा सेट इस्तेमाल करते हैं उस डेटा सेट के अंदर जो एंटायस डेटा होता है मतलब जो पूरा का पूरा डेटा हमारे पास होता है वो क्या होता है एक पॉपुलेशन डाटा कहलाता है अब वो चाहे आपके पास 10 रो ही क्यों ना हो या 10000 रो ही क्यों ना हो या 10 लाख रो ही क्यों ना हो वो जितना भी हमारे पास डाटा होता है वो सारा का सारा डाटा क्या होता है पॉपुलेशन डाटा कहलाता है राइट अब उस डाटा में से हम कुछ डाटा निकाल लेते हैं मतलब कुछ डाटा उसमें से बाहर निकाल ले जैसे कि मेरे पास 10000 रो है उसमें से मैंने 5000 रो रैंडम पिक अप कर ली तो जो वो 5000 रो मैंने रैंडम पिक अप की है दैट इज कॉल्ड ऑफ सैंपल डाटा यस दैट इज कॉल्ड ऑफ आपके पास सैंपल डेटा वो हमारे पास क्या कहलाता है सैंपल डाटा यहां पर कहलाता है तो बेसिकली गाइस क्या हुआ कि हमारे पास एक तो हो गया पॉपुलेशन डाटा एक हो गया हमारे पास यहां पर सैंपल डाटा राइट दो चीजें हमारे पास यहां पर हो चुकी है यहां पर अब स्टैटिक्स भी आपके पास क्या होती है इन दोनों डाटा पे अलग-अलग तरीके से अप्लाई होती है कैसे अब जरा समझते हैं देखिए देखिए यदि मैं अपनी पॉपुलेशन डाटा के ऊपर प्रॉपर्ली तरीके से एनालास करूं अब देखिए जो मेरा पॉपुलेशन डाटा है वो मेरे पास क्या है एंटायस क्या है एंटायस एंटायस करूं जिस तरह की मुझे एवरेज फाइंड आउट करना है मुझे मीन फाइंड आउट करना है उसकी रेंज क्या है यहां पर स्टैंडर्ड डिविजन फाइंड आउट करना है तो वो जो पूरा एंटायस करते हैं कि उसका एवरेज क्या है रेंज क्या है ठीक है वेरियंस क्या है तो उस तरह की जब हम एनालिसिस करते हैं तो उसको हम क्या बोलते हैं डिस्क्रि एनालिसिस बोलते हैं यस उस तरह की एनालिसिस को डिस्प्रेक्सिया डिपट स्टैटिक्स हम बोल सकते हैं तो डिपट स्टैटिक्स क्या है डिस्प िव स्टैटिक्स कि जो आपके पास एंटायस एंटायस से मीनिंगफुल इंफॉर्मेशन निकालना उसमें से ऑब्जर्वेशन निकालना राइट उसमें से सारे आंसर्स निकालना ठीक है दैट इज कॉल्ड ऑफ डिस्प एनालिसिस यस ये क्या कहलाती है आपकी डिस्प्रिन सिस कहलाती है ठीक है वहीं पे आपके पास आती है इन्फ्राट्रक्चर स्टडीज अब देखिए जैसा कि मैंने आप लोगों को बोला था कि एक है हमारे पास पॉपुलेशन डाटा उस पॉपुलेशन डाटा से हमने क्या किया कुछ नंबर ऑफ अमाउंट ऑफ रेटर निकाल लिया जैसे 10000 रो है यहां पर उस 10000 रो में से 5000 रो मैंने बाहर निकाल दी राइट अब वो जो 5000 रो बाहर निकाल ली उस 5000 रो के ऊपर जब मैं एनालिसिस करने जाता हूं यस जब मैं एनालिसिस करने जाता हूं या जब मैं उसके ऊपर काम करने जाता हूं यहां पर ठीक है तो उसके ऊपर जब मैंने काम किया जब मैंने वो 000 के ऊपर काम किया दैट इज कॉल्ड ऑफ इंफ्रा टेक्चरल स्टैटिक्स यस दैट इज कॉल्ड ऑफ इंफ्रा टेक्चरल स्टैटिक्स इंफ्रा टेक्चरल स्टैटिक्स का मतलब क्या हुआ कि जो हमारे पास पॉपुलेशन डाटा है उसमें से हमने कुछ सैंपल ऑफ अमाउंट ऑफ डाटा निकाला उस ऑफ अमाउंट के ऊपर डाटा के ऊपर हमने एनालिसिस की अच्छा एक और चीज मैं यहां पे बताना चाहूंगा कि हम इंफ्रास्ट्रक्चर स्टैटिक्स को क्यों यूज करें काफी लोगों के दिमाग में ये क्वेश्चन चला होगा कि सर हम डायरेक्टली अ डिस्प्ले स्टैटिक्स को क्यों नहीं इस्तेमाल कर सकते ठीक है इंफ्रास्ट्रक्चर स्टैटिक्स को क्यों नहीं इस्तेमाल कर सकते तो पहली चीज यहां पर ये होती है कि पॉपुलेशन डेटा बहुत ही लार्ज अमाउंट ऑफ डाटा यदि हो तब हम यहां पर इस्तेमाल नहीं कर सकते और इंफ्रास्ट्रक्चर स्टैटिक्स का एक और बेनिफिट यह है कि यदि हम सैंपल डाटा के ऊपर एनालिसिस कर ले यदि हम सैंपल डाटा के ऊपर यहां पर अपना काम करें तो उसी का जो रिजल्ट है वो ऑलमोस्ट आपके पास पॉपुलेशन डाटा के रिजल्ट के बराबर आता है मतलब यदि आप पॉपुलेशन डाटा के ऊपर एनालिसिस ना करें और उसके ही सैंपल डाटा के ऊपर एनालिसिस करें तो जो सैंपल डाटा के ऊपर जो आपने एनालिसिस की है सैंपल डाटा के ऊपर आपने जो भी यहां पर रिजल्ट निकाला यहां पर वो आपके पास क्या आएगा सेम आने वाला है ऑलमोस्ट सेम आने वाला है एग्जैक्ट सेम नहीं बोलूंगा यहां पर क्योंकि एग्जैक्ट सेम तो हो ही नहीं सकता ठीक है तो ऑलमोस्ट क्या आने वाला है सेम होने वाला है किसके आपके पास जो आपका पॉपुलेशन डाटा है उसके राइट ऑलमोस्ट आपका सेम होने वाला है जो आपका पॉपुलेशन डाटा है उसके सेम होने वाला है तो इसीलिए हम क्या करते हैं यहां पर गाइस इंफ्राटेक्स स्टैटिक्स को हम इस्तेमाल करते हैं तो इंफ्राटेक्स स्टैटिक्स कब इस्तेमाल की जाती है तो इंफ्राटेक्स स्टैटिक्स उस वक्त की जाती है जब हम सैंपल डाटा के ऊपर एनालिसिस करते हैं अब बात करते हैं कि इनके अंदर हमें कौन-कौन सी चीजें स्टडी करनी है मतलब बेसिकली गाइस ये जो हमारा स्टैटिक्स है स्टैटिक्स को पहले हमने क्या किया दो पार्ट के अंदर तोड़ा डिस्पले िव और इंक्चर स्टैटिक्स के अंदर तोड़ा यहां पर अब जब हमने इसको दो पार्ट में तोड़ा कि डिस्प्ले और इंफ्रास्ट्रक्चर होता है यहां पर इसको हम और कितने पार्ट्स के अंदर तोड़ते हैं मतलब इनके अंदर क्या-क्या स्टडी करनी है क्या-क्या चीजों के ऊपर हमें ध्यान देना है यहां पर जस्ट क्या-क्या चीजें पढ़नी है वो जरा अब यहां पर देखते हैं तो मैंने क्या किया दोनों को अलग-अलग पार्ट के अंदर डिवाइड कर रखा है यदि मैं बात करूं फर्स्ट ऑफ़ ऑल डिस्पर स्टैटिक्स के अंदर तो डिस्प्रेक्सिया मेंट ऑफ सेंट्रल टेंडेंसी यस हमें ये पढ़नी है यहां पर मेजरमेंट ऑफ सेंट्रल टेंडेंसी मेजरमेंट ऑफ सेंट्रल टेंडेंसी के अंदर बात करें यहां पर तो इसके इसके अंदर हमारे पास तीन चीजें आती है कौन-कौन सी आती है मीन आता है फिर इसके अंदर आपका पास आता है मीडियन आ जाता है यहां पर और क्या-क्या आता है यहां पर गाइस मोड आ जाता है ठीक है ये तीन चीजें हमें यहां पर डिस्कस करनी पड़ती है मेजरमेंट ऑफ वेरिबिग पढ़नी होती है या फिर आप चार चीजें बोल सकते हैं यहां पर ठीक है पहली चीज क्या है यहां पर आपको रेंज पढ़ना होता है रेंज के बाद में आपको पास क्या होता है मीन एब्सलूट डिवीजन भी पढ़ना होता है फिर आपको क्या पढ़ना होता है वेरियंस पढ़ना होता है और फिर आपको क्या पढ़ना होता है स्टैंडर्ड डेविएशन पढ़ना होता है तो ये चार चीजें इसके अंदर पढ़नी है यहां पर फिर बात करें मेजरमेंट ऑफ शेप के अंदर मेजरमेंट ऑफ शेप के अंदर आपको पढ़ना होता है स्क्यूनेस यस आपको यहां पर पढ़ना पड़ेगा स्क्यूनेस के स्क्यूनेस क्या होती है डेटा सेट का शेप कैसा होता है वो चीजें देखनी होती है फिर आपको पढ़ना पड़ता है परसेंटाइल्स अब इसी परसेंटाइल्स के अंदर हम क्या पढ़ते हैं परसेंटाइल पढ़ते हैं कं टाइल पढ़ते हैं परसेंटेज पढ़ते हैं और इसके साथ-साथ यहीं पे मैं आप लोगों को बॉक्स प्लॉट के बारे में भी इंफॉर्मेशन देने वाला हूं ठीक है तो मैं यहां पर क्या करूंगा बॉक्स प्लॉट के बारे में भी इंफॉर्मेशन दूंगा तो ट्स बॉक्स प्लॉट होगा ठीक है फिर वहीं पे आपके पास आ जाता है फ्रीक्वेंसी डिस्ट्रीब्यूशन डाटा यस फ्रीक्वेंसी डिस्ट्रीब्यूशन मतलब कि आपका डाटा कितनी बार फ्रीक्वेंसी कर रहा है किस तरह से काम कर रहा है ठीक है तो यहीं पे भी हमारे पास क्या आता है और भी तरीके के क्या आते हैं यहां पर प्लॉट्स आते हैं उन प्लॉट्स को हमें डिस्कस करना पड़ता है फिर लास्ट ऑफ लीस्ट यहां पर क्या है यस कोवेरिएट एंड को रिलेशन मतलब आपके पास दो डाटा के बीच में किस तरह का रिलेशन है यहां पर उसके बारे में भी डिस्कस करना पड़ता है तो दैट इज अ डिस्प स्टैटिक्स जिसके अंदर हमें क्या करना है बहुत सारी चीजें डिस्कस करनी है मेजरमेंट ऑफ सेंट्रल टेंडेंसी मेजरमेंट ऑफ वेरिएबल मेजरमेंट ऑफ सेप्स परसेंटाइल्स फ्रीक्वेंसी डिस्ट्रीब्यूशन और क्या है यहां पर को वेरियंस एंड को रिलेशन तो ये सारी चीजें हमें डिस्कस करनी है उसके बाद हम यहां पर आ जाते हैं इंफ्रास्ट्रक्चर स्टैटिक्स के राइट इंफ्रास्ट्रक्चर स्टैटिक्स के अंदर बात करें तो इसके अंदर आपके क्या आएगा सेंटल लिमिट थ्योरम दैट इज अ वेरी वेरी इंपोर्टेंट थ्योरम काफी जगह बहुत काफी जगह इसका यूज केस है यहां पर आगे चलते हुए मशीन लर्निंग के अंदर भी बहुत सारी जगह पर इसका यूज केस है ठीक है नेक्स्ट आपके पास आता है यहां पर हाइपोथेसिस टेस्टिंग दैट इंफ्रास्ट्रक्चर स्टैटिक्स का जो सबसे मेन पार्ट है वो यही है हाइपोथेसिस टेस्टिंग यस इसको हम डिस्कस करेंगे जिसके अंदर जड टेस्ट होगा टी टेस्ट होगा च स्क्वायर टेस्ट होगा ये सारे टेस्टस जो है यहां पर बहुत ज्यादा इंपॉर्टेंट है तो इनको हम डिस्कस करने वाले हैं तो ये वाला पूरा पार्ट रहने वाला है मतलब आगे आने वाले जितने भी वीडियोस रहने वाले हैं वो सारे चीजें इन्हीं के ऊपर डिपेंडेंट है पहले हम डेसपरेट स्टैटिक्स को इन डेप्थ डिस्कस करने वाले हैं फिर हम इंफ्रास्ट्रक्चर स्टैटिक्स को इन डेप्थ डिस्कस करने वाले हैं इसी बीच हम यहां पर एक और पॉइंट को डिस्कस करेंगे दैट इज कॉल ऑफ प्रोबेबिलिटी यस दैट इज कॉल ऑफ प्रोबेबिलिटी यस पीआर भी ठीक है तो दैट इज कॉल ऑफ प्रोबेबिलिटी हम प्रोबेबिलिटी को भी डिस्कस करेंगे क्योंकि प्रोबेबिलिटी को डिस्कस करने के बाद ही हम हमारे हाइपोथेसिस टेस्टिंग पर पहुंच जाएंगे पहुंचेंगे और हाइपर सेसिंग की एनालिसिस कर पाएंगे तो बेसिकली हम यहां पे क्या करेंगे प्रोबेबिलिटी को भी डिस्कस करेंगे दैट वन वन ऑफ द मोस्ट इंपोर्टेंट चीज है अब डेटा साइंस की मैथमेटिक्स के अंदर आपका लीनियर अलजेब्रा भी आता है राइट लीनियर अलजेब्रा भी आता है आपके पास यहां पर कैलकुलस भी आता है तो ये वाला जो पार्ट है ये कब आपको डिस्कस करना है जब आप आगे बढ़ेंगे मतलब आप जब यहां पर मशीन लर्निंग के अंदर जाएंगे तो मशीन लर्निंग के अंदर जैसे जैसे जो जो टॉपिक आएगा उसके अंदर वैसे-वैसे आपको लीनियर अलजेब्रा ऑटोमेटिक समझ में आने लग जाएगा ऑटोमेटिक सारी चीजें आपको समझा दी जाएगी वहीं पे ठीक है तो जब आप मशीन लर्निंग को फॉलो करेंगे तो वहीं पे आपको जो लीनियर अलजेब्रा है वहां पे ही आपका क्लियर हो जाएगा तो आपको कोई अलग से पढ़ने की जरूरत नहीं है लीन अलजेब्रा ठीक है हां स्टैटिक्स वाला पार्ट जरूरी है क्योंकि एज ए डेटा साइंटिस्ट आप मशीन लर्निंग के अलावा भी कुछ मैथमेटिकल एनालिसिस करते हैं तो चलिए जरा डिस्कस करते हैं कि मेजरमेंट ऑफ सेंडल टेंडेंसी में क्या है तो देखिए मेजरमेंट ऑफ सेंडर टेंडेंसी के अंदर हम मेजर्ली तीन चीजों के ऊपर डिस्कस करेंगे कौन-कौन सी तीन चीजें हैं तो पहली चीज है आपका मीन सेकंड है आपका मीडियन और थर्ड चीज है आपका मड यस ये तीन चीजें हमें डिस्कस करनी है मीन मीडियन एंड मॉड के बारे में डिस्कस करते हैं मेजरमेंट ऑफ सेंड एनस के अंदर अब ये चीजें है क्या और कैसे काम करती है तो इसको वन बाय वन जरा समझते हैं यहां पर तो सबसे पहले बात करता हूं यहां पर मीन के बारे में मीन को आप यहां पर एवरेज भी बोलते हैं काफी लोग इसे एवरेज भी बोला जाता है मीन और एवरेज दोनों सेम चीज होती है मीन का इस्तेमाल जनरली बहुत सारी जगह पर किया जाता है जैसे एक छोटा सा एग्जांपल की बात करें लेट्स सपोज आप किसी कंपनी के अंदर जॉइन होना चाहते हैं मतलब आप किसी कंपनी के अंदर अप्लाई कर रहे हैं यहां पर अब उस कंपनी के अंदर क्या है कि आपका कोई पर्सन यहां पर पहले से वर्किंग कर रहा है यहां पर तो आप जाके क्या बोलते हैं कि आपकी कंपनी के अंदर जितने भी एंप्लॉई वर्क कर रहे हैं यहां पर ठीक है उसके हिसाब से आप मुझे बताइए कि यदि मैं इस क्वालिफिकेशन के साथ इस कंपनी को जॉइन करता हूं तो मेरा एवरेज सैलरी पैकेज क्या रहने वाला है राइट तो यहां पर आपने एक वर्ड यूज किया दैट द एवरेज ये एवरेज आपका मीन नहीं होता है इसके अंदर जो अगला वाला पर्सन होता है वो क्या कैलकुलेट करता है वो ये कैलकुलेट करता है कि आपकी जो क्वालिफिकेशन है उस क्वालिफिकेशन के कितने पर्सन वहां पे वर्किंग कर रहे हैं उनकी सैलरी पैकेज क्या है यहां पर उसके हिसाब से वो क्या करता है एवरेज निकाल के आपको देता है जैसे कि एवरेज पैकेज आपका पास मान लीजिए 7 लाख हो गया या फिर आपका पास 8 लाख हो गया तो इस तरह का पैकेज आपके पास यहां पर क्या करता है फाइंड आउट करके दिया जाता है अब ये मीन निकालते कैसे हैं ठीक है इस मीन का यूज काफी जगह पर होता है जैसे क्रिकेट के अंदर होता है जैसे कि विराट कोहली का एवरेज स्कोर क्या है विराट कोहली का एवरेज रन रेट क्या है यहां पर राइट इस तरह की चीजों के लिए भी आपका क्या करते हैं एवरेज का इस्तेमाल करते हैं अब ये एवरेज निकालते कैसे हैं दैट द पॉइंट यहां पर ये है तो एवरेज निकालने का एक फार्मूला होता है मतलब इस मीन को निकालने का एक फार्मूला होता है और मीन को निकालने का फार्मूला क्या है यहां पर यहां पर मीन को निकालने का फार्मूला है सम ऑफ सम ऑफ ऑल डाटा सम ऑफ ऑल डाटा राइट डिवाइड बाय टोटल नंबर ऑफ ऑल डाटा टोटल नंबर ऑफ ऑल डाटा अब यहां पर मैंने ये क्या फर्मूला लिखा है जरा इसको समझते हैं यहां पर सम ऑफ ऑल डाटा का मतलब क्या हुआ जैसे मैं यहां पर इसको लू यस इस वाले सिनेरियो को लू तो सम ऑफ ऑल डाटा का मतलब क्या हुआ कि आपके पास जितने भी डाटा है जैसे 7000 7500 राइट इसके अलावा आपके पास 2000 प्लस आपके पास यहां पर क्या है 3000 प्लस प् यहां पर क्या है 4000 प्लस क्या है यहां पर 8000 राइट ये जितना भी डाटा है यहां पर इन सबको आप क्या करेंगे ऐड अप करेंगे मतलब इस डाटा को क्या करेंगे सबको सम करेंगे सम करने के बाद में यहां पर इन डाटा की कैलकुलेशन करू कितने नंबर ऑफ डाटा है जैसे 1 2 3 4 5 6 सिक्स नंबर ऑफ टा तो मैं डिवाइड बाय क्या करूंगा सिक्स करूंगा तो यहां से मेरे पास क्या निकलेगा मीन निकलेगा देखिए मीन निकालने का सिंपल तरीका क्या है कि आप जितने भी डेटा है उनको सम कर दीजिए सम करने के बाद में डिवाइड बाय आपके पास क्या है उतने नंबर ऑफ डेटा को क्या करके डिवाइड कर दीजिए दैट्ची सिंपल्स ये है मतलब आप किसी भी डाटा का एक एवरेज पॉइंट निकाल रहे हैं एवरेज पॉइंट मतलब लगभग आंसर निकाल रहे हैं कि भाई ये आपका हाईएस्ट पॉइंट है ये आपका लोएस्ट पॉइंट है तो इसके मिडल में यहां कहीं आपका रिजल्ट लाय करता है राइट उसको हम यहां पर फाइंड आउट करते हैं दैट इज कॉल्ड ऑफ एवरेज स्कोर दैट इज कॉल्ड ऑफ मीन स्कोर इसको यहां पर बोलते हैं चलिए थोड़ा इसको प्रैक्टिकली समझते हैं कैसे करेंगे राइट तो देखिए मैं यूजिंग दिस फार्मूला मतलब मैं फार्मूला भी यूज करके आपको दिखाऊंगा इवन दैट मैं नपाई के थ्रू भी आपको दिखाने वाला हूं और इसके साथ-साथ एक बड़े डाटा सेट के ऊपर आप किस तरह से मीन निकाल सकते हैं वो भी हम फाइंड आउट करेंगे मतलब एक साथ बहुत सारी चीजें फाइंड आउट करने वाले हैं ठीक है तो सबसे पहले मैं क्या कर रहा हूं यहां पर इंपोर्ट कर लेता हूं इंपोर्ट किसे करते हैं यहां पर मैं नपाई को कर लेता हूं क्योंकि नपाई के अंदर हमारे पास न्यूमेरिकल फॉर्मूला है तो नपाई एलियास ऑफ एपी यूज़ करते हैं इंपोर्ट कर लेते हैं यहां पर किसे पांडा भी इंपोर्ट इपोर्ट कर लेते हैं पांडा एलियाज ऑफ पीडी यहां पर इंपोर्ट कर लेते हैं ठीक है और इसके अलावा यहां पर इन दो चीजों की मुझे सबसे ज्यादा जरूरत पड़ने वाली है तो मैंने इन दोनों को ले लिया ठीक है अब मैं क्या करने वाला हूं गाइस यहां पर एक डाटा लेता हूं मल सिंपल सा एक डटा लेते हैं और उस डाटा के अंदर हम क्या करते हैं उसका मीन फाइंड आउट करते हैं यहां पर अब कैसे फाइंड आउट करेंगे जरा समझते हैं तो पहले डाटा बनाते हैं यहां पर तो मैं क्या करता हूं एक एरे तैयार कर लेता हूं ठीक है अब एरे तैयार करने के लिए मैं एप डॉट यहां पर एरे का इस्तेमाल करूंगा आप चाहे तो लिस्ट का भी इस्तेमाल कर सकते हैं राइट तो मैंने कुछ नंबर ले लिया जैसे कि 4 फ सिक्स फिर टू फिर वन फिर एट फिर फाइव फिर सिक्स फिर सेवन और ये कुछ नंबर ठीक है तो ये मेरा एक एरे तैयार हो गया इस एरे को यदि आप देखेंगे तो इस तरह का एरे दिखेगा अब मुझे क्या करना है गाइज यहां पर मुझे इसका एवरेज निकालना है तो पहला तरीका है हम यूजिंग फॉर्मूला मतलब ये जो हमने फॉर्मूला लिखा है यहां पर इसका इस्तेमाल करेंगे जिसके अंदर क्या है सम ऑफ ऑल डेटा डिवाइड बाय टोटल नंबर ऑफ ऑल डाटा अब सम ऑफ ऑल डाटा कैसे निकलेगा मतलब ये डेटा का सम कैसे निकलेगा तो वेरी सिंपल यदि आप चाहे तो सम का फार्मूला लगा सकते हैं यहां पर राइट या फिर आपको पता होगा पा के अंदर एप डॉट आपके पास क्या होता है सम फंक्शन होता है आप उसका इस्तेमाल कीजिए सम फंक्शन के अंदर ए को डिवाइड कर डाल दीजिए तो ये आपका क्या हो गया टोटल नंबर ऑफ डेटा का सम हो गया मतलब ये जितना भी डटा है इन सबका सम आपके पास आ गया सम आने के बाद में डिवाइड बाय टोटल नंबर ऑफ डेटा चाहिए मतलब इस डेटा के अंदर कितना डाटा है ये चाहिए तो मतलब इसके अंदर लेंथ चाहिए इसकी यदि मैं देखो यहां पर लेंथ ऑफ ए निकालूं तो मुझे यहां पर कितना दिखेगा 10 मतलब इसके अंदर टोटल नंबर ऑफ 10 डेटा देख कैसे देख 1 2 3 4 5 6 7 1 8 9 10 10 डाटा राइट तो लेंथ ऑफ ऑल डाटा मतलब क्या हो रहा है जितने भी नंबर ऑफ डाटा वो मुझे मिल गया डिवाइड करूंगा मैं यहां पर किससे लेन ऑफ यहां पर आपके पास र से राइट तो एवरेज कितना आ गया 4.8 आ गया मतलब यदि मैं इसको मिनिमम और मैक्सिमम के अंदर यहां पर अरेंज करूं तो मुझे यहां पर क्या मिल गया इसका एवरेज मिल गया इसको आप कुछ इस तरह से भी देख सकते हैं यहां पर एप डॉट यहां पर आप शॉर्ट फंक्शन का इस्तेमाल कीजिए और शॉर्ट फंक्शन के अंदर जाने के बाद में आप ए आर को डाल दीजिए और रन कीजिए तो आपका शॉर्ट हो गया यहां पर डाटा जैसे वन से लगाकर क गया ट तक के बीच हो गया राइट अब देखिए वन से लगाकर ट तक के बीच में हो गया तो ऑलमोस्ट इसके मिडल ऑफ सेंटर के अंदर कहीं आपका डाटा लाई करेगा जो कि होगा आपका एवरेज डटा राइट ये तो हो गया हमारे पास बेसिक तरीका जिसके अंदर हमने खुद मैनुअली कैलकुलेशन की लेकिन हर बार हम मैनुअली कैलकुलेशन नहीं करते हमारे पास बहुत सारे फॉर्मूले होते हैं हम उनका इस्तेमाल करते हैं कैसे देखिए एप डॉट मैं क्या कर रहा हूं यहां पर आपको मीन निकाल रहा हूं जस्ट एप डॉट क्या करूंगा यहां पर मीन निकालूं मीन आपको डायरेक्ट मिल जाएगा जिसके अंदर आप एर डालिए और रन कीजिए तो आपको डायरेक्टली 4.8 आपको देखने को मिल जाएगा तो इस तरह से आप क्या कर सकते हैं अपना एवरेज स्कोर निकाल सकते हैं अब बात करते हैं कि यदि हम रियल वर्ल्ड डाटा के ऊपर बात करें जैसे कि रियल वर्ल्ड डाटा मैं आपको दिखाना चाहूंगा जैसे मेरे पास देखिए बहुत सारे डाटा पड़े हैं जैसे सैंपल सुपर स्टोर डाटा बटा है टिप्स है टाइटनिक है इसे रियल वर्ल्ड डाटा बोलते हैं यदि मैं टाइटनिक डाटा को ओपन करके दिखाऊं आपको तो ये कुछ इस तरह का डाटा है यहां पर अब इस रियल वर्ल्ड डाटा के अंदर हम मीन बहुत सारी जगह पे फाइंड आउट करते हैं जैसे मैं यहां पे बात करूं कि जो टाइटन की शिप थी हमारी ठीक है उस टाइटन की शिप के अंदर ट्रेवल करने वाले बहुत सारे लोग थे तो उनके अंदर जो ट्रेवल करने वाले वाले जो लोग थे उनकी एवरेज एज क्या थी एवरेज एज मतलब क्या है लगभग एज कितनी थी यहां पर मतलब मोस्ट ऑफ पीपल यहां पर किस एवरेज एज के यहां पर थे ये हमारा एक क्वेश्चन होता है सिंपल सा ठीक है हो सकता है कि उसके अंदर काफी ऐसे लोग हो जो एक दो साल के भी हो काफी ऐसे लोग हो जो 80 90 साल के भी हो है ना तो बहुत सारी जगह सिनेरियो हो सकता है मतलब इसके अंदर बहुत सारा सिनेरियो हो सकता है उसके अंदर हमें एवरेज एज फाइंड आउट करनी है एवरेज मतलब क्या है कि यहां पर कि वो कौन सी एज है जहां पे सबसे मतलब मोस्ट ऑफ पीपल्स कर रहे हैं मतलब क्या मिडिल एज आपके पास आने वाली है ऐसा कुछ यहां पर फाइंड आउट करने वाले है ठीक है तो अब ये कैसे फाइंड आउट करेंगे तो उसके लिए मैं करूंगा यहां पर पहले डेटा सेट को लोड करूंगा एंड देन उसके बाद बात करूंगा तो फिलहाल मुझे इसकी अब जरूरत नहीं है तो मैं इन दोनों को हटा देता हूं यहां पर अब आते हैं डेटा सेट के ऊपर देखिए मैंने क्या किया डटा सेट को लोड किया यहां पर पीडी डॉट यहां पर ड अंडर सीएससी का इस्तेमाल करेंगे यहां पर लोड करने के लिए अब इसके लिए मैं क्या करूंगा यहां पर मैं इस्तेमाल करूंगा डेटा सेट का तो डेटा सेट कौन सा है मेरा टाइटनिक डेटा सेट है तो मैंने titan.com ने इसमें लगा दिया अब देखिए डेटा सेट को जाके मैं डॉट हैड लगा के तीन डाटा को देखूं तो मुझे मेरा तीन डाटा दिख गया यहां पर अब मुझे एवरेज जज पूछिए कि भा एवरेज एज ट्रेवल करने वाले लोगों की एवरेज एज क्या है यहां पर राइट इस तरह का चीजें पूछिए है तो दैट्ची एज आ जाएगी अब डॉट मैं क्या करूंगा यहां पर गाइस मीन निकाल दूंगा ठीक है मैं यहां पर क्या करूंगा मीन नाम के जो फंक्शन है उसे अप्लाई कर दूंगा तो मेरी मीन आ गई है ट्स 29 ठीक है ट्स अ फर्स्ट मेथड या फिर आप नपाई का भी इस्तेमाल कर सकते हैं एनपी डॉट यहां पर क्या करेंगे मीन का इस्तेमाल करेंगे राइट एपी डट मन का इस्तेमाल करेंगे और मीन के अंदर जाके आप क्या करेंगे डेटा सेट के पास जाएंगे और यहां पर जाने के बाद एज का इस्तेमाल करेंगे तब भी आपके पास क्या आने वाली है सेम एवरेज ए ही आपके पास यहां प आने वाली है तो गाइस दोनों तरफ से आपके पास जो एवरेज है सेम आ रही है आप चाहे तो इसका इस्तेमाल कर सकते हैं या फिर आप चाहे तो इसका इस्तेमाल कर सकते हैं अब ये जो मीन है वो कहां लाई कर रहा है मतलब ऑलमोस्ट कहां लाई कर रहा है हमारे डटा के पर ये चीज हमें देखनी है तो ये चीज भी आप देख सकते हैं कैसे उसके लिए मैं ग्राफिकल ग्राफ का इस्तेमाल करूंगा ताकि आप थोड़ा सा अच्छे से एनालिसिस कर सके तो मैं इंपोर्ट क्या कर रहा हूं यहां पर मैट प्लट लिप को कर रहा हूं ताकि मैं अच्छे से ग्राफ बना सकूं मैट पलि डॉट यहां पर पीवा प्लॉट यस पी वाई अ मैं प्लॉट का इस्तेमाल करूंगा एलियाज ऑफ यहां पर पी एलटी एंड देन मैं यहां पर इंपोर्ट करूंगा यहां पर किसे सी बन को ताकि मैं थोड़ा एडवांस ग्रा बना सकूं सी बन एलियाज ऑफ यहां पर एसए ठीक है चलिए अभी क्या करते हैं गाइस यहां पर इसका थोड़ा ग्राफ बनाते हैं ठीक है किसका एज का कैसे एए डॉट मैं यहां पे क्या कर रहा हूं हिस्टोग्राम का इस्तेमाल कर रहा हूं तो उसके लिए मैं हिश प्लॉट का इस्तेमाल करूंगा एक्स एक्सेस के अंदर मैं एज डाल रहा हूं एंड वा एक्सेस के अंदर नहीं चाहिए मुझे मेरा डेटा चाहिए तो डटा इक्वल्स टू क्या करेंगे डाटा सेट का इस्तेमाल करेंगे और ग्राफ बनाने के लिए मैं क्या कर रहा हूं पटी ड शो फंक्शन का इस्तेमाल करूंगा और रन करूंगा तो देखिए मेरी जो एज है वो लगभग जीरो से स्टार्ट हो रही है और 80 तक यहां पर जा रही है इसके बिंस सही नहीं है मैं थोड़ा बिंस को सही कर देता हूं यहां यहां पर तो मैं यहां पर इस्तेमाल करूंगा किसका बिंस का और बिंस के अंदर मैं क्या करूंगा जीरो से स्टार्ट करूंगा सॉरी i 4 आ ए क्या करेंगे रेंज का इस्तेमाल करेंगे जहां पर जीरो से लगाकर 80 है तो मैं 81 का इस्तेमाल करूंगा और 10 10 का गैप दे देता हूं यहां पर और रन कर देते हैं चलिए तो मुझे दिख गया यहां पर 0 से 10 10 से 20 20 से 30 30 से 40 40 से 50 50 60 70 80 इस तरह से गया अब ये जो एवरेज आ रहा है वो एवरेज कहां आ रहा है एवरेज 29 पॉट आ रहा है मतलब 30 के आसपास आ रहा है मतलब ये वाला देखिए एकदम मिडल पॉइंट आ रहा है देखिए ये 30 के आसपास आ रहा है मतलब देखिए यहां पर मेरा जो डाटा है वो सबसे ज्यादा लाई कर रहा है यहां पर डाटा मेरा कम लाई कर रहा है तो मेरा जो मीन है वो यहां पर है राइट मेरा जो मीन आप देख पा रहे हो वो यहां पर 30 के आसपास यहां पर देखने को मिल रहा है राइट चलिए यदि आपको मीन का भी ग्राफ बनाना है तो आप उसका भी बना सकते हैं कैसे बनाएंगे यहां पर तो मैं क्या कर रहा हूं यहां पर पलटी डॉट क्या कर रहा हूं यहां पर अ प्लॉट फंक्शन का इस्तेमाल करूंगा अब इसके अंदर x एक्सेस के अंदर क्या है यहां पर x एक्सेस के अंदर बात करें तो मेरे पास ए जाए आएगा और एज कहां से आ रहा है एप ड मन से आ रहा है राइट तो मैं एज डाल देता हूं एप ड मन से राइट अब मुझे मेरी वा एक्स चाहिए राइट वा एक्सेस के लिए यहां पे काउंटिंग चली 0 से 200 तक की तो मैं काम करता हूं यहां पर एक लिस्ट बना लेता हूं हां पे क्या करूंगा यहां पर फॉर आई एन यस इसको आगे भी आई कर देते हैं ठीक है आई र आई इन यहां पर लगाएंगे रेंज यस क्या लगाएंगे रें और रेंज के अंदर लगा देते हैं जीरो से स्टार्ट करके ये 200 से ऊपर है लगभग ऑलमोस्ट 300 तक है तो मैं 3 तक पास कर देता हूं ठीक है और टन कर देते हैं चलिए एक लाइन प्लॉट बनाते हैं ओके एक छोटी सी मिस्टेक हो गई है उसको थोड़ा सही कर देते हैं तो यह वाली मुझे दोबारा चाहिए गी ठीक है तो मैं इसको यहां पर पेस्ट कर देता हूं और इस बार आ की जगह क्या करते हैं मीन लगा देते हैं तो ये मीन का फार्मूला है तो मैं m ए के नाम से इसे सेव कर लेता हूं राइट और ये जो m ए है मैं यहां पर आ की जगह m ए पेस्ट कर द और रन करते हैं तो देखिए एक लाइन हमारे पास आ चुगी है जो कि मीन की लाइन है ओके और इसका कलर चेंज कर देते हैं तो मैं c इक्वल टू क्या करता हूं रेड कलर डाल देता हूं ठीक है और रन करते हैं तो देखिए ये आपका मीन आ गया यस ये आप देख पाएंगे तो ये आपका मीन यहां पर आपको देखने को मिले है जैसे कि देखिए 29 क्या ऊपर आ रहा है ये आपका मीन ठीक है तो इस तरह से आप यहां पर अपना मीन यहां पर देख पाएंगे ओके तो इस तरह से आप क्या कर सकते हैं अपना मीन फाइंड आउट कर सकते हैं और उसे ग्राफिकल तौर पे प्रिंट कर सकते हैं चलिए मीन के बाद में जो हमारा नेक्स्ट टॉपिक है दैट अ कॉल ऑफ आपके पास क्या है मीडियन मीडियन क्या करता है तो मीडियन आपके पास क्या होता है डाटा का मिडल वैल्यू होता है मिडल वैल्यू मतलब एग्जैक्ट बीच का पॉइंट आपके पास होता है दैट इज़ कॉल्ड ऑफ़ मीडियन जैसे एग्जांपल के तौर पे ये हमारा एक डेटा सेट है जहां पे क्या है कुछ लोगों के नाम लिखे हैं और उनकी मंथली इनकम लिखी है अब सबसे पहले मीडियन निकालते वक्त एक इंपॉर्टेंट चीज ये होती है कि आपके पास जितना भी टा होता है उसको क्या करें आप असेंडिंग ऑर्डर में अरेंज करें मतलब आप क्या क्या करें इंक्रीमेंट ऑर्डर में अरेंज करें जैसे देखिए यहां पर मैंने क्या किया 2000 3000 4000 5000 7000 7500 8000 एंड 1 लाख ठीक है तो मैंने इस तरह से क्या करा है यहां पर अरेंज किया है यहां पर अरेंज करने के बाद में यस अरेंज करने के बाद में नेक्स्ट प्रोसीजर क्या होता है गाइस यहां पर कि आप से मिडल वैल्यू निकालनी होती है देखिए मीडियन निकालते र आपको एक चीज ध्यान रखनी होती है कि आपका जो भी डाटा है वो डाटा आपके पास यहां पर किस तरह का है किस तरह का मतलब यहां पर क्या है इवन नंबर ऑफ डाटा है यहां पर या फिर ऑड नंबर ऑफ डाटा है इस चीज का आपको यहां पर स्पेशली ध्यान रखना होता है कि भा आपका डाटा इवन है या ऑड है जैसे देखिए मेरे पास दो यहां पर एग्जांपल है पहला जो देखेंगे यहां पर दैट इज अ ऑड नंबर ऑफ डेटा यस क्या है ऑड नंबर ऑफ आपके पास क्या है यहां पर डटा है सेकंड चीज देखेंगे तो यहां पे क्या है इवन नंबर ऑफ डेटा है यस इवन नंबर ऑफ आपके पास क्या है डेटा है अब यहां पर जब आपके पास ऑड नंबर ऑफ डाटा होता है तब यहां पर मीडिल वैल्यू कैसे निकाली जाती है तो ये बहुत ही सिंपल है कि तीन यहां से कैंसिल कर दीजिए तीन यहां से कैंसिल कर दीजिए और जो बीच वाला पॉइंट आपको दिखेगा दैट अ टो यस यहां पे क्या है दैट इज अ टो इज कॉल ऑफ मिडल वैल्यू यस तो मिडल वैल्यू कितनी हो गई आपके पास यहां पर 7000 आपकी मिडल वैल्यू हो गई अब बात करते हैं कि यदि हमारा इवन नंबर ऑफ डेटा है अब इवन नंबर ऑफ़ डेटा कैसे है यहां पर तो देखिए आप काउंट कीजिए थ देन 36 36 सिक्स और सेन और 8 तो ये आपके पास क्या है यहां पर इवन नंबर ऑफ डाटा है मतलब काउंटिंग क्या है यहां पर आपकी इवन है अब इवन नंबर ऑफ काउंटिंग होगी तो क्या होगा यहां पे गाइज थ्री यहां से लेस होंगे थ्री यहां से लेस होंगे और मिडल वैल्यू आपको यहां पर देखने मिलेगी अब मिडल वैल्यू के अंदर क्या है आपकी दो वैल्यू है एक टॉ है और दूसरा क्या है रोस है अब टॉ और रस है यहां पर दो डाटा है तो अब मिडल वैल्यू कौन सी चूज की जाए तो मिडल वैल्यू चूज करने के लिए हम क्या करेंगे कि जो टॉ का डेटा है दैट कॉल ऑफ यहां पर 6000 प्लस यहां पर क्या होगा यहां पर 7000 डिवाइड बायट करते हैं यस 6000 + 7000 / बा 2 तो आंसर कितना आ जाता है यहां पर 6 और 6 12 12 और 1 आपके पास हो गया 13 तो 13000 यस 13000 / बा 2 इट्स कॉल ऑफ आपके पास क्या हो गया 65000 65000 ओके दैट इज कॉल ऑफ 6500 आपके पास हो गया राइट तो ये आपका यहां पर एग्जैक्ट आंसर होता है ठीक है तो बेसिकली यदि आपके पास इवन नंबर ऑफ डाटा है तब आपके पास क्या होगा मिडल दो वैल्यू होगी उन दो वैल्यू में से क्या करना है आपको उनका एवरेज फाइंड आउट करना है मतलब जो दो मिडल वैल्यू होगी आपको उनका क्या करना है एवरेज निकालना है यहां पर और जब आपके पास ऑड नंबर ऑफ डाटा यस जब आपके पास क्या है ऑड नंबर ऑफ डाटा है तो उस केसेस में हमें क्या करना है गाइ यहां पर कि हमारा एक ही मिडल वैल्यू दिखेगा यस तो इस से फाइंड आउट करना है तो दैट इज अ मिडल वैल्यू ठीक है अब ये मिडल वैल्यू निकालते कैसे हैं तो वापस चलते हैं इसी डटा के ऊपर ठीक है अब जैसे कि मुझे इस डेटा का मिडल वैल्यू निकालना है मतलब एज की मिडल वैल्यू निकालनी है राइट तो एज का यदि मुझे मीडियन निकालना है तो मैं क्या करूंगा यहां पर गाइस कि मैं डेटा सेट के पास जाऊंगा सबसे पहले यस डेटा सेट के पास जाऊंगा या फिर आप नपाई में भी जा सकते हैं तो मैं ए डॉट यहां पर मीडियन को कॉल करूंगा जस एपी डॉट क्या करूंगा यहां पर मीडियन को कॉल करूंगा मीडियन को कॉल करने के बाद में आप यहां पर डेटा सेट को कॉल कर सकते हैं और डेटा सेट के अंदर जाने के बाद में आप किसका करेंगे एज का मीडियन निकालेंगे और रन करेंगे तो ये आ रहा है है बिकॉज इसके अंदर नल वैल्यू है यहां पर यस एज के अंदर क्या है हमारी नन वैल्यू है यहां पर तो मैं इस नन वैल्यू को पहले फिल कर देता हूं ठीक है ज के अंदर क्या है हमारी नन वैल्यू है अब ये कैसे पता चला यहां पर मेरे पास नन वैल्यू है तो बेसिकली यहां पर डेटा सेट के पास जाएंगे आप यहां पर यस डटा सेट के पास जाने के बाद में डॉट यहां पर इज नल का आप इस्तेमाल करेंगे और इज नल के बाद में डॉट यहां पर सम का इस्तेमाल करेंगे तो आप यहां पर देखेंगे कि जो एज है उसके अंदर 177 नल वैल्यू है तो बेसिकली मैं क्या करता हूं यहां पर नल वैल्यू फिल कर देता हूं अब ये नल वैल्यू कैसे फिल की जा रही है तो ये हमारा डेटा क्लीनिंग का पार्ट है हमारा यहां का पार्ट नहीं है डेटा क्लीनिंग का पार्ट है ठीक है तो जब आप डेटा क्लीनिंग वाला वीडियो देख रहे होंगे तब आपको ये नल वैल्यू कैसे फिल कर जाती है वो आपको वहां पर बहुत अच्छे तरीके से क्लियर हो जाएगा तो मैं फिलहाल अभी यहां पर थोड़ा फास्ट वे के अंदर यहां पर इसको क्लियर कर रहा हूं यहां पर देखिए मैं कर लूंगा यहां पर एज को लेने के बाद में मैं यहां पर क्या करूंगा फिल ने को कॉल करूंगा यस मैं क्या कर रहा हूं यहां पर फिल ने को कॉल कर रहा हूं और फिल ने को कॉल करने के बाद मैं डेटा सेट को कॉल करूंगा मैं यहां पर फिर से यस मैं फिर से क्या करूंगा डेटा सेट को कॉल करूंगा और डटा सेट को कॉल करने के बाद में मैं यहां पे क्या कर रहा हूं यहां पर एज को कॉल कर रहा हूं और एज को कॉल करने के बाद में दैट मैं मीन को कॉल कर रहा हूं अब आप यहां पर एक चीज को नोटिस करेंगे कि मैंने यहां पर यहां पर फिल करने के लिए किसका इस्तेमाल किया मीन का इस्तेमाल किया इट्स मीन दैट जो हमारे मेजरमेंट ऑफ सेंटल टेंडेंसी है जो कि हमारे पास मीन मीडियन मोड जो है यहां पर ये डेटा फिलिंग के अंदर बहुत कम आती है मतलब डेटा क्लीनिंग के वक्त हमारे पास बहुत ज्यादा इस्तेमाल की जाती है राइट तो बेसिकली जब भी आप डेटा क्लीनिंग वाला वीडियो देखेंगे आगे चलते हुए तब आप यहां पर एक नोटिस करेंगे कि जो हमारे पास डेटा क्लीनिंग है उसके अंदर हमारे पास मेजरमेंट ऑफ सेंटर टेंडेंसी का बहुत ज्यादा इस्तेमाल किया जाता है राइट तो अब देखिए मैं एवरेज एज मीडियन एज निकालूं यहां पर तो वो कितनी आ रही है 29.6 के आसपास यहां पर आ रही है मतलब मिडिल एज भी हमारे पास वही आ रही है ठीक है मीडियन एज भी क्या आ रही है हमारे पास वही आ रही है जो कि पहले थी यहां पर ठीक है तो दैट इ अ मिडियन एज ठीक है मीडियन एज ठीक है मीडियन एज कैसे निकालनी हमने कि भाई इसको असेंडिंग ऑर्डर में अरेंज किया एंड दैट मिडल वाला जो पॉइंट है हमने उसको चूज किया और वो कितना आ रहा है 29.6 के आसपास कुछ हमारे पास आ रहा है दैट कॉल ऑफ मीडियन ठीक है या फिर आप एक और काम कर सकते हैं कैसे यहां पर आप डेटा सेट के पास जाएं एंड देन आप यहां पर क्या करें एज को कॉल करें एज को कॉल करने के बाद में डॉट यहां पर आप मीडियन को कॉल कर सकते हैं राइट और जैसे ही आप मीडियन को कॉल करेंगे तब भी आपके पास मीडियन आ ग ठीक है तो इस तरह से कर सकते हैं अच्छा यदि आप यहां पर नहीं निकालना चाहते तो आप फेयर का भी निकाल सकते हैं पहले मैं एक काम करता हूं फेयर में चेक कर लेता हूं कि मेरे पास नल वैल्यू तो नहीं है यहां पर राइट पेयर में चेक कर लेता कि नेल वैल्यू तो नहीं है तो डेटा सेट के पास चलते हैं और डॉट मैं यहां पर इस नल को कॉल कर देता हूं यहां पर एंड डॉट सम को कॉल कर देता हूं यहां पर तो फेयर के अंदर अभी हमारे पास कोई नेल वैल्यू नहीं है ठीक है तो एक काम करते हैं एज की जगह इस बार फेयर को चूज कर लेते हैं ठीक है तो मैं क्या कर रहा हूं यहां पे गाइस फेयर को चूज कर रहा हूं और और फेयर का मीडियन निकाल देता हूं तो देखिए फेयर का मीडियन निकाला तो दैट अ 14 ठीक है और मैंने यहां पे फिर से फेयर का मीडियन निकाला दैट इज अ 14 दोनों तरफ से और यदि मैंने यहां पर फेयर का मीन निकाला तो फेयर का मीन इज 32 ठीक है यदि मैंने फेयर का फेयर का मीन निकाला तो दैट इज कॉल ऑफ 32 और मैं चाहूं तो यहां पर ये जो एज है इस एज को हटा के मैं फेयर डाल सकता हूं और रन कर सकता हूं तो देखिए फेयर का जो मीन है वो यहां कहीं आ रहा है दैट अ 32 और यहां पर जो मीडियन है वो मीडियन कहां रहा है कि जब हम इसे असेंडिंग ऑर्डर में अरेंज करेंगे यस जब हम इसे सेंडिंग ऑर्डर में अरेंज करेंगे तो जहां पे हमारा डाटा आएगा वहीं हमारा मीन में आ जाएगा यदि मैं इसको प्लॉट करना चाहूं तो मैं सेम टू सेम ऐसे ही प्लॉट कर सकता हूं यहां पर जैसे मुझे मीडियन प्लॉट करना है तो मैं मीडियन प्लॉट कर सकता हूं और मीडियन को प्लॉट करने के लिए मैं यहां पे कह रहा हूं एडी का इस्तेमाल करूंगा यस ये जो मेरा डाटा है इसमें एमडी का इस्तेमाल करूंगा राइट चलिए तो प्लॉट कर लेते हैं एमडी को ओके मैं एमडी को प्लॉट करता हूं देखिए एमडी वाली लाइन भी आ गई यहां पर और इसका कलर चेंज कर लेते हैं यहां पर तो ट्स मैं यहां पर ब्लू कलर ले लेता हूं और ब्लू कलर लेने के बाद में मेरा मीडियम अगे तो देखिए मीन कहां आ रहा है इस तरफ आ रहा है मीडियन कहां आ रहा है यहां कहीं आ रहा है यस मीडियन क्या आ रहा है यहां कहीं हमारे पास यहां पर लाइ कर रहा है तो इस तरह से आप क्या कर सकते हैं आपका मीन और मीडियन दोनों निकाल सकते हैं ठीक है अब नेक्स्ट जो पॉइंट्स हम डिस्कस करने वाले हैं दैट इज कॉल्ड ऑफ मड मड का मतलब होता है गाइज यहां पर मोस्ट फ्रीक्वेंसी डाटा यस मोस्ट फ्रीक्वेंसी डेटा मतलब यहां पर है कि आपके डेटा सेट के अंदर क्या होगा कि काफी ऐसा डाटा होगा जो रिपीट कर रहा होगा अपने आप यस क्या कर रहा होगा यहां पर अपने आप को रिपीट कर रहा होगा जैसे एग्जांपल के तौर पर बात करें तो ये मेरे पास कुछ डाटा है यहां पर अब इस डटा के अंदर यहां पर क्या है कि जो नेम है देखिए नेम आपका रिपीट कर रहा है क्या नहीं उनकी मंथली इनकम रिपीट कर रही है क्या नहीं यस सिटी हमारा रिपीट कर रहा है कैसे देखिए जोधपुर जो है यहां पर वो दो बार आ चुका है ठीक है जयपुर जो है यहां पर वो एक बार आया है अजमेर की बात करेंगे यहां पर तो अजमेर क्या है थ्री टाइम्स आ है तो यदि मैं बात करूं अजमेर क्या आया है यहां पर थ्री टाइम्स आया है जोधपुर जो बात करेंगे यहां पर यस जोधपुर जो बात करेंगे वो क्या है टू टाइम्स है यस जोधपुर आप देखोगे यहां पर तो जोधपुर कितनी बार आया आपके पास यहां पर वन एंड टू टाइम्स आया ठीक है उसके बाद में आप यहां पर देखो कोटा यस मैं बात करूं यहां पर कोटा की बात करूं तो कोटा हमारे पास क्या है वन टाइम आ है ठीक है तो अब इसके अंदर सबसे ज्यादा बार रिपीट करने वाला नंबर कौन रहा है तो सबसे ज्यादा रिपीट करने वाला कौन है यहां पे डटा दैट इज कॉल ऑफ अजमेर अजमेर सबसे ज्यादा हमें क्या कर रहा है रिपीट कर रहा है और वो कितने टाइम्स रिपीट कर रहा है दैट अ थ्री टाइम्स हमें रिपीट कर रहा है ठीक है तो यदि मैं मोड की बात करूं यस मोड की बात करूं तो मोड क्या हो जाता है गाइज यहां पर अजमेर होगा मोड क्या होगा मेरा अजमेर होगा और यदि मैं इसकी फ्रीक्वेंसी की बात करूं फ्रीक्वेंसी मतलब ये कितनी बार रिपीट कर रहा है दैट इज आंसर ऑफ थ्री यस ये अपने आप को क्या कर रहा है थ्री टाइम्स रिपीट कर रहा है ठीक है तो मड क्या हुआ अजमेर हो गया और फ्रीक्वेंसी क्या हो गई आपकी थ्री हो गई ठीक है तो इस तरह से हम क्या कर सकते हैं गाइज यहां पर मोड का पता लगाते हैं दैट कॉल ऑफ मोस्ट फ्रीक्वेंसी टा ठीक है अब मोस्ट फ्रीक्वेंसी ऑफ़ डेटा कैसे निकाला जाता है तो गाइज मोस्ट ऑफ फ्रीक्वेंसी ऑफ डेटा हम मेजर्ली किसके ऊपर निकालते हैं कैटेगरी कल डाटा पे निकालते हैं अब कैटेगरी कल डेटा मतलब क्या हो रहा है देखो ये वाला जो डाटा है एज जो है दैट इज कॉल ऑफ न्यूमेरिकल डाटा सेक्स की बात करें यहां पर दैट इज अ कैटेगरी कल डेटा क्लास की बात करें दैट इज अ कैटेगरी डेटा आल्सो ू की बात करें दैट इज अ कैटेगरी डेटा ठीक है हां नंबर पे भी हम निकालते हैं जैसे कि पी क्लास की बात करूं तो पी क्लास के अंदर 3 4 1 4 ये जितने भी डाटा है दैट आल्सो नंबर बट इनके ऊपर भी मॉड निकाला जाता है क्यों निकाला जाता है क्योंकि दैट इज़ कॉल्ड ऑफ डिस्क्रीट डाटा यस इस डाटा को हम क्या बोलते हैं डिस्क्रीट डाटा बोलते हैं और ये जो एज है ये हमारा कैसा है कंटिन्यूज डाटा है तो डिस्क्रीट डेटा के ऊपर हम मोड निकाल सकते हैं वैसे तो हम कंटीन्यूअस डटा पे भी निकाल सकते हैं मैं यहां पे कंटीन्यूअस डटा के ऊपर भी मोड निकाल के दिखाऊंगा यहां पर ठीक है तो ये कैसे निकाला जाता है अब जरा समझते हैं यहां पे सबसे पहले मैं बात करता हूं फेयर के ऊपर यस मुझे फेयर के ऊपर बॉन्ड निकालना है हाउ टू फाइंड दिस बॉड तो देखो डेटा सेट के पास जाएंगे यहां पर ठीक है डाटा सेट के पास जाने के बाद में मैं क्या करूंगा यहां पर फेयर को कॉल करूंगा फेयर को कॉल करने के बाद में डॉट मैं यहां पर क्या करूंगा मोड को कॉल कर दूंगा रन करेंगे तो मड कितना आ रहा है 8.0 आ रहा है यहां पर 8.05 आपके पास मोड आ रहा है ठीक है अब यदि मुझे मड की वैल्यू निकालनी है तो मैं यहां पे क्या करूंगा स्क्वायर बैकेट ऑफ 0 लगाऊंगा अब आप बोलेंगे स्क्वा बैके ऑफ 0 क्यों लगाया तो बहुत ही सिंपल रीजन है क्योंकि ये जो डेटा आपने यहां पर कलेक्ट किया है यस इसकी यदि आप यहां पर टाइप निकालेंगे तो टाइप क्या आ रही है पांडा कोड सीरीज आ रही है यस पांडा कोड क्या आ रही है सीरीज आ रही है तो सीरीज है और ये जो डाटा आपके पास क्या है ये सीरीज का क्या है पहला डाटा है ठीक है जीरो से इंडेक्स नंबर का डाटा और मुझे इसको कैलकुलेट कर कैलकुलेट करना है तो मैं यहां पर इस तरह से नि करूंगा तो ये मेरा क्या निकल गया यहां पर मड निकल गया इस तरह से ठीक है तो ये हमारे पास क्या है मड आपके पास आ चुका है यहां पर ठीक है अब ये मड कितनी बार आ है मतलब इनकी फ्रीक्वेंसी चेक करनी है तो कैसे फ्रीक्वेंसी चेक करेंगे तो इट्स अ वेरी सिंपल आंसर दैट आप क्या करेंगे डाटा सेट के जाएंगे फेर के अंदर जाएंगे उसके बाद में आप यहां पर क्या करेंगे वैल्यू यस अंडर यहां पर काउंट्स का इस्तेमाल करेंगे वैल्यू अंडरस्कोर का क्या रखेंगे सीओ य एटीएस काउंट यस वैल्यू अंडरस्कोर काउंट्स का इस्तेमाल करेंगे वैल्यू अंडरस्कोर काउंट्स क्या करेगा यहां पर कि जो डाटा आपका सबसे ज्यादा बार रिपीट कर रहा है वो सबसे पहले दिखाएगा आपके पास यहां पर जैसे 0 प 8.05 आपके पास है दैट इज अ 42 टाइम्स 13 आपके पास आ रहा है वो कितने आ र है 42 टाइम्स आ रहा है 7.8 आपके पास आ रहा है 38 टाइम्स 7.7 आ रहा है दैट इज अ 34 टाइम 26 आ रहा है दैट इ अ 31 टाइम ठीक है तो आपको पता चल रहा है कि आपका जो फेयर है वो फेयर मतलब एट की बात करें तो वो कितनी बार आ रहा है 43 टाइम्स आ रहा है इसका मतलब क्या है मोस्ट जो रिपीटेड है यहां पर वो कौन है 8.05 है और वो कितना है 43 टाइम्स है ठीक है तो इस तरह से आप क्या कर सकते हैं वैल्यू काउंट से अपनी काउंटिंग निकाल सकते हैं राइट चलिए अब इसको यदि मैं प्लॉट करके देखूं तो प्लॉट में कहां आएगा हमारे पास वो देखना है यदि हमें तो कैसे चेक करेंगे तो मैं एक काम करता हूं एओ के नाम से इसे सेव कर लेता हूं ठीक है और एओ के नाम से सेव करने के बाद में यदि मैं प्लॉट एक और बना लूं यहां पर तो सेे कॉपी कर देते हैं और पेस्ट कर लेते हैं इस बार क्या कर रहे हैं हम यहां पर एमओ मतलब मड का इस्तेमाल कर रहे हैं यस क्या कर रहे हैं एमओ मड का इस्तेमाल कर रहे हैं यहां पर और इस बार जो कलर है यहां पर वो मैं ग्रीन कलर लेता हूं ठीक है तो मैंने ग्रीन कलर ले लिया ग्रीन कलर लेने के बाद में देखो मड का आंसर यहां आ रहा है जैसे कि आप यहां पर देख पा रहे हैं जो कि क्या है एट के आसपास और वो यहां है चलो एक काम करते हैं थोड़ा सा कलर इधर-उधर कर लेते हैं ताकि थोड़ा सा अच्छा से दिखे यहां पर तो इधर मैं क्या करता हूं यहां पर जी आर ई एन ग्रीन कलर लेता हूं जी आर जी आर ई एन ग्रीन कलर ता हूं नीचे हमारा ब्लू सही है और इसको मैं यहां पर रेड कलर कर देता हूं ठीक है तो रन करने पर ये रेड कलर आ गया ठीक है इस तरह से आपको यदि मैं आपको इनका लेजेंड दिखाऊ यहां पर तो पी एलटी डॉट हम पी एलटी डॉट यदि मैं यहां पर लेजेंड की बात करूं ठीक है तो ये लेजेंट हमारे पास आ जाएगा और एक काम करते हैं लेबल लगा देते हैं ठीक है क्या करते हैं एल ए बीई एल ले लेबल और लेबल के अंदर ये क्या चीज है हमारे पास यहां पर यस सबसे पहले हमने क्या निकाला था यहां पर हमने मीन निकाला था सबसे पहले हमारा क्या था मीन था तो मैं मीन निकाल देता हूं यहां पर और सेम चीज यहां पर दूसरे में भी लगा देते हैं मीन है हमारा पहला दूसरा एंड तीसरा पहला मीन है दूसरा क्या है हमारा मीडियन है तो दूसरा हमारा मीडियन है यहां पर और तीसरा हमारा जो है दैट अ मड ठीक है दैट अ मोड तो मैं यहां पर मड लगाता रन करते हैं लीजेंड आ गया ठीक है तो मीन क्या है हमारा ग्रीन कलर का है और ब्लू कलर का क्या है हमारा यहां पे गाइस हमारा मीडियन है और रेड कलर का क्या है हमारा मॉड है जो कि हमें यहां पर दिख रहा है ठीक है तो आपको एनालिसिस हो रही होगी कि मीन मीडियन मोड ये तीनों अलग-अलग आपके पास यहां पर डिफाइन होता है लेकिन दैट डिपेंड ऑन योर डाटा यदि आपके पास डाटा सिमेटिक डाटा हो जैसे अभी तो क्या है ये नॉन सिमेटिक डाटा है तो नॉन सिमेटिक डाटा में आप देख रहे हैं कि पहले क्या आ रहा है मीन आ रहा है फिर क्या आ रहा है मीडियन आ रहा है फिर क्या आ रहा है मड आ रहा है यदि आपका सिमेटिक डाटा हुआ तो वहां पे मीन मीडियम मड तीनों एक साथ ू होता है अब इसका जो यूज़ है रियल केस के अंदर मतलब रियल सिनेरियो के अंदर डेटा साइंस के अंदर इसका यूज़ केस कहां है यहां पर तो रियल सिनेरियो के अंदर यदि आप डेटा साइंस के अंदर इसका यूज केस देखेंगे तो वो कब काम आता है तो वो होता है आपके पास जब आप डेटा क्लीनिंग करते हैं यस डेटा क्लीनिंग करते वक्त आपके पास मीन मीडियन मोड के बहुत काम आते हैं क्यों क्योंकि इनकी हेल्प से ही हम क्या करते हैं डेटा की फिलिंग करते हैं मतलब हमारे डाटा के अकॉर्डिंग हमारे डाटा के अकॉर्डिंग हमें मीन चूज करना है मीडियन चूज करना है मॉड चूज करना है ये हम चूज करते हैं और इसके बारे में कब जानेंगे आप यहां पर जब आप डेटा क्लीनिंग को सीखेंगे और आज के इस वीडियो के जरिए हम बात करेंगे मेजरमेंट ऑफ वेरिबिग मेंट ऑफ वेरिबिग रेंज के बारे में सेकंड चीज पढ़ेंगे मीन एब्सलूट डिवीजन के बारे में थर्ड चीज पढ़ेंगे वेरियंस के बारे में और फोर्थ में आएगा हमारे पास स्टैंडर्ड डिवीजन के बारे में देखिए इन सब का जो यूज केस है वो आपके पास डाटा के स्पिनेट को चेक करने के लिए यूज किया जाता है अब मेन इंपोर्ट ट चीज आती है कि डेटा का स्प्रिड मेस का मतलब क्या होता है डेटा के स्पिनेट से मतलब है कि डाटा का फैलाव किस तरह से है अब देखिए जब आप मशीन लर्निंग के अंदर काम कर रहे होते हैं तो उस वक्त काफी ऐसी एल्गोरिथम्स होती है जिसके अंदर डेटा का स्पिड बस यूज नहीं आता है मतलब यदि डटा का स्पीडसपोर्न करना स्टार्ट कर देता है इसीलिए काफी जगह पर हमें है जो स्पीड नेस के साथ काम नहीं करती है तो बेसिकली गाइस हमें मेजरमेंट ऑफ वेरिएबल से यह पता लगता है कि हमारा डाटा किस तरह से स्प्रेड नेस है यदि आपको पाइथन मशीन लर्निंग डाटा साइंस एंड डेटा एनालिस जसी फीड में अपने आपको को ग्रो करना है तो इसके लिए डब्लू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपने स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं अब देखिए सबसे पहले हम यहां पर बात करते हैं कि रेंज क्या होता है यस देखिए रेंज वर्ड आपने बचपन में भी सुना होगा पहले भी सुना होगा आज पढ़ने से पहले भी तो बेसिकली गाइज रेंज क्या होता है कि किसी भी डेटा सेट के अंदर किसी भी डेटा सेट के अंदर जो आपका मिनिमम वैल्यू है यस और जो मैक्सिमम वैल्यू है इसके बीच का जो डिफरेंस है दैट इज कॉल ऑफ रेंज या फिर आप बोल सकते हैं कि मिनिमम और मैक्सिमम वैल्यू को आप फाइंड आउट करके जो आप आंसर्स बताते हैं दैट इज कॉल ऑफ रेंज तो बेसिकली रेंज क्या है यहां पर कि आपके पास कोई भी आपका डेटा सेट है उसमें मिनिमम वैल्यू कितनी है और मैक्सिमम वैल्यू कितनी है ये फाइंड आउट करना रेंज कहलाता है है तो चलिए अब जरा थोड़ा इसको प्रैक्टिकली समझते हैं कि यह रेंज कैसे निकाला जाता है यहां पर तो जरा देखिए यहां पर तो मैं ले चलता हूं आपको एक डाटा सेट के ऊपर और आपको पता है कि जैसे कि हम टाइटनिक डटा सेट के ऊपर स्टार्टिंग से काम कर रहे हैं तो मैं एक काम करता हूं कि इस टाइटनिक डाटा सेट को मैं एक बार फिर से लोड कर लेता हूं ताकि हम यहां पर कुछ रेंज वगैरह फाइंड आउट कर सके इससे पहले हम हमारी जो रिक्वायर्ड लाइब्रेरी है उसे इंपोर्ट कर लेते हैं जैसे नपाई पांडा मैट पली एंड सी बन राइट एंड उसके बाद में हम हमारे जो डेटा सेट है इसमें titan.com डॉट हैड करके हम इसके तीन डाटा को देख लेते हैं अब मैं यहां पर एक क्वेश्चंस का आंसर निकालना चाहूंगा कि जो हमारे टाइटनिक जहा थ यस उसके अंदर बहुत से लोगों ने ट्रेवल किया था अब क्वेश्चन यहां पर एक आता है कि उस टाइटनिक जहाज के अंदर आपके पास किस रेंज के जो पर्सन थे वो ट्रैवल कर रहे थे इसका आंसर आपको कहां से मिलेगा रेंज के थ्रू मिलेगा अब यहां पे क्वेश्चन को जरा गौर से सुने तो यहां पे क्वेश्चंस का आंसर इस तरह से मिलता है कि आपके पास एज ग्रुप मिनिमम क्या है और मैक्सिमम क्या है तो यहां से आपको एक कर रेंज पता चल जाएगी कि इस रेंज के जो पर्सन हैं वो उस टाइटनिक शिप्स के अंदर ट्रेवल कर रहे थे तो चलिए जरा पता करते हैं कि कौन से एज ग्रुप के लोग ट्रेवल कर रहे थे अब मुझे यदि यहां पर एज ग्रुप के पर्सन के बारे में पता करना है तो मैं क्या करूंगा सबसे पहले डेटा सेट के पास जाऊंगा और डेटा सेट के पास जाने के बाद में मैं एज को कॉल करूंगा एज को कॉल करने के बाद इसका मिनिमम डाटा निकालूं यहां पर मिन फंक्शन के थ्रू तो ये मिनिमम आ गया अब मिनिमम लिखा है 0.42 अब 0.42 मतलब 0.42 ईयर अब 0.42 ईयर होता नहीं है तो बेसिकली ये था आपके पास चार महीने का बच्चा मतलब जो हम बच्चे बोलते हैं यहां पर दैट से अ वो फोर मंथ का यहां पर क्या है एक बच्चा है ठीक है अब यहां पे बात करें भाई मैक्सिमम रेंज क्या होगी यहां पर तो डेटा सेट के पास जाएंगे और एज को कॉल करेंगे एंड डॉट यहां पर क्या करने वाला हूं मैक्स को कॉल करने वाला हूं मैक्स कलने पर करने पर क्या हुआ 80 ईयर के जो पर्सन है वो मैक्सिमम है अब यदि मुझे रेंज निकालनी है यहां पर तो देखिए रेंज का पहले फार्मूला देखते हैं देखिए रेंज का फॉर्मूला क्या है आप मैक्सिमम माइनस मिनिमम करते हैं और रेंज की यदि डेफिनेशन भी पढ़ेंगे तो रेंज की डेफिनेशन क्या है अ रेंज इज द डिफरेंस बिटवीन मैक्सिमम एंड मिनिमम वैल्यू इन अ डेटा सेट मतलब हमारे पास जो मिनिमम और मैक्सिमम वैल्यू के बीच का जो डिफरेंस है दैट इज कॉल ऑफ रेंज ये हमारे लिए क्या कहलाता है रेंज कहलाता है तो अब हम क्या करने वाले हैं यहां पे मिनिमम माइनस मैक्सिमम को कॉल करने वाले हैं तो एक काम करते हैं यहां पर मिन अंडरस्कोर मैं यहां पर r लगा देता हूं राइट और इसी तरह से यदि मुझे मैक्स निकालना है तो मैं मैक्स अंड r निकाल देता हूं राइट और यह रहा हमारा मैक्स का डाटा मैं इसे यहां पर प्लेस कर देता हूं ओके अब मुझे क्या करना है यहां पर ये जो मिनिमम मैक्सिमम डेटा आया है यहां पर पहले तो इसे देख लेते हैं यहां पर तो मिन r देन कॉमा मैं मैस r को कॉल कर देता हूं तो मिनिमम मैक्सिम डेटा आ गया है यहां पर और यदि मुझे रेंज निकालना है तो मैं रेंज नाम से एक वेरिएबल बना लेता हूं और रेंज नाम से वेरिएबल बनाने के बाद मैं मै अ r में से सबस्टैक कर देता हूं किसे मिन r से यस किसे सबट कर देता हूं मिन अ r से और मेरे पास जो मेरा रेंज है वो मेरे पास आ चुका है और रेंज कितना आया है यहां पर 79.5 अच्छा रेंज का दो तरीके से पता करया जा सकता है कि जो रेंज है हमारी यहां पर मतलब जो ट्रेवल करने वाले जो यहां पर पैसेंजर थे वो कहां से थे मतलब 4 महीने के बच्चे से लगाकर 80 साल के जो पर्सन होते हैं वहां तक जो लोग हैं वो ट्रेवल कर रहे थे और इनकी रेंज जो है यहां पर वो कितनी आ रही है 79.5 ए आ रही है राइट तो इस तरह से हम क्या करते हैं रेंज पता करते हैं और इससे हमें एक इंफॉर्मेशन मिलती है कि उस पर्टिकुलर जहाज के अंदर कौन से ईयर के जो ग्रुप के लोग हैं वो ट्रेवल कर रहे थे राइट तो रेंज हमें बहुत अच्छी इंफॉर्मेशन देता है ऐसे ही बहुत सारी और अदर डाटा का इस्तेमाल करेंगे तो अलग-अलग रेंज मिलेगी जैसे एक और एग्जांपल बताता है यदि मैं इस टन ड सीएवी को एक बार के लिए हटा के मेरे पास एक डेटा सेट है ट्स अटप ड सीएसवी यस यदि मैं उसका इस्तेमाल करूं तो ये जो टप ड सीएसवी है ये एक रेस्टोरेंट का डाटा है अब इस रेस्टोरेंट के डाटा के अंदर मुझे ये पता लगाना है कि मेरे रेस्टोरेंट के अंदर एक महीने के अंदर जो भी लोग आ रहे हैं इसके अंदर किस रेंज के जो बिल बन रहे हैं मतलब किस रेंज के जो बिल बन रहे हैं ये हमें चेक करना है तो यदि किस रेंज के बिल बन रहे हैं तो इसका मतलब क्या है मुझे यहां पर टोटल बिल को कॉल करना पड़ेगा एंड टोटल बिल को कॉल करने के बाद में मेरे पास जो बिल है वो कितने बन रहे हैं $3 से लगाकर $50 तक बनर है अब ये ₹ में नहीं है ये डॉलर में है क्योंकि ₹ का तो बिल कौन बनाएगा ठीक है तो ये क्या है $3 से लगाकर क्या है $50 तक का यहां पर क्या बन रहा है मेरा बिल बन रहा है ठीक है और यदि मैं रेंज की बात करूं यहां पर तो ये रेंज कितना आएगा 47 हमारे पास रेंज आने वाला है तो इस तरह से हम क्या करते हैं रेंज को फाइंड आउट करते हैं ओके चलिए तो ये हमारा पहला टॉपिक था मेजरमेंट ऑफ रिबिट के अंदर रेंज अब सेकंड टॉपिक के ऊपर बढ़ते हैं यहां पर दैट अ मीन एब्सलूट डिवीजन अब ये मीन एब्सलूट डिवीजन क्या बताता है मीन एब्सलूट डिवीजन आपके पास डेटा का वेरियंस बताता है मतलब आपका डेटा कितना स्पिड है वो आपसे बताता है और मशीन लर्निंग के अंदर जैसा कि मैंने आप लोगों को बताया है कि मशीन लर्निंग के अंदर हम डाटा जो जितना कम स्प्रिड नेस वाला डाटा लेंगे उतने ही अच्छे रिजल्ट हमें देखने को मिलते हैं राइट जितना हमारा कम स्प्रेड नेस डाटा होगा उतने ही अच्छे रिजल्ट देखने को मिलेंगे इस इस चीज को पहचानने के लिए हम यहां पर तीन में से एक चीज इस्तेमाल करते हैं अब ये तीन चीजें कौन-कौन सी है तो पहला है मीन एब्सलूट डिवीजन दूसरा है आपका स्टैंडर्ड डिवीजन और तीसरा है आपके पास यहां पर वेरियंस तो ये तीनों में से आपको कोई एक चीज को इस्तेमाल करते हुए काम में लेना है अब ये मेन एब्सलूट डिवीजन कैसे काम करता है जरा समझते हैं यहां पर लेट्स इसको मैं एक एग्जांपल के तौर प समझा रहा हूं यहां पर लेट्स सपोज कि आप एक कोई एग्जाम कंडक्ट करवा रहे हैं ठीक है आप मान लीजिए कि आपको क्या कर रहे हैं एक एग्जाम कंडक्ट करा रहे हैं और जब आप कोई एग्जाम कंडक्ट करा रहे होते हैं ठीक है तो उसके अंदर आपको क्या करना है आपको अपनी स्कूल में से आपकी जो क्लास है जैसे क्या है क्लास 10थ के है मतलब मान लीजिए क्लास 10थ के बच्चों को आपको एग्जाम कंडक्ट कराना है अब क्लास 10थ के अंदर दो सेशन है ठीक है एक सेशन ए है और एक सेशन क्या है आपके पास यहां पर बी ठीक है इनमें से कोई एक ग्रुप को चूज करना है उस पर्टिकुलर एग्जाम के लिए देखिए आप दोनों ग्रुप को तो चूज नहीं कर सकते हैं एग्जाम के अंदर क्यों नहीं कर सकते रीजन बहुत सिंपल है क्योंकि एक सर्टेन अमाउंट ऑफ स्टूडेंट ही एग्जाम के अंदर फाइट कर सकते हैं राइट तो आपको सेशन ए या सेशन बी में से कोई एक ग्रुप को सेलेक्ट करना है ताकि वह आगे आपके जो एग्जाम है या आपका जो भी कंपटीशन है उसमें फाइट कर सके राइट अब एज ए डाटा साइंटिस्ट आपको दोनों में से एक ग्रुप को चूज करना है तो आप किस ग्रुप को चूज करेंगे तो अब यहां पर आप क्या सोचते हैं कि एक काम करते हैं हम मीन फाइंड आउट कर लेते हैं दोनों का यदि आप इस दोनों डटा साइड के ऊपर यदि आप मीन फाइंड आउट करते हैं तो आप एक चीज ऑब्जर्व करेंगे कि दोनों का जो मीन है वो सेम आ रहा है गा आप यहां पर देखेंगे तो दोनों का जो मीन यदि आप देखेंगे तो वो दोनों का मीन जो है यहां पर वो सेम है अब दोनों का मीन सेम कैसे है जरा देखें यहां पर थोड़ा कैलकुलेट करके देख लेते हैं ठीक है तो मैं इनका दोनों का मीन कैलकुलेट करवा रहा हूं आपके सामने ठीक है और दोनों का जो भी मीन होगा हम उसे क्या करेंगे यहां पर देखेंगे अब मीन कैसे निकाला जाता है आप सबको पता है सम ऑफ ऑल डेटा डिवाइड बाय टोटल नंबर ऑफ डेटा इससे निकाला जाता है तो मैं क्या कर रहा हूं 75 + 65 + 73 + 68 एंड प्लस उसके बाद क्या है 72 एंड देन प्लस और 67 राइट तो ये आपका मीन आ गया 420 420 डिवाइड बाय कितने नंबर ऑफ डेटा है ये देख लीजिए 1 2 3 4 5 6 सिक्स डेटा है यहां पर डिवाइड करते हैं तो 70 आपका मीन आ रहा है मतलब यदि मैं इस चीज के मीन की बात करूं तो वो कितना आ रहा है 70 आ रहा है अच्छा एक काम करते हैं दूसरा कल ले लेते हैं ताकि आप लोगों को दिखे ठीक है तो मैं यहां पे कर रहा हूं मीन = 70 ओके अब मैं मीन निकाल रहा हूं हमारे दूसरे डाटा की दूसरे डाटा मतलब इधर वाले डाटा की मीन निकालते हैं चलिए दूसरे डेटा के मीन निकालते हैं दैट 90 प्लस उसके बाद कह रहा है 47 + 43 देन प्लस उसके बाद क्या है 96 + 93 + 51 ओके एंड इक्वल्स टू करें तो इसका भी मीन 420 आ रहा है एंड यदि मैं इसके यहां पर नंबर ऑफ टोटल नंबर ऑफ डाटा के काउंट करूं ट इ 1 2 3 4 5 6 सिक्स मतलब यहां पर सिक्स से डिवाइड करने पर आपके पास कितना आ रहा है यहां पे गाइस तो ये सिक्स में डिवाइड करने पर आपका आंसर आ रहा है 70 ओके तो गाइज यहां पर क्या पता चला कि यदि मैं इन दोनों सेशन में से कोई एक सेक्शन चूज करना चाहूं ठीक है कोई एक सेक्शन का डाटा चूज करना चाहूं तो वो मैं मीन के अकॉर्डिंग नहीं कर सकता क्योंकि मीन दोनों की कंसीडर के अंदर सेम आ रहा है मतलब दोनों के अंदर मीन जो वैल्यू है वो क्या है सेम टू सेम है तो अब यहां पे क्वेश्चन उठता है कि भाई किस तरीके से चूज किया जाए इसमें से तो यहां पर काम आता है डाटा का स्पिड नेस आप वो सेशन को चूज करेंगे जिसके अंदर स्प्रेड नेस सबसे कम है अब ऐसा क्यों देखिए यदि आप ज्यादा स्पेड नेस इस वाले डाटा को चूज करेंगे तो वो आपके लिए इफेक्टिव नहीं होगा अब कैसे चूज करेंगे जरा देखते हैं यहां पर तो मैं एक काम करता हूं गाइ यहां पर एक नंबर लाइन बना लेता हूं इसकी राइट एक नंबर लाइन इसकी बनाता हूं और एक नंबर लाइन मैं इसकी बना देता हूं ठीक है ताकि हम नंबर लाइन पे थोड़ा डटा को देख सके कि डेटा किस तरह से आ रहा है यहां पर ओके अब जरा देखिए इस डाटा के अंदर तो इसका मीन कितना आ रहा है मीन आपके पास आ रहा है 70 ओके पहले डाटा की बात करें 75 तो जो कि आपके पास यहां क हीं होगा 75 उसके बाद दूसरा है 65 तो यहां क हीं हमारा 65 होगा उसके बाद क्या है 73 तो 70 यहां 73 यहां कहीं होगा उसके बाद है 68 तो दैट 68 यहां कहीं होगा फिर कितना है 72 तो यहां कहीं 72 होगा उसके बाद है 67 तो 67 यहां कहीं होगा तो यहां पर आप एक टा चीज को ऑब्जर्व कर रहे हैं कि आपका जितना भी डाटा है यस आपके पास जितना भी डाटा है वो आपके पास क्या है मीन के आसपास है क्या है मीन के आसपास है चलिए अब बात करते हैं यहां पे तो आपका मीन कितना है 70 अब 70 में पहला क्या है 90 तो वो 70 से काफी दूर होगा 90 यस बात है 70 के बाद है 47 47 को देखेंगे तो 47 आपके पास यहां क ही होगा 43 43 उससे भी आगे होगा यहां पर उसके बाद है 96 96 उससे भी आगे 96 होगा उसके बाद है 93 मतलब यहां कहीं 93 होगा यहां पर उसके बाद है 51 51 यहां गा अब एक चीज ऑब्जर्व करने पर क्या पता चला कि सेशन बी का जो डाटा है यहां पर वो मीन के आसपास नहीं है वो डाटा मीन के आसपास नहीं है तो बेसिकली यहां पर क्या ऑब्जर्वेशन मिली हमें यहां ऑब्जर्वेशन हमें ये मिली कि हम सेशन बी की जगह सेशन ए को चूज करेंगे क्योंकि यहां पर डाटा आपका बहुत ही लेस स्प्रेड है लेस स्पेड होने का मतलब क्या है बहुत कम स्पेड है अब इससे हमें क्या फायदा मिलेगा मतलब इस एग्जाम में हमें क्या फायदा मिलेगा इस एग्जाम में ये फायदा मिलेगा कि यदि हम शशन एक स्टूडेंट को इस एग्जाम के अंदर फाइट करने के लिए भेजें तो सभी लोग जितने भी लोग हैं वो बहुत अच्छा परफॉर्मेंस करके आएंगे राइट क्योंकि उनका पास जो आपका डाटा है वो मीन के आसपास का है तो बेसिकली वो बहुत अच्छा परफॉर्मेंस करके आएंगे जबकि यदि मैं सेशन बी के लोगों को भेजूं तो इसमें होगा क्या कि आपके पास कुछ परसेंट जो लोग हैं जैसे थ्री जो पर्सन है यहां पर वही बहुत अच्छा करके आएंगे बाकी के जो लोग हैं वो फेल हो सकते हैं तो बेसिकली यदि मैं सेशन बी को भेजूं यहां पर तो उसमें क्या होगा कि मेरे पास मेरी जो स्कूल है या फिर मेरा जो सेशन है उसके जो मतलब परफॉर्मेंस की बात करें यस वो डाउनग्रेड हो जाएगी बेसिकली जबकि सेशन ए में ऐसा बिल्कुल नहीं होने वाला है क्यों क्योंकि आपका डाटा मीन के आसपास है तो गाइस क्या पता चला हमें यहां पे हमें यह पता चला कि हमें हमेशा जो डाटा है वो बहुत ही आपके पास क्या होना चाहिए कम स्पीड्स वाला डटा ना चाहिए जबकि आप देखेंगे सेक्शन बी का जो डाटा है वो बहुत ज्यादा स्पीडसक्यूबर्स यदि हमें मैथमेटिकल टर्म्स से देखना हो तो हम कैसे देखेंगे तो उसके लिए हमें काम आता है मीन एब्सलूट डिवीजन फार्मूला यस आप क्या चूज करते हैं आप मीन एब्सलूट डिवीजन फॉर्मूला यूज करते हुए आप यहां पर पता लगा सकते हैं क्योंकि हर बार हम ग्राफ नहीं बना सकते ग्राफ बनाना कभी-कभी हमारे लिए इंपॉसिबल होता है तो उस केसेस के अंदर मीन एब्सलूट डिवीजन आपकी हेल्प करता है अब ये मीन एब्सलूट डिवीजन कैसे निकाला जाता है तो दैट इज अ फार्मूला हमें ये फॉर्मूला यूज़ करना पड़ेगा और फार्मूला यूज करने के बाद में हम एक फाइनल कंक्लूजन पे पहुंचेंगे यहां पर कि हमें कौन सा सेशन लेना चाहिए राइट तो चलिए अब मैं क्या कर रहा हूं गाइस यहां पर इस मीन एब्सलूट डिवीजन फॉर्मूला को आपके सामने लगा के दिखा रहा हूं कि ये फ कैसे लगेगा मैं सेशन ए और सेशन बी जैसे बना हुआ है वैसे ही बनाने वाला हूं फिर हम ओरिजिनल डेटा सेट के ऊपर भी निकालेंगे ठीक है तो सबसे पहले क्या कर रहे हैं सेशन ए और सेशन भी बना लेते हैं तो मैं यहां पर एसी ए के नाम से एक वेरिएबल बना लेता हूं और एप डॉट यहां पर क्या करते हैं एरे बना लेते हैं ठीक है एप डॉट एरे बनाने के बाद में अब हम क्या कर रहे हैं सेशन ए के जितने भी डटा है उनको लेते हैं तो क्या आ रहा है आंसर दैट इज 75 उसके बाद क्या है गाइ यहां पर 65 65 के बाद क्या है गाइस यहां पर 73 73 के बाद में क्या है हमारा 68 68 के बाद में क्या है 72 और 72 के बाद में क्या है 67 तो ये हमारा सेशन ए आ गया उसके बाद में देखो एसएस अंडर मैं बी की बात करता हूं यहां पर ठीक है और एप डॉट मैं क्या कर रहा हूं यहां पर एरे बना रहा हूं यहां पर एप डॉट क्या करेंगे यहां पर एरे बनाएंगे एरे के अंदर हम क्या करने वाले हैं गाइज यहां पर डेटा ले रहे हैं जस्ट लाइक अ 90 90 के बाद में 47 47 के बाद में दैट अ 43 43 के बाद में हमारा हो गया 96 96 के बाद में 93 93 के बाद में 51 ओके तो ये हमारा दूसरा डाटा भी आ गया दोनों में देख लेते हैं 66 डटा है ओके चलिए तो ये हमारे दोनों डाटा आ चुके हैं अब एक छोटी सी प्रॉब्लम हो गई है देख लेते हैं कहां पे या यहां पे हो गई चलिए अब हमारे पास सेशन ए और सेशन बी आ चुका है मैं आप लोगों को थोड़ा सा ग्राफ बना के दिखा देता हूं कि ये ग्राफिकल तौर पे कैसे दिखाई देंगे चलिए तो मैं एक काम करता हूं यहां पर एओ के नाम से एक वेरिएबल बनाता हूं और एफ डॉट हम क्या कर रहे हैं यहां पे भी एक एरे तैयार कर लेते हैं क्योंकि ग्राफ ऐसे डायरेक्टली तो नहीं बनेगा लेकिन हम मैं आपको एक छोटे से तरीके से ग्राफ बना के दिखा रहा हूं कि ये कैसे बनने वाला है ओके मेरे पास सिक्स डाटा है तो 1 2 3 4 5 6 ये सिक्स डाटा मैंने ले लिया है यहां पर अब देखिए सेशन ए का डाटा और सेशन बी का जो डाटा है मैं ग्राफिकल फॉर्मेट के अंदर दिखा रहा हूं कि किस तरह से डिजाइन होने वाला है ओके तो अब देखिए मुझे वन के ऊपर 92 के ऊपर इस तरह से पॉइंट चाहेंगे यहां पर तो मैं क्या कर रहा हूं यहां पर आपके पास पीएटी डॉट स्केटर प्लॉट का इस्तेमाल करूंगा यस पीएटी डॉट में क्या करना यहां पर आपके पास यहां पर स्केटर प्लॉट का इस्तेमाल कर रहा हूं और स्केटर प्लॉट के अंदर एक्स एक्सिस और वा एक्सेस का दो डाटा चाहिए ठीक है तो एक काम करते हैं यहां पर मैं यहां पर क्या कर रहा हूं सेशन a को एक्स एक्सेस में डाल रहा हूं मतलब सेशन a का क्या करेंगे एक् एक्सेस में डालेंगे और एन को हम y एक्सेस में डालेंगे और ग्राफ को देखने के लिए मैं पीटी डॉट क्या करूंगा यहां पर शो को कॉल करूंगा तो यह देखिए ग्राफ हमारा कुछ इस तरह से बन रहा है यस 60 66 और 65 और 63 पे हमारे सारे ग्राफ्स यहां पर डिज़ाइन हो गए अब एक काम करते हैं इस ग्राफ को थोड़ा छोटा करते हैं और भी बहुत सारी चीज़ें हमें डिज़ाइन करनी है तो मैं पीएटी डॉट क्या कर रहा हूं यहां पर आपके पास फिगर का इस्तेमाल कर रहा हूं यस पीएटी डॉट हम क्या करेंगे यहां पर फिगर का इस्तेमाल करेंगे और फिगर के अंदर मैं क्या कर रहा हूं गाइज यहां पर फिक्स साइज़ का इस्तेमाल करूंगा और फिक्स साइज़ के अंदर हम क्या करेंगे इस ग्राफ को स्ट्रेच करेंगे लेकिन इस ग्राफ की साइज को थोड़ा छोटा करेंगे तो बेसिकली 8 मैं फोर का इस्तेमाल करूंगा ओके तो अभी भी काफी बड़ा ग्राफ है यहां पर तो मैं 8थ का इस्तेमाल कर देता हूं यहां पर या काफी छोटा ग्राफ हो गया यहां पर और इसकी बात करें यहां पर इस एट की जगह हम इसको 10 कर देते हैं ताकि थोड़ा स्ट्रेच वाला ग्राफ हमें देखने को मिल जाए ओके अभी हमने क्या किया स्केटर प्लॉट एक ही का बनाया हमें हमें दूसरे का भी बनाना है तो मैं पीएटी डॉट क्या कर रहा हूं फिर से स्केटर प्लॉट बना रहा हूं ताकि दोनों ग्राफ में हम कंपैरिजन देख सके कि कौन कितना स्क्रेड है ठीक है तो मैं सेशन बी का इस्तेमाल करूंगा और कॉमा एओ का इस्तेमाल कर रहा हूं राइट और इसमें एक काम करूंगा कलर इक्वल्स टू मैं यहां पर यस मैं क्या कर रहा हूं यहां पर कलर इक्वल्स टू मैं यहां पर रेड कलर डाल देता हू ओके रन करते हैं तो एक रेड कलर का डाटा आ गया और एक इस तरह से डाटा आ गया चलिए अब मैं क्या कर रहा हूं यहां पर आपके पास थोड़ा सा हाइलाइटिंग मतलब लेबल भी दे देता हूं यहां पर और लेबल इक्वल्स टू मैं डाल देता हूं यहां पर सेशन ए ठीक है सेशन आपके पास क्या है यहां पर ए का है और इसके अंदर भी लेबल डाल देते हैं यहां पर ठीक है क्या कर रहे हैं लेबल डाल देते हैं और लेबल इक्वल टू मैं क्या कर रहा हूं यहां पर आपके पास सेशन बी डाल है ठीक है सेशन ए और सेशन बी और लेबल को दिखाने के लिए पीएटी डॉट क्या करेंगे यहां पर लेजेंड को इस्तेमाल करेंगे और लेजेंड को इस्तेमाल करके रन करते हैं ठीक है चलिए देखिए अब आप खुद यहां पर ऑब्जर्व कर पाएंगे कि आपका जो मीन है चलिए मीन का भी डाटा डाल देते हैं एक्चुअल में आपका मीन का डाटा नहीं है यहां पर तो मीन भी डाल देते हैं और मीन कितना आया था हमारे पास यहां पे गाइस मीन हमारा 70 था ओके मीन क्या है 70 है और नहीं तो आप मीन को फाइंड आउट भी कर सकते हैं कैसे फाइंड आउट करेंगे आप यहां पर मीन को तो मीन को फाइंड आउट करने का तरीका क्या है यहां पर ज मैं यहां पर मीन निकालना चाहूं तो क्या करेंगे एप डॉट यहां पर क्या करेंगे मीन निकालेंगे और एनपी डॉट मीन के अंदर क्या करेंगे सेशन ए या सेशन बी दोनों में से किसी एक को डाल सकते हैं आप यहां पर तो मीन भी आपका आ जाएगा अब मुझे मीन की लाइन बनानी है तो मीन की लाइन भी बना सकता हूं पीटी डॉट यहां पर क्या करूंगा लाइन प्लॉट का इस्तेमाल करूंगा पीएटी डॉट यहां पर क्या करूंगा मैं प्लॉट का इस्तेमाल करूंगा यहां पर और प्लॉट के अंदर देखिए मुझे सेशन ए के अंदर मुझे डाटा डालना है ठीक है तो मैं क्या कर रहा हूं यहां पर गाइस तो मैं यहां पर मीन ले रहा हूं यस क्या कर रहा हूं मैं यहां पर मीन ले रहा हूं और मीन के अंदर क्या कर रहा हूं यहां पर फॉर आई इन और क्या करेंगे यहां पर रेंज का इस्तेमाल करेंगे यस फॉर आई इन आपके पास रेंज का इस्तेमाल करेंगे और रेंज में 1 से डांगे उसके बाद में मुझे क्या करना है गाइज यहां पर एनो को डालना है एनो को डाल देते हैं और जो लाइन का कलर होगा यस मैं यहां पे जो कलर होगा यहां पर वो कलर मैं दूंगा यहां पर यस कलर के अंदर सी दे देते हैं यहां पर कलर जो होगा यहां पर दैट द ब्लू कलर तो मैं यहां पे ब्लू कलर डाल देता हूं उसके बाद में मेरे को क्या करना है यहां पर लेबल देना है और लेबल इक्वल्स टू मैं क देता हूं यहां पर आपका मीन ठीक है क्या है हमारा मीन है ठीक है तो मैं ये डाल देता हूं ओके छोटी सी एरर आ चुकी है इस एरर की प्रॉब्लम को सॉल्व करने के लिए हम क्या करेंगे यहां पे गाइस कि इस मीन को यहां से हटा देंगे ठीक है और 7070 हमें सिक्स टाइम चाहिए तो वन टाइम टू टाइम थ्री टाइम फोर टाइम फाइव टाइम एंड सिक्स टाइम ठीक है अब रन कर देते हैं तो देखिए एक हमारा मीन भी आ गया अब आप देखेंगे कि जो हमारा डाटा है वो क्या हो रहा है यहां पर मीन के बहुत पासपास है यहां पर और जबकि यहां देखेंगे तो आपका जो मीन का है वो दूर-दूर है यहां पर तो बेसिकली हमें क्लस्टर डाटा नहीं नहीं चाहिए हमें मीन के पासपास वाला डाटा चाहिए तो इसलिए हम किसका डाटा को चूज करेंगे सेशन ए वाले डाटा को चूज करेंगे जो कि हमारा कैसा कलर है ब्लू कलर है राइट तो हम इसको चूज करेंगे लेकिन हम बार-बार ऐसे ग्राफ बना के तो नहीं देख सकते इसके लिए हमें क्या जरूरत पड़ेगी मीन एब्सलूट डिवीजन की जरूरत पड़ेगी तो अब हमें क्या करना है मीन एब्सलूट डिवीजन का फॉर्मूला लगाना है अब मीन एब्सलूट डिवीजन का फॉर्मूला देख लीजिए आप यहां पर x i - x ब डिवा बा n और इसका क्या कर रखा है मॉड निकाल रखा है और समेशन कर रखा है अब यहां पे पॉइंट आता है कि x बार क्या चीज है यस ये x बार क्या चीज है तो ये x बार जो आप देख रहे हैं दैट इज कॉल ऑफ मी यस ये आप पास क्या है मीन है आपके पास यहां पर और इस मॉड्यूस का मतलब क्या होता है इस मॉड्यूस का मतलब बहुत ही सिंपल है कि यदि आप इस मॉड्यूस के अंदर टू देते हैं तो ये आपको जो रिजल्ट देता है वो क्या देता है टू ही देता है लेकिन इस मॉड्यूस के अंदर यदि आप -2 देते हैं तब भी ये रिजल्ट आपको क्या देता है टू ही देता है मतलब आप इसके अंदर नेगेटिव वैल्यू डालेंगे तब भी पॉजिटिव मिलेगा पॉजिटिव वैल्यू डालेंगे तब भी आपको पॉजिटिव ही मिलने वाला है तो बेसिकली मॉड्यूस का मतलब ये है और ये सिग्मा का मतलब है सम सम करना है और डिवाइड बा n करना है हमें ये क्या निकालना है मीन एब्सलूट डिवीजन निकालना है अब ये मीन एब्सलूट डिवीजन डायरेक्टली नहीं निकलेगा आपको थोड़ी सी कैलकुलेशन करनी पड़ेगी तो चलिए मेन एब्सलूट डिवीजन निकालते हैं यहां पे सबसे पहले मैं आपको मॉड्यूस का दिखाता हूं कि मॉड्यूस कैसे लगेगा तो देखिए एप डॉट आप क्या करेंगे यहां पर एए निकालेंगे एबीएस मतलब एब्सलूट वैल्यू यदि इसके अंदर -2 दे रहे हैं यहां पर तो देखिए टू आ रहा है यहां पर और यदि आप यहां पर टू दे रहे हैं तब भी क्या आ रहा है टू आ रहा है दैट अ एब्सलूट वैल्यू तो अब मैं क्या कर रहा हूं मीन स्क्वायर मीन एब्सलूट डिवीजन निकाल लाहा हूं यहां पर तो देखिए मैं क्या कर रहा हूं यहां पर मीन एब्सलूट डिवीजन के नाम से एक वेरिएबल बनाता हूं और a लगा देता हूं राइट अब क्या करना है मुझे फॉर्मूला बनाना है तो देखिए पहले मैं क्या करूंगा ए - a निकालूं देखिए मैं एक-एक करके आपके पा प्रोसेस बताऊंगा यहां पर तो सबसे पहले क्या करेंगे एसआई माइनस ही करेंगे माइनस मुझे क्या करना है गाइ यहां पर मीन से सबट करना है यस किससे सबस्टैक करना है मीन से सबै करना है जैसे ही रन करूंगा देखिए मेरा जो डाटा है वो मीन से सबस्टैक हो चुका है यहां पर मीन से सबस्टैक होने के बाद में देखिए हमारा नेक्स्ट प्रोसीजर क्या होगा मुझे एब्सलूट वैल्यू निकालनी है क्या निकालनी है मुझे एब्सलूट वैल्यू निकालनी है एब्सलूट वैल्यू निकालने के लिए एनपी डॉट मैं क्या करूंगा यहां पर एबीएस का इस्तेमाल करूंगा तो देखिए इन सबकी क्या निकल गई एब्सलूट वैल्यू निकल गई एब्सलूट वैल्यू निकालने के बाद में नेक्स्ट प्रोसीजर क्या होगा गाइ यहां पर मुझे इनका सम करना है तो एप डॉट मैं क्या करूंगा गाइ यहां पर सम फंक्शन को कॉल करूंगा तो ये सम आ सम आने के बाद मुझे डिवाइड करना है और डिवाइड क्या करना है यहां पर लेंथ ऑफ क्या करना है यहां पर एसएससी ऑफ a से करना है और रन करेंगे तो ये देखिए मीन एब्सलूट डिवीज़न आ चुका है यहां पर और ये मीन एब्सलूट डिवीजन किसका आया है गाइज यहां पर ये मीन एब्सलूट डिवीज़न ऑफ़ a आया है यहां पर तो मैं इसे सेव कर लेता हूं अब मे से मुझे मीन एब्सलूट डिवीजन क्या करना है b निकालना है देखिए मीन एब्सलूट डिवीजन यदि मैं b निकालूं तो वो हमें यहां पर ज्यादा मिलने वाला है यस देखिए मैं एसे स ऑफ a की जगह b कर देता हूं जहां-जहां है वहां वहां मैं क्या करता हूं आपके पास यहां पर b कर देता हूं रन करते हैं अब देखिए यहां पर मैं चेक करता हूं गाइज यहां पर किसका मीन एब्सलूट डिवीजन ऑफ a देन कॉमा मीन एब्सलूट डिवीजन ऑफ b रन करते हैं देखिए a का जो मीन एब्सलूट डिवीजन है वो आपका लो मिल रहा है और मीन एब्सलूट डिवीजन जो b है वो आपको ज्यादा मिल रहा है तो इसका मतलब क्या हुआ गाइज यहां पर कि आपके पास जो भी रियल टाइम डाटा है यहां पर उस रियल टाइम डाटा के अंदर आपको क्या करना है मीन एब्सलूट डिवीजन निकालना है और मीन एब्सलूट डिवीजन निकालने के बाद में आपको चेक करना है कि जो आप दो डटा ले रहे हैं उसमें से मीन एब्सलूट डिवीजन किसका कम है जिसका मीन एब्सलूट डिवीजन कम होगा आप उसी डाटा को कंसीडर करेंगे राइट तो यह जो प्रॉब्लम है वो बेसिकली कब इस्तेमाल की जाती है जब आपके पास टा बहुत ज्यादा स्पीडसक्यूबर कि मीन एब्सलूट डिवीजन कभी-कभी क्या होता है सेम निकल जाता है कभी-कभी डटा का राइट तो कुछ ऐसे डाटा होते हैं जिनके अंदर दो डाटा के मीन एब्सलूट डिवीजन सेम हो जाते हैं तो वहां पे हम इस्तेमाल करते हैं स्टैंडर्ड डिविजन का यस क्या इस्तेमाल करेंगे स्टैंडर्ड डिविजन का इस्तेमाल करेंगे और स्टैंडर्ड डेविएशन यहां पर निकालेंगे अब आप चाहे तो स्टैंडर्ड डेविएशन निकाल सकते हैं या फिर आप चाहे तो वेरियंस निकाल सकते हैं दोनों का फार्मूला क्या है सेम है अब सेम कैसे है गाइ यहां पर जरा देखिए देखिए मीन एब्सलूट डिवीजन का यदि आप फॉर्मूला देख स्टैंडर्ड डिविजन का यदि आप फॉर्मूला देखेंगे तो ये क्या है रूट ऑफ आपके पास क्या है सिगमा x i - म का स् डि बा n ये आपका फॉर्मूला है यहां पर अब यदि मैं यहां पर बात करूं वेरियंस का फॉर्मूले की बात करूं तो वेरियंस का फॉर्मूला क्या है कि भाई जो भी आपका यहां पर कोई फॉर्मूला है इस फॉर्मूले का क्या करेंगे आप स्क्वायर कर देंगे तो आपके पास क्या मिल जाएगा वेरियंस मिल जाएगा मतलब आपके पास क्या करना है स्टैंडर्ड डिविजन का स्क्वायर करने पर आपको क्या मिल जाएगा वेरियंस मिल जाएगा तो इनके बीच में क्या रिलेशन है यस वेरियंस और स्टैंडर्ड डिविजन के बीच में क्या रिलेशन है बहुत ही सिंपल सा डि रिलेशन है यहां पर कि जो आपका स्टैंडर्ड डिविजन है मैं इसको एटीडी से रिप्रेजेंट करूंगा क्योंकि एसटीडीसी के नाम से ही फॉर्मूला यहां पर स्टैंडर्ड डिविजन का आप स्क्वायर करेंगे तो आपको क्या मिल जाएगा आपको वेरियंस मिल जाएगा जिसे हम v बोलते हैं अब इनके अंदर हमें क्या चीज ध्यान रखनी पड़ती है कि भाई जो आप दो डाटा ले रहे हैं जो भी आप यहां पर दो डाटा ले रहे हैं उन दो डाटा के अंदर जो वेरियंस है या फिर जो स्टैंडर्ड डिविज है वो कम आएगा उसी को लेना है मतलब जिसका स्टैंडर्ड डिविज या जिसका वेरियंस आपका सबसे लो होगा हम उसी को देंगे मतलब जैसे हमने क्या देखा मीन एब्सलूट डिवीजन को हमने कम किया था यस मीन एब्सलूट डिवीजन को हमने देखा था कि जिसका मीन एब्सलूट डिवीजन कम है हम उस डाटा को लेंगे सेम एज प्रोसीजर के अंदर भी यहीं भी यही होता है कि जिसका वेरियंस ए स्टैंडर्ड डिविजन कम होगा हम उसी को ही कंसंट्रेशन करने वाले हैं चलिए इसको जरा थोड़ा प्रैक्टिकली देख लेते हैं यहां पर तो ये रहे हमारे दो डाटा जिसके अंदर आप देख रहे हैं सेशन ए और सेशन बी को हमने चूज कर रखा है अब मैं क्या कर रहा हूं दोनों का मैं क्या कर रहा हूं गाइज यहां पर स्टैंडर्ड डिविजन निकाल रहा हूं इसके साथ-साथ में वेरियंस भी निकाल हूं कैसे निकलेगा ये तो इसके लिए डायरेक्ट फॉर्मूला है आपके पास यहां पर आप क्या करें एप डॉट क्या करेंगे यहां पर स्टैंडर्ड डिशन निकालना है तो उसके लिए आपके पास फॉर्मूला होता है एसटीडी एसटीडी मतलब स्टैंडर्ड डिवीजन होता है और आप सेशन ए का स्टडी निकाल दीजिए ठीक है सेशन ए का स्टडी निकाल दीजिए उसके बाद में एप क्या करेंगे यहां पर एसटीडी को कॉल करेंगे और ये क्या करेंगे सेशन बी को भी निकालेंगे तो सेशन ए सेशन बी का स्टैंडर्ड निकालिए तो देखिए आपके पास क्या निकल रहा है ये थी निकल रहा है और ये कितना निकल रहा है 23 निकल रहा है राइट तो आपको क्या देखने को मिला कि आपका जिसका स्टैंडर्ड डेविएशन कम है हम उसी को चूज करेंगे क्योंकि वेरियंस और स्टैंडर्ड डेविएशन भी आपके डाटा के स्पिड नेस को ही शो करते हैं इसकी जगह अब हम क्या करेंगे हम वेरियंस निकालेंगे एप डॉट यहां पे क्या कर रहे हैं वेरियंस का इस्तेमाल कर रहे हैं तो मैं वेयर का इस्तेमाल करूंगा जहां पे एएसी ड ए का इस्तेमाल करूंगा एंड एप डॉट मैं क्या कर रहा हूं यहां पर आपके पास फिर से वेरियंस का इस्तेमाल करूंगा यहां पर और क्या करने वाला हूं एसएससी ऑफ यहां पर बी का इस्तेमाल कर रहा हूं रन करेंगे तो देखिए वेरियंस आपके पा इसका कितना आ रहा है 14 आ रहा है और इसका कितना आ रहा है 537 के आसपास आ रहा है राइट तो बेसिकली जिसका वेरियंस या स्टैंडर्ड डेविएशन कम है हम उसी को चूज करने वाले हैं जिसका स्टैंडर्ड डेविएशन ऑफ वेरियंस सबसे ज्यादा है हम उसे चूज नहीं करेंगे ठीक है अब आप एक चीज नोटिस भी करेंगे कि ये वाला जो डाटा आपके पास आ रहा है ये क्या है इसका स्क्वायर ही है अब आप बोलेंगे कैसे स्क्वायर है सर 3 का स्क्वायर तो नाइन होता है नहीं आप थोड़ा मिस्टेक कर रहे हैं यहां पर देखिए मैं आपको दिखा देता हूं ये डाटा मैं एग्जैक्ट उठाता हूं यहां पर और यहां पर जाने के बाद मैं इस डेटा को रखता हूं और डबल स्टार ऑफ टू लगा के रन करूं तो देखिए 41.9 6666 के आसपास या रहा डाटा तो ये स्परिंग ही है एगजैक्टली ये क्या है फोर के आसपास है तो 4 का स्क्वायर आपके पास क्या होता है 16 होता है तो उससे थोड़ा सा कम है तो इसकी वजह से आपके पास 14 है राइट तो बेसिकली जिसका स्टैंडर्ड डेविएशन एंड वेरियंस कम होगा हम उसी डाटा को प्रेफर करेंगे या फिर आपका मीन एब्सलूट डिवीजन कम होगा हम उसी डेटा को प्रेफर करेंगे ये कब काम आता है अब मेन इंपोर्टेंट चीज ये है देखिए जब आप रियल वर्ल्ड डाटा के ऊपर काम करते हैं तो वहां पे वेरियंस ए स्टैंडर्ड डिविजन आप निकालते हैं मीन एब्सलू कम निकालते हैं क्योंकि इसका डायरेक्टली फॉर्मूला नहीं है हमारे पास ठीक है तो हम क्या करते हैं वेरियंस या फिर स्टैंडर्ड डिविजन निकालते हैं वेरियंस एंड स्टैंडर्ड डिविजन की वैल्यू आपको हाई ख है एक ही सिंगल कॉलम की बात कर रहा हूं मैं दो सिंगल कॉलम के दो कॉलम की कंपैरिजन प नहीं आ रहा मैं यहां पर सिंगल कॉलम पे आ रहा हूं यदि आपको वैल्यू हाई ख है अब हमें कैसे पता चलगा कि ये वैल्यू हाई है देखिए आपके पास जो डाटा है वो जीरो के आसपास नजर आ रहा है मतलब आपके पास यहां पर 3 4 पा 10 10 तक आ रहा है ट्स ओके यदि उससे ज्यादा आ रहा है इसका मतलब डेफिनेटली वो बहुत ज्यादा स्टर्ड है डाटा यहां पर यस बहुत ज्यादा फैला हुआ डेटा है यहां पर तो आप उस समय ध्यान रखें जैसे मैं आपको रियल वर्ल्ड एक डेटा के ऊपर प्रॉब्लम दिखाता हूं राइट तो रियल वर्ल्ड डेटा के ऊपर प्रॉब्लम नहीं देखिए कैसे निकलती है तो मैं एक काम करता हूं मैं यहां पर डाटा सेट को लोड करता हूं यहां पर और उसके लिए मैं पीडी डॉट यहां पर क्या कर रहा हूं रीड सीएसवी का इस्तेमाल करूंगा और यहां पर जो हमारा टाइटनिक डाटा है उसको हम ले लेंगे ठीक है और रन करते हैं फिर उसके बाद चलते हैं डेटा सेट के पास यहां पर और डॉट हैड लगाते हुए इसके अंदर तीन डाटा को देखेंगे तो ये मिल गया अब जैसे एज ग्रुप है एज ग्रुप के अंदर या फिर आप चलिए फेयर के ऊपर भी चल सकते हैं एज ग्रुप बद है तो मैं एज के ऊपर बात करता हूं यहां पर कि एरियल जो है हमारा वो कितना स्क्रेड है मतलब कितना फैला हुआ है ये चीज हमें देखनी है यहां पर ठीक है ये चीज हमें देखनी है तो उसके लिए हम क्या करेंगे डेटा सेट निकालेंगे यहां पर और उसके बाद मैं क्या करूंगा यहां पर एज को कॉल करूंगा डॉट वेरियंस का इस्तेमाल करूंगा यस क्या करूंगा व आर वेरियंस का इस्तेमाल करूंगा रन करूंगा तो वेरियंस कितना आ रहा है 200 के करीब आ रहा है इसका मतलब ये डाटा बहुत ज्यादा फैला हुआ है राइट ये टा हमारे पास क्या है ये डाटा बहुत ज्यादा स्क्रेड है राइट अब इसकी स्क्रीड स को देखने के लिए हमें ग्राफ की जरूरत पड़ेगी वैसे जो अभी मैं आपको ग्राफ बताना चा रहा हूं ये ग्राफ आगे चलते हुए हम पढ़ने वाले हैं जब हम यहां पे स्क्यूनेस पढ़ेंगे जब हम जाके आगे चलते हुए नॉर्मल डिस्ट्रीब्यूशन पढ़ेंगे राइट हम डिस्ट्रीब्यूशन के कर्व देखेंगे तब हम इसको और अच्छे से देखेंगे लेकिन इस ग्राफ को अभी मैं शो करूंगा ताकि आप लोगों को थोड़ा सा आईडिया हो सके कि ये ग्राफ कैसा है ठीक है हम यहां पे क्या कर रहे हैं ग्राफ बना रहे हैं और ये ग्राफ हम आगे चलते हुए पढ़ने वाले हैं लेकिन तो भी मैं इसका एक ग्राफ बना रहा हूं ठीक है जो कि हम आगे चलते पढ़ेंगे लेकिन अभी मैं इसको थोड़ा सा यहां पे क्लेरिफाई कर रहा हूं कौन सा ग्राफ बनेगा तो इसके लिए मैं क्या कर रहा हूं गाइज यहां पर एए डॉट यहां पर हिस्टोग्राम बनाऊंगा यस ए क्या करूंगा हिस्टोग्राम बनाऊंगा हिस्टोग्राम बनाने के बाद में मैं क्या कर रहा हूं यहां पर x एक्सेस पे क्या ले रहा हूं गाइज यहां पर एज ले रहा हूं एंड डटा इक्वल्स टू क्या कर रहा हूं यहां पर डाटा सेट लेर ओके और पीएटी डॉट क्या कर रहे हैं ग्राफ को शो कर रहे हैं यहां पर और रन कर देते हैं देखिए ये ग्राफ बन चुका है अब इस ग्राफ के अंदर ऑब्जर्व करेंगे कि आपका जो आपका डाटा है वो जो मेजर है वो डाटा यहां है लेकिन ये डाटा बहुत आगे जाते हुए फैला हुआ है देखिए आपका जो मेजर डाटा है वो 40 तक ही है लेकिन उसके आगे देखिए बहुत डाटा फैला हुआ है 80 तक आपका डाटा फैला हुआ है राइट तो इसका मतलब क्या है इसके अंदर आपके पा क्या है बहुत ज्यादा स्प्रेड नेस है यहां से हमें आइडिया लग रहा है कि डाटा क्या है बहुत ज्यादा स्प्रेड नेस से है यहां पर देखिए 30 के बाद आगे चलेंगे तो देखिए आगे बहुत ज्यादा स्पीड नेस आ रहा है तो इस तरह से आप क्या कर सकते हैं वेरियंस निकाल सकते हैं अच्छा स्टैंडर्ड डेविएशन निकालना हुआ तो हम कैसे निकालेंगे तो वो भी आप निकाल सकते हैं देखिए डटा सेट डॉट यहां पर यदि एज लगाएंगे एज लगाने के बाद में यहां पर एसटीडी लगा दए क्या लगाएंगे एचटीडी लगा के रन करेंगे तो आपका स्टैंडर्ड डेविएशन भी आ जाएगा इवन दैट आप यह सारी चीजें कैलकुलेशन सेल्फ नहीं करना चाहते मतलब एक-एक डेटा के साथ नहीं करना चाहते तब भी आप ये सारी कैलकुलेशन कर सकते हैं कै डटा सेट डॉट यहां पर आप क्या करें डिस्क्राइब को कॉल कर रहे यस जैसे ही आप डिस्क्राइब को कॉल करके रन करेंगे तो देखिए आपका डिस्क्राइब निकल जाएगा इसके अंदर क्या होगा जितने भी न्यूमेरिकल कॉलम होंगे उनके डिस्क्राइब निकल जाते हैं और डिस्क्राइब के अंदर क्या-क्या चीजें निकलती है सबसे पहले निकलता है काउंट काउंट मतलब टोटल नंबर ऑफ टा उसके अंदर कितना परसेंट है ठीक है सेकंड चीज निकलती है मीन मीन मतलब उसका मीन क्या है यस डेटा का मीन क्या है थर्ड चीज निकलती है स्टैंडर्ड डिविज स्टैंडर्ड डिविज आपको मिल जाता है यहां पर उसके बाद मिलती है मीन मीन मतलब मिनिमम वैल्यू क्या है यहां पर और मैक्सिमम वैल्यू क्या है अब यहां पे है 25 50 और 75 दैट इज अ परसेंटेज आप यही सोच रहे होंगे नॉट इट्स नॉट अ परसेंटेज इट्स कॉल्ड ऑफ परसेंटाइल्स यस ये क्या है यहां पर ये परसेंटाइल्स है ना कि परसेंटेज है परसेंटाइल्स और परसेंटेज के अंदर बहुत बड़ा डिफरेंस है और ये डिफरेंस आगे आने वाले वीडियो के अंदर कवर अप होने वाला है यहां पर कि ये जो 25 परसेंटाइल्स है ये क्या होता है और परसेंटेज जो होता है वो क्या होता है म दोनों में बहुत बड़ा डिफरेंस है उस डिफरेंस को हम निकालेंगे मतलब क्या है वो देखेंगे अच्छे जानेंगे यहां पर अच्छे से और उसी के अंदर बॉक्स प्लॉट के बारे में भी थोड़ा डिस्कस करने वाले हैं राइट तो ये हमारा अगला पार्ट है लेकिन अभी आपके दिमाग में ये रहना चाहिए कि दैट इज अ परसेंटाइल अब परसेंटेज क्या है आगे समझेंगे यहां पर अब ये डिस्क्राइब क्या करता है गाइज यहां पर ये आपके पास प्रॉपर पूरी एनालिसिस करके देता है यहां पर कि कौन सा डाटा किस तरह से है यहां पर क्या है अब जैसे देखिए एज की बात करता हूं एज आपके पास क्रेड है या नहीं है देखिए मिनिमम वैल्यू कितनी है 43 है ठीक है और मैक्सिमम वैल्यू देखेंगे तो 80 है अब इसकी मीन देखेंगे तो 29 है तो ये मीन के आसपास है क्या 80 नो मीन के आसपास नहीं है ये डाटा हमारे पास इसका मतलब क्या है स्प्रेड्स सबसे ज्यादा है यहां पर राइट जो कि हमें दिख भी रही है स्टैंडर्ड डिविजन देखेंगे तो स्टैंडर्ड डिविजन भी आपके पास आ गया 14 के आसपास है राइट और 14 का स्क्वायर करेंगे तो आपके पास वेरियंस भी आपको देखने को मिल जाएगा ठीक है तो इस तरह से हम डेटा का स्प्रेड्स के बारे में पता करते हैं और डेटा जितना ज्यादा स्प्रेड बस होगा यहां पर उतना ही ज्यादा आगे प्रॉब्लम करेगा कब जब आप मशीन लर्निंग एल्गोरिदम को इस्तेमाल करेंगे राइट तो आई थिंक आई होप सो समझ में आ चुका होगा कि स्टैंडर्ड डेविएशन और वेरियंस कैसे निकाला जाता है ये स्टैंडर्ड डेविएशन और वेरियंस के फॉर्मूले आपको हल्के से लर्न होने चाहिए मतलब इतना भी नहीं कह रहा कि आप इसको याद ही कर लो नो क्योंकि हमें तो कोडिंग में इसको इस्तेमाल करना है और कोडिंग में हमारे पास डायरेक्टली हमारे पास यहां पर है फंक्शंस हम उसी का इस्तेमाल करेंगे राइट तो बेसिकली आपको थोड़ा सा याद होना चाहिए कि हां ये फॉर्मूले कैसे वर्क करते हैं और क्या है यहां तो चलिए शुरू करते हैं यहां पर कि परसेंटेज क्या होता है परसेंटाइल्स क्या होता है एंड ये क्वांटल क्या होता है और बेसिकली मशीन लर्निंग के अंदर इसको कहां यूज किया जाएगा डेटा साइंस के अंदर इसको कहां यूज किया जाएगा इसके बारे में इन डेप्थ नॉलेज लेते हैं सबसे पहले मैं आपकी सबसे पहली जो प्रॉब्लम है उस प्रॉब्लम को दूर करता हूं कि परसेंटेज और परसेंटाइल में क्या अंतर है दैट इ अ वेरी वेरी इंपोर्टेंट चीज जब तक आपको ये चीज समझ में नहीं आएगी तब आप आगे क्वानटाइज को नहीं समझ पाएंगे तो देखिए यहां पे एक बहुत बड़ा कन्फ्यूजिंग वाला टर्म होता है कि व्हाट इज अ परसेंटाइल्स एंड व्हाट इज अ परसेंटेज यस परसेंटेज क्या है और परसेंटाइल्स क्या है इनके बीच में डिफरेंस क्या है इसको समझना बहुत ज्यादा जरूरी है तो इसको हम एक छोटे से एग्जांपल के थ्रू इसे समझते हैं ठीक है लेट्स आपको एक एग्जाम देते हैं सपोज कीजिए आपको एक एग्जाम दे रहे हैं यहां पर ठीक है और वो एग्जाम दे रहे हैं आप यहां पर और उस एग्जाम के अंदर पांच आपके सब्जेक्ट है और उन पांच सब्जेक्ट के अंदर आपके पास 100 में से कुछ मार्क्स आते हैं ठीक है अब आपने एग्जाम दे दिया एग्जाम देने के बाद में जैसे ही आप घर पे आए मतलब रिजल्ट आने के बाद आप घर प आए तो आपके एपोस के जो लोग हैं वो आपसे आके पूछते हैं कि बेटा कितने परसेंटेज मार्क्स लेके आए हो तुम राइट मतलब कितने परसेंटेज मार्क्स आए हैं तुम्हारे एग्जाम के अंदर अब यहां पे एक वर्ड यूज हुआ है परसेंटेज अब ये परसेंटेज कैसे कैलकुलेट करते हैं तो बचपन से लेकर अभी तक आप परसेंटेज ही कैलकुलेट करते है परसेंट टाइल्स कभी नहीं कैलकुलेट करते हैं अब ये परसेंटेज कैसे कैलकुलेट किया होगा आप लोगों ने राइट ताकि आप लोगों के फ्रेंड्स एंड फैमिली में आप बता सके तो बहुत ही सिंपल है जैसे आपने कोई एग्जाम दिया राइट जैसे कि आपने क्लास 10थ का एग्जाम दिया है लेट्स सपोज क्लास 10थ का एग्जाम दिया है और क्लास 10थ के अंदर आपके पांच सब्जेक्ट्स है जैसे कि पहला सब्जेक्ट आपके पास क्या है यहां पर आपका साइंस है दूसरा क्या है यहां पर मैथमेटिक्स है यहां पर और मैथमेटिक्स के बाद में आपके पास आ गया इंग्लिश इंग्लिश के बाद में आपके पास आ गया हिंदी एंड हिंदी के बाद में आप आपके पास आ गया एसएसटी यस सोशल स्टडीज ठीक है तो ये पांच सब्जेक्ट है आपके पास यहां पर ये पांच सब्जेक्ट क्या है 100 मार्क्स के पेपर्स के यस ये पांचों सब्जेक्ट क्या थे 100 100 मार्क्स के पेपर्स थे इन 100 100 मार्क्स में से आपने कुछ नंबर्स गेन किए होंगे जस्ट सपोज मैं मान लेता हूं अभी के लिए कि आपने सब में 8080 मार्क्स गेन किए हैं राइट सब में कितने मार्क्स किए हैं 8080 मार्क्स गेन किए हैं अब आपसे आपके जो पड़ोसी है वो आपसे पूछते हैं भाई कितने परसेंटेज मार्क्स लेके आए हैं यह बता दो तो आप क्या करते हैं आप यह करते हैं कि इन नंबर का टोटल करते हैं जो कि होता है आपके पास 500 और फिर आप क्या करते हैं इन नंबर्स का भी टोटल करते हैं और जो कि होता है यहां पर आपका 400 अब आपको निकालना है परसेंटेज यस आपको क्या निकालना है परसेंटेज निकालना है यहां पे तो परसेंटेज निकालने के लिए आप क्या करते हैं यहां पर गाइ कि ये 400 डिवाइड बाय क्या करते हैं यहां पर 500 मल्टीप्ला बा 100 करते राइट और जैसे ही मैं इसको इससे कट करूं और 58 40 एंड यहां पर 80 पर आपके सामने निकल के आता है मतलब आपने उस एग्जाम के अंदर आपने 80 परज गेन किए राइट सिंपल सा आप ये जवाब देते हैं आई थिंक ये चीज आपने बचपन में भी बहुत पड़ी होगी राइट लेकिन ये परसेंटाइल्स क्या चीज है देखिए परसेंटाइल्स काफी जगह प यूज किया जाता है जैसे आप कोई गवर्नमेंट एग्जाम देते हैं तो वहां पे भी परसेंटाइल्स यूज किया जाता है या फिर आप जेई मैन जेई एडवांस के एग्जाम दे होगे इन पास्ट के अंदर तब वहां पे भी परसेंटाइल्स का यूज होता है अब ये परसेंटाइल है क्या चीज मतलब क्या है ये परसेंटाइल अब मानते हैं परसेंटाइल क्या है इसको समझने के लिए वापस एक एग्जांपल पे चलते हैं जैसे कि आपने क्लास 10थ का एग्जाम दिया यस आपने क्या किया एग्जाम दिया क्लास 10थ के में आपके क्लास 10थ का एग्जाम देने के बाद आपके कुछ रैंक आई होगी अब आप एग्जाम में बैठते हैं तो डेफिनेटली क्लास के अंदर कुछ ना कुछ स्टूडेंट्स होंगे और उनमें कुछ ना कुछ रैंक आई होगी लेट्स सपोज मानते हैं कि आपके क्लास के अंदर 100 स्टूडेंट्स है मतलब उस एग्जाम को 100 स्टूडेंट्स ने आपका एग्जाम दिया है 100 स्टूडेंट ने एग्जाम दिया है उसमें से जो आपकी रैंक आई है यस मैं बात करूं यहां पर रैंक के बारे में तो आपकी जो रैंक आई है वो फोर्थ रैंक मतलब आपके पास यहां पर अब आपने यहां पर मतलब जो 10थ क्लास का एग्जाम था इसके अंदर 100 स्टूडेंट बैठे थे और उसमें आपकी फोर्थ रैंक आपने गेट की है ओके अब आप यहां पे परसेंटाइल्स क्या बताएंगे तो यहां पे परसेंटाइल्स होती है कि आपकी रैंकिंग क्या है मतलब परसेंटाइल्स का बेसिक मतलब ये होता है कि आपके पास ग्रुप ऑफ डाटा को यदि मैं सेंडिंग ऑर्डर के अंदर अरेंज कर दूं तो उस ग्रुप ऑफ डाटा का पोजीशंस क्या है यह हम बता ते हैं परसेंटाइल्स के हेल्प से अब ये कैसे बताया जाता है जरा समझते हैं यहां पर तो देखिए परसेंटाइल्स यदि आपको निकालना है यस क्या निकालना है यहां पर आपको परसेंटाइल्स यदि आपको निकालना है तो उसके लिए आप क्या करेंगे उसके लिए आपके पास नंबर ऑफ स्टूडेंट्स आपने कितने थे एग्जाम के अंदर आपकी रैंक कौन सी आई है डिवाइड बाय टोटल नंबर ऑफ स्टूडेंट कितने बैठे थे और मल्टीप्लाई बाय 100 जैसे आप ये करेंगे तो आपकी यहां पर क्या आएगा 96 आ जाएगा इसका मतलब क्या है ये जो 96 है दैट इज कॉल ऑफ पर्सन गाइज ये 96 क्या है यहां पर परसेंटाइल्स को इंडिकेट करता है अब गाइज यहां पर परसेंटेज और परसेंटाइल्स के बीच में क्या डिफरेंस देखने को मिला परसेंटेज आपके पास क्या होता है एक इंडिविजुअल पर्सन का डाटा होता है मतलब बेसिकली कोई इंडिविजुअल पर्सन है उसने कोई एग्जाम दिया है उस एग्जाम के अंदर उसने अपने इंडिविजुअल मार्क्स गेट किए राइट मतलब अपने कुछ आपके पास यहां पर क्या है कि आपके पास एक बेस चीज होती है उस बेस चीज में से आप क्या करते हैं कुछ चीज फाइंड आउट करते हैं उसको हम परसेंटेज की कैटेगरी में डाल वहीं पे बात करें परसेंटाइल्स के बारे में तो परसेंटाइल्स क्या है एक तरीके का रैंकिंग सिस्टम है यस ये क्या है रैंकिंग सिस्टम है और ये रैंकिंग सिस्टम उस समय निकाला जाता है जब आपके पास कोई भी बेस नहीं होता है जैसे अभी मेरे क्लास के अंदर कितने स्टूडेंट हैं 100 स्टूडेंट हैं लेट्स सपोज कल 120 स्टूडेंट हो जाएंगे तब क्या होगा तो ये चीजें चेंज हो जाएगी राइट तो वहां पे परसेंटाइल्स भी क्या होंगे चेंज हो जाएंगे तो बेसिकली परसेंटेज जो है हमारा यस हम परसेंटेज की बात करें तो परसेंटेज के लिए क्या होना चाहिए एक बेस होना चाहिए बेस का मतलब क्या है गाइज यहां पर बेस है यहां पर 500 मतलब 500 है यहां पर 500 में से आपने कितने मार्क्स ऑब्टेन किए हैं दैट इज कॉल अ परसेंटेज और यहीं पे आपको रैंकिंग निकालनी है यहीं पे आपको क्या करनी है रैंकिंग के बारे में बात करनी है तो यू गो टू परसेंटाइल्स तो परसेंटाइल्स क्या है गाइज यहां पर इट्स कॉल्ड ऑफ रैंकिंग सिस्टम और इसको हम एक सिंपल लैंग्वेज में बात करें तो परसेंटाइल्स आपको इंडिकेट करता है कि किसी भी एग्जाम के अंदर या किसी भी सिचुएशन के अंदर आप कितने लोगों से सुपीरियर हैं आप कितने लोगों से सुपीरियर हैं या फिर आपने कितने लोगों को बैक किया है मतलब आपने कितने लोगों को पीछे छोड़ा है यहां पर राइट दैट इज कॉल ऑफ पर्सन टाइज यस दैट इज कॉल ऑफ पर्सन टाइज ओके तो चलिए अब थोड़ी परसेंटाइल्स की डेफिनेशन देखें तो परसेंटाइल्स क्या है यहां पर एक स्टैटिक्स नंबर है यहां पर जो कि डिस्क्राइब क्या करता है यहां पर कि आपने आपसे पीछे कितने लोग थे यहां पर उसको इंडिकेट करता है राइट तो दैट इज कॉल्ड ऑफ परसेंटाइल यस हम इसे क्या बोलते हैं गाइ यहां पर परसेंटाइल बोलते हैं अब बात करें ये जो परसेंटाइल होता है ये परसेंटाइल आपके पास यहां पर 0 परसेंटाइल से लेके आपके पास क्या होता है 100% तक का डाटा होता है जी0 परसेंटाइल्स का मतलब गाइ मैं बात करना चाहूं यहां पर यस जी0 परसेंटाइल का मतलब क्या है सबसे लोअर नंबर आपके पास आ जाएगा यहां पर और 100 परज मतलब सबसे ज्यादा वाला जो नंबर है वो आपके पास आ जाएगा ओके तो दैट इज कॉल्ड ऑफ परसेंटाइल यस ये आपका पास क्या कहलाता है परसेंटाइल आता है जैसे कि इस सिस्टम में भी दे सकते हैं यस इधर भी आप देख सकते हैं देखिए आपके पास क्या है 100% टाइल 10 पर टाइज का मतलब क्या है पीछे के लोग आपके पास आ रहे हैं और जैसे-जैसे आप आगे जा रहे हैं तो 90 पर टाइल्स 50 पर टाइल्स आपके पा इस तरह से चलता है ओके अब बात करते हैं यहां पर एक और नया टर्म यहां पर था हमारे पास जैसे कि मैं बात करूं एक तो हमारे पास टर्म था परसेंटाइल्स था और दूसरा क्या था यहां पर कॉन टाइल काथा यस दूसरा क्या था कंटल अब ये कोरटाइल क्या चीज होती है तो देखिए आपके पास जो आपका परसेंटाइल है यस आपके पास जो आपका परसेंटाइल है वो आप सबको पता है कि वो कहां से शुरू हो रहा है आपका जीरो से शुरू होता है और वो कहां पे खत्म हो रहा है 100% डायल्स पे आपका खत्म हो रहा है राइट 100% डस पे खत्म हो रहा है इसको हमने क्या किया बराबर फोर इक्वल पार्ट्स के अंदर तोड़ दिया जैसे मैंने यहां पे पहला इक्वल पार्ट टूटा जैसे 25 पर सेकंड इक्वल पार्ट तोड़ा मैंने यहां पर 50 पर डस पे थर्ड पार्ट तोड़ा मैंने 75 पर डस पे ओके और फोर्थ वाला पार्थ कौन सा था 100% तो हमने क्या किया कि भाई हमारी जो इक्वल रेंज है हमारी जो इक्वल रेंज है इस इक्वल रेंज को फोर इक्वल्स पार्ट में तोड़ दिया दैट इज कॉल्ड परसेंटाइल और ये जो पहला पार्ट आ रहा है इसको हम बोलते हैं फर्स्ट कं टाइल यस ये क्या कहलाता है आपका पास यहां पर फर्स्ट कं टाइल उसके बाद ये जो पार्ट है आपका 50 पर डज वाला यहां पर पार्ट है दैट इज कॉल्ड ऑफ सेकंड कं टाइल और ये जो 75 पर वाला पार्ट है यहां पर दैट इज कॉल ऑफ थर्ड क्वांटल यस ये क्या है आपका थर्ड क्वांटल है तो बेसिकली गाइज आपने क्या किया कि जो आपका 100% ऑफ रेंज है यहां पर उसको आपने क्या किया फोर इक्वल पार्ट्स के अंदर डिवाइड कर दिया दैट इज कॉलम परसेंट अब इस परसेंटाइल्स का यूज़ कहां पे करते हैं गाइज यहां पर तो इस परसेंटाइल का यूज़ आई क्यूआर मेथड में करते हैं यस कहां करते हैं यहां पर आई क्यूआर मेथड में में करते हैं आई क्यूआर मेथड मतलब इंटर क्वांटल रेंज के अंदर करते हैं अब ये इंटर क्वांटल रेंज क्या है यहां पर तो जब आप मशीन लर्निंग के अंदर वर्क करेंगे यस जब आप मशीन लर्निंग प बक करेंगे तो मशीन लर्निंग के अंदर जो आप डटा लेते हैं मतलब डेटा कैप्चर करते हैं डेटा गैदर करते हैं यहां पर इस डाटा के अंदर क्या होता है सम अमाउंट्स ऑफ आउटलायर होता है यस सम अमाउंट ऑफ आउटलायर होता है अब यहां पे एक पॉइंट आता है व्हाट इज आउटलायर तो इसके लिए आपको मशीन लर्निंग की डेटा क्लीनिंग वाली जो प्लेलिस्ट है उसको आपको देखना पड़ेगा मैं आपको थोड़ा सा यहां पे आपको आईडिया देता हूं कि व्हाट इज आउटलायर आउटलायर क्या होता है गाइ यहां पर कि वो डाटा जो हमारे बियोंड द रेंज चला जाए मतलब रेंज से बाहर चला जाए काफी दैट कॉल्ड ऑफ आउटलायर जैसे एग्जांपल के तौर पे मैं यहां पे लिखूं 2 3 4 5 6 यहां पर और फिर उसके बाद लिख दूं 2 3 4 5 6 ये कुछ हमारा डाटा है और अचानक से आपके पास आचा है 100 200 500 राइट तो इसका मतलब क्या हुआ कि गाइ ये जितना भी डाटा है ये तो हमारे एक रेंज के अंदर है टू से लेकर सिक्स तक लेकिन यहां पर 100 200 500 ये क्या है गाइज यहां पर दैट इज कॉल ऑफ आउटलायर दैट इज कॉल ऑफ आउटलायर आउटलायर क्यों बोला हमने इसको क्योंकि हमारी रेंज जो चल रही है वो टू से लगाकर सिक्स तक के बीच में चल रही है मतलब एक रेंज के बीच में चल रही है यहां पर लेकिन अचानक से हमारे पास कुछ डाटा एक्स्ट्राऑर्डिनरी आ गया यहां पर दैट इज कॉल ऑफ आउट यस दैट इज कॉल ऑफ आउटलाइन ठीक है तो ये आउटलायर जब हमारे पास आते हैं गाइस यहां पर इस आउटलायर को फाइंड आउट करने के लिए आउटलायर को फाइंड आउट करने के लिए हम क्या करते हैं इंटर क्वांट लिंज का इस्तेमाल करते हैं दैट इज कॉल ऑफ आई क्यूआर मैथ दैट इज कॉल्ड ऑफ आई क्यूआर मेथड हम इस आई क्यूआर मेथड की हेल्प से हम क्या करते हैं गाइज यहां पर आउटलायर को फाइंड आउट करते हैं अब पॉइंट यहां पे आता है कि ये आईक्यू आर मेथड कैसे वर्क करता है ठीक है तो ये आईक्यू आर मेथड आपके परसेंटाइल्स पे वर्क करता है कैसे वर्क करता है जरा समझते हैं यहां पे गाइस यहां पर तो देखिए आपके पास जो भी आपका डाटा है यहां पर उस डाटा के अंदर आप सबसे पहले क्या करते हैं गाइज यहां पर q1 पॉइंट फाइंड आउट करते हैं q1 पॉइंट मतलब आपके पास क्या है फर्स्ट कं टाइल रेंज पॉइंट आउट करते हैं इट्स कॉल ऑफ 25 परसेंटाइल्स को हम यहां पर फाइंड आउट करते उसके बाद में क्या करना है गाइस यहां पर हमें थर्ड कं टाइल को फाइंड आउट करना है इट्स कॉल ऑफ 75 पर कंटालू फाइंड आउट करना है ओके उसके बाद में गाइ यहां पर ये जो मीडियन आपके पास देखा जा रहा है यहां पर ये जो मीडियन आपके पास है ये मीडियन आपका पास क्या होता है ये मीडियन आपका पास आता है q2 इट्स कॉल ऑफ 50 पर ऑफ डेटा यस ट्स कॉल ऑफ q2 इट्स कॉल ऑफ 50 पर टाइल्स ऑफ योर डाटा अब हम क्या करते हैं गाइ यहां पर आई क्य आर निकालते हैं ये आई क्यूआर क्या होता है गाइज यहां पर ये आई क्यूआर होता है इंटर कंटालू रेंज कहां से आती है ये इंटर क्वांटल रेंज आती है q3 - q1 से मतलब थर्ड क्वांटल को आपको सबस्टैक करना है किससे फर्स्ट क्वांटल से तो आपको मिलती है इंटर क्वांटल ले अब इन इस इंटर क्वांटल रेंज से आप क्या करते हैं आपकी मिनिमम वैल्यू निकालते हैं और आपकी मैक्सिमम वैल्यू निकालते हैं और इन्हीं मिनिमम और मैक्सिमम वैल्यू के बियोंड मतलब बाहर जो भी डाटा आपके पास आता है दैट इज कॉल ऑफ आउटलाइन या मानली क्या होता है आउटलायर होता है तो इस तरह से आउटलायर को फाइंड आउट करने के लिए हम क्या यूज करते हैं आई क्यूआर मेथड का यूज करते हैं और ये जो आईक आकूर मेथड है ये आई क्यूआर मेथड आपके पास क्या करता है परसेंटाइल्स के बेसिस पे वर्क करता है तो बेसिकली गाइस हमें परसेंटाइल्स और क्वांटल क्यों पढ़ना है परसेंटेज एंड क्वांटल इसलिए पढ़ना है क्योंकि हमें हमारे डेटा सेट में से आउटलायर निकालना होता है मशीन लर्निंग के अंदर बात करें या फिर हम डेटा साइंस के अंदर बात करें तो वहां पे हमारे सिस्टम के अंदर जो आउटलायर प्रेजेंट है यहां पर उनको हमें निकालने के लिए क्या इस्तेमाल करना पड़ता है परसेंटाइल्स का इस्तेमाल करना पड़ता है विदाउट एनी परसेंटाइल आप काम नहीं कर सकते यहां पर और बेसिकली हम यहां पर परसेंटेज ही क्यों निकाल रहे हैं परसेंटेज से हमारा काम नहीं चलेगा क्या बेसिकली आप परसेंटेज से आप काम चला सकते हैं लेकिन आपके पास कोई बेस वैल्यू नहीं है जैसे मैं बात करूं एज के बारे में जस्ट एक सिंपल सा एग्जाम देता हूं कि मेरे पास एक ग्रुप ऑफ डाटा है यहां पर जो कि एज का है ठीक है 100 पीपल का एज का डाटा है अब मैंने कहा यहां पर कि पहले का क्या परसेंटेज ऑफ एज है दैट इज अ फलिश क्वेश्चन एक बहुत ही मजाकिया क्वेश्चन है यहां पर कि आपके पास जो पहला डाटा आया है जैसे मैं बात करूं मेरे पास एक ग्रुप ऑफ डाटा है यहां पर और उसके अंदर बहु सारी एज लिखी है यहां पर और मैं बोलूं 22 साल का वाला जो पर्सन है इसकी क्या परसेंटेज एज है अब आप बोलोगे कि सर परसेंटेज एज इसकी कैसे निकाले कोई फिक्स एज होगी उसमें से डिवाइड करके निकाल सकते हैं यस कोई फिक्स एज होगी उसके डिवाइड करके निकाल सकते हैं कि भाई 100 साल हमारी एज है तो उसमें से 22 निकालनी है तो 22 अप 100 करके निकाल लेंगे तो फिर परसेंटेज जज बता सकते हैं अदर वाइज हम परसेंटेज नहीं बता सकते राइट तो अब यहां पर आप क्या बताएंगे आप परसेंटेज ऑफ जज बताएंगे परसेंटेज ऑफ जज मतलब क्या है कि भाई आपके पास एक 1000 ग्रुप ऑफ डेटा 1000 ग्रुप ऑफ डेटा या 100 ग्रुप ऑफ डेटा भी आपके पास है यहां पर उसके अंदर ये जो 22 वाला जो पर्सन है ये कौन सी रैंकिंग प है ये कौन सी रैंकिंग पे है आप ये बता सकते हैं आराम से उसके लिए आप परसेंटेज का यूज कर सकते हैं राइट कि भाई 22 वाला जो है इस ग्रुप ऑफ डाटा में कौन सी रैंकिंग प है ये तो बता सकते हैं हम यहां पर तो इस चीज के लिए हम पर्सेंट ते और यही चीज का इस्तेमाल हम किसम करते हैं गाइस यहां पर इंटर क्वांटल रेंज के अंदर अब ये जो आप चार्ट देख रहे हैं ये चार्ट कहलाता है बॉक्स प्लॉट इस चार्ट को हम क्या कहते हैं बॉक्स प्लॉट कहते हैं और ये जो बॉक्स प्लॉट होता है ये बॉक्स प्लॉट बेसिस होता है ऑन द परसेंटाइल मतलब ये परसेंटाइल्स के बेसिस पे वर्क कर गेटिंग माय पॉइंट गाइ तो बेसिकली हमें कभी भी डेटा ग्रुप ऑफ डेटा मिल जाए तो वहां पे हमें परसेंटाइल से निकालना होता है नॉट अ पर्सेंट ओके चलिए अब जरा इसे थोड़ा प्रैक्टिकली समझते हैं कि ये कैसे निकाला जाता है क्या है इस चीज है ना इसको समझते हैं यहां पर तो मैं आपको ले चलता हूं जुपिटर नोटबुक के अंदर एंड जुपिटर नोटबुक के अंदर मैं अपनी एक नई नोटबुक ओपन कर लेता हूं और उसके बाद में मेरे पास देखिए आपको पता है कि हमारे पास बहुत सारा डाटा है और जैसा कि आपने यदि लगातार वीडियो देखी है आपको पता है कि हम दो डाटा सेट पर लगातार काम करते जा रहे हैं दैट द टाइटनिक ऑफ डटा एंड tscpget.com ऑ एंड प उसके बाद ग्राफ बनाना है ग्राफ बनाने के लिए हम मैट पप का इस्तेमाल करेंगे गाइस यहां पर तो मैट डॉट यहां पर पवा प्लॉट एलियाज ऑफ पटी उसके बाद गाइ हम यहां पर इंपोर्ट करने वाले हैं किसे यहां पर सी बन यस सी बन एलियाज ऑफ ए चलिए अब हमारा जो डेटा सेट है उसे लोड करते हैं और डटा सेट का नाम क्या है पडी सए से पहले तो लोड करेंगे और यहां पर डेटा सेट का नाम है titan.com डॉट हैड लगाते हुए इसके तीन डाटा को मैं लिखूंगा ओके अब हमारे पास जो देखिए एज वाला डाटा है अच्छा इस एज वाला डाटा में नल वैल्यू है अभी यहां पर डटा सेट डॉट यदि मैं हेड ऑफ थ्री की बात करूं यहां पर तो अ सॉरी डटा सेट ऑफ इज नल की बात करेंगे हम यहां पर ठीक है इज नल की बात करेंगे यहां पर और डॉट सम लगा के यहां पर इसे रन करेंगे रन करेंगे तो यहां पर एज मिलेगा और जज के अंदर 177 आपके पास यहां पर मिसिंग वैल्यू तो पहले इस मिसिंग वैल्यू को फिल कर दिया जाए तो फिल करने के लिए हम डेटा सेट डॉट डटा सेट देन यहां पर किसका यूज करेंगे एज का इस्तेमाल करेंगे डॉट यहां पर मैं लगाऊंगा फिल एनई और फिल एनई के अंदर जाने के बाद मैं डाटा सेट डेटा सेट का इस्तेमाल करूंगा वापस फिर से राइट क्या इस्तेमाल करना हूं डेटा सेट का इस्तेमाल करूंगा यहां पर और एज का इस्तेमाल करूंगा डॉट अब मुझे क्या करना है गाइस यहां पर मैं डाटा सेट के अंदर मीन फिल कर रहा हूं क्या फिल कर रहा हूं गाइस यहां पर मीन को फिल कर रहा हूं और मीन को फिल करने के बाद मैं दैट मैं इन प्लेस लगाऊंगा यहां पर इन पलेस इक्वल टू ट्रू एंड रन कर तो अब हमारे पास हमारे डाटा के अंदर कोई भी मिसिंग वैल्यू प्रेजेंट नहीं है इस एज के अंदर मतलब न्यूमेरिकल डेटा ओबवियसली चलिए अब हमें क्या करना है गाइ यहां पर कि ये जो एज है ये हमें मिल चुका है अब मेरे को क्या करना है इसको पर परसेंटाइल निकालना है क्या निकालना है परसेंटाइल्स निकालना है इसके अंदर कि 20 परसेंटाइल 50 परज ऑफ डाटा क्या है यहां राइट तो परसेंटाइल कैसे निकालेंगे गाइज यहां पर तो मैं अपने डटा सेट के पास जाऊंगा और एज को कॉल करूंगा अब एज को कॉल करने के बाद आप चाहे तो नपाई का इस्तेमाल कर सकते हैं नपाई के अंदर जाएंगे यहां पर और यहां पर जाने के बाद में आप परसेंटाइल्स को कॉल कर सकते हैं एंड परसेंटाइल के अंदर जाने के बाद में दैट a एंड q मिलेगा आपको यहां पर a क्या चीज है गाइज यहां पर ए इज योर डाटा एंड q इज योर परसेंटाइल अब परसेंटाइल देखिए आप यहां पर कैसे डालेंगे तो मस्ट बी बिटवीन 0 टू 100 मतलब 0 टू 100 के बीच में आपको परसेंट डज देना है तो देखिए मैं टा सेटड ए यहां पर पहले पास करा देता हूं देन सेकंड चीज मुझे कितना परसेंटेज देना है दैट 25 प परसेंटेज तो 25 प परसेंटेज कितना है 22 हमारे पास है इवन दैट यदि मेरे को 75 परसेंटाइल्स भी निकालना है तो भी निकाल सकता हूं गाइज यहां पर कैसे देखिए मैं यहां पर क्या करूंगा 75 लिखूंगा यहां पर रन करूंगा तो वो कितना आ रहा है 35 राइट तो ये 75 परज भी मेरे पास क्या निकल गया है डाटा निकल तो इस तरह से आप क्या कर सकते हैं हमारा परसेंटाइल फाइंड आउट कर सकते हैं इवन दैट आप वन परसेंटेज भी निकालना चाहे आप वन निकाल सकते हैं देर इज अ सिक्स और यदि आप रो परसेंटाइल यहां पर देते हैं तो ये आ रहा है 0.42 0.42 मतलब एकदम बच्चा एकदम चाइल्ड वाली बात करी जा रही है तो 0.42 का मतलब क्या है गाइस यहां पर इसका मतलब क्या है ये मिनिमम है मिनिमम नंबर है मतलब देखिए गाइज मैंने आपको लोगों को बोल था कि जो परसेंटेज होता है वो जीरो से लेके 100 तक होता है जीरो मतलब सबसे मिनिमम नंबर 100% मतलब सबसे मैक्सिमम नंबर तो देखिए मैं इसका मिनिमम और मैक्सिमम निकालता हूं ठीक है देखिए मैं डेटा सेट के पास जाता हूं यहां पर और एज करता हूं और एज के बाद में डॉट मैं यहां पर मिन को कॉल करता हूं तो यदि आप मिन को देखेंगे तो मिन आपके पास क्या आ रहा है 0.42 आ रहा है जैसा कि मैंने आपको बोला था 0 परसेंटाइल आपका मिनिमम होता है अब यदि मैंने यहां पर 100% दे दी तो इसका मतलब क्या है मेरा मैक्सिमम डाटा तो देखिए मैक्स निकाल के देखते हैं यहां पर तो यदि मैं यहां पर मैक्स की बात करूं यहां पर तो मैक्स देखिए 8 आरहा है ओके अब मैंने आपको बोला था कि 50 परज आपके पास क्या होता है आपके डाटा का मीडियन होता है मीडियन मतलब मिनिमम वैल्यू मतलब बीच वाली जो वैल्यू होती है वो आपके पास होता है अब हम क्या करने वाले हैं गाइस यहां पर मैं यहां पर मीडियन को कॉल कर रहा हूं मीडियन आपके पास होता है और मीडियन की बात करें गाइस यहां पर तो मीडियन की बात करें तो गाइस देखिए 29.6 आपको मिल रहा है और यहां पे भी देखिए 29.6 आपको मिला तो मतलब 50 पर क्या हुआ गाइ आपका मीडियन हुआ और जैसा कि हम देखिए बॉक्स प्लॉट में भी देख पा रहे हैं ये जो मीडियन वाली लाइन है ये आपके पास क्या होता है आपका 50 परका डेटा होता है राइट तो हमें 50 परज ऑफ आपका डाटा भी देखने को मिल गया तो परसेंटेज से आप यहां पर जी0 पर 50 पर जो भी आप निकालना चाहे वो आप फाइंड आउट आराम से कर सकते हैं राइट अब देखिए यहां पर मैं एक और चीज बताना चाहूंगा आप लोगों को यदि आप डटा सेट डॉट डिस्क्राइब को कॉल करते हैं यहां पर कैसे करते हैं डिस्क्राइब को कॉल करते हैं और डिस्क्राइब को कॉल करने के बाद देखते हैं तो आपको हर एक न्यूमेरिकल क्लास की 50 परज आपको वैल्यू मिल जाती है 25 पर आपको वैल्यू मिल मिल जाती है 75 पर टाइल्स आपको वैल्यू मिल जाती है मैक्सिमम वैल्यू मिल जाती है और मिनिमम वैल्यू मिल जाती है इवन दैट ये 25 पर डाइल्स 50 पर डाइल 75 ल आपको ये भी इंडिकेट करवा देती है कि इसके अंदर आउटलायर प्रेजेंट है या नहीं है कैसे देखिए इसकी थोड़ी सी न्यूमेरिकल एनालिसिस है उसको जरा समझते हैं यहां पर देखिए मान लीजिए कि ये आपका डटा है ये आपका डाटा है इस डाटा के अंदर मिनिमम डाटा कितना है देखिए इस डाटा के अंदर मिनिमम डाटा कितना है पहले वो देखिए तो यदि इस डाटा के अंदर यदि मैं मिनिमम पॉइंट के ऊपर चलूं तो मिनिमम पॉइंट है 0.42 मिनिमम पॉइंट क्या है 0.42 है उसके बाद 25 परस ऑफ डेटा की बात करें तो वो कितना है 22 है तो 25 पर ऑफ योर डेटा इज 22 50 परस ऑफ डेटा की बात करें तो 29.6 है 29.6 है और 75 परस ऑफ डाटा की बात करें गाइज यहां पर तो वो कितना है आपके पास 35 है और मैक्सिमम की बात करें गाइज यहां पर तो वो कितना है आपके पास अब आप ऑब्जर्वेशन कीजिए यहां पर क्या ऑब्जर्वेशन करेंगे यहां पर कि आपके पास 75 परसेंटाइल्स ऑफ योर डाटा 75 परस ऑफ योर डाटा का मतलब गाइ यहां पर क्या है कि 75 पर जो आपका डाटा है राइट 75 पर योर डाटा जो है यहां पर आपके ओवरऑल डेटा का 75 जो डेटा है यहां पर वो 35 में ही फिनिश हो रहा है क्या हो रहा है 35 में ही फिनिश हो रहा है यहां पर ओके और मैक्सिमम कहां कंसीडर कर रहा है मैक्सिमम 80 पे कंसीडर कर रहा है तो मैं कह रहा हूं 75 पर जो डटा है वो 35 पे आके अटक गया यहां पर और मैक्सिमम 80 में डिफरेंस करा है तो इसके बीच में एक बहुत लंबा कैप है देखिए 75 पर टाइल्स और मैक्सिमम के बीच में यदि आपको बहुत बड़ा गैप दिख जाए इसका मतलब क्या है डेफिनेटली इसका मतलब ये है कि इसके अंदर आउटलायर प्रेजेंट है सेकंड चीज यहां पर ये भी देख सकते हैं देखिए पीछे देखिए चार महीने का बच्चा है यहां पर और 22 साल का पर्सन है इसके अंदर भी आपके पास काफी बड़ा डिफरेंस है लेकिन कंपेरटिवली आगे वाला जो डिफरेंस है वो ज्यादा है देखिए 35 और 80 मतलब ऑलमोस्ट मैं मान लूं यहां पर 45 का डिफरेंस है यस ऑलमोस्ट कितना है 45 का डिफरेंस है यस ये 45 का डिफरेंस एकदम ज्यादा है क्यों ज्यादा है यहां पर देखिए आपके पास 22 के बाद 29 आपका तो मीडियन आ गया 29 क्या आ गया आपका मीडियन आ गया ये जो मीडियन है वो आपके पास क्या है 25 पर की तरफ शिफ्ट है आपका जो मीडियन वैल्यू आप देख पा रहे हैं मीडियन वैल्यू जो है आपका यहां पर वो 22 की तरफ शिफ्ट है इसका मतलब क्या हुआ गाइस यहां पर मीडियन आपका जो है वो लेफ्ट साइड की तरफ आपका शिफ्टेड है नॉट अ राइट साइड इसका मतलब डेफिनेटली इसके अंदर आउटलायर है यस तो आप पहले देखिए कैलकुलेशन देखिए कैलकुलेशन से आपको पता चल जाएगा कि देखिए ये 29 है और ये 22 है इसका मतलब मीडियन किस तरफ शिफ्ट है आपके पास 25 की तरफ शिफ्ट है इसका मतलब डेफिनेटली आपके पास आउटलायर है राइट इसका मतलब क्या है डेफिनेटली आपके पास आउटलायर है और इसको देखना है हमें आउटलायर है या नहीं है तो वी यूजिंग अ बॉक्स प्लॉट यस हम क्या यूज करने वाले हैं बॉक्स प्लॉट यूज करने वाले हैं कैसे देखिए मैं बॉक्स प्लॉट बनाने जा रहा हूं कैसे एनएस डॉट यहां पर क्या करूंगा बॉक्स प्लॉट कॉल करूंगा यस ए ट क्या करूंगा मैं बॉक्स प्लॉट को कॉल करूंगा बॉक्स प्लॉट के अंदर क्या करेंगे गाइस यहां पर एक्स एक्सेस के अंदर मैं क्या दूंगा यहां पर आपके पास a दे दूंगा एंड डटा इक्वल्स टू क्या पास करेंगे डेटा सेट पास करेंगे एंड इसके साथ-साथ मुझे क्या पास करना है गाइज यहां पर आपका पा पीटी श यस पीटी ड शो फंक्शन को पास करना एंड जैसे ही मैं रन करूंगा गाइज यहां पर देखिए डेफिनेटली इसके अंदर बहुत सारे आउट लायर्स है और जैसा कि मैंने बोला था आगे भी आपको आउट लायर्स मिलेंगे क्यों मिलेंगे यहां पर तो देखिए 0.4 0.4 मतलब आपके 4 महीने का बच्चा और 22 इसके बीच में गैप कितना आ रहा है यहां पर अराउंड 22 का गैप आ रहा है और ये वेरी वेरी लार्ज अमाउंट ऑफ गैप ये गैप जितना कम होगा आउटलायर नहीं मिलेंगे आपको यस आपको आउटलायर नहीं मिलेंगे अच्छा इसके साथ-साथ देखिए फेयर में भी देख लेते हैं फेयर के अंदर देखिए आपके पास यहां पर 25 पर कितना है 7.9 मिनिमम कितना है 0 है ना और 50 पर कितना है 14 और ये कितना है 31 और मैक्सिमम कितना है 512 ओके तो बेसिकली 75 और आपके पास मैक्सिमम में गैप आप देखेंगे तो कितना है बहुत ज्यादा है कितना है ब बहुत ज्यादा यहां पर देखिए एक तो 31 है और एक आपके पास क्या है 512 है तो ये गैप आपके पास बहुत ज्यादा आ गया अब जब गैप आपके पास बहुत ज्यादा आ जाता है तो डेफिनेटली उसके अंदर आउटलेट्स है यस आप चेक कर सकते हैं एज की जगह मैं यहां पे फेयर लगा देता हूं ठीक है क्या लगाता हूं फेयर और जैसे ही मैं फेयर लगाऊंगा देखिए मेरा मैक्सिमम डाटा उस तरफ शिफ्ट हो गया है तो यहां पर हमारा क्या है मैक्सिमम बहुत सारे आउटलेट्स है यस गाइ क्लियर आप लोगों को समझ में आ रहा है तो ये परसेंटाइल है आपके पास यहां पर ये परसेंटाइल आपकी हेल्प करते हैं किस तरह से आउटलाइन फाइंड आउट करने के लिए जस आउटलाव को रिमूव करने के लिए और भी बहुत सारी जगह पर ये आपकी बहुत ज्यादा और आज के इस वीडियो के जरिए हम बात करेंगे मेजरमेंट ऑफ सिप्स के बारे में देखिए मेजरमेंट ऑफ सिप्स के अंदर आज जो हम डिस्कस कर रहे हैं दैट इज कॉल्ड ऑफ स्क्यूनेस यस स्क्यूनेस क्या होती है कैसे हम किसी डाटा को देखकर पहचानेंगे कि इसके अंदर स्क्यू है या नहीं है मतलब स्क्यूनेस है या नहीं है बेसिकली और स्क्यूनेस का बेसिक मतलब मैं बात करना चाहूंगा यहां पर कि आपका डाटा कितना ज्यादा स्प्रेड है स्प्रेड मतलब कितना ज्यादा फैला हुआ है ये चीज हमें यहां पर पता चल जाएगा और हम यहां मशीन लर्निंग के अंदर कोशिश करते हैं कि हमारा डटा स्प्रेड ना हो और यदि हमारा डटा जितना ज्यादा स्प्रेड होगा उतना हमारे लिए प्रॉब्लम होने वाली है क्यों प्रॉब्लम होगी क्योंकि डाटा स्प्रेड बस होगा तो डेटा की इंफॉर्मेशन कलेक्ट करने में हमें बहुत टाइम लगेगा और उससे हमें रॉन्ग आंसर्स देखने को मिल जाएंगे तो मशीन लर्निंग या फिर डेटा साइंस के अंदर डाटा के स्प्रेड के बारे में बहुत ध्यान से चीजें ऑब्जर्व की जाती है इसके लिए हम यहां पर स्क्यूनेस को पढ़ते हैं यदि आपको पाइथन मशीन लर्निंग डेटा साइंस एंड डेटा एनालिसिस ज फीड में अपने आपको को ग्रो करना है तो इसके लिए डब्ल्यू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं अब स्क्यूनेस के अंदर जो सबसे इंपॉर्टेंट चीज हमारे पास होती है कि व्हाट इज स्क्यूनेस स्क्यूनेस होता क्या है तो स्क्यूनेस आपके पास जो भी आपका डाटा होता है जो भी आप डाटा यहां पर स्टडी कर रहे हैं यहां पर उस डाटा के अंदर सबसे पहले आप क्या करते हैं कि वो डाटा कितनी बार रिपीटेशन हुआ है अब डाटा जितनी बार भी रिपीटेशन हुआ उनको आप यहां पर क्या करते हैं ऑब्जर्व करते हैं और ऑब्जर्व करके आप क्या करते हैं एक फ्रीक्वेंसी डिस्ट्रीब्यूशन चार्ट्स बनाते हैं यस आपको क्या करना है फ्रीक्वेंसी डिस्ट्रीब्यूशन चार्ट बनाना है उस फ्रीक्वेंसी डिस्ट्रीब्यूशन चार्ट्स के जरिए हम हमारी स्क्यूनेस को देखते हैं कि स्क्यूनेस किस तरह की है यहां पर राइट अब मेजर्ली हम यहां पे क्या कोशिश करते हैं कि हमारी जो स्क्यूनेस है वो जीरो रहे मतलब आपके पास यहां पर कोई स्क्यूनेस हमें नहीं देखने को मिलनी चाहिए राइट हम यहां पर स्क्यूनेस जीरो जाता है अब स्क्यूनेस जीरो जाने का मतलब क्या है यहां पे गाइस कि हमारा जो डाटा है वो आपस क्या हो सिमेट्री हो सिमेटिक का मतलब क्या है कि उस डाटा का राइट हैंड साइड पार्ट और लेफ्ट हैंड साइड पार्ट जो है हमारा वो इक्वल है अब उससे होगा क्या कि यदि आपका डाटा स्क्यूनेस होगा तो उससे क्या होगा कि उसके अंदर आउटलाइंस प्रेजेंट होंगे यस डेफिनेटली उसके अंदर आउटलाइन प्रेजेंट होंगे और आउटलाइन प्रेजेंट होने की वजह से गाइस उसमें होगा क्या प्रॉब्लम उसमें प्रॉब्लम ये होगी कि आपके पास डाटा जो होगा यहां पर वो स्क्रैच ज्यादा हो जाएगा यस वो आपके पास क्या होगा फैला हुआ ज्यादा आपका पास देखने को मिलेगा इसीलिए हम चाहते हैं कि हमारे डटा के अंदर क्या हो स्क्यूनेस कम हो और यहां पर हम चाहते हैं सिमेटिक डाटा हो यहां पर अब इसे स्क्यूनेस को निकालने के लिए हमारे पास क्या होता ये फॉर्मूला होता है इस फॉर्मूले की हेल्प से हम क्या करते हैं स्क्यूनेस निकालते हैं लेकिन हमारे पास ऐसे बहुत सारी लाइब्रेरीज है जिनके अंदर ये फॉर्मूला इन बिल्ड लिखा हुआ है हम उस लाइब्रेरी का इस्तेमाल करते हुए क्या करेंगे स्क्यूनेस को निकालेंगे अब बेसिकली हमारे पास जो स्क्यूनेस होता है इस स्क्यूनेस को देखने के लिए हम क्या करते हैं गाइ यहां पर फ्रीक्वेंसी डिस्ट्रीब्यूशन को इस्तेमाल करते हैं फ्रीक्वेंसी डिस्ट्रीब्यूशन के जरिए हम यहां पर सेे कैलकुलेट करते हैं इसके साथ-साथ कम्युलेटिव डिस्ट्रीब्यूशन भी हम इस्तेमाल करते हैं जिसके जरिए हम ये सारी चीजें कैलकुलेट करते हैं अब ये फ्रीक्वेंसी डिस्ट्रीब्यूशन क्या होता है तो बेसिकली आपके पास कोई डाटा है उस डेटा के अंदर इस रेंज के अंदर आपका जो डेटा है वो कितनी बार आपके पास आ रहा है मतलब मैंने बोल लिया कि जीरो से 20 के बीच में कितने डेटा प्रेजेंट है यहां पर तो दैट अ 55 डाटा सेवन डाटा ए डाटा इतना डेटा प्रजेंट है तो वो आपके पास यहां पर आपके चार्ट्स बनते रंग हैं इसके लिए हम क्या इस्तेमाल करते हैं गाइस यहां पर इसके लिए हम यहां पर इस्तेमाल करते हैं आपका हिस्टोग्राम चार्ट यस हिस्टोग्राम चार्ट इस्तेमाल करते हैं हिस्टोग्राम चार्ट से भी आप अपना डाटा का स्नेस देख सकते इसके साथ-साथ आगे चलते हुए हम प्रोबेबिलिटी डिस्ट्रीब्यूशन चार्ट भी पढ़ेंगे यस जिसे हम पीडीएफ बोलते हैं यस जिसे हम क्या बोलते हैं पीडीएफ बोलते हैं तो हम पीडीएफ के जरिए भी हमारे डाटा की स्क्यूनेस को पहचानेंगे राइट वहां से भी हम स्क्यूनेस में देखने को मिलती है अब ये डिपेंड करता है कि आपका डटा कैसा है आपका डाटा यहां पर डिस्क्रीट इन नेचर के अंदर है राइट आपके पास तो आप यहां पर क्या करते हैं आप इस्तेमाल करते हैं instagram2 ऑब्जर्वेशन नहीं ले पाते हैं तो आपको मूव करना आता है पीडीएफ के अंदर पीडीएफ मतलब प्रोबेबिलिटी डिस्ट्रीब्यूशन फ्रीक्वेंसी चार्ट्स के अंदर मूव करना पड़ता है जहां पे आपको टर ऑब्जर्वेशन देखने को मिल जाती है तो बेसिकली गाइज हम क्या करते हैं हम सबसे पहले फ्रीक्वेंसी डिस्ट्रीब्यूशन चार्ट बनाते हैं उस फ्रीक्वेंसी डिस्ट्रीब्यूशन चार्ट से ही हम क्या करते हैं पता करते हैं कि हमारे डटा की स्क्यूनेस किस तरह की है अब यहां पे एक टर्म्स ऐड की है दैट अ कंपलेट डिस्ट्रीब्यूशन चार्ट ये फ्रीक्वेंसी डिस्ट्रीब्यूशन चार्ट से ही आपके पास मिलता है जोर्ट है ये क्या कहलाता है गाइ यहां पर तो देखिए कम्युनिटी डिस्ट्रीब्यूशन चार्ट्स आपके पास बहुत आपकी हेल्प करता है ये कब करता है यहां पर तो ये आपके स्टैटिकल एनालिसिस के अंदर बहुत हेल्प करता है अब ये स्टैटिकल एनालिसिस में किस तरह से हेल्प करता है जरा गाइ समझे यहां पर तो कम्युलेटिव डिस्ट्रीब्यूशन चार्ट के अंदर क्या होता है कि आपका जो भी आपका डाटा आ रहा होता है लगातार है ना उनको एडिशन करते हुए हम आगे बढ़ते हैं जैसे कैसे तो पहला डाटा एज इट इज आपके पास आएगा दूसरा डाटा क्या होगा जो पहले वाले डाटा से ऐड होके आएगा जैसे 5 + 8 ऐड होके आपको देखने को मिलेगा तो 5 प् ड 8 ऐड करके करें तो ट्स कितना आता है 13 आता है 13 के साथ आप क्या करेंगे 12 ऐड करेंगे तो 13 के साथ 12 ऐड करेंगे तो आपके पास क्या मिलेगा 25 मिलेगा 25 के साथ आपके पास यहां पर सिक्स को ऐड करेंगे तो आपके पास क्या मिलने वाला है गाइस यहां पर तो आपको मिलने वाला है 31 तो इस तरह से आपका जो डेटा होता है वो लगातार ऐड करते हुए आपके पास देखने को मिलता है अब गाइ फ्रीक्वेंसी डिस्ट्रीब्यूशन से आप क्या पता करते हैं फ्रीक्वेंसी डिस्ट्रीब्यूशन से ये पता करते हैं कि इस रेंज के अंदर कितना डटा है जैसे कि मेरे पास एक क्वेश्चन है यहां पर क्वेश्चन ये है कि 22 30 की रेंज के अंदर आपके पास यहां पर कितना डाटा है तो 22 30 की रेंज के अंदर आप क्या बोलेंगे य डेटा है लेकिन मैं ये बोलूं कि आपके पास 30 तक की रेंज के अंदर कितना डटा है अब 30 तक की रेंज के अंदर यदि मैंने आपका डेटा के बारे में पूछा है इसका मतलब मैंने क्या किया है कि जो मिनिमम डाटा से लगाकर 30 तक की रेंज का डाटा है वो सपोज अब इसके लिए आप क्या करेंगे इन दोनों डाटा को कैलकुलेट करेंगे तो इस दोनों डाटा को कैलकुलेट करने की जगह आप इसके जो सामने वाला डाटा है उसी को आप ऑब्जर्व कर लीजिए दैट इज अ कम्युलेटिव डिस्ट्रीब्यूशन चार्ट यस दैट इज अ कम्युलेटिव डिस्ट्रीब्यूशन दैट इज अ कम्युलेटिव डिस्ट्रीब्यूशन डेटा तो कम्युलेटिव डिस्ट्रीब्यूशन डेटा आपको डायरेक्टली बता रहा है कि 30 तक की जो डाटा है यहां पर वो कितना है 13 आपके सामने कितना है आपके पास यहां पर 13 आपके सामने दिखाई दे रहा है तो दैट इज अ कम्युलेटिव डिस्ट्रीब्यूटर यस दैट इज अ कंप्लीटेड डिस्ट्रीब्यूटर ये भी कहां आपके पास हेल्प करता है ये डाटा के स्क्यूनेस में आपके हेल्प करता है कैसे देखिए फ्रीक्वेंसी डिस्ट्रीब्यूशन चार्ट तो आपको ओबवियसली फ्रीक्वेंसी डिस्ट्रीब्यूशन चार्ट तो स्कस में आपको हेल्प करता है लेकिन कम्युलेट डिस्ट्रीब्यूशन जो चार्ट्स है आपके पास यहां पर है ये आपके पास स्टैटिकल एनालिसिस के लिए आपके बहुत हेल्प करता है अब मैं बात करूं स्क्यूनेस के बारे में तो स्क्यूनेस आपके पास तीन तरह की है पहले कौन सी है यहां पे गाइ नेगेटिव स्क्यूनेस चार्ट है आपके पास यहां पर सेकंड चीज आपके पास क्या है नॉर्मल डिस्ट्रीब्यूशन चार्ट या फिर नॉर्मल चार्ट्स या फिर नो स्क्यूज चार्ट्स बोल सकते हैं थर्ड आपके पास क्या होता है पॉजिटिव स्क्यू चार्ट्स अब देखिए नेगेटिव स्क्यूड चार्ट्स कब बोलते हैं नेगेटिव स्क्यूड चार्ट्स उस चार्ट्स को बोलते हैं जब आपके पास जो आपकी टेल होती है वो टेल आप गैस कहां होती है गाइज यहां पर लेफ्ट हैंड साइड की तरफ होती है यस ये आपके पास क्या होता है लेफ्ट हैंड साइड वाला पार्ट है तो लेफ्ट हैंड साइड की तरफ आपके पास क्या है टेल है और ये जो हेड है अब देखिए हेड और टेल किसे बोल रहा हूं यहां पर तो देखिए किसी भी चार्ट के अंदर ये जो पार्ट होता है दैट इज कॉल्ड ऑफ टेल पार्ट क्या पार्ट होता है टेल पार्ट होता है और ये जो पार्ट होता है गाइज यहां पर दैट इज कॉल ऑफ आपके पास हेड पार्ट होता है राइट तो आपका जो हेड पार्ट है वो कहां होता है राइट हैंड साइड के अंदर हो और टेल जो है यदि लेफ्ट हैंड साइड के अंदर हो तो इट्स कॉल्ड ऑफ नेगेटिव डिस्ट्रीब्यूटर चार्ट यदि आप बोल सकते हैं नेगेटिव स्क्यूड चार्ट भी बोल सकते हैं यहां पर सेम एज यदि मैं बात करू पॉजिटिव स्क्यूड चार्ट के अंदर तो पॉजिटिव स्क्यूड चार्ट के अंदर क्या होता है गाइज यहां पर कि आपका जो हेड होता है यस आपका जो हेड होता है वो हेड कहां आता है आपके पास यहां पर लेफ्ट हैंड साइड की तरफ आ जाता है और टेल जो होती है गाइज यहां पर टेल जो होती है वो राइट हैंड साइड की तरफ आ जाती है तो ये क्या बन जाता है गाइज यहां पर पॉजिटिव स्क्यू चार्ट बन जाता है और नो स्क्यू चार्ट हम किसे बोलते हैं यहां पर जिसके अंदर कोई भी आपके पास किसी भी तरह का आपके स्क्यूनेस नहीं होती है मतलब आपका लेफ्ट हैंड साइड पार्ट और राइट हैंड साइड पार्ट जो है वो दोनों इक्वल दिखने को मिलता है यहां पर दैट इज कॉल्ड ऑफ नो स्कू चार्ट राइट इससे हमें क्या ऑज न मिलेगी गाइ यहां पर यदि हमारा डाटा पॉजिटिव स्क्यूज चार्ट्स को फॉलो करता है इसका मतलब डेफिनेटली उसके अंदर आउट लायर्स है यदि हमारा डाटा नेगेटिव स्कू चार्ट को दिखता है यहां पर तो उसके अंदर भी आउट लायर्स है लेकिन यदि हमारा नॉर्मल डिस्ट्रीब्यूशन चार्ट है यहां पर या फिर नॉर्मल चार्ट्स है यहां पर नो स्क्यू चार्ट्स है यहां पर तो उसके अंदर हमारे पास क्या होता है गाइज यहां पर कोई भी आउटलायर नहीं है अब इनके अंदर एक और चीज बहुत ही मजेदार है जो समझने के लायक है यहां पर जो समझने के लिए इंपोर्टेंट पॉइंट है यहां पर अब जरा उसको देखिए यहां पर क्या होता है देखिए जब आप नेगेटिव स्क्यू चार्ट्स के ऊपर बढ़ते हैं तो नेगेटिव स्क्यू चार्ट्स के अंदर जो मीन होता है वो आपके पास पहले आता है देन आपके मतलब टेल की तरफ आता है और मीडियन जो होता है वो आपके हेड की तरफ आता है और मॉड जो होता है वो प्रॉपर हेड पे आता है तो मतलब नेगेटिव स्क्यू चार्ट के अंदर हम क्या बोल सकते हैं नेगेटिव स्क्यू चार्ट के अंदर हम ये बोल सकते हैं कि जो मीन होता है वो स्मॉलर देन होता है किससे आपके मीडियन से यस और वो स्मॉलर देन होता है आपके किसके मॉड के यस वो किसके स्मॉलर देन होता है मड के स्मॉलर देन होता है वहीं पे पॉजिटिव स्क्यू चार्ट के अंदर यदि आप एक ऑब्जर्वेशन लेंगे तो आपको देखिए मीन सबसे पहले टेल में मिलेगा फिर आप आपका मीडियन मिलेगा फिर आपका मॉड देखने को मिलेगा यस और ये इसके अंदर क्या बोला जाता है कि जो मड आपके पास होता है वो लेस दन होता है किसके गाइस यहां पर मीडियन के और वो लेस देन होता है किसके मीन के अर लेकिन यदि आपके पास डाटा नो स्क्यू है यहां पर कोई स्क्यू ना सी नहीं है उसके अंदर तो आपके पास मीन मीडियन मॉड जो है वो तीनों के तीनों आपके पास कहां मिलते हैं आपको सेंटर में ही मिलते हैं सारी चीजें आपको सेंटर में देखने को मिलती है राइट तो चलिए अब जरा इसे ऑब्जर्वेशन करते हैं तो इसके लिए मैं ले चलता हूं आपको जुपिटर नोटबुक के ऊपर देखिए जुपिटर नोट बुक के ऊपर मैंने पहले से ही आपके पास जो प्लेस t सए वाला जो डाटा है वो पहले ही मैंने रख रखा है अब एक काम करते हैं इसको रीलोड कर देते हैं तो रीलोड करने के लिए मैं क्या कर रहा हूं कर्नर को रीस्टार्ट कर देता हूं ताकि हमारा जो डाटा है वो एक बार रीलोड हो जाए ओके और हम इसे एक बार फिर से रन कर देते हैं सारी चीजों को राइट तो हमारा टाइटन टा हमारे पास आ चुका अब मुझे यहां पे ये देखना है कि एज के अंदर स्क्यूनेस है या नहीं है तो इसके लिए मुझे चार्ट बनाना पड़ेगा एंड चार्ट बनाने के लिए मैं क्या करूंगा यहां पर एसएस डॉट मैं हिस्टोग्राम का यूज करूंगा यस किसका तेमाल करूंगा प का इस्तेमाल करूंगा हिज प्लॉट के अंदर एक्स एक्सेस के अंदर क्या डालने वाला हूं गाइ यहां पर ए डाल रहा हूं यहां पर और डाटा इक्वल्स टू यस और क्या करूंगा गाइ यहां पर मैं यहां पर करूंगा डटा इक्वल टू डेटा सेट्स डाल बस और उसके बाद मैं पीएटी डॉट शो कर दूंगा ग्राफ को यहां पर और रन करूंगा तो मुझे मेरे डाटा के अंदर स्क्यूनेस दिख जाएगी अच्छा स्क्यूनेस हमें यहां पर डायरेक्टली दिख रही है इस चार्ट को हम ऑब्जर्व करें तो ये कौन सा चार्ट है गाइज यहां पर ये चार्ट है हमारा राइट स्क्यूड चार्ट यस यहां पर देखिए जिसे हम पॉजिटिव स्क्यूड चार्ट्स भी बोल सकते हैं यस कौन सा स्क्यू चार्ट बोलते हैं पॉजिटिव स्क्यू चार्ट बोलते हैं या रा स्क्यू चार्ट बोल रहे हैं कैसे इसकी टेल देखिए कहां पर है 8 की तरफ आपके पास जा रही है राइट और इसको पता करने के लिए हम एक और चीज ऑब्जर्वेशन कर सकते हैं देखिए क्या ऑब्जर्वेशन है यहां पे गाइ देखिए हमारे पास जो हमारा डेटा सेट है उस डेटा सेट के अंदर जाएंगे हम एज के पास जाएंगे एज के पास जाने के बाद दैट ए केई ड इस क्यू को हम यहां पर कॉल करेंगे जैसे ही स् क्यू को कॉल करेंगे यदि वो ग्रेटर दन 0 है यदि हमारी जो स्क्यू है वो ग्रेटर दन ज जीरो है इसका मतलब कौन सा आ गया है यहां पर पॉजिटिव स्क्यू चार्ट है यदि यही स्क्यूनेस आपके पास लेफ्ट साइड में आती तो क्या क्या बोलते हैं हम गाइज यहां पर नेगेटिव स्क्यूज चार्ट है राइट इसको ऑब्जर्वेशन कराने के लिए देखिए हमारे पास नेगेटिव स्क्यू चार्ट काभी कोई डाटा यहां पर प्रेजेंट नहीं है मैं यहां पे ऑब्जर्वेशन कराने के लिए क्या कर रहा हूं गाइ यहां पर आपको एक डेटा क्रिएट करके दिखा रहा हूं और नॉर्मल डिस्ट्रीब्यूशन वाला चार्ट भी डेटा क्रिएट करके दिखा रहा हूं कैसे देखिए डेटा क्रिएट करते हैं यहां पर तो मैं डटा के पास जाता हूं एंड एनपी डॉट एपी डॉट मैं रैंडम के पास जा रहा हूं यहां पर रैंडम के अंदर जाने के बाद में यस रैंडम मॉड्यूल के पास जाने के बाद में मैं रेंडम मॉडल के पास जाने के बाद में क्या करूंगा यहां पर मुझे नॉर्मल डिस्ट्रीब्यूशन चार्ट चाहिए यहां पर नॉर्मल डिस्ट्रीब्यूशन चार्ट के लिए नॉर्मल डेटा चाहिए का नॉर्मल डाटा के अंदर मुझे क्या करना है स्टार्टिंग स्टेज और साइज देनी है यहां पर तो मैं स्टार्टिंग विद जीरो कर देता हूं और एंडिंग विद मैं यहां पर 100 कर देता हूं और साइज मैं यहां पर लिख देता हूं 100 ओके और रन करें तो हमारा डाटा आ चुका है यदि मैं डटा के अंदर आपको दिखाऊं डेटा तो ये देखिए आपके पास 100 ऑफ डेटा आ गया अब यदि मैं इसको चार्ट में रिप्रेजेंट करूं इस डेटा को यदि मैं चार्ट में रिप्रेजेंट करूं दैट इज अ नॉर्मल डिस्ट्रीब्यूशन और इससे पहले हम इसका स्क्यूनेस भी चेक कर लेते हैं तो स्क्यूनेस चेक करने के लिए डॉट मैं यहां पर पहले तो डेटा फ्रेम को कॉल करूंगा डेटा फ्रेम के अंदर मैं क्या करूंगा सबसे पहले x को कॉल करूंगा देन कॉलन और यहां पर मैं अपने टा को डाल दा राइट करूंगा तो मेरे डटा सेट आ चुका है अब गाइस इसको हम क्या कर रहे हैं df1 बकेट ऑफ x का इस्तेमाल करूंगा तो मेरा x आ गया और डॉट इस क्यू को कॉल करूंगा यहां पर एस के ईड स् क्यू को कॉल करूंगा यहां पर रन करूंगा दैट इज अ नेगेटिव यस ये क्या है नेगेटिव नेगेटिव में क्या है 90 आ रहा है यहां अब जरा यहां पर इसके ग्राफ को देख लेते हैं यहां पर तो प्लॉट करने वाला हूं हि प्लॉट को कॉल करूंगा हि प्लॉट के अंदर देखिए एक् एक्सेस के अंदर क्या डा रहा हूं गाइ यहां पर एक्स डाल रहा हूं यहां पर और डेटा इक्वल्स टू मैं डेटा इक्व डीए डाल टा इक्वल टू क्या है मेरा यहां पर डीए और ग्राफ को देखने के लिए मैं पीएटी डॉट क्या करूंगा यहां पर शो को कॉल करूंगा और रन करूंगा तो देखिए मेरे पास यहां पे क्या नेगेटिव स्क्यू चार्ट है देखिए पीछे की साइड में आपका जदा ब एक बार और करते हैं इसे रन करते हैं और देखिए ये आपके पास क्या पॉजिटिव स्क्यू चार्ट्स आके आपके पास यहां पर देख पॉजिटिव स्क्यू चार्ट राइट तो इस तरह से आप क्या कर सकते हैं इसको पॉजिटिव स्क्यू चार्ट्स भी देख सकते हैं यदि आपको परफेक्ट नॉर्मल चाहिए बेटा यस परफेक्ट नॉर्मल डिस्ट्रीब्यूशन चार्ट चाहिए आपको यहां पर तो मैं एक चार्ट क्रिएट करने की कोशिश करूंगा परफेक्ट नॉर्मल डिस्ट्रीब्यूशन जस्ट लाइक अ टू जो है यस टू जो है दैट्ची [संगीत] अ सिक्स टाइम तो सेवन को कर देते हैं हम यहां पर सिक्स टाइम ओके सेवन को सिक्स टाइम करने के बाद में अब बारी है हमारी एट की तो एट को हम वापस क्या करेंगे आपके फाइव टाइम करेंगे तो मैं एट को क्या कर रहा हूं गाइ यहां पर फाइव टाइम कर रहा हूं यहां पर ओके और नाइन की बात करें तो नाइन को मैं यहां पर फोर टाइम कर रहा हूं और 10 की बात करूं गाइज यहां पर तो 10 को मैं थ्री टाइम कर रहा हूं और 11 की बात करूं गाइज यहां पर तो 11 को मैं टू टाइम कर रहा हूं यस क्या कर रहा हूं टू टाइम और 12 को वन टाइम तो ये मैंने कुछ एक डेटा तैयार किया ठीक है अब इस डाटा का स्क्यूनेस देखेंगे तो इस डेटा का स्क्यूनेस क्या आ रहा है जीरो आ रहा है यस इस डटा का स्क्यूनेस क्या आ रहा है जीरो आ रहा है ये मैंने कुछ ऐसा डाटा क्रिएट किया यहां पर दैट इ स्कस जीरो और यहां पे इस ग्राफ को देखेंगे दैट अ नॉर्मल डिस्ट्रीब्यूशन ठीक है एकदम नॉर्मल डिस्ट्रीब्यूशन ग्राफ आपके पास आ गया ठीक है अब देखिए मैं एक काम करता हूं इसका बेंस को सही कर देता हूं यहां पर तो मैं बिंस इस्तेमाल कर रहा हूं बिंस के अंदर क्या कर रहे है गाइ यहां पर बिंस के अंदर हमारे पास कहां से है टू से लेकर 12 तक है तो मैं यहां पे कर रहा हूं यहां पर 2 3 4 5 6 7 8 9 10 एंड 10 एंड देन 11 और 12 यस ये तो देखिए आपका डाटा नॉर्मल डिस्ट्रीब्यूशन है ये थोड़ा सा मिस मैच आपके पास आ रहा है यहां पर लेकिन ये आप यहां पर फ्रीक्वेंसी डिस्ट्रीब्यूशन चार्ट के ऊपर जाने की जग आप यहां पर प्रॉबी डिस्ट्रीब्यूशन चार्ट के ऊपर जाएंगे तो आपको परफेक्ट नॉर्मल डिस्ट्रीब्यूशन चार्ट आपको देखने को मिलेगा राइट और इसकी स्क्यूनेस देखेंगे यहां पर तो स्क्यूनेस आपके पास क्या है इसकी जीरो यस इसकी स्क्यूनेस क्या है आपके पास यहां पे गाइस जीरो है और एक काम करते हैं इसके बिंस को एक और एक्स्ट्रा बढ़ा देते हैं यहां पर रन करें राइट तो रन करने पर देखिए स्क्यूनेस इसकी आपके पा क्या हो रही है आपके पास जीरो आ और एकदम परफेक्ट नॉर्मल डिस्ट्रीब्यूशन चार्ट आपको देखने को मिल रहा है यस एकदम परफेक्ट नॉर्मल डिस्ट्रीब्यूशन चार्ट देख रहा है जो टू से लगाकर 12 के बीच में आपको देखने को मिल है ठीक है गाइज तो इस तरह से आपके पास क्या कर रहा है यहां पर ये चार्ट आपको देखने को मिल रहा है जो कि परफेक्ट नर्म डिस्ट्रीब्यूशन है इस कॉल ऑफ सिमेटिक चार्ट यहां पर यस इसमें आपको क्या दिख रहा है सिमेटिक का चार्ट दिख रहा है अब देखिए ये जो चार्ट आपके पास आ है यहां ये जो आपका चार्ट है इसका मीन मीडियन मोड निकाल के देखते हैं यहां पर क्या आने वाला है यहां पर तो देखिए df1 x को कॉल करता हूं यहां पर यस क्या है आपका सेवन आ रहा है इवन दैट यहां पर d डॉट यहां पर आपके पास क्या करेंगे x करेंगे x करने के बाद यहां पर मीडियन को कॉल करेंगे तो मीडियन भी आपका कितना है सेवन है और इवन दैट आप यहां पर मड को भी कॉल करेंगे df1 पर 777 मिल र है और इसको स्क्वायर बकेट ऑफ 0 कर देता हूं ताकि मॉड में देखने को मिले तो देखिए तीनों चीजें आपके पास क्या मिल रही है से यहां पे मेन मीडियन मॉड क्या आ रही है तीनों की तीनों आपके सेम आ रही है जबकि नीचे वाले चार्ट के अंदर ऐसा नहीं है नीचे वाले चार्ट के अंदर आप देखेंगे देर इज अ राइट स्क्यूड चार्ट जहां पे आपको क्या मिलेगा सबसे पहले यहां पे आके क्या मिलेगा मीन मिलेगा आप यहां पर मी मीडियन बॉन्ड निकाल सकते हैं देखिए यदि मैं डेटा सेट के पास जाता हूं किसके पास जाता हूं डेटा सेट के पास जाता हूं देन स्क्वायर ब्रैकेट और क्या करता हूं गाइ यहां पर मैं ए को कॉल करता हूं किसे कॉल कर रहा हूं एज को कॉल कर रहा हूं एज डॉट यहां पर क्या कर रहा हूं मीन को कॉल करता हूं तो मीन ऑब्जर्वेशन कीजिए आप यहां पर डटा सेट डॉट आपके पास मैं मीन को कॉल करता हूं यहां पर और मीन का ऑब्जर्वेशन कीजिए आप यहां पर टस अ 29 ओके अब मैं क्या कर रहा हूं यहां पर डेटा सेट देन इस डेटा सेट एंड देन स्क्वायर ब्रैकेट ऑफ एज को कॉल करता हूं यहां पर एंड एमई डी आई ए एंड मीडियन को कॉल करता हूं यहां पर तो मीडियन कितना आ रहा है 28 इसका मतलब मीडियन पीछे की तरफ शिफ्ट हो रहा है यहां पर एंड उसके बाद यदि मैं डेटा सेट डेटा सेट्स के पास चलू यहां पर एंड देन स्क्वायर ब्रैकेट ऑफ एज को कॉल करने के बाद में दैट मड ऑफ स्क्वायर ब्रैकेट ऑफ 0 कर देता हूं यहां पर तो दैट इज अ 24 तो आप देखिए यहां पर मीन मीडियन मड को देखिए मीन क्या है यहां पर सबसे ज्यादा आपके पास है फिर उसके बाद क्या है म मीडियन आपके पास है फिर आपके पास क्या है मॉड है क्यों क्योंकि दैट इ अ राइट स्क्यूड चार्ट और यदि हम ऊपर नॉर्मल डिस्ट्रीब्यूशन चार्ट के ऊपर चलेंगे यस ऊपर किसके पास चले नॉर्मल डिस्ट्रीब्यूशन चार्ट के पास चले तो मीन मीडियन मॉड आपको तीनों एक साथ तो इसीलिए रियल वर्ड जब हम डेटा करते हैं प्रैक्टिस करते हैं यहां पर रियल वर्ड डेटा के साथ काम करते हैं यहां पर तो हम ये कोशिश करते हैं कि हमारा डाटा जो है गाइज यहां पर वो नॉर्मल हो मतलब बेसिकली नो स्क्यूनेस स्क्यूनेस जीरो होनी चाहिए यहां पर य स्क्यूनेस हुई तो वहां पे क्या होंगे आउट लायर्स आपको देखने को मिलेंगे और जैसा कि हमें पता भी है यहां पर आउटलायर सेशन के हमने अंदर डिस्कस भी किया है पर्सेंट एंड क्वांटल के अंदर हमने डिस्कस भी किया है क्योंकि इसके अंदर क्या है आउट लायर्स है राइट तो वो चीज हमें देखने को मिलती है तो कोशिश हम क्या करते हैं कि हमारा डाटा कैसा हो नॉर्मल्स हो दैट इज अ स्क्यूनेस जो कि हमें डेटा के बारे में क्या बताता है डेटा के स्प्रेड बस के बारे में बताता है डेटा के अंदर आउट लायर्स के बारे में दिखाता है और हमें ये ऑब्जर्वेशन देता है कि आपका डाटा किस तरीके के पैटर्स के अंदर है राइट चलिए अब थोड़े कुछ और पैटर्न देखते हैं जो कि सिमेटिक और नॉन सिमेटिक से रिलेटेड है यदि मैं सिमेटिक की बात में बात करूं यहां पर तो ट्स अ नॉर्मल डिस्ट्रीब्यूशन चार्ट जो कि आपका पाका सिमेटिक में आता है फिर ये राइट स्कूड कार्ड है ये लेफ्ट स्कट कार्ड है यूनिफॉर्म डिस्क्यूट चार्ट है यहां पर जहां पर आपके पास कोई भी स्क्यूनेस आपको नहीं देखने को मिलती है यहां पर बात करें नॉर्मल डिस्ट्रीब्यूशन चार्ट भी आपको देखने को मिलगा सिमेटिक में इस तरह के भी सिमेटिक चार्ट्स होते हैं यस ये भी क्या है हमारे पास सिमेटिक चार्ट्स है और ये क्या है आपके पास नॉन सिमेटिक चार्ट्स है यदि देखिए यहां पर जो पीक है और इसकी जो पीक है वो आपके पास मैच नहीं कर कॉल ऑफ नॉन सिमेटिक चार्ट ओके तो ऐसे बहुत सारे चार्ट्स आपके पास देखने और आज के इस वीडियो के जरिए हम बात करने वाले हैं प्रोबेबिलिटी के बारे में देखिए प्रोबेबिलिटी को ूज करने से पहले हम पहले रैंडम वेरिएबल के बारे में जानते हैं कि रैंडम वेरिएबल क्या होता है और इसी रैंडम वेरिएबल के बेसिस पे हम आगे प्रोबेबिलिटी के बारे में डिस्कस करेंगे देखिए जब अभी तक हम जो वेरिएबल इस्तेमाल कर रहे थे जैसे x = 10 y = 20 या y = हेलो ये जितने भी वेरिएबल हम इस्तेमाल कर रहे थे दैट इज कॉल्ड ऑफ नॉर्मल वेरिएबल इनके अंदर हमारे पास क्या था सिंगल सिंगल डाटा हमारे पास आता है लेकिन यदि मैं एक रैंडम वेरिएबल के बारे में बात करूं तो रैंडम वेरिएबल क्या है एक फंक्शंस है एक बेसिक तौर पर बात करें तो फंक्शन है जो कि आपके पास जो आप एक्सपेरिमेंट कर रहे हैं उस एक्सपेरिमेंट के अंदर जो आपका सैंपल स्पेस बनता है उसका कलेक्शंस ऑफ डाटा है मतलब एक सिंपल वे के अंदर बोले जाए कि आप कोई भी एक एक्सपेरिमेंट करने जा रहे हैं जो कि प्रोबेबिलिटी में आप काम लेने वाले हैं ठीक है अब उस एक्सपेरिमेंट के अंदर आप क्या बनाते हैं अपना एक सैंपल स्पेस बनाते हैं सैंपल स्पेस क्या होता है यहां पे गाइस कि जो आप इवेंट कर रहे हैं जैसे मैं एग्जांपल के तौर पर बात करूं कि मेरे पास ये लूडो है अब इस लूडो को मैं रोल कर रहा हूं लूडो को जब मैं रोल करता हूं तो रोल करने पर मेरे पास क्या-क्या आने के चांसेस रहते हैं क्या-क्या आने के चांसेस रहने का मतलब क्या है कि इस लूडो को रोल करने पर मेरे पास वन आ सकता है मेरे पास टू आ सकता है थ्री आ सकता है फोर आ सकता है फाइव आ सकता है एंड देन सिक्स आ सकता है इसके अलावा और कुछ आ सकता है क्या नहीं इसके अलावा और कुछ भी चीजें नहीं आ सकती है तो बेसिकली गाइस मैं बात करूं तो ये मेरे पास क्या है मेरे पास जो भी मेरा इवेंट है या जो भी मैं एक्सपेरिमेंट कर रहा हूं उस एक्सपेरिमेंट का एक सैंपल स्पेस है सैंपल स्पेस का मतलब क्या है जो भी मेरा डाटा आएगा यहां पर इस डाइस को रोल करने में में वो इसी के अंदर आएगा इसको जब हम एक वेरिएबल के अंदर या फिर एक फंक्शन के अंदर साइन कर देते हैं दैट इज कॉल्ड ऑफ रैंडम वेरिएबल इसी को हम क्या करना हैं एक वेरिएबल के अंदर असाइन करते हैं एज अ फंक्शन के तौर पे इट्स कॉल्ड ऑफ रैंडम वेरिएबल ये रैंडम वेरिएबल अब कितने टाइप के होते हैं तो ये रैंडम वेरिएबल दो तरीके के होते हैं पहला होता है आपके पास यहां पर डिस्क्रीट रैंडम वेरिएबल और दूसरा होता है कंटीन्यूअस रैंडम वेरिएबल अब ये डिस्क्रीट रैंड वेरिएबल कब काम आता है कंटीन्यूअस रैंडम वेरिएबल कब काम आता है जरा समझते हैं देखिए इस चीज को समझने से पहले हम हमें पहले डिस्क्रीट नंबर को और कंटीन्यूअस नंबर को समझना पड़ेगा ताकि हम डिस्क्रीट रैंडम वेरिएबल और कंटीन्यूअस रैंडम वेरिएबल को समझ सक देखिए डिस्क्रीट नंबर वो नंबर्स होते हैं जो फिक्स नंबर्स होते हैं जैसे मैं बात करूं यहां पर वन से लगाकर फाइव के बीच में जब आप डाइस को रोल करते हैं तो कौन-कौन से नंबर्स आते हैं तो आप बोलते हैं वन आता है टू आता है थ्री आता है फोर आता है फाइव आता है और सिक्स आता है मतलब एक डाइस को रोल करें तो वन से लगाकर सिक्स के बीच में यही नंबर आते हैं और आप डाइस को जितनी बार भी रोल करते रहेंगे तो आपको यही नंबर बार-बार देखने को मिलेंगे ऐसा नहीं है कि 2.5 देखने को मिल जाए ऐसा नहीं है 3.5 देखने को मिल जाए 3.4 देखने को मिल जाए 3.1 देखने को मिल जाए नो आपके पास जो डाटा है वो यही नंबर बार-बार रिपीट कर रहा होता है एकदम फिक्स नंबर होता है इट्स कॉल ऑफ डिस्क्रीट नंबर यस इसको हम क्या बोलते हैं गाइज यहां पर इसको हम क्या करते हैं डिस्क्रीट नंबर बोलते हैं यहां पर बेसिकली और ये जो नंबर होते हैं यहां पर ये काउंटेबल होते हैं मतलब आप इन्हें काउंटिंग कर सकते हो आराम से एक दोती चार ऐसे करके काउंटिंग ब कर सकते हो अब बात करते हैं यहां पर मैंने बोला कि कि मेरे पास एक इवेंट हो रहा है इवेंट होने का मतलब क्या है गाइस यहां पर एक मेला लगा हुआ है राइट एक फेयर लगा हुआ है यहां पर उस फेयर के अंदर आने वाले जितने भी लोग हैं उनकी हाइट को मेजर कर दीजिए अब उनकी हाइट को मेजर करना है तो दैट्ची फीट से लगाकर आपके पास 6 फीट्स के बीच में लोग होते हैं अब ऐसा नहीं है कि आपके पास 1 फीट होगा 2 फीट होगा 3 फीट होगा 4 फीट होगा नो आपके पास जो जितने भी लोग आ रहे हैं यहां पर वो क्या होंगे इस रेंज के अंदर आएंगे इस पर्टिकुलर रेंज के अंदर आएंगे जैसे 1.1 का भी हो सकता है 1.2 का भी हो सकता है 1.3 का भी हो सकता है 1.4 का भी हो सकता है 1.5 का भी हो सकता है 1.6 का भी हो सकता है 1.6.6 का भी हो सकता है राइट तो बेसिकली आपके पास क्या होती है गाइ यहां पर एक रेंज होती है उस रेंज के बीच में आपको क्या मिल रहा होता है आपको सारा का सारा डाटा मिल रहा होता है ये डाटा आपके पास क्या कहलाता है कंटीन्यूअस डाटा कहलाता है ये कंटीन्यूअस नंबर कहलाता है क्योंकि इसके अंदर जो डाटा मिलता है वो आपको एक रेंज के अंदर मिल रहा होता है मतलब एक रेंज के अंदर बहुत छोटे-छोटे छोटे छोटे डेसिमल्स वैल्यू देखने को मिलती है दैट इज कॉल्ड ऑफ कंटीन्यूअस नंबर तो पहले हमने क्या समझा नंबर के बारे में समझा कि यदि हमारे पास एक दोती च पा यही फिक्स नंबर आपके पास आ रहे हैं इट्स कॉल ऑफ डिस्क्रीट नंबर यस इसे हम क्या बोलते हैं गाइस यहां पर डिस्क्रीट आपके पास डिस्क्रीट नंबर आपके पास बोला जाता है ठीक है और यदि आपके पास डाटा एक रेंज के अंदर बोला जाता है यहां पर तो यह क्या होगा गाइस यहां पर कंटीन्यूअस आपके पास यहां पर वेरिएबल हो जाएगा या कंटीन्यूअस आपके पास क्या होगा नंबर हो जाएगा राइट तो आपके पास जो डाटा है वो दो तरीके हो गया मतलब नंबर के अंदर आपके पास डाटा दो तरीका हो गया पहला तरीका डिस्क्रिप्ट दूसरा हो गया कंटीन्यूअस अब जब हम यहां पर कोई भी इवेंट करते हैं या फिर मैं बात करूं यहां पर हमारे पास कोई भी आपके पास एक्सपेरिमेंट होता है उस एक्सपेरिमेंट को दो कैटेगरी में बांटा गया है एक एक्सपेरिमेंट आप का डिस्क्रीट एक्सपेरिमेंट हो सकता है एक एक्सपेरिमेंट कंटीन्यूअस एक्सपेरिमेंट हो सकता है जस्ट एग्जांपल के तौर पे बात करें कि मुझे एक डाइस को रोल करना है तो डाइस को रोल करने पर मुझे पता है कि मेरे पास जो सैंपल स्पेस है मतलब उस एक्सपेरिमेंट के जो सैंपल स्पेस है वो एक डिस्क्र डाटा ही होंगे जैसे 1 2 3 4 5 6 राइट यही हमारे पास डाटा आने वाला है तो ये हमारा हो गया सैंपल स्पेस अब मैं क्या कर रहा हूं इसको एक वेरिएबल के अंदर सेव कर रहा हूं जस्ट लाइक x के अंदर तो ये हमारे पास क्या हो गया डिस्क्रीट रैंडम वेरिएबल डिस्क्रीट रैंडम वेरिएबल के अंदर क्या होगा आपके पास जो डाटा आएगा या जो आपका सैंपल स्पेस होगा वो डिस्क्रीट होगा जैसे एक और एग्जांपल मान लेते हैं एक कॉइन लेते हैं हम यहां पर इस कॉइन को हम क्या करते हैं थ्रू करते हैं कॉइन को थ्रू करने पर हमारे पास दो ही डाटा आने वाला है या तो हमारे पास हेड आएगा या हमारे पास क्या आएगा टेल आएगा तो बेसिकली यदि मैं यहां पर x1 1 के नाम से एक आपके पास डिस्क्रीट रैंडम वेरिएबल बनाऊं तो उसके अंदर दो ही आपके पास सैंपल स्पेस बनने वाले हैं हैड एंड एंड 10 राइट दैट इज कॉल्ड ऑफ डिस्क्रीट रैंडम वेरिएबल अब बात करते हैं कंटीन्यूअस रैंडम वेरिएबल के बारे में कंटीन्यूअस रैंडम वेरिएबल का एक एग्जांपल ये है सिंपल सा कि आप कोई मेले में गए या आप अपने ऑफिस में जा रहे हैं उस ऑफिस के अंदर जितने भी लोग हैं जैसे उस ऑफिस के अंदर 50 60 70 जितने भी लोग हैं यहां पर उन सब की हाइट को मेजर करना या उन सब की एज को मेजर करना दैट इज कॉल्ड ऑफ कंटीन्यूअस रैंडम वेरिएबल क्योंकि जैसे यदि मैं बात करूं यहां पर कि मैं यहां पे y के नाम से एक वेरिएबल बना रहा हूं कंटन रैंडम वेरिएबल का तो मैं क्या लिखूंगा एक रेंज लिखूंगा यहां पर और रेंज क्या होगी कि जैसे मैं एज की बात करूं तो मेरी कंपनी के अंदर काम करने वाले जो लोग हैं यहां पर वो कहां से 20 इयर से लगाकर आपके पास कहां तक हो सकते हैं गाइज यहां पर वो आपके पास 30 ईयर 40 यर 50 ईयर 60 यर तक हो सकता है तो मैं 60 ईयर तक लेता हूं तो ये हमें क्या मिलती है एक रेंज मिल जाती है दैट इज कॉल ऑफ कंटीन्यूअस रैंडम वेरिएबल तो गाइस जब भी आप प्रोबेबिलिटी में आप कोई भी एक्सपेरिमेंट कर रहे होते हैं तो उस एक्सपेरिमेंट को हम पहले क्या करते हैं उसका एक सैंपल स्पेस तैयार करते हैं उस सैंपल स्पेस को हम जिस वेरिएबल में रखते हैं दैट इज कॉल्ड ऑफ रैंडम लेवल और ये दो कैटेगरी में डिवाइड होता है डिस्केट एंड कंटीन्यूअस अब हम आते हैं हमारी प्रोबेबिलिटी के ऊपर प्रोबेबिलिटी का मतलब सिंपल सा है पॉसिबिलिटी पॉसिबिलिटी का मतलब है बेसिकली संभावना मतलब हम क्या कर रहे हैं एक छोटा सा अंश लगा रहे हैं कि यह काम होने की इतने पर चांसेस हैं जैसे एग्जांपल के तौर पे मैं बात करूं आप अभी अपने घर के बाहर निकलिए जैसे मतलब बाल कानी में जाइए या फिर आपने छत पे चले जाइए रूफ पे चले जाइए वहां जाके आप बादल को देखिए बादल को देख के क्या अंदाजा लगा रहे हैं बादल को देखने पर यदि आप के बादल क्लाउडीबीईटी है राइट बारिश होने की पॉसिबिलिटी है उसमें भी आप बोलते हैं यस 50 पर 60 पर फिर वो कैसे देख के बोलते हैं आपके बादल बहुत ज्यादा ब्लैक कलर के हैं राइट तो आप बोलते हैं यहां पर आपके पास 70 पर चांसेस है कि आज बारिश हो सकती है अब यह गारंटी नहीं है कि बारिश होगी ही होगी लेकिन आपने एक प्रोबेबिलिटी लगाई है मतलब आपने एक संभावना जारी की है कि हां बारिश होने के चांसेस हैं एट्स कॉल ऑफ प्रोबेबिलिटी तो प्रोबेबिलिटी क्या है गाइ यहां पर प्रोबेबिलिटी आपके पास क्या है कि किसी भी चीज के होने के कितने परसेंट चांसेस हैं उसको बोलते हैं प्रोबेबिलिटी जैसे आप कोई एग्जाम देते हैं अब एग्जाम के अंदर आपके पास 10 क्वेश्चन थे 10 में से आपने छह क्वेश्चन सही कर दिए अब जरूरी नहीं है कि उ छह क्वेश्चन सही करने की वजह से आपका एग्जाम क्लियर हो जाएगा नो आप कहेंगे कि यदि छह क्वेश्चन मेरे सही हैं तो इसका मतलब क्या है 60 पर चांसेस है या फिर 70 पर चांसेस है कि मेरा एग्जाम क्लियर हो जाएगा लेकिन इन केस कट ऑफ ज्यादा चली गई तो आपका एग्जाम में सिलेक्शन नहीं हो सकता है कट ऑफ कम चली गई तो आपका एग्जाम में सिलेक्शन हो जाएगा तो यहां पर आपने क्या किया एक पॉसिबिलिटी लगाई है एक प्रोबेबिलिटी लगाई है यहां पर कि इतने परसेंट चांसेस है कि मेरा ये एग्जाम क्लियर हो जाएगा तो दैट इज कॉल ऑन प्रोबेबिलिटी तो गाइज प्रोबेबिलिटी क्या है गाइज यहां पर कि जो भी आपका इवेंट अकर हो रहा है यस जो भी आपका इवेंट अगर हो रहा है उस इवेंट के अंदर आपका जो फेवरेबल इवेंट कौन सा है मतलब आप किस इवेंट्स को को चाहते हैं दैट्ची है आप किस इवेंट को चाहते हैं उस इवेंट्स के आने के कितने परसेंट चांसेस हैं देखिए आप इसे परसेंटेज में भी निकाल सकते हैं आप चाहे तो इसे फ्रैक्शन में भी निकाल सकते हैं तो कितने परसेंट चांसेस हैं दैट इज कॉल ऑफ प्रोबेबिलिटी दैट इज कॉल ऑफ प्रोबेबिलिटी जस्ट एक छोटा सा एग्जांपल लेते हैं जैसे अभी हमने एक लूडो की बात की थी लूडो के अंदर डाइस की बात की थी यहां पर मैं डाइस की बात करता हूं यहां पर फिर से ठीक है प्रोबेबिलिटी में फिर से मैं डाइस की बात करता हूं मैं डायस को रोल करता हूं और डायस के अंदर बोलता हूं कि यार फर आने के कितने परसेंट चांसेस है किसके फोर आने के कितने परसेंट चांसेस है तो देखिए आपके पास आपका सैंपल स्टेट क्या है या फिर आपका रैंडम वेरिएबल क्या है ठीक है तो आपका रैंडम वेरिएबल क्या है 1 2 3 4 5 6 राइट अब इसमें फोर कितनी बार आ रहा है फोर आपका वन टाइम आ रहा है ठीक है फोर आपका वन टाइम आ रहा है और कितने में से आ रहा है सिक्स में से आ रहा है यहां पर तो दैट 1 अप 6 इट्स योर प्रोबेबिलिटी 1 अप 6 इज योर प्रोबेबिलिटी यदि आप परसेंटेज में निकालना चाहते हैं तो मल्टीप्लाई बा 100 कर दीजिए और आपका डाटा परसेंटेज में निकल जाएगा तो इतने परसेंट चांसेस हैं कि आपके फोर आने के राइट एक और छोटा सा एग्जांपल लेते हैं ठीक है प्रोबेबिलिटी में एक छोटा एग्जांपल और लेते हैं यहां पर ठीक है जैसे कि मैं एक बैग बनाता हूं यहां पर ठीक है ये मेरा एक बैग है इस बैग के अंदर क्या कर रहा हूं यहां पर कुछ ब्लू बॉल्ड डाल रहा हूं जैसे मैंने यहां पर चार ब्लू बॉल्ड डाली और एक काम करते हैं यहां पर तीन मैंने ग्रीन बॉल डाली अब आपको मैंने बोला गया है यहां पर कि इस बैग के अंदर हाथ डालो और हाथ डाल के एक बॉल निकालो वो बॉल ग्रीन होने के कितने परसेंट चांसेस है यह बताइए तो अब आपका फेवरेबल आउटकम क्या हुआ वबबल आउटकम आपका ग्रीन हो गया यहां पर फबल आउटकम क्या हो गया ग्रीन हो गया यहां पर तो अब इसके कितने परसेंट चांसेस ये कैसे निकालेंगे तो पहले तो आप अपना सैंपल स्टेट बनाइए सैंपल स्टेट के अंदर मैंने क्या बोला कि जो ग्रीन है वो कितनी बार आ रहा है थ्री टाइम्स आ रहा है जो ब्लू है वो कितने टाइम आ रहा है यहां पर फोर टाइम्स आपके पास आ रहा है अब आपका फेवरेबल आउटकम क्या है मतलब आप क्या चाहते हैं आप चाहते हैं ग्रीन आना यस आप क्या चाहते हैं ग्रीन आना तो यदि मैं इस बैग के अंदर हाथ डालूं तो ग्रीन कितनी बार आ सकता है तीन बार आ सकता है तो मेरा फेवरेबल आउटकम कितनी बार आएगा तीन बार आएगा टोटल कितने आउटस कम है मतलब यदि मैं इसके अंदर हाथ डालता रहूं निकालता रहूं निकालता रहूं तो टोटल कितनी बार हम चीजें निकाल सकते हैं तो वो है यहां पर 3+ 4 कितना है 3+ 4 चलिए इसको सॉल्व करते हैं तो 3 अपन कितना हो गया सेवन इतने आपके पास चांसेस है कि आपका ग्रीन बॉल आ सकती है अब इसको मल्टीप्लाई बाय 100 कर दीजिए तो परसेंटेज में चांसेस निकल जाएंगे तो प्रोबेबिलिटी क्या है बेसिकली गाइस कि आपका जो भी सैंपल स्पेस है उस सैंपल स्पेस में से आप जो चीजें चाहते हैं वो कितना है पार्ट उसका दैट इज कॉल्ड ऑफ प्रोबेबिलिटी यस उसके आने की कितने परसेंट संभावना है कितने परसेंट पॉसिबिलिटीज है यहां पर दैट इज कॉल्ड प्रोबेबिलिटी अब देखिए प्रोबेबिलिटी की यदि मैं डेफिनेशन के ऊपर फॉर्मूले के ऊपर बात करूं तो फार्मूला क्या है यहां पर नंबर ऑफ टाइम a अकर अब a अकर का मतलब क्या है आपका फेवरेबल आउटकम ए मतलब आपका जो भी आप आउटकम लेना चाहते हैं दैट इज अ a ठीक है डिवाइड करना है टोटल नंबर ऑफ पॉसिबल आउटकम टोटल नंबर ऑफ़ पॉसिबल आउटकम का मतलब क्या है कि उस सैंपल स्पेस में से कितने आउटकम निकल सकते हैं दैट इज कॉल्ड अ पॉसिबल आउटकम राइट इन दोनों को डिवाइड कर दीजिए तो आपको मिल जाएगा प्रोबेबिलिटी राइट तो बेसिकली गाइज यहां पर हमने क्या समझा सबसे पहले हमने ये समझा कि रैंडम वेरिएबल क्या होता है रैंडम वेरिएबल के बाद में हमने यहां पर प्रोबेबिलिटी निकालना सीखा अब देखिए इससे पहले वाले वीडियो के अंदर आपने यदि लगातार कंटिन्यू सीरीज देखी है तो इसके पहले वाले वीडियो के अंदर हमने स्क्यूनेस के बारे में समझा था जहां पे मेजरमेंट ऑफ सिप्स के बारे में देखा था मेजरमेंट ऑफ सिप्स के अंदर हमने क्या देखा था कि हमारा डाटा कितनी बार आ रहा है मतलब उस पर्टिकुलर रेंज के अंदर कितनी बार आपका रिपीट कर रहा है वो हमने काउंटिंग निकाली थी अब उसी काउंटिंग को हम प्रोबेबिलिटी में कन्वर्ट करेंगे एट्स कॉल ऑफ प्रोबेबिलिटी डिस्ट्रीब्यूशन और आज के इस वीडियो के जरिए हम बात करने वाले हैं प्रोबेबिलिटी डिस्ट्रीब्यूशन फंक्शंस के बारे में कि प्रोबेबिलिटी डिस्ट्रीब्यूशन फंचस क्या होता है और ये किस तरह से वर्क करता है राइट इससे पहले हम यह समझेंगे कि प्रोबेबिलिटी डिस्ट्रीब्यूशन क्या होता है यदि आपको पाइथन मशीन लर्निंग डेटा साइंस एंड डेटा एनालिस जैसी फील्ड में अपने आपको को ग्रो करना है तो इसके लिए डब्ल्यू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं देखिए लास्ट वाले वीडियो के अंदर हमने प्रोबेबिलिटी के बारे में समझा था कि प्रोबेबिलिटी क्या होती है तो तो हमारा जो भी सैंपल स्पेस होता है उस सैंपल स्पेस में से हम हमारे जो भी फेवरेबल आउटकम निकालना चाहते हैं दैट इज कॉल ऑ प्रोबेबिलिटी मतलब उसके आने के कितने परसेंट चांसेस रहते हैं दैट इज कॉल्ड ऑफ प्रोबेबिलिटी राइट तो इस तरह से हमें प्रोबेबिलिटी देखने को मिलती है लेकिन अब हम क्या करने वाले हैं इसी प्रोबेबिलिटी को हम क्या करेंगे एक लार्ज अमाउंट ऑफ डेटा के ऊपर निकालेंगे अब देखिए जब भी आप मशीन लर्निंग में या डेटा साइंस के ऊपर काम करते हैं तो आपके पास जो डेटा होता है वो डेटा आपके पास कुछ स्मॉल अमाउंट ऑफ डेटा नहीं होता जैसे कि अ लूडो के अंदर जो आपका डाय है उसको रोल कर दिया या कॉइन को फ्लिप कर दिया या कॉइन को थ्रो कर दिया इस तरह का डेटा नहीं होता है आपके पास लार्ज अमाउंट ऑफ डेटा होता है जब आपके पास इस लार्ज अमाउंट ऑफ सैंपल डाटा के ऊपर आपको प्रोबेबिलिटी निकालनी होती है तो ये प्रोबेबिलिटी आपके पास एक डिस्ट्रीब्यूटर प्रॉबिटी हो जाती है जैसे एक सिंपल सी बात करें आपकी कंपनी के एंप्लॉयज की बात करते हैं आपकी जिस कंपनी में काम कर रहे हैं या जिस कंपनी में आप काम करने वाले हैं या आप जिस अ सिटी में रहते हैं यहां पर उनके ऊपर बात करें तो उन सिटी के अंदर जितने भी लोग हैं उनकी हाइट को मेजर करते हैं राइट उनकी हाइट को मेजर करते हैं तो उनके हाइट के मेजर का जो डाटा होगा वो आपके पास क्या होगा एक डिस्ट्रीब्यूटर होगा मतलब एक बहुत ही बड़े रेंज का डाटा होगा यहां पर तो बेसिकली हम सिंगल वैल्यू की डाटा के ऊपर हम काम नहीं करते अब हम एक लार्ज अमाउंट ऑफ डाटा के ऊ काम करते हैं और जब हम लार्ज अमाउंट ऑफ डेटा के ऊपर काम करते हैं और उस डेटा के ऊपर जब हम प्रोबेबिलिटी निकालते हैं दैट इज कॉल्ड ऑफ प्रोबेबिलिटी डिस्ट्रीब्यूशन मतलब हम क्या करते हैं यहां पे प्रोबेबिलिटी को डिस्ट्रीब्यूटर देते हैं यहां पर दैट इज कॉल प्रोबेबिलिटी डिस्ट्रीब्यूशन अब प्रोबेबिलिटी जो डिस्ट्रीब्यूशन है यहां पर बेसिकली ये दो पार्ट के अंदर डिवाइड कर रके फिर से कौन सा है डिस्क्रीट प्रोबेबिलिटी डिस्ट्रीब्यूशन एंड सेकंड पार्ट है कंटीन्यूअस प्रोबेबिलिटी डिस्ट्रीब्यूशन देखिए जब भी हमारे पास जो हमारा डाटा होगा वो डिस्क्रीट इन नेचर के अंदर हमें देखने को मिलेगा तो हम इसे डिस्क्रीट प्रोबेबिलिटी डिस्ट्रीब्यूशन बोलेंगे और जब भी हमारा डाटा यहां पर एक कंटीन्यूअस इन नेचर के अंदर देखने को मिलेगा दैट इज कॉल्ड ऑफ कंटीन्यूअस प्रोबेबिलिटी डिस्ट्रीब्यूशन बोलेंगे हम यहां पर देखिए इसको बहुत अच्छे से एग्जांपल के तौर पे मैं समझाऊं यहां पर तो ये रहा हमारा डेटा यहां पर जिसके अंदर आप देखिए आपके पास जो डेटा है वो एक डिस्क्रीट डाटा है यहां पर तो जब भी आपके पास एक डिस्क्रीट डाटा देख देखने को मिले यहां पर तो आप डिस्क्रीट प्रोबेबिलिटी डिस्ट्रीब्यूशन निकालेंगे यहां पर और जब भी आपका डाटा यहां पर कंटीन्यूअस देखने को मिले तो कंटीन्यूअस प्रोबेबिलिटी डिस्ट्रीब्यूशन निकालना है अब बेसिकली ये प्रोबेबिलिटी डिस्ट्रीब्यूशन निकलता कैसे है मतलब व्हाट इज द प्रोबेबिलिटी डिस्ट्रीब्यूशन कैसे निकलेगा फाइंड आउट कैसे होगा यहां पर बात करते हैं तो देखिए मैं सिंपल सी बात करूं यहां पर कि एक डाइस को लेते हैं फिर से दोबारा है ना एक डाइस को लेते हैं और डाइस को देख के डाइस को रोल करते हैं डाइस को रोल करते हैं तो हमारे पास क्या आता है वन आता है टू आ सकता है थ्री आ सकता है फोर आ सकता है फाइव आ सकता है और सिक्स आ सकता है दैट्ची चांसेस कितने हैं वन आने के प्रोबेबिलिटी क्या है यहां पर यदि मैं ये निकालूं तो यहां पे क्या आएगा 1/6 आएगा टू निकालने के चांसेस क्या आएगा फिर से 1/6 आएगा थ्री निकालने के चांसेस क्या आएगा 1/6 आएगा फोर निकालने के चांसेस की बात करें तो फिर से 1/6 आएगा फाइव निकालने के चांसेस करें तो फिर से 1/6 आएगा और सिक्स निकालने के चांसेस करें तो 1 अप फिर से 6 आएगा राइट तो यहां पे जो ये डाटा हमारे पास निकल के आया है दैट इज़ कॉल्ड प्रोबेबिलिटी यस दैट इज़ कॉल्ड ऑफ़ प्रोबेबिलिटी और जब हम इसे प्लॉट करते हैं यस जब हम क्या करें हैं इसे प्लॉट करते हैं कि जैसे यहां पर एक्स एक्सेस में हम क्या करें नंबर ऑफ आपके पास डाटा मतलब कौन सा रेंज का डाटा है यहां पर जैसे वन आपके पास है टू आपके पास है थ्री आपके पास है फोर आपके पास है फाइव आ रहा है एंड देन सिक्स आ रहा है राइट इनके ऊपर जो प्रोबेबिलिटी निकाली जा रही है वो आपके क्या है 1/6 इसके ऊपर भी 1/6 इसके ऊपर भी 1/6 इसके ऊपर भी 1/6 इसके ऊपर भी 1/6 इसके ऊपर भी 1/6 अब ये जो आपके पास आया मतलब यहां पे मैं 1/6 लिखूं दैट इज कॉल प्रोबेबिलिटी डिस्ट्रीब्यूशन मतलब हमने क्या किया है कि हमारा जो भी हमारा डाटा है यहां पर इसको आप क्या क्या है प्रोबेबिलिटी के तौर पे हमने मेजर किया है दैट इज़ कॉल ऑफ़ प्रोबेबिलिटी डिस्ट्रीब्यूशन चार्ट राइट इसको एक और एग्जांपल से समझते हैं जस्ट एक थोड़ा सा और एग्जांपल मैं आप लोगों के सामने दिखाना चाहूंगा मान लीजिए यह तो एक डाइस की बात हुई है अभी है ना यह क्या है हमारे पास एक डाइस की बात हुई इसी तरह से यदि हमारे पास दो डाइस हैं दो डाइस के हमारे पास यहां पर और जब हम दो डाइस को रोल करते हैं तो हमारे पास कुछ ना कुछ डाटा आता है मतलब हमारे पास कुछ ना कुछ फेसेस आते हैं उन फेसेस को यदि मैं सम कर दूं यस उन फेसेस को यदि मैं सम करूं यहां पर तो मेरे पास जो सम होगा यहां पर मतलब सम ऑफ़ फेसेस की बात करें यहां पर राइट तो जो सम होगा वो आपके पास क्या होगा टू से स्टार्ट होगा और 6स और सिक्स 12 पे आपके पास फिनिश अ बेसिकली जस्ट अ मिनट 6 और सि आपके पास क्या होगा 12 पे आपके पास फिनिश होने वाला है तो आपका जो डाटा है वो इस पर्टिकुलर रेंज के अंदर आपको देखने को मिलेगा मतलब टू से लेकर 12 के बीच में देखने को मिलेगा ठीक है अब यहां पे क्या-क्या आने वाला है कितने बार आने वाला है तो जरा इनको थोड़ा कैलकुलेट करते हैं यहां पर तो देखिए वन यहां पे आ गया टू देन थ्री आ सकता है फोर आ सकता है फाइव आ सकता है सिक्स आ सकता है सेवन आ सकता है एट आ सकता है नाइन आ सकता है 10 आ सकता है अच्छा मैं इसको 11 कर देता हूं और 12 आ सकता है ठीक है तो यह यह डाटा आपके पास रिपीट करने वाला है आपके पास यहां पर डटा ठीक है अब इनके अंदर यह जो है वह कितने बार आने वाले हैं इनके नंबर ऑफ़ चांसेस निकालते हैं मतलब आपके पास एट कितनी बार आएगा फव कितनी बार आएगा 10 कितनी बार आएगा 12 कितनी बार आएगा ठीक है तो देखिए जो टू है वो वन टाइम आएगा और जो 12 है वो भी वन टाइम आएगा अच्छा थ्री की बात करें तो यह टू साइम में आने वाला है और 11 भी टू टाइम आने वाला है फिर फोर की बात करें यहां पर तो ये थ्री टाइम्स आने वाला है और 10 भी आपके पास क्या आएगा थ्री टाइम्स य आपके पास आने वाला है राइट फाइव की बात करें यहां पर तो ये फोर टाइम आने वाला है और और नाइन की बात करें तो ये भी आपके पास क्या आएगा फोर टाइम ही आपके पास आने वाला है ठीक है सिक्स की बात करें यहां पर तो सिक्स आपके पास फाइव टाइम आने वाला है और एट जो है आपके पास यहां पर ये भी फाइव टाइम आने वाला है और सेवन की बात करें तो ये आपके पास सिक्स टाइम आने वाला है तो ये जो डाटा है आपके पास कुछ इस तरह से आपके पास आने वाला है राइट अब आप देख भी सकते हैं कि यदि मैं यहां पर सिक्स और सिक्स को ऐड करूं तभी आपका 12 बनेगा इससे कम की बात करें तो नहीं बनने वाला यहां पर और एट की बात करें यस मैं एट की बात करूं तो एट कितनी बार बन सकता है जैसे 1 प्लस आपके पास यहां पर नहीं होगा 2 प्लस आपके पास क्या होगा 2 प् 6 की बात 678 यस ये आएगा यहां पर उसके बाद 3 प्लस आपके पास क्या करेंगे यहां पर इसे थोड़ा कम करेंगे तो यहां पे आएगा फाइव ठीक है 3 + 5 = 8 आपके पास आएगा फोर और फोर आपके पास एट बन जाएगा उसके बाद फाइव और आपके पास थ्री बन जाएगा और उसके बाद आपका टू एंड सिक्स बन जाएगा राइट तो ये आपके पास कितने चांसेस हुए 1 2 3 4 5 यस ये आपके पास 5 पर चांस फाइव चांसेस है तो ये आपको मिल गए अब ये क्या है आपके पास यहां पर डाटा कितनी बार आया है वो आपके पास है मतलब डेटा कितनी बार आ रहा है वो आपके पास है यदि मैं नंबर ऑफ चांसेस की बात करूं यस नंबर ऑफ चांसेस की बात करूं कि जैसे मैं दो डाइस को एक साथ रोल कर रहा हूं तो आपके पास सेवन आने के कितने परसेंट चांसेस हैं यस दोनों डाइस के सम आने के सेवन आने के चांसेस कितने हैं यहां पर तो वो निकालना है तो आप क्या करते हैं इसके लिए प्रोबेबिलिटी निकालते हैं दैट इज अ 3 / 36 1 2 / 36 यस 3 / 36 और आपके पास क्या आएगा 4 / 36 और उसके बाद क्या आएगा 5/36 यस 5/36 6/36 5/36 ओके 4 बा फिर से क्या आएगा 36 3 / 36 आएगा एंड 2 / 36 आएगा और 1 बा आपके पास क्या आएगा 36 आएगा राइट दैट इज द प्रोबेबिलिटी और जब आप इनका प्लॉट करते हैं गाइज यहां तो एक तरफ आपके पास क्या हो गया आपके चांसेस हो गए मतलब आपके पास यहां पर आपका डाटा आपके पास हो जाता है और दूसरी तरफ आपके पास क्या आता है प्रोबेबिलिटी आपके पास हो जाती है यस क्या हो जाती है प्रोबेबिलिटी आपके पास हो जाती है तो ये जो प्रोबेबिलिटी का जो कर्वेचर्स है वो आपके पास कुछ इस तरह से बनके आपके पास निकल के आने वाला है राइट ये जो प्रोबेबिलिटी का कर्वेचर है वो आपके पास कुछ इस तरह से बनके निकल के आने वाला है यहां पर जैसे मैंने बोला था टू थ्री फोर ठीक है और ये मैं हाईएस्ट इसके बीच में भी होंगे यहां पर ये जो मैं हाईएस्ट है वो बना लेता हूं और ये जो हाईएस्ट है वो क्या ना है सेवन है यहां पर सेवन के बाद में ये आपके पास एट मान लीजिए यस 8 9 8 9 और यहां पे 7 8 9 10 और उसके बाद आपके पास आ जाएगा 11 और उसके बाद आपके पास आ जाएगा 12 राइट तो ये टू आ गया तो इसके बीच में वन बना लेता हूं अच्छा फोर और फाइव और सिक्स एक और बनाना है यहां पर तो इधर कुछ कर देते हैं यहां पर जस्ट लाइक ये इसे मैं सिक्स कर देता हूं यहां पर ठीक है फाइव यहीं कहीं बना लेते हैं और फोर यहीं कहीं बीच में बना लेते हैं फोर और फाइव ठीक है तो इस तरह से आपके पास कुछ कर्वेचर्स निकलने आने वाला है अब इससे हमें क्या चांसेस मिलते हैं इससे हमें ये देखने को मिलता है यहां पर कि यदि मैं आप लोगों से बोलूं यहां पर कि फाइव आने के क्या चांसेस है तो आप इमीडिएट इस चीज को देख के बता देंगे कि फाइव आने के चांसेस कितने परसेंट हैं यदि मैं डाइस को रोल करूं तो फाइव आने के चांसेस कितने हैं ये आपको इमीडिएट देखने को मिल जाएगा तो बेसिकली गाइज क्या होना है कि पहले आप क्या कर रहे थे कि भाई आपका डाटा कितनी बार अकर हो रहा है यही आप देख रहे थे राइट जब हम यहां पर फ्रीक्वेंसी डिस्ट्रीब्यूशन चार्ट्स के ऊपर जा रहे थे फ्रीक्वेंसी डिस्ट्रीब्यूशन चार्ट कब डिस्कस किया था जब हमने स्क्यूनेस डिस्कस की थी जब हमने यहां पर मेजरमेंट ऑफ स्विफ्ट डिस्कस की थी तब हमने केवल और केवल स्क्यूनेस के बारे में डिस्कस किया था स्क्यूनेस के अंदर हमने क्या देखा था कि हमारे पास केवल और केवल क्या है फ्रीक्वेंसी डिस्ट्रीब्यूशन है है वहां पे कितने परसेंट डाटा आने के चांसेस है ये नहीं बता रहा था वहीं पे यदि आपको ये बोल दिया जाए कि आपके पास डाटा जो है वो कितने परसेंट आने के चांसेस है तो उसके लिए आपको कहां आना पड़ेगा उसके लिए आपको प्रोबेबिलिटी डिस्ट्रीब्यूशन में आना पड़ेगा प्रोबेबिलिटी डिस्ट्रीब्यूशन क्या करता है कि आपका जितने भी डाटा है यहां पर उसको क्या करता है पहले प्रोबेबिलिटी निकालता है एंड देन डिस्ट्रीब्यूटर चार्ट बनाता है जब ये डिस्ट्रीब्यूटर चार्ट बन जाता है तो उसके अंदर आप यहां पर पता लगा सकते हैं कि इसके आने के चांसेस कितने हैं मतलब नेक्स्ट टाइम आप इसके आने के चांसेस कितने हैं वो आप यहां पर फाइंड आउट कर सकते हैं दैट इज कॉल्ड ऑफ प्रोबेबिलिटी डिस्ट्रीब्यूशन ये प्रोबेबिलिटी डिस्ट्रीब्यूशन दो तरीके होते हैं डिस्क्रीट प्रोबेबिलिटी डिस्ट्रीब्यूशन और कंटीन्यूअस प्रोबेबिलिटी डिस्ट्रीब्यूशन अब ये प्रोबेबिलिटी डिस्ट्रीब्यूशन के बाद में आता है कि व्हाट इज अ प्रोबेबिलिटी डिस्ट्रीब्यूशन कितने टाइप्स के आपके पास होता है तो ये कुछ जनरल आपके आज प्रोबेबिलिटी डिस्ट्रीब्यूशन के चार्ट्स मैं आपके सामने दिखा रहा हूं जैसे नॉर्मल डिस्ट्रीब्यूशन हो गया टी डिस्ट्रीब्यूशन हो गया यूनिफॉर्म डिस्ट्रीब्यूशन हो गया बीटा डिस्ट्रीब्यूशन हो गया ठीक है बीटा बाइनल हो गया तो ये कुछ डिस्ट्रीब्यूशन के चार्ट है पॉपुलर इनके बारे में हम आगे चलते हुए और भी चीजों के बारे में डिस्कस करते रहेंगे राइट अब मैं बात करता हूं कि प्रोबेबिलिटी डिस्ट्रीब्यूशन में प्रोबेबिलिटी डिस्ट्रीब्यूशन फंक्शंस क्या है यस व्हाट इज द प्रोबेबिलिटी डिस्ट्रीब्यूशन फंक्शन देखिए अभी तक आपने क्या निकाला प्रोबेबिलिटी डिस्ट्रीब्यूशन निकाला जैसे कि मैं यदि प्रोबेबिलिटी डिस्ट्रीब्यूशन की बात करूं यहां पर एक डाइस को रूल करने पर तो आपने निकाला कि ट्स द प्रोबेबिलिटी डिस्ट्रीब्यूशन p यस प्रॉबिटी डिस्ट्रीब्यूशन p = 1/6 ठीक है और 2 भी कितना आ रहा है 1/6 आ रहा है आपके पास थ भी कितनी बार आ रहा है 1/6 टाइम आ रहा है 4 भी कितनी बार आ रहा है 1/6 टाइम आ रहा है फाइव भी कितनी बार आ रहा है 1/6 टाइम आ रहा है सिक्स की बात करें 1/6 टाइम आ रहा है तो ये इसके क्या निकाला प्रोबेबिलिटी डिस्ट्रीब्यूशन निकाला ये आपके पास क्या है स्मॉल अमाउंट ऑफ डाटा है इसलिए आपने इसके प्रोबेबिलिटी डिस्ट्रीब्यूशन डायरेक्टली निकाल दिए लेकिन जब आपके पास लार्ज अमाउंट ऑफ डाटा आपके पास आ जाता है तो वहां पे प्रोबेबिलिटी डिस्ट्रीब्यूशन से निकालना थोड़ा सा इंपॉसिबल हो जाता है तो वहां पे हमें क्या करना पड़ता है फंक्शंस का यूज करना पड़ता है मतलब हम क्या करते हैं कि जो हमारा प्रोबेबिलिटी डिस्ट्रीब्यूशन है उसको एक मैथमेटिकल फंक्शंस में डिजाइन कर देते हैं दैट इज कॉल्ड ऑफ प्रोबेबिलिटी डिस्ट्रीब्यूशन फंक्शन तो प्रोब डिस्ट्रीब्यूशन क्या एक फंक्शन है यहां पर यदि मैं इसको लिखने की बात करूं तो क्या कहेंगे यहां पर p x आपके पास आ जाएगा इज इक्वल टू आपके पास क्या आएगा यहां पर y आप ले सकते हैं राइट तो एक तरीका ये फंक्शन डिजाइन हो गया है जो कि आपके पास क्या करेगा कि जो आप प्रोबेबिलिटी सिंपल तरीके से निकाल लेते हैं यहां पर जब आपके पास लार्ज अमाउंट ऑफ डाटा हो जाएगा तो उस समय आपके पास डायरेक्टली नहीं निकल पाएंगे तो उस केसेस में हमें क्या करना पड़ेगा प्रोबेबिलिटी डिस्ट्रीब्यूशन फंक्शन का इस्तेमाल करना पड़ेगा अब ये प्रोबेबिलिटी डिस्ट्रीब्यूशन फंक्शन जो है वो आपके पास तीन और टाइप्स के होते हैं यहां पर कौन-कौन से हैं यहां पर सबसे पहले है प्रोबेबिलिटी डेंसिटी फंक्शन जिसे हम यहां पर बोलते हैं पीडीएफ यस प्रोबेबिलिटी डेंसिटी फंक्शन दूसरा होता है प्रोबेबिलिटी मास फंक्शन और तीसरा होता है यहां पर कम्युलेटिव डेंसिटी फंक्शन राइट जिसे हम सीडीएफ बोलते हैं तो ये तीन टाइप के क्या होते हैं प्रोबेबिलिटी डिस्ट्रीब्यूशन फंक्शंस होते हैं कौन-कौन सा प्रोबेबिलिटी डेंसिटी फंक्शन प्रोबेबिलिटी मास फंक्शन कम्युलेटिव प्रॉबिटी डेंसिटी फंक्शन अब ये तीनों कब-कब काम में ले जाते है उनको जरा समझते हैं सबसे पहले मैं बात करूंगा यहां पर पीडीएफ के बारे में कि पीडीएफ कब काम में लेना है यहां पर देखिए जब भी आपके पास कंटीन्यूअस डाटा आपके पास आता है राइट तो कंटीन्यूअस डाटा का जब भी आप प्रोबेबिलिटी डेंसिटी फंक्शंस बनाते हैं या प्रोबेबिलिटी डेंसिट फंक्शंस बनाते हैं तो वो फंक्शंस आपके पास इस तरह से देखने को मिलता है अब यहां पे एक पॉइंट आता है व्हाई यूजिंग अ डेंसिटी हम डेंसिटी क्यों यूज करें हैं तो गाइस एक चीज मैं आपको बोलूं यहां पर कि आपके पास डाटा कौन सा है आपके पास एक कंटीन्यूअस डाटा है जैसे मान लो कि ये प्रोबेबिलिटी डिस्ट्रीब्यूशन डेंसिटी फंक्शन आपने बनाए हैं यहां पर ठीक है ये प्रॉबिटी डेंसिटी फंक्शन में ये वन यहां पर है और ये 10 है यहां पर पर दैट अ डेटा और प्रॉबिटी डेंसिटी फंक्शन के अंदर जो वा एक्सिस में आपको देखने को मिलता है दैट इज कॉल ऑफ डेंसिटी यस कौन सी है यहां पर डेंसिटी इज नॉट अ प्रोबेबिलिटी इज द कॉल ऑफ प्रोबेबिलिटी डेंसिटी अब ये प्रोबेबिलिटी डेंसिटी क्या है देखिए अभी तक हमने समझा था कि y एक्सिस में क्या आती है प्रोबेबिलिटी आती है जैसा कि हमने यहां पे ये वाला जो हमने कर्वेचर डिजाइन किया था यस मैं आपको थोड़ा कर्वेचर के बारे में डिजाइन करूं यहां पर तो इस तरफ हमने क्या इस्तेमाल किया था इस तरफ हमने प्रोबेबिलिटी को इस्तेमाल किता दैट 1/6 लेकिन जब हम यहां पे प्रोबेबिलिटी डेंसिटी फंक्शंस के बारे में बात करते हैं यहां पर तो इस समय यहां पर वई यूजिंग अ डेंसिटी वई यूजिंग अ प्रोबेबिलिटी डेंसिटी यहां पे दैट्ची में आपके पास कुछ डेटा आपके पास आ रहा है ठीक है अब मैं बोल रहा हूं यहां पर कि मेरे पास कोई डाटा है 5.56 3 2 1 यह कोई डाटा है इसके आने की कितने परसेंट चांसेस हैं अब आप बोलेंगे कि सर यह तो आपके पास वन से लगाकर 10 के बीच में कितने नंबर ऑफ़ डेटा है तो मैं का बहुत सारा डाटा है बहुत सारा डाटा मतलब इन द सेंस मतलब आपके पास मान लीजिए 20000 30000 40000 डाटा है ऑलमोस्ट है ना बहुत लार्ज अमाउंट ऑफ डाटा है उसके अंदर 5.6.3 आने के चांसेस कितने हैं तो दैट्ची पर्टिकुलर पॉइंट की प्रोबेबिलिटी निकालते हैं तो वो आपके पास क्या होती है बहुत ही स्मॉल अमाउंट ऑफ साइज के अंदर आती है दैट इस पर्टिकुलर केसेस के लिए हम यहां पर प्रोबेबिलिटी का इस्तेमाल नहीं कर सकते क्योंकि इट्स अ नेगलिजिबल प्रोबेबिलिटी राइट बहुत छोटी प्रोबेबिलिटी है जिसे हम यहां पर आराम से ऑब्जर्वेशन भी नहीं कर पाएंगे तो अब हमें क्या करना है अब हमें यहां पे क्या करना है हम यूज करते हैं प्रोबेबिलिटी डेंसिटी का प्रोबेबिलिटी डेंसिटी क्या करता है एक पर्टिकुलर रेंज बनाता है जैसे वन और टू के बीच में आपके पास कितने आपकी प्रोबेबिलिटी की डेंसिटी हुई है मतलब कितने प्रोबेबिलिटी डेंसिटी आपको देखने को मिली है वो आपको मिल जाता है कि मतलब इस पर्टिकुलर डाटा के रेंज के अंदर आपके कितने चांसेस हैं आने के वो आपको प्रॉबिटी डेंसिटी बता देता है राइट अब एक और चीज मैं बताऊंगा यहां पर कि ये जो आपका कर्वेचर बनता है इस कर्वेचर का एरिया अंडर द कर्व की बात करें यस किसकी बात करें एरिया अंडर द कर्क की बात करें दैट इज वन क्योंकि प्रोबेबिलिटी का जो सम होता है गाइ यहां पर वो आपके पास वन होता है और ये जो कर्वेचर बना है ये कर्वेचर क्या है ये कर्वेचर आपका प्रोबेबिलिटी कर्वेचर है जब हम ये प्रोबेबिलिटी कर्वेचर की बात करते हैं तो इसका एरिया की बात करें तो वो आपके पास क्या होता है वन होता है तो प्रोबेबिलिटी डेंसिटी फंक्शन कब इस्तेमाल करना है जब आपके पास डाटा कंटीन्यूअस इन नेचर के अंदर हो तब आप प्रोबेबिलिटी डेंसिटी फंक्शन का इस्तेमाल करें राइट अब बात करते हैं कि यदि हमारा डाटा कंटीन्यूअस की जगह डिस्क्रीट इन नेचर के अंदर होगा तो हम क्या यूज़ करेंगे हम यूज़ करेंगे प्रोबेबिलिटी मास फंक्शन का यस जब हम प्रोबेबिलिटी मास फंक्शन का इस्तेमाल करते हैं तो आपके पा डाटा डिस्क्रीट टाइप का होता है और उस समय जो आपके कर्वेचर्स बनते हैं वो कुछ इस तरीके से बनते हैं वहां पे आप आराम से मास्क का इस्तेमाल कर सकते हैं अब यहां पे बात करें मास्क मतलब क्या है कितनी बार रिपीटेशन हुआ है राइट जैसे कि अभी हमने ये जो निकाला था प्रोबेबिलिटी का फंक्शन का ग्राफ दैट अ फंक्शन ग्राफ ओके ये हमने निकाला था तो ये क्या है गाइज यहां पर दैट इज अ प्रोबेबिलिटी मास यस प्रोबेबिलिटी मास फंक्शंस आपके पास है यहां पर अब ये प्रोबेबिलिटी मास फंक्शन क्यों बोला गया क्योंकि यहां पे जो आप डाटा देख रहे हैं दैट इज अ डिस्क्रीट नेचर कैसे देखिए टू आपके आ आ रहा है थ्री आ रहा है फोर आ रहा है फाइव आ रहा है सिक्स आ रहा है सेवन आ रहा है 8 9 10 11 12 यही आपके आगा और यदि आप बार-बार यदि डाइस को रोल करेंगे तो यही डाटा आपको बार-बार रिपीट टीश देखने को मिलेगा आपके पास कोई नया डाटा नहीं आएगा कोई पॉइंट में वैल्यू का डाटा नहीं आएगा यही डटा आपको बार-बार देखने को मिलता है इसका मतलब यहां पे क्या हो रहा है आपका डाटा डिस्क्रीट इन नेचर के अंदर है तो डिस्क्रीट इन नेचर के अंदर है तो आपके पास क्या बन जाएगा प्रोबेबिलिटी मास फंक्शंस में चला जाएगा जहां पे आप यहां पर हिस्टोग्राम चार्ट बनाते हुए काम में ले सकते हैं अब यहां पे आता है व्हाट इज अ कम्युलेटिव डेंसिटी फंक्शन कम्युलेटिव डेंसिटी फंक्शन हमें पता चलता है कम्युलेटिव से यस हमने कमटी के बारे में समझा था कब जब हम फ्रीक्वेंसी डिस्ट्रीब्यूशन को समझ लेते हैं अब ये कमटी होता क्या है यहां पर जरा इसको एक बार फिर से बात करें यहां पर तो जैसे आपके पास कोई डटा है जैसे 1 2 3 4 5 ये कुछ आपके पास डटा पड़ा है दैट इज अ नॉर्मल डेटा मतलब f x आप बोल सकते हैं यहां पर यदि आप कम्युलेटिव बनाना चाहते हैं ठीक है क्या बनाना चाहते हैं कम्युलेटिव बनाना चाहते हैं तो कम्युलेटिव में क्या होता है पहला नंबर एज इट इज होता है पहला नंबर और दूसरा नंबर आपके पास ऐड हो के तीसरा नंबर बनता है जस्ट लाइक अ थ्री थ्री और थ्री ऐड हो के आपके पास क्या बनेगा सिक्स सिक्स और फोर आपके पास ऐड हो के 10 बनेगा 10 और फ ऐड हो के 15 बनेगा तो ये जो आपके पास डटा बनता है यहां पर दैट इ द कॉल ऑफ कम्युलेटिव डाटा अब आप क्या करते हैं इनकी भी प्रोबेबिलिटी निकालते हैं तो दैट इज कॉल ऑफ कम्युलेटिव डेंसिटी फंक्शन ये आपके पास दोनों में होता है प्रोबेबिलिटी मास में भी होता है और प्रोबेबिलिटी डेंसिटी में भी होता है ये क्या बताता है कि आपके पास पर्टिकुलर रेंज के पीछे वाला डाटा या पर्टिकुलर रेंज के आगे वाला जो आने वाला डाटा है ये कितने परसेंट है ये आपको इंडिकेट करता है दैट इज कॉल्ड ऑफ कलिटी डेंसिटी फंक्शन अब देखिए प्रोबेबिलिटी डिस्ट्रीब्यूशन फंक्शन के अंदर हमने क्या देखा कि हमारे पास बहुत से तरह के प्रोबेबिलिटी डिस्ट्रीब्यूशन फंक्शन होता है इसके अंदर सबसे जो फेमस जो सबसे पॉपुलर आपके पास प्रोबेबिलिटी डिस्ट्रीब्यूशन फंक्शन है दैट इज कॉल ऑफ नॉर्मल डिस्ट्रीब्यूशन फंक्शन यस अब हम बात कर रहे हैं यहां पर नॉर्मल डिस्ट्रीब्यूशन फंक्शन के बारे में कि ये क्या होता है और कैसे दिखाई देता है देखिए नॉर्मल डिस्ट्रीब्यूशन कर्व होता है इट्स कॉल्ड ऑफ सिमेटिक डिस्ट्रीब्यूशन कर्व यस ये क्या हैका सिमेटिक डिस्ट्रीब्यूशन कर्व है इसके अंदर जो राइट हैंड पार्ट है और जो आपका लेफ्ट हैंड पार्ट है वो आपके पास क्या होता है सिमेट्री होता है और मैं बात करूं नॉर्मल डिस्ट्रीब्यूशन फंक्शन के फार्मूले के बारे में तो ये आपके पास नॉर्मल डिस्ट्रीब्यूशन फंक्शन का फार्मूला है आपके पास यहां पर ठीक है अब इस नॉर्मल डिस्ट्रीब्यूशन फंक्शन के अंदर आपके पास क्या होता है कि आपका जो सेंटर होता है यही आपके पास क्या होता है मीन होता है इसका ये जो सेंटर है यही आपका मीन होता है यहीं पे आपका मीडियन होता है यहीं पे आपका मड होता है क्योंकि दैट इ अ सिमेटिक इस मीन के यदि मैं राइट हैंड साइड की तरफ मूव करूं तो आपको और लेफ्ट हैंड साइड की तरफ मूव करूं जो आपका जो पहला पार्ट आएगा जो आपका फर्स्ट पार्ट आएगा जहां पे 6.26 पर आपका जो डेटा आपके पास कलेक्ट होगा यहां पर इट्स कॉल्ड ऑ फर्स्ट स्टैंडर्ड डिवीजन यस ये आपके पास कौन सा है फर्स्ट स्टैंडर्ड डिवीजन आपके पास कहलाता है फिर जो 95 पर जो आपका डेटा कवर होगा मतलब लेफ्ट एंड राइट दोनों मिला के दैट इज कॉल ऑफ सेकंड स्टैंडर्ड डिवीजन और जो आपका थर्ड आपके पास जो डेटा कलेक्ट होगा इट्स कॉल ऑफ 99.7 पर जो आपका डेटा होगा दैट इज कॉल ऑफ थर्ड स्टैंडर्ड डिविज तो आपके पास नॉर्मल डिस्ट्रीब्यूशन चार्ट के अंदर बात करें तो ये क्या होता है आपके पास यहां पर एक बैल लाइक कर्व होता है इसको गौस डिस्ट्रीब्यूशन कर्व भी बोला जाता है गाइज यहां पर ठीक है ये आपके पास क्या होता है एक सिमेटिक कव है राइट हैंड साइड और लेफ्ट हैंड साइड आपके पास दोनों सेम देखने को मिलता है मीन मीडियन मॉड आपका सेंटर में मिलता है इसके अंदर जो आपका डटा का डिस्ट्रीब्यूशन होता है वो आपके पास कुछ इस तरह से होता है 68 26 पार्ट आपका 95.4 पर पार्ट 99 % पार्ट फर्स्ट स्टैंडर्ड डिविजन सेकंड स्टैंडर्ड डिविजन थर्ड स्टैंडर्ड डिविजन से डिनोट डाउन किया जाता है और इस फंक्शन के फॉर्मूले की बात करें तो ये है इस फंक्शन का फार्मूला अब बात करें स्टैंडर्ड नॉर्मल डिस्ट्रीब्यूशन फंक्शन के बारे में कि स्टैंडर्ड नॉर्मल डिस्ट्रीब्यूशन क्या होता है यहां पर तो देखिए जो आपका नॉर्मल डिस्ट्रीब्यूशन कव होता वो आपके पास कहीं पे भी हो सकता है मतलब पूरे एंटायस एक्सेस में कहीं पे भी हो सकता है मतलब आपके पास यहां पे मैंने कर्वेचर डिजाइन किया यस यहां पे मैं कर्वेचर डिजाइन कर रहा हूं तो ये यहां पे भी हो सकता है यहां पे भी हो सकता है नेगेटिव साइड में भी हो सकता है कहीं पे भी आपके पास यहां पर हो सकता है अकॉर्डिंग टू योर डाटा लेकिन यदि मैं इस कर्वेचर को सेंटर लाइन कर लूं मतलब आपके पास जो आपका डाटा है यहां पर वो आपके पास सेंटर अलाइन आपके पास हो जाए यहां पर तो ये आपके पास कहलाता है स्टैंडर्ड नॉर्मल डिस्ट्रीब्यूशन डाटा अब स्टैंडर्ड नॉर्मल डिस्ट्रीब्यूशन डाटा की क्या खासियत है स्टैंडर्ड नॉर्मल डिस्ट्रीब्यूशन को एक जड डिस्ट्रीब्यूशन भी बोलते हैं यहीं से आपका जड स्कोर भी निकलता है आगे चलते हुए हम जड स्कोर के बारे में भी बात करेंगे राइट स्टैंडर्ड नॉर्मल डिस्ट्रीब्यूशन में जो सबसे इंपॉर्टेंट चीज जो होती है यहां पर कि इसका जो आपका सेंटर होता है या फिर इसका मिडल पार्ट होता है यहां पर मीन जो होता है यहां पर वो आपके पास क्या होता है जीरो होता है और इस पूरे कर्वेचर का जो स्टैंडर्ड डिवीजन होता है गाइज यहां पर वो आपके पास क्या होता है वन होता है दैट इज अ स्पेशल केस ऑफ नॉर्मल डिस्ट्रीब्यूशन यस नॉर्मल डिस्ट्रीब्यूशन या गाउन डिस्ट्रीब्यूशन की बात करें यहां पर या इस बेल लाइक क की बात करें ये एंटायस में कहीं पे भी मूव कर सकता है लेकिन यदि मैं स्टैंडर्ड नॉर्मल डिस्ट्रीब्यूशन की बात करूं यहां पर तो स्टैंडर्ड नॉर्मल डिस्ट्रीब्यूशन में क्या खासियत है स्टैंडर्ड नॉर्मल डिस्ट्रीब्यूशन में ये खासियत है कि आपके पास जो इसका सेंटर होगा यस इसका जो सेंटर होगा यहां पर ठीक है इसका जो म होगा यहां पर जो मीन होगा यहां पर वो जीरो पे होगा यहां पर एंड इसका जो स्टैंडर्ड डिविजन होगा वो आपके पास क्या होगा वन होने वाला है दैट इज कॉल्ड ऑफ स्टैंडर्ड नॉर्मल डिस्ट्रीब्यूशन आपके पास अब देखिए हम अभी तक जो हमने पढ़ा कि हम फ्रीक्वेंसी डिस्ट्रीब्यूशन से प्रोबेबिलिटी डिस्ट्रीब्यूशन पे क्यों आए रीजन बहुत ही क्लियर है क्योंकि हमें अभी जो डाटा आने वाला है उसके ऊपर हमें चांसेस निकालने है कि इसके अंदर कितने परसेंट चांसेस इसके अंदर आने के मतलब इस पर्टिकुलर रेंज के अंदर आने के या इस पर्टिकुलर डेटा के आने के चांसेस कितने हैं इस चीज को फाइंड आउट करने के लिए हम डिस्ट्रीब्यूशन प्लॉट के ऊपर चलते हैं मतलब प्रोबेबिलिटी डिस्ट्रीब्यूशन प्लॉट के ऊपर चलते हैं अदर वाइज यदि आपको देखना है कि ये डाटा कितनी बार आया है बस इतना स ही देखना है यस ये डाटा कितनी बार आया है कितनी बार अक हो रहा है यही देखना है तो आपको फ्रीक्वेंसी डिस्ट्रीब्यूशन के ऊपर जाना चाहिए दो तरीके के ग्राफ है एक फ्रीक्वेंसी डिस्ट्रीब्यूशन है एक प्रोबेबिलिटी डिस्ट्रीब्यूशन है फ्रीक्वेंसी डिस्ट्रीब्यूशन कब इस्तेमाल करना चाहिए फ्रीक्वेंसी डिस्ट्रीब्यूशन उस वक्त इस्तेमाल करना चाहिए जब आपको केवल यही देखना है कि आपका डाटा कितनी बार आया है मतलब कितनी टाइम रिपीटेशन हुआ है यही देखना है तो फ्रीक्वेंसी डिस्ट्रीब्यूशन पे जाइए आपके पास जो डाटा आपके पास है यस उसके अंदर आपके पास जो डाटा है इसके नेक्स्ट टाइम आने के कितने परसेंट चांसेस हैं यदि आपको यह देखना है तो आप कहां जाएंगे प्रोबेबिलिटी डिस्ट्रीब्यूशन के ऊपर मूव ऑन करेंगे राइट गाइ तो ये एक मेजर डिफरेंस था जो कि मैंने आप लोगों को यहां पे क्लियर किया है और आज के इस वीडियो के अंदर हमने प्रोबेबिलिटी डिस्ट्रीब्यूशन के बारे में भी समझाए कि क्या होता है और कैसे काम करता है और आज आज के इस वीडियो के जरिए हम बात करेंगे कोवेरिएट एंड को रिलेशन के बारे में देखिए डेटा साइंस एंड मशीन लर्निंग के अंदर आप इस्तेमाल करते हैं डेटा सेट का डेटा सेट मतलब आपके पास एक टेबुलर डाटा होता है जिसके अंदर आप एक्सेल शीट के डाटा को लेते हैं अब यहां पे एकल शीट के अंदर बहुत सारे कॉलम्स होते हैं इन कॉलम्स के अंदर यदि आपको दो कॉलम के बीच में रिलेशनशिप को निकालना है कि उनके बीच में क्या रिलेशन है तो उसके लिए आप कोवेरिएट एंड को रिलेशन का इस्तेमाल करते हैं अब बात करें रिलेशनशिप का मतलब क्या है रिलेशनशिप का मतलब है कि यदि आप किसी एक कॉलम को लेते हैं इस कॉलम का दूसरे कॉलम के साथ क्या रिलेशन है मतलब वो इंक्रीजिंग ऑर्डर है डिक्रीजिंग ऑर्डर है या इक्वल है क्या है यहां पर इन दोनों के बीच में ये चीज यदि हमें फाइंड आउट करनी है तो इसके लिए हम क्या इस्तेमाल करते हैं कोवेरिएशन एंड को रिलेशन का अब बात करेंगे यहां पर कि ये क्यों जरूरी है देखिए जब आप यहां पर दो कॉलम के बीच में रिलेशनशिप को फाइंड आउट करते हैं तो उनसे हमें काफी चीजों की नॉलेज होती है जैसे मशीन लर्निंग की बात करें तो मशीन लर्निंग की काफ ऐसी एल्गोरिथम्स हैं जिनके अंदर आप दो कॉलम के रिलेशनशिप को देखकर आगे डिसीजन लेते हैं कि उनके अंदर कौन सी एल्गोरिथम सबसे बेस्ट रहने वाली है सेकंड चीज डेटा साइंस के अंदर हम यहां पर रिलेशनशिप को देखकर ये डिसीजन लेते हैं कि पहला कॉलम दूसरे कॉलम के साथ किस तरह का नेचर है मतलब किस तरह का नेचर यहां पर रखता है इस चीज को भी फाइंड आउट करते हैं अब देखिए कोवेरिएट एंड को रिलेशन के बीच में कोई डिफरेंस नहीं है दोनों चीज एक ही चीज को इंडिकेट करती है बस एक छोटे से पॉइंट का डिफरेंस है है और वो है रेंज का अब ये रेंज क्या है यहां पर तो उसको अब हम जरा समझते हैं तो देखिए कोवेरिएट एंड को रिलेशन को अब थोड़ा डिटेल के साथ समझते हैं यहां पर तो देखिए कोवेरिएट क्या होता है यहां पर कोवेरिएट क्या है आपके पास यहां पर एक सिग्निफिकेंट है मतलब एक आपके पास क्या है एक रिलेशनशिप है लीनियर रिलेशनशिप है क्या रिलेशनशिप है आपके पास यहां पर दो वेरिएबल के बीच में मतलब आपके पास दो वेरिएबल आपको दे रखे हैं या फिर दो कॉलम आपको दे रखे हैं यहां पर उनके बीच में आपको रिलेशनशिप बताने का जो तरीका होता है उसको हम क्या बोलते हैं को वेरियंस बोलते हैं अब बात करते हैं ये कोवेरिएट आपके पास बहुत से तरीके हो सकते हैं यहां पर अब ये कोवेरिएट निकालते कैसे हैं सबसे पहला पॉइंट होता है कोवेरिएट निकालते कैसे हैं और फिर हम ये समझेंगे कि कोवेरिएट आपके पास कितने तरीके के होते हैं तो देखिए कोवेरिएट निकालने का सिंपल तरीका यहां पर ये है कि जो भी आपका कॉलम है जैसे मेरे पास यहां पर एक x कॉलम है और दूसरा एक y कॉलम है यहां पर राइट तो मेरे पास दो कॉलम है यहां पर अब दो कॉलम के अंदर यदि मुझे कोवेरिएट निकालना है तो मुझे क्या करना पड़ेगा सबसे पहले उस कॉलम का मुझे मीन फाइंड आउट करना पड़ेगा यस क्या फाइंड आउट करना है मुझे यहां पर मीन फाइंड आउट करना है मीन फाइंड आउट करने के बाद में मुझे अपने डाटा को इस फॉर्मूले के अंदर रखना है तो ये फॉर्मूला मुझे क्या देगा को वेरियंस निकाल कर गा अब ये कोवेरिएट क्या होता है जरा समझते हैं यहां पर तो देखिए आपके पास दो वेरिएबल है इन दो वेरिएबल के बीच में रिलेशनशिप को बताता है किस तरह का रिलेशनशिप बताता है यहां पे गाइज तो देखिए यदि मेरा x बढ़ रहा है यदि मेरा क्या है x बढ़ रहा है और x के बढ़ने के करेस्पॉन्डिंग्ली इनको हम क्या बोलते हैं पॉजिटिव को वेरियंस बोलते हैं मतलब जैसे-जैसे x की वैल्यू बढ़ेगी वैसे-वैसे यदि मेरी y की वैल्यू भी इंक्रीज हो रही है तो दैट इज कॉल्ड ऑफ पॉजिटिव को रिलेशन या फिर हम बोल सकते हैं पॉजिटिव को वेरियंस राइट अब यदि मैं बात करूं यहां पर कि x के घटने पर यस x के घटने पर यदि मेरा y बढ़ रहा है तो इसका मतलब क्या हुआ गाइस यहां पर दैट इज अ नेगेटिव को रिलेशन मतलब आपके पास यहां पर x जैसे जैसे बढ़ता जा रहा है वैसे-वैसे यहां पर y की वैल्यू यहां पर डिक्रीज हो रही है या फिर x के घटने पर y इंक्रीज हो रहा है यहां पर तो दैट इज कॉल्ड ऑफ नेगेटिव को रिलेशन यस तो देखिए गाइ यहां पर को रिलेशन आपके पास दो तरीके हैं एक तो पॉजिटिव को रिलेशन एक नेगेटिव को रिलेशन थर्ड आपके पास आता है कि x के बढ़ने या घटने से y के ऊपर कोई भी किसी भी तरह का इंपैक्ट नहीं आता है इंपैक्ट नहीं आने का मतलब क्या है y ना तो घट रहा है ना ही आपका बढ़ रहा है एकदम कांस्टेंट वे के अंदर है इसका मतलब मतलब क्या है गाइज यहां पर जीरो को रिलेशन हम बोलते हैं इसे मतलब यहां पर इसे बोला जाता है नो को रिलेशन या नो कोवेरिएट हम बोल सकते हैं कोई भी किसी भी तरह का यहां पर इंपैक्ट नहीं है राइट तो बेसिकली हमारे पास तीन तरह के रिलेशनशिप है यहां पर क्या रिलेशनशिप है एक तो पॉजिटिव कोवेरिएट है एक आपका नेगेटिव कोवेरिएट है और एक आपका जरो को रिलेशन है जैसे इन तीनों के एग्जांपल बताता हूं जैसे पॉजिटिव को वेरियंस का एग्जांपल की बात करें यहां पर तो सिंपल सा आप ये मान सकते हैं कि जैसे-जैसे आप कार ड्राइव कर रहे हैं यस जैसे-जैसे आप यहां पर कार ड्राइव कर कर रहे हैं यहां पर यस आप जितना डिस्टेंस यहां पर कवर कर रहे हैं उतना ही आपका टाइम भी कवर अप हो रहा है यस उतना आपके पा क्या हो रहा है टाइम कवर अप हो रहा है जैसे मुझे अ यहां पर मतलब मेरा जोधपुर सेंटर है यहां पर तो जोधपुर सेंटर से मुझे जयपुर सेंटर जाना है तो जितनी मैं डिस्टेंस क करूंगा उतना ही मेरे पास क्या होगा टाइम भी साथ-साथ कंज्यूम होगा तो जैसे-जैसे आपकी डिस्टेंस बढ़ रही है वैसे-वैसे आपके जो टाइमिंग है मतलब आपका ट्रेवलिंग का जो टाइमिंग है वो क्या होता है बढ़ रहा है दैट इज कॉल्ड ऑफ पॉजिटिव को रिलेशन यस दैट कॉल्ड ऑफ पॉजिटिव को रिलेशन अब बात करते हैं नेगेटिव को रिलेशन के बारे में नेगेटिव कोलेशन का यहां पर एक सिंपल सा एग्जांपल है कि आप जितनी डिस्टेंस ट्रेवल कर रहे हैं यस आप अपने गाड़ी के अंदर जितनी डिस्टेंस ट्रेवल कर रहे हैं उतना ही आपके गाड़ी का जो फ्यूल है चाहे वो पेट्रोल हो चाहे वो डीजल हो वो क्या हो रहा है डीके हो रहा है तो डिस्टेंस बढ़ रही है लेकिन फ्यूल क्या हो रहा है यहां पर डीके हो रहा है यहां पर दैट इज कॉल्ड ऑफ नेगेटिव कोरिले यस डिस्टेंस बढ़ने के साथ-साथ कभी भी फ्यूल आपका इंक्रीज नहीं होता इसका मतलब क्या है गाइज यहां पर दैट इज कॉल्ड ऑफ नेगेटिव को रिलेशन अब बात करते हैं जीरो को रिलेशन के बारे में तो जीरो को रिलेशन ये है कि आपके पास डिस्टेंस जैसे-जैसे बढ़ती रहेगी ह्यूमन कभी चेंज नहीं होगा मतलब अंदर जो पैसेंजर बैठे हैं यहां पर वो कभी चेंज नहीं होने वाले मतलब आप ड्राइविंग कर रहे हैं तो आप ही ड्राइविंग करते रहेंगे दैट इज कॉल्ड ऑफ जीरो को रिलेशन यस एक छोटा सा एग्जांपल है जीरो को रिलेशन का कि आप x की वैल्यू को कितना भी बढ़ाता जाए आपके पास y की वैल्यू जो है एकदम कांस्टेंट रहेगी या फिर y की वैल्यू को कितनी बढ़ाएं कितनी भी घटाएं x की वैल्यू के ऊपर क्या हो रहा है गाइज यहां पर एकदम कांस्टेंट रह रहा है यहां पर दैट इज़ कॉल्ड ऑफ़ ज़ीरो कोलेशन ओके तो बेसिकली हमारे पास क्या है तीन तीन तरह के आपके पास क्या है कोवेरिएट आपके पास होते हैं अब ये कोविस जो होता है गाइ यहां पर इसकी एक रेंज होती है और ये रेंज क्या होती है माइनस इनफिनिटी टू आपके पास क्या होता है प्लस इनफिनिटी के बीच में आपको डटा देखने को मिलता है यस माइनस इनफिनिटी टू प्लस इनफिनिटी के बीच में डेटा देखने को मिलता है अब देखिए ये डटा काफी बड़ा लार्ज अमाउंट ऑफ़ डटा होता है यहां पर तो इनसे ऑब्जर्वेशन करना थोड़ा सा डिफिकल्ट हो जाता है यहां पर तो फिर इनका एक अल्टरनेटिव ऑप्शंस हम यहां निकालते हैं दैट इज कॉल ऑफ को रिलेशन यस दैट इज अ को रिलेशन को रिलेशन का मतलब क्या है गाइज यहां पर बस सेम एज को वेरियंस है यहां पर को रिलेशन एक्चुअल में क्या है यहां पर दैट इज अ न्यूमेरिकल डटा यस ये आपके क्या है इट्स अ न्यूमेरिकल डाटा दैट इ अ रिलेशनशिप डटा ओके अब ये जो डाटा होता है गाइज यहां पर ये आपके क्या होता है कि ये -1 टू 1 के बीच में आ जाता है मतलब जो आपके पास जो डाटा माइनस इनफिनिटी टू इनफिनिटी के बीच में ट्रेवल कर रहा था या जो माइनस इनफिनिटी टू प्लस इनफिनिटी के बीच में आपका डाटा कैप्चर हो रहा था उसी डाटा को हमने कन्वर्ट कर दि दिया और किसमें कन्वर्ट कर दिया गाइज यहां पर -1 टू 1 के अंदर मतलब हम एक छोटी सी रेंज के अंदर लेके आ गए ताकि हम एक बेटर अंडरस्टैंडिंग कर सके कि किस तरह का रिलेशनशिप यहां पर देखने को मिला है राइट तो दैट इज अ को रिलेशन अब यहां पे बात करें दैट अ को रिलेशन का फॉर्मूला क्या है यहां पर तो जो आपका कोवेरिएट है यस जो आपका कोवेरिएट निकलेगा उस कोवेरिएट के अंदर आप क्या करोगे यहां पर स्टैंडर्ड डेविएशन ऑफ़ x स्टैंडर्ड डेविएशन ऑफ़ y को यहां पर डिवाइड कर दोगे दैट इज अ को रिलेशन या सिंपल सा को रिलेशन आपको निकल जाएगा और ये क्या होगा -1 टू 1 के बीच में हो जाएगा अब देखिए -1 टू 1 के बीच में जो आपका को रिलेशन आपके पास आ रहा है यहां पे गाइज इसको हम क्या करते हैं हम इसको चार पार्ट के अंदर डिवाइड कर लेते हैं यस इन मशीन लर्निंग मशीन लर्निंग की लैंग्वेज में बात करूं तो इनको हम चार पार्ट के अंदर डिवाइड करते हैं कैसे डिवाइड करते हैं गाइज यहां पर तो देखिए सबसे सेंटल में आ जाता है आपका ज़ीरो कोड रिलेशन राइट यहां पे आता है वन को रिलेशन और यहां पे आ जाता है -1 को रिलेशन अच्छा मिडल टर्म के अंदर बात करें यहां पर तो मिडल टर्म के अंदर ये 0.5 आ जाएगा और यहां पे माइनस में 0.5 आपको देखने को मिल जाएगा अच्छा 0 से लेके 0.5 के बीच में दैट इ आपके पास वीक आपके पास क्या होगा यहां पर आपका जो वीक है वह कौन सा होगा पॉजिटिव कोलेशन यस वीक पॉजिटिव कोलेशन आ जाएगा और 0.5 से लेके 1 के बीच में हम ये बोल सकते हैं दैट इज़ अ स्ट्रांग यस हमारे पास क्या होगा स्ट्रांग आपके पास क्या होगा पॉजिटिव कोरिले यस पॉजिटिव स्ट्रांग कोलेशन आपको देखने को मिलेगा दैट्ची आपके पास को रिलेशन आपको देखने को मिलेगा तो इस तरह से हम यहां पर क्या करते हैं को रिलेशन को चार पार्ट के अंदर डिवाइड करते हैं अब यदि इन को रिलेशन को आपको ग्राफिकली तरफ पे रिप्रेजेंट करना हो तो कैसे करेंगे यहां पर चलिए मैं ग्राफिकल तौर पे यहां पे बात करूं तो एक छोटा सा एग्जांपल के ौर बताता हूं यहां पर पॉजिटिव और नेगेटिव को रिलेशन का यस पॉजिटिव और नेगेटिव कोलेशन का एक ग्राफिकल तौर पे यहां पर रिप्रेजेंट करेंगे तो इसके लिए एक छोटा सा एग्जांपल लेते हैं जैसे देखिए मैं एक x एक्स ले रहा हूं और दूसरा मेरा y एक्सेस है यहां पर और अभी मैं बात कर रहा हूं किसके बारे में पॉजिटिव कोलेशन के बारे में बात कर रहा हूं यहां पर जैसे कि x एक्सेस के अंदर आपके पास क्या चल रहा है 1 2 3 4 और फाइव चल रहा है यहां बात करें तो 2 3 4 5 एंड 6स चल रहा है अब ऐसा नंबर आ सकता है आपके पास यहां पर अब यदि मैं इसको ग्राफिकल के तौर पे रिप्रेजेंट करूं यहां पर तो एक तरफ मेरी x एक्सिस है दूसरी तरफ मेरी y एक्सिस है अच्छा देखिए आपके पास यहां पे बात करें अच्छा ये सिक्स है आपके पास यहां पर यदि मैं वन पे बात करूं तो आपका वन यहां पे आएगा देन टू यहां आएगा थ्री आ जाएगा फोर आ जाएगा देन फाइव आ जाएगा एंड देन आपके पास क्या आएगा सिक्स आ जाएगा इधर बात करें तो वन आएगा टू आएगा थ्री 4 5 6 आ जाएगा अच्छा वन पे वन है क्या नो वन पे क्या है गाइज यहां पर टू है तो वन पे आपके पास क्या आया टू आ गया अच्छा टू पे कितना आया गाइज यहां पर टू पे आपके पास यहां पर थ्री आ गया अच्छा थ्री पे कितना आया गाइज यहां पर थ्री पे फोर आ गया फोर पे कितना आया गाइज यहां पर फाइव आ गया फाइव पे कितना आया गाइ यहां पर सिक्स आ गया अच्छा देखिए अब मैं इनको एक लाइन के तौर पे रिप्रेजेंट करूं यहां पर तो यह कुछ इस तरह से जाएगा राइट अब यहां पे आप ऑब्जर्व कीजिए कि क्या आपके पास x के बढ़ने पर y बढ़ रहा है क्या यस डेफिनेटली बढ़ है यहां पर कैसे देखिए x के अंदर यदि आप इस तरफ आगे बढ़ रहे हैं मतलब 1 2 3 4 5 6 बढ़ रहे हैं यहां पर तो y के अंदर भी आप देखिए यहां पर 2 3 4 5 6 बढ़ रहा है मतलब x के जैसे-जैसे बढ़ने पर y भी वैसे-वैसे ही बढ़ रहा है कोई दूसरा इफेक्ट नहीं ले रहा है यहां पर इट्स मीन दैट दैट अ पॉजिटिव कोलेशन और ये पॉजिटिव कोलेशन कौन सा है यहां पर हाईली पॉजिटिव कोलेशन है यहां पर राइट ये कौन सा है यहां पर हाईली पॉजिटिव कोरलेन है अब मैं यहां पर हाईली नेगेटिव कोरिले बनाने जा रहा हूं जिसको आप ऑब्जर्व कर पाएंगे देखिए मैं हाईली पॉजिटिव नेगेटिव कोलेशन बनाने जा रहा हूं यहां पर तो मैं फिर से क्या कर रहा हूं यहां पर ग्राफ को वापस बनाएंगे हम यहां पर और मेरा जो डाटा है उसको भी हम चेंज करेंगे जैसे ये डाटा है मैं इसको चेंज करने जा रहा हूं और डेटा चेंज करने के बाद में मैं यहां पे कुछ नंबर ले रहा हूं जैसे कि आपके पास यहां पे क्या है 5 4 3 2 1 ये हमारा टा है ओके चलिए अब वापस ग्राफ बनाते हैं यहां पर ओके एक तरफ हमारा x एक्सिस है दूसरी तरफ हमारा क्या है y एक्सिस है ओके अच्छा देखिए वन आएगा यहां पे फिर टू देन थ्री फोर एंड फाइव इधर बात करें तो वन 2 3 फर एंड देन फाइव ओके चलिए अच्छा वन पे क्या आ रहा है गाइस यहां पर वन पे आपका फाइव आ रहा है टू पे बात करें तो आपका फोर आ रहा है थ्री पे बात करें तो आपका थ्री आ रहा है चलिए थ्री पे आपका थ्री आ रहा है फोर पे बात करें ट्स अ टू आ रहा है फाइव पे बात करें तो आपका वन आ रहा है ओके अब आप इन डाटा को मैच ऑन करते हैं मतलब मैच करते हैं यहां पर ठीक है तो आपको एक लाइन देखने को मिल जाती है और ये लाइन कैसी है गाइस यहां पर ये नेगेटिव कोरिले को आपको रिप्रेजेंट कर रही है कैसे देखिए आप x के अंदर जैसे-जैसे आगे बढ़ रहे हैं जैसे-जैसे आगे बढ़ने का मतलब क्या है 1 2 3 4 5 वैसे वैसे आप देखेंगे तो y एक्सिस क्या कर रहा है आपका d के कर रहा है कैसे वो फाइव से फोर आ रहा है फोर से थ्री आ रहा है थ्री से टू आ रहा है टू से वन आ रहा है मतलब आपके पास यहां पर y की जो वैल्यू है लगातार d के होती जा रही है इसका मतलब x के बढ़ने पर आपका जो y है वो यहां पर घट रहा है यस आपका y क्या हो रहा है यहां पर d के आपके पास हो रहा है यहां पर तो इट्स कॉल्ड ऑफ नेगेटिव को रिलेशन ये कैसा को रिलेशन है गाइज यहां पर दैट इज कॉल्ड ऑफ़ नेगेटिव कोरलेन तो गाइज आपका पॉजिटिव को रिलेशन एंड नेगेटिव को रिलेशन के बारे में आप समझ चुके होंगे अब जैसा कि मैंने आपको बोला था कि को रिलेशन की एक रेंज होती है यहां पर और वो रेंज क्या है गाइज यहां पर -1 टू वन के बीच में होती है और आपको जरो भी देखने को मिलती है तो इसका मतलब क्या होगा कि हर एक पॉइंट के ऊपर हर एक तरीके से अलग-अलग तरीके के ग्राफ्स बनते होंगे यस तो उन ग्राफ्स को थोड़ा सा ऑब्जर्वेशन करते हैं यहां पर तो जरा देखिए ग्राफ कैसे हैं यहां पर तो द पियर्सन को रिलेशन को एफिशिएंट हम यहां पर देख रहे हैं जिसके अंदर आप ऑब्जर्व करेंगे कि आपके पास अलग-अलग तरीके के ग्राफ बने हुए हैं जो कि अलग-अलग को रिलेशन को रिप्रेजेंट कर रहे हैं जैसे कि है फर्स्ट ऑफ वन फर्स्ट ऑफ क्या है वन को रिलेशन है अब वन को रिलेशन को आप देखेंगे तो देखिए x के बढ़ने पर आपके पास क्या हो रहा है यहां पर y भी बढ़ता जा रहा है लगातार बढ़ता जा रहा है दैट इज कॉल ऑफ पॉजिटिव कोरिले यस ये क्या है पॉजिटिव कोरलेन है और क्या है यहां पर वन है आपके पास यहां पर उसके बाद आप ऑब्जर्व करेंगे यहां पर तो देखिए x के बढ़ने पर आपका जो y बढ़ रहा है यस ये आपके पास क्या हो रहा है जैसे ही देखिए आपके पास को रिलेशन की वैल्यू आपके पास कम हो रही है जैसे 1 2 क्या हो रही है 0.8 हो रही है यस 1 टू क्या हो रही है यहां पर 0.8 हो रही है तो 1 टू 0.8 हो रही है यहां पर तो इसके अंदर आप देखिए आपके पास जो डाटा है वो क्या हो रहा है स्प्रेड हो रहा है मतलब जैसे जैसे आपके पास को रिलेशन की जो वैल्यू है वो घटती रहेगी यस जैसे-जैसे को रिलेशन की वैल्यू क्या हो रही है घटती रहेगी घटने का मतलब क्या है वन से आपके पास जीरो की तरफ जैसे-जैसे आप मूव करते रहेंगे आपका डाटा वैसे-वैसे क्या होगा स्प्रेड होना स्टार्ट हो जाएगा मतलब आपका डाटा फैलना स्टार्ट हो जाएगा तो आप देखिए 0.8 के अंदर आपके पास क्या हो रहा है फैलना स्टार्ट हो रहा है यहां पर उसके बाद बात करेंगे यहां पर गाइस तो आप और ऑब्जर्वेशन करेंगे गाइ यहां पर तो आपका पा देखिए और डटा आपका क्या हो रहा है स्प्रेड हो रहा है उसके बाद यहां पर बात करेंगे तो देखिए आपका जरो के अंदर बात करेंगे यस जीरो कोरिश के अंदर बात करेंगे तो आपका डाटा और ज्यादा स्प्रेड होने लग गया राइट अब देखिए ज़ीरो के अंदर तो आप यहां पर पता भी नहीं लगा पा रहे हैं यहां पर कि x के बढ़ने पर y बढ़ रहा है या y के बढ़ने पर x बढ़ रहा है कुछ भी हमें नॉलेज नहीं देखने को मिल रही है राइट ये डाटा कहीं पे भी रिप्रेजेंट हो रहा है तो बेसिकली यहां पे क्या हो रहा है डटा नॉर्मली तरीके से क्या हो रहा है स्प्रेड हो रहा है यदि मैं बात करूं नेगेटिव को रिलेशन के बारे में गाइज यहां पे चलूं तो देखिए आपके पास क्या हो रहा है डेटा वापस स्क्रेड हो रहा है यहां पर लेकिन ग्राफ आप देखेंगे तो अब क्या है नेगेटिव साइड्स में आना स्टार्ट हो गया राइट इस तरह से आपके पास क्या हो गया नेगेटिव साइड में स्टार्ट हो गया 0.8 के ऊपर बात करेंगे तो अब देखिए आपके पास यहां पे क्या है और डटा स्ट्रैट होके हैं फिर आप -1 पे बात करेंगे तो और डेटा आपके पास क्या हो रहा है स्ट्रेच हो जा रहा है तो गाइज यहां पे आप क्या ऑब्जर्वेशन कर रहे हैं ऑब्जर्वेशंस हमें ये मिल रही है कि जैसे-जैसे यस जैसे-जैसे आप यहां पर नेगेटिव की तरफ मूव कर रहे हैं यस जैसे-जैसे आप यहां पर ज़ीरो की तरफ मूव कर रहे हैं मतलब हाईली डाटा से आप लो डेटा के ऊपर मूव कर रहे हैं तो आपका डाटा क्या हो रहा है स्प्रेड हो रहा है स्प्रेड होने का मब क्या है फैल रहा है यहां पर वहां पे हमें कोई अंडरस्टैंडिंग नहीं मिल पा रही है कि को रिलेशन कैसा है और सेकंड चीज यदि आप 0 से -1 की तरफ मूव कर रहे हैं यहां पर तो उसके अंदर क्या हो रहा है फिर से आपका डाटा स्प्रेड होते होते आते क्या हो रहा है यहां पर वापस यहां पे हो रहा है अब बात करें वन को रिलेशन के बारे में तो वन को रिलेशन का डेटा का जो ग्राफ है वो केवल ऐसा ही नहीं होगा आपके पास और भी तरह के ग्राफ हो सकते हैं जैसे ये ग्राफ देख लीजिए ये ग्राफ देख लीजिए ये ग्राफ देख लीजिए ये कैसा ग्राफ है आपका जीरो कोलेशन का -1 की बात करें तो -1 का ऐसा कुछ भी हो सकता है ओके चलिए अब मैं बात करूं यहां पर कि गाइस जीरो कोलेशन के और कैसे-कैसे ग्राफ हो सकते हैं तो इन ग्राफ को आप ऑब्जर्व कर कर पाएंगे कि जीरो को रिलेशन के इन तरह के भी ग्राफ आपको देखने को मिल सकते हैं तो दैट इज़ अ को रिलेशन यस जो कि क्या करता है दो कॉलम के बीच में रिलेशनशिप को बताता है कि उन दोनों के बीच में किस तरीके का रिलेशन हमें देखने को मिलेगा राइट चलिए अब थोड़ा इसको प्रैक्टिकली समझते हैं कि यदि हमारे पास रियल वर्ल्ड डाटा आता है तो रियल वर्ल्ड डाटा के ऊपर हम किस तरह से ये को रिलेशन देख सकते हैं तो चलिए मैं आपको ले चलता हूं यहां पर चपट नोटबुक के ऊपर जहां पे हम को रिलेशन को देखेंगे अब कोलेशन को देखने के लिए सबसे पहले जो मेरी रिक्वायर्ड लाइब्रेरी है तो मैं इहे पहले इंपोर्ट कर लेता हूं पांडा एलियाज ऑफ पीडी को कर लेता हूं उसके बाद मैं यहां पर क्या करता हूं इंपोर्ट कर लेता हूं और इंपोर्ट किसे कर रहा हूं गाइ यहां पर मैं मैट पल लिप को कर रहा हूं मै पलि डॉट यहां पर पवा प्लॉट पवा प्लॉट एलियाज ऑफ यहां पर पीएटी एंड देन मैं यहां पर क्या कर रहा हूं इंपोर्ट कर रहा हूं यहां पर किसे सीवन को भी करूंगा यहां पर एलियाज ऑफ राइट तो ये तीन जो चीजें हैं इनको मैं इंपोर्ट कर रहा हूं अच्छा यदि नपाई की रिक्वायरमेंट होगी तो नपाई को भी करेंगे अच्छा डेटा सेट को लोड कर लेते हैं पहले यहां पर तो मैं डेटा सेट के नाम से एक वेलेबल बना रहा हूं पडी डॉट यहां पर ड सीएसवी का इस्तेमाल करूंगा जहां पे मैं क्या कर रहा हूं यहां पर टप ड सीएसवी को लोड कर रहा हूं अब ये टप ड सीएसवी क्या है गाइ यहां पर तो ड सीएवी एक डाटा सेट है जहां पे आप देख पाएंगे कि आपके पास जो भी आपके रेस्टोरेंट के अंदर जो भी लोग आए हैं यहां पर उन्होंने कितना बिल दिया है उन्होंने कितने टिप दी है कितने साइज के लोग आए हैं यहां पर वो चीज हमें यहां पर ऑब्जर्वेशन हो जाएगी तो अब देखिए जो को रिलेशन है यहां पर वो आपके पास क्या हो रहा है न्यूमेरिकल वैल्यू के साथ निकलता है जैसे टोटल बिल आपके पास हो गया टिप्स हो गया यहां पर साइज हो गया यहां पर तो इनके बीच में ही आपके क्या निकलेगा आपका रिलेशनशिप निकलेगा तो चलिए इनके बीच में हम रिलेशन श शिप को निकालते हैं तो उससे पहले हम यहां पर ऑब्जर्वेशन कर लेते हैं कि कोई नल वैल्यू तो प्रेजेंट नहीं है तो टा सेटड हैड डटा सेटड इ नल लगा के चेक करूंगा मैं यहां पर यस डटा सेट डॉट मैं यहां पे इज नल लगा के मैं यहां पर क्या करूंगा मैं चेक करूंगा यहां पर डॉट यहां पर सम भी लगाऊंगा यहां पर एंड रन करूंगा तो देखिए कोई भी नल वैल्यू अभी फिलहाल क्या है प्रेजेंट नहीं है अब बात करते हैं यहां पे को रिलेशन के बारे में कि को रिलेशन कैसे निकलेगा तो देखिए हमें हमारा क्या है न्यूमेरिकल डटा चाहिए जिनके ऊपर हम कोलेशन निकालने वाले हैं तो मैं क्या करूंगा डेटा सेट के पास जाऊंगा यहां पर डॉट अब मैं क्या करूंगा यहां पर सेलेक्ट डाटा टाइप को कॉल करूंगा एंड सेलेक्ट डटा टाइप के अंदर जाके मैं क्या करूंगा गाइ यहां पर अपनी जो डेटा है उसको मैं कैप्चर करूंगा अब उससे पहले मुझे देखना पड़ेगा कि डेटा टाइप क्या है मतलब इन दोनों की डेटा टाइप्स है क्या न कौन सी जाके हम डेटा कैप्चर कर सके आराम से तो डेटा टाइप को चेक करने के लिए मैं क्या करूंगा डटा सेट डॉट यहां पर इंफो को कॉल करने वाला हूं एंड जैसे ही मैं इनो को कॉल करूंगा तो देखिए मेरे पास फ्लोटिंग 64 है और इंटी जर 64 बिट्स का दो डाटा मिल रहा है तो देखिए मैं फ्लोटिंग 64 कर लूंगा पहले तो सबसे पहले तो फ्लोटिंग 64 आ गया एंड सेकंड चीज मैं बात करूं यहां पर तो वो कैसा है यहां पर इंटी जर 64 बिट्स का टा तो मैं इंटी जर 64 बिट्स का डटा लूंगा तो ओवरऑल जितना भी न्यूमेरिकल डटा है वो मुझे मिल गया देन मैं यहां पर सीआरआर को रिलेशन को कॉल करने वाला हू जैसे ही मैं सीआर को रिलेशन को कॉल करूंगा तो मुझे देखिए को रिलेशन मिल चुका है अब ये को रिलेशन क्या बता रहा है वो हम समझते हैं यहां पर अच्छा यदि आपको कोवेरिएट निकालना है यहां पर तो आप को वेरियंस भी निकाल सकते हैं कोवेरिएट निकालने के लिए यहां पर ये जो सीओ आरआर है मतलब को रिलेशन को हटा के सीओ को वेरियंस को निकालेंगे तो कोवेरिएट भी निकल जाएगा अब देखिए कोवेरिएट के अंदर आप ऑब्जर्व करेंगे तो आपका जो डाटा है वो देखिए आपका क्या चल रहा है सारा न्यूमेरिकल ऑर्डर में चल रहा है जैसे कि देखिए देखिए 79 पॉइंट यहां पर मिल रहा है 1.9 मिल रहा है यहां पर 0.9 मिल रहा है फाइव मिल रहा है यस 0.6 मिल रहा है फाइव मिल रहा है एट मिल रहा है यहां पर तो कोवेन से आपको कुछ भी मिल रहा है जबकि को रिलेशन देखिए आपके पास यहां पर क्या है -1 और वन के बीच में आ रहा है जैसे देखिए टोटल बिल और टोटल बिल का को रिलेशन आपके पास क्या है वन है और ओबवियसली बात है वन ही होगा यहां पर राइट एंड उसके बाद मैं बात करूं टोटल बिल और टिप्स का जो को रिलेशन है वो 0.6 है मतलब हाईली को रिलेटेड की तरफ मूव कर रहा है यहां पर टोटल ब लॉ साइज की बात करें तो वो भी क्या है हाईली को रिलेटेड है अच्छा टिप और यहां पे बात करूं टिप के बीच में तो ये ये हाईली को रिलेटेड है अच्छा टिप और साइज की बात करें तो ये भी हाईली को रिलेटेड है क क्या है गाइस यदि आपको को रिलेशन देखना है यदि आपको को रिलेशन की ऑब्जर्वेशन करनी है तो आपको क्या करना पड़ेगा आपको डेटा सेट सेलेक्ट करना पड़ेगा उसके बाद आप फ्लोटिंग वैल्यू को ले सकते हैं और इंटी जर वैल्यू को ले सकते हैं और उसके बाद को रिलेशन निकालने के लिए सीआरआर का इस्तेमाल करेंगे एंड कोवेरिएट निकालने के लिए सीओ का इस्तेमाल करेंगे कोवेरिएट आपको मिल जाएगा राइट तो इस तरह से आप ऑब्जर्वेशन कर सकते हैं अच्छा ये जो ऑब्जर्वेशन आप देख पा रहे हैं यहां पर ये आपके पास कैसी दिख रही है एकदम आपके पास न्यूमेरिकल ऑब्जर्वेशन दिख रही है मतलब एक टेबुलर फॉर्म में ऑब्जर्वेशन मिल रही है आप इस कोवेरिएट एंड को रिलेशन वाली जो ऑब्जर्वेशन है इनको आप क्या कर सकते हैं ग्राफिकल तौर पे भी रिप्रेजेंट कर सकते हैं अब ये ग्राफिकल तौर पे कैसे रिप्रेजेंट होगी उसके लिए हम क्या करेंगे गाइज यहां पर राइट ये मैं लिख रहा हूं अच्छा इसको मैं दिखा भी देता हूं ताकि आप लोगों को ध्यान रहे कि हां हम एग्जैक्ट आंसर निकाल रहे हैं ओके ट मैप के अंदर चलेंगे हिट मैप के अंदर जैसे ही जाएंगे आप आपको आपको सबसे पहले आपका डाटा देना पड़ेगा डाटा देने के लिए मैं क्या कर रहा हूं यहां पर को आरआर मतलब सीओ आरआर का इस्तेमाल करूंगा एंड ग्राफ बनाने के लिए मैं पीएटी डॉट क्या कर रहा हूं गाइ यहां पर शो फंक्शन को कॉल करूंगा और रन कर देता हूं राइट तो देखिए मेरा ग्राफ बन चुका है जहां पे मुझे ऑब्जर्वेशन मिल चुकी है कि ये जो वाइट कलर जो आपको रिप्रेजेंट कर रहा है यस ग्राफ काफी बड़ा है तो मैं एक काम करता हूं इसको थोड़ा छोटा कर देता हूं यहां पर पहले तो ताकि आप लोगों को दिखे यहां पर पटी बट मैं यहां पे क्या करूंगा फिगर का इस्तेमाल करूंगा और फिगर के अंदर जाके मैं क्या करने वाला हूं गाइ यहां पर फिक्स साइज का इस्तेमाल करूंगा फिक्स साइज के अंदर जाके मैं यहां पे 43 का इस्तेमाल करूंगा ताकि एक छोटा सा गरा बन जाए अच्छा इसके अंदर ऑब्जर्वेशन लेते हैं तो देखिए आपके पास यहां पर जो वाइट कलर दिख रहा है दैट द वन कोशन और जो आपके पास लो है वो 0.5 है मतलब इसके नीचे ब्लैक कलर जो है यहां पर वो लगभग जीरो कोलेशन को भी रिप्रेजेंट करता है प्योर ब्लैक अब ये प्योर ब्लैक नहीं है ये जो आप देख रहे हैं ये प्योर ब्लैक नहीं है राइट क्यों नहीं है यहां पर क्योंकि ये रो नहीं है 0.4 के आसपास है ठीक है अब मुझे यहां पे क्या करना है अपने जो नंबर्स हैं वो भी रिप्रेजेंट करना है नंबर्स को भी रिप्रेजेंट करना है तो उसके लिए मैं क्या करूंगा नोट को मैं यहां पर ट्रू कर देता हूं जैसे ही नोट को ट्रू करूंगा तो मुरे यहां पर नंबर्स भी देखने को मिल जाएंगे अच्छा देखिए ये 0.49 है ये 0.6 है 0.6 के अंदर देखिए आपके पास कैसा है पर्पल कलर है फिर 0 आपके पास क्या है 68 है जहां पे भी आप देखिए थोड़ा हल्का पर्पल कलर आपको देखने को मिल रहा है 0.49 में ऑलमोस्ट ब्लैक कलर देखने को मिल रहा है लेकिन हां वन के अंदर आपका जीरो के अंदर आपका ऑलमोस्ट पूरा जीरो कलर मिल जाएगा राइट तो दैट आपके पास क्या है हिट मैप है किसका है ये कोलेशन का है इसी तरह से यदि य हम को वेरियंस का बनाना चाहे तो हम को वेरियंस का भी बना सकते हैं कैसे बनाएंगे यदि हम डटा अंडरस्कोर मैं यहां पे सीवी का इस्तेमाल करूं मतलब को वेरियंस का इस्तेमाल करूं तो वो भी मैं बना सकता हूं यहां पर देन कॉपी एंड नीचे जाके मैं पेस्ट करके रन करूं तो ट्स अ कोविस मिल गया यहां पर अब मुझे इसका ग्राफ बनाना है तो मैं यहां पे डटा सेट सीओ आर की जगह सीओ कर दूंगा और रन करूंगा तो देखिए मुझे को वेरियंस भी मिल जाएगा अब यहां पे ऑब्जर्वेशन करेंगे तो आपका जो हाईएस्ट नंबर है दैट इज अ 100 वो वाइट कलर में है यहां पर और जो लोएस्ट कलर है यहां पर दैट इज अ ब्लैक कलर वो आपको दिख रहा है और यहां पर सारा डाटा जीरो ब्लैक कलर में ही है ऑलमोस्ट यहां पर इससे अच्छा ऑब्जर्वेशन हमें यहां देखने को मिला तो जनरली हम जब भी मशीन लर्निंग के अंदर काम करते हैं हम क्या करते हैं को रिलेशन निकालते हैं अब मशीन लर्निंग के अंदर मैं बात करूं तो जब आप सिंपल लीनियर रिग्रेशन को इस्तेमाल करेंगे या लीनियर एल्गोरिथम को इस्तेमाल करेंगे तो वहां पे हम ये ऑब्जर्वेशन करेंगे कि दो डाटा के बीच में रिलेशनशिप कैसा है मतलब आपके पास दो कॉलम आप जो चूज कर रहे हैं उनके बीच में रिलेशनशिप कैसा है उस दोनों डेटा के बीच में रिलेशनशिप देखने के लिए आपको को रिलेशन का ही इस्तेमाल करना पड़ेगा अदर वाइज आप सिंपल लीनियर डिग्रेशन के अंदर य आप सिंपली डाटा देते रहेंगे तो वो आपको बेटर काम नहीं करेगा तो यहां पर क्या करना है गाइज यहां पर कि जब भी आप डाटा ले रहे हैं यहां पर उसके अंदर जब भी आप फीचर सिलेक्शन का इस्तेमाल करते हैं मशीन लर्निंग के अंदर स्पेशली तो अब आप क्या करते हैं को विडेंस का भी इस्तेमाल करते हैं किसके लिए सिंपल लीनियर रिग्रेशन के लिए ओनली फॉम और आज के इस वीडियो के जरिए हम बात करेंगे सेंटर लिमिट थ्योरम के बारे में जिसको सी एलटी भी बोला जाता है अभी सेंटर लिमिट थ्योरम क्या होती है किस तरह से वर्क करती है इसको अब थोड़ा डिटेल के साथ समझते हैं यदि आपको पाइथन मशीन लर्निंग डेटा साइंस एंड डेटा एनालिसिस फील्ड में अपने आप आपको ग्रो करना है तो इसके लिए डब्लू कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो देखिए सेंटर लिमिट थ्योरम का एक बहुत ही अच्छा स्टेटमेंट है कि आपके पास किसी भी तरह का डाटा पड़ा हो आपके पास यहां पर चाहे वो नॉर्मल डिस्ट्रीब्यूटर हो चाहे वो नॉन नॉर्मल डिस्ट्रीब्यूशन डाटा हो यहां पर बेसिकली नॉन नॉर्मल डिस्ट्रीब्यूशन पे ये बेटर एनालिसिस होती है तो यदि आपके पास एक नॉन नॉर्मल डिस्ट्रीब्यूशन डाटा है यहां पर ठीक है और यदि आप उस नॉन नॉर्मल डिस्ट्रीब्यूशन डाटा से कुछ सम अमाउंट ऑफ सैंपल्स निकाल लेते हैं अब कितने सैंपल्स निकालने हैं तो आप बहुत सारे सैंपल्स निकाल सकते हैं लेकिन सैंपल्स ऐसे नहीं निकालने मतलब सैंपल्स के ग्रुप्स निकालने हैं तो आप यहां पर कुछ सम अमाउंट्स और सैंपल्स के ग्रुप्स निकालते हैं और उन सैंपल के ग्रुप्स का जब आप मीन फाइंड आउट करते हैं और जब वो मीन आपके पास निकलता है और उस मीन को जब आप यहां पर प्लॉट्स करते हैं उन सारे मींस को जब आप प्लॉट करते हैं तो आपको एक नॉर्मल डिस्ट्रीब्यूशन देखने को मिलता है तो ये स्टेट स्ट क्या कहलाता है गाइस यहां पर ये पूरा स्टेटमेंट सेंटर लिमिट थ्योरम कहलाता है तो सेंटर लिमिट थ्योरम क्या कह रही है कि भाई आपके पास नॉन नॉर्मल डिस्ट्रीब्यूशन डाटा हो या फिर नॉर्मल डिस्ट्रीब्यूशन डाटा हो दोनों के अंदर ये वर्क करती है तो सेंटर लिमिट थ्योरम क्या करह रही है कि जैसे आपके पास कोई डटा है यस आपके पास कोई डाटा है अब ये डाटा आपके पास दोनों तरीके से हो सकता है कौन-कौन सा एक नॉर्मल डिस्ट्रीब्यूशन डटा भी हो सकता है और नॉन नॉर्मल डिस्ट्रीब्यूशन भी डाटा हो सकता है अब इ इस डाटा में से आप क्या करना चाहिए मतलब ये कैसा डाटा हो सकता है ये पॉपुलेशन डाटा है आपके पास यहां पर यस ये पॉपुलेशन डेटा आपके पास यहां पर इस पॉपुलेशन डाटा से आप क्या करेंगे कुछ सैंपल्स बनाएंगे जैसे s1 s2 और s3 ये सैंपल आपके पास क्या होना चाहिए रैंडम सैंपल होने चाहिए और जब आप इस रैंडम सैंपल का मीन फाइंड आउट करते हैं यस आप x बार फाइंड आउट करते हैं यहां पे इन सबका तो जब आप इन x बार का प्लॉट करते हैं यस x बार को जब हम क्या करते हैं प्लॉट करते हैं तो ये आपको ऑलवेज एंड ऑलवेज कैसा दिखता है नॉर्मल डिस्ट्रीब्यूशन देखने को मिलता है और इसके साथ-साथ एक और चीज बहुत इंपॉर्टेंट यहां पर देखने को मिलती है कि ये जितने भी मीन निकल के आए हैं इन सभी मीन का यदि आप एक फाइनल मीन निकालते हैं मतलब आप इन सभी मीन का आप फिर से मीन निकालते हैं तो ये जो मीन आपके पास निकल के आया है ये आपके पास इस नॉर्मल डिस्ट्रीब्यूशन या नॉन नॉर्मल डिशन डटा जो था मतलब जो पॉपुलेशन डाटा था उस पॉपुलेशन डाटा के मीन के इक्वल आपको देखने को मिलता है मतलब ऑलमोस्ट आपके पास यहां पर उसके सेम आता है ये आपकी सेंटर लिमिट थ्योरम कहलाती है देखिए तो सेंटर लिमिट थ्योरम क्या करती है अ सेंटर लिमिट थ्योरम स्टेट दैट वी प्लॉटिंग अ सैंपल डिस्ट्रीब्यूशन ऑफ द मीन यस क्या करना है यहां पर सैंपल डिस्ट्रीब्यूशन ऑफ़ मीन द मीन ऑफ द सैंपल विल बी इक्वल्स टू पॉपुलेशन मीन मतलब हम क्या कर रहे हैं कुछ सैंपल डिस्ट्रीब्यूशन का यदि मीन हम बनाए यहां पर या उसे प्लॉटिंग करें यहां पर तो वो आपके पास इक्वल होगा किसके पॉपुलेशन मीन के इक्वल होगा एंड द सैंपल डिस्ट्रीब्यूशन अप्रोच टू द नॉर्मल डिस्ट्रीब्यूशन वेदर वेरियंस इक्वल्स टू स्टैंडर्ड एरर मतलब आपके पास जो वेरियंस है वो आपके पास क्या होगा इक्वल होगा किसके स्टैंडर्ड एरर के इक्वल होने वाला है तो ये आपके पास क्या कहलाती है सेंटर लिमिट थ्योरम कहलाती है अब सेंटरल लिमिट थ्योरम का इस्तेमाल कब किया जाता है तो बेसिकली जब आपके पास पॉपुलेशन डाटा बहुत ही लार्ज अमाउंट में हो और उस लार्ज अमाउंट ऑफ पॉपुलेशन डाटा का आपको मीन निकालना हो तो आप पूरे एंटायस डाटा को लेकर आप मीन फाइंड आउट नहीं करते हैं उसकी जगह आप क्या करते हैं उस एंटायस डाटा से कुछ-कुछ सैंपल्स आप निकालते हैं जब वो कुछ-कुछ सैंपल्स निकालने के बाद आप उनका मीन निकालते हैं और मीन निकाल के फिर से दोबारा मीन निकालते हैं तो वो आपके पॉपुलेशन डाटा के मीन के ऑलमोस्ट इक्वल्स टू होता है एग्जैक्ट इक्वल्स टू नहीं बोलेंगे मतलब ऑलमोस्ट इक्वल्स टू आप यहां पर देखने को मिलेगा तो ये आपके पास क्या कहलाती है गाइज यहां पर ये आपकी सेंटर लिमिट थ्योरम कहलाती है अब सेंटर लिमिट थ्योरम की कुछ आपके पास अंश है मतलब आपके पास कुछ आपके पास चीजें हैं जिनको हमें ध्यान रखना पड़ेगा जब भी हम सेंटर लिमिट थ्योरम यूज़ कर रहे हो तो क्या करना है यहां पर कि जो सैंपल डाटा है यहां पर जो भी आप सैंपल डाटा दे रहे हैं यहां पर वो आप जब भी सिलेक्टेड कर रहे हैं वो आपको रैंडम सिलेक्टेड करना पड़ेगा ऐसा नहीं है आप सीक्वेंस सेलेक्ट कर रहे हैं नहीं आपको रैंडम सिलेक्टेड करना पड़ेगा सेकंड चीज आपके पास यहां पर कि आपके डाटा के अंदर कोई भी मल्टी कोलिनियर नहीं होनी चाहिए थर्ड चीज बताए यहां पर तो आपके पास जो सैंपल साइज होनी चाहिए वो सैंपल साइज क्या होनी चाहिए नॉट मोर दन 10 पर ऑफ योर डाटा मतलब 10 पर डाटा से ज्यादा आपके पास सैंपल साइज नहीं होनी चाहिए इसके साथ-साथ आपके पास डाटा के जो क्वांटिटी है वो किससे ज्यादा होनी चाहिए ग्रेटर दन 30 आपके पास होनी चाहिए तभी आप इसका इस्तेमाल कर सकते हैं राइट तो अब हम इस सेंटर लिमिट थ्योरम को प्रैक्टिकली देखने वाले हैं मैं प्रैक्टिकली एक डेटा जनरेट करूंगा जो कि एक नॉन नॉर्मल डिस्ट्रीब्यूशन डेटा होगा फिर हम क्या करने वाले हैं गाइ यहां पर हम उसको नॉर्मल डिस्ट्रीब्यूशन में कन्वर्ट करेंगे विद द हेल्प ऑफ सेंटर इमेज थ्योरम अब देखिए कैसे करते हैं जरा उसको समझते हैं यहां पर गाइस तो मैं यहां पर ले चलता हूं आपको जुपिटर नोटबुक के ऊपर जहां पे हम ये काम करने वाले हैं तो मैं आप चुका हूं जुपिटर नोटबुक के अंदर यहां आने के बाद मैं हम एक नई नोटबुक बना लेता हूं जिसके ऊपर हम सेंटर लिमिट थ्योरम को यहां पर देखेंगे और प्रूफ करके भी देखेंगे अब अब इसके लिए जो रिक्वायर्ड लाइब्रेरी है मैं उसे इंपोर्ट कर लेता हूं पहले तो जो मेरी रिक्वायर्ड लाइब्रेरी है वो है सबसे पहले नपाई क्योंकि मेरे को डाटा जनरेट करना है यहां पर एलियाज मैं क्या कर रहा हूं गाइ यहां पर एनपी ले रहा हूं इसके साथ-साथ मैं यहां पे इंपोर्ट करूंगा किसे आपके पास सी बन को क्योंकि हम ग्राफ देखने वाले हैं सी बन एलियास ऑफ हम क्या करेंगे आपके पास एसएनएस लिखने वाले हैं इसके साथ-साथ हम यहां पर इंपोर्ट करेंगे किसे गाइज यहां पर मैट प्लॉट लिप को इंपोर्ट करने वाले हैं डॉट मैं यहां पर पीवा प्लॉट लूंगा एलियाज ऑफ पीएटी रख लेते हैं चलिए इसे रन करते हैं अब हम क्या कर रहे हैं डेटा जनरेट कर रहे हैं यहां पर अब डाटा हम क्या क्या करेंगे रैंडम जनरेट करेंगे और फिर हम उसे प्लॉटिंग करके भी देखेंगे कि वो नॉर्मल डिस्ट्रीब्यूशन है या फिर नहीं है चलिए तो अब मैं क्या कर रहा हूं गाइस यहां पर रैंडम डाटा जनरेट कर रहा हूं रैंडम डाटा जनरेट करने के लिए मैं क्या करूंगा यहां पे गाइस नपाई का इस्तेमाल करूंगा एप डॉट यहां पे क्या करूंगा गाइ यहां पर रैंडम को इस्तेमाल करूंगा यस एपी डॉट क्या करूंगा गाइज यहां पर मैं रैंडम को इस्तेमाल कर रहा हूं रैंडम के अंदर आपके पास आपको मिलेगा रैंडिट और रंड रेज मिल जाएगा तो मैं रेंड का इस्तेमाल करूंगा जिसके अंदर आप ए एंड बी दे सकते हैं मतलब आपके हाईएस्ट पॉइंट एंड लोएस्ट पॉइंट दे सकते हैं जिसके बेसिस पे रैंडम नंबर आपके जनरेट होते हैं तो एक काम करते हैं यहां पर मैं एक काम करता हूं कि यह जो नंबर है वो 10 से लगाकर 100 के बीच में कुछ भी ले लेते हैं तो जैसे ही रन करेंगे तो देखिए हमें हर बार क्या मिलेगा रैंडम नंबर्स देखने को मिलेंगे अभी कितने नंबर चाहिए तो बेसिकली मैं यहां पे क्या कर रहा हूं 10000 नंबर को इकट्ठा कर रहा हूं और फिर हम उसे प्लॉटिंग करके देखेंगे क्योंकि दैट्ची तो दैट्ची जिसके अंदर मैं 10000 जो डाटा है यहां पर वो मैं स्टोर करने वाला हूं ओके एंड अब मुझे इस पॉपुलेशन डाटा को देखना है तो मैं यहां पे क्या करूंगा पॉप डाटा को लेके रन कर दूंगा तो देखिए मेरा पॉपुलेशन डाटा आ गया है और टोटल ये 10000 डाटा है इसको चेक करने के लिए हम इसके लैन को चेक कर सकते हैं तो मैंने लैन लगा के रन किया तो ये मुझे 10000 डाटा देखने को मिल गया अब ये जो 10000 डाटा जो मुझे मिला है यहां पर दैट अ पॉपुलेशन डाटा तो मैं काम करता हूं पॉपुलेशन डाटा का एक डेटा फ्रेम तैयार कर लेते हैं मतलब एक टेबल तैयार कर लेते हैं तो मैं पॉप अंडरस्कोर यहां पर टेबल बना लेते हैं और इसके लिए मुझे डेटा फ्रेम की जरूरत पड़ेगी ताकि हम इसका ग्राफ बना सके अच्छे से और हम देख सके कि ये नॉर्मल डिस्ट्रीब्यूशन है या नॉन नॉर्मल डिस्ट्रीब्यूशन है तो इसके लिए हम क्या कर रहे हैं गाइ यहां पर इंपोर्ट कर रहे हैं किसे पांडा एलियाज ऑफ पीडी को राइट अब मैं क्या कर रहा हूं गाइस यहां पर देखिए पीडी डॉट यहां पर मैं डाटा फ्रेम का इस्तेमाल करूंगा इस डाटा सेट को बनाने के लिए और यह मेरा कैसा है पॉपुलेशन डाटा है तो मैं यहां पे पॉप अंडरस्कोर डाटा के नाम से इसे वेरिएबल के अंदर सेव कर लेता हूं अ पॉप अंड डटा के नाम से मैं यहां पे क्या कर रहा हूं कॉलम का नाम ना लेता हूं अब यहां पर मैंने क्या किया गाइ यहां पर पॉप डाटा जो है यहां पर इसे मैंने रख लिया है अब पॉप टेबल को देखें यदि हम यहां पर यस मैं क्या कर रहा हूं पॉप टेबल को देखें तो हमारी टेबल यहां पर बनके आ चुकी है अब ये जो पॉप टेबल बनके आई है यहां पर गाइज इस पॉप टेबल का क्या करने वाला हूं गाइज यहां पर मैं डायग्राम बनाऊंगा मैं देखूंगा कि इसका डिस्ट्रीब्यूशन कैसा है इसका डिस्ट्रीब्यूशन चेक करने के लिए मैं एनए डॉट क्या करूंगा गाइज यहां पर केडी प्लॉट बनाऊंगा केडी प्लॉट के अंदर एक एक्सेस के अंदर मैं क्या करने वाला हूं एक् एक्सेस के अंदर पॉप डाटा को रखूंगा यहां पर यस जो हमारा कॉलम का नाम है एंड डाटा इक्वल्स टू जो हमारा है यहां पर वह क्या करेंगे पॉप अंड टेबल से पास करा देंगे और पीएटी डॉट क्या करना है गाइज यहां पर शो फंक्शन के थ्रू इसे रन कर देते हैं तो हमारा कर्वेचर निकल के आ गया है अब यह कर्वेचर काफी बड़ा है यहां पर तो इसे हम छोटा कर देते हैं तो पीएटी डॉट मैं यहां पे फिगर का इस्तेमाल करने वाला हूं इस चीज़ को छोटा करने के लिए और इसके अंदर हमारा जो फिक्स साइज़ है उसके हम इस्तेमाल करेंगे और इसके अंदर 43 को इस्तेमाल कर देते हैं राइट तो अभी भी यह काफी ग्राफ काफी बड़ा है यहां पर तो इसकी जगह थमा मैं यहां पे टू का इस्तेमाल करके रन कर देता हूं तो एक छोटा सा ग्राफ मेरे पास निकल के आ गया है जिसके अंदर हमें ये देखने को मिल रहा है कि ये जो हमारा डाटा है वो नॉर्मल डिस्ट्रीब्यूशन डाटा नहीं है और ये जो डाटा की रेंज है यहां पर वो जीरो से लेके आपके कहां तक चल रही है 100 तक के डाटा के अंदर चल रही है जो कि हमें यहां पर देखने को मिल रहा है अब हम क्या कर रहे हैं गाइज यहां पर अब हम इसके क्या कर रहे हैं इस डाटा में से सैंपल को पिक अप कर रहे हैं और सैंपल को पिक अप करने के बाद में हम यह पता लगाएंगे कि वो नॉर्मल डिस्ट्रीब्यूशन डाटा आ रहा है या फिर नहीं आ रहा है चलिए तो अब इसे देख लेते हैं यहां पर कि नॉर्मल डिस्ट्रीब्यूशन डाटा आ रहा है या फिर नहीं आता है तो हम क्या कर रहे गाइज यहां पर कि ये जो पॉपुलेशन डाटा है इस पॉपुलेशन डाटा से हम क्या करेंगे कुछ-कुछ सैंपल्स उठाएंगे अब ये सैंपल्स उठाना है हमें रैंडम और इसके साथ-साथ 10 पर से ज्यादा हमें नहीं उठाना है और इसके साथ-साथ 30 सैंपल से ज्यादा डाटा पिक करना है अच्छा हमारे पास टोटल कितना डाटा है हमारे पास टोटल 10000 डाटा है इसका 10 पर पहले मैं निकाल लेता हूं कि 10 पर कितना आने वाला है ताकि हम जो डाटा पिक करें वो सही तरीके से पिक करें तो इसका जो 10 पर डाटा जो है वो आपके पास कितना आ रहा है 1000 आ रहा है तो हमें 1000 से कम ही हमें क्या करना है सैंपल डाटा को पिक अप करना है चलिए तो अब हम क्या कर रहे हैं हमारा सैंपल डाटा पिकअप बना रहे हैं यहां पर और सैंपल डाटा का मीन यहां पर क्या करेंगे उसे सेव करेंगे तो मैं यहां पर क्या कर रहा हूं सम अंडरस्कोर आपके पास क्या कर रहा हूं मीन के नाम से एक वेरिएबल बना रहा हूं जहां पे मेरे जितने भी सैंपल डटा होगा उनका मीन यहां पर सेव हो जाएगा अब गाइज यहां पे क्या करना है हमें कुछ सैंपल डाटा उठाना है अब नंबर ऑफ सैंपल डाटा कितना होना चाहिए तो नंबर ऑफ सैंपल डाटा जो हम उठाएंगे वो 50 या 60 उठाने वाले हैं यहां पर तो मैं यहां पर फॉर आ ए क्या करने वाला हूं गाइ यहां पर एक रेंज फंक्शन को अप्लाई करूंगा जहां पे मैं 50 सैंपल्स को यहां पर उठाने वाला हूं ठीक है तो हम एक काम करते हैं इस आ को क्या कर देते हैं नंबर अंडर हम यहां पर सैंपल बना लेते हैं कि इतने नंबर ऑफ सैंपल्स हम यहां पर बनाने वाले हैं अब आपके पास सैंपल्स को पिक करना है कहां से पिक करना है गाइज यहां पर तो यह जो आपके पास लिस्ट है इस लिस्ट में से हमको क्या करना है रैंडम सैंपल को पिक करना है तो अब हम इस रैंडम सैंपल को कैसे पिक कर सकते हैं इस लिस्ट में से तो उसके लिए फिर से हमें नं पाइ की जरूरत पड़ेगी तो मैं एप डॉट क्या कर रहा हूं गाइज यहां पर रैंडम का इस्तेमाल करूंगा और रैंडम के अंदर रैंडम हमारे पास क्या है चॉइस फंक्शन है इस चॉइस फंक्शन के अंदर यदि मैं पॉपुलेशन डाटा देता हूं मतलब पॉप डाटा देता हूं यहां पर तो ये उसमें से क्या करता है हर बार रैंडम डाटा पिक करके लाके देता है देखिए हर बार क्या कर रहा है गाइस यहां पर रैंडम डाटा पिक करके लाके दे रहा है तो बस हमें इसी तरह से हमें रेंडम डाटा पिक करना है अब ये रैंडम डाटा कितना पिक करना है तो बेसिकली हमें क्या करना है 30 से ज्यादा करना है और 1000 से कम करना है तो मैं मान लेता हूं एप्रोक्सीमेट 500 डटा को पिक करना है तो यहां पर मैं 500 डाटा पिक करने जा रहा हूं तो फॉर आई एन डाटा इन यस फॉर आईन डाटा इन कहां से आएगा गाइज यहां पर रेंज से आएगा रेंज मतलब हर बार चलेगा यहां पर और कितना डाटा पिक करना है 500 डाटा यहां पर पिक करना है ओके अब यह पिक कहां से होगा तो यह हमारे पॉपुलेशन डाटा से पिक होगा और कैसे होगा np1 पर हम क्या करने वाले हैं गाइज यहां पर एप हम यहां पर रैंडम को अप्लाई करने वाले हैं तो मैंने रैंडम लगाया रैंडम डॉट मैंने क्या किया गाइज यहां पर चॉइस फंक्शन को लगाया और यह चॉइस फंक्शन क्या करेगा गाइज यहां पर कि जो आपके पास यहां पर बना रखा है मॉडल जो आपने यहां पर डाटा बना रखा है पॉप अंड डाटा वह वहां से ये डाटा क्या करेगा पिक करेगा अब ये जितना भी डाटा आ रहा है इस डाटा को हमें क्या करना है कहीं ना कहीं सेव करना है फिर उसका मीन निकालना है तो इस डाटा को सेव करने के लिए मैं यहां पे लिस्ट बना देता हूं तो आपके पास क्या है ये सैंपल डाटा है तो मैं यहां पे बना रहा हूं सैंपल अंडरस्कोर डाटा के नाम से एक लिस्ट बना रहा हूं जहां पे ये डाटा जो है वो सेव हो जाएगा तो इसके अंदर सेव करने के लिए क्या करेंगे गाइस यहां पर सपल अंड डटा डॉट अपेंड फंक्शन का इस्तेमाल करेंगे और अपेंड फंक्शन के अंदर ये प्रोग्राम चला लेंगे ताकि हमारे पास जो सैंपल डेटा ली वो आपके पास इंसर्ट हो जाए अब ये जो लिस्ट के अंदर आया हुआ डाटा है इसका हमें क्या करना है गाइ यहां पर मीन निकालना है और मीन निकाल के ऊपर ये जो सैंपल मीन है अच्छा मैं इसे लिख देता हूं सैंपल मीन के अंदर जाके क्या करना है सेव करना है तो कैसे करेंगे गाइ यहां पर तो देखिए मेरे पास यदि एक लिस्ट है जैसे लाइक मैं आपको दिखाता हूं यहां पर जैसे 2 3 4 5 ये लिस्ट है और मुझे इसका मीन निकालना है तो मैं नपाई का इस्तेमाल कर सकता हूं कैसे एप हमारे पास क्या होता है गाइज यहां पर मीन फंक्शन होता है उस मीन फंक्शन का इस्तेमाल करते हुए हम यहां पर मीन निकाल सकते हैं जैसे 3.5 इसका मीन है तो मैं भी यही काम करने वाला हूं यहां पर मीन निकालूं लूप के बाहर जाके उसके लिए क्या करेंगे गाइज यहां पर एप डॉट यहां पर मीन का इस्तेमाल करने वाले हैं राइट तो एप में मीन का इस्तेमाल कर रहा हूं और मीन के अंदर मैं क्या कर रहा हूं गाइ यहां पर सैंपल डाटा को इंसर्ट करा रहा हूं और ये जितना भी आपके पास आया है यहां पर इसको हम क्या कर रहे हैं अपेंड करा रहे हैं किसके अंदर सैंपल अंड मीन के अंदर तो सैंपल अंड मीन डॉट यहां पर ले रहे हैं अपेंड और अपेंड के अंदर ये डाटा पिक करा रहे हैं और अब हम इसे रन करते हैं तो ये हमारा सैंपल डाटा का जो मीन है वो इकट्ठा हो चुका है मतलब हमारे पास जो भी पॉपुलेशन डाटा था उस पॉपुलेशन डाटा से हमने छोटे-छोटे सैंपल्स बना लिए हैं यहां पर और जितने भी सैंपल्स बनाए हैं उन सबके हमने क्या निकाले मीन निकाले हैं और मीन को ले जाके सैंपल अंडरस्कोर मीन के अंदर रख दिया है अब हम क्या करने वाले हैं गाइज यहां पर ये सैंपल अरस को मीन का हम क्या कर रहे हैं डेटा फ्रीम बना लेते हैं ताकि हम ऑब्जर्वेशन कर सके कि इसके अंदर ये जो आपका डाटा आया है वो नॉर्मल डिस्ट्रीब्यूशन डाटा है या नहीं है चलिए तो मैं यहां पे क्या कर रहा हूं गाइ यहां पर सैंपल अंडरस्कोर आपके पास m के नाम से एक ल बना रहा हूं यहां पर जहां पे पीडी डॉट क्या करेंगे गाइज यहां पर डाटा फ्रेम का इस्तेमाल करेंगे इसके अंदर एक लिस्ट बनाएंगे और मैं यहां पे क्या कर रहा हूं सैंपल इसके अंदर हम क्या कर रहे हैं डिक्शनरी बनाएंगे जहां पे मैं सैंपल अंडर मीन के नाम से एक वेरिएबल बना रहा हूं यहां पर मतलब एक कॉलम का नाम बना रहा हूं यहां पर और जिसके अंदर मैं सैंपल जो आपके पास मीन है उसे सेव कर रहा हूं एंड अब बारी है हमारे ग्राफ की तो देखिए की बात करें तो एकस एक्सेस के अंदर मैं क्या करूंगा ये सैंपल अंडर जो मीन आपने बनाया है कॉलम का नाम इसे पेस्ट करेंगे एंड डाटा जो है यहां पर डेटा इक्वल टू सैंपल मीन को हम यहां पर रखने वाले हैं और ग्राफ को देखने के लिए मैं पीटी डॉ क्या कर रहा हूं शो फंक्शन का इस्तेमाल कर रहा हूं अच्छा ग्राफ को मुझे छोटा करना है तो इसके लिए मुझे प्लॉट फिगर का इस्तेमाल करना पड़ेगा तो यह मैं ऊपर से कॉपी करके लाके यहां पे पेस्ट कर रहा हूं और जैसे ही हम रन करेंगे यहां पर अ एक छोटी सी मिस्टेक हो गई है इसे हम पुट कर देते हैं और जैसे ही हम पुट करेंगे तो देखिए हमारा जो डाटा है वो कैसा आ चुका है गाइ यहां पर नॉर्मल डिस्ट्रीब्यूटर डाटा हमें यहां पर देखने को मिल चुका है तो इस तरह से आप यहां पर क्या कर सकते हैं गाइ यहां पर अपने जो पॉपुलेशन डाटा है उस पॉपुलेशन डाटा को आप यहां पे क्या कर सकते हैं नॉर्मल डिस्ट्रीब्यूशन डाटा में कन्वर्ट कर सकते हैं कुछ इस तरीके से अब ये जो आपके पास सैंपल साइज आप सैंपल डाटा उठाया ये कितना उठाया 50 डाटा उठाया अब आप इसे और बढ़ाइए तो और आपके पास यहां पर आपके जो डायग्राम है उसके अंदर चेंजेज देखने को मिलेगा जैसे देखिए यदि मैं यहां पर 60 देखूं तो मैं जैसे रन करूंगा तो ये और प्रेसर साइज होता रहेगा और और नॉर्मल डिस्ट्रीब्यूशन की तरफ आपके पास बढ़ता रहेगा तो चलिए इसे रन करते हैं एक बार के लिए और यह हमारा डाटा जो है वोह कैलकुलेट हो रहा है यहां पर और अब हम इसे रन करते हैं तो देखिए हमारा जो डाटा है यहां पर और प्रेस साइज हो रहा है और यह नॉर्मल डिस्ट्रीब्यूशन डाटा की तरफ बढ़ रहा है अब देखिए आपके पास यहां पर सेंटर लिमिट थ्योरम की एक बहुत इंपॉर्टेंट लाइन है वो लाइन क्या कहती है गाइज यहां पर कि जब आप यहां पर अपना पॉपुलेशन टा का मीन देखते हैं और जब आप यहां पर सेंटर लिमिट थ्योरम के अंदर जो आपने थ्योरम अप्लाई की है उसका मीन देखते हैं यहां पर वो आपका ऑलमोस्ट सेम आता है यहां पर तो चलिए मीन देख लेते हैं इसका क्या मीन आने वाला है यहां पर तो मैं ये जो पॉप डाटा है यहां पर इस पॉप डाटा का मीन देखूंगा इस पॉप डाटा का मीन देखने के लिए मैं एप डॉट यहां पर मीन का इस्तेमाल करूंगा और इसके अंदर मैं क्या कर रहा हूं गाइज यहां पर ये जो पॉप डेटा इसका डाल रहा हूं यहां पर ये जो मीन आपके पास निकल के आया है वो कितना निकल के आया है 54.3 5 निकल के आया है ओके अब मेरे पास ये जो सैंपल मीन आए हैं यहां पर इन सैंपल मीन का मैं मीन देखूंगा तो मैं क्या कर रहा हूं गाइज यहां पर एप डॉट क्या कर रहा हूं गाइज यहां पर मीन का इस्तेमाल करूंगा एपी डॉट मैं मीन का इस्तेमाल कर रहा हूं और इस मीन के अंदर मैं सैंपल जो मीन है यहां पर इसको रख रहा हूं और रन कर रहा हूं तो देखिए इसका आंसर कितना आया है 54 अ 54.2 से आया है यहां पर और ऊपर वाले का भी देखिए 54.3 5 निकल गया है मतलब हमारे पास जो मीन निकल के आया गाइ यहां पर दोनों ग्राफ का वो ऑलमोस्ट सेम आया है यहां पर एंड इसके साथ-साथ यहां पर देखेंगे कि पहला जो डाटा था वो नॉन नॉर्मल डिस्ट्रीब्यूशन डाटा था और फिर बाद वाला जो डाटा देखेंगे तो वो आपका एक नॉर्मल डिस्ट्रीब्यूशन डाटा आपको देखने को मिल रहा है यहां पर तो इस तरह से आपके पास क्या करते हैं कभी-कभी आपके ऐसी सिचुएशन आ जाती है जहां पे आप पॉपुलेशन डाटा का मीन नहीं निकाल सकते तो उस पॉपुलेशन डाटा में जसे आप कुछ सैंपल डाटा पिक कर लीजिए और उस सैंपल डाटा का मीन का मीन फाइंड आउट कर दीजिए तो वो आपके पॉपुलेशन डाटा के मीन के इक्वल आने वाला है यह आपका सेंटर लिमिट थ्योरम कहती है और इसी तरह की सिचुएशन के अंदर हम सेंटर लिमिट थ्योरम का इस्तेमाल करते हैं और आज की इस वीडियो के जरिए हम बात करेंगे हाइपोथेसिस टेस्टिंग के बारे में हाइपोथेसिस टेस्टिंग कब इस्तेमाल की जाती है इसको आज आप डिटेल के साथ समझने वाले हैं हाइपोथेसिस टेस्टिंग के अंदर कौन कौन सी टेस्ट का इस्तेमाल किया जाता है वो भी चीजें हम डिटेल के साथ आज के इस वीडियो के जरिए देखेंगे चलिए जरा स्टार्ट करते हैं जस्ट सपोज मान लीजिए कि आपकी कोई एक मेडिकल इंडस्ट्रीज है मतलब आप फार्मर इंडस्ट्रीज में काम करते हैं आपकी फार्मर इंडस्ट्रीज है यहां पर और आपने कोई एक टैबलेट ए बनाई है और यह जो टैबलेट ए है ये क्या करती है आपके पास 3 घंटे के अंदर यस थ आवर्स के अंदर आपके जो फीवर है उसे रिमूव कर देती है जस्ट सपोज पैरासिटामोल भी आती है ठीक है डोलो आपके पास आती है है ऐसे बहुत सारी आपके पास टैबलेट्स आती है मार्केट में तो उन्हीं में से कोई आपने एक टैबलेट डिजाइन की है और टैबलेट बनाई है यहां पर और वो क्या करती है यहां पर 3 घंटे में आपका फीवर उतार देती है अब आपने एक टैबलेट बना दी है अब टैबलेट बनाने के बाद में आप ऐसा तो नहीं है कि आप अपनी कंपनी को आगे नहीं बढ़ाएंगे बिल्कुल आपको अपनी कंपनी आगे बढ़ानी है तो आप नए-नए यहां पर इन्वेंशन करेंगे मतलब आप यहां पर और इसके अंदर जाएंगे कि इसके वर्किंग आवर को कम किया जाए मतलब ये 3 घंटे की बुखार को आप एक घंटे में ही रिमूव कर सके तो ऐसा करने के लिए आप क्या करते हैं एक मेडिसिन बी बनाते हैं राइट अब आपने क्या की एक मेडिसिन बी बनाई है यहां पर और मेडिसिन बी बनाने के बाद में जब इसकी टेस्टिंग की गई तो आपके पास क्या हुआ ये वन ववर के अंदर ही आपके फीवर को दूर कर गई है अब ऐसा तो है नहीं कि आपने टेस्टिंग कर दी है तो इसको बी को लॉन्च कर दिया जाए नहीं बी को लॉन्च करने से पहले आपको चेक करना पड़ता है कि जो आपने बी जो है जो नई बी जो आपने बनाई है बी नाम की जो टैबलेट आपने बनाई है यहां पर वो ए से परफेक्ट है मतलब a से अच्छी तरीके से वर्क कर इससे ज्यादा अच्छा वर्क करती है यह आपको चेक करना होता है अब इस चेक करने का जो प्रोसीजर होता है दैट इज कॉल्ड ऑफ हाइपोथेसिस टेस्टिंग यस आप यहां पे क्या करते हैं हाइपोथेसिस टेस्टिंग करते हैं अब ये हाइपोथेसिस टेस्टिंग कैसे की जाती है तो बेसिकली ये जो मेडिसिन है जो आपने बी मेडिसिन बनाई है इस बी मेडिसिन को आप क्या करते हैं कुछ ग्रुप ऑफ आपके पास पीपल्स को देते हैं टेस्टिंग करने के लिए देते हैं और टेस्टिंग करने के बाद में उनके जो कुछ रिजल्ट आते हैं उन रिजल्ट को कलेक्ट करते हैं अब रिजल्ट को कलेक्ट करने के बाद में आप जो एज वाली टैबलेट है इसको भी कुछ ग्रुप ऑफ मेंबर्स को देते हैं और वहां से भी आप क्या करते हैं कुछ रिजल्ट को गेट करते हैं अब रिजल्ट को गेट करने के बाद दोनों रिजल्ट को कंपेयर किया जाता है कि कौन सा रिजल्ट बेस्ट है और फिर उसके कंपैरिजन में आपको रिजल्ट बताया जाता है कि यस बी जो है काफी इफेक्टिव है और बी जो है आपके पास कम आवर्स के अंदर आपके फीवर को दूर कर सकती है तो यहां पे ये जो टेस्टिंग हो रही है यहां पर बेसिकली सम ग्रुप ऑफ आपके पास जो पीपल है उनके ऊपर टेस्ट किया जा रहा है एंड देन कुछ रिजल्ट कैलकुलेट किया जा रहा है तो ये जो पूरी एंटायस ंग होती है इसके अंदर इट्स कॉल्ड ऑफ हाइपोथेसिस टेस्टिंग ये हाइपोथेसिस टेस्टिंग मेडिकल इंडस्ट्रीज के अलावा और भी इंडस्ट्रीज के अंदर यूज की जाती है जैसे कि एग्जांपल के तौर पे जब भी कोई वेबसाइट जैसे मैं आईटी इंडस्ट्रीज की बाद में बात करूं यहां पर तो जब भी कोई वेबसाइट यहां पर लॉन्च की जाती है तो वेबसाइट के लॉन्च होने पर आपके पास कुछ डाटा रिकॉर्ड कर आ जाता है कि उस वेबसाइट के ऊपर कितनी रीच है कितने पीपल्स वहां पे आ रहे हैं कितने क्लिक्स हो रहे हैं वगैरह ये सारा जो रिकॉर्ड्स है वो कलेक्ट कर लिया जाता है अब आप क्या करते हैं एक और नई वेबसाइट बनाते हैं या उसी वेबसाइट को इंप्रूव करते हैं और इंप्रूव करने के बाद में इंप्रूव करने के बाद में आप फिर से उस वेबसाइट के ऊपर चेक करते हैं कि उसके ऊपर नंबर ऑफ रीच मतलब नंबर ऑफ पीपल की इंगेजमेंट बढ़ी है या घटी है अब वो बढ़ने के पीछे रीजन आपके पास नई वेबसाइट का बनना है या कोई और रीजन है यह चीज आपको पता लगानी है कि नई वेबसाइट की डिजाइन होने से रीच बढ़ी है या फिर आपके पास कुछ ऐसे प्रोडक्ट आपके पास उसके अंदर ऐड करें जिसकी वजह से रीच बढ़ी है तो इस चीज को चेक करने के लिए भी आप क्या करते हैं हाइपोथेसिस टेस्टिंग का इस्तेमाल करते हैं इवन दैट जो फूड कंपनियां हैं फूड कंपनियां भी अपने प्रोडक्ट को बार-बार हाइपोथेसिस टेस्टिंग करती है कि जो उनकी फूड की क्वालिटी है वो आपके पास पहले के कंपेरटिवली बेटर है राइट इस चीज को भी चेक करने के लिए क्या करते हैं आप लोग यहां पर हाइपोथेसिस टेस्टिंग का इस्तेमाल करते हैं तो हाइपोथेसिस टेस्टिंग क्या है यहां पे गाइस कि जो हमारी एजिस्टिफाई नहीं है इस चीज को चेक करने के लिए आप क्या करते हैं हाइपोथेसिस टेस्टिंग का इस्तेमाल करते हैं मतलब जैसे कि अभी कोई आपके पास करंट में वर्किंग चल रहा है और आप कोई नया वर्क ला रहे हैं यहां पे उसके कंपेरटिवली एक नया वर्क ला रहे हैं अब आपको चेक करना है कि जो नया वर्क है वो उसके कंपेरटिवली बेटर है या खराब है आपको दोनों में से कोई एक चीज चेक करनी है कि जो नया वर्क आया है वो पहले वाले के कंपैटिबल बेटर वर्क कर रहा है या फिर आपके पास यहां पे उससे लेस वर्क कर रहा है इस चीज को चेक करके आपको रिजल्ट निकालना है कि कौन सा बेस्ट है यहां पर राइट तो इस चीज को चेक करने के लिए हम यूज़ करते हैं हाइपोथेसिस टेस्टिंग और डेटा साइंस के अंदर हाइपोथेसिस टेस्टिंग का इस्तेमाल बहुत ज्यादा होता है राइट हर किसी केसेस के अंदर जैसे आप किसी भी इंडस्ट्रीज में काम करेंगे तो वहां पे कोई ना कोई प्रोडक्ट इन्वेंटरी बनती रहती है और डे बाय डे उन प्रोडक्ट के अंदर अपडेट होते रहते हैं और जैसे-जैसे डे बाय डे प्रोडक्ट के अंदर अपडेट होते हैं तो चेक करते हैं कि पुराने वाले प्रोडक्ट से कितना बेटर है या कितना खराब है इस चीज को चेक करने के लिए फिर हम हाइपोथेसिस टेस्टिंग का इस्तेमाल करते हैं अब इस हाइपोथेसिस टेस्टिंग के अंदर मैं मैं बात करूं तो ये क्या है आपके पास यहां पर स्टैटिक्स का पार्ट है और स्टैटिक्स के अंदर आपके पास क्या है इंफर स्टैटिक्स का पार्ट है मतलब आप यहां पर एंटायस ऑफ डाटा के ऊपर काम नहीं करते हैं आप क्या करते हैं सम ग्रुप ऑफ डेटा के ऊपर काम करते हैं मतलब आप सैंपल्स के ऊपर काम करते हैं जैसे इस मेडिसिन के ऊपर भी बात करते हैं यहां पर ये जो मेडिसिन आपने बनाई है मतलब जो नई मेडिसिन भी बनाई है तो ऐसा तो है नहीं कि इसको मार्केट में लॉन्च कर दें और हर कोई पर्सन इसे यूज करें और यूज करने के बाद उसका फीडबैक दे और फीडबैक के हिसाब से हम काम करें दैट इज नॉट अ पॉसिबल ये पॉसिबल टास्क नहीं है तो अब हमें क्या करना है यहां पर हम यहां पे क्या करते हैं कुछ सैंपल डाटा उठाते हैं और उन सैंपल डाटा के ऊपर हम क्या करते हैं ये टेस्टिंग करते हैं उस सैंपल डाटा के ऊपर हम क्या करते हैं ये टेस्टिंग करते हैं दैट इज व्हाई आपके पास ये कौन सी है टेस्टिंग आपके पास है इंफ्रास्ट्रक्चर स्टैटिक्स के अंदर आता है क्योंकि हम यहां पे इंफ्रास्ट्रक्चर स्टैटिक्स के अंदर सम ग्रुप ऑफ अमाउंट्स ऑफ डाटा के ऊपर ही काम करते हैं तो ये क्या है आपके पास यहां पर स्टैटिक्स पार्ट है वेयर इसमें टेस्ट में क्या करते हैं गाइ यहां पर कि जो भी आपके डाटा पैरामीटर्स है उससे चेक करते हैं कि जो पुराना वाला जो डेटा है और जो नया वाला डेटा है उससे कितना इफेक्टिव है दैट कॉल ऑफ हाइपोथेसिस टेस्टिंग अब बात करते हैं इस हाइपोथेसिस टेस्टिंग के अंदर आपको दो काम करने होते हैं पहला आपको नल हाइपोथेसिस ढूंढना होता है दूसरा आपको अल्टरनेटिव हाइपोथेसिस ढूंढना होता है इस चीज को समझने के लिए मैं एक छोटा सा एग्जांपल दूंगा आप लोगों को ताकि आपको नल हाइपोथेसिस और अल्टरनेटिव हाइपोथेसिस समझ में आ सके जैसे एग्जांपल के तौर पे मैंने पहले कोई मेडिसिन बनाई और मैंने दूसरी मेडिसिन बनाई अब यहां पे क्या होगा कि जो पहले मेडिसिन जो लोगों ने बनाई होगी जैसे सपोज हम दो ग्रुप बना रहे हैं यहां पर पहले ग्रुप ने ए मेडिसिन बनाई और ए मेडिसिन बहुत ज्यादा पॉपुलर हो गई है यहां पर और बहुत बहुत ज्यादा पॉपुलर होने के बाद में ये तीन घंटे में बुखार को रिमूव कर लेती है फिर मैंने एक नया ग्रुप बनाया और नया ग्रुप बनाने के बाद में मैंने उनको बोला कि ये जो बना रहे हैं इनसे अच्छी मेडिसिन आप बनाओ जो कि एक घंटे के अंदर फीवर को दूर कर दे तो उन्होंने वो मेडिसिन बना ली अब दोनों ग्रुप्स के अंदर क्या हो गई लड़ाई हो गई है कि नहीं जो मेडिसिन बी जो है वो इतनी ज्यादा इफेक्टिव नहीं है और मेडिसिन बी वाले बोल रहे हैं कि मेडिसिन ए से हम बेटर है राइट मेडिसिन ए से हम क्या है बैठ रहे हैं तो ऐसे केसेस में ये लोग क्या करते हैं कि ये लोग चले जाते हैं कोर्ट के अंदर राइट आपको अंश करना है कि ये लोग क्या कर रहे हैं कोर्ट के पास जा रहे हैं यहां पर और कोर्ट के पास जाने पर क्या होता है कि कोर्ट के अंदर आपको यदि लड़ना है मतलब कोर्ट के अंदर आपको यहां पर केस जीतना है तो आपको वकील करने होंगे राइट वकील करने होंगे एक वकील किसका होगा गाइस यहां पर ए का होगा और दूसरा वकील बी का होगा जैसे एग्जांपल के तौर पे कि जब कोई पर्सन किसी का मर्डर कर देता है या जब कोई पर्सन होता है यहां पर कोई रॉबरी वगर कर लेता है यहां पर तो उसके केसेस में भी हम दो वकील रखते हैं पहला वकील क्या होता है कि जो रोबरी करने वाला जो है उसके पक्ष में बोल रहा होता है और दूसरा वकील कौन सा होता है गाइ यहां पर जो उसके विपक्ष में बोल रहा होता है तो सेम एज यहां पे भी हमारे दो वकील हैं ये दोनों गए कोर्ट के पास और कोर्ट मतलब यहां पे कोर्ट का कौन सा रोल होगा कोर्ट कोर्ट यहां पर हाइपोस सटिंग है अब इनके खुद के दो वकील होने चाहिए इनके खुद के दो वकील होने चाहिए पहला वकील मैं बात करूं यहां पर दैट इज कॉल ऑफ आपके पास क्या होगा गाइज यहां पर इट्स कॉल ऑफ नल हाइपोथेसिस यस दैट इज कॉल्ड ऑफ नल हाइपोथेसिस और नल हाइपोथेसिस क्या बोलेगा यहां पर नल हाइपोथेसिस बोलेगा कि ये जो बी मेडिसिन जो आपने बनाई है वो बिल्कुल अच्छी नहीं है यस ये बिल्कुल अच्छी नहीं है बिल्कुल अच्छी नहीं होने का मतलब क्या है गाइस यहां पर ये जो है आपके पास जैसे हमने बनाई है मतलब जैसे a है उसी तरह से b है मतलब बेसिकली गाइस मैं बात करूं नल हाइपोथेसिस कहेगा कि जो ए मेडिसिन का जितना इफेक्ट है उतना ही बी मेडिसिन का ही इफेक्ट है अब आप बोलोगे सर वो एक घंटे में सॉल्व कर रही है ये तीन घंटे में आपके पास फीवर को उतार रही है तो सेम कैसे है तो यहां पे जो ए वाले हैं वो ये बोलेंगे कि बी जो है वो ज्यादा इफेक्टिव नहीं है वो आपके पास बराबर ही है कोई ज्यादा इफेक्टिव नहीं है हां हो सकती है तो थोड़ी सी ज्यादा हो सकती है या थोड़ी सी कम हो सकती है इससे ज्यादा नहीं है ए के बराबर ही है राइट तो नल हाइपोथेसिस क्या बोल रहा है यहां पर नल हाइपोथेसिस मतलब ए का वकील बोल रहा है ए का वकील बोल रहा है कि जो बी मेडिसिन आपने डिजाइन की है वो इतनी ज्यादा इफेक्टिव नहीं है इतनी ज्यादा पावरफुल नहीं है जितना ज्यादा इसको बताया जा रहा है मे बी हो सकता है आप ने जो लोग इकट्ठे किए हैं वो इतने एनर्जेटिक हो या इतने आपके पास यहां पे इम्युनिटी पावर उनकी इतनी अच्छी हो कि वो एक घंटे में ही फीवर को दूर कर रहे हो तो a का वकील ये बोलता है और इसको हम बोलते हैं नल हाइपोथेसिस यस ये क्या कहलाता है गाइज यहां पर नल हाइपोथेसिस और इस नल हाइपोथेसिस को दिखाने का तरीका क्या होता है गाइ यहां पर h0 होता है नल हाइपोथेसिस क्या होता है इसको दिखाने का तरीका क्या है h0 है देन सेकंड चीज आता है अल्टरनेटिव हाइपोथेसिस जो कि है बी का वकील बी का वकील क्या बोल रहा है गाइस यहां पर कि मैं a से ज्यादा अच्छा हूं मतलब इज मीन दैट आपके पास बी जो है दैट ग्रेटर दन ऑफ a राइट या फिर आपके पास यहां पे लेस देन का भी साइन हो सकता है या फिर ये बोल सकते हैं कि भाई ए और बी बराबर नहीं है यहां पे ये बोल सकते हैं ए और बी बराबर नहीं है कुछ तो डिफरेंस है भाई कुछ तो डिफरेंस है ए से ज्यादा अच्छी है यस ए से ज्यादा अच्छी है या ए से ज्यादा खराब है ये भी बोल सकते हैं लेकिन कुछ ना कुछ डिफरेंस है इसका मतलब क्या हो गया गाइस ए और बी बराबर नहीं है तो गाइस यहां पर ये बोल सक हैं कि जो ए का वकील होगा वो कौन होगा हमारा यहां पर h नॉ होगा मतलब नल हाइपोथेसिस होगा और जो बी का वकील होगा गाइज यहां पर वो कौन होगा आपका अल्टरनेटिव हाइपोथेसिस होगा जिसको ए से डिनोट करते हैं या h1 से डिनोट करते हैं तो गाइस जैसे कि हमारे कोर्ट में भी यही होता है कि जो भी कोई आपके पास यहां पर आपके पास क्राइम होता है उस क्राइम के लिए हम दो वकील रखते हैं कौन सा पहला वकील जो उसको डिफेंड कर रहा होता है जो पर्सन के ऊपर क्राइम अप्लाई हुआ है दैट वो डिफाइन कर रहा होता है सेकंड वकील जो होता है गाइज यहां पर वो उसको क्या करता है अपोज करता है मतलब हां कि ये क्राइम किया है इस पर्सन ने तो सेम एज यहां पे भी है कि यहां पर हमारे पास क्या है आपके पास दो प्रोडक्ट है एक ए है एक बी है ए हमारा एजिस्टिफाई भी ज्यादा इफेक्टिव नहीं है जितनी ज्यादा बताई जा रही है राइट और बी का वकील क्या बोलेगा गाइज यहां पर बी का वकील बोले लेगा यहां पर कि मैं a से ज्यादा इफेक्टिव हूं या फिर मैं a के बराबर नहीं हूं सिंपल सी लाइन य पलेगा तो दैट्ची की जरूरत पड़ती है फर्स्ट वन इज नल हाइपोथेसिस एंड सेकंड वन इज अल्टरनेटिव हाइपोथेसिस और इन हाइपोथेसिस के बेसिस पे हम आगे के टेस्ट कंडक्ट करते हैं अब ये टेस्ट कितने टाइप्स के हैं गाइस यहां पर तो ये टेस्ट आपके पास बहुत से तर के होता है और कुछ कॉमन टेस्ट हम डिस्कस करने वाले हैं आगे आने वाली वीडियो के अंदर जिनमें कौन-कौन सा है जेड टेस्ट टी टेस्ट एंड चा स्क्वायर टेस्ट ये तीन टेस्ट हम यहां पर आगे आने वाले वीडियो के अंदर डिस्कस करेंगे अब ये टेस्ट जो है डिपेंड करेंगे कि आपके पास सिचुएशन क्या है ऐसा नहीं है कि हर एक सिचुएशन के अंदर कोई भी टेस्ट लग जाएगा नो ऊपर वाले जो दो टेस्ट है गाइस यहां पर ये आपके डाटा के अंदर एवरेज के अंदर काम करते हैं एवरेज के अंदर काम करने का मतलब क्या है गाइ यहां पर कि दो डाटा है पर उनके एवरेज है यहां पर एवरेज के बारे में बात की जा रही है तो ये दोनों टेस्ट काम करते हैं और बेसिकली ये कुछ सैंपल डाटा पे ही काम करते हैं आपके पॉपुलेशन डाटा पे काम नहीं करते सेकंड चीज मैं बात करूं यहां पर चाय स्क्वेयर टेस्ट के बारे में तो चाय स्क्वेयर टेस्ट दो तरीके से काम करता है गाइस कौन-कौन से दो तरीके पहला तो यहां पर ये तर काम करता है कि कोई भी चीज आपकी बेटर है या नहीं है मतलब वो सही चीज आपके पास यहां पर परफेक्ट है या नहीं है यस कोई भी आपका इवेंट हो रहा है वो परफेक्ट तरीके से हो रहा है या नहीं हो रहा है इस चीज के लिए फाइंड आउट करता है मतलब आपके पास क्या करता है ये गुडनेस के बारे में बात करता है किसी भी चीज की गुडनेस के बारे में बात करता है कि वो चीज परफेक्टली वर्क कर रही है या नहीं काम कर रही है देन सेकंड जो यहां पे यह काम करता है कि दो डाटा के बीच में कोई रिलेशन है या नहीं है यस दो डाटा के बीच में क्या करता है गाइस यहां पर किसी भी चीज का रिलेशन है या नहीं है या दोनों इंडिपेंडेंट्स है इस चीज के बारे में फाइंड आउट करके हमें देता है तो गाइस हाइपोस टेस्टिंग के अंदर बहुत से तरीके के टेस्ट हो है जिनके अर हम कॉमन तीन तरह के टेस्ट को डिस्कस करेंगे जड टेस्ट डी टेस्ट एंड चा स्क्वा टेस्ट तीनों अलग-अलग सिचुएशन के अंदर काम करते हैं तीनों सेम सिचुएशन के अंदर काम नहीं करते हैं हां जड टेस्ट और टी टेस्ट है वो एवरेज में काम करते हैं लेकिन एवरेज में भी आपके पास अलग-अलग सिचुएशन में काम करेंगे एवरेज भी आपके पास अलग-अलग तरीके से अ होगा यहां पर तो उनमें भी अलग-अलग सिचुएशन में काम करेंगे और चा स्को टेस्ट जो है आपके पास यहां पर ये डाटा के गुडनेस को दिखाएगा कि कोई भी चीज परफेक्टली है या नहीं है जैसे ये माउस है ये परफेक्टली डिजाइन हुआ है या नहीं हुआ है राइट इस चीज को चेक करना है दैट अ गुडनेस ओके और दो चीज के बीच में रिलेशनशिप को चेक करने के लिए भी हम चा स्को टस्ट यूज करेंगे राइट तो प्रॉपर्ली ये हम हाइपोथेसिस टेस्टिंग डिस्कस करने वाले हैं तो हाइपोस टेस्टिंग क्या है कि जो हमारा एजिस्टिफाई टेस्टिंग के बारे में चलिए जरा इसको डिस्कस करते हैं कि ये कैसे वर्क करता है यदि आपको पाइथन मशीन लर्निंग डेटा साइंस एंड डेटा एनालिस फील्ड में अपने आपको ग्रो करना है तो इसके लिए डब्लू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो देखिए जब भी आपके पास कोई क्वेश्चन आएगा उस क्वेश्चन के जरिए या फिर जो भी आपकी सिचुएशन होगी उस सिचुएशन के अंदर हम टोटली ये स्टेप्स फॉलो करते हैं अब ये स्टेप्स क्या-क्या है यहां पर सबसे पहला स्टेप्स होगा कि जो भी आपका सिचुएशन होगा उस सिचुएशन के अंदर आप क्या करेंगे नल हाइपोथेसिस और अल्टरनेटिव हाइपोथेसिस को निकालेंगे मतलब जैसा कि लास्ट वीडियो के अंदर बताया था कि आपके पास जो भी आपका डाटा होता है उसमें आपको दो वकील्स निकालने होते हैं एक जो होता है वो उसके सपोर्ट में होता है और दूसरा उसके अपोज करता है राइट तो नल हाइपोथेसिस एंड अल्टरनेटिव हाइपोथेसिस आपको निकालने होते हैं तो सबसे पहला आपका काम क्या है कि नल हाइपोथेसिस और अल्टरनेटिव हाइपोथेसिस को फाइंड आउट करना है उसके बाद चूज सिग्निफिकेंट लेवल अल्फा आपको डिसाइड करना है जिसे हम कॉन्फिडेंस इंटरवेल भी बोलते हैं वो आपको निकालना है फिर फाइंड क्रिटिकल वैल्यू निकालनी है फिर फाइंड टेस्ट कौन सा टेस्ट हमें निकालना है वो निकालना है और फिर आपको कंक्लूजन डालना है ये हमारे कुछ स्टेप्स होते हैं जिनके ऊपर हम बात करते हैं चलिए अभी मैं क्या कर रहा हूं यहां पे गाइस बता रहा हूं यहां पर कि कौन से स्टेप कैसे-कैसे वर्किंग करते हैं चलिए नेक्स्ट अब समझते हैं सबसे पहले कि हमारा काम क्या होगा तो देखिए सबसे पहले हमें नल हाइपोथेसिस अल्टरनेटिव हाइपोथेसिस को निकालना है जैसे आपका कोई भी क्वेश्चन आएगा उस क्वेश्चन के अंदर आपको क्या करना है सबसे पहले नल हाइपोथेसिस को निकालना है नल हाइपोथेसिस का जैसे कि मैंने आपको बोला था कि नल हाइपोथेसिस क्या करता है नल हाइपोथेसिस बोलता है कि जो आपके पास नया प्रोडक्ट है और जो आपका एजिस्टिफाई और आपने कोई बी प्रोडक्ट नया बनाया है जो कि ए प्रोडक्ट से काफी अच्छा है तो आपके पास नल हाइपोथेसिस h नॉ क्या बोलेगा कि दोनों के बीच में कोई डिफरेंस नहीं है यस दोनों के बीच में कोई डिफरेंस नहीं है मतलब आपके पास क्या क रहा है दोनों सेम वर्किंग ही कर रहे हैं यहां पर ये बोलेगा या फिर ये बोलेगा कि थोड़ा बहुत बड़ा है या फिर थोड़ा बहुत छोटा है ये आपके साइंस होंगे जबकि अल्टरनेटिव हाइपोथेसिस की बात बात करें यहां पर वो क्या बोला जाएगा कि जो ए प्रॉडक्ट आपने बनाया है और जो आपने बी प्रोडक्ट आपने बनाया है ये दोनों आपस में बराबर नहीं है मतलब इनमें डिफरेंशिएबल या फिर यह बोल सकता है कि बी प्रोडक्ट अच्छा है या फिर यह बोल सकता है कि बी प्रोडक्ट खराब है कि कंपली तो कुछ इस तरह से आपके पास होता है तो आप अपने जो भी आपको स्टेटमेंट मिले या फिर जो भी आपको सिचुएशन मिले उन सिचुएशन में से पहले आपको दो वकील निकालने होंगे अदर वाइज टेस्ट कंडक्ट नहीं होगा जैसे सिंपल सा एग्जांपल की बात करें कि आपके पास कोई आपके पास मर्डर है मतलब किसने किसीने मर्डर कर दिया किसी पर्सन का ठीक है वो पर्सन है यहां पर है ना अब उस पर्सन को आप क्या कर सकते हैं या तो वो गिल्टी होगा या वो नॉट गिल्टी होगा दोनों में से कोई एक हो वाला है राइट तो अब जब तक आपके पास जो उनके वकील्स हैं बस मतलब उनके वकील्स का मतलब क्या है कि जिसने मर्डर किया उसका वकील और जो आपके पास पब्लिक वटी वकील ये दोनों जब तक आपस में लड़कर ये प्रूफ नहीं कर देते कि उसने मर्डर किया या नहीं किया तब तक वो आपके पास मर्डर वाला पर्सन नहीं कहलाएगा राइट उसने मर्डर किया या नहीं किया ये प्रूफ नहीं हो जाता तब तक वो मर्डर वाला पर्सन नहीं कहलाता है राइट सेम एज हमारे यहां पे भी यही है कि यदि हम कोई ए प्रोडक्ट बना रहे हैं और उसके बाद कोई बी प्रोडक्ट बना रहे हैं जो कि उसका अपडेशन है और अपडेशन से प्रॉफिट हो रहा है तो जब तक हम यहां पर ये कंडक्ट प्रूफ नहीं कर देते तब तक हमारे पास यहां पर ये अच्छा है या नहीं अच्छा है ये हम नहीं बता सकते राइट तो बेसिकली इस चीज को आइडेंटिफिकेशन है सबसे पहले आप क्या करेंगे नल हाइपोथेसिस और अल्टरनेट हाइपोथेसिस को फाइंड आउट करेंगे उसके बाद गाइ बात करें यहां पर तो आपको कॉन्फिडेंस इंटरवल या फिर हम बोल सकते हैं यहां पर लेवल ऑफ सिग्निफिकेंट ये आपको अल्फा निकालना होता है अब ये अल्फा किसके ऊपर निकाल जाता है तो ये आपका अल्फा जो होता है वो डोमेन एक्सपर्ट निकालता है अब बेसिकली गाइस यहां पर एक आपको ध्यान रखना है कि जो भी आप यहां पर सिचुएशन ले रहे हैं राइट उस सिचुएशन को आपको अपने माइंड में मानना है कि वो क्या है आपका नॉर्मल डिस्ट्रीब्यूशन सिचुएशन है मतलब बेसिकली गाइज मैं बात करूं यहां पर कि आपको ऑलवेज एंड ऑलवेज मानना है कि जो भी आपको डाटा दिया जा रहा है वो डाटा ऑलवेज एंड ऑलवेज नॉर्मल डिस्ट्रीब्यूशन है दैट इज आपके पास यहां पर अजमन यस ये अंश आपको मानना पड़ेगा कि आपका जितना भी डाटा है वो आपके पास क्या है आपका नॉर्मल डिस्ट्रीब्यूशन है अब ये नॉर्मल डिस्ट्रीब्यूशन हम क्यों मान रहे हैं क्योंकि नॉर्मल डिस्ट्रीब्यूशन एक ऐसी सिचुएशन है जिसके अंदर आपके पास यहां पे जितना इसका राइट साइड पार्ट होता है उतना ही आपका लेफ्ट साइड पार्ट होता है मतलब इट्स कॉल ऑफ सिमेटिक कव इसको आप यदि बीच में से कट करेंगे तो आपको जो राइट हैंड साइड पार दिखेगा वही आपको लेफ्ट हैंड साइड पार दिखेगा और जो राइट हैंड साइड की जो वैल्यू है वही आपको लेफ्ट हैंड साइड की वैल्यू भी दिखती है मतलब ये आपके पास क्या सिमिलर है आपके पास यहां पर आपके पास सिमेटिक है इसको आप फोल्डेबल कर सकते हैं पहली चीज सेकंड चीज क्या हैगा कि इसका जो मीन मीडियन मॉड है है वो आपको सेंट्रल लाइन मिलता है यहां पर थर्ड चीज क्या है कि इसका एरिया अंडर द कर्व की बात करूं यस किसकी बात करूं यहां पर एरिया अंडर द कर्व की बात करूं वो वन होता है क्योंकि दैट अ प्रोबेबिलिटी कर्व राइट अभी आपके पास क्या है x एक्सिस में क्या चलता है आपकी वैल्यू चलती है और y एक्सिस में क्या चलती है आपकी डेंसिटी चलती है यस y एक्सिस में क्या चलती है आपके डेंसिटी चलती है मतलब कौन सी डेंसिटी प्रोबेबिलिटी डेंसिटी जो कि हमने स समझी थी प्रोबेबिलिटी डिस्ट्रीब्यूशन कर्व के अंदर तो प्रोबेबिलिटी डिस्ट्रीब्यूशन कर्व के अंदर हमने क्या देखा था कि इसका जो एरिया अंडर कव है वो आपको क्या मिलता है ऑलवेज एंड ऑलवेज वन मिलता है राइट तो दैट इज अ बेनिफिशियल एंड सेकंड ली चीज आपके पास यहां पर इसकी प्रोबेबिलिटी का सम क्या होता है वन होता है तो इस वजह से हम क्या मानते हैं कि हमारा जितना भी डाटा है वो नॉर्मल डिस्ट्रीब्यूटर है उसके बाद में आपको एक सिग्निफिकेंट लेवल अल्फा डिसाइड करना होता है ये अल्फा क्यों डिसाइड कर रहे होते हैं क्योंकि जैसे हमारी जो सिचुएशन है जैसे मैंने माना कि भाई हमारा जो भी वर्किंग है वो सारा वर्क नॉर्मल डिस्ट्रीब्यूशन है नया वाला पुराना वाला सारा वर्क नॉर्मल डिस्ट्रीब्यूशन है अब हम क्या करते हैं गाइ यहां पर एक सिग्निफिकेंट लेवल अल्फा डिसाइड कर लेते हैं जैसे मैंने ये अल्फा डिसाइड कर लिया अब ये अल्फा की जो वैल्यू है मैं इस कर रहा हूं 0.05 अब ये डिपेंड करता है डोमेन के ऊपर आपकी जो डोमेन होगी आप उस डोमेन के हिसाब से वर्किंग करेंगे अल्फा की वैल्यू उस हिसाब से लेंगे राइट सेकंड चीज यहां पे ये भी है कि आपके जो भी इस डोमेन का एक्सपर्ट होगा वो आपको बता देगा कि ये अल्फा की वैल्यू कितनी रनी है मेजर्ली अल्फा की वैल्यू की बात बात करें तो ये 1 पर से लगाकर आपके पास 5 पर के बीच में होती है राइट यदि मैं जनरल सिनेरियो की बात करूं तो 1 पर से लेके 5 पर के बीच में आपके पास होती है 1 पर भी इंक्लूड है 5 पर भी इंक्लूड है ये होती है अब ये सिग्निफिकेंट लेवल अल्फा काम क्या करता है बेसिकली तो सिग्निफिकेंट लेवल क्या करता है गाइ यहां पर आपको एक बाउंड्री कंडीशन देता है इस बाउंड्री कंडीशन के ऊपर इस तरफ का जो एरिया होता है वह क्या होता है गाइज यहां पर h0 का होता है मतलब नल हाइपोथेसिस का होता है और नल हाइपोथेसिस बोलता है कि a जो प्रोडक्ट है वो b प्रोडक्ट के इक्वल नहीं है देन जो सेकंड प्रोडक्ट यह जो एरिया होता है गाइज यहां पर यह ए का होता है जो कि आपको यह बोलता है कि जो b प्रोडक्ट हमने बनाया है वह a से काफी अच्छा होता है तो यदि आप यहां पे बोले सिग्निफिकेंट लेवल अल्फा या कॉन्फिडेंस इंटरवल यह जो बोल रहे हैं आपके पास गाइज यहां पर यह क्या डिसाइड करता है यह डिसाइड यह करता है कि आपको एक इंटरवल बना के देता है मतलब आपके पास एक एरिया बना देता है जैसे मैंने यहां पे कॉन्फिडेंस इंटरवल बनाया ये वाला यस ये वाला एक कॉन्फिडेंस इंटरवल बनाया इस कॉन्फिडेंस इंटरवल का मतलब ये हो गया कि इस इंटरवल के इधर वाले पार्ट के अंदर मतलब जो मिडल वाले पार्ट है इसके अंदर यदि हमारा कोई डाटा आता है इसके अंदर हमारे कोई सिचुएशन आती है तो इसका मतलब यह होता है कि जो नया प्रोडक्ट है और जो पुराना प्रोडक्ट है वो सेम है कोई उनमें डिफरेंशिएबल वाले एरिया के अंदर यदि हमारा कोई डाटा आता है कॉन्फिडेंस इंटरवल के बाहर वाले एरिया के अंदर डेटा आता है तो इट्स मीन दैट इसका मतलब ये सिंपल सा है कि आपके पास जो बी प्रोडक्ट है वो ए प्रोडक्ट के डिफरेंशिएबल जाने के लिए हम क्या करते हैं कॉन्फिडेंस इंटरवल डिसाइड करते हैं और ये कॉन्फिडेंस इंटरवल की वैल्यू क्या होती है आपके पास डिपेंड करती है डोमेन के ऊपर या फिर वन से लेकर 5 पर के बीच में रहती है अब ये जो कॉन्फिडेंस इंटरवल आप देख रहे हैं यहां पर ये कॉन्फिडेंस इंटरवल को हम तीन पार्ट के अंदर डिवाइड करते हैं कौन सा होता है दैट अ लेफ्ट टेल दैट अ राइट टेल एंड दैट अ टू टेल यस इसके ऊपर डिपेंड करता है अब देखिए लेफ्ट टेल कब डिसाइड करना है यहां पर लफ टेल उस वक्त डिफाइन करना है जब आपके डाटा के अंदर बोला जा रहा है कि कोई प्रोडक्ट जो नया वाला बना है वो पुराने वाले प्रोडक्ट से बेकार है मतलब खराब है इस तरह की सिचुएशन बोली जा रही है मतलब आपके पास डिफाइन की बा बात की जा रही है मतलब आपके पास डाउन ग्रेड वाले की बात की जा रही है तो यू यूजिंग अ लेफ्ट टेल यस आप क्या यूज़ करेंगे लेफ्ट टेल यूज़ करेंगे लेफ्ट टेल को वन टेल टेस्ट भी बोलते हैं यस राइट टेल को भी वन टेल टेस्ट बोलते हैं जिसके अंदर आपके पास क्या हो रहा है कि आप एक साइड के एरिया के ऊपर ही आप काम कर रहे होते हैं मतलब इस साइड वाला जो एरिया है आपके पास यहां पर ये क्या होगा ए का होगा और अंदर वाला जो एरिया होगा वो h0 का होगा राइट दैट अ वन टेज अच्छा राइट टेल की बात कब की जा रही है कि जब वो बोला जा रहा है कि जो नया वाला प्रोडक्ट है वो पुराने वाले प्रोडक्ट से काफी अच्छा है यस मतलब यहां पे ग्रेटर दन के बारे में बात की जा रही है यहां पर तो दैट यूज ऑफ राइट टेल यस आप क्या यूज़ करेंगे राइट टेल यूज़ करेंगे इसके अंदर ये टेल आपके पास यहां पे क्या होगी ये वाली जो टेल का जो पार्ट होगा वो किसका होगा ए का होगा और अंदर वाला जो पार्ट होगा वो किसका होगा h0 का होने वाला है तो इस तरह से ये कौन सा हो गया गाइज यहां पर राइट टेल टेस्ट हो गया राइट अब आती है बारी यहां पर आपके पास कौन सी टू टेल टेस्ट टू टेल टेस्ट के अंदर क्या होता है गाइज यहां पर अच्छा ये वाली जो वैल्यू है ऊपर वाली दोनों के अंदर अल्फा की वैल्यू अल्फा ही रहेगी लेकिन टू टेल के अंदर सबसे पहला पॉइंट ये है कि जो अल्फा होता है वो अल्फा डिवाइड बा 2 होता है जैसे यदि मैंने सिग्निफिकेंट लेवल 0.05 डिसाइड किया यहां पर तो आपके पास ये वाला जो एरिया और ये वाला जो एरिया है वो डिवाइड बाय टू हो जाएगा मतलब आपके पास क्या होगा 0.025 आपके पास हो जाएगा दैट्ची कब यूज़ की जाती है ये सिचुएशन उस वक्त यूज कर जाती है जब आपके पास कुछ भी नहीं बोला जा रहा है कि ज्यादा अच्छा है या कम अच्छा है आपके पास बोला जा रहा है कि ये दोनों बराबर नहीं है यस जब आपके पास बोला जा रहा है कि दोनों प्रोडक्ट बराबर नहीं है ये इतनी सी बात की जा रही है तब आप क्या करते टू टेलर्स का इस्तेमाल करते हैं यहां पे आपके पास ना तो ग्रेटर दन का साइन देखने को मिलता है ना लेस दन का साइन देखने को मिलता है आपके पास यहां पर दोनों इक्वलिटी का साइन देखने को मिलता है मतलब कोई भी डायरेक्शन आपके पास डिसाइड नहीं होती है कि कौन सी डायरेक्शन के अंदर आपको मूव करना है तो जब आपके पास नॉन डायरेक्शनल आपके पास यहां पर सिचुएशन आ जाए तो यू गोइंग टू टू टेल और टू टेल के अंदर यहां पे ये जो दोनों हिस्से होते हैं गाइस यहां पर ये किसके हो जाते हैं ए के हो जाते हैं और अंदर वाला हिस्सा किसका हो जाता है h0 का हो जाता है तो अभी तक हमने क्या किया h और h0 डिसाइड किया अब हमने क्या किया सि ें लेवल अल्फा डिसाइड किया जिसके बेसिस पे हमने क्या किया दोनों साइड्स के डाटा को डिसाइड किया अब उसके बाद में जो नेक्स्ट स्टेप के अंदर आपके पास आता है आपके पास क्रिटिकल वैल्यू फाइंड आउट करनी होती है क्रिटिकल वैल्यू के फाइंड आउट करने से पहले आपको क्या करना पड़ता है टेस्ट फाइंड आउट करना पड़ता है फाइंड द टेस्ट कि आपका पास कौन सा टेस्ट उसके अंदर अप्लाई होगा अब ये टेस्ट के अंदर हमने बहुत सारे टेस्ट देखे जैसे कि हमने यहां पर जड टेस्ट देखा यस मैं आपको जड टेस्ट दिखाएंगे उसके बाद आपको टी टेस्ट देखेंगे हम यहां पर उसके बाद हम यहां पर चाई स्क्वायर टेस्ट देखेंगे यस कौन सा देखेंगे चाई टेस्ट हम यहां पर देखने वाले हैं अब किस समय कौन सा टेस्ट इस्तेमाल करना है उसके ऊपर थोड़ा सा यहां पर देख लेते हैं ऑब्जर्वेशन देखिए आपके पास सबसे पहले मैं बात करूं कि जो जड टेस्ट है यस जो जड टेस्ट है और जो टी टेस्ट है यस जो जटेस्ट है और टी टेस्ट है ये दोनों कब काम करेंगे जब आपके डाटा के अंदर एवरेज वैल्यू के ऊपर बात की जा रही है यस किसके ऊपर बात की जा रही है एवरेज वैल्यू के ऊपर बात की जा रही है अब इस एवरेज वैल्यू के अंदर भी हम क्या करेंगे कि z टेस्ट का जो इस्तेमाल है उस वक्त करेंगे जब आपके पास आपके डाटा के अंदर जो आपका पॉपुलेशन डाटा है यस जो आपका पॉपुलेशन डाटा है उस पॉपुलेशन डाटा का आपको मीन मिल जाए और इस इसके साथ-साथ आपको क्या मिल जाए स्टैंडर्ड डिवीजन मिल जाए क्या मिल जाए यहां पर स्टैंडर्ड डिवीजन आपको मिल जाए इसके साथ-साथ जो आपके पास सैंपल लिया जा रहा है यस आपके पास जो सैंपल डाटा लिया जा रहा है उस सैंपल डाटा की जो साइज है वो ग्रेटर दन आपके पास क्या हो 30 हो मतलब ग्रेटर दन इक्वल टू 30 हो तब हम यहां पर इसका इस्तेमाल करते हैं अच्छा यदि मैं बात करूं कि ये जो सैंपल डेटा है ग्रेटर दन 30 है और जो आपका पॉपुलेशन डेटा है उसका मीन और स्टैंडर्ड डिविजन आपको देखने मिल जाए हां इसके साथ-साथ एक और चीज का ध्यान रखना है कि जो आपका सैंपल है यस जो आपका सैंपल डाटा आपने लिया है यहां उस सैंपल डाटा का भी आपको क्या करना है मीन ही डिसाइड करना है मीन भी लेना है आपको तब आप क्या करेंगे गाइज यहां पर जटेस्ट का डिसाइड करेंगे ओके अब बात करते हैं गाइस यहां पर कि टी टेस्ट कब इस्तेमाल करना है तो टी टेस्ट के लिए आपके पास क्या होगा कि आपको पॉपुलेशन डाटा आपका जो है यस जो आपका पॉपुलेशन डाटा है उसका आपको मीन मिलेगा उसका आपको क्या मिलेगा मीन मिलेगा अच्छा स्टैंडर्ड डेविएशन आपका जो है वो पॉपुलेशन डाटा का नहीं मिलेगा इस बार तो किसका मिलने वाला गाइज यहां पर आपको आपका जो सैंपल डाटा है यस जो सैंपल डाटा है उसका स्टैंडर्ड डेविएशन आपको देखने को मिलेगा इवन दैट यदि मैं बात करूं यहां पर कि टी टेस्ट कब इस्तेमाल किया जाता है तो जो सैंपल साइज है आपकी यस जो आपकी सैंपल की जो साइज है वो आपके पास लेस देन इक्वल टू लेस दन आपके पास 30 हो यस मतलब 30 से कम सैंपल्स आपको दिखे मतलब कम सैंपल्स के ऊपर आपके पास काम हो रहा है तब आपके पास यह काम किया जाता है अच्छा इसके अंदर भी आपको क्या करना पड़ेगा सैंपल का मीन चाहिए यस क्या चाएगा आपको यहां पर सैंपल का मीन चाहिए तो जड टेस्ट और टी टेस्ट कब काम लिया जा रहा है यहां पर जड टेस्ट आपके पास उस वक्त काम किया जा रहा है जब सैंपल डाटा 30 से ज्यादा हो और इसके साथ-साथ पॉपुलेशन का आपको क्या मिल जाए मीन और स्टैंडर्ड डेविएशन दोनों मिले राइट टी टेस्ट कब काम करना है जब आपके सैंपल साइज जो है वो 30 से छोटी हो इसके साथ-साथ पॉपुलेशन का मीन एंड स्टैंडर्ड डेविएशन इस बार किसका मिलेगा सैंपल का मिलेगा तब आप काम करेंगे अच्छा चा स्क्वा टेस्ट की बात करें तो चा स्क्वायर टेस्ट कब काम करता है चा स्क्वायर टेस्ट आपके पास गुडनेस के ऊपर काम करता है मतलब कि आपको चेक करना है कि कोई जो डेटा आपके पास आ रहा है वो परफेक्टली डेटा है या नहीं है मतलब ओरिजिनल डाटा जो आपके पास होता है उसके बराबर है या नहीं है जैसे मैं बात करूं एक सिंपल सा डाइस कम रोल करते हैं रोल करने पर 1 2 3 4 5 6 इसमें से कोई एक वैल्यू आनी चाहिए लेकिन आप बार-बार बारबार डाइस को रोल करे जा रहे हैं और बार-बार बारबार आपके पास वन आ रहा है इसका मतलब डाइस के अंदर कहीं ना कहीं प्रॉब्लम है कहीं ना कहीं से वो ब्रेकेबल है तो यहां पर आप क्या कर रहे हैं डाइस की गुडनेस के बारे में चेक कर रहे हैं राइट इस तरह के डाटा के अंदर आपका पास काम किया जाता है या फिर कोई दो सिचुएशन दे रखी है यस मतलब आपके पास कोई दो वेरिएबल दे रखे हैं और उन दो वेरिएबल के अंदर देखना है कि इन दोनों के वेरिएबल के अंदर कोई रिलेशनशिप है या नहीं है ये दोनों एक दूसरे के ऊपर डिपेंडेंट है या नहीं है ये चीज आपको देखनी है तब आप चा स्क्वा टेस्ट का इस्तेमाल करते हैं तो सबसे पहले आपका क्या काम होगा कि आप टेस्ट फाइंड आउट करेंगे आपके डाटा को देखते हुए टेस्ट फाइंड आउट करने के बाद में इन टेस्ट से आप क्या करेंगे अपनी क्रिटिकल वैल्यू निकालेंगे क्रिटिकल वैल्यू का मतलब क्या है इन टेस्ट की वैल्यू को निकालेंगे राइट जैसे कि आप क्या करेंगे z वैल्यू निकालेंगे आप यहां पर आप क्या करेंगे t वैल्यूज निकालेंगे राइट ये दोनों निकालेंगे z वैल्यू का फार्मूला अलग होता है t वैल्यू का फार्मूला अलग होता है जो कि आगे आने वाले टाइम के अंदर हम देखेंगे भी जब हम इन टेस्ट को कंडक्ट करेंगे राइट ये निकालने के बाद में अब आपका नेक्स्ट काम क्या होगा आपको एक कंक्लूजन पे आना है कंक्लूजन क्या आना है यहां पे गाइस कि आपका ज जड टेस्ट के करने पर या टी टेस्ट करने पर या च स् टेस्ट करने पर क्या रिजल्ट निकला ए विन है या h नॉट विन है मतलब आपको यहां पे बताना पड़ेगा कि h नॉ जो है यस h नॉ की बात कर रहा हूं यहां पर h नॉ आपके पास राइट है यस h नॉ राइट है यहां पर ये बताना पड़ेगा या फिर आपको ये बताना पड़ेगा कि जो ए है वो आपका राइट है तो इस फाइनल एक कंक्लूजन पे आपको आना पड़ेगा देन जैसे आप इस कंक्लूजन प आ जाएंगे तो आपको पता चल जाएगा कि कौन सही है और कौन गलत है मतलब जो ए आपके पास बेटर है या बी आपका बैटर है ये आपको आइडेंटिफिकेशन मिल जाएगी तो इस तरह से आपके पास क्या करते हैं गाइज यहां पर हाइपोथेसिस टेस्टिंग को करते हैं ये हाइपोथेसिस टेस्टिंग का प्रोसेसर है सबसे पहले नल हाइपोथेसिस अल्टरनेटिव हाइपोथेसिस को निकालना उसके बाद क्या है एक सिग्निफिकेंट लेवल डिसाइड करना सिग्निफिकेंट लेवल डिसाइड करने के बाद में आपके पास जो आपका डाटा दे रखा है उस डाटा के हिसाब से आपको टेस्ट को फाइंड आउट करना टेस्ट को फाइंड आउट करने के बाद में टेस्ट को अप्लाई करना टेस्ट को अप्लाई करने के बाद में आपको कंपैरिजन करना और कंपैरिजन करके आपको एक रिजल्ट प पहुंचना कि कौन यहां पर है सही राइट यह आपका काम होता है इस हाइपोथेसिस टेस्टिंग के अंदर और आज के इस वीडियो के जरिए हम बात करेंगे z टेस्ट और t टेस्ट के बारे में देखिए पहले वाले केस के अंदर हम z टेस्ट के बारे में डिस्कस करेंगे कि z टेस्ट क्या है कैसे वर्क करता है इसका फॉर्मूला क्या है क्वेश्चन कैसे आता है इसको हम डिटेल के साथ देखेंगे तो चलिए पहले मैं आपको जड टेस्ट के ऊपर ले चलता हूं तो स्टार्टिंग से ही मैं क्वेश्चन करवा रहा हूं यहां पर ताकि आप जड टेस्ट को डिटेल के साथ समझ सकें कि क्या किस तरह से वर्क करता है चलिए एक क्वेश्चन है यहां पर क्या लिखा है अ टीचर क्लेम दैट अ मीन स्कोर ऑफ अ स्टूडेंट इन हिज क्लास इज ग्रेटर दन 82 मतलब अब यहां पे क्या बोला जा रहा है कि एज मान लीजिए कि आप एक प्रिंसिपल है मतलब आप एक स्कूल के प्रिंसिपल हैं और आप किसी क्लास के अर जाते हैं और उनके क्लास टीचर को बोलते हैं कि आपके क्लास का मीन स्कोर क्या है यस आपके क्लास का मीन स्कोर क्या है यहां पर मतलब एवरेज स्कोर क्या है रेट चल रही है आपके क्लास की स्कूल के स्टू आपके क्लास के जो स्टूडेंट्स हैं उनके एग्जाम के अंदर एवरेज स्कोर क्या चल रहा है उनका तो उन्होंने बोला कि ग्रेटर दन 82 है हमारे स्टूडेंट्स का अब यहां पे क्या निकाला विद स्टैंडर्ड डेविएशन आपको कितना बताया गया है 20 आपको बता गया अब क्या आ रहा है कि आप इस बात से एग्री नहीं करते हैं और आपने क्या किया एक टेस्ट कंडक्ट किया टेस्ट के अंदर आपने क्या किया कुछ सैंपल स्टूडेंट्स का डाटा लिया जैसे कितने स्टूडेंट का डटा दिया इट्स 81 स्टूडेंट का आपने यहां पर क्या किया डाटा लिया यहां पर और 81 स्टूडेंट का डेटा लेने के बाद में उनका मीन स्कोर निकाला मतलब उनके जो मार्क्स है उनका एवरेज स्कोर निकाला उ 81 का तो वो आपको 90 मिला अब यहां पे आपको एक टेस्ट कंडक्ट करना पड़ेगा जिसकी वजह से यह देखना पड़ेगा कि यह जो सैंपल डाटा हमने पिक अप किया है यहां पर यस ये जो सैंपल डाटा हमने पिक अप किया है ये सही है या नहीं है या जो टीचर जो सही बोल रहे हैं वो सही है या नहीं है मतलब यहां पे टीचर क्या बोल रही है कि हमारी जो क्लास है उस क्लास का मीन स्कोर क्या है ग्रेटर दन 82 है राइट मीन स्कोर क्या है ग्रेटर दन 82 है ये सही है या नहीं है इसको हमें प्रूफ करना पड़ पड़ेगा अब देखिए ये जो ग्रेटर दन 82 आपके पास बोला गया है ये किसका बोला गया है ये पॉपुलेशन का डटा बोला गया है मतलब आपकी क्लास के अंदर कितने नंबर ऑफ स्टूडेंट है मेरी क्लास के अंदर n नंबर ऑफ स्टूडेंट है इन n नंबर ऑफ स्टूडेंट का जो यदि मैं मीन की बात करूं यस इन n नंबर ऑफ स्टूडेंट के स्कोर के मीन की बात करूं यहां पर दैट म इज इक्वल टू कितना दे रखा है 82 दे रखा है अब हमें यहां पे ये प्रूफ करना है इस सैंपल डाटा के अकॉर्डिंग यस इस सैंपल डाटा के अकॉर्डिंग ये प्रूफ करना है कि कि जो टीचर बोल रही है जो टीचर बोल रही है वो सही है या नहीं है मतलब बेसिकली इस हाइपोथेसिस टेस्टिंग के अंदर इस जड हाइपोथेसिस टेस्टिंग के अंदर हम क्या प्रूफ करने वाले हैं बेसिकली हम यहां पे क्या कर रहे हैं कि आपके पास जो आपका सैंपल डाटा है उस सैंपल डाटा के आपके पास डेटा के एनालिसिस है उस सैंपल डाटा का जो डाटा आपके पास आया है यहां पर जो भी आपके पास ऑब्जर्वेशन आई है उस ऑब्जर्वेशन के बेसिस पे हम पॉपुलेशन डाटा के ऊपर ये प्रूफ करने वाले हैं कि वो जो पॉपुलेशन डाटा का जो आपका पास यहां पर डाटा आया है या फिर जो भी आपकी चीजें आई है वो सही है या गलत है मतलब अब आपको पॉपुलेशन डाटा के बारे में कोई भी नॉलेज नहीं है आपको अपके पॉपुलेशन डाटा के बारे में कोई नॉलेज नहीं है आप क्या कर रहे हैं कुछ सैंपल डाटा से यह पता कर रहे हैं कि जो पॉपुलेशन डाटा के बारे में जो कुछ भी बोला गया है वो सही है या गलत है दैट इज कॉल ऑफ हाइपोथेसिस टेस्टिंग और यहां पे जड टेस्ट के थ्रू भी हम यही प्रूफ करने वाले हैं राइट तो चलिए वापस क्वेश्चन पे आते हैं यहां पर क्वेश्चन में क्या बोला गया है गाइ यहां पर क्वेश्चन पे ये बोला गया है कि एक टीचर है जो क्लेम कर रही है कि उनकी कोई क्लास है अब लेट्स सपोज क्या है यहां पे उनकी कोई क्लास है और उस क्लास के अंदर अब ये क्लास कोई सी भी हो सकती है गाइज यहां पर क्लास 10 क्लास 11 क्लास 12थ जो भी हो सकती है उसका जो मीन है उस क्लास के अंदर कितने नंबर ऑफ स्टूडेंट हैं आई डोंट नो मुझे नहीं पता और ना ही वो बताने में इंटरेस्ट है और वो बोल रहे हैं n नंबर ऑफ स्टूडेंट है इस n नंबर ऑफ स्टूडेंट्स का यदि मैं डाटा कलेक्ट कर रहा हूं तो उसका जो मीन है यस उसका जो मीन है वो कितना मिला है 82 मिला है एंड इसके साथ-साथ स्टैंडर्ड डिवीजन की बात करें यस इसके साथ-साथ यदि मैं स्टैंडर्ड डिवीजन की बात करूं तो स्टैंडर्ड डेविएशन कितना मिला है 20 मिला राइट अब हमने क्या किया इस n नंबर ऑफ स्टूडेंट से कुछ स्मॉल ए अमाउंट ऑफ स्टूडेंट निकाले और वो कितने हैं 81 स्टूडेंट है और इन 81 स्टूडेंट का यदि हमने मीन निकाला तो वो कितना निकल के 90 निकल के आया अब हमें यहां पर ये बताना है कि ये जो डाटा हमने निकाला है क्या ये जस्टिफाई करता है इसको या नहीं जस्टिफाई करता है यस ये चीज हमें यहां पे फाइंड आउट करनी है हमें किससे हाइपोथेसिस सिस्टम से अब यहां पे ज टेस्ट लगेगा टी टेस्ट लगेगा ये कैसे पता चला अभी तो हमने यहां पे बता रखा है कि हम ज टेस्ट को पढ़ा रहे हैं तो हम ज टेस्ट के बारे में डिस्कस कर रहे इसलिए हमें पता है कि ये ज टेस्ट लगेगा लेकिन हम किस कांसेप्ट के थ्रू यहां पर जटेस्ट को पता कर सकते हैं तो जटेस्ट के लिए हमने कुछ कांसेप्ट लिखे थे कि जड टेप्स के लिए पहला चीज जो है यहां पर हमें क्या चाहिए गाइस यहां पर हमें यहां चाहिए पॉपुलेशन यस पॉपुलेशन का स्टैंडर्ड डिवीजन चाहिए सेकंड चीज पॉपुलेशन का क्या चाहिए गाइ यहां पर हमें मीन चाहिए का थर्ड चीज हमें यहां पर क्या चाहिए गी यस हमें यहां पर सेकंड चीज मिल गई थर्ड चीज हमें क्या चाहिए गी नंबर ऑफ सैंपल डाटा नंबर ऑफ आपके पास क्या होगा यहां पर सैंपल डाटा की बात करूं यहां पर तो वो क्या होना चाहिए ग्रेटर दन 30 होना चाहिए जो कि 81 है राइट ये तीन चीजें हमारे लिए मस्ट इंपॉर्टेंट है और ये तीनों चीजें इस चीज को सेटिस्फाई करती है कि यहां पर जेड टेस्ट लगने वाला है चलिए अब ये जेड टेस्ट कैसे कंडक्ट होगा किस तरह से काम करेगा ये ज टस्ट उसके बारे में समझते हैं उससे पहले हमें z टेस्ट का फार्मूला देखना पड़ेगा तो यदि मैं z टेस्ट का फॉर्मूले की बात करूं तो z टेस्ट का फॉर्मूला क्या होगा गाइज यहां पर अजेटस का फार्मूला होगा x बार - ऑफ म डिवाइडेड बाय सिगमा / √ ऑफ n ये आपके पास z का फॉर्मूला होने वाला है अब यहां पे x बार क्या चीज है गाइ यहां पर x बार है आपके पास सैंपल का मीन यस आपके पास जो आपने सैंपल लिया है यहां पर उसका क्या है यहां पर मीन है ओके उसके बाद मैं बात करूं म क्या है गाइ यहां पर म है आपके पास जो पॉपुलेशन है यस उस पॉपुलेशन का मीन है सिग्मा की बात करें यहां पर तो ये क्या है कि जो भी आपका पॉपुलेशन है उसका क्या है यहां पर स्टैंडर्ड डिविज है एंड क्या है यहां पर नंबर ऑफ यस नंबर ऑफ आपके पास क्या है यहां पर सैंपल डाटा है कितने नंबर ऑफ सैंपल डाटा है वो आपके पास है तो ये आपके पास यहां पर क्या होने वाला है z टेस्ट का फॉर्मूला होने वाला है अब ये जड टेस्ट कैसे कंडक्ट होगा अब उसके बारे में बात करते हैं वन बाय वन स्टेप बाय स्टेप्स यहां पर बात करते हैं ये जड टेस्ट कैसे कंडक्ट होने वाला है चलिए तो अब मैं जस्ट टेस्ट को यहां पर कंडक्ट करके दिखा रहा हूं किस तरह से जड टेस्ट यहां पर लगने वाला है तो हमें फार्मूला पता चल गया राइट हमें हमारा डाटा भी मिल चुका है चलिए अब ज टेस्ट को निकालते हैं तो टेस्ट स्टार्ट करने से पहले हमारे पास कुछ रूल्स थे और इस रूल के लिए हमने एक अलग से वीडियो बनाया था कि जड टेस्ट के लिए किस तरह से किस किस तरह से रूल काम करते हैं तो पहला काम हमारे पास यहां पे क्या होता है कि यहां पे सबसे पहला काम होता है h नॉ और ए को फाइंड आउट करना यस पहला काम क्या है यहां पर h नॉ और ए को पॉइंट आउट करना अच्छा h नॉ क्या होने वाला है यहां पर h नो यहां पर ये होगा कि जो आपके पास सैंपल का मीन है यस जो आपके पास सैंपल का मीन है अब सैंपल का मीन मतलब आपके पास क्या हो गया म म आपके पास है डज नॉट इक्वल 82 हम ये प्रूव करने वाले हैं मतलब टीचर ने तो बोला हमें क्या टीचर ने बोला यहां पर कि मेरी क्लास के जो स्टूडेंट है उनका जो म है उनका म मतलब उनका जो एवरेज स्कोर है यहां पर वो क्या है गाइस यहां पर वो आपका 82 है वो आपका क्या है 82 है तो हम क्या करेंगे हम उसका अपोज करेंगे किस चीज का अपोज करेंगे कि आपकी क्लास का जो म है वो 82 नहीं है आपकी क्लास का जो म है वो 82 नहीं है तो हम क्या करें अपोज कर रहे हैं हम अपोज कर रहे हैं इसका मतलब हम h न है राइट अब हम ए की बात करते हैं तो ए क्या बोलेगा यहां पर ए बोलेगा म इज ग्रेटर दन 82 म क्या है यहां पर ग्रेटर दन 82 है यहां पर और हम क्या बोलेंगे ये म जो है वो 82 नहीं है तो हमारे पास h नॉ और ए फाइंड आउट हो चुका है अब बात आती है यहां पे कॉन्फिडेंस इंटरवल की या फिर सिग्निफिकेंट लेवल अल्फा की बात आती है तो यदि मैं बात करूं यहां पे अल्फा के बारे में तो अल्फा मैं यहां पे लेने वाला हूं 0.05 यस अल्फा मैंने कितना ले लिया 0.05 ले लिया अब यहां पर मैंने अल्फा 0.05 लिया इसका मतलब क्या हुआ गाइ यहां पर जरा समझते हैं लेट्स ये हमारे पास क्या है हमारा जितना भी डाटा है यहां पर वो क्या है नॉर्मली डिस्ट्रीब्यूटर है जैसे कि मैंने यहां पे बोला अब अल्फा = 0.05 का मतलब क्या हुआ कि जो मेरे पास ए का एरिया है मतलब मैं यहां से ये कट कर देता हूं यहां पर तो मेरा जो ए का जो एरिया है यहां पर यस ए का जो एरिया है इस एरिया का जो वैल्यू होगा वो कितना होगा 0.05 होने वाला है तो ये जो रिमेनिंग जो एरिया बच गया है ये कौन सा होगा गाइज यहां पर ये 0.95 होने वाला है इसका मतलब ये जो एरिया रहने वाला है ये किसका रहने वाला है h0 का रहने वाला है और ये जो एरिया जो दिख रहा है गाइ यहां पर ये किसका रहेगा ए का रहेगा तो ये पर्टिकुलर जो लाइन आप देख रहे हैं इस लाइन का पॉइंट्स कहां आएगा ये लाइन जो पॉइंट है ये कहां आएगी ये लाइन की पॉइंट आएगी 0.95 अब आप बोलोगे सर ये 0.95 क्यों हो गई ये 0.5 क्यों हो गई तो मैंने आपको पहले ही बताया था कि यदि आप हाइपो टेस्टिंग में काम करते हैं तो आपका डाटा नॉर्मल डिस्ट्रीब्यूशन होना चाहिए और नॉर्मल डिस्ट्रीब्यूशन का एरिया अंडर द कर्व की बात करें यहां पर तो वो आपका वन होता है क्योंकि इसके अंदर क्या होता है डिस्ट्रीब्यूशन का एरिया एंडर क्या रिप्रेजेंट करता है ये प्रोबेबिलिटी को रिप्रेजेंट करता है यस क्या करता है ये रिप्रेजेंटेशन ये प्रोबेबिलिटी को रिप्रेजेंटेशन करता है और प्रोबेबिलिटी सम ऑफ प्रोबेबिलिटी क्या होती है आपके पास गाइ यहां पर वन होती है इसका मतलब क्या हो गया इसका एरिया अंडर द का क्या हो गया आपका वन हो गया तो यदि मैं ये वाला जो एरिया है वो 0.05 बोल रहा हूं यहां पर तो रिमेनिंग एरिया क्या हो गया 0.95 हो गया ओके तो इस पॉइंट के अंदर क्या आ गया 0.95 आ गया अब इस 0.95 के ऊपर मुझे क्या निकालना है हमारी z की वैल्यू फाइंड करनी है क्या करनी है z की वैल्यू फाइंड आउट करनी है अब ये z की वैल्यू कैसे फाइंड आउट होगी तो इस z की वैल्यू को फाइंड आउट करने के लिए आपको z टेबल की रिक्वायरमेंट होने वाली है यस और यह जट टेबल हमें कहां मिलेगी तो इसके लिए चलते हैं हम यहां पर google3 और जड टेबल लिखने के बाद आप कोई भी ज टेबल का आप ओपन कर सकते हैं जैसे मैंने इस वेबसाइट की ज टेबल ओपन कर लीया ww.com की अब z.com की टेबल को नोट डाउन करने के बाद में अब आपको ये डिसाइड करना पड़ेगा कि ये राइट टेल है या लेफ्ट टेल है यस आपको क्या डिसाइड करना है राइट टेल है या लेफ्ट टेल है तो ये कौन सा है ये हमारा राइट टेल है अब मैंने यहां पे इसे राइट टेल क्यों माना क्योंकि यहां पे देखिए ग्रेटर देन का साइन आ रहा है मतलब म इज ग्रेटर दन 82 मतलब म हमारे पास क्या है 82 से ज्यादा है दैट अ प्रूफ ऑफ कांसेप्ट राइट तो म ग्रेटर दन है इसका मतलब क्या है गाइस यहां पर ये राइट टेल है अच्छा देखिए गाइस यहां पर यदि लेफ्ट टेल होती तो लेफ्ट टेल की हमारी एक अलग से टे टेबल चल रही है यदि हमारी राइट टेल है तो इसकी एक अलग से टेबल चल रही है राइट इसकी क्या चल रही है अलग से टेबल चल रही है अब गाइस यहां पे बात करते हैं हमारे पास ये क्या है 0.95 क्या है 0.95 इज कॉल ऑफ एरिया 0.95 इज कॉल ऑफ एरिया तो अब देखिए ये जो जड टेबल आप देख पा रहे हैं यहां पर इस जड टेबल के अंदर ये जो अंदर जो वैल्यूज चल रही है ये हमारे पास क्या है एरिया मतलब ये जितनी भी वैल्यू अंदर आप देख पा रहे हैं दैट इज कॉल ऑफ एरिया और ये जो बाहर आप नंबर्स देख पा रहे हैं दैट इज कॉल ऑफ जड नंबर मतलब उस पर्टिकुलर पॉइंट पे z का स्कोर क्या होगा दैट्ची करेंगे 0.95 कहां लिखा हुआ है तो ये हमारे पास क्या है अंदर का एरिया है और यह हमारे पास क्या है z की वैल्यू है हमें क्या सर्च करना है 0.95 को सर्च करना है चलिए 0.95 को सर्च करते हैं तो देखिए 0.95 ये वैल्यू क्या है थोड़ी सी ज्यादा है तो हम क्या करते हैं थोड़ी सी कम को कंसीडर कर लेते हैं तो ये आ गया 0.94 195 यस यही हमें चाहिए था इसके करस डिंग इधर से z की देखें तो देर इज 1.6 और इसके करेस्पॉन्डिंग्ली आई है मतलब इस 0.95 के ऊपर हमारे पास z की क्या वैल्यू आई है दैट इज अ पॉइंट और यह कहां से मिली हमें यहां पर ये z टेबल से मिली वापस देख लेते हैं जड टेबल कैसे निकली यहां पर तो 0.94 5 दिख रहा है आपको यहां पर इसके करेस्पॉन्डिंग्ली आप ऊपर जाएंगे तो 4 मिलेगा दोनों को ऐड कर दीजिए दोनों को ऐड करने पर 1.64 मिला ठीक है चलो 1.64 मिला मतलब 1.64 मैं यहां पे लिख लेता हूं तो अभी तक हमने क्या किया गाइज यहां पर हमने h0 और h की वैल्यू डिसाइड की है हमने एक सिग्निफिकेंट लेवल अल्फा डिसाइड किया है उस सिग्निफिकेंट लेवल के बेसिस पे हमने z की वैल्यू फाइंड आउट की है क्योंकि हम z टेस्ट लगाने वाले हैं अब नेक्स्ट काम क्या होगा नेक्स्ट वर्क होगा हमारे पास z की वैल्यू फाइंड आउट करना अब यह कौन सी z की वैल्यू फाइंड आउट कर रहे हैं हम यहां पर हमारे पास जो हमारा डाटा गिवन है उसके अकॉर्डिंग z की वैल्यू फाइंड आउट करना तो मैं यहां पे z कल के नाम से यहां पे एक वेरिएबल बना लेता हूं जो कि z कैलकुलेशन करेंगे अब यह z कैलकुलेशन कैसे होगी गाइज यहां पर तो z का फॉर्मूला अभी हमने बताया था यस मैं यहां लिख लेता हूं z का फॉर्मूला क्या है गाइज यहां पर x ब - म अ सिमा / √ n और ये ब्रैकेट में राइट तो हमारे पास देखिए म तो पड़ा है हमारे पास यस म पड़ा है x बार की बात करें गाइज यहां पर तो x बार कितना हुआ तो x बार की बात करें तो ये कितना है हमारे पास गाइ यहां पर 90 है x बार कितना है 90 है अच्छा स्टैंडर्ड डेविएशन यदि सिग्मा की बात करें तो वो कितना है 20 है n की बात करें गाइज कितना है गाइज यहां पर 81 है चलिए इसको फॉर्मूले में रख देते हैं यहां पर तो क्या लिखेंगे यहां पे गाइज 90 - यस 90 - 82 डिवाइड बाय अब आपके पास क्या आएगा गाइज यहां पर आपके पास आएगा 20 यस 20 / √ 81 आपके पास आ जाएगा यस यहां पे इसका सॉल्यूशन करते हैं तो देखिए कितना आ रहा है ऊपर की तरफ से ऊपर करेंगे यहां पर तो एट आपके पास ऊपर आ रहा है यस ऊपर क्या आएगा 90 - 82 इज 8 यहां पे √ 81 इज कॉल ऑफ 9 तो ये क्या हो जाएगा गाइज यहां पर 20 / 9 यस ये ऊपर चला जाएगा तो 9 * 8 हो जाएगा यस 8 * 9 / 20 यस इसका कैलकुलेशन करते हैं 9 * 8 * / 20 यस चलिए तो मैं क्या कर रहा हूं गाइ यहां पर हम क्या कर रहे हैं 8 को मल्टीप्लाई करवा रहे हैं किससे ना के साथ यस ये आ गया 72 72 आने के बाद में 72 को यस इस 72 को डिवाइड कर देते हैं किससे डिवाइड करते हैं गाइ यहां पर 20 से यस 20 से डिवाइड किया यहां पर तो कितना आ रहा है 3.6 तो आंसर इज कॉल ऑफ 3.6 ये 3.6 क्या है गाइ यहां पर ये z कैलकुलेटेड है ये क्या है z कैलकुलेटेड है अब z कैलकुलेटेड आया है इसको यहां पर प्लॉट करते हैं कि z कैलकुलेटेड कहां दिखेगा तो मैं इसको पर्पल कलर से यहां पे डिनोट कर रहा हूं और ये जो ए है इसको एक बार के लिए हटा देते हैं और इस ए को मैं बाहर लिख देता हूं यहां पे इस छोटे से कॉर्नर में लिख देता हूं ए ओके अब हमारे पास क्या है पर्पल कलर से आया है यहां पर z और वो कितना है 3.6 आया है कितना आया 3.6 और 3.6 जो होगा ये 1.6 से कुछ आगे ही आने वाला है डेफिनेटली इसके आगे ही आने वाला है मतलब यहां कहीं आपके पास क्या आएगा z कैलकुलेट आएगा और ये z कैलकुलेट कितना आ रहा है 3.6 आने वाला है z कैलकुलेट कैसे आना 3.6 आने वाला है अच्छा ये z कैलकुलेट जो आपके पास आया है वो कहां आया है ए के एरिया में आया है या h नॉ के एरिया में आया तो यह डेफिनेटली ए के एरिया में आया है इसका मतलब क्या हुआ इसका मतलब यह हो गया कि जो टीचर क्लेम कर रही थी यस टीचर क्लेम कर रही थी मतलब ए मतलब म इ ग्र 82 ये सही है इस तरीके से हम z टेस्ट कंडक्ट करते हैं सिंपल सा आप अपने डाटा को लीजिए यस पहले उसमें नल हाइपोथेसिस और अल्टरनेटिव हाइपोथेसिस को फाइंड कर लीजिए जैसे ही वो आपके पास निकल जाए यहां पर उसके बाद में आप क्या करें एक कॉन्फिडेंस लेवल यहां पर डिसाइड कीजिए अल्फा डिसाइड कीजिए और फिर आप जड कैलकुलेट कीजिए और जड को प्लॉट करके देखिए कि वो कहां आ रहा है ए में आ रहा है या h नोट में आ रहा है जैसे ही आपको यह चीज पता चल जाएगी डेफिनेटली आप फाइनली अपने आंसर प पहुंच जाएंगे राइट यह तो तरीका हो गया हमारे पास यहां पे कैसा हम खुद ट्राई करें उस तरीके से यदि हमें यह सारा तरीका पाइथन के थ्रू करना हो तो कैसे करेंगे जरा उसको समझते हैं तो चलिए अब मैं के थ्रू ये पूरी कैलकुलेशन करके दिखा रहा हूं देखिए पाइथन के थ्रू आप ये कैलकुलेशन के अंदर क्या कर पाएंगे बेसिकली आपके पास जो भी डाटा है वो ले लीजिए आपका जो भी फार्मूला है आप वो बना लीजिए एंड देन आपको सिंपल सा जो जड टेबल से वैल्यू लाई है वो आप डायरेक्टली निकाल सकते हैं कैसे निकाल सकते हैं जरा उसको समझते हैं यहां पर तो उसके लिए आपको इंपोर्ट करना पड़ेगा किसे इंपोर्ट करना है आपको साइ पाई लाइब्रेरी को इंपोर्ट करना पड़ेगा जहां पे हमारे बहुत सारे कांस्टेंट्स पड़े हैं सा पाई में जाने के बाद में आपको कहां जाना है गाइस यहां पर साइ पाई के अंदर जाने के बाद आपको जाना है स्टेट के अंदर यस आपको कहां जाना है यहां पर स्टेट्स के अंदर जहां पर स्टैटिकल एनालिसिस है स्टैटिकल एनालिसिस के अंदर जाने के बाद डॉट आपको कहां जाना है गाइस यहां पर नॉर्म्स के अंदर जहां पे नॉर्मल डिस्ट्रीब्यूशन है यस तो मैं एक काम करता हूं यहां पे एलियाज ऑफ यहां पर इसको एसटी के नाम से सेव कर लेता हूं एटी डॉट यहां पे क्या करते हैं गाइस यहां पर आपको नॉर्म्स में भेज देते हैं यस नॉर्म्स आ गए नॉर्म्स के अंदर आने के बाद में गाइस यहां पे आपको क्या मिलेगा आपको पीपीएफ मिल जाएगा यस क्या मिल जाएगा आपको यहां पर क्या मिल जाएगा आपको गाइज यहां पर पीपीएफ मिल जाएगा इस पीपीएफ को जैसे ही आप ओपन करेंगे इसके अंदर एक वैल्यू जाएगी दैट द वैल्यू इज अल्फा यस आपको क्या करना है सिंपल से यहां पे अपने अल्फा की वैल्यू रखनी है ऑटोमेटिक ये आपकी z की वैल्यू कैलकुलेट कर देगा जैसे मेरी अल्फा की वैल्यू क्या थी 0.95 थी एंड रन करेंगे तो देखिए 1.64 4 आपके पास क्या हो गया z टेबल की वैल्यू आ गई तो बेसिकली यदि आपको z टेबल की वैल्यू निकालनी है तो आप डायरेक्टली निकाल सकते हैं आप विदाउट गोइंग ज टेबल आप यहां से भी अपनी वैल्यू निकाल सकते हैं राइट आपको क्या करना है सिंपल सा आपने अल्फा की वल यहां पे रखनी है अच्छा अल्फा की वैल्यू यदि आप रखना चाहते हैं तो आप यहां पे 1 - अल्फा भी रख सकते हैं म 1 - 0.5 भी रख सकते हैं 0.05 रखेंगे तब भी आपका सेम वैल्यू आने वाली है अब यहां पे कैसे कैलकुलेट करेंगे तो आपका जो भी डाटा है पहले आप उसे कलेक्ट कर लीजिए जैसे सबसे पहले क्या है x बार है तो मैं x बार को x के तौर पे लिखूंगा और x बार कितना है गाइस यहां पर आपका कितना है गाइस x बार आपके पास है 90 x बार कितना है 90 ओके अब नेक्स्ट चीज क्या आएगी गाइस यहां पर 90 के बाद में अब आपके पास म आएगा यस म को u से रिप्रेजेंट कर लेता हूं यहां यहां पर म कितना है गाइ यहां पर 82 म कितना है 82 उसके बाद में क्या है आपके पास यहां पर सिग्मा अब ये सिग्मा हमारे पास इस तरह का होता नहीं है तो इसकी जगह मैं कुछ और सिंबल्स बना देता हूं तो एक काम करते हैं इसको q से रिप्रेजेंट कर देते हैं यस ये जो सिग्मा स्टैंडर्ड डिविज अच्छा एक काम करते हैं स्टैंडर्ड डेविएशन है ना तो एसटी के नाम से इसे सेव कर लेते हैं ओके एटी ऑलरेडी बना रखा है तो एसटीडी के नाम से सेव कर लेते हैं यहां पर और ये एसटीडी किसके है पॉपुलेशन की है तो p एटीडी कर देते हैं p अंडर एटीडी मतलब पॉपुलेशन स्टैंडर्ड डिविजन ओके ओके और ये क्या चीज है गाइज यहां पर ये सैंपल का है तो मैं इसको s आपके पास x कर देता हूं और ये क्या है पॉपुलेशन का है तो p u कर देता हूं राइट और ये कितना है गाइज यहां पर पॉपुलेशन का स्टैंडर्ड डिविज कितना है 20 है देन 20 नंबर ऑफ सैंपल n है यहां पर यस नंबर ऑफ सैंपल्स आपके पास क्या n है और n कितने है गाइज यहां पर 81 है राइट ये कुछ हमारे डाटा आ चुके हैं अब हमें क्या करना है यहां पर हमें कैलकुलेशन करनी है सिंपल सी क्या करना है z कैलकुलेट म z कैलकुलेट बनाना है z कैलकुलेट का फार्मूला लिखिए यहां पर क्या लिखेंगे यहां पर s s यस z कैलकुलेट का फॉर्मूला लिखिए क्या लिखेंगे s x फिर उसके बाद क्या करना है सबस्टैक करना है किसका p u को राइट और डिवाइड करना है डिवाइड में क्या करना है गाइज यहां पर यस डिवाइड में क्या करना है डिवाइड में p एडी ये लेना है फिर उसको फिर से डिवाइड करना है किससे स्क्वायर रूट ऑफ ये स्क्वायर रूट चाहिए आपको यहां पर तो उसके लिए क्या करेंगे गाइज यहां पर इंपोर्ट करेंगे किसे नम पाई को इंपोर्ट कर लेते हैं नम पाई एलियाज ऑफ ए को राइट अब यहां पे क्या करना है गाइज यहां पर डिवाइड कर लेते हैं क्या पे आपके पास np1 आटी स्क्वायर रूट और स्क्वायर रूट के अंदर क्या लिखना है यहां पर गाइज न रखना है तो यहां से आपको क्या मिलेगा z कैलकुलेट मिल जाएगा दैट इज अ 3.59 n96 दैट इज योर आंसर ओके अब हमें क्या करना है z कैलकुलेट आ गया अब हमें z टेबल की वैल्यू निकालनी है और z टेबल की वैल्यू कैसे निकलेगी एटी डॉट आपके पास कहां जाएंगे नॉर्म्स में जाना है आपको ठीक है कहां जाना है नॉर्म्स में जाना है नॉर्म्स में जाने के बाद आपको कहां जाना है पीपीएफ में जाना है पीपीएफ में 1 माइ आपके अल्फा की वैल्यू रखनी है यस 1 माइनस क्या रखना है अल्फा अल्फा ए रख देता हूं मैं यहां पर और ऊपर जाके ए की वैल्यू रखते हैं ए इज इक्वल टू क्या रखना है गाइज यहां पर 0.05 राइट 0.05 और यहां पे z टेबल की वैल्यू निकालिए ठीक है अब z टेबल की जो वैल्यू है यस यहां पे हम कुछ कंडीशन बनाएंगे क्या क्या बनाएंगे गाइज यहां पर यदि z टेबल की वैल्यू है इज लेस दन ऑफ क्या है यहां पर z कैलकुलेटेड है z कैलकुलेटेड है तो प्रिंट में क्या लिखेंगे गाइज यहां पर आपके पास ए ए इज राइट ए ए इज आपके पास आर आई जीएसटी राइट यस और फिर उसके बाद यदि मैं एल्स लिख देता हूं यहां पर तो एल्स में क्या लिखूंगा गाइ यहां पर प्रिंट कर दूंगा और क्या प्रिंट करूंगा गाइस यहां पर h नॉ इज आपके पास आर आ जीी राइट ओके रन करें तो हमारे पास आ गया ए राइट तो इस तरह से हम कैलकुलेट कर सकते हैं अब हमें क्या करना है गाइस यहां पर कभी भी कोई भी वैल्यूज आए तो इन सब वैल्यूज को चेंज कर देंगे और चेंज करने के बाद में हम हमारे फाइनल आंसर पे पहुंच जाएंगे कि ए इज राइट या h नॉट इज राइट गेटिंग माय पॉइंट गाइस तो इस तरीके से हम क्या कर सकते हैं गाइ यहां पर z की कैलकुलेशन कर सकते हैं मतलब जड टेस्ट को कंडक्ट करा सकते हैं ओके तो ये एक हमारा सिंपल सा एक क्वेश्चन हुआ अब हम अगले क्वेश्चन के ऊपर बढ़ते हैं जड टेस्ट के ऊपर तो ज टेस्ट का अगला क्वेश्चन देखिए यहां पर जिससे आप और अच्छे तरीके से समझ पाएंगे क्या लिखा है इमेजिन यू वर्क एज ए ई-कॉमर्स कंपनी अब ई-कॉमर्स कंपनी का मतलब क्या होता है जैसे flipkart-com कंपनी दैट इज अ ई-कॉमर्स कंपनी तो हम क्या कर रहे हैं एक ई-कॉमर्स कंपनी में काम कर रहे हैं एंड योर टीम इज रिस्पांसिबल टू एनालाइजिंग कस्टमर परचेस डाटा मतलब क्या कर रहा है हमारी एक टीम है जो कि क्या करती है गाइस यहां पर जो भी कस्टमर डाटा परचेस कर रही है उसको एनालाइज करती है अब आप क्या चाहते हैं यू वांट टू डिटरमिनेट अ न्यू वेबसाइट डिजाइन हैज लीड टू सिग्निफिकेंट इंक्रीज द एवरेज परचेस अमाउंट ऑफ ओल डिजाइन मतलब हम क्या करना चाहते हैं हम क्या डिटरमिन करना चाहते हैं कि हमने क्या की कोई एक ओल्ड वेबसाइट बनाई और फिर हमने क्या किया उस वेबसाइट को रीडिजाइन किया उस वेबसाइट को हमने क्या किया रीडिजाइन किया तो हमें यह बताना है कि जो ओल्ड वेबसाइट से न्यू वेबसाइट हमने जो बनाई है उसकी वजह से हमारी कंपनी के अंदर जो भी कस्टमर है उन कस्टमर का इंक्रीमेंट हुआ है या नहीं हुआ मतलब जस्ट एग्जांपल जस्ट एग्जांपल मेरे पास क्या है एक एक्स वाई जड नाम की कोई कंपनी है राइट इस एक्स वाई जड नाम की कंपनी ने क्या किया फर्स्ट टाइम पहली बार आपके पास क्या कि एक वेबसाइट डिजाइन की इट्स कॉल्ड ऑफ ओल्ड वेबसाइट इट्स कॉल्ड ऑफ ओल्ड वेबसाइट ये डिजाइन की इसके ऊपर लेट्स सपोज हमारे पास 500 कस्टमर्स आते हैं कितने आते हैं लेट्स 500 कस्टमर आते हैं मैंने कहा एक काम करते हैं वेबसाइट को इंप्रूव करते हैं मतलब एक न्यू वेबसाइट डिजाइन करते हैं जैसे ही मैंने न्यू वेबसाइट बढ़ाई तो मुझे यह पता करना है कि मेरे पास जो मेरे जो कस्टमर आ रहे हैं उनके नंबर ऑफ काउंटिंग ऑफ कस्टमर्स जो है वह इंक्रीज हुए हैं या नहीं हुए हैं इसके करेस्पॉन्डिंग्ली अब हमें क्या कर रखा है इस डटा से रिलेटेड क्या दे रखा है इंफॉर्मेशन यू कलेक्ट डटा फ्रॉम द रैंडम सैंपल इज 30 कस्टमर कितने कस्टमर दे रखे हैं गाइज यहां पर 30 कस्टमर्स का डाटा दे रखा है हु हु मेड परचेस्ड ऑन द ओल्ड वेबसाइट डिजाइन एंड 30 कस्टमर हु मेड परचेज ऑन न्यू वेबसाइट डिजाइन मतलब हमने क्या किया 30 कस्टमर का डटा लिया यहां पर नंबर ऑफ सैंपल इज 30 यस 30 अब 30 आ गया इसका मतलब क्या हो गया डेफिनेटली जट टेस्ट लगेगा नंबर ऑफ सैंपल कितना है 30 है 30 आते ही क्या होगा चट टेस्ट लगेगा डेफिनेटली राइट उसके बाद गाइज यहां पे बात करें यहां पर तो क्या इन्होंने क्या किया 30 कस्टमर का डाटा उठाया जो पहले पुरानी वेबसाइट से उठा रहे डेटा ले कुछ कलेक्ट कर रहे थे फिर 30 कस्टमर का डाटा उठाया क्योंकि क्योंकि न्यू वेबसाइट से डाटा परचेस कर रहे थे यू हैव अ सैंपल मीन हमारे पास सैंपल का मीन है सैंपल का स्टैंडर्ड डिविजन भी दे रखा है अच्छा सैंपल का स्टैंडर्ड डिशन हम कैलकुलेट कर लेंगे उसके बाद सैंपल की साइज भी दे रखी है सैंपल की साइज भी दे रखी है और उसके बाद पॉपुलेशन का स्टैंडर्ड डिविज भी गिवन है राइट तो ये कुछ डाटा खा है अब ये सिनेरियो कब आता है जब आप बड़ी-बड़ी कंपनियों में काम करते हैं तो बड़ी-बड़ी कंपनियों के अंदर वेबसाइट क्या होती है अपडेट होती है तो यहां पे क्वेश्चन ये आता है कि हमने कोई पहले वेबसाइट बनाई हमने क्या की कोई पहले वेबसाइट बनाई और पहले वेबसाइट बनाते वक्त हमारी कुछ परचेसिंग थी फिर मैंने कुछ वेबसाइट में अपडेट किया वेबसाइट को कुछ अच्छे से नए तरीके से डिज़ाइन किया अब जो मेरी नई वेबसाइट बनाई है उससे परचेसिंग लेवल इंक्रीज हुआ है या नहीं हुआ है दैट्ची जो है परचेज लेवल जो है वो इंक्रीज हुआ है या नहीं हुआ है दैट समय यहां पे यह फाइंड आउट करना है इसके रिगार्डिंग हमारे पास कुछ डाटा दे रखा है ओल्ड डिज़ाइन के रिगार्डिंग भी डाटा दे रखा है और न्यू डाटा के रिगार्डिंग भी हमें कुछ डाटा दे रखा है अब हमें क्या करना है इस डेटा सेट के ऊपर काम करना है चलिए अब इसमें कैसे काम कर सकते हैं जरा समझते हैं यहां पर देखिए हमें क्या-क्या चाहिए सबसे पहले z टेस्ट के लिए जड टेस्ट के लिए सबसे पहले हम स्टार्ट करने से पहले हमें नल हाइपोथेसिस और अल्टरनेटिव हाइपोथेसिस को डिसाइड करना पड़ेगा चलिए डिसाइड करते हैं यहां पर तो मैं h0 की बात करूं तो h0 मतलब जो आपके पास ओल्ड वेबसाइट के डिजाइनर थे वो h0 को क्लेम करेंगे क्या क्लेम करेंगे गाइज यहां पर कि जो न्यू वेबसाइट है जो न्यू वेबसाइट है यस मैं क्या कर रहा हूं यहां पर जो हमारी वेब है यहां पर जो न्यू वाली है वह आपके पास इक्वल ही है कोई ज्यादा चेंजेज नहीं है आपके पास क्या है कोई ज्यादा चेंजेज नहीं है किसके ज्यादा चेंजेज नहीं है यहां पर वेबसाइट ऑफ ओल्ड के मतलब न्यू वेबसाइट और ओल्ड वेबसाइट आपके पास क्या है इक्वल है न्यू वेबसाइट और ल्ड वेब आप पास यहां पर इक्वल है दैट्ची बात करूं यहां पर ए के बारे में एच के बारे में बात करूं तो एच क्या बोल रहा है यहां पर जो वेबसाइट डिजाइनिंग आपके पास न्यू हुई है यहां पर वो अच्छी है क्यों अच्छी है परचेसिंग लेवल इंक्रीज हो चुका है यहां पर किससे वेबसाइट ऑफ ओल्ड से किससे वेबसाइट ऑफ ल्ड से गेटिंग माय पॉइंट तो मैंने एच और एचन डिसाइड कर लिया अब एच और एचन डिसाइड करने के बाद में मुझे क्या करना है बाकी के पैरामीटर्स को फाइंड आउट करना है सबसे पहले क्या फैटर फाइंड आउट करना है यहां पर तो ये हमें क्या मिला पॉपुलेशन मीन चाहिए हमें क्या चाहिए पॉपुलेशन का मीन चाहिए क्यों क्योंकि यदि मैं जड टेस्ट लगाऊंगा यहां पर यस ज टेस्ट लगाऊंगा तो ज टेस्ट का फॉर्मूला क्या होता है गाइस यहां पर x बार - म अप सिगमा अप र n होता है यहां पर यस और यहां पे क्या बोलते हैं n इज ग्रेटर दन क्या होता है यहां पर 30 होता है n इज ग्रेटर दन क्या होता है 30 होता है राइट ग्रेटर दन इक्वल टू क्या होता है 30 होता है तो चलिए मैं बात करता हूं यहां पर आपके पास कि सबसे पहले म के बारे में बात करते हैं यस म कहां है यहां पर तो देखिए यहां पे इस पूरे एंटायस के अंदर म हमें कहीं नहीं दे रखा है म हमें कहीं भी नहीं दे रखा है इट्स मीन दैट जब हमारे पास इस तरह का सिनेरियो आता है जहां पे हमें म नहीं देखने को मिलता है और हमें पता है कि इसके अंदर z ट लगता है तो उस सिनेरियो के अंदर हम क्या मानते हैं कि म ऑफ न्यू इक्वल्स टू म ऑफ ओल्ड जो है वो सेम है मतलब हमारे पास पहले आपके पास जब वेबसाइट बनी थी उससे पहले स्टैंडर्ड डेविएशन और जो वेबसाइट बनी है उसके बाद का जो स्टैंडर्ड डेविएशन है वो सेम हो रहा है यहां पे हम ये कंसीडर करते हैं चलिए ये हमने मान लिया ये मानने के बाद में हमारा नेक्स्ट चीज आएगी यहां पर x बार ऑफ न्यू x बार ऑफ न्यू चाहिए हमें यहां पर एंड सेकंड चीज ऑफ x बार ऑफ ओल्ड चाहिए तो उसके लिए मतलब पॉपुलेशन का सैंपल का चाहिए तो सैंपल का डाटा हमें दे रखा है यहां से हमें मीन फाइंड आउट करना पड़ेगा तो हम कर लेंगे चलिए उसके बाद में हमें क्या चाहिए गाइज यहां पर स्टैंडर्ड डेविएशन सिग्मा चाहिए तो यहां पे स्टैंडर्ड डेविएशन सिग्मा के लिए यहां पे देखिए पॉपुलेशन स्टैंडर्ड डेविएशन 2.5 हमें दे रखा तो पॉपुलेशन स्टैंडर्ड डिशन 2.5 हमें मिल चुका है उसके बाद चाहिए नंबर ऑफ सैंपल नंबर ऑफ सैंपल डाटा हमारे पास क्या है 30 दे रखा है चलिए अब हम क्या करते हैं इन सभी डाटा को उठाते हैं और सभी डाटा को उठा के हमारे ज टेस्ट के फॉर्मूले के अंदर रखते हैं और वहां से सारी कैलकुलेशन करते हैं चलिए करते हैं यहां पर तो फिलहाल मैं यहां पर क्या कर रहा हूं कीप करके छोड़ देता हूं इसको फिलहाल क्योंकि हमें यहां पर कैलकुलेशन करनी पड़ेगी ये डाटा भी हमें चाएगा तो हम यहां पर आ चुके हैं अब क्या आपके पास यह फार्मूला लगने वाला है नहीं इस बार यह आपका फार्मूला नहीं लगेगा तो जटेस्ट का इस बार वाला फार्मूला क्या बनेगा मतलब इस बार वाला z टेस्ट वाला फॉर्मूला क्या बनेगा तो z टेस्ट का जो फॉर्मूला है वो थोड़ा सा चेंज हो जाएगा गाइज यहां पर इस बार और z टेस्ट का फॉर्मूला क्या होगा गाइज यहां पर z टेस्ट जो इस बार बनेगा गाइज यहां पर वो ये बनेगा क्या बनेगा कि x बार ऑफ न्यू x बार ऑफ न्यू - x बार ऑफ आपके पास क्या आएगा ओल्ड आ जाएगा डिवाइडेड बाय यस डिवाइडेड बाय पॉपुलेशन स्टैंडर्ड डेविएशन रूट n ये आपके पास फॉर्मूला बन जाएगा तो यहां पे ये म को क्यों नहीं कंसीडर किया गया यदि आप माइनस साइन लगाते हुए म ओल्ड माइनस म करते हैं यहां पे यस न्य - म ओल्ड यदि आप यहां पे कंसीडर करते हैं तो हमारे पास जो न्यू वाला म है और जो ओल्ड वाला म है वो तो सेम है तो ये माइनस और माइनस प्लस माइनस यहां पे दोनों वैल्यू सेम होने की वजह से क्या हो जाएगा ज़ीरो हो जाएगा यस क्या हो जाएगा रो हो जाएगा मतलब ये दोनों एक दूस से कैंसिल आउट हो जाएंगे तो रो हो जाएगा तो वन अ कुछ डेटा में से रो को लेस करें तो वो डेटा ही बच जाता है यहां पर बेसिकली है ना तो ये चीज गई तो अब हमारे पास z ट का फॉर्मूला बन चुका है चलिए अब हम इस z टेस को कैलकुलेट करते हैं यहीं पे चलिए तो मैं क्या कर रहा हूं गाइ यहां पर यहां पे कुछ स्लेश स्पेसेस कर देता हूं यहां पर अब मेरे पास क्या-क्या है एक-एक चीजें हमें सब निकालनी पड़ेगी तो ये रहा हमारा ओल्ड डिजाइन का डाटा तो मैं यहां पे ओल्ड डिजाइन का जो डाटा है मैं कॉपी कर लेता हूं एंड देन यहां ले जाके मैं पेस्ट कर लेता हूं उसी तरीके से हमारे पास न्यू डिजाइन का डाटा हमारे पास चाहिए का तो ये रहा हमारा न्यू डिजाइन का डाटा इसे भी कॉपी कर लेते हैं एंड देन पेस्ट कर लेते हैं तो ये हमारा दोनों का डाटा आ चुका है यहां पर अब एक काम करता हूं इसके अंदर अच्छे तरीके से कैलकुलेशन करने के लिए मुझे इसको दोनों को क्या कर देता हूं एरे में डिजाइन कर लेता हूं यस मैं क्या करता हूं यहां पर एरे में डिजाइन कर लेता हूं ताकि हमारी कैलकुलेशन थोड़ी फास्ट हो जाएगी राइट तो मैं कैलकुलेशन करने के लिए फास्ट करने के लिए मैं नपाई एरे लूंगा है ना इसे एरे में कन्वर्ट करूंगा तो एप डॉट क्या करेंगे गाइस यहां पर एरे का इस्तेमाल करेंगे यहां पर यस एपी डॉट क्या करेंगे यहां पे गाइस एरे का इस्तेमाल करेंगे और यहां पे भी क्या करते हैं एप डट एरे लगा देते हैं एप डॉट यहां पे भी मैंने क्या किया एरे लगा दिया यहां पर और क्लोज कर दिया चलिए अभी मैंने क्या किया गाइ यहां पर पीछे जाके इसको एरे को क्लोज भी करना पड़ेगा तो मैंने यहां पे भी क्लोज कर दिया और यहां पे भी क्लोज कर दिया और नीचे आ जाता हूं और रन कर देते हैं तो यह मेरे पास क्या हो गया न्यू डिजाइन डाटा आ गया और ओल्ड डिजाइन डाटा दोनों आ चुका है अब अकॉर्डिंग टू माय फार्मूला मुझे क्या चाहिए गाइज यहां पर मुझे चाहिए x बार न्यू और x ओल्ड न्यू राइट तो चलिए मैं x बार न्यू निकालता हूं तो मैं क्या कर रहा हूं गाइस यहां पर मीन अंड न्यू मीन अ न्यू कैसे निकलेगा गाइज यहां पर एप डॉट हमारे पास क्या है मीन फॉर्मूला है मीन के अंदर जाके क्या करेंगे जो न्यू वेबसाइट डिजाइन है उसको डाल देंगे राइट अब क्या करेंगे गाइ यहां पर मीन अंडरस्कोर ओल्ड लिख देंगे और वो कैसे आएगा गाइस यहां पर एप डॉट क्या आएगा गागा यहां पर मीन को निकालेंगे यस और वो कैसे निकालेंगे गाइस यहां पर हमारे पास ल डिजाइन डाटा से निकालेंगे तो म न्यू और मीन ओल्ड हमारे पास आ चुका है अब गाइस यहां पर यह हमारे पास है यह हमारे पास है तो ज टेस्ट का फर्मूला निकाल लेते हैं तो मैं क्या कर रहा हूं यहां पर गाइस यहां पर z अंडरस्कोर कैलकुलेट निकाल रहा हूं यस z अको कैलकुलेट निकाल रहा हूं कैसे हम क्या करेंगे गाइस यहां पर मीन जो है यहां पर न्यू सबै ऑफ मीन ऑफ ओल्ड ये कर दिया डिवाइडेड बाय अब क्या लगाना है गाइज यहां पर हमें क्या चाहिए नेक्स्ट यहां पर स्टैंडर्ड डिविजन पॉपुलेशन स्टैंडर्ड डिवीजन तो मैं यहां पे पॉपुलेशन अंडर एटीडी के नाम से इसे बना लेता हूं यहां पर पॉपुलेशन स्टैंडर्ड डेविएशन कितना है गाइज यहां पर 25 अ सॉरी 2.5 यस कितना है आपके पास यहां पर 2.5 तो दैट अ 2.5 आपके पास आ गया यहां पर सेकंड चीज हमारे पास क्या है नंबर ऑफ सैंपल यस नंबर ऑफ सैंपल की बात करें यहां पर राइट तो मैं यहां पर n अंडर सैंपल की बात करूंगा यहां पर एस ए एम की बात कर रहा हूं यहां पर एसे एमपी ए कर देते हैं यहां पर सैंपल के ौर पे नंबर ऑफ सैंपल ठीक है ए और ये कितना है गाइज यहां पर 30 यस 30 और यदि हमें नहीं पता 30 है तो हम कैलकुलेट भी कर सकते हैं कैसे कैलकुलेट करेंगे लेंथ ऑफ यहां पे न्यू डिजाइन डाटा को क्लिक कर दो राइट लेंथ ऑफ न्यू डिजाइन डाटा को क्लिक कर दो राइट ये आ गया अब सिग्निफिकेंट लेवल अल्फा चाहिए एएल के नाम से इसे सेव कर लेते हैं अल्फा इज 0.05 यस अल्फा इज 0.05 है यहां पे राइट तीनों चीज आ गई है चलो अभी हम वापस फॉर्मूले में आते हैं तो हमें क्या चाहिए पॉपुलेशन स्टैंडर्ड डेविएशन चाहिए तो पॉपुलेशन स्टैंडर्ड डेविएशन आ गया डिवाइड बाय अब क्या क्या चाहिए np.sum पड़ेगी तो मैं इसको एक काम करता हूं यहां से पिक अप करके यहां छोड़ देता हूं ओके तो यह हमारी z टेबल की वैल्यू ओके और यह हमारी पास क्या होगई z कैलकुलेटर की वैल्यू अच्छा हमारे पास z टेबल की जो वैल्यू है इफ आपके पास क्या लिखेंगे हम यहां पर यस हम क्या लिखेंगे कि जो z कल की वैल्यू है यस जो z कल की वैल्यू जो है यदि वो ग्रेटर दन हो जाए कहां से z टेबल की वैल्यू से तो हम क्या लिखेंगे प्रिंट एच ए इज राइट ए ए एज एस एज आर आई जी एडी राइट ठीक है नहीं तो हम क्या लिखेंगे एल्स लिखेंगे और एल्स में क्या लिखेंगे गाइ यहां पर प्रिंट करेंगे और क्या लिखने वाले हैं यहां पर h नॉट एस आर आईज एटी राइट न करते हैं क्या निकल के आया एच ए इज राइट और एच ए इज राइट होने का मतलब क्या है गाइस यहां पर एच ए इज राइट होने का मतलब क्या है गाइस यहां पर कि जो न्यू वेबसाइट हमारे पास बनी है यस जो हमारी न्यू वेबसाइट है वो ओल्ड वेबसाइट से काफी ज्यादा अच्छी है यस जो हमारी न्यू वेबसाइट है वो क्या है काफी ज्यादा अच्छी है हमारी ओल्ड वेबसाइट से गेटिंग पॉइंट गाइ यहां पर तो इस तरीके से हम क्या करते हैं हाइपोथेसिस टेस्टिंग करते हैं किस चीज की जड टेस्ट की इस तरीके से राइट तो आज के इस लेक्चर के अंदर हमने क्या दिखा यहां पर कि जड टेस्ट कैसे कैलकुलेट किया जाता है सबसे पहले आपका काम क्या होता है गाइज यहां पर नल हाइपोथेसिस और अल्टरनेटिव हाइपोथेसिस को फाइंड आउट करना उसके बाद जो नेक्स्ट प्रोसीजर जो होता है हमारे पास यहां पे सिग्निफिकेंट लेवल अल्फा डिसाइड करना अल्फा के बेसिस पे आपको यह डिसाइड करना कि ए कौन सा है h नॉ कौन सा होने वाला है यहां पर उसके बाद उस अल्फ के बेसिस पे हमारी z वैल्यू फाइंड आउट करना यूजिंग अ टेबल राइट यूजिंग अ टेबल फिर हमें क्या करना है z कैलकुलेट करना है विद द यूजिंग ऑफ फार्मूला राइट और फार्मूला से फिर कंपेयर करना है कि कौन सही है कौन नहीं है मतलब कंक्लूजन पे पहुंचना है राइट और यदि हमारे पास इस तरह का टू डाटा एक साथ कंसीडरेबल आ जाए तो उस केसेस में हमें क्या करना है गाइ यहां पर हमें इस तरह का फार्मूला लगाना है यदि हमें कभी इन केस ऐसा कभी सिनेरियो मिल जाए जहां पे आपके पास जो है पॉपुलेशन का मीन ना दे रखा हो तो हमें ये मानना पड़ेगा हमें ये अंश करना पड़ेगा कि पहले और बाद में पॉपुलेशन का जो मीन है वो सेम है यस कोई चेंजेज नहीं हुआ मीन के अंदर राइट यह मान के हमें यह वाला फार्मूला अप्लाई करना पड़ेगा राइट तो इस तरीके से आप क्या कर सकते हैं जेट टेस्ट का इस्तेमाल कर सकते हैं इन पर्टिकुलर सिनेरियो के अंदर तो चलिए स्टार्ट करते हैं टी टेस्ट के बारे में देखिए टी टेस्ट को स्टार्ट करने से पहले हमें यह देखना पड़ेगा कि टी टेस्ट कब अप्लाई किया जाता है मतलब इसके लिए क्या-क्या सिचुएशन होनी चाहिए सेकंड चीज टी टेस्ट का फार्मूला क्या है मतलब टी टेस्ट के लिए कौन सा फार्मूला अप्लाई करना है यहां पर ये चीज भी हम डिटेल के साथ देखेंगे देन उसके बाद हम रियल वर्ल्ड सिचुएशन लेंगे कि टी टेस्ट कौन-कौन से सिचुएशन के अंदर फॉलो किया जा सकता है उसको हम देखने वाले हैं तो चलिए जरा स्टार्ट करते हैं यदि आपको पाइथन मशीन लर्निंग डेटा साइंस एंड डेटा एनालिस जैसी फील्ड में अपने आपको को ग्रो करना है तो इसके लिए डब्ल्यू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो सबसे पहले मैं यहां पे बात करना चाहूंगा कि जो हमारा टी टेस्ट है यस ये जो हमारा टी टेस्ट है उस टी टेस्ट को कब परफॉर्म किया जाता है तो टी टेस्ट को परफॉर्म करने के लिए आपके पास कुछ स्पेशल कंडीशंस है सबसे पहले आपका जो डाटा है यस आप जिस डाटा को यहां पर ले रहे हैं वो डेटा आपको अज्यू करना पड़ेगा कि जो डाटा है वो नॉर्मल डिस्ट्रीब्यूशन होना चाहिए सेकंड चीज मैं बात करूं यहां पर कि आपके पास जो डेटा है इस डाटा में से क्या-क्या चीजें गिवन होनी चाहिए तो सबसे पहली चीज है यहां पर कि आपके पास डाटा जो होता है वो दो तरीके का होता है एक होता है पॉपुलेशन डाटा और एक होता है उसके अंदर से सैंपल डाटा राइट तो बेसिकली आपके पास क्या होना चाहिए कि जो आपका पॉपुलेशन डाटा है यहां पर उस पॉपुलेशन डाटा का आपको क्या मिलना चाहिए यहां पे गाइस मीन मिलना चाहिए मतलब पॉपुलेशन डाटा का मीन चाहिए आपको यहां पर सेकंड चीज बात करें कि आपके पास जो सैंपल डाटा है यस जो आपके पास यहां पर सैंपल डाटा है उस सैंपल डाटा का आपके पास क्या होना चाहिए मीन होना चाहिए एंड इसके साथ-साथ सैंपल डाटा का आपके पास क्या होना चाहिए स्टैंडर्ड डेविएशन भी होना चाहिए मतलब आपके पास स्टैंडर्ड डेविएशन आपको गिवन होना चाहिए थर्ड चीज़ बात करें यहां पर यस थर्ड चीज़ बात करें कि आपके पास होना चाहिए नंबर ऑफ़ सैंपल यस नंबर ऑफ आपके पास क्या होना चाहिए सैंपल डाटा आपके पास होना चाहिए अब ये नंबर ऑफ़ सैंपल डेटा आपके पास क्या होना चाहिए लेस दन 30 होना चाहिए तब आप यहां पे क्या कर सकते हैं t टेस्ट को अप्लाई कर सकते हैं अब t टेस्ट का फॉर्मूला क्या है जर उसकी बात करें यहां पर तो देखिए t टेस्ट की मैं बात करूं यहां पर तो t टेस्ट का फॉर्मूला क्या है गाइज यहां पर t टेस्ट का फॉर्मूला है यहां पर x ब - म अप आपके पास s / √ n अब यहां पे बात करें x बार क्या चीज़ है तो यह जो x बार जो आप देख रहे हैं ये x बार क्या होता है कि जो भी आपका सैंपल दिया हुआ होता है यस जो भी आपका सैंपल है उस सैंपल का आपके पास क्या है मीन है अब मैं बात करूं म क्या चीज है तो म आपके पास क्या है गाइज यहां पर कि जो भी आपका पॉपुलेशन डाटा है यस पॉपुलेशन डाटा का आपके पास क्या है मीन है आपके पास यहां पर s की बात करें तो ए क्या है आपके पास यहां पर गाइज स्टैंडर्ड डेविएशन है और ये स्टैंडर्ड डेविएशन किसका है गाइज यहां पर ये स्टैंडर्ड डेविएशन सैंपल के डाटा का है एंड एंड की बात करें तो n क्या है गाइज यहां पर नंबर ऑफ आपका पास क्या है सैंपल डाटा है तो बेसिकली गाइज आपके पास यदि मैं बात करूं कि टी टेस्ट के बारे में तो टी टेस्ट को अप्लाई करने के लिए ये सारी चीजों की रिक्वायरमेंट होती है और सबसे इंपॉर्टेंट चीज क्या है नंबर ऑफ सैंपल की वैल्यू क्या होनी चाहिए लेस दन 30 होनी चाहिए और य जब भी आपके पास पॉपुलेशन का स्टैंडर्ड डिविजन नहीं दिया गया हो तब आप क्या करते हैं गाइज यहां पर आप टी टेस्ट को अप्लाई करते अब टी टेस्ट को अप्लाई करने के लिए हम एक कुछ एग्जांपल लेंगे कि रियल वर्ड सिनेरियो के लिए हम टी टेस्ट किस तरह से यूज कर सकते हैं चलिए सबसे पहला एग्जांपल यहां पर लेते हैं अब एग्जांपल नंबर फर्स्ट जो है गाइज यहां पर ये क्या है कि आपके पास जो चिप्स मेकिंग कंपनियां होती है जैसे चिप्स मेकिंग कंपनिया बहुत सारी तरह की है जैसे लेस हो गई यहां पर अंकल चिप्स हो गई यहां पर यस बालाजी चिप्स हो गई यहां पर तो इस तरह से कोई एक चिप्स की कंपनी है यस और इसकी कंपनी क्या कर रही है कुछ क्लेम कर रही है तो उसके रिगार्डिंग ये क्वेश्चन है जिसको हम समझेंगे यहां पर देखिए क्या क्वेश्चन कह रखा है यहां पर अब मैन्युफैक्चरर क्लेम दैट अब मैन्युफैक्चरर क्लेम क्या कर रहा है यहां पर कि एवरेज बैग ऑफ पोटैटो चिप्स अब पोटैटो की कोई चिप्स बनाने वाली जो कंपनी है वो क्या कहती है कि भाई एक पैकेट जो आपके पास है यहां पर उसका जो एवरेज वेट है यस आपके जो पैकेट का जो वेट है एवरेज वेट का पैकेज है यहां पर वो 150 ग्रा है यस तो हमें क्या दे रखा है गाइ यहां पर हमें हमारे जो पॉपुलेशन डाटा है उस पॉपुलेशन डाटा का क्या दे रखा है मीन दे रखा है हमें क्या दे रखा है पॉपुलेशन डाटा का मीन दे रखा है जस्ट मैं यहां पे कहूंगा कि जो म है यहां पर गाइ वो कितना दे रखा है 150 ग्रा है अब पोटैटो चिप्स की जो कंपनी ने बोला कि मेरे जो बैग है यहां पर इन बैग के अंदर जो भी चिप्स भरी जाती है उनका एवरेज वेट जो है यहां पर वो कितना है 150 ग्रा यहां पर दे रखा है अब गाइ यहां पे बात करें कि हम इनको क्या कर रहे हैं यहां पर बेसिकली हम इनको गलत प्रूफ करना चाहते हैं कि आपके बैक का जो पोटैटो चिप्स के जो बैग का जो वेटेज है वो 150 ग्रा नहीं है इसके लिए हमने क्या किया यहां पर कि इनके जो पॉपुलेशन डेटा मतलब इनके जो बहुत सारे मैन्युफैक्चरिंग मूवे हुए जो आपके पास पोटैटो चिप्स के बैग हैं उनमें से हमने क्या किया 25 सैंपल्स यहां पे उठा ली अब 25 सैंपल उठाने के बाद में हमने उनका एवरेज वेट फाइंड आउट किया और 25 सैंपल उठाने के बाद एवरेज वेट जो हमें यहां पे मिला है वो कितना है 140 8 ग्रा मिला है मतलब मैं बात करूं गाइ यहां पर जो हमारा प सैंपल का जो मीन है वो कितना मिला है 148 ग्राम का और नंबर ऑफ सैंपल्स हमने कितने उठाए गाइ यहां पर 25 हमने उठाए अब देखिए नंबर ऑफ सैंपल क्या है 25 है इट्स मीन दैट यहां पर हमारा टी टेस्ट ही अप्लाई होने वाला है चलिए अब आगे बढ़ते हैं यहां पर विद द स्टैंडर्ड डिवीजन अब हमें स्टैंडर्ड डिवीजन भी साथ दे रखा है कितना 5 ग्राम दे रखा है इसका मतलब गाइस क्या है यहां पर s हमें प्रोवाइडेड है और वो कितना है फाइव यहां पर दे रखा है टेस्ट द मैन फैक्चरिंग क्लेम दैट मैन्युफैक्चरिंग क्लेम यूजिंग अ वन टेल टी टेस्ट विद द सिग्निफिकेंट लेवल ऑफ 0.05 अ मतलब हमें यहां पर टेस्ट करना है कि मैन्युफैक्चरर जो बोल रहा है वो सही बोल रहा है या जो हमने 25 सैंपल्स यहां प उठाए हैं जिनका वेट 158 ग्राम है वो सही है हमें ये चीज यहां पर फाइंड आउट करनी है अब चलिए यहां पे फाइंड आउट करते हैं तो देखिए जब भी हम हाइपोथेसिस टेस्टिंग करते हैं तो हाइप टेस्टिंग के करने के कुछ रूल्स होते हैं मतलब कुछ स्टेप्स होते हैं यहां पर पहला स्टेप्स क्या होता है गाइज यहां पर पहला स्टेप्स होता है कि हमें नल हाइपोथेसिस एंड अल्टरनेटिव हाइपोथेसिस को यहां पे फाइंड आउट करना राइट तो चलिए नल हाइपोथेसिस और अल्टरनेटिव हाइपोथेसिस को निकालते हैं यहां पर तो अकॉर्डिंग टू दिस क्वेश्चन आपके पास नल हाइपोथेसिस क्या होगा गाइज यहां पर h0 क्या होगा गाइज यहां पर h0 यहां पर बोलेगा कि आपके पास जो सैंपल मीन है जो गाइज यहां पर वो कितना है 150 ग्रामस है यस कितना है 150 ग्राम है ओके और ए जो है हमारा अल्टरनेटिव हाइपोथेसिस बोलेगा गाइ यहां पर कि जो म है वो क्या है लेसन ऑफ 150 ग्रा है क्यों लेस दन ऑफ 150 ग्रा है क्योंकि 148 ग्राम हमें यहां पर देखने को मिला है तो बेसिकली म जो वैल्यू है वो कितना होगा 150 ग्रा होगा मतलब लेस दन ऑफ 150 ग्रा आपको यहां पर देखने को मिलेगा मतलब हम कंपनी को चैलेंज कर रहे हैं यहां पर कि आपके पास जो आपका सैंपल डाटा है उससे 18 148 ग्राम आपका देखने को मिला है मीन यहां पर इट्स मीन दैट आप जो बोल रहे हैं वो गलत बोल रहे हैं अब हमें ये प्रूफ करना है कि कंपनी जो बोल रही है कंपनी का जो क्लेम है वो सही है या जो हम कर रहे हैं वो सही है यहां पर तो चलिए अब जरा इसे फाइंड आउट करते हैं कि कौन यहां पर सही बोल रहा है अब जरा देखिए गाइस यहां पर हमारे पास जो गिवन डाटा है यहां पर इसमें से हमने क्या निकाला नल एंड अल्टरनेटिव हाइपोथेसिस हमने फाइंड आउट कर लिया अब नल एंड अल्टरनेटिव हाइपोथेसिस फाइंड आउट करने के बाद में हमें क्या करना पड़ता है हमें एक सिग्निफिकेंट लेवल अल्फा डिसाइड करना पड़ता है अच्छा सिग्निफिकेंट लेवल अल्फा जो है वो यहां पर हमें गिवन है 0.05 यहां पर गिवन है अब सिग्निफिकेंट अल्फा के बेसिस पे हमें क्या करना है हमें हमारा कॉन्फिडेंस इंटरवल निकालना है एंड कॉन्फिडेंस इंटरवल निकालने के बाद में हमें क्या करना है t टेबल से t की वैल्यू फाइंड आउट करनी है चलिए फाइंड आउट करते हैं यहां पर अब देखिए गाइज यहां पर बोला गया है वन टेल टी टेस्ट आपको यूज़ करना है तो ठीक है हम वन टेल टी टेस्ट यूज़ करेंगे गाइज यहां पर और इसके लिए मैं क्या कर रहा हूं गाइ यहां पर इस तरह से आपका डिजाइन कर रहा हूं अब इस एरिया के अंदर आपके पास क्या है लेस दन ऑफ 150 ग्रा बोला गया है इसका मतलब क्या होगा गाइज यहां पर डेफिनेटली आपके पास क्या होगा लेफ्ट टेल टेस्ट चलने वाला है राइट टेल टेस्ट नहीं चलेगा ठीक है तो मैं यहां पर लेफ्ट टेल टेस्ट चलाऊंगा यहां पर और ले ल टेल के हिसाब से मैंने यहां पर एक लाइन बना दी है अब ये लाइन कौन सी होने वाली है गाइज यहां पर अल्फा = 0.05 हमारे पास होने वाली है अच्छा ये वाला जो एरिया होगा ये एरिया किसका होगा गाइज यहां पर ये एरिया होगा ए का होने वाला है और ये जो एरिया होने वाला है गाइज यहां पर वो किसका होने वाला है h न कौन आ रहा है अब ल्फ = 0.05 के ऊपर हमें क्या करना है t की वैल्यू फाइंड आउट करनी है चलिए t की वैल्यू को फाइंड आउट करते हैं t की वैल्यू को फाइंड आउट करने के लिए हम पहुंच गए कहां पे गाइस हम पहुंच गए हैं क्या लिखना है यहां पर टी टेबल चाहिए तो मैं google3 बल सर्च करूंगा एंड टी टेबल सर्च करने के बाद में आपके पास जो भी आपको टेबल दिखे जैसे मुझे ये टेबल पसंद है मैं यहां पे इसे सेलेक्ट कर लेता हूं एंड देन हम उसे क्या कर लेते हैं ओपन कर लेते हैं अब बात करते हैं हमारे पासस अल्फा अल्फा क्या है यहां पर वन टेल टेस्ट की बात की जा रही है तो वन टेल टस्ट के हिसाब से 0.05 हमें यहां पे मिल चुका है यस 0.05 के ऊपर हमें क्या करना है यहां पे गाइज अल्फा की वैल्यू निकालनी है अल्फा की वैल्यू निकालने से पहले हमें क्या चाहिए गाइज यहां पर वा एक्सेस का डटा चाहिए लेकिन यहां पे बात की गई है डीएफ की अब ये डीएफ क्या है इज डिग्री ऑफ फ्रीडम यस हमें यहां पे डिग्री ऑफ फ्रीडम निकालना पड़ेगा और यह डिग्री ऑफ फ्रीडम कैसे निकाला जाता है गाइज यहां पर तो मैं बात करूंगा डिग्री ऑफ़ फ्रीडम के बारे में तो df-41 को माइनस करें तो दैट इज कॉल्ड ऑफ डिग्री ऑफ फ्रीडम अब देखिए n की वैल्यू कितनी है n की वैल्यू है गाइज 25 25 - 1 करूंगा तो आंसर कितना मिलेगा मुझे 24 मिलने वाला है अब 24 पे निकालते हैं अल्फा की वैल्यू 0.05 के ऊपर तो 0.05 के ऊपर अल्फा = 20 आपके पास कितना है फर है तो 24 के ऊपर अल्फा वैल्यू निकाली जाए तो 1.71 आता है हमारे पास कितना आ रहा है 1.71 हमें यहां पे मिल रहा है अा = 0.05 का इसका मतलब गाइज यहां पे बात करें ल् = 0.05 के ऊपर बात करें हैं तो 1.7 आपके पास 1 पॉट यस मैं यहां पे लिख लेता हूं आपके पास कितना आ रहा है अ अल्फ = 24 पे बात करें यहां पर तो 1.71 1.71 आपके पास यहां पर देखने को मिलने वाला है लेकिन गाइज हमें एक चीज का ध्यान रखना पड़ेगा क्योंकि ये हमारे पास क्या है एक नॉर्मल डिस्ट्रीब्यूटर डाटा है तो नॉर्मल डिस्ट्रीब्यूटर डाटा के आपके पास यहां पर मिडल के ऊपर आपके पास जो वैल्यू होती है वो रो होती है और इस तरफ हमें सारी कैसे मिलती है पॉजिटिव वैल्यू देखने को मिलती है और इस तरफ हमें सारी नेगेटिव वैल्यू मिलती है इसका मतलब ये जो वैल्यू हमें निकल के आई है वो हमारे पास कैसी होगी नेगेटिव होगी नेगेटिव में 1.71 हमें देखने को मिलेगा अब ये तो हमने किससे कैलकुलेट की है टेबल से कैलकुलेट की है यदि हम टेबल से कैलकुलेट ना करें तो हम किस तरह से फाइंड आउट कर सकते हैं यहां पर t की वैल्यू को तो चला जरा आप समझते हैं कि t की वैल्यू को कैसे फाइंड आउट कर सकते हैं तो इसके लिए हम चलते हैं जुपिटर नोटबुक के पर जुपिटर नोटबुक में आने के बाद में आपको क्या करना है इंपोर्ट करना है इंपोर्ट क्या करेंगे गाइज यहां पर इंपोर्ट करना है आपको सा पाई को लाइब्रेरी को अब साई लाइब्रेरी के अंदर जाने के बाद में आपको कहां जाना है गाइ यहां पर साई लाइब्रेरी के अंदर आपको मिलेगा आपके पास स्टेट नाम से यस आपके पास क्या मिलेगा स्टेट मिलेगा जहां पे हम स्टैटिक्स से रिलेटेड चीजों को सॉल्व करेंगे स्टेट के नाम से मिलने के बाद मैं लिस बनाऊंगा यहां पर एसटी के नाम से चलिए तो अब हम क्या कर रहे हैं गाइ यहां पर एटी डॉट यहां पर क्या करने वाला हूं गाइस यहां पर t लेने वाला हूं यस टी के अंदर जाने के बाद में अब हमें क्या चाहिए यहां पर पीपीएफ की वैल्यू चाहिए पीपीएफ के अंदर हम सबसे पहले अल्फा डालेंगे 0.05 और उसके बाद हमें डालना पड़ेगा डिग्री ऑफ फ्रीडम डिग्री ऑफ फ्रीडम इज 24 और जैसे ही रन करेंगे देखिए हमें यहां पर नेगेटिव की वैल्यू देखने को मिली है इसका मतलब हमारा जो टेस्ट है गाइ यहां पर हमारे पास कैसा है लेफ्ट टेल टेस्ट है यहां पर इस वजह से हमें वैल्यू भी किसकी मिली है नेगेटिव मिली है ये कैसी वैल्यू है गाइ यहां पर ये वैल्यू है t टेबल की वैल्यू है तो मैं यहां पर t टेबल की वैल्यू लिख देता हूं और ये जो टी टेबल है यहां पर इसे फिर से रन करके देख लेते हैं तो टी टेबल की वैल्यू कितनी निकल के आई है माइनस के अंदर 1.7 आपके पास क्या निकल के आई है 1 निकल के आई है चलिए अब हमारे पास t टेबल की वैल्यू कैलकुलेट हो चुकी है अब हमें क्या करनी है गाइस यहां पर t कैलकुलेट निकालना है ये कैसी वैल्यू है गाइ यहां पर ये t टेबल की वैल्यू हमें मिली है यहां पर अब हमें t कैलकुलेट निकालना है तो चलिए t कैलकुलेट कर लेते हैं यहां पर t कैलकुलेट करने का फार्मूला क्या है गाइस यहां पर तो t का फार्मूला मैं यहां पर ऊपर लिख देता हूं t इक्वल टू क्या है गाइस यहां पर आपके पास x ब - म डिवाइड बा s / √ n ये आपके पास फार्मूला होता है और यहां पे बात करें तो आपके पास x बार की वैल्यू कितनी निकल के आई है गाइज यहां पर 148 निकल के आई है और म के बारे में बात करें तो म आपके पास कितना है 150 है यहां पर s की बात करें तो s आपके पास कितना है गाइज यहां पर s5 है आपके पास यहां पर और n की वैल्यू की बात करें तो वो आपके पास कितना है 25 है तो अब फॉर्मूले के अंदर वैल्यू रखते हैं तो फॉर्मूले के अंदर वैल्यू रखने पर 148 मिला यहां पर 148 - 150 डिवाइडेड बाय आपके पास क्या लिखेंगे गाइज यहां पर 5 / √ √ 25 यस रूट ऑफ क्या निकलने वाला है 25 निकलने वाला है अब जब आप इसे सॉल्व करते हैं तो आपके पास आंसर कितना निकल के आता है यहां पर आंसर निकल के आता है माइनस का टू और ये क्या है गाइज यहां पर टी कैलकुलेटेड अच्छा टी कैलकुलेटेड को मैं यहां पे कैसे कल दिखा रहा हूं ब्लू कलर से दिखा रहा हूं और जो कि है -2 -2 का मतलब यहां कहीं आपके पास आएगा -2 माइनस के 1.7 से अंदर की तरफ आएगा माइनस का टू अब ये आपके पास कौन से एरिया में आ रहा है ये आपके पास ए के एरिया में आ रहा है इसका मतलब क्या हुआ गाइज यहां पर कि जो कंपनी क्लेम कर रही है कि हमारे पास जो बैग ऑफ पोटैटो चिप्स है यहां पर मतलब जो हमारा चिप्स का पैकेट है यहां पर इसका जो आपका वेटेज है 150 ग्रा जो है यहां पर वो वो फॉल्स है यहां पर जो वेटेज है वो लेस देन ऑफ 150 ग्रा है यहां पर 148 ग्रा हो सकता है 149 ग्रा हो सकता है या 147 ग्रा भी हो सकता है या उससे कम भी हो सकता है तो मतलब जो कंपनी क्लेम कर रही है यहां पर वो कंपनी का जो क्लेम है वो क्या है गाइज यहां पर गलत है तो बेसिकली आपके पास यहां पर टी टेस्ट के जरिए हमने ये फाइंड आउट किया कि जो कंपनी क्लेम कर रही है वो क्या है यहां पर रंग है चलिए तो इस तरह से हम क्या कर सकते हैं टी टेल को यहां पर अप्लाई कर सकते हैं वन टेल टेस्ट के अंदर लेकिन टी टेल का जो इस्तेमाल है वो आगे और भी केसेस के अंदर किया जाता है जैसे पेयर टेस्ट अनपेयर टेस्ट के अंदर भी इस्तेमाल किया जा सकता है इसके अंदर हम कुछ सिचुएशन के और क्वेश्चन लेने वाले हैं ताकि और आपको क्लियर हो सके कि टी टेस्ट का इस्तेमाल कैसे करा जाता है तो चलिए एक और क्वेश्चन लेते हैं यहां पर अब देखिए ये क्वेश्चन क्या कह रहा है यहां पर ये क्वेश्चन है एक कंपनी का अब कंपनी क्या कर रही है कंपनी वांट्स टू टेस्ट कंपनी क्या कर रही है एक टेस्ट करना चाहती है वेदर द देयर इज द डिफरेंस इन द प्रोडक्टिविटी अब क्या कर रही हैं कि आपके पास दो टीम है यस टीम ए और टीम बी यहां पर है उनके बीच का जो डिफरेंस है प्रोडक्टिविटी का जो डिफरेंस है वो चेक करना चाहती है यहां पर एक टेस्ट के जरिए देखना चाहती है कि दोनों टीम के जो प्रोडक्टिविटी जो है यहां पर वो सेम है या नहीं है इस चीज को कंपनी चेक करना चाहती है तो देखिए क्या लिखा है यहां पर अ कंपनी वांट टू टेस्ट कंपनी एक टेस्ट कंडक्ट करना चाहती है क्या लिखा है यहां पर देयर इज अ डिफरेंस देयर इज अ डिफरेंस इन द प्रोडक्टिविटी बिटवीन टू टीम्स मतलब दो टीम्स के बीच में आपके पास कोई प्रोडक्टिविटी डिफरेंस है या नहीं है इसके रिलेटेड ठीक है दे रैंडम सिलेक्टेड 20 एंप्लॉई वे क्या कर रहे हैं रैंडम सिलेक्टेड कर रहे हैं 20 एंप्लॉयज को फ्रॉम फॉर ईच टीम मतलब कंपनी में क्या होता है यहां पर बहुत सारी टीम्स होती है उनमें से क्या कर रहा है 20 एंप्लॉयज को रैंडम सिलेक्टेड किया एंड रिकॉर्ड देयर प्रोडक्टिविटी स्कोर मतलब प्रोडक्टिविटी का जो स्कोर है उन्होंने रिकॉर्ड कर लिया यहां पर अब क्या लिखा है यहां पर अ मीन प्रोडक्टिविटी स्कोर फॉर अ टीम ए इज 80 फॉर स्टैंडर्ड डिवीजन ऑफ़ फाइव एंड व्हाइट अ मीन प्रोडक्टिविटी स्कोर ऑफ द टीम बी इज 75 स्टैंडर्ड डिविजन इज सिक्स टेस्ट ऑफ 5 पर ऑफ सिग्निफिकेंट लेवल अल्फा अब क्या लिखा है यहां पर देयर इज अ डिफरेंस इन अ प्रोडक्टिविटी बिटवीन द टू टीम मतलब यहां पर आपके पास दोनों टीम के अंदर प्रोडक्टिविटी का डिफरेंस है या नहीं है ये चीज हमें यहां पर पता लगानी है तो चलिए अब पता लगाते हैं यहां पर तो एक क्वेश्चन का सिनेरियो को थोड़ा सा क्लियर कर देता हूं मान लीजिए आपके पास आपकी खुद की कोई कंपनी है इस कंपनी के अंदर टीम ए और टीम बी के तौर पे आपके पास दो टीम्स काम कर रही है अब आपको देखना है कि दोनों टीम सेम लेवल पे काम कर रही है या फिर नहीं कर रही है अब आप डायरेक्टली पूरी टीम के ऊपर जो जाके सर्वे करने से रहे इसके लिए आपने क्या किया कि टीम ए से आपने 20 अ परस को निकाल दिया और टीम बी से 20 पर को निकाला अब इनके बीच में जो है आपके पास इनके ऊपर आपने क्या किया टेस्ट कंडक्ट कराया टेस्ट कंडक्ट कराने के बाद आपने कुछ रिजल्ट निकाला रिजल्ट निकालने के बाद में अब आपको यहां पे पता करना है कि आपके पास दोनों टीम के बीच में कोई डिफरेंस है या नहीं है मतलब प्रोडक्टिविटी में डिफरेंस है या नहीं है ऐसा भी हो सकता है कि टीम अच्छा काम कर रही हो टीम ब अच्छा काम नहीं कर रही हो या फिर ऐसा भी हो सकता है कि टीम भी अच्छा काम कर रही हो और टीम ए अच्छा काम नहीं कर रही हो या फिर दोनों टीमें सेम काम कर रही हो अब हमें यही प्रूफ करना है यहां पर कि दोनों टीम सेम वर्क कर रही है या फिर दोनों टीम सेम वर्क नहीं कर रही है तो चलिए अब जरा इसे यहां पर सिंपलीफाई करके देखते हैं कि ये दोनों टीम सेम वर्क कर रही है या फिर नहीं करती है चलिए अब इसके लिए हम क्या कर रहे हैं गाइस यहां पर हम यहां पर टी टेस्ट को अप्लाई करेंगे क्यों टीस्ट को अप्लाई करना है कि क्योंकि हमारे पास जो नंबर ऑफ सैंपल्स क्या है गाइ यहां पर 20 एंप्लॉयज है लेस दन ऑफ 30 यहां पर आपको देखने को है तो इसका मतलब हम यहां पर t टेस्ट को अप्लाई करने वाले हैं अब ये t टेस्ट कैसे अप्लाई होने वाला है जरा समझते हैं यहां पर पहले तो हम बात करते हैं कि t टेस्ट का फॉर्मूला क्या बनने वाला है यहां पर तो t टेस का फॉर्मूला गाइज क्या बनेगा यहां पर आपके पास बनेगा x ब - x ब अब ये x बार - x बार क्या है गाइज यहां पर x ब a - x बफ b मतलब टीम a- टीम b यस उसके बाद में गाइज यहां पे माइनस का साइन लगेगा ऑफ a - ऑफ आपके पास क्या बन जाएगा b बन जाएगा डिवाइडेड बाय रूट के अंदर मैं जाऊंगा यहां पर रूट के अंदर जाने के बाद में s का स्क्वा डिवा बा n1 ए आ जाएगा यहां पर और ए आ जाएगा यहां पर प्लस s स् ऑफ b / n आपके पास क्या हो जाएगा b हो जाएगा तो ये आपके पास क्या बनने वाला है फॉर्मूला बनने वाला है अब इस फॉर्मूले को अप्लाई करते हैं यहां पर इससे पहले हम क्या करेंगे गाइज यहां पर नल हाइपोथेसिस एंड अल्टरनेटिव हाइपोथेसिस को फाइंड आउट करेंगे तो चलिए पहले फाइंड आउट कर लेते हैं यहां पर तो देखिए गाइज यहां पर h नॉ क्या बोलेगा गाइज यहां पर यहां पर न क्या बोलेगा गाइज यहां पर मूट यहां पर ये बोलेगा कि आपके पास जो दोनों टीम की प्रोडक्टिविटी है उनके बीच में कोई डिफरेंस नहीं नहीं है और म क्या बोलेगा गाइज यहां पर म बोलेगा कि दोनों के बीच में डिफरेंस है मतलब क्या करने वाला हूं गाइस यहां पर कि प्रोडक्टिविटी ऑफ a यस प्रोडक्टिविटी ऑफ a माइनस प्रोडक्टिविटी ऑफ b जो है यहां पर इज इक्वल टू 0 यस यहां पे क्या बोला जाएगा गाइज यहां पर इक्वल टू 0 बोला जाएगा मतलब दोनों के बीच में प्रोडक्ट का डिफरेंस जीरो है मतलब दोनों क्या है सिमिलर है यहां पर है यस अब यहां पे गाइज मैं क्या बोलूंगा ए क्या बोलेगा ए बोलेगा गाइज यहां पर प्रोडक्टिविटी ऑफ a माइनस प्रोडक्टिविटी ऑफ b इज इक्वल टू ड नॉट इक्वल टू 0 यस डज नॉट इक्वल टू 0 मतलब दोनों के बीच में प्रोडक्टिविटी का डिफरेंस जीरो नहीं है मतलब कुछ ना कुछ प्रोडक्टिविटी का डिफरेंस है मतलब ये बोला जाएगा यस यहां पर सिंपल सा बोला जाएगा देखिए प्रोडक्टिविटी ऑफ़ a प्रोडक्टिविटी ऑफ़ b के बीच में कोई डिफरेंस नहीं है यस माइनस जीरो आ गया यहां पर रो का मतलब क्या है दोनों सिमिलर है और नॉट इक्वल टू 0 का मतलब क्या है दोनों सिमिलर वर्किंग नहीं है यहां पर चलिए अब हमारे पास क्या है गाइज यहां पर सिग्निफिकेंट लेवल अल्फा 0.05 है अब यहां पर टेस्ट कौन सा कर रहे हैं यहां पर हम यहां पर कर रहे हैं टू टेल टेस्ट यहां पर इस्तेमाल करेंगे क्यों टूटेल इस्तेमाल करेंगे क्योंकि हमने डज नॉट इक्वल टू 0 बोला है यहां पर डज नॉट इक्वल टू 0 का मतलब क्या हो गया गाइ यहां पर टू टेल टेस्ट यहां पर एप्लीकेबल होगा अब एप्लीकेबल होगा तो गाइ यहां पर क्या होगा गाइ यहां पर सिंपल सा आपके पास ये कर्वेचर बनने वाला है इस कर्वेचर के पार्ट में यहां भी हम बात करें सिग्नि ल अल्फा जो हमने डिसाइड किया 0.05 इसके हिसाब से बात करें तो 0.25 यहां पे आएगा और 0.25 जो पर है वो यहां पर हमारे पास आने वाला है और ये वाला जो एरिया है गाइज यहां पर ये हमारा क्या बन जाएगा ए बन जाएगा और ये वाला जो एरिया है वो भी क्या बनेगा ए बनने वाला है अब बात करें ये जो मिडल वाला जो एरिया है गाइज यहां पर ये क्या बनेगा हमारा h0 यहां पर बनने वाला है ठीक है अब बात करते हैं डिग्री ऑफ फ्रीडम क्या बनने वाला है गाइ यहां पर डीएफ की बारी तो डिग्री ऑफ फ्रीडम की बात करें डीएफ के बारे में बात करें तो डीए आपके पास क्या होने वाला है गाइ यहां पर 20 + 20 माइ का 2 इट्स मीन दैट गाइज यहां पर क्या होने वाला है 20 + 20 = 40 40 - 2 करेंगे तो गाइज आपके पास क्या मिलेगा यहां पर 38 आपको मिलने वाला है मतलब df3 मिलने वाला है चलिए टी टेबल से टी टेबल की वैल्यू निकालते हैं यहां पर तो अब हम आ चुके हैं टी टेबल के अंदर यह रहा हमारा t टेबल टी टेबल के अंदर हम आने के बाद में अब डिग्री ऑफ़ फ्रीडम क्या हो गया गाइज यहां पर आपका 28 हो गया है य सॉरी 38 आपके पास डिग्री ऑफ़ फ्रीडम है आपके पास यहां पर और देखिए टू टेल के बारे में बात करें तो टू टेल के अंदर 0.02 आपके पास होगा यस आपके पास क्या होगा यहां पर आपके पास 0 प 0.02 या इट इज माय मिस्टेक दैट इज अ 0 पॉट आपके पास क्या होगा यहां पर 02 होगा यहां पर यस 0.02 यहां पर आपके पास होने वाला है यहां पर तो 0.025 यस ये आपका पास होने वाला है मतलब ये आपका होने वाला है और डिग्री ऑफ फ्रीडम कितना है यहां आपका यहां पर 38 के आसपास है देखिए 40 दे रखा है और उसके बाद 30 दे रखा है तो 38 की वैल्यू आपके पास यहां पर आपको नहीं दे रखी है तो अब हमें कहां आना पड़ेगा गाइ यहां पर आपके पास कैलकुलेटर पे आना पड़ेगा यहां पे हमारा कैलकुलेटर बना हुआ है जिसके अंदर हम t टेबल की वैल्यू को कैलकुलेट कर सकते हैं अब डिग्री ऑफ फ्रीडम की बात करें तो डिग्री ऑफ फ्रीडम कितना है गाइज यहां पर डिग्री ऑफ फ्रीडम है इस कॉल ऑफ 38 एंड अल्फा की बात करें तो अल्फा आपके पास क्या हो गया यहां पर 0.25 आपके पास हो गया रन करते हैं यहां पर तो क्या निकल के आया है यहां पर माइनस का टू निकल के आया है दैट अ नेगेटिव और यदि हमें पॉजिटिव में चाहिए तो हम क्या करेंगे 1 माइनस इसको कर देंगे तो क्या आगा यहां पर 2.02 4 आपका आएगा तो 2.02 4 आएगा मतलब यहां पर यदि मैं t की वैल्यू की बात करूं तो कितना आगा 2.02 आपके पास आने वाला है यस 2.24 यस ये आपके पास वैल्यू आने वाली है ये किसकी वैल्यू आएगी गाइ यहां पर t टेबल की वैल्यू आएगी अब हमें क्या करना है t कैलकुलेटेड करना है ठीक है हमें क्या करना है यहां पर t कैलकुलेट करना है t कैलकुलेट का फार्मूला हमारे पास लिखा हुआ है यहां पर चलिए अब टीम ए का हम क्या कर रहे हैं गाइज यहां पर मीन की बात कर ें हैं टीम ए का मीन कितना है 80 आपके पास दे र तो मैं 80 माइनस टीम बी के मीन की बात करूं तो इट्स कॉल ऑफ़ 75 तो मैंने 75 रख दिया यहां पर अब गाइज माइनस करते हैं और हम क्या कर रहे हैं पॉपुलेशन का स्टैंडर्ड डेविएशन की बात कर पॉपुलेशन के मीन की बात करते हैं यहां पर तो पॉपुलेशन की मीन की बात करें तो पॉपुलेशन का मीन कहीं नहीं दे रखा है जब ऐसे सिचुएशन के अंदर पॉपुलेशन का मीन ना मिले आपको यहां पर तो आपको ये मानना है कि म a इज इक्वल टू क्या होगा गाइज यहां पर म ब ही होने वाला है यस म इक्वल टू क्या होने वाला है गाइज यहां पर म ब होने वाला है तो = म मतलब आपके पास यहां पे ये वाली जो वैल्यू है वो जीरो हो जाएगी अब हम क्या करेंगे गाइज यहां पर रूट लेंगे स्क्वायर रूट के अंदर अब हमें क्या करना है गाइज यहां पर आपके पास सैंपल का स्टैंडर्ड डिविज का स्क्वायर करना है आपके पास यहां पर मतलब फाइव का स्क्वायर करना है 5 का स्क्वायर कितना होता है गाइज यहां पे 25 डिवाइडेड बाय आपके पास क्या होगा नंबर ऑफ सैंपल नंबर ऑफ सैंपल कितना है गाइज यहां पे 20 मैं प्लस करता हूं यहां पर आपके पास 6 का स्क्वायर आपके पास हो जाएगा 36 डिवाइडेड बाय आपके पास कितना होगा गाइज यहां पर आपके पास हो जाएगा 20 यस इस तरह से हमें क्या करना है t कैलकुलेटेड करना है चलिए इस t कैलकुलेटेड की वैल्यू को कैलकुलेटेड करते हैं यहां पर तो मैं यहां पर कीप रखता हूं और इसको साइड बाय साइड चलाऊंगा और हमारे पास जो हमारा कैलकुलेटर है मतलब हमारा जो python2 से हम इसे कैलकुलेट करेंगे क्योंकि हमें यहां पर कैलकुलेशन बहुत आराम से हो जाएगी तो इसके लिए मैं क्या करूंगा गाइज यहां पर इंपोर्ट करूंगा इंपोर्ट किसे कर रहा हूं गाइज यहां पर नपाई को करूंगा यहां पर यस नपाई एलियाज ऑफ़ एप का इस्तेमाल करूंगा इधर की वैल्यू को कैलकुलेट करने के लिए मतलब t कैलकुलेट t कैलकुलेटेड बनाने के लिए चलिए t कैलकुलेटेड बनाने के लिए हम क्या करेंगे गाइज यहां पर 180 - 75 करेंगे सबसे पहले अब क्या कर रहा हूं डिवाइड कर रहा हूं डिवाइड करने के बाद में मैं यहां पे एक ब्रैकेट लगाऊंगा क्योंकि इसके अंदर ही मुझे काम करना है np.sum 1 के आसपास आई है देख एक बार फिर से चेक कर लेते हैं 80 - 75 सही है एंड डिवाइडेड बाय nps2.0 आया है चलिए अब हम फिर से यहां पे बात करते हैं कि 3 पॉ कितना आया है गाइ यहां पर 13 यस 3.13 आपके पास आया है तो मैं इसको क्या करता हूं वापस जूम में ले चलता हूं और इसकी जो वैल्यू कैलकुलेटेड आपके आई है यहां पर दैट इ अ 3.13 यस मैं एक बार प कलर चेंज कर लेता हूं ओके 3.13 आपके पास आई है अब गाइज यहां पे बात करें यहां पे इस जगह पे बात करें तो ये कहां पे प्लॉटिंग होगी तो यदि मैं यहां पर t कैलकुलेटेड की वैल्यू को प्लॉट करूं तो t कैलकुलेटेड की वैल्यू प्लॉट होगी यहां पर मतलब यहां पर हमारे पास t जो है वो 3.13 आने वाला है और ये कौन से एरिया में आया है गाइ यहां पर ये आया है हमारे ए के एरिया में इसका मतलब क्या हुआ इसका मतलब सिंपल सा है गाइ यहां पर कि ए जो है वो यहां पर राइट है और h नॉ जो है वो रिजेक्टेड है तो ए राइट है इसका मतलब क्या है प ऑफ पब मतलब आपके पास यहां पर प्रोडक्टिविटी ए और प्रोडक्टिविटी बी जो है यहां पर इन दोनों के अंदर कुछ ना कुछ डिफरेंस है मतलब दोनों की प्रोडक्टिविटी में क्या आ रहा है गाइस यहां पर आपको डिफरेंस देखने को मिलेगा राइट तो गाइस यहां पर हमने क्या निकाला यहां पर यहां पे कंक्लूजन निकाला कि जो हमारी टीम काम कर रही है टीम ए और टीम बी काम कर रही है इन दोनों की प्रा विटी के अंदर कुछ ना कुछ तो डिफरेंस है यस क्या है गाइस यहां पर कुछ ना कुछ तो डिफरेंस है यहां पर ये चीज हमने यहां पर कैलकुलेट की तो आई थिंक आई होप सो समझ में आ चुका होगा टीटी टेस्ट को यदि हमारे पास दो दो सिचुएशन एक साथ आ जाए तो उस समय किस तरीके से सॉल्व किया जाता है राइट चलिए एक और ट्र टास्ट का सिनेरियो लेते हैं और उसके थ्रू समझते हैं कि यदि आपके पास दोनों सिनेरियो एक ही टीम को इंडिकेट करते हो तब क्या रिजल्ट निकलेगा उसको अब हम देखते हैं जैसे अभी तो हमने क्या देखा यहां पर अभी हमने यह देखा कि आपके पास जो टी टेस्ट है यहां पर यह टी क्या कर टेस्ट जो है गाइस यहां पर दो अलग-अलग सिनेरियो पे काम कर रहा है दो अलग-अलग टीम पे काम कर रहा है लेकिन एक ही टीम के ऊपर सारी चीजें लगाई जाए तब कैसा वर्क करेगा उसको अब जरा देखते हैं तो उसके रिगार्डिंग हमने यहां पर एक और क्वेश्चन ले रहे हैं यहां पर क्वेश्चन क्या है यहां पर गाइ यहां पर अ कंपनी वांट टू टेस्ट कंपनी क्या करना चाहती है एक टेस्ट कराना चाह रही है यहां पर क्या टेस्ट कराना चाह रही है कि वेदर अ न्यू ट्रेनिंग प्रोग्राम इंप्रूव अ टाइपिंग स्पीड इट्स एंप्लॉई मतलब अब कंपनी क्या कर रही है कि कुछ एंप्लॉयज उनके अंदर अंडर में काम कर रहे थे पहले कुछ टाइपिंग के ऊपर काम कर रहे थे मतलब नॉर्मल टाइपिंग स्पीड प काम कर रहे थे फिर उन्होंने क्या किया कि उनके टाइपिंग स्पीड को इंप्रूव कराने के लिए उन्होंने क्या किया एक ट्रेनिंग प्रोग्राम लगवाया एक तरीके से मतलब आपके पास क्या करी उनको एक छोटी सी ट्रेनिंग दी है यहां पर राइट ट्रेनिंग देने के बाद में वो यह जानना चाहते हैं कि ट्रेनिंग से पहले जो टाइमिंग था वही टाइमिंग ट्रेनिंग के बाद भी है या उनके अंदर कुछ डिफरेंस देखने को मिला है ये चीज यहां पर कंपनी देखना चाहती है कि ट्रेनिंग से पहले और ट्रेनिंग के बाद में आपके पास कुछ इंप्रूवमेंट हुई है या नहीं हुई है तो चलिए जरा अब यहां पर देखते हैं इस क्वेश्चन को तो लिखा है यहां पर अ टाइपिंग स्पीड ऑफ 20 एंप्लॉई वाज अ रिकॉर्डेड बिफोर एंड आफ्टर द ट्रेनिंग प्रोग्राम अ डेटा इज गिवन बिलो मतलब हमें डटा मिल चुका है टेस्ट किस पे करना है 5 पर सिग्निफिकेंट प लेवल पे करना है वेदर अ ट्रेनिंग प्रोग्राम हैज अ इफेक्टेड ऑन अ टाइपिंग स्पीड ऑफ एंप्लॉय मतलब ट्रेनिंग प्रोग्राम ने टाइपिंग स्पीड पे इफेक्टिव की किया है या नहीं किया है यह चीज हमें यहां पर पता लगानी है यस गाइस तो चलिए अब यहां पर हमें क्या करना है हमें नल हाइपोथेसिस और अल्टरनेटिव हाइपोथेसिस को निकालना है तो मैं क्या करूंगा यहां पर गाइस पहले नल हाइपोथेसिस और अल्टरनेटिव हाइपोथेसिस को डिसाइड कर लेता हूं तो गाइस यहां पर जो ट्रेनिंग जो पहले हुई मतलब जो ट्रेनिंग नहीं हो रखी थी तब का डाटा हमारे पास है और आफ्टर मतलब आपके पास जो ट्रेनिंग अब होगी यहां पर ट्रेनिंग के बाद का जो डाटा है वो हमें यहां पर मिल चुका है तो मैं क्या कहूंगा यहां पर गाइस कि ट्रेनिंग बिफोर जो है यहां पर और जो ट्रेनिंग आफ्टर है जो ट्रेनिंग आफ्टर है यहां पर इसके अंदर कोई ज्यादा डिफरेंस नहीं है मतलब यहां पर ज दोनों के जो डिफरेंस है यहां पर वो जीरो बता रहा हूं यहां पर और ए की बात करें तो ए क्या होगा गाइज यहां पर कि जो ट्रेनिंग बिफोर है यहां पर और जो ट्रेनिंग आफ्टर है यहां पर उसके अंदर आपके पास क्या है कुछ ना कुछ डिफरेंस है ये मैंने यहां पर डिसाइड कर रखा है अच्छा सिग्निफिकेंट लेवल आपके पास अल्फा = 0.05 यहां पर बोला गया है यहां पर तो इसके हिसाब से मैं बात करूं यहां पर तो ये टू टेल टेस्ट है या वन टेल टेस्ट है तो डेफिनेटली ये क्या है टू टेल टेस्ट है यहां पर यस ये आपके पास क्या है टू टेल टेस्ट है तो टू टेल टेस्ट के हिसाब से से यदि मैं अल्फा = 0.05 आपके पास डिसाइड कर रखा है तो यदि मैं बात करूं अल्फा क्या होगा गाइज यहां पर अफ / 2 आपके पास हो जाएगा इट्स मीन दैट आपके पास क्या होगा 0.025 आपके पास देखने को मिलेगा यहां पर राइट अब हमें क्या करना है इन दोनों की वैल्यू निकालनी है अब यहां पे जो फॉर्मूला लगने वाला है वो क्या लगेगा गाइज यहां पर यहां पे फॉर्मूला लगेगा t टेस्ट का क्योंकि नंबर ऑफ़ सैंपल क्या है 20 है तो मैं t टेस्ट का फॉर्मूला अप्लाई करूं तो क्या होगा गाइज यहां पर यहां पर t टेस्ट का फॉर्मूला होगा यहां पर आफ्टर माइनस बिफोर यस आप आफ्टर माइनस बिफोर कर सकते हैं यहां पर या बिफोर माइनस आफ्टर भी कर सकते हैं यहां पर यस तो बिफोर माइनस आफ्टर कर दीजिए आफ्टर माइनस बिफोर कर दीजिए यहां पर डिवाइडेड बाय आपके पास क्या होगा गाइज यहां पर सैंपल का स्टैंडर्ड एविएशन अब सैंपल आपके पास ये भी है और सैंपल आपके पास क्या है ये भी है तो दोनों सैंपल है यहां पर तो रूट ऑफ आप क्या करेंगे यहां पर आपके पास s का होल स्क्वायर डिवाइड बा n प् s ब का यस s ब का स्क्वायर डिवाइडेड बा n हो जाएगा अब बात करें डिग्री ऑफ फ्रीडम क्या होगा गाइज यहां पर तो डिग्री ऑफ़ फ्रीडम यहां पर n -1 ही होने वाला है अब यहां पे n - 1 क्यों हुआ और पहले n - n + n n ् n -2 वहां पे क्यों हुआ रीज़न क्या है यहां पर तो रीज़न यहां पर सिंपल सा है कि जब हम यह क्वेश्चन कर रहे थे तो इस क्वेश्चन के अंदर आपके पास जो एंप्लॉई थे वो दोनों क्या थे डिफरेंट डिफरेंट थे मतलब आपके पास जो 20 एंप्लॉई टीम ए के और 20 एंप्लॉयज टीम b के जो थे वो दोनों क्या थे अलग-अलग थे यहां पर इस वजह से हमने क्या किया 20 + 20 - 2 यहां पर किया जबकि हमारे पास इस क्वेश्चन के अंदर बात करें तो इस क्वेश्चन के अंदर दोनों के दोनों जो एंप्लॉई है मतलब दोनों बार जो एंप्लॉई यहां पे यूज़ किए जा रहे हैं व सेम ही है यहां पर तो इसलिए हमने n - 1 ही करना है चलिए अब हम क्या कर रहे हैं इसकी वैल्यू को कैलकुलेट करते हैं चलिए कैलकुलेशन करते हैं यहां पर तो मैं इसको बाहर ले लेता हूं सबसे पहले तो और इसके लिए हम ले चलते हैं पाइथन के अंदर मैं साइड बाय साइड यहां पर पाइथन को भी ओपन कर रहा हूं यहां पर अब मुझे t टेबल की वैल्यू कैलकुलेट करनी है तो पहले तो t टेबल की वैल्यू कैलकुलेट कर देते हैं तो 1 - 0.05 और डिग्री ऑफ फ्रीडम क्या होगा n - 1 n कितने है नंबर ऑफ वैल्यू 20 है 20 - 1 कितना हो गया गाइ यहां पर 19 हो गया तो पहले मैं t टेबल की वैल्यू कैलकुलेट करूं तो t टेबल की वैल्यू कितनी आई है 2.09 आपका सही है अब t कैलकुलेटेड करना है यहां पर देखन कैलकुलेट करने से पहले मुझे बिफोर और आफ्टर का दोनों का डाटा चाहिए तो देखिए मेरे पास ये रहा बिफोर और आफ्टर दोनों का डाटा है तो मैं इसे कॉपी कर लेता हूं एंड देन पेस्ट कर लेता हूं अब देखिए यहां पर बिफोर और आफ्टर का जो डाटा हमें मिला है यहां पर वो हमारे पास टेबल फॉर्मेट में नहीं लिस्ट फॉर्मेट में नहीं है तो मैं इसे लिस्ट फॉर्मेट में बना लेता हूं या फिर नपाई फॉर्मेट में बना लेते हैं तो एप डॉट मैं क्या कर रहा हूं गाइज यहां पर एरे बना लेता हूं और इसे भी क्या कर रहा हूं गाइज यहां पर एप डॉ एरे बना लेते हैं तो मैंने एप डॉट मैंने क्या किया यहां पर एरे का इस्तेमाल कर लिया य यहां पे भी चलिए एड डरे बनाने के बाद में अब हम क्या कर रहे हैं यहां पर बिफोर और जो आफ्टर हमने बनाया यहां पर इसे हम क्या करते हैं क्लोजिंग मार्क्स कर लेते हैं चलिए आ गया हमारे पास यहां पर और रन कर देते हैं अभी यहां प कुछ एरर आ गई है एरर को देख लेते हैं यहां पर क्या प्रॉब्लम आई है ओके एक प्रॉब्लम आ गई है क्योंकि यहां पर मुझे एरर डालना था लिस्ट के एरे के अंदर एरे डालना था मुझे यहां पर सिंगल फॉर्मेट में नहीं देना था ये चीज मैंने मिस्टेक की है तो अब हम इसे भी सही कर लेते हैं राइट तो मैंने इसे भी सही कर लिया है एंड देन मैंने इसे भी यहां पर सही कर लिया है चलिए अब हमारा जो डाटा है वो हमारे पास आ गया है बिर फोर और आफ्टर का अब हमारा जो फार्मूला क्या है यहां पर बिफोर का मीन माइनस आपके पास आफ्टर का मीन आफ्टर का मीन माइनस बिफोर का मीन कर सकते हैं क्योंकि ट्स टू टेल ट और स्क्वायर रूट ऑफ क्या करना है यहां पर ए काल स्क्वा / n + s ब का स्क्वा / n हमें ये फॉर्मूला लगाना है चलिए तो फॉर्मूला लगाते हैं यहां पर तो मुझे क्या करना है सबसे पहले यहां पर ये फॉर्मूला तैयार करना है तो मैं यहां पर t कैलकुलेट ले रहा हूं यहां पर यस t अंड कैलकुलेट लिया कैलकुलेट के अंदर अब मुझे क्या करना है मीन निकालना है तो n पड हमारे पास क्या है मीन है यहां पर यस n प डॉट क्या है हमारे पास मीन है है एड मीन के अंदर मैं क्या कर रहा हूं गाइज यहां पर बिफोर ले रहा हूं या फिर आप आफ्टर भी ले सकते हैं ऐसा कुछ नहीं है तो मैं आफ्टर ले लेता हूं चलिए आफ्टर माइनस यस माइनस किया मैंने यहां पर एप डॉट क्या किया गाइज यहां पर फिर से मैंने मीन निकाला यहां पर और मीन के अंदर मैंने क्या किया यहां पर गाइस बिफोर कर दिया यहां पर तो आफ्टर माइनस बिफोर आपके पास आ चुका है अब मुझे क्या करना है डिवाइड करना है डिवाइड के अंदर क्या करना है गाइज यहां पर यस डिवाइड का फॉर्मूला देखें तो डिवाइड के अंदर क्या करना है स्क्वायर रूट ऑफ आपके पास क्या है एसे का होल स्क्वा डि बा n + s का स्क्वा डि बा n चलिए तो सबसे पहले स्क्वायर रूट लगाना है यहां पर तो मैंने एक ब्रैकेट लगा लिया है एप डॉट यहां पर ए क आरटी स्क्वायर रूट को कॉल कर लिया स्क्वायर रूट के अंदर स्क्वायर रूट को डाल दिया यहां पर अब मुझे एक यहां पर लगाना है पहले प्लस यहां पर एक और ब्रैकेट लगाना है चलिए पहले ब्रैकेट की बात कर रहे हैं पहले ब्रैकेट के अंदर क्या करना है इसका स्टैंडर्ड डेविएशन निकालना है तो मैं यहां पे एप डॉट यहां पे क्या कर रहा हूं एसटीडी का इस्तेमाल करूंगा यस एप डॉट क्या करूंगा एटीडी स्टैंडर्ड डेविएशन के बारे में बात करेंगे स्टैंडर्ड डेविएशन के अंदर मुझे क्या करना है गाइज यहां पर बिफोर या आफ्टर दोनों ले सकते हैं तो पहले मैं आफ्टर ले रहा हूं यहां पर अब ये आफ्टर स्टैंडर्ड डिविजन आ गया स्टैंडर्ड डिविजन का जो यहां पर आया है मुझे इसको क्या करना है स्क्वायर करना है अब मुझे स्क्वायर करना है तो इसके लिए मैं क्या कर रहा हूं गाइस यहां पर बाहर आ रहा हूं बाहर आने के बाद में n प डॉट मैं क्या कर रहा हूं यहां पर s स्क्वायर का फार्मूला यहां पे यूज कर रहा हूं तो मैंने क्या किया np1 लिया यस एड कुछ ज्यादा यहां पर हो गया है तो एक काम करते हैं ये जो नीचे वाला एरिया है इसे हम अलग से सॉल्व कर लेते हैं तो मैं इसे कैंसिल आउट कर रहा हूं यहां पर और यहां पर ले लेते हैं नीचे वाला एरिया ठीक है इसको मैं बना लेता हूं डिनॉमिनेटर ताकि आप लोगों को थोड़ा कंफ्यूजन ना हो यहां पर ठीक है या एक काम करते हैं कि जितने भी कैलकुलेशन मुझे चाहिए वो सारी अलग-अलग ही कर लेते हैं ठीक है और उसके साथ एक साथ र ख लेंगे चलिए स्टार्ट करते हैं यहां पर एटीडी ऑफ a ले रहा हूं मैं यहां पर एटीडी a कैसे निकालेंगे यहां पर एप डॉट यहां पर स्टैंडर्ड डेविएशन निकालेंगे यस ए n स्टैंडर्ड डेविएशन पे आ जाएंगे स्टैंडर्ड डेविएशन के अंदर क्या करने वाला है गाइज यहां पर हमारे पास आफ्टर का स्टैंडर्ड डेविएशन निकालेंगे ये से राइट उसके बाद क्या करेंगे गाइज यहां पर एटीडी यस मैं क्या कर रहा हूं गाइज यहां पर एटीडी अंडर ऑफ बी निकाल रहा हूं मतलब बिफोर का निकाल रहा हूं उसके लिए मैं एप डॉट क्या कर रहा हूं यहां पर एटीडी का इस्तेमाल करूंगा और स्टैंडर्ड डेविएशन के अंदर मैं कर रहा हूं गाइज यहां पर बिफोर का यूज़ कर रहा हूं तो ये दोनों का स्टैंडर्ड डेविएशन मुझे निकल गया यहां पर अब मुझे क्या करना है गाइ यहां पर मुझे दोनों का मीन भी चाहिए यस मुझे क्या चाहिए दोनों का मीन भी चाहिए तो मैं यहां पर क्या कर रहा हूं मीन अंडर ऑफ a का इस्तेमाल करूंगा और इसके लिए एप डॉट क्या करना है गाइज यहां पर हम मीन का इस्तेमाल करेंगे मीन के अंदर क्या कर रहा हूं आफ्टर के अंदर आफ्टर का इस्तेमाल करूंगा और उसके बाद मैं क्या कर रहा हूं गाइ यहां पर मीन ऑफ बी यस मीन ऑफ बी का इस्तेमाल करेंगे जिसके अंदर एप डॉट क्या कर रहा हूं गाइ यहां पर मीन का इस्तेमाल करूंगा जिसके अंदर मैं क्या करूंगा गाइज यहां पर बिफोर का इस्तेमाल करूंगा तो ये चारों वैल्यू मेरे पास कैलकुलेट हो गई है अब हम क्या करेंगे t जो है हमारा वो कैलकुलेट करेंगे t कैलकुलेट करने के लिए मुझे क्या चाहिए गाइ यहां पर मीन ऑफ आफ्टर मीन ऑफ आफ्टर माइनस मीन ऑफ आफ क्या करेंगे यहां पर बिफोर का इस्तेमाल करेंगे डिवाइडेड बाय ये आपके पास आ गया वैल्यू अब हम क्या करें इसको तो ब्रैकेट में ले ले पहले तो क्योंकि दोनों का मीन है यहां पर तो दोनों को ब्रैकेट में डाल देते हैं अब मुझे क्या करना है गाइस यहां पर एक ब्रैकेट लगाना है अब इस ब्रैकेट के अंदर मुझे क्या करना है एप डॉट यहां पर ए क आरटी स्क्वायर रूट का इस्तेमाल करना है स्क्वायर रूट के अंदर एक ब्रैकेट लगाना है एंड देन प्लस करना है एंड देन ब्रैकेट लगाना है अब मुझे क्या करना है यहां पे गाइ स्क्वायर कर करना है किसका स्क्वायर करना है स्टैंडर्ड डेविएशन का स्क्वायर करना है पहले तो यस स्टैंडर्ड डेविएशन का स्क्वायर करना है तो मैं एक और ब्रैकेट लगा रहा हूं यहां पर जहां पे स्टैंडर्ड डेविएशन मल्टीप्लाई स्टैंडर्ड डिविजन लिखूंगा यहां पर डिवाइडेड बाय नंबर ऑफ सैंपल डाटा अब ये नंबर ऑफ सैंपल डाटा कितना है गाइज यहां पर तो मैं यहां पर क्या करूंगा लेन लिखूंगा और लेंथ ऑफ क्या कर रहा हूं गाइ यहां पर आफ्टर कर देता हूं यस ये हमारे पास आ गया अब इसी के अंदर भी एक और ब्रैकेट लगाएंगे गाइ यहां पर जहां पे स्टैंडर्ड डेविएशन ऑफ मैं b लिखने वाला हूं मल्टीप्लाई आपके पास क्या करूंगा स्टैंडर्ड डिविज ऑफ b लूंगा यहां पर एंड डिवाइड कर दें हम यहां पर किसे लेन ऑफ यहां पर किससे आपके पास गाइज बिफोर से यस किससे करेंगे बिफोर से करेंगे और यह हमारा t कैलकुलेटेड निकल चुका है चलिए टी कैलकुलेटर को हम कैलकुलेट करें तो ये आंसर कितना आया 2.06 आपके पास निकल के आया है और जो हमारी कैलकुलेट टेबल कैलकुलेटर है यहां पर वो कितनी है 2.9 आपके पास कैलकुलेटेड है चलिए अब हमारे पास यहां पर दोनों एविडेंस आ चुके हैं अब दोनों एविडेंस के ऊपर हम बात करते हैं ठीक है तो t टेबल की जो वैल्यू है यहां पर वो कैलकुलेट होके कितनी आई है यस जरा उसको देखें यहां पर तो जो कैलकुलेट होके आई है वो नहीं है यहां पर 2 पॉइंट के आसपास है 2.06 के आसपास है यस 2 आपका 06 के आसपास है और जो t टेबल की वैल्यू की बात करें गाइज यहां पर t टेबल की वैल्यू की बात करें तो t टेबल की वैल्यू कितनी निकल के आई है तो t टेबल की जो वैल्यू निकल के आई है वो 2.09 के आसपास आई है 2.09 के आसपास आई है चलिए अब हम यहां पर बात करते हैं कि हमारा ग्राफ कैसे बनेगा और किस तरह से हम यहां पे यूज़ करेंगे तो देखिए गाइज ये हमारा ग्राफ बन गया है यहां पर अब इसके अंदर बात करें यहां पर तो ये जो पॉइंट आया है यहां पर ये कितना है 2.09 है और इसके अकॉर्डिंग यहां पे क्या आएगा गाइज यहां पर यहां पे h0 आएगा और यहां पे क्या आएगा ए आने वाला है और अब हम बात करते हैं यहां पर कि आपके पास जो कैलकुलेटेड हो गया है 2.06 वो कहां आएगा तो वो यहां पे आने वाला है तो ये आने वाला है 2.06 यहां पे आने वाला है इसका मतलब क्या हुआ गाइज यहां पर इसका मतलब हुआ कि दोनों के बीच में कोई डिफरेंस नहीं है मतलब पहले यदि आपकी जो टाइपिंग स्पीड है और जो बाद में आपके पास है यहां पर टाइपिंग स्पीड वो आपके पास ऑलमोस्ट सेम है उनके बीच में कोई ज्यादा डिफरेंस नहीं देखने को मिला है क्योंकि देखिए 2.06 और 2.09 के अंदर डिफरेंस देखेंगे तो एक माइन्यूट सा डिफरेंस है 0.5 का इसका मतलब क्या हुआ गाइस यहां पर बेसिकली कि जो टेस्ट कंडक्ट हुआ है ये आपको क्या इंडिकेट करता है यहां पर ये आपको ये इंडिकेट करता है कि जो बिफोर ट्रेनिंग थी मतलब पेनिंग से पहले जो आपके पास जो स्पीड थी और ट्रेनिंग के बाद जो आपकी स्पीड आई है यहां पर उनके अंदर कोई मेजर डिफरेंस यहां पर देखने को नहीं मिला है यहां पर यस गा तो हमें ये चीजें यहां से देख मिली है और आज के इस वीडियो के जरिए हम यहां पर बात करने वाले हैं चाय स्क्वायर टेस्ट के बारे में कि ये किस सिचुएशन के अंदर अप्लाई होता है और इसका फार्मूला क्या है आज के इस वीडियो के जरिए हम इसे डिटेल के साथ देखने वाले हैं तो चलिए जरा अब इसे शुरू करते हैं देखिए चा स्क्वाड जो टेस्ट है यहां पर ये दो तरीके की सिचुएशन के अंदर अप्लाई होता है पहली जो सिचुएशन है यहां पर वो है आपके पास गुडनेस मतलब आपके पास किसी भी डाटा के अंदर आपको चेक करना है कि वो डटा सही है या फिर गलत है मतलब आपने जो भी डाटा रिकॉर्ड किया है यहां पर उस डाटा के रिकॉर्ड करने में कोई मिस्टेक्स तो नहीं हो गई है उस डेटा को जब हमने कैलकुलेट किया तब कोई मिस्टेक नहीं हो गई है इस चीज को देखने के लिए हम क्या करते हैं चाई स्क्वायर टेस्ट का इस्तेमाल करते हैं मतलब आपके पास क्या करते हैं आपके पास गुडनेस के बारे में यहां पर पता चलता है सेकंड चीज चाय स्क्वायर टस्ट का जो इस्तेमाल किया जाता है वो आपके पास क्या आ जाता है आपके पास इंडिपेंडेंस के ऊपर मतलब आपके पास कोई दो डाटा जो है यहां पर वो एक दूसरे के ऊपर डिपेंड कर रहा है या नहीं कर रहा है इस चीज को पता लगाने के लिए भी हम क्या करते हैं यहां पर आपके पास चा स्क्वायर टस्ट का इस्तेमाल करते हैं मतलब आपके से यहां पर एक तो करते हैं हम यहां पर फिटनेस ऑफ गुडनेस के ऊपर एंड सेकंड चीज हम यहां पर करते हैं आपके पास डाटा की इंडिपेंडेंस के ऊपर चलिए अब जरा इसे वन बाय वन इसे समझते हैं कि ये किस तरह से किस सिचुएशन के अंदर कैसे अप्लाई होता है राइट इससे पहले हम क्या करेंगे चा स्क्वा टेस्ट के फॉर्मूला के बारे में देख लेते हैं कि चा स्क्वा टेस्ट का फॉर्मूला क्या होता है गाइ यहां पर तो यदि हम चा स्क्वा टेस्ट के सिंबॉलिक फॉर्म के अंदर बात करें तो चा स्क्वा टा इसको सिंबॉलिक तरीके से हम इस तरह से लिख सकते हैं और इसका जो फॉर्मूला होता है वो होता है समेशन ऑफ oii.com एक्सेप्टेड वैल्यू एक्सेप्टेड वैल्यू मतलब आपके पास जो ओरिजिनल डाटा मतलब आपके पास यदि मैं नेचर के अंदर इस वर्क को इस तरह से अप्लाई करूं तो आपके पास ओरिजिनल डाटा हमें क्या गेट होगा दैट इज कॉल्ड ऑफ e आई एंड जो o आ है गाइज यहां पर दैट इज द ऑब्जर्वेशन वैल्यू मतलब हमें यहां पर क्या कैलकुलेट करके हमने लिखा है दैट इज कॉल्ड ऑफ ऑब्जर्वेशन वैल्यू ये हमें यहां पर देखने को मिलता है तो दैट इज आवर चा स्क्वायर टेस्ट फॉर्मूला अब हम इसे अप्लाई करने वाले हैं अब अप्लाई किसके ऊपर करेंगे गाइज यहां पर तो सबसे पहले हम बात करेंगे गुडनेस के ऊपर मतलब कि हमारा जो डाटा है यहां पर वो हमने सही तरीके से कलेक्ट किया या नहीं किया या फिर हम जो डाटा कलेक्ट कर रहे जिस इक्वेंस के ऊपर वो सही है या नहीं है इस चीज को पता लगाते तो चलिए चा स्क टेस्ट का जो फर्स्ट क्वेश्चन है उसे हम देखते हैं यहां पर तो ये जो फर्स्ट क्वेश्चन है गाइस यहां पर ये आपके पास क्या किसके ऊपर है ये डाई के ऊपर है अब आप सभी ने लूडो खेला होगा तो लूडो के जो डाई होता है यहां पर उसको हमने क्या किया गाइ यहां पर 120 टाइम हमने क्या किया रोल किया अब रोल करने पर हमें डिफरेंट डिफरेंट सिचुएशन हमें देखने को मिली होगी अब आप सबको पता है कि जो लूडो है यहां पर यदि हम उसे रोल करते हैं रोल करने का मतलब क्या है यहां पर उसे थ्रो करते हैं यहां पर तो आपके पास क्या होता है हमारे पास सिक्स नंबर में से को कोई भी एक नंबर आता है 1 2 3 4 5 6 में से कुछ भी एक नंबर आपके पास आ सकता है अब इसे 120 टाइम यदि हम रोल करेंगे तो अकॉर्डिंग टू यदि हम आइडियल डेटा के ऊपर चले या अकॉर्डिंग टू हमारे पास जो डाई है वो डाई एकदम हर हर सिचुएशन के अंदर परफेक्ट है यहां पर तो उस समय आपके पास जितने भी फेसेस हैं उन फेसेस की वैल्यू जो है वो इक्वल आनी चाहिए इन द सेंस मतलब यदि मैं यहां पर आपके पास एक्सेप्टेड वैल्यू की बात करूं तो हर वक्त आपके पास क्या आनी चाहिए 2020 आपके पास आनी चाहिए मतलब यहां पे भी 20 आनी चाहिए यहां पे भी 20 आनी चाहिए यहां पे भी 20 आनी चाहिए और इस जगह पे भी 20 आपके पास आनी चाहिए बट हमने जो रिजल्ट कैलकुलेटेड किया है वो हमें यहां पर मिला है कि फेस वन जो है वो 22 टाइम्स है फेज टू जो है वो 17 टाइम्स है फेस थ्री है वो 20 टाइम्स है फेज फोर जो है वो 26 टाइम है फेज फाइव जो है वो 22 टाइम्स है फेज सिक्स जो है गाइ यहां पर वो कितना है 30 टाइम्स है यहां पर तो हमने ये सारे डाटा जो है हमने कैलकुलेटेड कर लिए कैलकुलेटेड करने के बाद में हमें यहां पे लिखा है कि टेस्ट एट द 5 पर ऑफ द सिग्निफिकेंट लेवल टेक्स्ट हमें क्या करना है 5 पर ऑफ सिग्निफिकेंट लेवल पे करना है वेदर द डाइस इज फेयर ये बोल रहे हैं डाइस क्या है यहां पर फेयर है अब यहां पर क्या बता गया है गाइ यहां पर डाइस फेयर है अब हमें यहां पे प्रूफ करना है कि डाइस फेयर है या फिर अनफेयर है मतलब ये जो आपके पास कैलकुलेटेड जो डाटा आपके पास आया है इसके हिसाब से हमें बताना है कि डाइस हमारा फेयर है या फिर अनफेयर है तो मतलब हमें यहां पर h0 और ए की वैल्यू को फाइंड आउट करना है तो बहुत ही सिंपल तरीके से हम यहां पर h न और h की वैल्यू को फाइंड आउट कर सकते हैं h न क्या होगा गाइ यहां पर h न सिंपल सा हो जाएगा यहां पर डाइस इज फेयर यस डाज क्या है हमारा यहां पर फेयर है यहां पर और ए जो हम यहां पर प्रूव करेंगे वो क्या है यहां पर डाई इज नॉट फेयर तो ये हमने ए और h0 की वैल्यू जो है हमने फाइंड आउट कर ली है अब हमें पता है कि जो हमारा डाटा है वो क्या है हमारे पास गाइज नॉर्मल डिस्ट्रीब्यूटर कर्व के ऊपर है तो हमने नॉर्मल डिस्ट्रीब्यूटर कर्व बना लिया है अब सिग्निफिकेंट लेवल कितना बोला गया है गाइज यहां पर 0.05 बोला गया है यहां पर तो 0.05 के अकॉर्डिंग मैं यहां पे चलूंगा ओके 0.05 के अकॉर्डिंग चले तो दैट 0.05 हमारे पास हो जाएगा तो इसके ऊपर हमें क्या करना है चा स्क्वायर वैल्यू निकालनी है चा स्क्वायर टेबल से हमें यहां पे वैल्यू फ आउट करनी है तो चलिए चा स्क्वायर वैल्यू के हिसाब से टेबल की वैल्यू को फाइंड आउट करते हैं यहां पर तो अब हम यहां पे आ चुके हैं और मुझे यहां पर क्या करना है चा स्क्वायर टेबल निकालना है यस मैं चा स्क्वायर टेस्ट की जो टेबल है यहां पर या चा स्क्वायर टेबल को लिख लेता हूं यहां पर कि चा स्क्वायर टेबल निकालना है जिससे हम क्या करेंगे हमारे टेबल की वैल्यू निकालेंगे और टेबल की वैल्यू से हमें हमारा कॉन्फिडेंस इंटरवल हमें मिल जाएगा च स् वैल्यू मिल जाएगी हमरे पास तो चलिए च स्क्वा वैल्यू हमारे पास आ चुकी है और मैं इसे यहां पर ओपन कर देता हूं अब गाइस यहां पे बात करें इस टेबल के अंदर तो टेबल हमारे पास यहां पे आ गई है और इस टेबल के ऊपर टेबल हमारे पास पूरी नहीं आई है तो हम कोई और वेबसाइट ले लेते हैं जहां पे हमें हमारी जो टेबल है वो देखने को मिल जाए प्रॉपर्ली तरीके से तो हम ये इस्तेमाल कर लेते हैं इसके अंदर हमारा चा स्क्वा टेस्ट की टेबल जो है हमें दिख जाएगी प्रॉपर ठीक है और हम इसका यूज कर पाएंगे चलिए तो मैं यहां पर आता हूं ओके हमें हमारी चा स्क्वा टेस्ट की टेबल चाहिए तो मेरे पास चा स्क्वा टेस्ट की टेबल यहां पे आ चुकी है और ये रही हमारी चा स्क्वा टेस्ट की टेबल ओके च स्क्वा टेस्ट की टेबल के अंदर ये रहा हमारा अल्फा की वैल्यू 0.05 यहां पे अब यहां पे पूछा जा रहा है डिग्री ऑफ फ्रीडम मतलब हमारे पास डिग्री ऑफ फ्रीडम भी चाहिए गा तो डिग्री ऑफ फ्रीडम की बात करें यहां पर df-41 यहां पर कितना है n कितना है यहां पे गाइज तो n हमारे पास सिक्स है तो 6 - 1 6 - 1 हो जाएगा गाइज यहां पर और 6 - 1 इक्वल टू कितना हो जाएगा गा यहां पर फव हो जाएगा तो फाइव के ऊपर हमारे पास च स्क्वा टेस्ट की टेबल की वैल्यू निकालनी है तो 0.05 के ऊपर आ गए यहां पर और ये रहा हमारा फाइव और फाइव के ऊपर वैल्यू कितनी आई है गाइज यहां पर 11 आई है तो मैं यहां पर च स्क्वा की वैल्यू लिखूं यहां पर तो दैट अ 11 पॉइंट यस ये कितना है गाइज यहां 11.07 यस 11.07 हमारे पास कैलकुलेटेड ओके हमारे पास आ गई है अब हमें क्या करना है यहां पर ये तो हो गई हमारी किसकी च स्क्वायर टेस्ट के टेबल की वैल्यू हमारे पास आई है अब हमें क्या करनी है कैलकुलेटेड करनी है कैलकुलेटेड मतलब हमें यहां पर चाई कैलकुलेटेड की वैल्यू निकालनी है यहां पर और चाई कैलकुलेटेड की वैल्यू क्या है गाइज यहां पर समेशन ऑफ यस समेशन ऑफ आपके पास क्या होगा गाइ यहां पर आपके पास ऑब्जर्वेशन वैल्यू माइनस एक्सेप्टेड वैल्यू का होल स्क्वायर डिवाइडेड बाय एक्सेप्टेड वैल्यू है यस यदि मैं फार्मूला आपको दिखाऊं तो देखिए ऑब्जर्वेशन वैल्यू माइनस एक्सेप्टेड वैल्यू का होल स्क्वायर डिवाइड बाय आपके पास क्या होगा एक्सेप्टेड वैल्यू आपको देखने को मिल जाएगी तो ये रहा हमारा फार्मूला अब इस फॉर्मूले के ऊपर हम क्या करने वाले हैं इस वैल्यू को कैलकुलेटेड करने वाले हैं चलिए कैलकुलेटेड करते हैं तो इसके लिए मैं python.py को ओपन कर लेता हूं तो ये रहा हमारे पास अन टाइटल के नाम से हमने एक python-pip करना है यहां पर हमारी ऑब्जर्वेशन लेन है तो ओ के नाम से मैं ऑब्जर्वेशन वैल्यू ले रहा हूं और ऑब्जर्वेशन वैल्यू कितनी आ रही है गाइस यहां पर 22 और उसके बाद आ रहा है 17 17 के बाद में आ रहा है 20 20 के बाद में 26 और 26 के बाद 22 एंड 13 तो ये सारी मेरी ऑब्जर्वेशन वैल्यू आ गई है यहां पर अब एक्सेप्टेड वैल्यू की बात करूं यहां पर तो एक्सेप्टेड वैल्यू कितनी है हर जगह 20 है तो मैं 20 20 20 एंड देन 20 एंड देन 20 एंड देन 20 रखूंगा यहां पर तो ऑब्जर्वेशन वैल्यू और एक्सेप्टेड वैल्यू आ चुकी है अब हम क्या करेंगे इन दोनों को एरे बना लेते हैं एक काम करते हैं इन दोनों को क्या करते हैं एरे बना लेते हैं एप डॉट यहां पर मैं एरे का इस्तेमाल करूंगा यहां पर और एरे के अंदर यहां ब्रैकेट लगा देते हैं और यहीं पे भी क्या कर रहा हूं गाइज यहां पर एप डॉट मैं यहां पर एरे का इस्तेमाल करूंगा और यहां पे भी मैं ब्रैकेट लगा लेता हूं चलिए अब जो पीछे हैं इनको भी ब्रैकेट से क्लोज कर देते हैं दोनों को एरे बना लेते हैं एरे बनाने से हमारा काम बहुत आसान हो जाएगा यहां पर क्यों आसान हो जाएगा क्योंकि देखिए ऑब्जर्वेशन वैल्यू लेनी है मुझे यहां पर सबट करना है एक्सेप्टेड वैल्यू से और मैं जैसे ही रन करूंगा तो देखिए आपके पास 22 - 20 करेंगे तो टू आ गया 17 - 20 करेंगे माइनस का 3 भी आ गया 20 - 20 करेंगे 0 26 - 20 6 22 - 20 कॉल ऑफ 2 एंड 13 - 20 इज -7 तो डायरेक्ट वैल्यू आ चुकी है यहां पर अब मुझे इसका स्क्वायर करना है तो मैं बहुत ही आसानी से स्क्वायर कर सकता हूं एप डॉट यहां पर क्या करूंगा स्क्वायर लगाऊंगा स्क्वायर लगाने से रन करूंगा तो सारी स्क्वायर वैल्यू मिले आ जाएगी अब स्क्वायर वैल्यू आने के बाद में मुझे डिवाइड करना है किससे डिवाइड करना है यहां पर एक्सेप्टेड वैल्यू से डिवाइड करना है मैं एक्सेप्टेड वैल्यू से डिवाइड करूंगा तो मेरी सारी वैल्यू आ गई अब मुझे इस सब का क्या करना है सम करना है सम करने के लिए मैं क्या करूंगा गाइज यहां पर np0 पर सम फंक्शन का इस्तेमाल करूंगा जैसे ही मैं रन करूंगा तो सम की जो वैल्यू आई है गाइ यहां पर वो कितनी आई है 0.5 निकल के आई है यस 0.5 निकल के आ गई है यहां पर अब हम यहां पर हमारी वैल्यू को कैलकुलेटेड करते हैं ओके तो मेरे पास जो आपके पास कैलकुलेटेड वैल्यू आई है यस मैं क्या कर रहा हूं यहां पे गाइस कैलकुलेटेड जो वैल्यू आई है मतलब चाई कैलकुलेटेड की जो वैल्यू आई है यहां पर यस वो कितनी आई है 0 5.0 आई है यस हमारे पास कितनी आई है गाइज यहां पर 5.1 आ गई है ओके चलिए तो 5.1 आपके पास आ गकी है अच्छा h0 क्या कह रहा है गाइज यहां पर h नॉट कह रहा है डाइस इज फेयर और एच क्या कह रहा है गाइज यहां पर ए बोल रहा है डाइस इज अनफेयर डाइस आपके पास फेयर नहीं है अच्छा चा स्क्वा की वैल्यू कितनी आई है 5.1 तो हमारे पास यहां पे 5.1 आ गई यहां पर अब देखिए गाइज यहां पे बात करें तो h0 जो है यहां पर यस 5.1 आई है चा स्क्र की वैल्यू और जो चा स्क्वा की वैल्यू आपके पास 5.1 आई है वो गाइज यहां पर क्या आएगी इस जगह पर आएगी यस कहां पे आने वाली है गाइज यहां पर इस जगह पे इस पॉइंट पे हमारे पास आने वाला है दैट अ 5.1 यस क्योंकि आपके पास 11.07 से छोटा ही होता है अब 11.07 के हिसाब से छोटा होता है तो इसका मतलब क्या हुआ गाइज यहां पर कि हमारा जो h नॉ है वो सही है यहां पर और ए जो है वो गलत है इसका मतलब हमारे पास इनफ एविडेंस नहीं है यहां पर कि हमारे पास जो डायक है वो अनफेयर है तो बेसिकली हम यहां पे ये कह सकते हैं कि जो हमारा डाय है यहां पर वो आपके पास क्या है एक फेयर कंडीशन के अंदर वर्क कर रहा है मतलब हमारा जो डाइस है यहां पर वो क्या है एकदम फेयर है यहां पर ओके हमने यहां पे कैलकुलेटेड किया है चलिए अब हम हमारे यहां पर नेक्स्ट क्वेश्चन के ऊपर बढ़ते हैं नेक्स्ट क्वेश्चन आपके पास है यहां पर एसोसिएशन के बीच में एसोसिएशन का मतलब क्या है गाइज यहां पर दोनों के बीच में कोई रिलेशनशिप है या नहीं है इस चीज के बारे में पता कर रहे हैं यहां पर क्या लिखा है यहां पर अ स्टडी वाज कंडक्ट अब यहां पर एक स्टडी कंडक्ट की गई है टू इन्वेस्टिगेट यहां पर इन्वेस्टिगेट किया गया है द रिलेशनशिप बिटवीन जेंडर एंड परफॉर्मेंस ऑफ द जनर ऑफ म्यूजिक अब यहां पर क्या है कि एक जेंडर मतलब जेंडर का आपके जो प्रेफरेंस है यहां पे म्यूजिक के बीच में इसके बीच में इन्वेस्टिगेशन किया गया है और कितने पीपल के ऊपर इन्वेस्टिगेशन किया गया है यहां पर गाइज यहां पर 235 पीपल्स के ऊपर इन्वेस्टिगेट किया गया यहां पर सिलेक्टेड किया गया है डाटा कलेक्ट किया गया है और 5 पर सिग्निफिकेंट लेवल यहां पर है और लिखा है देयर इज अ सिग्निफिकेंट एसोसिएशन बिटवीन जेंडर एंड म्यूजिक ब फ्रेंट मतलब जेंडर और म्यूजिक प्रेफरेंस के बीच में कोई एसोसिएशन है या नहीं है एसोसिएशन का मतलब बेसिकली गाइ यहां पर कोई कनेक्शंस है यहां पे नहीं है ये चीज हमें पता लगाना है तो चलिए इस तरह का जब भी हमारे पास डाटा आ है तो सबसे पहले हमें क्या करना है यहां पर h0 और h का पता लगाना है तो h नॉ क्या होगा गाइज यहां पर h नॉ बोलेंगे यहां पर कि इन दोनों के बीच में कोई भी एसोसिएशन नहीं है हम ये बोलेंगे इन दोनों के बीच में कोई एसोसिएशन नहीं है यहां पर तो हम यहां पे बोलेंगे नो एसोसिएटेड यस हम क्या बोलने वाले हैं गाइज यहां पर नो एसोसिएशन यहां पर मैं लिखने वाला हूं यहां पर बेसिकली और एच ए क्या बोलेगा गाइज यहां पर एच ए बोलेगा यहां पर इन दोनों के बीच में एसोसिएट है यहां पर ये दोनों एसोसिएशन है यहां पर बेसिकली ये आ च बनने वाला है यहां पर अब सिग्निफिकेंट लेवल आपके पास 0.05 दे रखा है यहां पर इसका मतलब अल्फा की वैल्यू आपके पास क्या आ गई 0.05 आई है यहां पर अच्छा डिग्री ऑफ फ्रीडम की बात करें यहां पर पहले डिग्री ऑफ फ्रीडम की बात करें तो डिग्री ऑफ फ्रीडम निकालने से पहले हम यहां पे क्या करेंगे डिग्री ऑफ़ फ्रीडम की वैल्यू बता देता हूं यहां पर आपके पास क्या होगा रो -1 एंड उसके बाद क्या आएगा गाइज यहां पर कॉलम -1 आपके पास आने वाला है इस जगह पे डिग्री ऑफ फ्रीडम क्या होगा रो -1 ंट कॉलम -1 आपके पास यहां पर आने वाला है अच्छा रो कितनी है गाइज यहां पर दो है तो यहां पे क्या आएगा 2 - 1 आपके पास आ जाएगा और कॉलम कितना है गाइज यहां पर 1 2 3 4 है यहां पर तो बेसिकली 4 - 1 आ जाएगा अच्छा 2 - 1 कितना हो गया वन और 4 - 1 हो गया आपके पास थ्री तो यहां पर बेसिकली डिग्री ऑफ़ फ्रीडम की वैल्यू कितनी आएगी गाइज यहां पर थ्री आपके पास आने वाली है राइट तो हमने ये चीज निकाल दिया यहां पर अब यहां पर बात करें बेसिकली कि आपके पास चा स्क्वा टेबल की वैल्यू कितनी होगी यस पहले हम चा स्क्वायर टेबल की वैल्यू निकाल लेते हैं यहां पर फ्री हो जाता है उससे तो चा स्क्वा टेबल की वैल्यू निकालते हैं यहां पर तो उसके लिए मैं ले चलता हूं आपको आपके पास कम ब्राउजर के अंदर जहां पे हम चा स्क्वा टेबल की वैल्यू निकालेंगे अब चा स्क्वा टेबल की वैल्यू की बात करें तो चा स्क्वा टेबल की वैल्यू यहां रही और सिग्निफिकेंट लेवल कितना है गाइ यहां पर 0.05 है यहां पर डिग्री ऑफ फीडम की बात करें वो कितना है थ्री है तो डिग्री ऑफ फ्रीडम थ्र और आपके पास सिग्निफिकेंट लेवल 0.05 की वैल्यू के हिसाब से 7 85 आपके पास आने वाला है 7 7.81 आपके पास आने वाला है तो 7.81 तो मैं यहां पे च स् टेबल की बात करूं यहां पर तो 7.81 आपका ऐसा आने वाला है ओके तो हमने h और ए नॉट और ए की वैल्यू यहां पे निकाल ली है अल्फा की वैल्यू डिसाइड कर ली है डिग्री ऑफ फ्रीडम हमने निकाल लि है यहां पर अब चाई टेबल की वैल्यू भी निकाल ली है अब हमारी बारी है यहां पर चाई स्क्वायर कैलकुलेटेड की तो मैं चाई कैलकुलेटेड की वैल्यू की बात करूंगा यहां पर अब मेन पॉइंट यहां पे आता है कि गाइस जो हमारा फार्मूला है उस फॉर्मूले के अंदर क्या है गाइज यहां पर ् ् वेशन वैल्यू है और एक्सेप्टेड वैल्यू है अच्छा ऑब्जर्वेशन वैल्यू की बात करें तो ऑब्जर्वेशन वैल्यू तो हमें यहां पर दे रखी है एक्सेप्टेड वैल्यू कैसे निकाली जाएगी तो एक्सेप्टेड वैल्यू निकालने का जो तरीका है वो मैं आपको समझा रहा हूं यहां पर देखिए क्या हो रहा है देखिए हमें क्या करना है यहां पर सम ऑफ यहां पर इस रो को निकालना है मतलब ये जो रो है यहां पर इसको मैं r1 दे देता हूं तो आपको क्या करना है सम ऑफ आपके पास क्या करना है r1 करना है और आपको क्या करना है सम ऑफ आपको क्या करना है r2 करना है इसी तरह से सम ऑफ आपके पास क्या करना है गाइज यहां पर आपके पास यहां पे कॉलम वन करना है यहां पर और सम ऑफ यहां पर वापस आप क्या करेंगे कॉलम टू निकालेंगे सम ऑफ आप क्या करेंगे गाइज यहां पर आपके पास कॉलम थ्री निकालेंगे और सम ऑफ यस मैं बात करूं यहां पर सम ऑफ आपके पास क्या करना है कॉलम फोर निकालना है इस तरह से सबका सम निकल गया सम निकलने के बाद में यदि मुझे यहां पर इस पर्टिकुलर वैल्यू की एक्सेप्टेड वैल्यू चाहिए राइट तो वो कैसे निकाली जाएगी तो बहुत ही सिंपल तरीके से निकाल जाएगी आपके पास जो सम ऑफ आपके पास कॉलम वन है इसको मल्टीप्लाई करेंगे य मैं इस फॉर्मूले को थोड़ा सा बाहर निकाल देता हूं यहां पर क्या कर रहे हैं यहां पर सम ऑफ कॉलम वन मल्टीप्लाई आपके पास क्या होगा सम ऑफ कॉलम टू टू सम ऑफ कॉलम सम ऑफ आपके पास क्या होगा रो वन डिवाइडेड बाय आपके पास क्या हो जाएगा गाइज यहां पर डिवाइडेड बाय आपके पास टोटल नंबर ऑफ सैंपल यस नंबर ऑफ आपके पास क्या होगा यहां पर सैंपल डेटा आ जाएगा यस नंबर ऑफ क्या होगा सैंपल डेटा आपके पास आ जाएगा तो इस तरीके से आप क्या कर सकते हैं गाइ यहां पर आप यहां पर इसकी एक्सेप्टेड वैल्यू फाइंड आउट कर सकते हैं क्या करना है आपके पास गाइज यहां पर इसको लेना है इसको लेना है एंड देन डिवाइड करना है फिर इस पॉइंट के लिए क्या होगा इसको लेना है एंड इसको लेना है और डिवाइड कर देना है इसके लिए क्या होगा गाइज यहां पर इसको लेना है एंड देन इसको लेना है फिर डिवाइड कर देना है अब मैं बात करूं इसके लिए तो इसको लेना है एंड इसको लेना है एंड डिवाइड बाय कर देना है सिंपल सा आपके पास यहां पे हो जाएगा यस तो चलिए अब वन बाय वन इसे कैलकुलेट करते हैं और फिर मैं वन बाय वन तरीके से आपको समझाऊ कि कैसे क्या होने वाला है ठीक है अब इसको कैलकुलेट करने के लिए मैं pythonanywhere.com कर्नल को क्या कर रहा हूं गाइस यहां पर रीस्टार्ट कर देता हूं हमारे कर्नल को ताकि हमारे पास कोई प्रॉब्लम ना आए तो मैं रीस्टार्ट कर्नल को इस्तेमाल कर रहा हूं यहां पर ताकि हमारा कर्नल वापस रिसेट हो जाए और हम स्टार्टिंग से हमारा जो काम है वो स्टार्ट कर सके चलिए अब हम क्या करें पहले तो इसे रन कर देते हैं ओके अब हमें क्या करना है गाइस यहां पर ये जो हमारे टेबल बनी है ये टेबल हमें यहां पे बनानी है कुल मिला के हमरे क्या करना है हमें यहां पे टेबल बनानी है चलिए टेबल बना लेते हैं यहां पर तो टेबल मैं क रहा हूं दो अलग-अलग तरीके से बना रहा हूं यहां पर मतलब पहली रो अलग ले रहा हूं और दूसरी रो अलग ले रहा हूं ताकि काम हम आराम से कर सके तो मैं यहां पे कर रहा हूं रो आपके पास यस मैं रो व ले रहा हूं यहां पर और रो वन के लिए एप डॉट मैं कर रहा हूं यहां पर एरे का इस्तेमाल कर रहा हूं यस एपी डॉट एरे का इस्तेमाल किया और एरे के अंदर मैं बात करूं मैं कर रहा हूं 40 45 25 कमा एंड 10 ले रहा हूं एंड अब मैं बात कर रहा हूं रो टू के बारे में तो मैं गाइज यहां पर रोटू ले रहा हूं यहां पर और उसके अंदर एप डॉट मैं कर रहा हूं गाइस यहां पर एरे का इस्तेमाल करूंगा और एरे का इस्तेमाल करने के बाद में मैं क्या करने वाला हूं गाइस यहां पर 35 कॉमा 30 एंड देन कॉमा उसके बाद आगा 20 एंड आपके पास आ जाएगा 30 तो ये रो वन एंड रो टू मैंने यहां पर डिसाइड कर लिए अच्छा यहां पर टोटल नंबर ऑफ काउंटिंग देखिए यहां पर तो सम ऑफ क्या सम ले रहा हूं यहां पर किसका सम ले रहा हूं यहां पर आपके पास अच्छा सम किसका करना है गाइज यहां पर n p डॉट यदि मैं यहां पर सम फंक्शन का इस्तेमाल करूं और किसका कर रहा हूं यहां पे गाइस रो वन का कर रहा हूं यस क्या कर रहा हूं रो वन कर रहा हूं तो 120 प्लस साइन के साथ यस मैं एप डॉट यहां पर सम ऑफ यहां पर रो टू का कर रहा हूं यहां पर क्या कर रहे हैं यहां पे गाइ रो टू कर रहे हैं यहां पर रन करें तो 135 आ रहा है और जो कि हमारे पास सिंपल पीपल है यहां पर ओके तो पहले मैंने यही कैलकुलेटेड किया चलिए अब मुझे क्या करना है यहां पर मेरी एक्सेप्टेड वैल्यू निकालनी है मेरी ऑब्जर्वेशन वैल्यू तो ये रही हमारे पास दोनों ऑब्जर्वेशन वैल्यू आ गई अब एक्सेप्टेड वैल्यू निकालनी है एक्सेप्टेड वैल्यू से निकालने से पहले मुझे क्या करना है सम ऑफ रो चाहिए सम ऑफ रोटू प चाहिए उसके बाद कॉलम वन और कॉलम टू कॉलम थ्री कॉलम फोर तीनों के सम चाहिए तो मैं एक काम करता हूं यहां पर आपके पास देखिए सम अंड r1 ले रहा हूं यहां पर रोव ले रहा हूं ये कैसे निकलेगी यहां पर तो मैं n प डॉट यस एप डॉट यहां पे क रहा हूं सम फंक्शन का इस्तेमाल माल करूंगा एप सम फंक्शन के अंदर मैं कर रहा हूं गाइ यहां पर रोव जो हमारा है यहां पर उसको ले रहा हूं तो ये हमारा कैलकुलेट हो गई है यहां पर सम ऑफ यहां पे मैं यहां पे क्या कर रहा हूं सम ऑफ अंड r2 ले रहा हूं यहां पर है ना r2 ले रहा हूं यहां पर और n प डॉट एप डॉट क्या कर रहे है गाइ यहां पर सम ऑफ यहां पे क्या करेंगे गाइस यहां पर रोटू का इस्तेमाल करेंगे टन करते हैं तो दोनों का सम आ चुका है यहां पर देखिए यहां पर सम ऑफ r1 यस सम ऑफ r1 सम ऑफ r2 का इस्तेमाल करेंगे राइट और रन करेंगे तो देखिए 120 ऊपर का है और 115 है मतलब इन सब का सम कितना आएगा 120 आ रहा है और इन सब का सम कितना आ रहा है 120 आ रहा है तो रो का सम हमारे पास आ गया है अब मुझे क्या करना है गाइज यहां पर कॉलम का सम चाहिए कॉलम का सम कैसे चाहिए गाइज यहां पर इन दोनों का सम मुझे चाहिए यहां पर तो मुझे यहां पे कॉल सम चाहिए तो कॉल अंडरस्कोर या सम अंडरस्कोर कॉल कर देते हैं यहां पर यस क्या कर रहा हूं सम अंडरस्कोर मैं कॉल का इस्तेमाल कर रहा हूं राइट तो एप डॉट यहां पर मैं सम का इस्तेमाल करूंगा यहां पर जहां पे रोव यस जहां पे मैं क रहा हूं गाइ यहां पर रोव कॉमा आपके पास रो टू का इस्तेमाल करेंगे यहां पर राइट और उसके बाद सम ऑफ कॉल को इस्तेमाल करें यहां पर यस सम ऑफ कॉल का इस्तेमाल करें और रन करें जस्ट मिस्टेक हो गई यहां पर ओके तो मैं यहां पे क्या कर रहा हूं रो 1 प् रोट करूंगा यहां पर ट्स अ मिस्टेक रो 1 प् रोट करना था मुझे यहां पर नॉट इंटरनली सम करना था मुझे ओके रो 1 प् √2 करें तो हमारे पास आ गया देखिए 40 + 35 इज कॉल ऑफ 75 45 + 30 75 25 + 20 इज 45 45 एंड देन 10 प्लस आपके पास 30 इज कॉल 40 तो हमारे पास कॉलम सम भी हमारे पास आ चुका है एंड एंड रो सम की बात करें तो वो भी हमारे पास आ गया है यस मैं आपको दिखा देता हूं सम ऑफ रो एंड सम ऑफ कॉलम का दिखा दूं यहां पर ताकि आपको थोड़ा सा ध्यान रहे कि सम ऑफ रो एंड सम ऑफ रोटू जो है यहां पर वो क्या है ओके दोनों वैल्यू आ चुकी है अब मुझे क्या करना है इसकी एक्सेप्टेड वैल्यू निकालनी है इसकी एक्सेप्टेड वैल्यू निकालनी है इसकी एक्सेप्टेड वैल्यू निकालनी है इसकी एक्सेप्टेड वैल्यू निकालनी है अच्छा इसकी एक्सेप्टेड वैल्यू कैसे निकालेंगे गाइज यहां पर इट्स अ 75 इज मल्टीप्ला बाय 120 इज मल्टीप्ला बाय 120 एंड डिवाइडेड बाय क्या करना है गाइज यहां पर टोटल नंबर ऑफ सैंपल इज कॉल्ड ऑफ 1 2 35 यस इस तरह से हमें यहां पर क्या करनी है वैल्यू निकालनी है अब ये वैल्यू कैसे निकालेंगे इसको जरा समझते हैं यहां पर तो इट्स अ वेरी सिंपल टास्क इट्स अ वेरी सिंपल टास्क क्या करना है गाइ यहां पर देखिए मुझे क्या करना है यहां पर इस 120 को यस इस 120 को इसके साथ भी करना है इस 120 को इसके साथ भी करना है इस 120 को इसके साथ भी करना है इस 120 को इसके साथ भी करना है मतलब तीनों के साथ करना है यहां पर उसके बाद में इस वन 115 को क्या करना है यहां पर इन सब के साथ प फिर से मल्टीप्लिकेशन करना है तो मतलब मुझे इन दोनों को यहां पर रिपीटेशन के तौर पे लगाना है राइट तो मैं एक काम करता हूं गाइज यहां पर इन दोनों का एक एरे बना लेते हैं सिंपल सा दोनों का एरे बना लेते हैं यहां पर ठीक है तो मैं सम अंडरस्कोर यहां पर रो का इस्तेमाल करूंगा एंड यहां पे क्या करूंगा एप डॉट क्या करूंगा एरे का इस्तेमाल कर दूंगा यस एप डट एरे का इस्तेमाल किया यहां पर और ये एप ड एरे करके मैंने सम ऑफ रो निकाल दिया यहां पर यस क्या निकाला यहां पर सम अंडरस्कोर मैंने रो का इस्तेमाल कर लिया ये सम अंडरस्कोर रो आ गया ओके इन दोनों को मुझे एरे बनाना था तो मैं इन दोनों को क्या करता हूं गाइज यहां पर एरे बना देता हूं और रन कर देता हूं ओके अब मुझे क्या करना है गाइज यहां पर पहले ये वाला जो टर्म है वो बारबार रिपीट होगा तो मैं एक काम काम करता हूं एक फोल्ड रूप लगाता हूं कि फॉर आई ए यहां पर क्या करेंगे गाइज यहां पर सम अंडर रो का इस्तेमाल करेंगे यस सम अंडर रो का इस्तेमाल करेंगे यहां पर तो ये रो क्या होगी गाइज यहां पर वन बाय वन आती रहेगी कैसे देखो प्रिंट ऑफ यहां पर यदि मैं आई करूं तो मेरे पास रो आ गई 120 और 115 ओके अब मुझे क्या करना है गाइ यहां पर मुझे व सम ऑफ कॉलम चाहिए है ना तो मैं यहां पे एक और फोल्ड लगा रहा हूं फॉर जे इन यस क्या करेंगे यहां पर गाइस सिंपल सा सम अंडरस्कोर क्या करेंगे कॉल का कॉल करेंगे यस सम अंडरस्कोर क्या करूंगा गाइज यहां पर कॉल को कॉल करूंगा एंटर अब देखिए मैं प्रिंट ऑफ क्या कर रहा हूं यहां पर जे आ और ज कर रहा हूं यहां पर आ ज करें यहां पर तो देखिए 120 के साथ 75 120 के बाथ 75 120 के साथ 45 120 के साथ 40 फिर 115 के साथ सब कुछ कडिट आ गया चलिए वेरी वेरी सही बहुत ही सही जा रहा है हमारा डटा यहां पर अब मुझे क्या करना था हमारी एक्सेप्टेड व निकालना था तोस के नाम से यहां पर रिबल बना लेता हूं और इसे लेस्ट में सेव कर लेते हैं चलिए अभी मुझे क्या करना है एक्स का वैल्यू निकालनी है तो मैं यहां पर वैल्यू के नाम से एक वेरिएबल बना देता हूं मैं यहां पे वैल्यू के नाम से एक वेरिएबल बना लेता हूं यहां पर और वैल्यू कैलकुलेटेड कर रहे हैं यहां पर कैसे देखिए मुझे i को मल्टीप्लाई करना है j के साथ और मुझे इस कम को डिवाइड करना है किससे डिवाइड करना है 235 से ओके ये वैल्यू आ गई है इसको हमें क्या करना है सेव करना है एकस डॉट क्या करेंगे यहां पर अ पंड करेंगे यस एक्ड अपेंड करेंगे अपेंड के अंदर क्या डालेंगे गाइस यहां पर ये जो वैल्यू है इसे अपेंड कर देंगे चलिए हमारी एक्स प की वैल्यू आ चुकी है सभी की कैसे यहां पर की वैल्यू देखें तो देखिए ् की वैल्यू हमारे पास सभी की आ चुके है तो हमारे पास एक्सेप्टेड वैल्यू आ चुकी है अब हमारे पास ऑब्जर्वेशन वैल्यू भी चाहिए तो ये दो एरे हैं इन दोनों एरे को हमें एक साथ लिखना है दैट अ ऑब्जर्वेशन एरे राइट तो एक्सेप्टेड वैल्यू आ गई है यहां पर अब हमें क्या करना है ओजे ओजे मतलब ऑब्जर्वेशन वैल्यू ऑब्जर्वेशन वैल्यू बनानी है तो एप डॉट क्या करूंगा यहां पर फिर से एक एरे बना लूंगा यहां पर एरे के अंदर मैं एक काम करता हूं एक लिस्ट बनाता हूं जिसके अंदर ये वाला जो डाटा है ये भी डाल देता हूं यहां पर यस कॉपी कर लेते हैं यहां पर ये वाला डाटा आ गया यहां पर देन कॉमा अब मुझे क्या करना है गाइज यहां पर ये वाला हमारे ये वाला भी वैल्यू चाहिए हमें वन बाय वन तो ये वाली वैल्यू भी हम ने डाल दिया यहां पर चलिए ये हमारी एक्सेप्टेड वैल्यू आ चुकी है यहां पर और ओ ज इसके नाम से रन करूं तो ये हमारी ऑब्जर्वेशन वैल्यू भी आ गई है चलिए एक्सेप्टेड वैल्यू भी रेडी है एंड ऑब्जर्वेशन वैल्यू भी रेडी है अब हमें क्या करना है गाइस यहां पर हमें यहां से कैलकुलेटेड निकालना है क्या निकालना है चाई कैलकुलेट निकालना है चाई कैलकुलेटेड क्या होता है गाइ यहां पर आपकी ऑब्जर्वेशन वैल्यू माइनस एक्सेप्टेड वैल्यू का होल स्क्वायर डिवाइडेड बाय एक्सेप्टेड वैल्यू एंड सम चलिए लगाते हैं फार्मूला यहां पर तो एप डॉट यस यहां पे क्या करेंगे एप डॉट क्या सबसे पहले क्या कर रहे हैं यहां पर ओजे यस सबसे पहले क्या कर रहे हैं ओजे माइनस क्या कर रहे हैं यहां पर एक्सेप्टेड वैल्यू को सबकट कर रहे हैं ये सबक्स का डटा आ चुका है हमारे पास अच्छा यदि मैं लेंथ निकालूं एक बार लेंथ चेक कर लेते हैं कि दोनों की लेंथ सेम है या नहीं है लेंथ ऑफ यहां पर ओजे निकालते हैं लेंथ ऑफ ओजे कितना है ए है और लेंथ ऑफ एकस निकाले यस लेंथ ऑफ यहां पर मैं एकस निकालूं यहां पर एक निकालूं तो वो भी कितनी है ए ही आ रही है ट्स गुड एट्स अब रेडी तो ओजे माइनस कर रहा हूं यहां पर तो ओजे माइन हमारे पास आ चुका है अब हमें क्या करना है इसका स्क्वायर करना है यस क्या करना है डाटा का स्क्वायर करना है तो एप डॉट यहां पे क्या करेंगे स्क्वायर का इस्तेमाल करेंगे तो एप डॉट स्क्वायर किया तो स्क्वायरिंग हो गई स्क्वायरिंग होने के बाद में मुझे क्या करना है डिवाइड करना है तो चलिए डिवाइड कर लेते हैं डिवाइड किससे करना है यहां पे गाइज एक्सपी से करना है तो मैंने क्या कर रहा है गाइज यहां पर ् को डिवाइड करना है तो मैं इसको कर रहा हूं ब्रैकेट में क्लोज कर देता हूं ताकि कोई गड़बड़ ना हो तो लीजिए एक से मैंने डिवाइड कर दिया डिवाइड करने के बाद इस पूरे डाटा को मुझे सम करना है यहां पर तो मैं np0 पे क्या करूंगा सम फंक्शन का इस्तेमाल करूंगा और रन करूंगा तो सम करने के बाद जो मेरा आंसर आया गाइज यहां पर वो कितना आया 13 हमारे पास आया है चलिए 13 आ गया यहां पर तो अब यहां पर बात करते हैं 13 चलिए तो 13 हमारे पास आया है तो मैं यहां पर लिखूंगा 13 पट आपके पास जो कैलकुलेटेड आया है यहां पर वो कितना आया है 13.7 आया 13.7 आ गया चलिए अभी मैं बात करता हूं यहां पर कि क्या सही है और क्या गलत है चलिए तो मैं यहां पे रन करूं और h न की बात करूं यहां पर यस h न कहां आएगा h न यहां पे आएगा और ए जो आएगा वो यहां कहीं आएगा और h0 बोल रहा है नो एसोसिएशन कोई एसोसिएशन नहीं है और एच ए बोल रहा है एसोसिएटेड है अच्छा जो कैलकुलेटर आई है जो टेबल्स आई है वो है 7.8 आई है यहां पर और जो कैलकुलेटर आई है वो कितनी आई है 13 के 13.7 आई है यहां पर इसका मतलब क्या हुआ गाइ यहां पर कि इन दोनों के बीच में एसोसिएशन है मतलब ए जो है यहां पर वो हमारा सही है और h0 जो है वो हमारा सही नहीं है इसका मतलब क्या हुआ दोनों के बीच में एसोसिएशन है मतलब हमारे पास इनफ एविडेंस है कि ये दोनों क्या है गाइस यहां पर एसोसिएटेड है और आज की इस वीडियो के जरिए हम ये समझेंगे मशीन लर्निंग होती क्या है और ये किस तरह से वर्क करती है आज के इस वीडियो के जरिए हम समझेंगे यदि आपको पाइथन मशीन लर्निंग डेटा साइंस एंड डेटा एनालिस जैसी फील्ड में अपने आपको को ग्रो करना है तो इसके लिए डब्ल्यू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं सबसे पहले हम ये जानते हैं कि आज की इस वीडियो के जरिए हम क्या देखने वाले हैं सबसे पहले हम बात करेंगे मशीन लर्निंग क्या होती है कैसे काम कर करती है कितने टाइप की हमारे पास मशीन लर्निंग होती है इसके क्या एडवांटेज है क्या डिसएडवांटेज है और मशीन लर्निंग को कहां-कहां इस्तेमाल किया जा सकता है देखिए सबसे पहले हम बात करते हैं कि मशीन लर्निंग होती क्या है देखिए मशीन लर्निंग आपके पास क्या है एक साइंस की फील्ड है जिसके अंदर आप क्या करते हैं कि जैसे ह्यूमंस बिहेव करता है उसी तरह से आप क्या करते हैं मशीन को ट्रेड करते हैं ताकि वो ह्यूमंस लाइक वर्क कर सके अब ये ह्यूमन लाइक वर्किंग का मतलब क्या है यहां पे जैसे कि क्या होता है कि ह्यूमंस क्या करता है कि अपने जो भी फेवरेट सॉन्ग होता है उस फेवरेट सॉन्ग की एक प्लेलिस्ट क्रिएट कर देता है अब देखिए गाइ यहां पे पुराने जमाने में क्या होता था कि लोग अपने पसंद के जो गाने होते थे वो एक रिकॉर्डिंग में या एक टैप रिकॉर्डिंग में या अपनी एक सीडी के अंदर स्टोर करवाते थे लेकिन आज ये सारे क्या हो चुके हैं हम ऑनलाइन सुनते हैं तो ऑनलाइन सुनने पर जैसे कि मैं हर किसी पॉइंट पे मैं उसी सॉन्ग को वापस सर्च करके सुनता रहता हूं तो youtube0 पे गए थे फ्रीक्वेंसी आता है जहां पे क्या होता है कि आपके जो इसके साथ-साथ जो प्रोडक्ट यहां पर सेल हुए हैं वो आपको सारे प्रोडक्ट क्या होते हैं यहां पर सजेस्ट किए जाते हैं जैसे कि यदि आप iphone7 नहीं आते इयरफोंस नहीं आते स्क्रीन ग्लास नहीं आता तो आप जैसे ही थोड़ा सा मूव नीचे करेंगे तो आपको iphone7 हो गया स्क्रीन गार्ड्स हो गई यहां पे टेंपर क्लास हो गई कवर्स हो गए ये सारी चीजें नीचे आपको सजेस्ट की जाती है दैट इज कॉल ऑफ रिकमेंडेशन सिस्टम ये सारा काम मशीन लर्निंग के थ्रू होता है तो मशीन लर्निंग में क्या है मशीन लर्निंग आपके पास क्या है एक कंप्यूटर सिस्टम है जिसके थ्रू आप यहां पर यह सारे जो काम है वो ऑटोमेटिक करवा रहे हैं मतलब आप अपने कंप्यूटर को इस तरह से ट्रेन कर रहे हैं क्या कि ये ह्यूमंस लाइक की तरह वर्क कर सके दैट इज कॉल ऑफ मशीन लर्निंग अब मेन इंपॉर्टेंट चीज यहां पे ये आती है कि ये मशीन लनी काम कैसे करती है मतलब बेसिकली ये ह्यूमंस की तरह बिहेव कर रही है लेकिन ये वर्किंग कर कैसे पा रही है इसको जरा आप समझते हैं तो देखिए मशीन लर्निंग कैसे काम करती है इसको जरा समझिए यहां पे मशीन लर्निंग क्या करती है कि आपने अभी तक जितना भी डटा जनरेट किया है अब डेटा कैसे जनरेट करते हैं तो देखिए आप किसी ना किसी वेबसाइट पे मूव करते हैं या आप यहां पे सारा का सारा डाटा जो है वो कलेक्ट हो रहा है कि आप फ्रीक्वेंसी वीडियो को रेगुलरली देख रहे हैं यहां पे इवन दैट आप यहां पे किस-किस के ऊपर वीडियो के ऊपर लाइक कर रहे हैं शेयर कर रहे हैं ये सारा क्या हो रहा है डाटा जनरेट हो रहा है ये सारा जितना भी पास्ट वाला डाटा है ये सारा पास्ट वाला डाटा को आप क्या करते हैं मशीन लर्निंग की जो एल्गोरिथम होती है अब मशीन लर्निंग के अंदर क्या होती है कुछ एल्गोरिथम्स होती है जिसके थ्रू ये पर्टिकुलर सेट ऑफ वर्क किए जाते हैं जैसे कि प् लिस्ट क्रिएट करना जैसे कि आपका रिकमेंट करना यहां पे आपका फ्यूचर का प्रोडक्शन करना तो आपके पास जितना भी आपका पास्ट डटा है उस पास्ट डाटा को हम क्या करते हैं मशीन लर्निंग मॉडल को देते हैं अब मशीन लर्निंग मॉडल क्या करता है उस डाटा से ट्रेड होता है और ट्रेड होके आपके पास एक ब मॉडल बिल्ड करता है अब ये मॉडल जो बिल्ड हो गया है यहां पे इसके अंदर जब भी आप अपना नया डाटा देते हैं या जब भी आप उस डाटा के ऊपर सर्च करते हैं तो आपके पास उसी के रेवलेट आपको चीजें दिख दिखाई देती है जैसे लाइक यहां पे बात करें कि ये जो हमारी से ये सारी चीजें मुझे सजेस्ट की जा रही है मतलब जिन्होंने भी ये डाटा जनरेट किया था उसी के बेसिस पे मुझे क्या करनी जा रही है ये सारी चीजें सजेस्ट की जाती है इवन दैट मेल जब आप यहां पे ओपन करते हैं तो इसमें भी इनबॉक्स और इनबॉक्स के अंदर जो आने वाले मेल और जो स्पैम मेल के अंदर जाने वाले जो मेल हैं इनको भी फिल्टर करने का तरीका भी यही है कि आपके पास जितने भी पास्ट में जितने भी मेल आए थे उन मेल के अंदर देखा गया कि कौन से मेल यूजर के लिए इंपॉर्टेंट है और कौन से मेल यूजर के लिए इंपोर्ट ट नहीं है जस्ट लाइक एडवर्टाइजमेंट के मेल हो गए यहां पे या किसी और चीज के मेल हो गए तो जो यूजर के लिए इंपॉर्टेंट नहीं होते हैं उनको ये क्या कर रहा है ऑटोमेटिक फिल्टर कर देता है और फिल्टर करके जब भी कोई नया मेल आता है तो ये आपको क्या करता है ऑटोमेटिक उसे ईमेल में डालना है मतलब इनबॉक्स में डालना है या फिर स्पैम मेल में डालना है ये ऑटोमेटिक क्या करता है उसे फिल्टर कर देता है तो ये सारा काम किस तरह से हो रहा है मशीन लर्निंग के हेल्प से हो रहा है ये मशीन लर्निंग कैसे काम करती है कि आपने जो जो भी प्रीवियसली डेटा जनरेट किया है उसको अपनी एल्गोरिथम के अंदर सेट करते हैं और एल्गोरिथम को सेट करने के बाद में एक मॉडल बिल्ड होता है और उसके बाद कोई भी नया टास्क परफॉर्म होता है तो वो पुरानी वाली एल्गोरिथम से कंपेयर करके फिर ये परफॉर्म करता है ये पूरा काम क्या होता है मशीन लर्निंग के थ्रू होता है अब यहां पर ये जानते हैं कि मशीन लर्निंग और ट्रेडिशनल प्रोग्रामिंग में क्या अंतर है क्योंकि ट्रेडिशनल प्रोग्रामिंग भी हम यहां पे करते थे जैसे कि आपने सी पढ़ी होगी आपने पाइथन पढ़ी होगी तो यहां पे आपकी ट्रेडिशनल प्रोग्रामिंग होती है तो मशीन लर्निंग से कैसे डिफरेंट है देखिए जब भी आप ट्रेडिशनल प्रोग्रामिंग पढ़ते हैं जस्ट लाइक c c+ प जावा एक इनपुट आएगा इसके साथ मल्टीप्लाई ऑफ़ टू करूंगा तो मेरे पास एक फोर जनरेट होगा यहां पे राइट इसके साथ मल्टीप्लाई करूंगा तो मेरा एक y आउटपुट जनरेट होगा यहां पे अब यहां पे बात करें तो बेसिकली x के अंदर यदि मैं टू रखता हूं तो ये मुझे जनरेट करके क्या देता है फोर देता है तो आप ट्रेडिशनल प्रोग्रामिंग में क्या करते थे आप अपना इनपुट्स भी देते थे इवन दैट आप यहां पे क्या करते थे आप अपना फॉर्मूला भी देते थे देन ये क्या करता था अपना आउटपुट जनरेट करके देता था लेकिन मशीन लर्निंग में ऐसा बिल्कुल नहीं होता है मशीन लर्निंग में क्या होता है होता है गाइ यहां पे मशीन लर्निंग में आप अपने डाटा का इनपुट देते हैं और आप अपने डाटा का आउटपुट देते हैं तो यह आपको एक प्रोग्राम जनरेट करके देता है ताकि कोई नया डाटा उसके अंदर आए तो आप आसानी से उसका आंसर निकाल सकें जस्ट लाइ एग्जांपल के तौर पे मैं बात करूं यदि मैं मशीन लर्निंग को ये रिजल्ट के तौर पे दूं राइट यदि मैं मशीन लर्निंग को ये रिजल्ट के तौर पे दूं जैसे देखिए मैं यहां पे दे रहा हूं यहां पे मैं कुछ को यहां पे मैं कुछ एग्जांपल लिख रहा हूं यहां पे तो यदि देखिए मशीन लर्निंग के तौर पे मशीन लर्निंग को मैं ये डाटा दूं जिसके अंदर मैं आगे वाला जो दोनों डाटा है जैसे कि ये x1 और x2 ये एज इनपुट पे दूं और ये वाला मैं आउटपुट दे दूं तो मशीन लर्निंग क्या करेगा इस इनपुट और आउटपुट के बेसिस पे एक प्रोग्राम जनरेट करेगा जैसे कि यहां पे जनरेट कर रहा है x1 * x2 यस x1 * x2 = y ये हमारे पास क्या क्या मशीन लर्निंग ने एक प्रोग्राम जनरेट करके दिया अब इन केस कोई नया डाटा आता है जैसे कि मैं यहां पे एक नया डाटा दूं और फिर से एक आंसर पूछूं तो मशीन लर्निंग क्या करता है कि दो जो उसने प्रोग्राम डिजाइन किया है उसके अंदर ये नया डाटा प्लेस करता है और फिर आंसर जनरेट करके देता है तो ट्रेडिशनल प्रोग्रामिंग और मशीन लर्निंग प्रोग्रामिंग में यही एक मेजर डिफरेंस है कि ट्रेडिशनल प्रोग्रामिंग के अंदर आप प्रोग्राम खुद बनाते थे और आप अपना इनपुट देते थे तो वो आपको एक आउटपुट जनरेट करके देता था लेकिन मशीन लर्निंग प्रोग्रामिंग के अंदर ऐसा बिल्कुल नहीं होता है मशीन लर्निंग प्रोग्रामिंग में आप इनपुट और आउटपुट दीजिए एक आपको एक प्रोग्राम जनरेट करके देगा ताकि आप यहां पे कोई भी नया इनपुट आए तो उसके बेसिस पे आप आउटपुट जनरेट कर सकें तो ये आपके पास वर्क होता है मशीन लर्निंग प्रोग्रामिंग में और ट्रेडिशनल प्रोग्रामिंग के अंदर अब बात करते हैं यहां पे कि मशीन लर्निंग आपके पास कितने टाइप्स की होती है तो मशीन लर्निंग आपके पास यहां पे मेजर थ्री टाइप्स की यहां पे होती है जिसके अंदर फर्स्ट होती है आपकी सुपरवाइज मशीन लर्निंग सेकंड होती है अन सुपरवाइज मशीन लर्निंग और थर्ड होती है रिइंफोर्समेंट मशीन लर्निंग ये तीनों मशीन लर्निंग की जो टाइप्स है ये तीनों अलग-अलग तरीके से अलग-अलग जगह पे काम करती है जैसे एक छोटा सा एग्जांपल मैं यहां पे दूंगा तीनों का पहला बात करता हूं सुपरवाइज मशीन लर्निंग के बारे में सुपरवाइज मशीन लर्निंग आपके पास फ्यूचर प्रेडिक्शन के लिए आपके पास इस्तेमाल की जाती है या फिर आप यहां पे रिकमेंडेशन सिस्टम बना रहे हैं तब भी आपके पास यहां पे सुपरवाइज मशीन लर्निंग काम करती है अब बेसिकली बात करें यहां पे फ्यूचर प्रोडक्शन का मतलब क्या है जैसे कि बेसिकली आप यहां पे किसी एरिया के अंदर घूम रहे हैं और उस एरिया के अंदर कोई आपको हाउस पसंद आ गया है अब आप उस हाउस की प्राइस को पता करना चाहते हैं तो वहां का जो ब्रोकर होता है वो ऑटोमेटिक आपको बता देता है कि इस हाउस की जो प्राइस है वो इतनी है तो ये उसने कैसे बताया तो उसने क्या किया अपने आसपास के जितने भी हाउस है उनकी प्राइस को देखा और उनके इंफ्रास्ट्रक्चर को देखा उसी के बेसिस पे उसने अब जो नया वाला हाउस आया है उसको देखा और उसके इंफ्रास्ट्रक्चर को देखा तो उसने ऑटोमेटिक उस पुराने वाले डाटा से उसने हाउस के प्राइस को प्रिडिक्ट कर दिया तो इस तरह के जो भी टास्क होते हैं हैं वो आप सुपरवाइज मशीन लर्निंग के अंदर परफॉर्म करते हैं अब बात करते हैं अनसुपरवाइज्ड मशीन लर्निंग के बारे में अनसुपरवाइज्ड मशीन लर्निंग के अंदर आपके पास टास्क होते हैं क्लासिफिकेशन के जैसे कि मैं आपको एक एग्जांपल के तौर पे जैसे कि मैं आपको एक एग्जांपल दूं तो आप क्या करें एक बकेट ले लें और उस बकेट के अंदर बहुत सारे फ्रूट्स डाल दें अब बहुत सारे फ्रूट्स कैसे अलग-अलग टाइप्स के आप बहुत सारे फ्रूट्स डाल दीजिए अब मैं आपको बोलूं कि आप इसमें से बनाना को अलग कर दीजिए एप्पल को अलग कर दीजिए मैंगो को अलग कर दीजिए या फिर पाइनएप्पल को अलग कर द दीजिए तो आप क्या करते हैं उस फ्रूट्स को देखते हैं और उसके बाद इन सारे फ्रूट्स को अलग-अलग कैटेगरी इज के अंदर डिवाइड कर देते हैं सेम एस आपके पास यहां पे अन सुपरवाइज मशीन लर्निंग में भी ये होता है आप एक मिक्स डाटा देते हैं तो अन सुपरवाइज मशीन लर्निंग क्या करता है कि डाटा के पैटर्न को देखते हुए उनको क्या करता है उनके नेचर को देखते हुए अलग-अलग ग्रुप्स बना देता है तो अन सुपरवाइज मशीन लर्निंग में क्या होता है आपका ग्रुपिज्म का काम होता है रिइंफोर्समेंट मशीन लर्निंग की बात करें तो रिइंफोर्समेंट मशीन लर्निंग का इस्तेमाल आप डेट टू डे लाइफ में करते हैं यदि आप कोई भी गेम खेलते हैं चाहे आप देखिए लूडो किंग खेले चाहे आप चेस का गेम खेले कोई भी आप गेम खेलते हैं तो उस गेम के अंदर आपके जब भी कंप्यूटर वर्सेस यू खेला जाता है जब आप यहां पे बोर हो जाते हैं आपका फ्रेंड आपके साथ नहीं खेल रहा है तो आप कंप्यूटर के साथ खेलना स्टार्ट करते हैं तो जो कंप्यूटर यहां पे गेम खेल रहा होता है वो आपके पास रिइंफोर्समेंट मशीन लर्निंग के थ्रू खेल रहा होता है वो आपके मूवमेंट के ऊपर अपना मूवमेंट चेंज करता रहता है ये चीज आप लूडो किंग के अंदर भी आप ट कर सकते हैं तो बेसिकली जो आपके पास यहां पे ऑटोमेटिक जो गेम प्ले होता है वो आपके पास किसके अंदर होता है रिइंफोर्समेंट मशीन लर्निंग के थ्रू यहां पे होता है ये थी आपके पास तीन टाइप की मशीन लर्निंग जो आपके पास डिफरेंट डिफरेंट स्टेजेस के अंदर डिफरेंट डिफरेंट एरिया के अंदर वर्क करती है अब हम यहां पे जानते हैं कि मशीन लर्निंग के एडवांटेज क्या है देखिए मशीन लर्निंग के एडवांटेज बहुत सारे हैं मशीन लर्निंग के एडवांटेज आपके पास फ्यूचर प्रोडक्शन के अंदर है आपके पास यहां पे पैटर्न को रिकॉग्नाइज करने के अंदर है यहां पे इवन दैट आपके पास ह्यूमन की एफिशिएंसी को कम करने के लिए जैसे पहले ह्यूमंस क्या करता था अपने फेवरेट सॉन्ग को सुनने के लिए अपनी एक अलग से सीडी बनवा आता था देन उसके बाद में क्या करता था उसके अंदर जो भी गाने वाने भर के एंड उसके बाद में वो सॉन्ग सुनता था लेकिन आज वो काम youtube's की वर्किंग है उसको बहुत ज्यादा कम कर रहा है इवन दैट आपके पास किसी भी वेबसाइट के अंदर या किसी भी वर्किंग के अंदर आप किसी भी वेबसाइट के अंदर जाएं तो वहां पे भी ऑटोमेशन का जो व होता है वो मशीन लर्निंग के थ्रू होता है ऐसे बहुत सारे इसके एडवांटेज हो सकते हैं जो कि आपके काम को क्या कर रहे हैं इंप्रूव कर रहे हैं अब बात करते हैं इसके डिसएडवांटेज के बारे में देखिए डिसएडवांटेज इसके ये है कि इसके लिए आपको बहुत ही लार्ज अमाउंट में डाटा की जरूरत पड़ती है आपके पास आपको बहुत सारे रिसोर्सेस की जरूरत पड़ती है बहुत सारे टाइम की जरूरत पड़ती है क्योंकि देखिए आपके पास जब आप मशीन लर्निंग मॉडल को ट्रेड करते हैं तो उसके लिए आपको जरूरत पड़ती है डाटा की और वो भी पास्ट डाटा की तो आपको सबसे पहले पहले उन डाटा को कलेक्ट करना पड़ता है देन आपके पास उस डाटा के ऊपर आप यहां पे क्या करते हैं वर्किंग कर पाते हैं अब वो डाटा कलेक्ट करना एंड देन उसको प्रोसेस करना फिल्टर करना इसमें आपके पास क्या होता है बहुत ज्यादा टाइम कंज्यूम होता है तो ये ऐसे कुछ डिसएडवांटेज यहां पर है अब बात करते हैं कि कौन-कौन से एरिया के अंदर मतलब किस-किस जगह पर आप मशीन लर्निंग का यूज के देखते हैं तो देखिए जितनी भी सेल्फ ड्राइविंग कार आई है आप 11 मस की जितनी भी ऑटोपायलट की कार आ रही है उनको देख सकते हैं तो इन सब में क्या करके है मशीन लर्निंग का इस्तेमाल किया जाता है इवन दैट यहां पे स्टॉक मार्केटिंग आप यहां पे क्या करें कैमरे को सर्च करें कैमरे के अंदर जैसे ही सर्च करें तो आपके पास यहां पे आपको देखिए एक फेस डिटेक्शन आता है जिसके थ्रू आप क्या कर पाते हैं आपका जो ये फेस है वो डिटेक्ट हो रहा है आप जैसे-जैसे मूव कर रहे हैं वैसे-वैसे आपका ये फेस डिटेक्ट होता जा रहा है और आपको प्रॉपर तरीके से ये कैप्चर कर रहा है तो बेसिकली ये जो प्रोसेसर हो रहा है जो कि ये मेरे फेस को डिटेक्ट कर रहा है ये सारा का सारा किससे हो रहा है मशीन लर्निंग के थ्रू हो रहा है इवन दैट आप जो भी ट्रांसलेटर देखते हैं कि हिंदी टू इंग्लिश हो रहा है इंग्लिश टू हिंदी हो रहा है या फिर फिर आपके बोलने पर यह इंग्लिश में कन्वर्ट कर रहा है या फिर [संगीत] google-map-react चाहिए और किस तरह से हम एक कंप्लीट मशीन लर्निंग मॉडल को बिल्ड कर सकते हैं तो चलिए इसके रोड मैप को समझते हैं तो देखिए रोड मैप समझने से पहले हम ये जानते हैं कि मशीन लर्निंग को सीखने से पहले हमें कौन-कौन सी प्रोग्रामिंग लैंग्वेज आनी चाहिए क्योंकि विदाउट एनी प्रोग्रामिंग लैंग्वेज आप मशीन लर्निंग में वर्क नहीं कर पाएंगे अब बेसिकली बात करें तो मशीन लर्निंग को सीखने के लिए आपके पास दो प्रोग्रामिंग लैंग्वेज की रिक्वायरमेंट है इनमें से आप किसी को भी एक को चूज कर सकते हैं लेकिन मैं जो प्रेफर करने वाला हूं वो पाइथन प्रोग्रामिंग लैंग्वेज है पाइथन प्रोग्रामिंग लैंग्वेज के अलावा आप आर प्रोग्रामिंग लैंग्वेज को भी इस्तेमाल कर सकते हैं हम python2 लैंग्वेज में ये सारी चीजें हमें नहीं देखने को मिलती है तो इवन दैट आर प्रोग्रामिंग लैंग्वेज वो लोग इस्तेमाल करते हैं जो लोग रिसर्च सेक्टर में जाना चाहते हैं मतलब मशीन लर्निंग के अंदर यदि आपको रिसर्च वगैरह करनी है या आपको एक नई एल्गोरिथम वगैरह डेवलपमेंट करनी है तो आर प्रोग्रामिंग लैंग्वेज आपके लिए सबसे बेस्ट रहने वाली है नहीं तो आपके लिए pythonanywhere.com अब ये एक्सप्लोरी डेटा एनालिसिस का मतलब क्या होता है मतलब आपके पास जो भी आपने डेटा गैदर किया है अब डेटा कहीं से भी आप गैदर कर सकते हैं चाहे किसी वेबसाइट से गैदर कर सकते हैं चाहे आप किसी के डेटा सर्वर से गैदर कर सकते हैं या फिर आपके किसी प्लेटफॉर्म से डेटा गैदर कर सकते हैं तो डेटा कहीं से भी गैदर करने जा रहे हैं यहां पे उस डाटा को आप एक्सप्लोर कीजिए एक्सप्लोर करने का मतलब है उस डाटा के अंदर क्या-क्या फीचर दे रखे हैं किस-किस तरह के फीचर्स दे रख हैं आप उन फीचर को अच्छे तरीके से समझिए कि ये फीचर कैसे और किस तरीके से काम करते हैं तो उसके बाद ही आप मशीन लर्निंग मॉडल को बिल्ड कीजिए क्योंकि जब तक आपको उस फीचर की नॉलेज नहीं होगी तो मशीन लर्निंग मॉडल जब आप बिल्ड करेंगे तो उस वक्त आपको कौन सा मॉडल यहां पे बिल्ड करना है किस तरीके से मॉडल बिल्ड करना है ये आपको बिल्कुल भी समझ में नहीं आने वाला है तो इसलिए पहले क्या करें आप अपने फीचर को एक्सप्लोर कीजिए कि ये क्या-क्या किस-किस तरह से परफॉर्म करे मतलब डाटा का नेचर क्या है फीचर को एक्सप्लोर करने के बाद में आप फीचर इंजीनियरिंग की तरफ मूव कर सकते हैं फीचर इंजीनियरिंग के अंदर बहुत सारी चीजें आती है जिसके अंदर आपके पास एक्सप्लोरी डेटा एनालिसिस भी आता है यहां पे क्योंकि हमारा ईडी का पार्ट है इसके अलावा आपके पास मिसिंग वैल्यू हैंडलिंग भी आती है मतलब आपके पास डेटा क्लीनिंग के सारे प्रोसेसर आते हैं अब डेटा क्लीनिंग के अंदर आपके पास मिसिंग वैल्यू हैंडल हो गई आउटलायर डिटेक्शन हो गए एन कोडिंग हो गई स्केलिंग हो गई इस तरह की सारी चीजें यहां पे आती है मतलब आपके पास जब आपका डाटा आता है तो वो एक रॉ मटेरियल डाटा होता है उस रॉ मटेरियल डाटा को आपको एक फिल्टर बना के मशीन लर्निंग एल्गोरिथम के लिए डटा तैयार करना पड़ता है तो उसके लिए आप क्या करते हैं डेटा क्लीनिंग करते हैं डाटा क्लीनिंग की हमने एक अलग से प्लेलिस्ट तैयार कर रखी है आप वहां जाके डाटा क्लीनिंग को देख सकते हैं अब देखिए इस फीचर इंजीनियरिंग के अंदर आपके पास क्या होता है आप फीचर को क्रिएट भी करते हैं इवन दैट आप यहां पे फीचर को डिलीट भी करते हैं मतलब आप यहां पे फीचर को देखते हैं कि आपके कौन से इंपॉर्टेंट फीचर्स हैं जो कि वहां पे प्रेजेंट है नहीं है तो आप ऑटोमेटिक वहां पे क्रिएट करते हैं इवन दैट आप डेटा को क्लीनिंग करने का प्रोसेसर भी इसी के अंदर फॉलो करते हैं चलिए नेक्स्ट स्टेप में आप क्या करते हैं फीचर सिलेक्शन करते हैं फीचर सिलेक्शन के अंदर आप क्या करते हैं कि आपके पास मान लीजिए आपके डटा सेट के अंदर आपके पास 115 फीचर है लेकिन ये सारे 115 फीचर्स आपके पास आपके लिए इंपॉर्टेंट हो भी सकते हैं और नहीं भी हो सकते हैं तो आप यहां पे अपने मॉडल के अकॉर्डिंग आप क्या करते हैं उन फीचर का सेलेक्ट करते हैं कि ये वाले फीचर्स हमारे लिए जरूरी है अब इसके अंदर आप बहुत सारे डिफरेंट डिफरेंट टेक्निक का इस्तेमाल करते हुए फीचर्स सिलेक्शन करते हैं यहां पे इसके लिए आपके पास फॉरवर्ड एलिमिनेशन बैकवर्ड एलिमिनेशन यूनिलैटरल सिलेक्शन रैंडम फॉरेस्ट इंपॉर्टेंस आपके बाद फीचर सिलेक्शन के लिए आप डिसीजन ट्री अब ऐसे को रिलेशन मेथड का इस्तेमाल करते हुए अपने फीचर को सेलेक्ट कर सकते हैं फीचर को सेलेक्ट करने के बाद में अब आपके डेटा सेट का आप नेचर देखते हैं डेटा सेट का नेचर का मतलब क्या है आपके डेटा सेट के अंदर आउटपुट की रिक्वायरमेंट क्या है आउटपुट यदि आपके पास कंटीन्यूअस नेचर का है तो आप चलते हैं रिग्रेशन एनालिसिस के अंदर यदि आउटपुट आपके पास कंटीन्यूअस इन नेचर की जगह आपका डिस्क्रीट इन नेचर का है तो आप चलते हैं क्लासि फिक्सस एनालिसिस के अंदर लेकिन इसके अंदर भी आप एक और चीज सेलेक्ट करते हैं यदि आपके डाटा के अंदर इनपुट आउटपुट नहीं दिया गया है यदि आपका डाटा एकदम रैंडम वे के अंदर है तो आप चल जाते हैं अनसुपरवाइज्ड मशीन लर्निंग के अंदर तो आप यहां पे क्या करते हैं अपने डेटा के नेचर को देखते हैं कि डाटा के अंदर क्या डिमांड की गई है उसके बेसिस पे आप अपनी क्या करते हैं मशीन लर्निंग मॉडल को चूज करते हैं आप मशीन लर्निंग मॉडल को मतलब आपके पास बहुत सारे मशीन लर्निंग मॉडल्स होते हैं मशीन लर्निंग एल्गोरिथम्स होती है उनमें से आप उनको चूज करते हैं कि हमारे डाटा के लिए परफेक्ट चीज क्या होने वाली है इसके अंदर आपके पास बहुत सारी है जैसे रिग्रेशन एंड क्लासिफिकेशन है क्लस्टरिंग है ऐसी बहुत सारी चीजें आती है उसके बाद आपकी मशीन लर्निंग मॉडल भी यहां पे चूज होती है जिनके थ्रू आप ये सारा काम करते हैं देन नेक्स्ट प्रोसेसर के अंदर आप क्या करते हैं अपने मॉडल को इंप्रूव करते हैं मॉडल का इंप्रूवमेंट का मतलब यहां पे है कि यदि आपके मशीन लर्निंग मॉडल आपको 80 पर एक्यूरेसी दे रहा है इसका मतलब यहां पे है कि बेसिकली आपका जो मॉडल है वो 80 पर एक्यूरेसी दे रहा है और आप चाहते हैं कि ये और अच्छी एक्यूरेसी दे ताकि ये मॉडल परफेक्टली वर्क करें तो इसके लिए आप यहां पे इस्तेमाल करते हैं हाइपर पैरामीटर ट्यूनिंग का हाइपर पैरामीटर ट्यूनिंग के थ्रू आप क्या करते हैं अपने मॉडल को और अच्छे तरीके से बिल्ड करते हैं उनके अंदर काफी चीजें चेंजेज करते हैं देन नेक्स्ट चीज आती है आपके पास यहां पे आपने मॉडल को और ज्यादा इंप्रूवमेंट करने के लिए ग्रेड सर्च सीवी रेंडमाइज सर्च सीवी एंड आपके पास जेनेरिक एल्गोरिथम ऐसी बहुत सारी एल्गोरिथम्स आती है जो आपके मॉडल को इंप्रूवमेंट करती है जिसके अंदर एड ब एजी बूस्ट जैसे एल्गोरिथम्स आती है जो कि आपके मॉडल को क्या करती है आपके इंप्रूव करती है उसके बाद आप यहां पे डॉकर एंड कबिट का इस्तेमाल करते हुए मॉडल को आप क्या करते हैं स्टोर करते हैं एंड लास्ट में आप अपने मॉडल को डिप्लॉयडी पलॉइकोंपू है यदि आप कोई भी एक मशीन लर्निंग मॉडल बिल्ड करने की सोच रहे हैं या कोई भी आप प्रेडिक्शन मॉडल बनाने की सोच रहे हैं तो उसके लिए यह सारे प्रोसीजर आपको करने होते हैं अब हम यहां पे ये बात करते हैं कि यदि हम कोई एक प्रोग्रामिंग लैंग्वेज इस्तेमाल करें हैं जो कि हमारी यहां पे है पाइथन प्रोग्रामिंग लैंग्वेज तो इस पाइथन प्रोग्रामिंग लैंग्वेज के अंदर हमें क्या-क्या सीखना पड़ेगा मतलब हमें कौन-कौन सी लाइब्रेरीज हैं जो हमें सीखनी पड़ेगी तो बेसिकली बात करें तो python3 जो कि इस काम को आसान करती है इसके अंदर हमारे कुछ मोस्ट पॉपुलर आपके पास यहां पे लाइब्रेरीज है जिसके अंदर फर्स्ट है आपके पास यहां पे नपाई जो कि आपके न्यूमेरिकल प्रॉब्लम को सॉल्व करती है जितने भी नंबर्स रिलेटेड वर्क होते हैं जितने भी कैलकुलेशन रिलेटेड वर्क्स होते हैं मैथमेटिकल रिलेटेड वर्क होते हैं वो आपके पास क्या करता है नम पाई आपकी हैंडल करता है उसके बाद आप जब डाटा की एनालिसिस करते हैं मतलब आप अपने डाटा को ग्राफिकल फॉर्मेट के अंदर देखते हैं तो वहां पे आपके पास काम करता है मैट पल लेब और सीबोर्न जैसी लाइब्रेरीज ये आपके डाटा की एनालिसिस करने में आपकी हेल्प कर ते हैं कि आपका डाटा का नेचर किस तरह से है डाटा किस तरीके से वर्किंग कर रहा है इसके बाद आप बनाते हैं मशीन लर्निंग मॉडल मशीन लर्निंग मॉडल बनाने के लिए आप साइकेड लन का इस्तेमाल करते हैं और यहां पे साइ पाई क्या करता है आपके पास जो भी आपके कांस्टेंट वगैरह की जरूरत होती है वो आपको यहां पे प्रोवाइड करता है मशीन लर्निंग मॉडल बनाने के लिए आप सकड लर्न का इस्तेमाल कर सकते हैं अब यहां पे एक बहुत अच्छी इंपॉर्टेंट चीज आती है दैट इज कॉल्ड ऑफ डीप लर्निंग जो कि मशीन लर्निंग का ही पार्ट है मतलब मशीन लर्निंग से एडवांस वर्किंग यदि आप करना चाहते हैं तो आप डीप लर्निंग की तरफ मूव करते हैं काफी ऐसे वर्क होते हैं जो मशीन लर्निंग आपका परफॉर्म नहीं कर पाता है तब आप यहां पे डीप लर्निंग की तरफ जाते हैं तो उसके लिए आपको जरूरत पड़ती है टेंसर फ्लो लायब्ररी की जो कि आपके पास यहां पे वर्क करती है अब यहां पे एक बहुत ही इंपॉर्टेंट चीज यदि आपका डाटा टेक्चुअल फॉर्मेट के अंदर है या इमेज फॉर्मेशन के अंदर है तो इसको सॉल्व करने के लिए आपको एनएलटी के और इसको सॉल्व करने के लिए लिए आपको दो लाइब्रेरी और जरूरत पड़ती है जो कि है आपके पास एनएलटी के और ओपन सीवी एनएलटी के आपके पास टैक्स फ्री प्रोसेसिंग के लिए काम आती है और इमेज प्रोसेसिंग के लिए यदि आप वर्क कर रहे मतलब इमेज के ऊपर वर्क कर रहे हैं तो आपके पास ओपन सीवी लाइब्रेरी वर्क करती है और आज के इस वीडियो के जरिए हम बात करेंगे कि डाटा टाइप्स कितने तरीके होता है यदि आप मशीन लर्निंग के अंदर आप डाटा इस्तेमाल करने जा रहे हैं तो देखिए मशीन लर्निंग या फिर डाटा साइंस के अंदर जो आप डेटा इस्तेमाल करते हैं वो आपके पास एकल फॉर्मेट के अंदर होता है या फिर सीएसपी फॉर्मेट होता है दोनों ऑलमोस्ट आपके सेम फॉर्मेट में होता है अब मैं बात करना चाहूं यहां पर कि ये जो डाटा होता है इसके अंदर बहुत सारे कॉलम्स होते हैं जैसे जस्ट एग्जांपल के तौर पे मैं यदि आपको पाइथन मशीन लर्निंग डाटा साइंस एंड डेटा एनालिसिस जसी फीड में अपने आपको को ग्रो करना है तो इसके लिए डब्लू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपने स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो देखिए ये मेरे पास एक डेटा सेट का एक एग्जांपल है ठीक है ये एक एक्सेल शीट का एग्जांपल है अब इस एक्सल शीट के अंदर बहुत सारे कॉलम्स है यहां पर इन कॉलम्स के अंदर हमारे पास बहुत सारे तरीके का डाटा पढा है जैसे देखिए पहले कॉलम के अंदर देखेंगे तो लोन आईडी है यहां पर अब लोन आईडी में डाटा पड़ा है जेंडर में पड़ा है मैरिड में पड़ा है डिपेंडेंस में पड़ा है एजुकेशन सेल्फ एंप्लॉय एप्लीकेशन इनकम को एप्लीकेशन इनकम लोन अमाउंट्स तो ऐसे आप देखेंगे तो आपके पास क्या है बहुत सारे कॉलम्स हैं इन बहुत सारे कॉलम्स के अंदर डिफरेंट डिफरेंट टाइप्स के हमारे पास डाटा होते हैं राइट अब हम ये समझेंगे कि इन डाटा की डेटा टाइप्स क्या होती है देखिए डाटा की डेटा टाइप समझना बहुत ज्यादा जरूरी है बिकॉज आगे चलते हुए जब आप इनके वर्क करते हैं तो इन डेटा टाइप को चेंज करने का भी आपको यहां पर आना चाहिए राइट डेटा टाइप को चेंज करना भी आपको आना चाहिए क्योंकि आपके पास एक डेटा टाइप से दूसरे डेटा टाइप में आपको जाना है तो डटा टाइप को चेंज करना भी आना चाहिए तो उसके लिए भी आपको डेटा टाइप के बारे में पता होना बहुत ज्यादा जरूरी है इवन दैट आप कोई भी ऑपरेशन परफॉर्म करते हैं किसी भी पर्टिकुलर कॉलम के अंदर तो फिर उसके अंदर भी आपको उसकी डेटा टाइप के बारे में पता होना बहुत ज्यादा जरूरी है तो बेसिकली आज हम यहां पर समझेंगे कि यदि हमारे पास इस तरह का डाटा है मतलब जिसे हम बोलते हैं टेबुलर डाटा यदि पढ़ा है तो इसके अंदर कौन-कौन से तरीके की डेटा टाइप्स होती है अब देखिए आप लोग पाइथन पढ़ के आ चुके हैं तो इस वेरिएबल के अंदर हमारे पास न्यूमेरिकल डटा हो सकता है कैटेगरी कल डाटा हो सकता है डेट एंड टाइम्स डाटा हो सकता है या फिर मिक्सड डटा हो सकता है अब बात करते हैं कि न्यूमेरिकल डाटा का मतलब क्या हुआ न्यूमेरिकल डाटा का मतलब हुआ सिंपल सा उसके अंदर नंबर्स हो सकते हैं यस उसके अंदर क्या हो सकते है नंबर्स हो सकते हैं जैसे एग्जांपल के तौर पे मैं बात करूं यहां पर तो आपके पास देखिए एप्लीकेशन इनकम है यस ये एप्लीकेशन इनकम आप देख र हैं यहां पर यस एप्लीकेशन इनकम के अंदर आपके पास कैसा है न्यूमेरिकल रेटा देखिए सारे कुछ क्या है नंबर्स आपके सार हैं लोन अमाउंट्स के अंदर आप देखेंगे तो इसके अंदर भी क्या है आपका नंबर रेटा है लोन अमाउंट्स के बाद में लोन अमाउंट्स टर्म्स के बारे में लोन अमाउंट्स के बारे में देखेंगे को एप्लीकेशन इनकम के बारे में देखेंगे तब भी आपका इसका दिखेगा न्यूमेरिकल टा दिखेगा तो पहला आपके पास क्या हो गया न्यूमेरिकल डाटा जहां पे आपको क्या मिलेंगे नंबर मिलेंगे अब ये नंबर जो है यहां पर यस ये जो नंबर है यहां पर ये नंबर आपके पास दो कैटेगरी के हो सकते हैं और वो कौन-कौन सी कैटेगरी है आपके पास यहां पर दैट इज अ पॉइंट ऑफ फर्स्ट इंटी जर एंड सेकंड आपके पास क्या हो सकता है फ्लोट हो सकता है अब मैं बात करना चाहूं यहां पर इंटी जर के पॉइंट ऑफ व्यू से यस इंटी जर के पॉइंट ऑफ व्यू से तो इंटी जर किसे कहते हैं फ्लोट किसे कहते हैं अभी हम थोड़ा और डिस्कस करेंगे यदि मैं बात करूं कैटेगरी कल डाटा के ऊपर तो कैटेगरी कल डाटा हम किसे बोलते हैं गाइस यहां पर जहां पे ये अल्फाबेटिकल लिखे जैसे ये आप ग्रेजुएट लिखा हुआ है यहां पर जेंडर के अंदर मेल और फीमेल लिखा है राइट फिर उसी तरह से डेट ऑ टाइम एंड मिक्सड डाटा भी आपके पास होता है अब ये आगे किस तरह से डिफेंडेड है यस उनको अब जरा वन बाय वन समझते हैं सबसे पहले मैं बात करूंगा यहां पर न्यूमेरिकल डाटा न्यूमेरिकल डाटा के अंदर बात करें तो आपके पास ऐसे कॉलम जिनके अंदर नंबर्स प्रेजेंट है अब ये नंबर्स जो है आपके पास गाइस दो तरीके हो सकते हैं जैसे कि मैंने अभी आपको बताया फर्स्ट टाइम फॉलो इंटी जर सेकंड ऑफ आपके पास क्या है फ्लोट राइट अब मैं बात करूं इंटी जर नंबर कौन से नंबर होते हैं इंटी जर नंबर वो नंबर होते हैं जो आपके परफेक्ट नंबर होते हैं मतलब विदाउट एनी डेसीमल नंबर जैसे एग्जांपल के तौर पे मैं बात करूं जैसे टू हो गया थ्र हो गया -2 हो गया माइनस का फाइव हो गया राइट रो हो गया दैट इज़ कॉल्ड ऑफ इंटी जर नंबर अब मैं बात करूं फ्लोटिंग नंबर के बारे में कि फ्लोटिंग नंबर कौन-कौन से होंगे तो फ्लोटिंग नंबर वो नंबर होते हैं जिनमें आपको डेसीमल वैल्यू देखने को मिलती है जैसे 2.5 हो गया यस माइनस के 2.5 हो गया थ हो 3.0 हो गया या 3.0 इज आल्सो फ्लोटिंग नंबर यदि यहां पे डेसीमल लग गया इसका मतलब क्या है आल्सो फ्लोटिंग नंबर ओके तो नंबर की कैटेगरी में बात करें तो नंबर आपके पास इंजर टाइप का हो सकता है और फ्लोटिंग टाइप का हो सकता है इनको भी हमने क्या कर रखा है दो पार्ट के अंदर डिवाइड कर रखा है फर्स्ट पार्ट इज डिस्क्रीट एंड सेकंड पार्ट इज कंटीन्यूअस यस अब डिस्क्रीट और कंटीन्यूअस में क्या डिफरेंशिएबल आता है जो अपने आप को बार-बार रिपीट कर रहा होता है मतलब तीन-चार फिक्स नंबर है जैसे मैं बात करूं यहां पर एक्सपीरियंस के बारे में अकॉर्डिंग टू दिस डाटा ठीक है अब अकॉर्डिंग टू दिस डेटा यदि आप एक्सपीरियंस को देखेंगे तो एक्सपीरियंस क्या कर रहा है अपने आप को बार-बार रिपीट कर रहा है जैसे 1 2 3 4 5 6 7 8 आ गया फिर वापस 1 2 3 आ गया राइट मतलब यहां पे आपको क्या मिलेंगे कुछ परफेक्ट नंबर मिलेंगे जैसे एग्जांपल के तौर पे देखिए 1 2 3 फिर मैंने लगा दिया वन फिर वन फिर टू फिर टू टू एंड देन थ्री फिर आपके पास हो गया वन यस फिर आपके पास क्या हो गया वन फिर आपके पास टू हो गया फिर थ्र थथ इस तरह से नंबर आ गया तो इस तरह के जो डाटा होता है जहां पे आपके पास क्या होता है गाइ यहां पर परफेक्ट नंबर्स आपको मिल रहे होते हैं यहां पर और वही नंबर एक दूसरे को रिपीट कर र हो है जैसे मैं एक रेंज बोलूं 1 टू 5 के बीच में नंबर जैसे 1 2 3 4 5 बस यही नंबर और यही नंबर अपने आप को बारबार बार बार क्या कर रहे हैं रिपीट कर रहे होते हैं दैट इज कॉल ऑफ डिस्क्रीट नंबर यस इसको हम क्या बोलते हैं गाइस यहां पर डिस्क्रीट नंबर बोलते हैं नेक्स्ट पॉइंट में आता है हमारा कंटीन्यूअस नंबर अब कंटीन्यूअस नंबर वो नंबर्स होते हैं जो एक गिवन रेंज के अंदर आपके पास बहुत सारे डेसीमल नंबर्स मिल जाते हैं मतलब बेसिकली गाइ मैं बात करूं यहां पर तो कंटीन्यूअस नंबर के एक एगजाम एल देता हूं जैसे कि मैं बोल रहा हूं वन से लगाकर फाइव के बीच में डटा अब कितने डेटा बहुत सारे मल्टीपल डाटा जैसे कि देखिए 1.1 और 1.2 1.3 1.4 1.5 1 प आपके पास यहां पर 1.5.5 यस 1.6.1 राइट 1 प आपके 7.1 इस तरह के जो नंबर्स होते हैं मतलब आपके पास यहां पे एक रेंज के अंदर बहुत सारे मल्टीपल नंबर्स आपको देखने को मिल जाते हैं दैट इज कॉल ऑफ आपके पास कैसा होता है डटा यहां पर इस कॉल ऑफ कंटीन्यूअस डटा तो तो इस तरह से हम क्या करते हैं कंटीन्यूअस वेरिएबल के बारे में डिस्कस करते हैं ठीक है तो अब हम आगे बढ़ते हैं हमारे अगले वेरिएबल के ऊपर दैट इज कॉल्ड ऑफ कैटेगरी कल वेरिएबल कैटेगरी कल वेरिएबल के अंदर वो डटा आता है जिसके अंदर हमारे पास कैटेगरी कल डाटा होता है जैसे कि मैं बेसिकली गाइस बात करूं हमारे पास स्ट्रिंग टाइप का जो डाटा प्रेजेंट होता है जैसे ये देखिए हमारे पास क्या है स्ट्रिंग टाइप का डाटा प्रेजेंट है काफी है ना तो दैट इज कॉल ऑफ यहां पर क्या कहते हैं हम इसे कैटेगरी कल वेरिएबल बोलते हैं अब कैटेगरी वेरिएबल में आपको हमेशा स्ट्रिंग टाइप का डाटा दिखेगा न्यूमेरिकल टाइप का डाटा नहीं दिखेगा तो एंप्लॉई आईडी आपका नहीं है जेंडर आपका कैटेगरी अवेलेबल है यहां पर ज और उसके बाद मैं बात करूं रिमार्क आपके पास है और लैंग्वेज आपके पास है राइट तो ये तीन जो वेरिएबल आप देख रहे हैं जेंडर रिमार्क एंड लैंग्वेज ये तीनों के तीनों क्या है कैटेगरी वेलेबल में आते हैं अब इन कैटेगरी वेलेबल को हमने क्या कर रखा है दो पार्ट के अंदर डिवाइड कर रखा है फर्स्ट फर्स्ट इज ऑर्डिनल एंड सेकंड वन इज नॉमिनल ये बहुत इंपोर्टेंट रहेंगी आपके लिए आगे चलते हुए कब जब आप मिसिंग वैल्यू को हैंडल कर रहे होंगे तब यस आपके डेटा सेट के अंदर मिसिंग वैल्यू आने वाली है और वो टॉपिक आएगा डाटा क्लीनिंग के अंदर तो जब आप मिसिंग वैल्यू को हैंडल कर रहे होंगे तब आपके पास ये डि नल और जो नॉमिनल है वो आपके लिए बहुत ज्यादा हेल्प करेंगे राइट तो बेसिकली गाइज यहां पे बात करें तो जो कैटेगरी कल वेरिएबल आपके पास हैं उनको हमने दो पार्ट के डिवाइड किया है एक तो है ऑर्डिनल दूसरा है नॉमिनल पहले हम नॉमिनल को समझते हैं कि नॉमिनल वेरिएबल हम किस वेरिएबल को बोलेंगे तो नॉमिनल वेरिएबल उस वेरिएबल को बोलेंगे जिसके अंदर आपके पास रैंडम कुछ डेटा बना है जैसे एग्जांपल के तौर पे मैं बात करूं यहां पर तो लैंग्वेज यस ये लैंग्वेज डाटा है यहां पर लैंग्वेज में python2 प् आ गया सी हैज आ गया एटीएमएल आ गया तो इसके अंदर आपके पास क्या है रेंडमल डाटा है कोई किसी के साथ इंटरकनेक्टेड नहीं है हां वैसे तो ये कनेक्टेड है यहां पर कि ये सब पार्ट किसके है लैंग्वेज के है लेकिन आपस में कोई इंटरकनेक्टेड नहीं रखते जैसे कि python-tk का मतलब है कि यदि मैं बोलूं पाइथन और जावा के बीच में क्या कनेक्शन है तो कोई कनेक्शन नहीं है दोनों अलग-अलग प्रोग्राम लैंग्वेज है बस सिंपल सा राइट तो नॉमिनल डाटा उस डाटा को बोलते हैं या फिर उस कॉलम को बोलते हैं यहां पर जिसके अंदर आपका जो डाटा होता है वो रैंडम कुछ भी पड़ा हो सकता है राइट कुछ भी मतलब रैंडम कुछ भी आप उसके अर रख सकते हैं राइट अब उसके बाद चलते हैं ऑर्डिनल डाटा ऑर्डिनल डाटा वो डाटा होता है या फिर ऑर्डिनल वेरिएबल वो वेरिएबल होता है यहां पर जिसके अंदर एक ऑर्डर फॉलो किया गया है अब ऑर्डर फॉलो करने का मतलब क्या हुआ गाइज यहां पर वेरी सिंपल आप जब भी किसी गारमेंट शॉप में जाते हैं या फिर कपड़े खरीदने जाते हैं यहां पर राइट तो वहां पे आपकी जो ड्रेस होती है यस उन ड्रेसेस के कुछ साइज के ऑर्डर होते हैं जैसे कि मैं बात करूं यहां पर सबसे स्मॉल साइज आती है कपड़े के अंदर सबसे स्मॉल साइज आती है फिर आपकी मीडियम आती है फिर आपकी लार्ज आती है फिर आपकी एक्स्ट्रा लार्ज आती है फिर डबल एक्सल आती है फिर ट्रिपल एक्सल आती है ऐसे करते करते आगे बढ़ते ती है राइट तो बेसिकली गाइ मैं यहां पे बात करूं तो यहां पे जो वेरिएबल है यस जो आपका कॉलम है यहां पर उस कॉलम के अंदर जो डेटा है वो अभी भी कैटेगरी कल डटा है मतलब आपका स्ट्रिंग टाइप का डाटा है लेकिन ये जो डाटा होता है वो एक ऑर्डर को फॉलो कर रहा था ऑर्डर को फॉलो करने का मतलब क्या है ए एम एल फिर उसके बाद एक्सेल फिर उसके बाद डबल एक्सेल फिर आपका ट्रिपल एक्सेल तो बेसिकली क्या हो रहा है यहां पर आपका जितना भी डाटा है वो एक सीक्वेंस ऑर्डर को फॉलो कर रहा होता है इसी वजह से हम इसको क्या बोलते हैं ऑर्डिनल डाटा बोलते हैं तो बेसिकली कैटेगरी कल वेरिएबल को हमने दो पार्ट के अंदर डिवाइड किया है एक तो है नॉमिनल नॉमिनल के अंदर कुछ भी आ सकता है उनके बीच में कोई आपस में इंटर कनेक्शन नहीं है मतलब इंटर रिलेशन नहीं है यहां पर दैट इज कॉल्ड ऑफ नॉमिनल डाटा ऑर्डिनल डाटा वो डाटा हो जाएगा जिसके अंदर आपस में क्या है इंटरकनेक्शंस आपको देखने को मिलते हैं जैसे कि वो एक ऑर्डर को फॉलो कर रहे होते हैं दैट इज कॉल ऑफ ऑर्डिन डेटा तो ये हमारे पास क्या है कैटेगरी वेलेबल को हमने दो पार्ट कर निन किया अब हम चलते हैं हमारे तीसरे और चौथे डेटा टाइप के ऊपर दैट इज कॉल ऑफ डेट टाइम एंड मिक्सड वेरिएबल देखिए डेट टाइम वेरिएबल किसे बोलते हैं यहां पर तो देखिए काफी ऐसे कॉलम होंगे जैसे मैं आपको एक एग्जांपल के तौर पे एक कॉलम बताता हूं अ फिलहाल इसके अंदर नहीं है मैं आपको एक कॉलम बता देता हूं जैसे कि आपके पास कोई कॉलम है उस कॉलम के अंदर आपके पास क्या पड़ गया डेट है मतलब डेट ऑफ जॉइनिंग है यहां पर जैसे डेट ऑफ जॉइनिंग के बारे में बात करूं तो देखिए 12 आपके पास जीरो व फिर उसके बाद 03 राइट इस तरह से आपके पास डेट पड़ी है तो उस तरह के डेटा टाइप को हम क्या बोलते हैं गाइस यहां पर उस टाइप के डेटा टाइप को हम बोलेंगे यहां पर डेट टाइम डेट यस क्या बोलेंगे यहां पर डेट टाइम डेट राइट इसके अंदर डेट भी हो सकती है टाइम भी हो सकता है डेट टाइम का कॉमिनेशन भी हो सकता है राइट उसके बाद में अगला जो हमारे पास है यहां पर दैट इज कॉल्ड ऑफ मिक्स वेरिएबल मिक्स वेरिएबल वो वेरिएबल होता है जिसके अंदर न्यूमेरिकल और कैटेगरी कल डाटा दोनों मिक्स करे हुए आपको देखने को मिलता है जैसे एग्जांपल के पे मैं मैं वेरिएबल का एक एग्जांपल देता हूं जैसे कि हमारे पास यहां पे देखिए एंप्लॉई आईडी यस इस डाटा के अंदर बात करें तो यहां पे एंप्लॉई आईडी या फिर आप बोल सकते हैं लोन आईडी इसके अंदर देखिए आपके पास नंबर और कैटेगरी दोनों मिक्स है यस नंबर और कैटेगरी दोनों मिक्स है इवन दैट यदि आप डिपेंडेंस को देखेंगे यहां पर तो डिपेंडेंट के अंदर देखिए ऊपर क्या चल रहा है आपका नंबर चल रहा है और अचानक से थ प्लस आ जाता है अचानक से क्या आता है 3 प्लस आता है 3 प्लस इज नॉट अ नंबर इट्स कॉल ऑफ आपके पास नंबर और स्ट्रिंग का मिक्स कॉमिनेशन तो बेसिकली इनको हम क्या बोलते हैं मिक्स डेटा टाइप बोलते हैं राइट तो बेसिकली गाइस यहां पर मशीन लर्निंग के अंदर आपको इतने तरीके के डेटा टाइप देखने को मिलते हैं अब मैं यहां पे बात करना चाहूंगा कि जब भी आप कोई डटा लेंगे और डेटा लेने के बाद में आप उसका इंफॉर्मेशन निकालेंगे तो इंफॉर्मेशन निकालने पर न्यूमेरिकल वेरिएबल में आपको इंटी जर और फ्लोट देखने को मिलेंगे अकॉर्डिंग टू योर आपके पास सिस्टम आपके पास इंटी जर 64 और फ्लोटिंग 64 आपको देखने को मिल सकता है उसके बाद कैटेगरी कल डाटा को यहां पर बोला जाता है ऑब्जेक्ट डाटा यस यहां पे क्या बोला जाता है ऑब्जेक्ट डाटा आपको देखने को मिलेगा हां आपको आईडिया होना चाहिए कि नॉमिनल डाटा कौन सा है और ऑर्डिनल डटा कौन सा है राइट तो आपको क्या मिलेगा ऑब्जेक्ट टाइप का डाटा देखने को मिलेगा डेट टाइम के अंदर डेट टाइम देखने को मिलेगा मिक्स वेरिएबल में भी आपको ऑब्जेक्ट डाटा ही देखने को मिलेगा आप जब यहां पर किसी डाटा का इंफॉर्मेशन निकालते हैं मतलब उसकी डेटा टाइप निकालते हैं तब आपको ये देखने को मिलेगा सबसे पहले हम ये जानते हैं कि डेटा क्लीनिंग होता क्या है तो डेटा क्लीनिंग आपके पास क्या होता है कि जो भी आपका रॉ मटेरियल डटा होता है उसको आप क्लीन करते हैं पहले तो हम ये समझते हैं कि हमारे पास जो डेटा सेट होता है उसके अंदर डेटा किस-किस तरह का हो सकता है तो डेटा आपके पास दो तरीके का हो सकता है या तो आपके पास एक न्यूमेरिकल डाटा आपको मिलेगा जहां पे आपको सारे नंबर्स देखने को मिलेंगे या फिर आपके पास एक कैटेगरी कल डाटा मिलेगा जहां पे आपका किसके नेम वगैरह मिलेंगे काफी बार आपको यहां पे तीसरी टाइप्स और चौथी टाइप्स का डाटा भी मिल सकता है आपको यहां पे जिसके अंदर आपके पास क्या होगा डेट डाटा होगा जहां पे आपके प्रॉपर्ली डेट लिखी होगी और फोर टाइप का होगा जिसके अंदर आपको मिक्स्ड डाटा मिलेगा तो आपके पा डेटा की टाइप्स की बात करूं तो फोर टाइप्स के डेटा के अंदर कैटेगरी इज किया गया है इन चार टाइप के डेटा के अंदर ही आप मशीन लर्निंग मॉडल को बिल्ड कर सकते हैं यदि आपका डाटा वीडियो फॉर्म के अंदर है या फिर आपके पास डाटा ऑडियो फॉर्म के अंदर है तो आपको उसे कन्वर्ट करना पड़ेगा इन दो टाइप के डाटा के अंदर या न्यूमेरिकल डटा के अंदर और कैटेगरी डेटा के अंदर लेकिन जब हम मशीन लर्निंग मॉडल बिल्ड करने जाते हैं तो मशीन लर्निंग मॉडल के अंदर जो रिक्वायर्ड डाटा होता है वो सारा का सारा एक न्यूमेरिकल डाटा होता है अब न्यूमेरिकल डाटा क्यों होता है क्योंकि देखिए मशीन लर्निंग एल्गोरिथम को जब हम इस्तेमाल करते हैं तो जो एल्गोरिथम हम यूज करते हैं वो होते हैं एक मैथमेटिकल फॉर्मूला जस्ट एक सिंपल अर्थमेटिक फॉर्मूले के अंदर बात करूं यहां पे तो y = + c ये क्या है आपके पास एक सिंपल लाइन की इक्वेशन है यही आपके पास एक मशीन लर्निंग मॉडल बनती है आगे जाते हुए इसके अलावा और भी एल्गोरिथम्स होती हैं अब इन एल्गोरिथम्स के अंदर हमें जरूरत होती है न्यूमेरिकल डाटा की ना कि हमारे पास कैटेगरी डेटा की ना ही हमें डेट डेटा की जरूरत पड़ती है और ना ही हमें मिक्स तरह के डेटा की जरूरत पड़ती है तो इस केसेस के अंदर हमें क्या करना पड़ता है डेटा को क्लीन करना पड़ता है डेटा को क्लीन करने का मतलब क्या है डेटा को हमारे पास मशीन लर्निंग थम के अंदर जो रिक्वायर्ड डेटा होता है उसके अकॉर्डिंग इसे कन्वर्ट करना होता है तो अब जरा समझते हैं कि डेटा क्लीनिंग के अंदर हमें कौन-कौन सा स्टेप्स लेना चाहिए सबसे पहले हम यहां पे डेटा क्लीनिंग की डेफिनेशन के ऊपर बात करें तो डेटा क्लीनिंग क्या है एक प्रोसेसर है जिसके लिए आप क्या करते हैं प्रिपेयर करते हैं अपने डाटा को किसके लिए एनालिसिस के लिए मशीन लर्निंग के लिए डीप लर्निंग के लिए या इन सब चीजों के लिए आप क्या करते हैं क्लीन करते हैं अब कैसे करते हैं यहां पे रिमूविंग करते हैं यहां पे या फिर मॉडिफाई करते हैं डाटा को जिसके अंदर आपका जो इनकरेक्ट डाटा होता है इनकंप्लीट डाटा होता है इन डेवले डेटा होता है डुप्लीकेट डटा होता है इसके अंदर थ्रू आप क्या करते हैं आप अपने डाटा को क्लीन करते हैं अब डेटा को क्लीन करने का मतलब क्या हो गया डाटा को क्लीन करने का मतलब क्या हो गया कि बेसिकली आपका जो डेटा मिलेगा स्टार्टिंग में वो आपका पास कुछ इस फॉर्मेट के अंदर आपको मिलेगा जैसे कि आप यहां पर आप देख पा रहे हैं यहां पे कि बेसिकली आपके सारा का सारा क्या है आपके पास कैटेगरी डटा है इस डाटा को कन्वर्जन करके आपको क्या करना पड़ता है इस तरह के एक नंबर डाटा की फॉर्मेट में कन्वर्ट करना होता है जहां आपके आज के जो कॉलम के नंबर है कॉलम के नाम है उस कॉलम के नाम के अंदर केवल और केवल क्या होगा न्यूमेरिकल डाटा ही प्रेजेंट मिलेगा आपको और किसी तरीके का बिल्कुल भी डाटा आपको नहीं देखने को मिलेगा अब इसके अंदर हम क्या-क्या स्टेप लेने वाले हैं तो बेसिकली इसके अंदर बहुत सारे स्टेप्स है यहां पे लेकिन मैं उस मोस्ट इंपोर्टेंट स्टेप्स की बात कर रहा हूं जो कि आपको फॉलो करने ही करने होते हैं सबसे पहले हम क्या करते हैं मिसिंग वैल्यू को हैंडल करते हैं उसके उसके बाद हम आउटलायर को डिटेक्ट करते हैं और उसे हैंडल करते हैं उसके बाद हम स्केलिंग करते हैं और काफी बार हम ट्रांसफॉर्मेशन का भी इस्तेमाल करते हैं इसके बाद हम यहां पे इनकोडिंग भी करते हैं डुप्लीकेट डटा को भी रिमूव करते हैं और जो हमारे पास इनकंसिस्टेंट डाटा है उसे भी हैंडल करते हैं अब वन बाय वन समझते हैं ये होता क्या है कैसे-कैसे क्या प्रोसीजर है तो देखिए सबसे पहले मैं डेटा सेट के ऊपर ले जाता हूं जो कि एक बेसिक डेटा सेट है अब इस डेटा सेट के अंदर देखेंगे तो आपके पास देखिए प्रोडक्ट नेम के अंदर आपके पास बहुत सारा डटा आपको देखने को मिलेगा इसके अंदर आपके पास बहुत सारा मिक्स डाटा है तो अब हमें क्या करना पड़ता है कि हम इस डाटा को डायरेक्टली हमारे मशीन लर्निंग एल्गोरिथम को नहीं दे पाएंगे तो फिर हमें क्या करना पड़ता है इस डाटा को हमें क्लीन करना पड़ता है क्लीन करके हमें क्या करना पड़ता है कि इसके अलग-अलग तरीके के जो कॉलम्स है वो बनाने पड़ते हैं जैसे कि जो भी कैटेगरी डटा होता है उसे हम न्यूमेरिकल डाटा में कन्वर्जन करते हैं तो ये हमारा नेक्स्ट प्रोसीजर यहां पे होता है थर्ड प्रोसीजर यहां पे देखिए आपके जो डेटा है जैसे कि यहां पे रम लिखा है रम के अंदर आप देखेंगे तो डेटा आपके पास क्या है मिक्स डटा है इसे हम इनकंसिस्टेंट डेटा बोलते हैं जिसके अंदर आपके पास क्या मिक्स डाटा है नंबर भी मिक्स है आपके पास यहां पे और कैटल डेटा भी मिक्स है तो इस केसेस में हम क्या करते हैं नंबर ऑफ कटल डेटा को अलग-अलग करते हैं और जो हमारे पास सारा डेटा होता है उसे नंबर डेटा के अंदर कन्वर्जन करते हैं अब मे जैसा कि बोला कि मिसिंग डाटा भी होता है आपके पास यहां पे मिसिंग डाटा इस वक्त ऐसे डाटा को बोलते हैं जहां पे आपके पास कॉलम के अंदर बहुत सारी मिसिंग वैल्यू होती है मतलब काफी बार क्या होता है यूजर जो होते हैं जो इस डेटा सेट को तैयार कर रहे होते हैं यस वो क्या करते हैं यहां पे काफी कॉलम को मिस कर देते हैं मतलब छूट देते हैं ब्लैंक कर देते हैं अब ब्लैंक करने की वजह से आप क्या करते हैं यहां पे कि आपको जो आउटपुट है वो आपको ब्लैंक नजर आएगा यहां पे अब जब यहां पे आउटपुट आपका ब्लैंक नजर आता है तो आपके पास यहां पे मिसिंग डाटा होता है और इस मिसिंग डाटा के ऊपर आपका जो मशीन लर्निंग एल्गोरिथम है वो बिल्कुल भी वर्क नहीं कर पाती है तो हमें क्या करना पड़ता है काफी बार इस मिसिंग वैल्यू को भी हैंडल करना पड़ता है काफी बार आपके डाटा के अंदर डुप्लीकेट डाटा भी देखने को मिलता है डुप्लीकेट डटा का मतलब क्या है काफी रो जो होती है वो बार-बार अपने आप को रिपीट कर रही होती है अब वो जो डाटा होता है वो आपके लिए बिल्कुल यूजफुल नहीं होता है उस केसेस के अंदर हमें क्या करना पड़ता है डेटा को क्या करना पड़ता है यहां पे बैलेंसिंग करना पड़ता है जो भी आपका डेटा सेट है उस डेटा के अंदर यदि आपकी डुप्लीकेट टू वैल्यू प्रेजेंट है तो उन डुप्लीकेट वैल्यू को हटाना पड़ता है तो ये कुछ बेसिक स्टेप थे जो कि हम यहां पे आगे आने वाले वीडियो के अंदर सीखेंगे जिसके अंदर हम मिसिंग वैल्यू को हैंडल करना भी सीखेंगे आउटलायर जो होता है अब आउटलायर क्या होता है कि बेसिकली आपके डेटा सेट के अंदर कुछ ऐसा डाटा होता है जो कि उस रेंज से बियोंड होता है बियोंड का मतलब क्या है बेसिकली मैं बात करूं कि आपके पास जो आपकी कंपनी के अंदर 10 एंप्लॉय काम कर रहे हैं 10 एंप्लॉई की जो सैलरी है यहां पे वह आपके सैलरी जो होती है वह 5 लाख टू 10 लाख होती है लेकिन आपकी कंपनी के अंदर आपके जो बॉस है या आपके कंपनी के जो सीईओ है वो भी वर्क कर होते हैं उनकी जो सैलरी होती है वह 50 लाख के अराउंड होती है या फिर 20 लाख के अराउंड होती है तो वो आपके डटा सेट के लिए क्या होता है एक आउटलायर की तरफ बिहेव करते हैं तो आप उनको भी क्या करते हैं हैंडल करते हैं क्योंकि व आगे चलते हुए मशीन लर्निंग अलमको अंदर रॉन्ग प्रेडिक्शन करते हैं तो बेसिकली इसके लिए आपको क्या करना पड़ता है आउटलायर को भी हैंडल करना पता है काफी बार डेटा को स्केलिंग करनी पड़ती है डाटा के अंदर इन बैलेंसिंग होती है तो वहां पे आप स्केलिंग करते हैं ट्रांसफॉर्मेशन हम इसलिए करते हैं क्योंकि डेटा सेट के अंदर जो डेटा होता है आपके पास यहां पे वो नॉन नॉर्मल डिस्ट्रीब्यूशन डटा होता है उसको आपको नॉर्मल डिस्ट्रीब्यूशन डेटा के अंदर कन्वर्जन करने के लिए आपको ट्रांसफॉर्मेशन की भी जरूरत पड़ती है उसके बाद आप अन कोडिंग भी करते हैं जिसके थ्रू आप यहां पे मैंने अभी बताया था कि जो आपका कैटेगरी डटा होता है उसे न्यूमेरिकल डेटा में करते हैं डुप्लीकेट डाटा भी हैंडल करते हैं और इनकंसिस्टेंट डटा को भी हैंडल करते हैं तो ये कुछ प्रोसेसर है ये कुछ स्टेप्स हैं जिनको फॉलो करते हुए आप अपने डाटा को क्या करते हैं क्लीन करते हैं और आप अपने को तैयार करते हैं किसके लिए मशीन लर्निंग एल्गोरिथम के लिए हे एवरीवन वंस अगेन वेलकम टू डब्ल्यू कपटेक माय सेल्फ गरा और आज के इस वीडियो के जरिए हम ये समझने वाले हैं मिसिंग कंटेंट क्या होता है और इसे कैसे फाइंड आउट किया जाता है और इसके कैलकुलेशंस कैसे की जाती है इन सारी चीजों के बारे में डिटेल के साथ देखने वाले हैं तो सबसे पहले ये समझते हैं कि मिसिंग कंटेंट आता कैसे है मतलब यदि हम किसी डेटाबेस के अंदर देखें तो उसके अंदर मिसिंग कंटेंट कैसे आया है यहां पे उसको एक टस एग्जांपल के थ्रू समझते हैं यदि आपको पाइथन मशीन लर्निंग डेटा साइंस एंड डेटा एनालिस जैसी फीड में अपने आपको को ग्रो करना है तो इसके लिए डब्लू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जवाइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो मेरे पास एक google-my के लिए फॉर्म फिल किया होगा या फिर फिर आपने किसी गवर्नमेंट जॉब के लिए फिल किया होगा यहां पे तो कुछ इस तरह के फॉर्म्स आपको दिखाई देते हैं अब इस फील के अंदर आपको कुछ चीजें मैंडेटरी दिखाई दे रही है और कुछ चीजें नॉन मैंडेटरी दिखाई दे रही है अब एज अ यूजर क्या करते हैं आप यहां पर जो मैंडेटरी चीजें हैं वो आप जरूर फिल कर देते हैं जैसा कि मैं यहां पे अपनी डाटा फिल कर रहा हूं अब मुझे फादर नेम डालना है तो मैं यहां पे अपना फादर नेम डाल देता हूं देन नेक्स्ट अब हम बात करते हैं यहां पे कि क्लास के बारे में बात करें तो क्लास हमारे पास कोई मैंडेटरी ऑप्शन नहीं है अब जब मैंने इस डाटा को यहां पे नहीं चेक आउट किया और सब्जेक्ट भी हमारा कोई मैंडेटरी ऑप्शंस नहीं है और मैंने इसको भी चेक आउट नहीं किया और एड्रेस को भी चेक आउट नहीं किया तो ये वाला जो डाटा अंदर जाके जब सेव होता है तो वहां पे ब्लैंक स्पेस आ जाता है मतलब यदि मैं इस डाटा को ले जाके अपने किसी भी डेटाबेस के अंदर स्टोर करूं चाहे वो एक्सेल फॉर्मेट में हो चाहे वो माल फॉर्मेट में हो या किसी भी डेटा सर्वर के फॉर्मेट में हो जब ये डेटा अंदर जाके सेव हो होता है उस वक्त यह आपके पास क्या करता है वहां पे ब्लैंक वैल्यू रख देता है इसी को हम बोलते हैं मिसिंग कंटेंट जैसा एक छोटा सा एग्जांपल और देखें यहां पे तो मेरे पास एक एक्सल सीट है इस एकल सीट के अंदर आपको ऐसा डाटा दिखाई देगा जहां पे बहुत सारे मिसिंग कंटेंट दिखेंगे जैसा कि मैं यहां पे इस डेटा सेट के ऊपर बात करूं तो देखिए लोन अमाउंट्स के अंदर ये आपको एक मिसिंग डाटा दिखाई देगा इसका मतलब क्या है कि जब यूजर ने इस फॉर्म को फिल किया होगा या जहां से ये डाटा आया होगा उस वक्त उस जगह पर कोई भी डाटा नहीं पहुंच पाया है या फिर उस जगह पर उस यूजर ने उस डाटा को फिल नहीं किया है तो इस तरीके के डाटा को बोलते हैं मिसिंग डाटा अब इस मिसिंग डाटा को हमें यहां पर हटाना बहुत ज्यादा जरूरी होता है अब हटाना है या फिर फिल करना है वो आपके डिसीजन पे मैटर करता है बट यह हटाना क्यों जरूरी है इसके पीछे रीजन यह है कि जब भी आप मशीन लर्निंग एल्गोरिथम के ऊपर काम करते हैं तो एल्गोरिथम मिसिंग वैल्यू पे काम नहीं करती है क्योंकि इसके पीछे सबसे बड़ा रीजन यह है कि जो भी आप मशीन लर्निंग एल्गोरिथम लगाएंगे वो होते हैं एक मैथमेटिकल फार्मूला मतलब बेसिक लैंग्वेज में बात करें तो एक मैथ का एक सिंपल सा फार्मूला होता है जिसे हम मशीन लर्निंग एल्गोरिथम बोलते हैं अब उस मैथ के फार्मूले के अंदर यदि हम इस मिसिंग डाटा को वहां पे ले जा के रखेंगे तो मैथ का फार्मूला कंफ्यूज हो जाएगा कि यहां पे क्या डाटा है बेसिकली बात करें मैं एक सिंपल सा क्वेश्चन आपको यहां पे देता हूं कि 2 * 2 करेंगे तो आंसर क्या आएगा आप लोगों का आंसर आएगा फोर यदि मैं बोलूं ब्लैंक * 2 कीजिए तो आपका आंसर क्या आएगा तो आप बोलेंगे सर ब्लैंक के साथ किसी भी नंबर को मल्टीप्लाई नहीं किया जा सकता क्योंकि ब्लैंक कंटेंट ही नहीं है वहां पर हमारे पास कोई डाटा ही प्रेजेंट नहीं है वहां पर तो हम उसका मल्टीप्लिकेशन कैसे कर सकते हैं तो बेसिक बात करें यहां पे कि जब भी आप मशीन लर्निंग या फिर डीप लर्निंग दोनों के अंदर बात करें यहां पे तो मशीन लर्निंग या डीप लर्निंग ंग के अंदर जब भी आप डेटा सेट के ऊपर काम करते हैं तो उस वक्त मिसिंग वैल्यू नहीं होनी चाहिए क्योंकि यदि आपके डाटा के अंदर मिसिंग वैल्यू प्रेजेंट हुई तो वो फार्मूला या फिर मशीन लर्निंग एल्गोरिथम या डीप लर्निंग के न्यूरल नेटवर्क्स आपके पास वर्क नहीं करेंगे तो इसलिए हमें हमारे डेटा सेट के अंदर मिसिंग वैल्यू को हमें कंप्लीट हटाना चाहिए या फिर इसके अंदर कोई डाटा फिल करना चाहिए इसके पीछे का रीजन हम थोड़ी देर में जानेंगे लेकिन सबसे पहले हमें यह पता करना चाहिए डाटा सेट के अंदर प्रेजेंट है या नहीं है हमें यह पता करना चाहिए तो अब इस वीडियो को मैं दो पार्ट के अंदर स्प्लिट कर रहा हूं पहला पार्ट यहां पे ये होगा जिसके अंदर हम ये जानेंगे कि किसी भी डेटा सेट के अंदर मिसिंग वैल्यू है या नहीं है सेकंड पार्ट के अंदर हम ये जानेंगे कि इस मिसिंग वैल्यू के साथ अब हमें आगे क्या ऑपरेशन करना है क्यासे रखना है क्या इससे हटाना है यदि इसे रखना है तो रखने के वक्त हमें इसके अंदर क्या डाटा फिल करना है वो सारी चीजों के बारे में देखने वाले हैं तो पहले पार्ट के अंदर हम ये जानते हैं कि मिसिंग वैल्यू को हम कैसे पहचान सकते हैं तो ये मेरे पास एक डेटा सेट है जैसा कि आप देख रहे हैं जिसका नाम है लोन . सएससी अब ये जो डाटा है वो एक बैंक का डाटा सेट है जिसके अंदर किसी पर्सन को लोन सेंशन हुआ है या नहीं हुआ है उससे रिलेटेड कुछ डटा है यहां पे अब इस डाटा के अंदर हमारे पास बहुत सारी जगह पर मिसिंग वैल्यू है अब देखिए यदि आप डायरेक्टली फाइंड आउट करने जाएंगे मिसिंग वैल्यू को तो डायरेक्टली आपको डाटा नहीं मिलेगा मिसिंग वैल्यू को फिलहाल ये सबसे ऊपर ही था तो इसलिए हमें दिख गया है बाकी ऐसे आप सर्च करने बैठेंगे तो आपको डाटा के अंदर मिसिंग वैल्यू नहीं मिलेगा और इवन दैट आप ये भी कैलकुलेशन नहीं लगा पाएंगे कि किस कॉलम के अंदर कितनी मिसिंग वैल्यू है यदि मैं एज अ परसेंटेज के तौर पर बात करूं तो वो भी आप अच्छे से फाइंड आउट नहीं कर पाएंगे तो अब हमें ये फाइंड आउट करना जरूरी है क्योंकि एज अ डाटा साइंटिस्ट हमें मिसिंग वैल्यू को हटाना है यहां से तो अब इसके लिए हम क्या करेंगे पांडा का इस्तेमाल करेंगे पांडा का इस्तेमाल करने के लिए मैं जुपिटर नोटबुक का इस्तेमाल करूंगा और जुपिटर नोटबुक के थ्रू ही ये सब चीजें फाइंड आउट करने वाला हूं सबसे पहले आप अपने सिस्टम के अंदर जुपिटर नोटबुक को इंस्टॉल कर लें और जुपिटर नोटबुक को इंस्टॉल करने के बाद में हम यहां पर हमारा जो कोड है वो इसके अंदर लिखने वाले हैं तो इसके लिए हमें पांडा की जरूरत पड़ेगी तो मैं सबसे पहले क्या करने वाला हूं इंपोर्ट करने वाला हूं और इंपोर्ट क्या करूंगा पांडा एलियास ऑफ पीडी मैं यहां पे इंपोर्ट करूंगा यस सबसे पहले हमने पांडा की लाइब्रेरी को इंपोर्ट किया है देन उसके बाद में हम हमारे जो डेटा सेट है उसे लोड कराएंगे डेटा सेट को लोड कराने के लिए पीडी डॉट यहां पर रीड सीएवी का इस्तेमाल करूंगा अब नेक्स्ट चीज यहां पे आएगी कि मेरे पास डेटा सेट का एड्रेस क्या है और डेटा सेट का नाम क्या है तो डटा सेट का यदि आपको एड्रेस लेके आना है तो देखिए एड्रेस आपको सबसे टॉप में ही मिल जाएगा ये रहा आपका डेटा सेट का एड्रेस डी डाइव के अंदर है डेटा सेट के नाम से और वीडियो के नाम से हमारे पास है तो मैं इसे जस्ट आपके पास क्या करता हूं कॉपी कर लेता हूं और उसके बाद यहां पे पेस्ट कर देता हूं उसके बाद मेरे पास जो सेट का नाम है मतलब आपका डेटा सेट का नाम है वो क्या है लोन . सीएवी है तो मैं वीडियोस के बाद में स्लैश लगाता हूं स्लैश लगाने के बाद में अ देखिए मेरे डाटा सेट का नाम क्या है लोन सवी तो मैं इसे क्या करता हूं रिनेम के थ्रू यहां पे जो इसका नाम है वो पूरा का पूरा गेट कर लेता हूं और यहां पर रख लेता हूं अब जब भी आप किसी पांडा के थ्रू किसी डाटा सेट को गेट करने जा रहे हैं तो उस सो यहां पे जो आप स्ट्रिंग दे रहे हैं उसके आगे आपको क्या लगाना है r लगाना है इस आर को बोलते हैं रॉ स्ट्रिंग यहीं से जो हमारा यहां पे जो लिखा हुआ टैक्स्ट है वो पाथ के अंदर कन्वर्ट हो जाएगा यूजिंग अ रॉ स्ट्रिंग के जरिए अब ये जो डेटा सेट है इसके अंदर हमारा डेटा आ चुका है अब डेटा सेट आने के बाद में हम यहां पे क्या करेंगे हम हमारे डेटा सेट को देखेंगे डाटा सेट को देखने के लिए डॉट हैड का इस्तेमाल करूंगा और हेड के जरिए तीन डाटा को मैं यहां पे देखूंगा ताकि हम हमारे डाटा को थोड़ा सा समझ सके कि किस तरह का हमारे पास डाटा है यहां पे कि किस कॉलम के अंदर कौन सा डाटा प्रेजेंट है अब नेक्स्ट चीज यहां पर हमारे पास ये रही कि इसके अंदर ओवरऑल कितना डेटा प्रेजेंट है मतलब कितने नंबर ऑफ रो है कितने नंबर ऑफ कॉलम्स हैं यह हमें जानना बहुत ज्यादा जरूरी है अदर वाइज यदि हम ये नहीं जानेंगे तो आगे जाते हुए हम परसेंटेज कैलकुलेशन नहीं कर पाएंगे कि पर्टिकुलर कॉलम के अंदर कितनी परसेंटेज नल वैल्यू प्रेजेंट है तो इसके लिए हम क्या करेंगे गाइज यहां पे तो सबसे पहले मैं डेटा सेट के अंदर क्या जाता हूं यहां पे चलता हूं और इसके बाद में मैं यहां पे इसकी टोटल डाटा गेट करता हूं कितना हमारे पास डाटा है तो उसके लिए मैं क्या करूंगा डेटा सेट को कॉल करूंगा एंड दैट यहां पर सेव लगा के कॉल कर दूंगा अब सेकंड चीज यहां पर हम ये देखेंगे कि नल वैल्यू हमें दिखती कैसी है मतलब यदि मैं एक्सल शीट को ओपन करता हूं तो यहां पे नल वैल्यू तो हमें ब्लैंक के तौर पे दिखाई देती है लेकिन जब मैं पांडा का इस्तेमाल करता हूं तो उसके अंदर नल वैल्यू किस तरह से दिखाई देती है ये हमें कैसे पता चलेगा तो उसके लिए जैसे ही आप यहां पर अपने डाटा सेट को लोड करेंगे जैसे कि मैं यहां पे क्या करता हूं हमारे 10 डाटा को यहां पे लोड करता हूं तो न डाटा को जैसे ही मैंने लोड कराया तो अब हमें नल वैल्यू कैसे दिखाई देगी तो इसके अंदर जैसे ही आप थोड़ा सा और मूव करेंगे तो आपको एक एन ए के नाम से आपको मिलेगा एन ए ए के नाम से एक डाटा मिलेगा जो कि आपके पास नल वैल्यू को रिप्रेजेंट कर रहा होगा मतलब कि यहां पर यह है कि यह एक मिसिंग कंटेंट है कहीं पे भी आपको एन ए एन आपको देखने को मिल जाए इसका मतलब डेफिनेटली वो आपके पास क्या है मिसिंग कंटेंट है यदि मैं यहां प देखूं तो इस जगह पर भी एन एन मुझे दिख रहा है इसका मतलब इसके अंदर भी क्या है एक मिसिंग कंटेंट है अब मुझे यहां पे क्या करना है मुझे पता लगाना है कि इसके अंदर टोटल नंबर ऑफ मिसिंग कंटेंट कितने हैं क्योंकि यदि मैं डायरेक्टली सर्च करूंगा तो बहुत ही ज्यादा डिफिकल्ट हो जाएगा क्योंकि डेटा हमारे पास एक लिमिटेड डेटा नहीं होगा बहुत ही लार्ज अमाउंट में डेटा होगा कभी-कभी आपको बिग डाटा के ऊपर भी काम करने की जरूरत पड़ सकती है तो वहां पे भी हमें नल वैल्यू को फाइंड आउट करना आना चाहिए तो उसके लिए हम क्या करेंगे कि हमारा जो डेटा सेट है जिसके बारे में हम यहां पे काम कर रहे थे फिलहाल मैं इसे वापस क्या कर देता हूं थ्री कर देता हूं ताकि हमारे पास यहां पे लिमिटेड अमाउंट प डाटा हमें दिखे और उसी से हम सारी एनालिसिस कर सके तो मैं वापस यहां प चलता हूं और उसके बाद में मैं अपना डेटा सेट को क्या करता हूं कॉल करता हूं डेटा सेट को कॉल करने के बाद में पांडा का एक फंक्शन होता है इज नल इज नल के नाम से आप क्या करते हैं इस फंक्शन को कॉल करते हैं तो ये क्या करता है कि जहां पे आपका मिसिंग कंटेंट होता है वहां पे आपको ट्रू रिप्रेजेंट करता है और बाकी सारी जगह फॉल्स रिप्रेजेंट कर देता है तो मैं यहां पे क्या कर रहा हूं इस नल को मैं कॉल कर रहा हूं एंड देन रन कर रहा हूं तो जैसे ही मैंने इस नल को कॉल किया यहां पे आप देख पाएंगे कि आपके पास जो भी डाटा है यहां पे जो भी आपका डेटा सेट है उसके अंदर जहां-जहां आपकी नल वैल्यू है वहां पे आपको ट्रू रिप्रेजेंट कर रहा है और जहां नल वैल्यू नहीं है वहां पे आपको क्या कर रहा है फॉल्स रिप्रेजेंट किया जा रहा है अब मुझे तो यहां पे काउंटिंग करनी है कि कितनी नल है और कितनी नॉट नल है तो बेसिकली मैं यहां पे इसके पीछे जाऊंगा और डॉट सम नाम से एक फंक्शन को कॉल कर दूंगा अब डॉट सम नाम का फंक्शन क्या करेगा इसके अंदर क्या करेगा जितनी भी नल वैल्यू है मतलब जितने भी आपके पा ट्रू है यहां पे उनकी काउंटिंग करके हमें दे देगा एंड देन जैसे ही मैं रन करूंगा तो मेरे पास पर्टिकुलर जिस कॉलम के अंदर नल वैल्यू प्रेजेंट है उसकी काउंटिंग हमारे पास आ जाएगी जैसे आप लोन आईडी को देखेंगे तो इसके अंदर क्या है जीरो है जेंडर को देखेंगे तो इसके अंदर 13 है देखेंगे तो सिक्स है डिपार्टमेंट को देखेंगे 15 है एजुकेशन में नाइन है एंड एप्लीकेशन इनकम के अंदर टू है तो ऐसे करके हमें यहां पे हर कॉलम के बारे में अंडरस्टैंडिंग हो गई है कि किसके अंदर कितनी नल वैल्यू प्रेजेंट है बट यहां पे एक छोटी सी मिस्टेक है कि केवल आपको यदि मैं बोलूं कि जेंडर के अंदर 13 मिसिंग वैल्यू है तो इससे आप एक बेटर अंडरस्टैंडिंग नहीं कर पाएंगे तो अब इसको बेटर अंडरस्टैंडिंग कराने के लिए हमें यहां पर निकालनी पड़ती है परसेंटेज नल वैल्यू क्योंकि परसेंटेज नल वैल्यूज के थ्रू हम काफी अच्छे-अच्छे डिसीजन बना सकते हैं कि इस कंटेंट को हमें रखना है या इस कंटेंट को हमें हटाना है तो अब हम क्या करेंगे इसके अंदर परसेंटेज नल वैल्यू निकालेंगे अब परसेंटेज नल वैल्यू निकालने के लिए आपको थोड़ा सा परसेंटेज का फॉर्मूला आना चाहिए और जो कि आप बचपन में बहुत अच्छे तरीके से सीख चुके होंगे कि आप क्या करते हैं कि जो भी आपका डाटा ऑब्टेन होता है उसको डिवाइड कर देते हैं टोटल नंबर ऑफ़ डाटा से एंड मल्टीप्लाई बा 100 कर लेते हैं तो यह आपका परसेंटेज का फॉर्मूला होता है हम भी वही यहां पे लगाने वाले हैं कैसे जरा समझिए यहां पे तो मेरे पास ये डटा सेट इनल सम है यहां पे मैं इसी को वापस यहां पे लिखूंगा देन मैं डिवाइड कर दूंगा डिवाइड मुझे क्या करना है गाइज यहां पे डटा सेट डॉट यहां पर मैं शेप को कॉल करूंगा देन स्क्वायर ब्रैकेट ऑफ 0 लगाऊंगा अब ये स्क्वायर ब्रैकेट ऑफ जीरो क्या है तो इसके लिए आपको थोड़ी बहुत पांडा की नॉलेज होनी चाहिए यदि आपको पांडा की नॉलेज नहीं है तो आप हमारे जो पांडा के वीडियोस हैं डब्लू एस कपट के youtube4 पे पड़े हैं आप वहां जाके देख सकते हैं पांडा के वीडियो और आप पांडा को पहले अच्छे तरीके से कवर कर लीजिए क्योंकि जितने भी आगे वाले जितने भी वीडियो आने वाले हैं यहां पे उनके अंदर पांडा का बहुत ज्यादा यूज़ होने वाला है तो एक तरीके से मान लीजिए कि मशीन लर्निंग की शुरुआत करनी है आपको तो पांडा का आना बहुत ज्यादा जरूरी है तो इसलिए पांडा के जो हमारे वीडियोस हैं उन्हें आप देखिए वहां से आप पांडा सीख लीजिए एंड देन आप इसके कंटेंट के ऊपर आगे से आगे वर्क कीजिए यदि नहीं आता है तो आप यहां पर फर्द कैरी ऑन कीजिए आपको काफी चीजें अच्छे से और चीजें देखने को मिलेगी चलिए मैंने टा सेटड शप के पीछे रो क्यों लगाया है इसको भी अब जरा समझ लेते हैं यहां पे तो मैं क्या करूंगा गाइज यहां पे कि मैं डाटा सेट के पास जाऊंगा डॉट यहां पर शेप को कॉल करूंगा देन स्क्वायर बकेट जीरो लगाऊंगा तो ये 600 जो 18 हमारे पास जो टोटल नंबर ऑफ रो है वो हमें डायरेक्टली मिल जाती है और बेसिकली हमें वही चाहिए क्यों चाहिए कि हमारे पास डेटा सेट के अंदर कितनी नल वैल्यू प्रेजेंट है उसका हमें सम मिल चुका है और पर कॉलम के अंदर टा सेटड इ नल को हमने क्या किया हमारे पास पर पर्टिकुलर कॉलम के अंदर कितनी नल वैल्यू प्रेजेंट है वो हमने देखी यहां पर उसके बाद सेप के थ्रू हमने क्या देखा यहां पे कि टोटल नंबर ऑफ़ रो कितनी है वो हमें मिल गई यहां पे अब मुझे क्या करना है इस पूरे डाटा को मल्टीप्लाई बाय 100 कर देना है और मल्टीप्लाई बाय 100 जैसे ही करूंगा तो मुझे मेरे डटा के अंदर कंटेंट मिल जाएगा कि किसके अंदर कितनी नल वैल्यू प्रेजेंट है जैसे कि आप यहां पे देखेंगे तो इसके अंदर 2 पर नल वैल्यू है अब देखिए ऊपर चल के देखेंगे तो 13 नल वैल्यू थी लेकिन अब परसेंटेज के अंदर जब हमारे पास नल वैल्यू आ चुकी है तो अब हमें बेटर अंडरस्टैंडिंग हो रही है कि किसी पर्टिकुलर कॉलम के अंदर कितनी नल वैल्यू परसेंट है कि 100 के अंदर कैलकुलेशन करना थोड़ा इजी होता है क्योंकि यदि में हम ओवरऑल डेटा सेट के ऊपर बात करें तो डटा हमारे पास कम या ज्यादा कितना भी हो सकता है जैसे कि यहां पर देख रहे हैं 618 रोज है यहां पे तो उसके अंदर हमें कुछ बेटर अंडरस्टैंडिंग नहीं हो पा रही थी कि 618 में से 30 रो फिल ब्लैंक है यहां पे तो उसके बारे में हम प्रॉपर्ली अंडरस्टैंडिंग नहीं कर पा रहे थे जबकि हम यदि परसेंटेज वैल्यू निकाल रहे हैं तो यहां पर प्रॉपर अंडरस्टैंडिंग भी कर पा रहे हैं कि नल वैल्यू कितनी प्रेजेंट है अब सेकंड चीज हम यहां पर ये जानेंगे कि टोटल यहां पे कितनी नल वैल्यू प्रेजेंट है मतलब यदि मैं इन सबको टोटल कर दूं तो कितनी नल वैल्यू प्रेजेंट होगी हमारे यहां पे डटा सेट के अंदर वो अब हम यहां पे निकाल रहे हैं तो उसके लिए हम क्या करेंगे गाइज यहां पे कि ये जो डाटा सेटड इनल लिखा ना यहां पे मैं इसी के ऊपर चलूंगा वापस तो मैं डटा सेट के पास जाऊंगा डॉट इनल को कॉल करूंगा यस इ नल को मैंने कॉल किया इ नल के बाद में डॉट यहां पर सम को लगाया डॉट सम को जैसे ही मैं लगाता हूं तो मुझे हर एक कॉलम के अंदर कितने वैल्यू प्रेजेंट है वो मुझे मिल रही है लेकिन यदि मैं इसके पीछे एक और सम लगा दूं तो मेरे ओवरऑल डाटा के अंदर कितनी नल वैल्यू प्रेजेंट है वो मुझे मिल जाएगी और वो कितनी है 179 नल वैल्यू प्रेजेंट है अब बेसिकली नेक्स्ट स्टेप में हम ये जानने की कोशिश करेंगे कि ये जो 179 जो आपके पास रो खाली है ये कितने परसेंट खाली है हमारे ओवरऑल डाटा के अंदर ओवरऑल डेटा मतलब यदि मैं रो एंड कॉलम को मल्टीप्लाई करूं तो मुझे क्या मिलेंगे पर सेल मिलेंगे तो पर सेल के हिसाब से ये नल वैल्यू खाली है तो ओवरऑल डेटा सेट के अंदर से कितनी नल वैल्यू खाली है इसके अंदर मतलब कितनी नल वैल्यू आपके पास प्रेजेंट है यहां पे वो अब हम निकाल रहे हैं तो उसको यदि आपको फाइंड आउट करना है तो बहुत ही इजी काम है यहां पे वापस आप इसको ले लीजिए यहां पे वापस एंड उसके बाद में आपको क्या करना है डिवाइड करना है अब डिवाइड किससे करेंगे आप यहां पे तो ये जो डटा सेट डॉट शेप दिख रहा है यहां पे इन दोनों नंबर को मल्टीप्लाई कराना है और आपका काम हो जाएगा तो मैं टा सेट डॉट यहां पर मैं शेप को कॉल करूंगा देन स्क्वायर ब्रैकेट ऑफ 0 लगाऊंगा और इसको मल्टीप्लाई कर दूंगा किससे डटा सेट डॉट यहां पर फिर से मैं शेप को कॉल करूंगा n1 से अब ये क्या हो गया मेरे पास यहां पे नीचे तो टोटल नंबर ऑफ डाटा आ गया ऊपर टोटल नंबर ऑफ नल वैल्यू आ गई है और इसके बाद में मुझे परसेंटेज में निकालना है तो मैं मल्टीप्लाई बाय क्या करूंगा यहां पे 100 करूंगा तो मेरे पास ओवरऑल डेटा सेट्स के अंदर जाके देखें तो 2 पर नल वैल्यू का रिजेंट है अब देखिए यहां पे आप बहुत ही बड़ा डिफरेंस देखेंगे कि पर कॉलम के अंदर चलेंगे तो पर कॉलम के अंदर बात करें तो किसी के अंदर 8 पर है किसी के अंदर 3 पर है किसी के अंदर 2 पर है लेकिन यदि मैं ओवरऑल टा सेट की बात करूं तो वहां पे हमारे पास कितनी परसेंट नल वैल्यू है यहां पर हमारे पास 2 पर नल वैल्यू है या फिर बात करें 2.2 पर नल वैल्यू प्रेजेंट यहां पर है हमारे पास तो इस तरह से आप क्या करते हैं डेटा सेट के अंदर नल वैल्यू को फाइंड आउट करते हैं अब यदि मेरा क्वेश्चन थोड़ा सा रिवर्स यहां पे हो जाए कि यदि मेरे पास डाटा सेट के अंदर कितनी नॉट नल वैल्यू प्रेजेंट है तो आप कैसे निकालेंगे तो उसका सवाल सिंपल सा उसका जवाब है यहां पे कि हमारे पास पांडा के अंदर एक फार्मूला होता है जिसके थ्रू हम नॉट नल वैल्यू को भी फाइंड आउट कर सकते हैं कैसे देखिए डेटा सेट के अंदर चले लेंगे डॉट यहां पे आपको क्या लिखना है नॉट नल को कॉल करना है नॉट नल को कॉल करेंगे डॉट यहां पे सम को कॉल करेंगे एंड रन करेंगे तो हर कॉलम के अंदर कितनी नल वैल्यू प्रेजेंट नहीं है मतलब फिल डाटा कितना है यहां पे वो चीज आपको मिल जाएगा यदि मैं यहां पे डॉट सम को कॉल करूं यहां पे एक बार और से तो यहां पे टोटल जो आपके पास फिल डाटा है वो भी हमें यहां पर देखने को मिल जाएगा अब यह तो हो गया हमारे पास नंबर्स की बात लेकिन यदि मुझे यहां पे एक ग्राफ के तौर पर रिप्रेजेंट करना है कि हमारे डाटा के अंदर कितनी नल वैल्यू प्रेजेंट है तो वो भी हम यहां पर कर सकते हैं तो उसके लिए मुझे क्या करना पड़ेगा सी बन को कॉल करना पड़ेगा क्योंकि सी बन के थ्रू ही हम ग्राफ बना सकते हैं तो उसके लिए मैं क्या करूंगा इंपोर्ट करूंगा और इंपोर्ट कैसे करूंगा गाइज यहां पे सी बन एलियाज ऑफ एसएनएस को कॉल करूंगा देन सेकंड चीज मैं यहां पे फिर से इंपोर्ट करूंगा किसे मैट प्लॉट लिप की क्योंकि हम यहां पे प्लॉट बनाने जा रहे हैं और प्लॉट बनाने के लिए मैट प्लट लिप नहीं यूज़ करें तो ऐसा तो हो नहीं सकता तो मैट प्लॉट लिप डॉट यहां पर मैं पीवा प्लॉट का इस्तेमाल करूंगा यस क्या करूंगा यहां पे पीवा प्लॉट का इस्तेमाल करूंगा एलियाज ऑफ यहां पे पीएटी का बना लूंगा देन अब हम इसे रन करेंगे एंड रन करने के बाद में मुझे क्या करना है जितनी भी हमारे नल वैल्यू प्रेजेंट है इसका एक ग्राफिकल रिप्रेजेंटेशन दिखाना है यहां पे तो ग्राफिकल रिप्रेजेंट दिखाने के लिए मैं एए डॉट यहां पे क्या य करूंगा हिट मैप का इस्तेमाल करूंगा और हिट मैप के अंदर जाके मेरे पास ये डटा सेट डॉट इनल जो आपको दिख रहा है यहां पे इज नल को ओनली फॉर सम को नहीं मैं बात कर रहा हूं यहां पे टा सेट डॉट इनल जो दिख रहा है यहां पे बस मुझे इसी का ग्राफ बनाना है उसके बाद पीएटी डॉट मैं यहां पे क्या करूंगा शो फंक्शन को कॉल करूंगा यहां पे और फिर जाके मैं इसे रन कर दूंगा जैसे मैं इसे रन करता हूं तो देखिए मुझे हर एक कॉलम के अंदर कितनी नल वैल्यू प्रेजेंट है उसका ग्राफिकल रिप्रेजेंटेशन दिखने को मिल जाएगा अब देखिए जहां पे हमारा पास ब्लैक पार्ट है इसका मतलब वो क्या है हमारे पास डाटा नल वैल्यू प्रेजेंट नहीं है मतलब आपके पास यहां पे फुल डाटा फिल किया हुआ है और जो जो वाइट एरिया आपको दिखाई दे रहा है जैसे कि यहां पे देखिए वाइट लाइंस आपको दिखाई दे रही है इसका मतलब इसके अंदर इतनी सारी नल वैल्यू प्रेजेंट है अब ये कैसे अंदाजा लगा यहां पे किस तरह से पता लगा तो देखिए आपके पास आपके डाटा के अंदर जीरो से लगाकर 6180 तक हमारे पास रो है जो कि हमारे पास यहां पे हमें दिखाई दे रही है उसके बाद में आप देखेंगे हमारे पास जितने भी कॉलम्स हैं उन सारे कॉलम्स के नाम लिखे हुए हैं जैसे लोन आईडी जेंडर हो गया मैरिड हो गया डिपार्टमेंट एजुकेशन वगैरह सब कुछ दिख रहा है इसके बाद में यदि हम यहां पे हमारे पास कलर बार को देखें तो कलर बार के अंदर रो दिखाया जा रहा है यहां पे ब्लैक कलर को और वन दिखाया जा रहा है वाइट कलर को अब जब हमने इज नल को इस्तेमाल किया है तो इज नल यदि हमें कंटेंट को देखना है तो इज नल क्या करता है यहां पे कि जहां मिसिंग वैल्यू होती है वहां पे वो क्या करता है ट्रू दिखाता है और जहां पे मिसिंग वैल्यू नहीं होती है वहां पे वो फाल्स दिखाता है तो ट्रू का मतलब क्या होता है गाइज यहां पे वन होता है और फाल्स का मतलब क्या होता है जीरो होता है तो वही चीज हमें यहां पे देखने को मिल र है कि फॉल्स है यहां पे जीरो है इसका मतलब आपके पास क्या है ब्लैक कंटेंट दिख रहा है और जहां पे हमारे पास मिसिंग वैल्यू है वहां पे हमें राइट कंटेंट देखने को मिल रहा है तो इस तरह से हम हमारी नल वैल्यू को फाइंड आउट कर सकते हैं तो गाइज नल वैल्यू यदि आपको फाइंड आउट करनी है तो पहला तो तरीका है आप यहां पे क्या करें इज नल का इस्तेमाल करें और डॉट सम लगा के आप यहां पे नल वैल्यू को देखें और उसके बाद में ओवरऑल नल वैल्यू देखनी है तो आप यहां पे एक बार और सम लगा दें यहां पे ग्राफिकल रिप्रेजेंटेशन देखना है तो आप सी बन का स् इस्तेमाल करके भी कर सकते हैं अब नेक्स्ट स्टेप जो हमारा सेकंड पार्ट है यहां पे जिसके अंदर हम ये देखेंगे कि अब इस नल वैल्यू को हमें रखना है या हटाना है इसके ऊपर क्या होना चाहिए मतलब आगे क्या प्रोसीजर करना चाहिए इसको जरा यहां पर समझते हैं तो गाइस देखिए सबसे पहले आप अपने डेटा सेट को आराम से देखिए डेटा सेट के बारे में आपको प्रॉपर पहली नॉलेज होनी चाहिए मतलब उस डोमेन के बारे में पूरी नॉलेज होनी चाहिए क्योंकि नल वैल्यू यदि आप उसमें हैंडल करने जा रहे हैं तो उस डेटा सेट के बारे में पहले आप नॉलेज ले लीजिए कि ये डेटा सेट क्या काम करता है इस डेटा सेट के थ्रू आप क्या आगे म डिजाइन करने वाले हैं और यह मॉडल के लिए आपके पास किस तरह से यूज आने वाली है तो पहले ये चीज आप आराम से आइडेंटिफिकेशन चीज है जो मैं आपको बताने जा रहा हूं ज्यादातर डेटा साइंटिस्ट उसी चीज को इस्तेमाल करते हैं मैं उसी के बारे में बात करूंगा यहां पे कि यदि आपके डेटा सेट के अंदर ओवरऑल यदि मैं बात करूं यहां पे ओवरऑल जैसे यहां पर इस डेटा सेट के अंदर बात करें तो केवल 2 पर मिसिंग वैल्यू है यदि ओवरऑल डेटा सेट के अंदर 50 पर से ज्यादा मिसिंग वैल्यू आपको देखने को मिल जाए तो उस वक्त आपको उस डाटा सेट को यूज नहीं करना चाहिए क्योंकि 50 पर का मतलब होता है गाइज यहां पे आधा से ज्यादा डाटा आपके पास यहां पे हाफ से ज्यादा डाटा आपके पास उसके अंदर प्रेजेंट नहीं है अब जब हाफ से ज्यादा डाटा उसके अंदर प्रेजेंट नहीं होगा तो आप उसमें से बेटर इनसाइट्स को नहीं निकाल पाएंगे सेकंड चीज यदि आपके डेटा सेट के अंदर 50 पर से कम मिसिंग वैल्यू है तो उस वक्त आपको उस डेटा सेट को अवॉइड नहीं करना चाहिए उस डेटा सेट के ऊपर वर्क स्टार्ट कर लेना चाहिए अब यहां पे एक और कांसेप्ट आता है यहां पे कि आप क्या करें पर्टिकुलर कॉलम के अंदर परसेंटेज नल वैल्यू को निकालें और जो कि हमने निकाली भी है यहां पे इसके अंदर आप चेक करें कि इसके अंदर कितने परसेंट नल वैल्यू है यदि इसर इस कंटेंट में भी आपके पास 50 पर से ज्यादा नल वैल्यू किसी एक पर्टिकुलर कॉलम में मिसिंग है तो इसका मतलब उस कॉलम के अंदर डाटा बिल्कुल भी नहीं परसेंट है तो आप उसे उस कॉलम को मतलब हटा दीजिए मतलब उस कॉलम को ड्रॉप कर दीजिए उस कॉलम को वहां से उस डटा से से रिमूव कर दीजिए जो भी आप करना चाहे राइट यदि आपको लगता है कि नहीं वह कंटेंट हमारे लिए बहुत ज्यादा इंपॉर्टेंट है तो फिर आप उस कंटेंट को फिल कीजिए और आज के इस वीडियो के अंदर हम बात करने वाले हैं कि मिसिंग वैल्यू को कैसे ड्रॉप किया जाता है मतलब डिलीट कैसे किया जाता है इसके बारे में हम यहां पर डिटेल के साथ देखेंगे तो चलिए जरा इसको देखते हैं तो ये रहा हमारा डेटा सेट जहां पे हमें बहुत सारी मिसिंग वैल्यू प्रेजेंट है और उसके बारे में हमने लास्ट वाले वीडियो के अंदर भी देखा था कि इसके अंदर बहुत सारी मिसिंग वैल्यू है यहां पे अब हम इसे क्या करेंगे हैंडल करेंगे हैंडल करने के लिए जो हम ऑपरेशन ले रहे हैं वो है हमारा डिलीट ऑपरेशन तो हम डि करना सीखेंगे इसे तो चलते हैं जुपिटर नोटबुक के अंदर जहां पे हम इस डाटा सेट के ऊपर पूरा प्रॉपर्ली काम करेंगे इसके लिए सबसे पहले मैं यहां पे इंपोर्ट करने वाला हूं पांडा एलियाज ऑफ पीडी को मतलब पांडा को हम यहां पे इंपोर्ट करेंगे इसके साथ-साथ मैं यहां पे इंपोर्ट करने वाला हूं किसे सी बन को भी क्योंकि हम इसका ग्राफ भी बनाएंगे एलियाज ऑफ एसएनएस लेंगे और उसके बाद में मैं फिर से यहां पे इंपोर्ट करने वाला हूं किसे मैट प्लॉट लिप को करूंगा और ताकि इसके लिए थ्रू हम ग्राफ बना सके और इसके अंदर पीवा प्लॉट्स के पास जाऊंगा एलियास ऑफ पीएटी मैं रख लूंगा उसके बाद हम हमारे डेटा सेट को लोड करेंगे अ पांडा के अंदर यहां पे थोड़ी मिस्टेक हो गई है तो मैं इसे सॉल्व कर देता हूं पांडा ओके एंड डन करते हैं चलिए अब हम हमारे डेटा सेट को लोड करते हैं तो डटा सेट के नाम से इसे वेलेबल बनाते हैं पडी ड यहां पर ंड सीएवी का इस्तेमाल करूंगा लोड करने के लिए और मेरी जो फाइल का नाम है वो लोन . सीएवी है तो मैं अपनी फाइल का नाम लोन . सवी रख दूंगा अब मैंने यहां पे डायरेक्ट इस्तेमाल किया है लोन . सीएवी को इसके पीछे रीजन ये है क्योंकि हम यहां पे जो डटा सेट ले रहे हैं और जो हमारी जुपिटर नोटबुक की फाइल जो है वो सेम पोर्टिकल फोल्डर के अंदर है इस वजह से हम यहां पर डायरेक्टली नेम रख सकते हैं अदर वाइज हमें एड्रेस विद नेम यहां पर देना पड़ता तो चलिए अब हम आगे बढ़ते हैं और हमारे डेटा सेट को देखते हैं तो डाटा सेट के पास जाते हैं डॉट यहां पर मैं हैड लगाता हूं और हेड लगा के मैं यहां पे फोर डाटा यहां प देखता हूं तो मुझे चारों के चारों जो डाटा है वो मुझे यहां पर मिल जाएंगे और ताकि हम आजसे आराम से देख पाएंगे चलिए अब हमें नेक्स्ट प्रोसीजर में क्या करना है हमें इसके अंदर देखना है कि मिसिंग वैल्यू कितनी है और उसका हमें ग्राफ भी बनाना है तो चलिए मिसिंग वैल्यू को फाइंड आउट करते हैं मिसिंग वैल्यू को फाइंड आउट कर से पहले मैं एक काम करूंगा डेटा सेट के अंदर डॉट शेप निका लूंगा शेप के थ्रू हम ये देखेंगे कि कितनी रो एंड कितने कॉलम हमारे मिस हो चुके हैं मतलब हमारे हट चुके हैं वो भी हम यहां पे ऑब्जर्व करते रहेंगे चलिए नेक्स्ट अब हमारे पास काम क्या होगा मिसिंग वैल्यू को देखना होगा तो मैं उसके लिए डाटा सेट के पास जाऊंगा डॉट यहां पे मैं इस नल को मैं यहां पे लगाने वाला हूं इस नल के बाद में मैं डॉट सम लगाऊंगा एंड रन करूंगा तो मुझे हर एक पर्टिकुलर कॉलम के अंदर जितने भी आपके पास नसिंग वैल्यू है वो हमें यहां पर दिख जाएगी नेक्स्ट हमारा टारगेट क्या होगा कि हम इसका ग्राफ बनाए आएंगे तो एए डॉट यहां पर मैं यूज़ करूंगा ट मैप का और ट मैप के अंदर मैं क्या करने वाला हूं यहां पे इस्तेमाल करने वाला हूं डाटा इक्वल्स टू या फिर डायरेक्टली मैं डटा सेट डॉट यहां पे इस नल को कॉल कर दूंगा तो इससे मुझे क्या मिलेगा मेरे पास यहां पे एक ग्राफ मिलेगा और इसको शो करने के लिए मैं अच्छे से शो करने के लिए मैं पीएटी डॉट यहां पर शो फंक्शन को कॉल करने वाला हूं जैसे मुझे ये ग्राफ मिलेगा जहां पे जहां पे मेरी नेस्टिंग वैल्यू है वहां पे मुझे वाइट कलर देखने को मिलेगा और जो मेरी नॉन मिशिंग वैल्यू है जहां पे मुझे ब्लैक देखने को मिलेगा तो इस तरह से मेरे पास मिसिंग कंटेंट भी मुझे यहां पर दिख चुका है अब हमारा नेक्स्ट टारगेट क्या होगा कि इन मिसिंग कंटेंट को हमें क्या करना है डिलीट करना है अब डिलीट करने के दो मेथड्स मैं आपको बताने वाला हूं पहला मेथड्स हमारे पास होगा कि हम किसी पर्टिकुलर कॉलम को ही डिलीट कर देते हैं यदि मान लीजिए आपका कोई कॉलम है जिसके अंदर 50 पर से ज्यादा डाटा आपके पास यहां पे मिसिंग है उस कांसेप्ट में आप क्या करें उस कॉलम को ही डिलीट कर दीजिए या फिर आप क्या कर सकते हैं कि जिस-जिस पर्टिकुलर रो के अंदर मिसिंग वैल्यू है आप क्या करें उस रो को ही डिलीट कर दें हमारे पास दो मेथड्स हैं इन दोनों मेथड्स में से जो भी आप चूज करना चाहे वो कर सकते हैं यह डिपेंड करेगा आपके डेटा सेट के ऊपर कि आपका डेटा सेट के अंदर जो डाटा है वो कितना इंपॉर्टेंट है आपके लिए यदि आप रो वाइज डिलीट नहीं करना चाहते हैं तो आप उसके अंदर डाटा फिल भी कर सकते हैं लेकिन आज के इस वीडियो के जरिए हम डेटा डिलीट के बारे में सीख रहे हैं इस वजह से मैं आपको डिलीट करना सिखाऊंगा कॉलम वाइज भी सिखाने वाला हूं एंड इवन दैट मैं आपको रो वाइज भी डिलीट करना सिखाऊंगा तो चलिए हम कैसे करेंगे इसको डिलीट जरा समझते हैं यहां पे तो सबसे पहले यदि मुझे किसी कॉलम को हटाना है डायरेक्ट डायरेक्टली किसी कॉलम को हटाना है तो पहले मैं पता करूंगा कि कौन सा कॉलम मैं हटाना चाहूंगा तो सबसे पहले देखिए सबसे ज्यादा मिसिंग वैल्यू किसम है तो मुझे दिख रहा है क्रेडिट हिस्ट्री के अंदर सबसे ज्यादा मिसिंग वैल्यू मेरी प्रेजेंट है तो क्यों ना हम क्रेडिट हिस्ट्री को ही हटा दें तो यदि मुझे क्रेडिट हिस्ट्री को हटाना है तो उसके लिए मैं क्या करूंगा डेटा सेट के अंदर जाऊंगा देन यहां पे मैं ड्रॉप का इस्तेमाल करूंगा डटा सेट ड्रॉप का कॉल करने के बाद में मुझे क्या करना पड़ेगा यहां पे कॉलम देना पड़ेगा ड्रॉप फंक्शन क्या करता है आपके कॉलम वाइज डाटा को क्या करता है डिलीट करता है तो यहां पे आप जो भी कॉलम देंगे तो ये कॉलम वाइज आपके पास क्या करेगा उस डाटा को हटा देगा अब यहां पे मुझे कॉलम का नाम देना है तो कॉलम का नाम मैंने यहां पे दे दिया आपके पास यहां पे क्रेडिट हिस्ट्री तो मैंने जैसे ही यहां पे कैडे हिस्ट्री डाला तो ये क्या करेगा ड्रॉप कर देगा अब इसके अंदर मुझे क्या करना है हमारे डाटा को प्रीवियस वाले डाटा से रिप्लेस करना है यदि मैं ऐसा नहीं करता हूं तो ये मुझे क्या करेगा एक नई शीट बना के देगा जिसके अंदर मेरे पास जो पर्टिकुलर कॉलम है वही हमारे पास क्या होंगे डिलीट हो जाएंगे जो हमने यहां पे नाम दिया है ऐसा जरूरी नहीं है कि आप सिंगल कॉलम को डिलीट करें आप मल्टीपल कॉलम को भी डिलीट कर सकते हैं बस यहां पे कॉमा सेपरेट करते हुए मल्टीपल कॉलम दे सकते हैं जिससे वो डिलीट हो जाएगा नेक्स्ट हमारे पास क्या है कि ये हमें क्या करता है एक नया डेटा सेट जनरेट करके देता है हमें हमारा डेटा सेट को नया तरीके से वापस जनरेट नहीं करना है मुझे मेरे पुराने वाले जो डेटा सेट है उसी के अंदर रिप्लेस करना है यहां पे आपको एक स्पेशली ध्यान रखिएगा कि जब आप रिप्लेस ऑप्शन लगा रहे हैं तो इसका मतलब आपके पास ये नहीं है कि आपका ओरिजिनल जो डेटा सेट था वो चेंज हो चुका है नहीं आपके एक्सेल के अंदर जो डाटा पड़ा है वो एज इट इज रहेगा बस आपके पास जो आप जुपिटर नोटबुक इस्तेमाल कर रहे हैं इसके अंदर जो आपने फर्स्ट टाइम डाटा इंपोर्ट किया था यस फर्स्ट टाइम डाटा जो आपने लोड किया था उसी के अंदर आपके पास क्या होगी चीजें चेंजेज होने वाली है तो बस मैं यहां पे क्या करूंगा कॉलम के अंदर कैड हिस्ट्री डालूंगा और उसके बाद में मैं यहां पे इस्तेमाल करूंगा इन पलेस को जैसे ही मैं इन प्लेस इक्वल टू ट्रू लगाऊंगा गाइ यहां पे तो यहां पे ये वाला जो कॉलम है वो डिलीट हो जाएगा चलिए अब हमें कैसे पता चलेगा तो आप क्या करें टा सेनल सम है ना इसे एक बार रन कर दीजिए रन करने पर देखिए आपका जो आपका क्रेडिट हिस्ट्री जो आपके पास था वो डिलीट हो चुका है अच्छा कॉल के अंदर मुझे चेक करना है तो एक बार इसे मत छेड़िए एक बार नीचे जाके आपके पास क्या कीजिएगा डटा सेट डॉट यहां पर सेप को एक बार फिर से कॉल कीजिए जैसे ही आप दोबारा कॉल करते हैं अब आप यहां पे नोटिस कर पाएंगे कि 618 रोज तो एज इट इज है बट यहां पे कॉलम की जो काउंटिंग है वो 13 से किसमें बदल चुकी है 12 में बदल चुकी है तो इस तरह से आप किसी भी पर्टिकुलर कॉलम को डिलीट कर सकते हैं इवन दैट जब आप यहां पे हिट मैप को रन करेंगे आपके नल वैल्यू के रिकॉर्डिंग तो उसमें भी आप ऑब्जर्व करेंगे कि आपका एक कॉलम जो है वो मिस हो चुका तो इस तरह से आप क्या कर सकते हैं अपने पर्टिकुलर किसी भी कॉलम को डिलीट कर सकते हैं जिसके अंदर नल वैल्यू सबसे ज्यादा प्रेजेंट है यहां पे ये जो ऑप्शन है यहां पे नल वैल्यू ज्यादा परसेंट होने का डिलीट करने का जो ऑप्शंस है ये आपका ऑप्शनल है ये आपके डिपेंड करेगा आपके डेटा सेट के ऊपर नेक्स्ट जो चीज हम यहां पे बताने जा रहे हैं जिसके अंदर हम यह सीखेंगे कि आप नल वैल्यू की जितनी भी रो है उनको कैसे डिलीट कर सकते हैं जैसे कि ये वाली जो रो है जैसे मैं 24 रो की बात करूं तो इसके अंदर आप देख पाएंगे आराम से कि इसमें नल वैल्यू प्रसेंट है अब मुझे इस पर्टिकुलर रो को ही क्या करना है रिमूव कर देना है यहां पे तो वो कैसे होगा तो उसके लिए हम क्या करेंगे हम हमारे डेटा सेट के पास जाएंगे एंड डेटा सेट के पास जाने के बाद में हमारे पास ड्रॉप एन ए फंक्शन होता है इस ड्रॉप एन ए फंक्शन को आपको क्या करना है कॉल कर देना है जैसे ही आप ड्रॉप एनए फंक्शन को कॉल करते हैं तो ये क्या करता है वो सारी रो को हटा देता है जिसके अंदर आपके मिसिंग कंटेंट होता है मिसिंग कंटेंट का मतलब एन एन प्रेजेंट होता है उसको हटा देता है अब बेसिकली बा बात करें यहां पे तो मिसिंग कंटेंट हट चुका है लेकिन इसने भी क्या कर दिया एक नया डेटा सेट जनरेट करके दे दिया है हमें एक नया डेटा सेट नहीं जनरेट करना है हमें हमारे पुराने डेटा सेट को ही अपडेट करना है तो उसके लिए मैं क्या करूंगा गाइज यहां पे इन पलेस को कॉल करूंगा और इन प्लेस इक्वल्स टू क्या कर दूंगा गाइज यहां पे ट्रू कर दूंगा यस इन पलेस इक्वल्स टू क्या करूंगा गाइज यहां पे ट्रू मैं यहां पे कर दूंगा यहां पे एंड देन रन करूंगा जैसे ही रन करूंगा तो मेरे पास वो सारी मिसिंग वैल्यू डिलीट हो जाएगी जो हमारे प्रेजेंट डटा में है एक बार इनल ड सम को रन करते हैं तो देखिए आपका यहां पे सारी मिसिंग वैल्यू डिलीट हो चुकी है इवन दैट जब मैं हिट मैप को भी रन करता हूं तो मेरा जो हिट मैप है उसका कलर पूरा पूरा चेंज हो जाता है अब आप बोलेंगे कि सर पहले तो ब्लैक कलर था अब यहां पे रेड कलर कैसे आ चुका है तो ताकि आपका पूरा तो पूरा ब्लैक होना चाहिए था तो देखिए आप एक बार कलर बार को ऑब्जर्व करेंगे तो कलर बार के अंदर जो जरो है वो रिप्रेजेंट कर रहा है रेड कलर को इट्स मीन दैट आपके पास इसके अंदर कोई भी मिसिंग वैल्यू प्रेजेंट नहीं है अब जो ब्लैक कलर है वो -1 के ऊपर शिफ्ट हो चुका है यस - 0.1 के ऊपर शिफ्ट हो चुका है और जो आपका वाइट कलर है वो 0.1 के ऊपर शिफ्ट हो चुका है हमारे मतलब है रो से तो रो का कलर कौन सा है रेड कलर है जो कि हमें यहां पर दिखाई दे रहा है तो आई थिंक आई होप सो समझ में आ चुका होगा अब देखते हैं हमारे डटा सेट के अंदर क्या रो हमारे डिलीट हो चुकी है तो यदि आप यहां पर शेप को वापस जाके दोबारा रन करेंगे तो अब देखिए शेप जो है वो आपकी चेंजेज हो चुकी है और अब जो रो की काउंटिंग है वो 506 हो चुकी है जबकि पहले क्या थी आपका 618 रोज प्रेजेंट थी चलिए एक बत देख लेते हैं कि यदि हमने ड्रॉप का इस्तेमाल किया है तो इससे हमने डाटा का कितना लूज किया है मतलब हमने कितनी रो लूज की है एज अ परसेंटेज के तौर पे वो भी जरा चेक कर लेते हैं यहां पे वो कैसे चेक करेंगे इट्स अ वेरी सिंपल 618 में से मैं सबस्टैक कर दूंगा 506 को यस 506 को सबट क्ट करूंगा और उसके बाद में नेक्स्ट मैं क्या करूंगा डिवाइड कर दूंगा किससे 618 से डिवाइड कर दूंगा और मुझे परसेंटेज निकालना है तो मैं इसको मल्टीप्लाई बाय क्या कर दूंगा गाइज यहां पे 100 कर दूंगा तो परसेंटेज निकालना है मल्टीप्लाई बा 100 किया तो मैंने टोटल 18 पर जो है यहां पे गाइज डाटा को लूज कर दिया है और ये एक बहुत ही ज्यादा अमाउंट में डाटा है जिसको हमने लूज किया है क्या पता हमारे पास इसी डाटा के अंदर बहुत सारे इंपॉर्टेंट जो चीजें हैं वह छुपी हुई हो सकती थी जो कि हमने लूज़ कर दी है और आज के इस वीडियो के जरिए हम यह जानेंगे कि मिसिंग कंटेंट को कैसे फिल किया जाता है और स्पेशली आज के इस वीडियो के अंदर हम यह जानने वाले हैं कि यदि हमारा डाटा कैटेगरी कल डाटा है तो उसके अंदर डाटा को कैसे फिल किया जा सकता है वो हम डिटेल के साथ देखेंगे यदि आपको के लिए डब्ल्यू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो चलिए सबसे पहले मैं यहां पे आपको ले चलता हूं जुपिटर नोटबुक के ऊपर जहां पे मैंने क्या कर रखा है पांडा और सीन को लोड कर रखा है और मैंने अपने डेटा सेट को भी लोड कर रखा है और इसके अंदर हमारे पास बहुत सारा मिसिंग कंटेंट है अब देखिए मिसिंग कंटेंट को यदि मुझे फिल करना है तो वैसे तो मैं डायरेक्टली फिल कर सकता हूं और फिल करने के बाद में जो एनएन है वहां पे कुछ ना कुछ डाटा फिल हो जाएगा ये एक आपके पास राइट वे नहीं है क्योंकि आपके पास किसी भी डाटा के अंदर कुछ भी रैंडम फिल कर देना यह सही तरीका नहीं होता है इसकी जगह पर हम क्या करेंगे हमारे डटा सेट के पहले आपके पास डाटा टाइप्स को जानेंगे और फिर उसके बाद उसके अंदर हम क्या करेंगे डाटा को फिल करेंगे चलिए जरा समझते हैं यहां पे पहले तो बेसिक फिल करना कैसे करते हैं यहां पे तो देखिए फिल करने का तरीके से पहले मैं आपको क्या कर देता हूं डेटा सेट के ऊपर ले चलता हूं और यहां पे क्या करता हूं इनल के थ्रू मैं यहां पे आपको मिसिंग कंटेंट के बारे में पहले बताता हूं कि मिसिंग कंटेंट को आप कैसे निकालते हैं तो स्नल डॉट यहां पे मैं करूंगा सम लगाऊंगा एंड देन रन करूंगा तो इसके थ्रू हमें ये पता चलेगा कि किस पर्टिकुलर कॉलम के अंदर कितना मिसिंग कंटेंट प्रेजेंट है अब नेक्स्ट चीज हमें ये जाननी है कि इसके अंदर कैसे डाटा फिल किया जाता है तो उसके लिए मैं डटा सेट डॉट यहां पर फिल ए नाम के जो फंक्शन है उसे मैं अप्लाई करने वाला हूं और इसके अंदर जो भी चीज मुझे फिल करनी है वो मुझे सिर्फ सिंपल सी देनी है इसके अंदर जैसे कि मैं इसके अंदर 10 फिल करने जा रहा हूं ओके तो जैसे ही मैं 10 लिख के यहां पे एंटर करूंगा तो ये क्या करेगा मेरे पास वो सारे जो मिसिंग कंटेंट है वहां पे 10 को फिल कर देगा जैसे कि आप यहां पर थोड़ा सा देख पाएंगे कि लोन अमाउंट्स के अंदर हमारे पास मिसिंग कंटेंट था और इसने क्या कर दिया 10 को फिल कर दिया है यही चीज आप यदि ऊपर देखेंगे तो इसके अंदर आपको ए मिलेगा तो ये एक मिसिंग कंटेंट है और इसकी जगह पर इन्होंने क्या कर दिया 10 फिल कर दिया इसी तरह से आप दूसरी जगह पर भी दे देखेंगे तो आपको वहां पे भी मिसिंग कंटेंट के अंदर आपको रैंडम चीजें फिल करी हुई मिलेगी जस्ट लाइक मैं आपको थोड़ा सा एग्जांपल दिखाता हूं तो मैंने यहां पे हैड लगाया है और हैड के अंदर मैंने 10 डाटा रखा है यहां पे तो स्टार्टिंग के यदि मैं 10 डाटा देखूं तो उसके अंदर देखिए आपके पास जो प्रॉपर्टी एरिया है उस प्रॉपर्टी एरिया के अंदर आप देखेंगे तो आपको 10 जो है वो फिल हो चुका है अब जबकि ये जो है वो राइट वे नहीं है क्योंकि प्रॉपर्टी एरिया के अंदर अर्बन रूलर सेमी अर्बन ऐसी कुछ चीजें चल रही है और इसके अंदर यदि हम 10 फिल कर रहे हैं तो इट्स अ रॉन्ग वे तो अब मुझे यहां पे क्या करना है इसके अंदर राइट चीजों को फिल करना है अब राइट चीजों को कैसे फिल करना है वो चीज जरा समझ लेते हैं यहां पे तो बेसिकली गाइज यदि डायरेक्टली फिल करना है तो आप इस मेथड को इस्तेमाल कर सकते हैं रदर देन आपके पास ये जो मेथड है बहुत ही गलत तरीका है तो मैं इसे क्लोज करने जा रहा हूं अब मैं मैं सही तरीके के ऊपर बात करूंगा देखिए यह डेटा सेट जो आपके पास दिया गया है इसके अंदर सबसे पहले आप अपने डाटा को देखें कि आपका डाटा कौन-कौन सी टाइप्स के अंदर पड़ा है क्योंकि डेटा जो होता है वो दो तरीके से होता है एक तो होता है आपका न्यूमेरिकल डेटा और दूसरा होता है कैटेगरी कल डाटा कैटेगरी कल डेटा मतलब स्ट्रिंग टाइप का आपको डाटा देखने को मिलता है अब जब आपके स्ट्रिंग टाइप का डाटा होता है जिसे हम मशीन लर्निंग के अंदर ऑब्जेक्ट टाइप का डाटा कहते हैं अब ऑब्जेक्ट टाइप के डाटा को हम क्या करते हैं ज्यादातर मोड से फिल करना पसंद करते हैं क्योंकि उसके अंदर क्या होता है मोस्ट फ्रिक्वेंटली जो डाटा होता है वो आपके पास फिल करना ज्यादा सही रहता है इसकी जगह पर हम यहां पे बैकवर्ड फिलिंग या फॉरवर्ड फिलिंग का भी इस्तेमाल करते हैं बैकवर्ड फिलिंग के अंदर क्या होता है कि जो आपका पीछे वाला जो डाटा होता है वो आगे जाके फिल होता है और फॉरवर्ड फिलिंग के अंदर क्या होता है कि जो आगे वाला डाटा होता है वो पीछे जाके आपके पास फिल होता है तो हम चाहे तो बैकवर्ड फिलिंग फॉरवर्ड फिलिंग या फिर हम क्या कर सकते हैं यहां पे मोड को फिल कर सकते हैं तो चलिए जरा अब इस वीडियो के जरिए इन तीनों टेक्निक को समझते हैं जो कि एक राइट वे है डाटा को फिल करने का वो भी कैटेगरी कल डाटा के अंदर तो सबसे पहले मैं अपने कैटेगरी कल डेटा को पहचानू का कि कैटेगरी डेटा कौन-कौन से हैं फिलहाल यदि हम डेटा सेट को देखें तो यहां से मुझे आराम से पता चल जाएगा कि कौन से कैटेगरी कल है कौन से आपके पास ब्यू मेरिकल डेटा है लेकिन यदि मुझे इसके अलावा भी मुझे जानना है तो उसके लिए मैं क्या करूंगा डेटा सेट के पास जाऊंगा डॉट यहां पर मैं क्या करूंगा इंफो लगाऊंगा इंफो लगाने के बाद में मैं यहां पे देखूंगा हमारे डाटा को तो मुझे यहां पे मिल जाएगा कि कौन-कौन से कैटेगरी कल है और कौन-कौन से हमारे न्यूमेरिकल है अब इसके अंदर जो हमें जेंडर है इस जेंडर के अंदर हमें क्या करना है मिसिंग कंटेंट को फिल करना है अब मुझे यहां पे सबसे पहले आपको ये बताना है कि बैकवर्ड फिलिंग एंड फॉरवर्ड फिलिंग क्या होता है उसके बाद नेक्स्ट हम यहां पे मोड को भी फिल करना सीखेंगे तो सबसे पहले मैं क्या करना हूं बैकवर्ड फिलिंग एंड फॉरवर्ड फिलिंग को समझाता हूं आप लोगों को तो देखिए ये लोन अमाउंट्स है इस लोन अमाउंट्स के जरिए ही हम क्या करेंगे बैकवर्ड फिलिंग एंड फॉरवर्ड फिलिंग को समझने वाले हैं तो इसको जरा समझने के लिए मैं क्या करूंगा यहां पे गाइ एक और नया कॉलम बनाऊंगा नया सेल बनाऊंगा और उसके बाद डेटा सेट लूंगा एंड दैट डॉट यहां पर मैं क्या लूंगा फिल एन लूंगा फिल एन लेने के बाद में मुझे क्या करना है यहां पे मेथड को अप्लाई करना है मेथड इक्वल्स टू के अंदर मुझे क्या करना है यहां पे बैक फी को इस्तेमाल करना है तो यहां पर मैं बी फी को इस्तेमाल करूंगा बैकवर्ड फिलिंग के लिए और जैसे ही मैं रन करूंगा तो देखिए हमारा जो पीछे वाला कंटेंट है वो आगे जाके फिल हो जाएगा जो कि आप लोन अमाउंट में बहुत ही अच्छे तरीके से देख पा रहे हैं कि जो आपका 128 है वो ऊपर जाके आपके पास क्या हो गया फिल हो चुका है ये कहलाता है बैकवर्ड फिलिंग यदि मैं बात करूं यहां पे फॉरवर्ड फिलिंग के बारे में तो मुझे एफ लगाना पड़ेगा एंड देन रन करूंगा तो देखिए आपका जो ऊपर वाला डाटा है वो नीचे आके फिल हो चुका है लेकिन यहां पे आपके पास ऊपर कोई भी डाटा प्रेजेंट नहीं है इस वजह से ये ए जो है वो ए की ही तरह रह चुका है आपके पास कहीं पे भी डाटा फिल नहीं हुआ है उसको अच्छे से समझने के लिए हम क्या करते हैं एक्सेस को चेंज करते हैं एक्सेस का मतलब क्या है एक्सेस = 0 का मतलब हम रो वाइज फीलिंग चला रहे हैं यहां पे और एक्सेस इ इक्वल टू यदि मैं वन का इस्तेमाल करूंगा इसका मतलब मैं कॉलम वाइज आपका डाटा को फिल करूंगा तो इसको अच्छे से समझने के लिए मैं क्या करूंगा एक्सेस का इस्तेमाल करूंगा और एक्सेस को कर दूंगा वन जैसे ही एक्सेस = 1 करूंगा तो अब आप यहां पे आराम से देख पाएंगे कि जो को एप्लीकेशन इनकम का जो डाटा है वो आपके पास क्या आ चुका है लोन अमाउंट में आ चुका है जो कि हमारा क्या है एक फॉरवर्ड फिलिंग डाटा है इसी तरह से हम यहां पे क्या कर सकते हैं बी फिल को लगा सकते हैं बी फीड के अंदर क्या होता है कि जो पीछे वाला जो डाटा है वो आपके आगे जाके फिल हो जाएगा तो देखिए आपके पास यहां पे वापस देखेंगे तो जो 360 है वो लोन अमाउंट के अंदर आके आपका शिफ्ट हो चुका है तो इसको बोलते हैं बैकवर्ड फीलिंग तो गाइज बैकवर्ड फीलिंग एंड फॉरवर्ड फीलिंग ये जो टेक्नीक है ये आपका कैटेगरी कल डाटा के अंदर ज्यादातर अप्लाई की जाती है इसके साथ-साथ हम ज्यादातर केसेस के अंदर मॉड को फिल करते हैं अब आप लोगों के दिमाग में एक बहुत बड़ा क्वेश्चन चला होगा कि हमें किस समय कौन सी चीज अपनानी चाहिए तो बेसिकली इसका कोई एक फिक्स रूल नहीं है ये डिपेंड करेगा आपके डटा सेट के ऊपर कि आपका का डेटा सेट का पैटर्न क्या है डेटा सेट किस तरह से दिया गया है और उस डेटा सेट से आप क्या समझते हैं वहां पे आप इस डेटा सेट को देखते हुए आप ये डिसाइड करेंगे कि बैकवर्ड फीलिंग सही रहेगा या फॉरवर्ड फीलिंग सही रहेगा या फिर मॉड करना फि सही रहेगा अब मॉड का मतलब मैं आपको सिंपल सी बात करूं यहां पे आप किसी भी डेटा सेट को लेते हैं उस डेटा सेट के अंदर जो सबसे ज्यादा बार डेटा रिपीट हो रहा होता है उस डाटा को आप क्या करते हैं मिसिंग कंटेंट की जगह फिल कर देते हैं ये आपके पास क्या कहता है मड फिलिंग कहलाता है अब ये कैसे यूज किया जाता है तो जरा समझते हैं यहां पे तो अब हमें क्या करना है केवल और केवल कैटेगरी कल डाटा के अंदर हमारा जो मोड है वह फिल करना है तो फिलहाल मैं इसे आपके पास कहता हूं कमेंट आउट कर देता हूं अब नेक्स्ट मुझे क्या करना है अपने आप को अपने डेटा सेट के अंदर मॉड फिल करना है तो मैं डेटा सेट को यूज़ करता हूं देन स्क्वायर ब्रैकेट और यहां पर मैं क्या करता हूं जेंडर को डाल देता हूं क्योंकि मुझे जेंडर के अंदर मॉड निकालना है और उसी के अंदर वो डाटा फिल करना है तो दैट यहां पे क्या करूंगा फिल ने को इस्तेमाल करूंगा क्योंकि जो मोड होता है वो पर्टिकुलर एक सिंगल कॉलम के ही निकाला जाता है क्योंकि आपके पास उसी मोस्ट रिपीटेड जो डाटा है उसी को फिल करना है तो इसी लिए आप क्या करते हैं एक प लर कॉलम के अंदर ही क्या करते हैं आप मोड को फिल करते हैं तो मैं पर्टिकुलर एक कॉलम को ले रहा हूं यहां पे जो कि मेरा जेंडर कॉलम है उसके बाद मैं फिलन को लगाऊंगा यहां पे फिल हैने के अंदर अब मुझे क्या करना है मोड को लगाना है तो पहले मैं आपको थोड़ा सा मड निकालना बता देता हूं फिर उसके बाद हम य हमारा क्या करेंगे डाटा को फिल करेंगे तो देखिए मोड कैसे निकालते हैं तो सबसे पहले मैं डेटा सेट के पास जाऊंगा देन स्क्वायर रके उसके बाद मैं अपने जेंडर को कॉल करूंगा उसके बाद मुझे क्या करना है मोड को निकालना है तो मैं यहां पे मोड लिख दूंगा तो हमारे पास जो मड है वो यहां पे आ जाएगा देन मोड आने के बाद में आप इसे जैसे ही रन करेंगे तो मॉड मुझे मिलेगा मेल अब ये जो डाटा दिया गया है वो सीरीज डाटा सेट है तो इसके अंदर दैट स्क्वायर ब्रैकेट ऑफ 0 लगाने पर मुझे क्या मिलेगा यहां पे मुझे मेरा मेल जो है वो मुझे मिल जाएगा अब इस मेल को ही मुझे क्या करना है फिल करना है तो मैं इस मेल को फिल कर देता हूं किस तरह से करेंगे डाटा सेट को कॉल करेंगे देन स्क्वायर ब्रैकेट और जेंडर को लगा के डॉट यहां पर आप क्या लगाएंगे फिल एने लगाएंगे यस फिल एने लगाने के बाद में आप क्या करेंगे कि यह जो आपका डाटा आ रखा है इस पूरे डाटा को लेके यहां पे इसके अंदर एडजस्ट करेंगे देन आप यहां पर क्या करेंगे इसके अंदर पेस्ट कर देंगे पेस्ट करने के बाद गाइस यहां पर जैसे ही आप एंटर करेंगे तो आपके पास एक नया कॉलम जनरेट हो जाएगा जिसके अंदर आपके पास जो मोड है वो फिल हो चुका है अब आपको इस तरह से नहीं करना है आपको क्या करना है अपने पुराने वाले डेटा सेट से रिप्लेस करना है तो पुराने वाले डेटा सेट से रिप्लेस करने के लिए आप क्या करेंगे इन पलेस का इस्तेमाल करेंगे इन प्लेस इक्वल्स टू आप यहां पे ट्रू लगाइए और रन कर दीजिए तो इससे क्या होगा आपका जो मोड है वो फिल हो चुका है आपके गिवन डाटा के अंदर अब ये तो हो गया एक पर्टिकुलर कॉलम के अंदर कि हमने एक पर्टिकुलर कॉलम के अंदर क्या कर दिया मड फिल दिया है लेकिन मुझे मेरे सारे ऑब्जेक्ट टाइप के डाटा के अंदर मोड को फिल करना है तो फिर मैं कैसे करूंगा तो इसके लिए बहुत ही सिंपल तरीका है आप क्या कर सकते हैं लूप का इस्तेमाल कर सकते हैं और मोड फिल को लगा सकते हैं किस तरह से करेंगे इट्स अ वेरी सिंपल सबसे पहले आप अपने डटा सेट के अंदर जो ऑब्जेक्ट टाइप के डाटा है उनको कलेक्ट कर लीजिए वो कैसे कलेक्ट करेंगे तो आपको जाना है डाटा सेट के अंदर देन आपको क्या करना है डॉट यहां पर सेलेक्ट डेटा टाइप को कॉल करना है सेलेक्ट डेटा टाइप के अंदर आपको क्या करना है इंक्लूड करना है और इंक्लूड किसे करना है गाइ यहां पे ऑब्जेक्ट टाइप के डाटा टाइप को कलेक्ट करना है जैसे ही आप रन करेंगे तो आपको वो डेटा सेट मिल जाएगा जिसके अंदर आपके पास क्या है ऑब्जेक्ट टाइप का डेटा यहां पे प्रेजेंट है राइट अब उसके बाद में मुझे क्या करना है गाइज यहां पे मुझे इसमें से क्या करना है आपके कॉलम के नाम को गेट करना है तो आप यहां से कॉलम के नेम को गेट कर सकते हैं या फिर आप यहां पे क्या कर सकते हैं इज नल को कॉल कर सकते हैं इज नल को कॉल करने के बाद में आप यहां पर जैसे ही रन करेंगे तो आपके पास नल वैल्यू प्रेजेंट हो जाएगी और उसके बाद आप यहां पे डॉट सम को कॉल करेंगे आपको यहां पे वो मिल जाएंगे जिसके अंदर नल वैल्यू प्रेजेंट है जैसे कि आपका डिपार्टमेंट हो गया सेल्फ एंप्लॉयड हो गया मैरिड हो गया एंड उसके बाद में प्रॉपर्टी एरिया भी आपके हो गया तो इन सब के अंदर हमें क्या करना है मड को फिल करना है तो हम इसके अंदर मड फिल लगा सकते हैं या फिर आप एक और काम कर सकते हैं इसकी जगह पर आप क्या करें हैं डॉट यहां पे कॉलम्स को लगा दीजिए जैसे ही आप डॉट कॉलम्स को लगाएंगे तो आपको क्या करेगा सारे के सारे कॉलम के नाम मिल जाएंगे एज अ लिस्ट के तौर पे तो मैं यहां पे क्या करूंगा एक फोर लूप लगाऊंगा 4 आ इन यहां पे करूंगा डेटा सेट को लिखूंगा देन उसके बाद मैं कॉलन को लगा के प्रिंट ऑफ आ करूंगा तो मुझे मेरे सारे कॉलम के नाम मिल जाएंगे जो कि कैटेगरी कल डाटा है अब मुझे क्या करना है सिंपल सा जो फिल लेने कांसेप्ट मैंने ऊपर लगाया था इसी को जस्ट मुझे कॉपी करना है और कॉपी करके मुझे यहां पे पेस्ट कर देना है और जैसे ही मैं पेस्ट करूंगा तो मुझे यहां पे क्या करेगा जेंडर जेंडर मिलेगा इस जेंडर की जगह मैं क्या करूंगा इस आई को पेस्ट कर दूंगा इस जेंडर की जगह मैं आ को लगा दूंगा ताकि हमारे पास इन सारे कॉलम्स के अंदर क्या कर रहे मोड को फिल हो जाए अब जिनके अंदर हमारा मिसिंग कंटेंट है उस जगह पे तो हमारा मड फिल हो जाएगा लेकिन जिनके अंदर हमारा मिसिंग कंटेंट नहीं है उस जगह पर हमारा कुछ भी चीजें फिल नहीं होने वाली है तो हमें वैसे भी एरर नहीं मिलने वाली है और मैं जैसे ही इसे रन करूंगा तो मेरे जितने भी मिसिंग कंटेंट थे वो सारे के सारे एक बार के अंदर ही अब क्या चुके हैं मोड से फिल हो चुके हैं चलिए इसको जरा देख लेते हैं कि क्या ये वाक में मड से फिल हुए हैं या नहीं हुए हैं जैसे ही रन करूंगा तो देखिए अब हमारे पास मिसिंग कंटेंट बहुत कम बच चुके हैं और हमारे पास वो कंटेंट बच चुका है जो कि हमारा न्यूमेरिकल कंटेंट है इस तरह से आप क्या कर सकते हैं कि आपका जो गिवन डेटा सेट है इसके अंदर आप मोड को फिल कर सकते हैं वो भी कैटेगरी कल डाटा के अंदर और आज के इस वीडियो के जरिए हम यह जानेंगे कि साइक लर्न के थ्रू मिसिंग वैल्यू को कैसे इंप्यूट किया जाता है मतलब कैसे फिल किया जाता है उसको हम जरा देख रहे हैं तो सबसे पहले हम चलते हैं हमारे डेटा सेट के ऊपर वहां पे हम मिसिंग वैल्यू को थोड़ा आइडेंटिफिकेशन कर रखा है फिलहाल मैं क्या करता हूं दोनों को रन कर देता हूं एक बार के लिए अब मैं इसके अंदर क्या करता हूं हमारे मिसिंग वैल्यू को सर्च करता हूं कि कितनी मिसिंग वैल्यू इसके अंदर प्रेजेंट है उसको हम देखते हैं यहां पे तो उसके लिए क्या करते हैं डेटा सेट के पास चलते हैं डॉट यहां पे इज नल को कॉल कर देते हैं यहां पे एंड इ नल के बाद में डॉट यहां पर सम को कॉल करते हैं ताकि हमें मिसिंग वैल्यू को पता चल सके तो ये हमें सारी मिसिंग वैल्यू के बारे में सारी इंफॉर्मेशन हमें मिल चुकी है अब इन मिसिंग वैल्यू को हमें क्या करना है फिल करना है तो फिल करने के हमारे पास बहुत सारे टेक्निक हो सकते हैं फिल करने की जो टेक्निक्स है उनके बारे में मैं पहले से डिस्कस कर चुका हूं कि जब आपके पास कैटेगरी कल डाटा प्रेट प्रजेंट हो तो उस समय आपको क्या फिल करना है और जब आपके पास न्यूमेरिकल डाटा प्रेजेंट हो तो उस वक्त आपको क्या फिल करना है ये मैं बहुत ही अच्छी तरीके से क्लियर कर चुका हूं कि आपका डेटा के पैटर्न को देखते हुए किस तरह से आप डेटा को फिल कर सकते हैं कि कब आपको मीन बनना है कब आपको मीडियन बनना है कब आपको मॉड बनना है ये सारी चीजें क्लियर हो चुकी है तो फिलहाल आज के इस वीडियो के अंदर हम उस चीज को टॉपिक को डिस्कस ना करते हुए हम सीधा कैसे फिल करते हैं वो समझने वाले हैं यहां पे तो सबसे पहले क्या करते हैं यहां पे जिसने भी न्यूमेरिकल डेटा है उनको थोड़ा अलग कर लेते हैं क्योंकि वहीं पे हम क्या करेंगे थोड़ा फिल करना सीखेंगे तो इसके लिए मैं क्या करूंगा हमारे डेटा सेट के पास जाऊंगा यहां पे डॉट यहां पे क्या करूंगा सेलेक्ट डेटा टाइप को कॉल करूंगा पहले तो मैं देख लेता हूं इसमें न्यूमेरिकल डाटा कौन-कौन से हैं तो उसके लिए मुझे क्या करना पड़ेगा यहां पे हमारे डेटा सेट के पास जाना पड़ेगा डॉट यहां पे इनो को कॉल करेंगे और जैसे ही हम रन करेंगे तो इसके अंदर देखिए हमारे पास फ्लोटिंग की वैल्यू मिल जाएगी और ऑब्जेक्ट टाइप का भी डटा मिल जाएगा इसके अंदर चलेंगे हम सेलेक्ट डेटा टाइप के अंदर सेलेक्ट डेटा टाइप के अंदर हम क्या करेंगे हम इंक्लूड को कॉल करेंगे मतलब हमें कौन-कौन सा डाटा इंक्लूड करना है उसको हम यहां पे लेने वाले हैं अब इसके अंदर मुझे क्या चाहिए मुझे चाहिए फ्लॉट्स का जो डाटा है उसे हमें यहां पे चाएगा तो जैसे ही रन करेंगे वो हमें सारे डाटा दे देगा और उसके बाद में मुझे क्या करना है इसके कॉलम्स के नाम को ही कैट करना है तो मैं सिंपल सा कॉलम को कॉल करूंगा तो मेरे पास जो कॉलम के नाम है यहां पे वो मुझे यहां पर देखने को मिल जाएंगे अब नेक्स्ट टारगेट हमारा क्या होगा यहां पे कि मुझे मिसिंग वैल्यू को फिल करना है यूजिंग अ साइकेड लर्न तो मैं क्या करूंगा साइकल लन की लाइब्रेरीज को कॉल करूंगा तो फ्रॉम यहां पे सबसे पहले मैं साइकल लन के पास जाऊंगा यहां पे डॉट साइकल लन की लाइब्रेरी के अंदर इनपुट नाम के क्या है हमारे पास एक मॉड्यूल है तो उसको मैं कॉल करने वाला हूं यहां पे तो मैं क्या करूंगा यहां पे इंप्यूट को कॉल करूंगा इंप्यूट को कॉल करने के बाद में यहां पे फ्रॉम के थ्रू मैं यहां पे सिंपल इंप्यूटर नाम की जो क्लास है उसे मैं यहां पे कॉल करने वाला हूं क्योंकि सिंपल इंप्यूटर के थ्रू ही हम क्या करने वाले हैं हमारे डाटा को फिल करने वाले हैं अब सिंपल इंप्यूटर के अंदर मैं करूंगा एसआई के नाम से एक वेरिएबल बना लेता हूं यहां पे और उसके बाद मैं मेरी जो सिंपल इंप्यूटर क्लास है इसको मैं कॉल कर देता हूं अब इस क्लास को जैसे ही आप ओपन करेंगे तो इसके अंदर बहुत सारे हाइपर पैरामीटर्स आपको देखने को मिल जाएंगे जिसके अंदर आपको देखि सबसे पहले क्या मिलेगा मिसिंग वैल्यू मिलेगा मिसिंग वैल्यू के अंदर आप एनन को फिल करना चाहते है स्ट्रेटजी आपको मिल जाएगी स्ट्रेटजी मतलब आप क्या फिल करना चाहते हैं मीन मीडियन मड क्या फिल करना चाहते हैं वो भी आप देख सकते हैं फिल वैल्यू फिल वैल्यू का मतलब है यदि आप किसी कांस्टेंट को फिल करना चाहते हैं और वो कांस्टेंट वैल्यू क्या है वो भी आप यहां पे दे सकते हैं इसके साथ-साथ वेयर बॉस मिल जाएगा कॉपी मिल जाएगा और ऐड इंडक्टर भी मिल जाएगा और बहुत सारी चीजें आपको मिल जाएगी इसके अंदर हमारे पास जो सबसे हमारी जो मेन इंपॉर्टेंट चीज है वो स्ट्रेटजी है स्ट्रेटेजी के अंदर आप यहां पर देख पाएंगे आपके पास मीन भी है मीन के बाद में आप देखेंगे मीडियन भी है मीडियन के बाद में मोस्ट फ्रीक्वेंसी है मोस्ट फ्रीक्वेंसी का मतलब है यहां पे मॉड से मतलब है आपका तो यहां पे आप मड को भी फिल कर सकते हैं इसके साथ-साथ आपको कांस्टेंट वैल्यू यदि फिल करनी है तो कांस्टेंट वैल्यू भी आप यहां पर दे सकते हैं तो फिलहाल मैं मीन को ही रखना चाहूंगा क्योंकि मेरे पास सारा न्यूमेरिकल डटा है तो मुझे मीन को ही फिल करना है बेसिकली तो मैं मीन को ही रखना चाहूंगा हमारे स्ट्रेटजी के तौर पे और मैं किसी चीज को चेंज नहीं करना चाहूंगा तो आप चाहे तो इसे चेंज कर सकते हैं मैं क्या करूंगा यहां पे स्ट्रेटजी लगाऊंगा स्ट्रेटजी के अंदर मैं यहां पे क्या करूंगा मीन लिख दूंगा इस तरह से आप मोस्ट फ्रीक्वेंसी मीडियन वगैरह रख सकते हैं ये आपका सिंपल इंप्यूटर का जो क्लास है वो आपका रेडी हो चुका है अब इस एसआई के अंदर ही आपको क्या मिलेगा फिट ट्रांसफॉर्म आपको मिल जाएगा फिट ट्रांसफॉर्म के थ्रू आप अपने डाटा के अंदर जो मिसिंग वैल्यू है उसे फिल कर सकते हैं अब मुझे इसके लिए क्या चाहिए मु मेरा डेटा सेट चाहिए तो मैं डेटा सेट के पास जाऊंगा देन डबल स्क्वायर ब्रैकेट लगाऊंगा और डबल स्क्वायर ब्रैकेट लगाते हुए एक काम कर देंगे ये जितने भी मेरे नाम है यहां पे इन सबको कॉपी कर लेंगे क्योंकि इन सभी के अंदर मेरे पास क्या है मिसिंग वैल्यू प्रेजेंट है तो मैं यहां पे इन सबको लेके यहां पे पेस्ट कर देता हूं पेस्ट करने के बाद आप जैसे ही यहां पे रन करेंगे तो इसके अंदर आपके जो मिसिंग वैल्यू है वो सारे के सारे फिल हो चुके हैं और आपका जो डाटा मिला है वो एज ए एरे के तौर पे मिला है अब आप चाहें तो इसे आप अपने डेटा फ्रेम के अंदर कन्वर्ट कर सकते हैं अब डेटा फ्रेम के अंदर कैसे कन्वर्ट करेंगे तो इट्स अ वेरी सिंपल आंसर आपके पास ये जो डाटा आया है वो एक एरे के तौर पे आया है तो आप इसे एर के अंदर जाके सेव कर सकते हैं मतलब किसी पर्टिकुलर वेरिएबल के अंदर जाके सेव कर सकते हैं फिर उसके बाद आप यहां पे पीडी डॉट यहां पर डटा फ्रेम का इस्तेमाल कर सकते हैं और पीडी डॉ डटा फ्रेम के अंदर ये जो एरे है वो एज एरे के तौर पे देंगे यहां पे और आपके पास जो कॉलम के नाम है वो कॉलम के नाम आप किस तरह से देंगे तो कॉलम के नाम ये आपके पास पड़े हैं इसी के थ्रू आप दे सकते हैं जैसे डटा टाइप के बाद में सेलेक्ट डटा टाइप इंक्लूड करके ये जो आपके पास है इसी को सेम टू सेम आप यहां पर इसके थ्रू दे सकते हैं और जैसे ही आप रन करेंगे तो अब आपके पास जो डाटा है वो मिसिंग वैल्यू फिर हुआ हुआ आपके पास यहां पे डाटा मिलेगा अब आप चाहे तो इसके अंदर मिसिंग वैल्यू को चेक भी कर सकते हैं कि इसके अंदर मिसिंग वैल्यू है या नहीं है तो उसको मैं चेक कैसे करूंगा तो मैं न्यू डेटा सेट के नाम से वेरिएबल बना लेता हूं ताकि मैं उसके अंदर देख सकूं कि मिसिंग वैल्यू प्रेजेंट है या नहीं है तो मैं न्यू डेटा सेट के अंदर गया यहां पे डॉट मैंने इस नल को कॉल किया यहां पे और फिर उसके बाद मैंने यहां पे डॉट सम को मैंने कॉल किया यहां पे ताकि मुझे पता चल सके कितनी मिसिंग वैल्यू प्रेजेंट है और फिलहाल यहां पे सभी के अंदर जीरो आई है क्योंकि यहां पे मिसिंग वैल्यू जो है थी वो आपकी फिल हो चुकी है चलिए एक बार चेक कर लेते हैं हैं यहां पे न्यू डेटा सेट के अंदर जाके कि आपकी मिसिंग वैल्यू फिल हुई है या नहीं हुई है तो आप लोन अमाउंट को देख सकते हैं क्योंकि लोन अमाउंट के अंदर आपकी जो मिसिंग वैल्यू है वो प्रेजेंट थी और वो आपके पास भर चुकी है वो किससे भरी है 146 से भरी है यहां पे जो कि उस डाटा का मीन है कैसे पता चला मुझे यहां पे तो देखिए मुझे आपके पास लोन अमाउंट में जाएंगे तो लोन अमाउंट में आपके पास क्या है एन एन आपको दिखाई दे रहा है इसी के अंदर आपके पास देखिए 146 आपके पास जो डाटा है वो फिल हो चुका है और ये इसका मीन है ये कैसे कंफर्म करेंगे आप यहां पे तो वो आप देख सकते हैं अपने डेटा सेट के थ्रू डेटा सेट के अंदर चलेंगे यहां पे और डेटा सेट के अंदर जाने के बाद मुझे लोन अमाउंट चाहिए था तो मैंने यहां पे क्या किया लोन अमाउंट्स यहां पे डाल दिया यहां पे और लोन अमाउंट्स के पास जाने के बाद में डॉट मैं यहां पे क्या करूंगा इसका मीन को कॉल करूंगा मतलब मुझे इसका मीन निकालना है यहां पे मैं मीन को जैसे ही कॉल करूंगा तो देखिए मीन जो है वो 14632 मुझे मिला है यहां पे और जो कि आप यहां पे देख पाएंगे लोन अमाउंट्स के अंदर 14632 मुझे यहां पे देखने को मिल रहा है तो इसका मतलब क्या है कि मेरे डेटा सेट के अंदर जो मीन है वो फिल हो चुका है और ये मीन आपके पास एप्लीकेशन इनकम को एप्लीकेशन इनकम लोन अमाउंट लोन अमाउंट टर्न्स एंड कैट हिस्ट्री इन सभी के अंदर क्या हो चुका है फिल हो चुका है तो इस तरह से आप क्या कर सकते हैं अपने डाटा के अंदर मीन को फिल कर सकते हैं आप चाहे तो मीडियन को भी फिल कर सकते हैं बहुत ही सिंपल है आप स्ट्रेटेजी के अंदर जाएं और अपनी स्ट्रेटेजी को चेंज करें तो आपके पास मीडियम भी फिल हो जाएगा और यदि किसी कांस्टेंट वैल्यू को फिल करना है तो भी कर सकते हैं अब इसका इस्तेमाल कहां किया जाता है तो कॉलम ट्रांसफॉर्मेशन और जब आप मशीन लर्निंग की पाइपलाइन को इस्तेमाल करेंगे मशीन लर्निंग की पाइपलाइन का मतलब बेसिकली यहां पे है कि जब आप अपने प्रोजेक्ट को एंड मोड पे लेके आएंगे और आप इसे डिप्लॉयड जाएंगे तब आपको एक पाइपलाइन सर्किट्स बनाना पड़ता है और उसके अंदर आपका यह जितना भी प्रोसेसर है मिसिंग वैल्यू को फिल करने का जो प्रोसेसर है वह आपको ऑटोमेटिक रखना पड़ता है ताकि आपके पास कोई नया डाटा है तो उसके अंदर भी ऑटोमेटिक जो डाटा है वह फिल हो जाए यहां पे तो उस कंडीशन के अंदर आपको सिंपल इंप्यूटर की जरूरत पड़ती है और उसके थ्रू आप अपने डाटा को फिल कर सकते हैं आज के इस वीडियो के जरिए हम बात करेंगे एन कोडिंग कैसे कर सकते हैं वह भी वन हॉट एनको डि के बारे में तो बेसिकली बात करें तो लास्ट वाले वीडियो के अंदर हमने ये देखा था कि इनकोडिंग होती क्या है जब भी हमारे पास कोई कैटेगरी कल डाटा हमें मिल जाए और उनको हम न्यूमेरिकल डाटा में कन्वर्ट करना चाहे तो उसे हम इनकोडिंग बोलते हैं और इसके करने के पीछे पर्पस क्या होता है क्योंकि आप जब इस डाटा को मशीन लर्निंग एल्गोरिथम के अंदर यूज करने वाले हैं तो उस वक्त आपके डाटा को आप क्या करते हैं इनकोडिंग करके देते हैं क्योंकि मशीन लर्निंग एल्गोरिथम्स जो होती है वो एक मैथमेटिकल फार्मूला होती है जस्ट एग्जाम y = mx3 या फिर 1 / a ट पावर x + c इस तरह के फॉर्मूला के कॉमिनेशन होते हैं यहां पे अब इन फॉर्मूला के अंदर हमें जरूरत होती है न्यूमेरिकल डाटा की और हम दे देते हैं यहां पे कैटेगरी कल डाटा तो ये इनके ऊपर वर्क नहीं कर पाती है तो इस सिचुएशन के अंदर हमें क्या करना पड़ता है कि हमारे पास जितने भी कैटेगरी कल डाटा होता है इन्हें हमें न्यूमेरिकल डाटा में कन्वर्ट करना पड़ता है इन कन्वर्ट करने की प्रोसीजर को हम इनकोडिंग बोलते हैं और आज के इस वीडियो के अंदर हम वन हॉट एन कोडिंग को समझने वाले हैं कि ये वन हॉट एन कोडिंग का प्रोसेसर क्या होता है और इसे किस तरीके से परफॉर्म कर सकते हैं इसको जरा समझते हैं यहां पे यदि आपको python-tk के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपने स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो देखिए मैं एकल सीट में आ चुका हूं और वन हॉट एन कोडिंग को समझाऊं मैं जेंडर और मैरिड के बेसिस पे बेसिकली ये उस वक्त यहां पे इनकोडिंग की जाती है जब आपके पास नंबर ऑफ डाटा कम प्रेजेंट हो मतलब जैसे मेल फीमेल इस तरह के डेटा प्रेजेंट हो मैरिड में यस नो इस तरह के डेटा प्रेजेंट हो या प्रॉपर्टी एरिया में आपके पास यहां पे अर्बन सेमी अर्बन रूलर इस तरह के डाटा यदि आपके प्रेजेंट है मतलब एक लिमिटेड अमाउंट में डटा प्रेजेंट है एक या दो डाटा प्रेजेंट है तो आप वहां पे वन हॉट एन कोडिंग को इस्तेमाल कर सकते हैं अब वन हॉट एन कोडिंग करते कैसे है परफॉर्म यहां पे तो इसको जरा देखते हैं यहां पे तो सबसे पहले वन हॉट इनकोडिंग क्या करता है आपके पास दो वेरिएबल क्रिएट करता है जैसे मुझे जेंडर की वन हॉट एन कोडिंग करनी है तो इसको समझने के लिए मैं क्या करूंगा यहां पे एक नया जो डाटा है वो इंसर्ट करूंगा इसी के जस्ट आगे और इसके अंदर क्या करेंगे आपके पास जेंडर के अंदर क्या करेंगे यहां पे जेंडर के नाम से ही यस जेंडर मेल के नाम से ही आपके पास क्या बन जाएगा एक कॉलम बन जाएगा और इसी के अंदर आपके पास जेंडर के नाम से ही आपके पास जेंडर अंडर फीमेल भी एक बन जाएगा तो मैं यहां पे फीमेल भी आपके पास यहां पे बन जाता है अब होता क्या है कि आपके पास जो जेंडर वाला कॉलम है उसके अकॉर्डिंग आपका जो डाटा है यहां पे रो और वन के अकॉर्डिंग फिल होता रहता है जैसे आपके यहां पे देखेंगे इस डाटा के अंदर आपको क्या दिख रहा है मेल दिख रहा है तो मेल के अंदर आपके पास वन आ जाता है और फीमेल के अंदर आपके पास रो चला जाता है सेम इसी तरह से यदि आपके पास फिर से मेल है तो वन आ जाएगा और फीमेल के अंदर आपका जीरो चला जाएगा अब मान लीजिए कभी आपका फीमेल डेटा आ जागा तो उस वक्त क्या होगा कि यहां पे मेल वाले सेशन के अंदर जीरो आ जाएगा और फीमेल वाले सेक्शन के अंदर वन आ जाएगा तो इस तरह की अनकोडिफाइड हम क्या बोलते हैं वन हॉट एन कोडिंग बोलते हैं और इसके थ्रू आप क्या करते हैं अपने डाटा को एनकोड करते हैं अब आपका डाटा जीरो और वन के अंदर कन्वर्ट हो चुका है मतलब आपके पास आपका डाटा नंबर के अंदर कन्वर्ट हो चुका है तो अब इसका इस्तेमाल हम मशीन लर्निंग एल्गोरिथम में कर सकते हैं तो चलिए जरा अब इसको डिटेल के साथ समझ लेते हैं कि ये इनकोडिंग कैसे परफॉर्म होगी तो अब हम इसे मैनुअल ना करते हुए हम इसे पाइथन के थ्रू परफॉर्म कराएंगे इसके लिए जो सबसे पहले रिक्वायर्ड लाइब्रेरी है उसे हम यहां पे क्या करते हैं इंपोर्ट करते हैं सबसे पहले मैं यहां पे करने वाला हूं पांडा एलियाज ऑफ यहां पे पीडी को इंपोर्ट करने वाला हूं और उसके बाद आप चाहे तो इसके अंदर आप यहां पे ग्राफ वगैरह बनाने के लिए c1 का भी इस्तेमाल कर सकते हैं लेकिन फिलहाल हम ऐसा अभी कुछ नहीं करने वाले हैं हम सीधा इनकोडिंग को परफॉर्म करेंगे अब इनकोडिंग करने के लिए सबसे पहले मुझे डेटा सेट की जरूरत पड़ेगी तो मैं डेटा सेट ले लेता हूं यहां पे और पीडी डॉट यहां पर _ सीएसवी की हेल्प से मेरे जो डेटा सेट है उसे लोड कराता हूं और डेटा सेट का नाम है हमारे पास यहां पे लोड सए उसके बाद हम क्या करते हैं हमारे डाटा सेट को देखते हैं डॉट हैड लगाते हुए चलिए मुझे मेरा डाटा दिख चुका है अब मुझे मेरी जिसकी अनकोट करनी है वो है आपके पास कॉलम जेंडर और मैरिड एक काम करते हैं पहले इसके जो आपके पास कॉलम्स है इन कॉलम के अंदर मिसिंग वैल्यू को फिल कर देते हैं तो चलिए देखते हैं क्या इसमें मिसिंग वैल्यू प्रेजेंट है या नहीं है तो मिसिंग वैल्यू देखने के लिए डेटा सेट डॉट यहां पर मैं इज नल का इस्तेमाल करने वाला हूं यहां पे एंड डॉट सम लगाते हुए मैं क्या कर रहा हूं इसके अंदर मिसिंग वैल्यू को देखूंगा इसके अंदर हमें क्या देखने को मिल रहा है कि जेंडर और मैरिड ऐसे दो कॉलम है जिनके अंदर हमें मिसिंग वैल्यू प्रेजेंट है और ये दोनों कैटेगरी कॉलम है तो हमें पहले इनकी मिसिंग वैल्यू को फिल करना पड़ेगा फिर हम जाके क्या करेंगे इसके अंदर हम क्या इस्तेमाल करेंगे एन कोडिंग का इस्तेमाल करेंगे मिसिंग वैल्यू को फिल करने के लिए क्या करूंगा मैं फिल लेने का इस्तेमाल करूंगा तो मैं चलता हूं डेटा सेट के अंदर और सबसे पहले मैं चलता हूं किसके अंदर जेंडर के अंदर तो मैंने जेंडर ले लिया है जेंडर लेने के बाद में मैं यहां पे क्या इस्तेमाल करने वाला हूं फिल लेने का इस्तेमाल करूंगा डाटा को फिल करने के लिए तो मैंने फिल लेने इस्तेमाल किया है अब देखिए हमारे पास ये डाटा जो है वो कैटेगरी कॉलम में है तो इसलिए हम इसके अंदर क्या करेंगे मोड को फिल कर देंगे तो फटाफट से मोड को बिल कर देते हैं ताकि हम एन कोडिंग को समझ सकें तो मैंने यहां पे जेंडर लगा दिया है जेंडर को लगाने के बाद मैंने यहां पे मोड को कॉल कर दिया है और मड को कॉल करने के बाद में मैंने यहां पे क्या किया है इसका स्क्वायर ब्रैकेट ऑफ़ ज़ीरो ले लिया है उसके बाद मैंने यहां पे इन प्लेस इक्वल्स टू क्या कर दिया है यहां पे टू का इस्तेमाल कर दिया है चलिए जेंडर तो हमारा फिल हो ही चुका है और इसको देखने के लिए हम चले तो जेंडर भी हमारा फिल हो गया है उसके बाद देखिए हमारे पास मैरिड को फिल करना है तो मैं क्या करता हूं मैरिड को सेलेक्ट कर लेता हूं तो जेंडर की जगह हम क्या करते हैं मैरिड को डाल देते हैं और फिर उसके बाद में यहां पे भी हम मेरिड डाल के इससे भी फिल कर देते हैं चलिए मेरिड भी हमारा क्या हो चुका है फिल हो चुका है अब बारी है इनकोडिंग की तो वन हॉट एन कोडिंग करने के लिए आप दो तरीके का इस्तेमाल कर सकते हैं इसके अंदर सबसे पहले आता है गेट डमीज गेट डमस की हेल्प से आप क्या कर सकते हैं वन ह एंड कोडी को परफॉर्म कर सकते हैं यह पांडा का आपके पास क्या है मेथड है जिसका इस्तेमाल कर सकते हैं आप यहां पे दूसरा है आपके पास साइक लर्न लाइब्रेरी के अंदर वन हॉट इनकोडर नाम से क्लास जिसका इस्तेमाल करते हुए वन हॉट एन कोडिंग का भी इस्तेमाल कर सकते हैं तो दोनों प्रोसेसर को इस वीडियो के जरिए हम समझने वाले हैं चलिए वन बाय वन इन दोनों प्रोसीजर को समझते हैं सबसे पहले चलते हैं गेट डमीज के पास में गेट डमीज किस तरह से परफॉर्म करता है जरा उसको समझेंगे तो इसके लिए मैं क्या करूंगा गाइ यहां पे सबसे पहले मैं यहां पे पीडी डॉट यहां पर गेट डमीज को कॉल कर देता हूं यहां पे एंड गेट डमीज के अंदर जाने के बाद में ये देखिए सबसे पहले आपके पास जो आपका डाटा है उसकी डिमांड करता है उसके बाद आप जो भी प्रीफिक्स लगाना चाहे वो आप लगा सकते हैं प्रीफिक्स को सेपरेटर भी दे सकते हैं और भी बहुत सारी चीजें मांगता है तो मैं क्या करता हूं हमारा जो डाटा है जो इनकोडिंग हमें करना है पहले उस डाटा को अलग कर लेता हूं तो मैंने देखिए _ डटा के नाम से मैंने एक अलग से वेरिएबल बना रखा है जहां पे मैं अपने डेटा सेट से क्या करूंगा कि मुझे जेंडर और आपके पास जो मैरिड है इन दोनों को अलग कर देना है ताकि मैं यहां पे क्या कर सकूं इनकोडिंग को परफॉर्म कर सकूं तो मैंने क्या किया जेंडर और मैरिड को मैंने क्या कर दिया यहां पे गाइस अलग कर दिया है उसके बाद में मेरे पास क्या है ईन डाटा को मैं एक बार चेक कर लेता हूं ईन डाटा मुझे किस तरह से दिखाई दे रहा है तो ईन डाटा मेरे पास आ चुका है अब मैं इसकी इनकोडिंग आराम से कर पाऊंगा चलिए अब मुझे क्या करना है गाइस यहां पे सिंपल सा ई अंडरस्कोर जो डाटा है वो मुझे पास करना है एंड देन एंटर करना है तो देखिए इसने मेरी जो डाटा की इनकोडिंग है वो करके दे दी है देखिए जेंडर के अंदर फीमेल बनाया है जेंडर के अंदर मेल बनाया है और ट्रू फॉल्स के अंदर इसने अपना जो रिजल्ट है वो मुझे यहां पे दे दिया है अब देखिए जैसा कि इसने आपका जो आंसर है वो ट्रू फॉल्स में दिया है इस डाटा को यदि आप चेक करेंगे यहां पे इंफो लगा के तो ये डाटा आपको बाइनरी कोडेड के अंदर दिखाएगा यदि मैं यहां पे इंफो लगा के चेक करूं यहां पे तो ये मुझे क्या दिखाता है यहां पे बुलियन डाटा के अंदर दिखाता है मतलब बाइनरी कोडेड में 01 के आपको रिप्रेजेंट करता है लेकिन हमें जो हमारा डाटा चाहिए वो न्यूमेरिकल कंटेंट में चाहिए तो फिर से मुझे यहां पे क्या करना पड़ेगा इसे न्यूमेरिकल कंटेंट में कन्वर्ट करने के लिए इनकोडिंग का इस्तेमाल करना पड़ेगा या नंबर्स को देना पड़ेगा इसकी जगह आप यहां पे क्या इस्तेमाल कर सकते हैं साइकेड लन की लाइब्रेरी के अंदर जाकर आप वन हॉट एन कोडिंग को इस्तेमाल करते हुए यह काम बहुत ही आसानी से कर सकते हैं अब ये कैसे करा जाएगा तो इसको भी जरा हम देख लेते हैं तो इसके लिए आपको जरूरत पड़ेगी साइक लन की लाइब्रेरी अब साइक लन की लाइब्रेरी को सबसे पहले क्या करें आप अपने सिस्टम के अंदर इंस्टॉल कर लें ये कहां मिलेगी तो आपको सबसे पहले सर्च करना है और सर्च बार पे जाने के बाद में एलन pythonanywhere.com देता हूं अब देखिए साइकल लन की जो लाइब्रेरी है हमारे पास यहां पे इसके अंदर क्या-क्या काम होता है तो साइकल न की लाइब्रेरी को जब आप देखेंगे तो इसके अंदर आपका सब तरह का काम होता है इसके अंदर प्री प्रोसेसिंग से लगाकर आपके मॉडल बिल्डिंग तक का सारा काम होता है यदि आप इसके अंदर जाएंगे तो देखिए प्री प्रोसेसिंग के अंदर आपके पास यहां पे अलग-अलग तरीके से काम कर सकते हैं जिसके अंदर आपके पास प्री प्रोसेसिंग के अंदर प्री प्रोसेसिंग होगा फीचर एक्सट्रैक्शन होगा और भी बहुत से तरीके जो काम होते हैं आपके पास डाटा को तैयार करने से रिलेटेड वो सारे के सारे काम इसके अंदर करे जा सकते हैं तो बस हम इसी का ही इस्तेमाल करने वाले हैं आपके पास इनकोडिंग करने के लिए अब ये इनकोडिंग होगी कैसे तो आपको सबसे पहले क्या करना है फ्रॉम साइकल लन के अंदर चलना है साइक लन के अंदर आपके पास क्या आता है प्री प्रोसेसिंग नाम की एक फाइल है मतलब साइकल लन आपके पास क्या एक मॉड्यूल है जहां पे प्री प्रोसेसिंग नाम की एक फाइल पड़ी है उस फाइल के अंदर आप जाके इंपोर्ट करेंगे और किसे इंपोर्ट करने वाले हैं वन हॉट इनकोडर को इंपोर्ट करने वाले हैं वन हॉट इनकोडर नाम की क्लास के अंदर आपका इनकोडिंग परफॉर्म होगी अब क्या करना है आपको गाइज यहां पे सिंपल सा ओई के नाम से आप क्या करें एक वेरिएबल बना दें मतलब एक ऑब्जेक्ट तैयार कर ले इसके अंदर जाके आप यहां पे क्या करें वन हॉट इनकोडर को कॉल कर लें उसके बाद देखिए ओई के अंदर जाना है और मॉडल को क्या करना है फिट ट्रांसफॉर्म करना है आप चाहे तो यहां पे फिट भी कर सकते हैं और ट्रांसफॉर्म अलग से कर सकते हैं और आप चाहे तो आप यहां पे फिट ट्रांसफॉर्म एक साथ भी कर सकते हैं फिट ट्रांसफॉर्म यहां पे क्या काम करता है इसको जरा थोड़ा डिटेल के साथ समझते हैं तो देखिए फिट ट्रांसफॉर्म क्या करता है कि आपके पहले आपके डाटा को देखता है समझता है और उसके अंदर अपनी सा बकेट लर्न के जो एल्गोरिथम है वो अप्लाई करता है एंड देन उसके बाद में जो भी आपका डाटा है उसे ट्रांसफॉर्म कर देता है जैसे कि मैं यदि यहां पे कैटेगरी कल डाटा भेजूं तो ये उसे न्यूमेरिकल डाटा में कन्वर्ट कर देता है तो बस यही इसका काम होता है फिट ट्रांसफॉर्म का तो हम भी यही काम करने वाले हैं बस इसके अंदर आपको क्या करना है आपका जो भी अन कोडिंग का डाटा है वो इसके अंदर पास करना है तो मैं यहां पे क्या करना हूं ए अ डाटा को यहां पे पास कर रहा हूं जैसे ही मैं ंडर डाटा को पास करता हूं ये मुझे एक स्पर्स मैट्रिक्स बना के देता है स्पर्स मैट्रिक्स का मतलब आप जरा समझिए क्योंकि ये बहुत ज्यादा आगे काम आने वाली है जब भी आप डीप लर्निंग के अंदर वर्क कर रहे हैं तब स्पर्स मैट्रिक्स एक एसी मैट्रिक्स होती है जिसके अंदर ज्यादातर जो कंटेंट होता है मतलब ज्यादातर जो एलिमेंट्स होते हैं वो जीरो और वन से फिल होते हैं और जैसा कि हमें पता है कि हमारे पास ये जो आपका वन हॉट एन कोडिंग टा लेके आता है वो आपके जीरो और वन कंटेंट से ही बना हुआ होता है तो बेसिकली स्पार्क्स मैट्रिक्स उस मैट्रिक्स को कहते हैं जहां पे ज्यादातर कंटेंट आपके पास जीरो और वन से फिल करे हुए होते हैं आपके पास यहां पे अब यह हमें क्या दे रहा है एक एड्रेस दे रहा है या फिर आप बोल सकते हैं एक आपके पास रॉ फॉर्मेट दे रहा है जहां पे आपका डाटा मतलब वन हॉट एन कोडिंग करा हुआ जो डाटा है वो प्रेजेंट पड़ा है अब हमें क्या करना पड़ेगा इस डाटा को एरे में कन्वर्ट करना पड़ेगा एरे में कन्वर्ट करने के लिए आप बस क्या करें सबसे इसके पीछे सिंपल सा डट एरे को कॉल कर दें आप यहां पे और ड एरे को जैसे ही आप कॉल करेंगे तो आपका जो डाटा है वो एरे में कन्वर्ट हो जाएगा मतलब आपका डाटा इनकोडिंग हो जाएगा और एक एरे फॉर्मेट में मिल जाएगा लेकिन मुझे यह मेरा जो डाटा है वह एक एरे फॉर्मेट में नहीं चाहिए मुझे एक डटा फ्रेम के तौर पे चाहिए तो आपको यहां पे इसे डाटा फ्रेम के अंदर कन्वर्ट करना पड़ेगा अब डेटा फ्रेम के अंदर कैसे कन्वर्ट कर सकते हैं तो उसके लिए बहुत ही सिंपल तरीका है आप क्या करें यहां पे पहले इसे सेव कर लें तो मैं इसे एर नाम के वेरिएबल के अंदर सेव कर रहा हूं और डाटा फ्रेम में कन्वर्ट करने के लिए पीडी डॉट मैं डटा फ्रेम का इस्तेमाल करूंगा यहां पे जिसके अंदर एआर जो डाटा है वो एज इट इज दूंगा अब बारी है हमारे कॉलम के नेम की तो कॉलम के नेम के अंदर आप अपने कॉलम के नाम तैयार कर लें जैसे सबसे पहले मैं बात करूं कि हमारे पास क्या है जेंडर है जेंडर में मेल और फीमेल है फिर उसी तरह से मैरिड में भी यस एंड नो है तो देखिए ये कॉलम हमारे पास पहले से तैयार है तो मुझे बार-बार लिखने की जरूरत नहीं पड़ेगी तो मैं क्या करूंगा गाइस यहां पे सिंपल सा इन्हीं को यूज कर लूंगा तो मैंने जेंडर फीमेल डाल दिया है और इसी तरीके से मैं क्या करूंगा यहां पे जेंडर मेल को भी ले लूंगा यहां पे ओके और इसी तरीके से मैं क्या करूंगा गाइज यहां पे मैरिड में भी नो को ले लूंगा यहां पे और इसी तरीके से मैं क्या करने वाला हूं मैरिड को मैं यस भी ले लूंगा एंड इसको कर देते हैं यस चलिए अब मैं इसे रन करता हूं तो देखिए मेरे पास जो मेरे डाटा है उनकी इनकोडिंग हो चुकी है मतलब अब मुझे इन कॉलम की इस्तेमाल करने की जरूरत नहीं है जो कि कैटेगरी कल कॉलम है यहां पे जिसके अंदर मेल और फीमेल लिखा है उसकी जगह पर मैं यहां पे इन कॉलम का इस्तेमाल कर सकता हूं जहां पे मैं जेंडर फीमेल जेंडर मेल मैरिड नो और मैरिड एस का इस्तेमाल कर सकता हूं अब देखिए इसके अंदर देखिए एक और बहुत इंपॉर्टेंट चीज है काफी बार क्या होता है कि आपका जो डाटा होता है वो काफी बड़ा हो जाता है जैसे मैंने यहां पे दो कॉलम दिए थे और इसने मुझे जनरेट करके के दिए चार कॉलम तो आपका डाटा जो क्या हुआ यहां पे बहुत ही ज्यादा हो चुका है यहां पे मतलब आपका डाटा एक्ससीड्स डेटा को यदि आपको कम करना है तो आप यहां पे ड्रॉप फर्स्ट का इस्तेमाल कर सकते हैं ड्रॉ फर्स्ट क्या करेगा गाइज यहां पे कि आपके पास जो पहला कॉलम आया है ये उसे डिलीट कर देगा अब इसके लिए आप क्या करें सिंपल सा जो वन हॉट इनकोडिंग है इसके ऊपर जाएं और इसे ओपन करें ओपन करते ही देखिए आपको यहां पे ड्रॉप मिल जाएगा ड्रॉप के अंदर जैसे ही आप यहां पे जाएंगे तो ड्रॉप के अंदर आप थोड़ा सा नीचे जाएंगे और सर्च करेंगे तो देखिए ड्रॉप आपको क्या मिलेगा फर्स्ट मिल जाएगा तो आप यहां पे ड्रॉप फर्स्ट का इस्तेमाल कर सकते हैं तो मैं भी यहां पे क्या करने वाला हूं ड्रॉप यहां पे जाऊंगा और एफ आई आर एस टी फर्स्ट यहां पर देने वाला हूं और जैसे ही मैं रन करूंगा तो मेरे पास एक नया एरे जनरेट होगा जहां पे मेरा जो डाटा होगा वो ड्रॉप फर्स्ट करके मिलेगा अब मैं इसे रन करूंगा तो देखिए मेरे पास जो कॉलम है वो दो ही मिलने वाले हैं अब ये कॉलम बना कौन सा है ये कॉलम के अंदर आपके पास जो जेंडर फीमेल है वो यहां से हट चुका है मैरिड के अंदर जो नो है वो भी यहां से हट चुका है ड्रॉप फर्स्ट का मतलब ये होता है कि आपके पास जितने भी एंड कोडिंग के बाद कॉलम बनते हैं उनमें से जो पहला कॉलम होता है वो आपका डिलीट हो जाता है और पीछे बचे रिमेनिंग जितने भी कॉलम्स हैं वो आपको देखने को मिलते हैं बस यही एक ड्रॉप फथ का नियम होता है चलिए इसके द्वारा जो बनी हुई नई आपका एरे है उसको हम देखते हैं और इसके थ्रू हम यहां क्या करते हैं आपका जो नया डाटा सेट है वो तैयार करते हैं तो मैं यहां पे क्या कर रहा हूं मैं जेंडर मेल को ले रहा हूं यहां पे और मैरिड नो को भी मैं यहां पे हटा रहा हूं जैसे ही रन करूंगा तो देखिए मेरे पास जो मेरा डाटा है वो मुझे मिल चुका है ये कैसे थ्रू मिला है ये ड्रॉप फर्स्ट के थ्रू मुझे यहां पे मिला है अब इसके थ्रू भी हम यहां पे बहुत सारी इंफॉर्मेशन निकाल सकते हैं मैं बेसिकली जेंडर की बात करूं तो जेंडर आपके पास तीन तरह के होते हैं लेकिन यहां पे हमें जेंडर के अंदर दो तरीके के जेंडर की बात की गई है जेंडर मेल और जेंडर फीमेल तो यहां पर यदि जेंडर मेल दिया गया है और वहां पे यदि वन दिया गया है तो अंडरस्टूड होगा कि यहां पे मेल की बात की गई है लेकिन जहां-जहां जीरो दे रखा है वहां पे आपका अंडरस्टूड हो जाएगा कि मेल नहीं है मेल नहीं है इसका मतलब क्या है गाइज यहां पे फीमेल प्रेजेंट है तो इससे थ्रू हम बहुत ही आसानी से अपनी चीजें एनालिसिस कर सकते हैं तो बेसिकली गाइज आपके पास जब भी कैटेगरी कल डाटा हो और आपको न्यूमेरिकल डाटा में कन्वर्ट करने की जरूरत पड़े तो आप वहां पे वन हॉट एंड कोडिंग का इस्तेमाल करके आप ये चीजें कर सकते हैं और आज के इस वीडियो के जरिए हम सीखने वाले हैं लेबल एंड कोडिंग को और इसका इस्तेमाल कहां पे होता है यह चीज देखने वाले हैं देखिए सबसे पहले मैं बात करूं इनकोडिंग का इस्तेमाल हम क्यों कर रहे हैं डटा साइंस के अंदर क्योंकि देखिए जब भी आप मशीन लर्निंग मॉडल को बना ने चाहते हैं तो मशीन लर्निंग का जो मॉडल होता है वो आपके पास क्या होता है एक मैथमेटिकल फॉर्मूला होता है जैसे कि y = mx3 राइट अब इस तरह के फॉर्मूले के अंदर हमारा न्यूमेरिकल डाटा जाता है ना कि कैटेगरी कल डाटा जैसे कि मैं हाइट विड्थ की बात करूं तो वो चला जाएगा लेकिन यदि मैं बात करने जा रहा हूं यहां पे किसी के नेम के बारे में किसी के जेंडर के बारे में तो वो वहां पे नहीं जा सकता तो उसके लिए हमें जरूरत पड़ती है इनकोडिंग की अब इसी एन कोडिंग की सीरीज के अंदर हमने ऑर्डिनल इनकोडिंग को देखा था आज के इस वीडियो के अंदर हम दे देख रहे हैं लेबल एन कोडिंग को तो लेबल एन कोडिंग किस जगह परफॉर्म की जाती है उसको देखते हैं यहां पे तो देखिए लेबल एन कोडिंग जो होती है यहां पे वो आपके पास नॉमिनल डाटा के ऊपर परफॉर्म की जाती है अब यहां पे कांसेप्ट आता है व्हाट इज अ नॉमिनल डाटा तो देखिए नॉमिनल डेटा देखिए क्या होता है कि जब आप किसी कैटेगरी कल डाटा के ऊपर बात करते हैं तो उसको हम दो पार्ट के अंदर कैटेगरी इज करते हैं एक होता है हमारा नॉमिनल डाटा दूसरा होता है हमारे पास ऑर्डिनल डाटा नॉमिनल डाटा वो डाटा होता है जिसके अंदर आपके पास किसी भी डाटा के अंदर कोई भी आपके पास कनेक्शंस नहीं होता है जस्ट लाइक एग्जांपल की बात करूं यहां पे तो आप मान लीजिए काउ डॉग बफेलो पैरोट इस तरह से आप किसी भी एनिमल का नेम ले लीजिए अब ये जो एनिमल नेम्स है यहां पे इनमें कोई ऑर्डर सीक्वेंस नहीं है ऑर्डर सीक्वेंस का मतलब क्या है ये एक दूसरे के साथ कनेक्टेड नहीं है हालांकि एक दूसरे के साथ कनेक्टेड है ये सब एनिमल की कैटेगरी के अंदर आते हैं लेकिन इन सब के अंदर कोई भी कनेक्शंस नहीं है कि यह कोई एक सीक्वेंस ऑर्डर के अंदर नहीं है सारे कुछ क्या है आपके पास इंडिविजुअल वर्क करते हैं वहीं पे यदि मैं बात करूं ऑर्डिनल डाटा के बारे में तो ऑर्डिनल डाटा के अंदर आपको एक सीक्वेंस पैटर्न देखने को मिलता है जैसे कि एक छोटा सा एग्जांपल दूं मैं आप लोगों को आप सब लोग ड्रेस खरीदने जाते हैं ड्रेसेस के अंदर आपके पास ड्रेसेस की क्या होती है एक साइज ऑर्डर होता है कि सबसे पहले स्मॉल साइज होती है उसके बाद आपकी मीडियम होती है फिर लार्ज होती है फिर एक्स्ट्रा लार्ज होती है फिर उसके बाद डबल एक्स्ट्रा लार्ज भी होती है तो यहां पे आपको सारी चीजें क्या मिलती है एक ऑर्डर के थ्रू मिलती है तो तो इस तरह के डेटा को हम ऑर्डिनल डाटा यहां पे बोलते हैं तो मैं आ चुका हूं हमारी जुपिटर नोटबुक के अंदर यहां पे जो मेरी रिक्वायर्ड है यहां पे लाइब्रेरी उनको मैं इंपोर्ट करता हूं तो सबसे पहले मैं यहां पे इंपोर्ट करूंगा किसे पांडा को कर देता हूं यहां पे पांडा एलियाज ऑफ पीडी और देखिए पांडा एलियाज ऑफ पीडी लगाने के बाद में मैं जो डेटा सेट है वो खुद क्रिएट कर रहा हूं ताकि आप लोगों को थोड़ी एन कोडिंग के बारे में नॉलेज हो सके और छोटे डाटा सेट के अंदर आप इसे आराम से समझ सके तो इसके लिए मैं क्या करता हूं यहां पे एक डीएफ नाम से एक डेटा फ्रेम क्रिएट करता हूं पडी ड डटा फ्रेम के थ्रू मैं यहां पे एक डाटा फ्रेम क्रिएट करने जा रहा हूं यहां पे और यहां पे क्या करते हैं नेम देते हैं किसी के भी एनिमल के या कोई भी पर्सन के किसी के भी दे सकते हैं आप यहां पे नाम तो मैं किसी का भी नाम डाल रहा हूं जैसे एक नाम डालते हैं लए क्यूब टेक राइट और सेकंड चीज क्या डालते हैं यहां पे काउ डाल देते हैं उसके बाद में गाइज यहां पे कैट डाल देते हैं और उसके बाद मैं क्या करता हूं गाइज यहां पे डॉग डाल देता हूं इसके अलावा देखिए आप कुछ भी डाल सकते हैं जैसे कि मैं यहां पे बीएल एसी के ब्लैक कलर डाल देता हूं तो मैंने क्या किया कुछ भी नाम यहां पर दे दिया है अब ये जो मेरा डाटा फ्रेम तैयार हुआ है मुझे इसी की क्या करनी है इनकोडिंग करनी है तो इसकी इनकोडिंग करने के लिए मैं साइके एटल लाइब्रेरी का इस्तेमाल करूंगा लेकिन उससे पहले साइकेल लाइब्रेरी आप सभी के सिस्टम में इंस्टॉल होनी चाहिए जैसा कि मैंने लास्ट वाली वीडियो के अंदर भी आपको बताया था कि साकन लाइब्रेरी को आप अपने सिस्टम के अंदर कैसे इंस्टॉल कर सकते हैं तो चलिए इसको साइक लन लाइब्रेरी के थ्रू एन कोडिंग करते हैं यहां पे साक लन लाइब्रेरी के अंदर आप क्या करेंगे आप सबसे पहले जाएंगे फ्रॉम साइकल लन के अंदर जाएंगे साइकल लन के अंदर आपको जाएंगे प्री प्रोसेसिंग के अंदर प्री प्रोसेसिंग के अंदर आपके पास क्या मिलेगी इनकोडिंग की लाइब्रेरी मिल जाएगी तो उसके अंदर जाएंगे आप यहां पे इंपोर्ट करेंगे और किसको इंपोर्ट करना है लेबल इनकोडर को इंपोर्ट करना है लेबल इनकोडर को इंपोर्ट करने के बाद में आप क्या करें एक वेरिएबल बना ले मतलब एक ऑब्जेक्ट बना लें एई के नाम से उसके बाद में लेबल इनकोडर को कॉल कर दीजिए लेबल इनकोडर को कॉल करने के बाद ए डॉट यहां पे क्या करें फिट ट्रांसफॉर्म का इस्तेमाल करें आप चाहे तो फिट का भी इस्तेमाल कर सकते हैं ट्रांसफॉर्म का भी इस्तेमाल कर सकते हैं जैसा कि मैंने आपको पहले भी बताया है कि फिट क्या करता है आपके मॉडल को केवल और केवल ट्रेंड करता है अब ट्रेंड करने के बाद में आपको उसे कन्वर्ट करना होता है तो आप यहां पे ट्रांसफॉर्म का इस्तेमाल कर सकते हैं और आप चाहें तो फिट ट्रांसफॉर्म का एक साथ भी इस्तेमाल कर सकते हैं हालांकि इसका इस्तेमाल उस वक्त किया जाता है जब आप मॉडल बिल्डिंग करने के लिए जा रहे हैं मॉडल को डिप्लॉयड को जब भी डिप्लॉयड हैं तो आपको इनकोडिंग को परमानेंटली रखना पड़ता है तो आप क्या करते हैं एली को पहले फिट करते हैं और ट्रांसफॉर्म आप अलग से करते हैं और जब आपके पास ट्रेनिंग मॉडल आता है तब उस वक्त आप यहां पे क्या करते हैं फिट ट्रांसफॉर्म यहां पे दोबारा करते हैं तो बेसिकली गाइज यहां पे मैं डायरेक्टली आपको सिर्फ समझाने के परपस के लिए यहां पे क्या कर रहा हूं फिट ट्रांसफॉर्म को यहां पे दे रहा हूं अब उसके बाद मैं क्या करूंगा गाइज यहां पे डीए दूंगा और डीए के अंदर यहां पे डबल स्क्वायर ब्रैकेट बनाते हुए मैं जो मेरा नेम है डीएफ के अंदर मेरा जो यहां पे नेम नाम से यहां पे पैरामीटर है वो मैं पास करा रहा हूं और इसने मुझे क्या करके दे दी है मुझे मेरे डाटा की इनकोडिंग करके दे दी है और वो भी एक एरे फॉर्मेट में यहां पे करके दी है अब इस इनकोडिंग को ले जाके हम इस नेम नाम के वेरिएबल के अंदर इसके पास लगा देते हैं मतलब इसी डेटा फ्रेम में लगा देते हैं तो देखिए डेटा फ्रेम में लगाने के लिए मैं क्या करूंगा यहां पे गाइज डीएफ नाम से जो डेटा मैं उसे कॉल करूंगा और उसके बाद मैं क्या करूंगा _ नेम के नाम से एक आपके पास कॉलम का नाम बना दूंगा एंड रन करूंगा तो मेरा ईन नेम जो है वहां जाके लग जाएगा अब एक बार डीएफ को देखते हैं तो देखिए मेरे पास यहां पे क्या है ओरिजिनल डाटा दिख रहा है और उसके साथ-साथ मुझे एन कोडिंग का भी डाटा देखने को मिल रहा है अब यहां पे आप देखिए कैट जो है वो उसको नंबर वन दिया है अ उसके बाद आप देखिए उससे पहले आपके पास ब्लैक को जीरो दिया है कैट को नंबर वन दिया है उसके बाद काव को टू दिया है डॉग को थ्री दिया है और डब्ल्यू एस क्यूब को फोर नंबर यहां पे मिला है तो गाइस इस तरह से आप क्या कर सकते हैं लेबल एन कोडिंग को परफॉर्म कर सकते हैं यहां पे आपका पास जितना भी डाटा है वो आपके पास क्या है अनसी क्वेंस डटा मतलब यहां पे कोई सीक्वेंस ऑर्डर परफॉर्म नहीं किया जा रहा है इसलिए हम यहां पे क्या कर रहे हैं इस तरह से यूज़ कर रहे हैं अब एक काम करते हैं हम रियल वर्ड डेटा सेट को लेते हैं जैसे कि हम पहले भी डेटा सेट के ऊपर काम कर रहे थे उसके ऊपर इनकोडिंग परफॉर्म करके देखते हैं तो उसके लिए मुझे क्या करना पड़ेगा मुझे मेरा डेटा सेट को लोड करना पड़ेगा तो मैं डाटा सेट को लोड करता हूं pd.cut लोन ड सीएवी है उसको मैं लोड करने वाला हूं यहां पे अब उसके बाद में मैं डेटा सेट को क्या करता हूं लोड करता हूं और डॉट हैड के थ्रू मैं इस डाटा को देखता हूं तो इसके अंदर आप देखेंगे कि आपके पास जो प्रॉपर्टी एरिया है यहां पे आपको इनकोडिंग करने की जरूरत है और यहां पे जो डाटा है वो एक से ज्यादा भी है हमारे पास यहां पे तो क्यों ना इसके अंदर इनकोडिंग की जाए यहां पे तो चलिए इसके अंदर इनकोडिंग करते हैं क्या करना पड़ेगा गाइज यहां पे आप सिंपल सा क्या करें आप एल के नाम से एक वेरिएबल बना सकते हैं क्योंकि देखिए मैंने यहां पे एली के नाम से ऑलरेडी वेरिएबल बना रखा है तो मैं यहां पे एए के नाम से क्वारे बल होना होगा और मैं अपना जो लेबल इनकोडर है उसे मैं यहां पे कॉल करने वाला हूं उसके बाद ए डॉट मैं क्या करूंगा मॉडल को फिट करूंगा यहां पे या फिर ट्रांसफॉर्म का इस्तेमाल भी कर सकता हूं तो देखिए मैं फिट करने वाला हूं यहां पे फिलहाल फिट करने के बाद में मैं जो हमारा डेटा सेट है उसको लूंगा और इसके अंदर जो मेरा प्रॉपर्टी एरिया है उसको मैं लगा दूंगा तो मेरा जो मॉडल है वो फिट हो जाएगा उसके एले के बाद मैं क्या करूंगा यहां पे ट्रांसफॉर्म करूंगा और ट्रांसफॉर्म के अंदर मैं मेरा जो डटा सेट है उसे लूंगा और इसके अंदर मेरा जो प्रॉपर्टी है इसे लूंगा तो देखिए इसने मुझे अपने डाटा की जो इनकोडिंग है वो करके दे दी है यहां पे अब देखिए इसने नंबर टू दिया है पहले वाले को और उसके बाद रो दिया है फिर उसको टू दिया है इसका मतलब इसने अर्बन को क्या दिया है टू नंबर दिया है रूलर को इसने जीरो दिया है अब देखिए इसके अंदर क्या है हमारे पास तीन तरह की कैटेगरी है यदि आप इसको एक्सपेंड करके देखेंगे ना तोत आपको तीन तरह की कैटेगरी मिलेगी इसको देखने के लिए मैं क्या करूंगा यहां पे गाइज डाटा सेट देन स्क्वायर ब्रैकेट और प्रॉपर्टी एरिया जो है यहां पे इसे कॉल करूंगा और इसके अंदर जो यूनिक वैल्यू को निकालू ा यहां पे यूनिक से मुझे पता चल जाएगा कि इसके अंदर किस तरह का डटा प्रेजेंट है फिलहाल आप देखिए यहां पे अर्बन है रूलर है सेमी अर्बन है और नैन वैल्यू भी है अब देखिए इसने नैन वैल्यू को हमने फिल नहीं किया है तो वहां पे भी इसने क्या कर रखा है रो या वन से आपके पास फिल करके इसने मुझे दे दिया है तो इस तरह से आप क्या कर सकते हैं अपने डाटा की इनकोडिंग कर सकते हैं और यदि आप चाहें कि इस डाटा को वापस इसी जगह पे लगाना है तो आप क्या करेंगे अपने डाटा सेट को कॉल करेंगे देन स्क्वायर ब्रैकेट और जो आपके कॉलम का नाम है वो रिप्लेस कर देंगे तो प्रॉपर्टी एरिया का जो डाटा है वो उसके अंदर जाके रिप्लेस हो जाएगा अब जाके आप यूनिक को चेक कीजिए तो य यहां पे आपको नंबर मिल जाएगा 0 1 2 एंड ्र इसका मतलब नैन को भी हमें यहां पे एक नंबर मिला है और वो हो सकता है आपका टू हो सकता है या थ्री हो सकता है वो आपको देखना पड़ेगा कि नैन का आपको किस तरह से नंबर दिया है यहां पे तो इस तरह से आप क्या कर सकते हैं डाटा की इनकोडिंग कर सकते हैं और वो भी लेबल एन कोडिंग कर सकते हैं तो फिलहाल आज की वीडियो के लिए बस इतना ही रखेंगे मिलते हैं हमारी अगली वीडियो के साथ जहां पे हम ऑर्डिनल इनकोडिंग को समझेंगे और उसी वीडियो के जरिए हम ये भी समझेंगे कि ऑर्डिनल एन कोडिंग आपके पास कब लगाई जाती है और दोनों में क्या डिफरेंस है और आज के इस वीडियो के जरिए हम बात करेंगे ऑर्डिनल इनकोडिंग के बारे में कि ऑर्डिनल इनकोडिंग किस तरीके से परफॉर्म की जाती है हम प्रेफर करते हैं ऑर्डिनल इनकोडिंग को अब ये जो एडोल इनकोडिंग होती है वो दो तरीके से आप परफॉर्म कर सकते हैं पहला तरीका है यहां पे कि आप साइकल लन की हेल्प ले सकते हैं दूसरा तरीका है मैप फंक्शन के थ्रू यस मैप फंक्शन के थ्रू भी आप इस इनकोडिंग को परफॉर्म किया जा सकता है तो आज की इस वीडियो के अंदर हम दोनों टेक्निक को बात करेंगे पहले हम बात करेंगे यहां पे साइकिल लर्न के थ्रू फिर दूसरी टेक्निक के अंदर हम मैप के थ्रू बात करेंगे तो इसको समझने के लिए चलते हैं जुपिटर नोटबुक के अंदर जहां पे इस टेक्निक को डिटेल के साथ देखते हैं यदि आपको python-tk के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं चलिए मैं आ चुका हूं हूं जुपिटर नोटबुक के अंदर अब मैं एक काम करता हूं सबसे पहले मैं अपना खुद का एक डेटा सेट तैयार करता हूं देखिए डेटा सेट तो फिलहाल मेरे पास बहुत सारे पड़े हैं लेकिन मैं आपको एक छोटे डेटा सेट के ऊपर दिखाऊंगा ताकि आप ऑब्जर्वेशन आराम से ले सके और चीजों को अच्छे तरीके से समझ सक फिर हम यहां पे इसको डिटेल के साथ एक बड़े डाटा सेट के साथ भी परफॉर्म कर लेंगे चलिए सबसे पहले मैं बात करूंगा यहां पे कि हमें क्या करना पड़ेगा हम एक डेटा सेट बनाना चाह रहे हैं डेटा सेट बनाने के लिए मैं क्या करूंगा यहां पे इंपोर्ट करूंगा और इंपोर्ट कैसे करने वाला हूं पांडा एलियाज ऑफ पीडी को मैं इंपोर्ट करूंगा डेटा फ्रेम तैयार करना है तो उसके लिए मैं क्या करता हूं डीएफ नाम से एक डटा फ्रेम तैयार करता हूं पीडी डॉट यहां पर मैं डटा फ्रेम को इस्तेमाल करूंगा इसके अंदर क्या करने वाला हूं गाइज यहां पे एक नेम नाम से या फिर एक काम करते हैं साइज की बात कर लेते हैं तो मैं साइज के नाम से एक वेरिएबल बना लेता हूं मतलब एक कॉलम का नाम बना लेता हूं यहां पे और यहां पे मैं अपनी अलग-अलग साइज रख लेता हूं जैसे कि मैंने रखा है स्मॉल साइज रखी फिर मैंने मीडियम साइज लिया यहां पे फिर मैंने लार्ज ले लिया फिर मैंने एक्सेल डबल एक्सेल ले लिया यहां पे फिर देखिए मैंने फिर से स्मॉल ले लिया फिर मैंने मीडियम ले लिया फिर मैंने लार्ज ले लिया फिर से देखिए मैंने स्मॉल ले लिया फिर से मैंने स्मॉल ले लिया फिर से मैंने यहां पे लार्ज लिया फिर मैंने एक्सेल ले लिया और फिर मैंने लास्ट में चलते हुए मैंने एम वापस ले लिया तो इस तरह से मैंने अपना एक डेटा सेट तैयार कर रखा है यहां पे और इस डेटा सेट को देखा जाए तो डीएफ आपको एक डेटा सेट मिल जाएगा एक छोटी सी मिस्टेक हो गई है यहां पे क्योंकि मुझे ये डेटा किस में डालना था एज अ डिक्शनरी के तौर पे डालना था हमारी जो डेटा फ्रेम है वो यहां पे तैयार हो चुका है अब मुझे इसकी क्या करनी है इनकोडिंग करनी है इनकोडिंग करनी है तो फिलहाल इस डेटा सेट को कम कर देते हैं इसके अंदर दो डेटा या तीन डाटा को दिखा देते हैं यहां पे अब इनकोडिंग करने के लिए मुझे यहां पे क्या करना पड़ेगा इनकोडिंग के नंबर्स डिसाइड करने पड़ेंगे मतलब मुझे ऑर्डर डिसाइड करना पड़ेगा तो मैं काम करता हूं डेटा नाम से एक वेरिएबल बना लेता हूं उसके बाद मैं डबल स्क्वायर ब्रैकेट के अंदर एक चीज का ध्यान रखिएगा यहां पे टू डायमेंशन डटा सेर चलता है तो आपको डबल स्क्वायर ब्रैकेट्स के अंदर लेना पड़ेगा ड्यू डायमेंशन डेटा के लिए डबल स्क्वायर लिया मैंने यहां पे और सबसे पहला ऑर्डर दिया स्मॉल को फिर मैंने दिया मीडियम को फिर मैंने लार्ज को दिया और फिर मैंने एक्स्ट्रा लार्ज को दिया इस तरह से मैंने क्या किया एक सीक्वेंशियल ऑर्डर तैयार कर दिया है एक काम करते हैं इसको ओ आरडी अंडर डटा के नाम से इसे सेव कर लेते हैं अब अब चलते हैं साइकल लन की लाइब्रेरी के थ्रू जिसके थ्रू हम यहां पे इस ऑर्डिनल इनकोडिंग को परफॉर्म करेंगे तो उसके लिए मैं करूंगा यहां पे फ्रॉम जाऊंगा यहां पे साइकल लन के पास में देन डॉट उसके बाद मुझे क्या करना पड़ेगा प्री प्रोसेसिंग को कॉल करना पड़ेगा प्री प्रोसेसिंग के थ्रू हम ये इनकोडिंग परफॉर्म कर सकते हैं उसके बाद हम इंपोर्ट करेंगे और इंपोर्ट करने के बाद में मैं यहां पे करूंगा ऑर्डिनल इनकोडर को जहां पे हम हमारी ऑर्डिनल इनकोडिंग को परफॉर्म करने वाले हैं चलिए इसे रन करते हैं फिर मैं यहां पे काम करता हूं ओई के नाम से एक वेरिएबल बना लेता हूं जहां पे मैं ऑर्डिन इनकोडिंग का एक क्या बना रहा हूं ऑब्जेक्ट तैयार कर रहा हूं और इधर मैं क्या करता हूं ऑर्डिनल इनकोडिंग को कॉल कर देता हूं अब इस ऑर्डिनल इनकोडिंग को जब आप ओपन करेंगे तो यहां पे आपको सबसे पहले पहले मिलेगी कैटेगरी कैटेगरी का मतलब है कि आप इस इनकोडिंग को किस तरह से परफॉर्म करना चाहते हैं फिलहाल यहां लिखा है ऑटो जब ये ऑटो की सिचुएशन में रहता है उस वक्त आपके पास क्या होता है कि आपके पास जो अल्फाबेटिकल ऑर्डर होते हैं उसके हिसाब से ये इनकोडिंग कर देता है लेकिन मुझे यहां पे अल्फाबेटिकल ऑर्डर नहीं करना है मुझे यहां पे एस एम एल एक्सेल इस फॉर्मेट में मुझे यहां पे इनकोडिंग करनी है तो इसलिए मुझे क्या करना पड़ेगा कैटेगरी को च चेंज करना पड़ेगा और कैटेगरी को मुझे क्या करना पड़ेगा ओ आरडी डाटा को रखना पड़ेगा बस इतना सा आपको करना है फिर मैं क्या करूंगा ई डॉट यहां पे क्या करूंगा फिट ट्रांसफॉर्म का इस्तेमाल करूंगा आप चाहें तो पहले फिट कर सकते हैं और उसके बाद ट्रांसफॉर्म भी परफॉर्म कर सकते हैं क्योंकि देखिए क्या होता है कि जब आप यहां पे इस मॉडल को डिप्लॉयड जाएंगे तो आपको इस ओई की जरूरत पड़ेगी क्योंकि आपके पास जो नया डाटा आएगा उसके अंदर भी आपको इनकोडिंग करने की जरूरत पड़ेगी तो उस वक्त आपको यहां पे इस ओई डाटा सेट की जरूरत पड़ेगी तो इसलिए जब भी आप यहां पे ओई के साथ इनकोडिंग करने जा रहे हैं तो पहले आप इसमें आराम से फिट कर लीजिए उसके बाद आप यहां पे क्या करिए इनकोडिंग कीजिए चलिए मैं डीएफ डालता हूं और डीए डालने के बाद डबल स्क्वायर ब्रैकेट के अंदर मैं क्या कर रहा हूं यहां पे जो मेरी साइज है उसे डाल देता हूं तो मैंने यहां पे साइज डाल दिया रन करते हैं यह इनकोडिंग हमारी परफॉर्म हो चुकी है उसके बाद में हम क्या करते हैं ई के साथ चलते हैं और उसके बाद हम यहां पे ट्रांसफॉर्म को कॉल करते हैं ट्रांसफॉर्म के अंदर जाने के बाद मैं df1 ब्रैकेट फिर से डालूंगा और यहां पर मैं अपनी साइज को डाल देता हूं जैसे ही मैं साइज को डालूंगा तो देखिए इसने मुझे मेरी एनकोड परफॉर्म करके दे दी है यहां पे अकॉर्डिंग टू नंबर्स यहां पे लग चुके हैं चलिए एक काम करते हैं इसको हम क्या करते हैं हमारी मेन टेबल के साथ से ऐड कर देते हैं मेन टेबल का नाम क्या है डीएफ है तो मैं चलता हूं यहां पे डीएफ और डीएफ के बाद में एक कॉलम बनाता हूं नया जहां पे मैं क्या लिखूंगा कि मेरी जो साइज है उसको इनकोडिंग किया है मतलब न किया है चलिए इसे रन कर देते हैं अब एक काम करते हैं डीएफ को दोबारा देखते हैं तो डीएफ को मैंने दोबारा देखा तो एक तरफ हमारे पास क्या है वेरिएबल का नाम है एक तरफ हमारे पास क्या है हमारे पास कैटेगरी डाटा है और दूसरी तरफ हमारे पास क्या है इनकोडिंग डाटा है चलिए देखते हैं साइज को क्या मिला है साइज को हमें जीरो मिला है यहां पे मीडियम को वन मिला है लार्ज को हमने टू दिया है एक्स्ट्रा लार्ज को हमने थ्री दिया फिर उसके बाद देखिए 0 1 1 टू के बाद टू फिर रो फिर रो फिर टू फिर एक्स्ट्रा लार्ज को थ्री फिर m को वन तो इस तरह से आपके डाटा की क्या हो चुकी है एन कोडिंग हो चुकी है तो ये था साइकेड लर्न का मेथड जहां पे आपने क्या किया ऑर्डिनल एन कोडिंग को परफॉर्म किया अब आप चाहें तो इस परफॉर्मेंस को मैप फंक्शन के थ्रू भी कर सकते हैं तो अब स्टेप जानते हैं मैप फंक्शन के थ्रू हम ये इनकोडिंग कैसे करने वाले हैं चलिए मैप फंक्शन को जरा समझते हैं तो मैं काम करता हूं यहां पे वापस से इसी डाटा को लूंगा मैं यहां पे साइज को ही लूंगा मैं यहां पे और फिर इसी के थ्रू मैं यहां पे परफॉर्म करूंगा मैप फंक्शन से करना और भी ज्यादा आसान है इसके लिए आपको क्या करना पड़ेगा एक आपको डिक्शनरी तैयार करनी पड़ेगी जहां पे आप ये बताएंगे कि किसको क्या नंबर देने वाले हैं तो चलिए डिक्शनरी तैयार करते हैं एक काम करते हैं यहां पे रडी डटा के नाम से एक वेरिएबल बना लेते हैं यहां पे अच्छा देखिए डी अ डटा के नाम से हमने पहले से ही वेरिएबल बना रखा है तो एक काम करेंगे इसको र d व कर देते हैं अब मैं क्या करूंगा यहां पे एक डिक्शनरी तैयार करूंगा इस डिक्शनरी के अंदर क्या करूंगा स्मॉल को दूंगा नंबर यहां पे जीरो अब यहां पे आप नंबर देने की पूरी फैसिलिटी होती है कि आप इसे कुछ भी नंबर दे सकते हैं जरूरी नहीं है आप 0 1 2 3 से स्टार्ट करें आप यहां पे चाहे तो 5 6 से से से स्टार्ट कर सकते हैं चलिए मैं दोनों तरीके से करके आपको दिखाने वाला हूं तो फिलहाल मैं जीरो रखूंगा यहां पे s को फिर मैं रखूंगा मीडियम को मीडियम को कर देता हूं यहां पे वन फिर उसके बाद में मुझे क्या करना है यहां पे मुझे लार्ज चाहिए लार्ज को कर देता हूं मैं टू टू के बाद में मुझे चाहिए एक्स्ट्रा लार्ज और एक्स्ट्रा लार्ज को कर देता हूं थ्री तो ये मैंने ओ आरडी डाटा डिसाइड कर दिया है अब मुझे क्या करना है जिसकी इनकोडिंग करनी है उस डटा को लेके आना है तो मैंने डीएफ लिया डीएफ के बाद में मैंने कहा मुझे साइज की इनकोडिंग करनी है साइज के बाद में मुझे क्या करना है यहां पे सिंपल सा मैप फंक्शन को कॉल करना है मैप फंक्शन के अंदर ये जो ओ आरडी डाटा है इसको मुझे सिंपल सा पास करवा देना है तो रडी वन को जैसे ही मैं पास कराऊंगा इसने मुझे वो इनकोडिंग करके परफॉर्म करके दे दी है अब बस मुझे क्या करना है इसे सेव कर लेना है कहीं पे भी जैसे कि मैं इसी शीट के अंदर सेव करने वाला हूं तो मैंने लिखा यहां पे साइज en-a स्टोर हो चुका है चलिए एक बार चेक कर लेते हैं कि क्या हमारा डाटा यहां पे सही तरीके से आया या नहीं आया रन करते हैं तो देखिए वही तरीके से आया है जो आपने पहले किया था तो आप चाहें तो ऑर्डिनल एन कोडिंग को इस तरह से भी परफॉर्म कर सकते हैं अब जैसा कि मैंने आप लोगों को बोला था कि ये जो नंबर्स आपने दिए हैं ये नंबर को आप अपने अकॉर्डिंग चेंज कर सकते हैं आप चाहे तो फव से 78 भी दे सकते हैं आप चाहे तो कुछ भी रैंडम नंबर परफॉर्म कर सकते हैं तो वो मैं परफॉर्म करके आपको दिखाने वाला हूं चलिए तो मैं क्या करूंगा यहां पे इस नंबर को थोड़ा सा चेंज करूंगा मैं नंबर को चेंज करके क्या करने वाला हूं गाइ यहां पे जस्ट लाइक दे दूंगा फाइव देन अगले वाले को मैं दे दूंगा यहां पे सिक्स उसके अगले वाले को दे दूंगा मैं सेवन और उसके अगले वाले को दे दूंगा मैं एट अब जरूरी नहीं है कि मैंने 5 6 78 दिया है मैं यहां पे 7 5 कुछ भी रैंडम नंबर असाइन कर सकता था तो मैप के थ्रू जब भी आप इनकोडिंग करने जा रहे हैं वहां पे आप अपने अकॉर्डिंग डिसाइड कर सकते हैं कि किसको क्या क्या नंबर्स देना है चलिए अब इसे रन करते हैं और इसे भी रन करते हैं फिर इसे रन करके फिर इसे रन करते हैं तो अब देखिए आपके अकॉर्डिंग नंबर यहां पे डिसाइड हो चुके हैं एम को मिल चुका है फाइव नंबर एम को मिल चुका है सिक्स नंबर एल को मिल चुका है सेवन नंबर और एक्सेल को मिल चुका है एट नंबर तो इस तरह से आप अपने हिसाब से नंबर को डिसाइड कर सकते हैं तो क्या इसमें इनकोडिंग के अंदर कुछ चेंजेज हुई नहीं बेसिकली मैप फंक्शन एक ऐसी फंक्शनैलिटी प्रोवाइड करा रहा है जहां पे आप किसी को भी कोई नंबर असाइन कर सकते हैं और ये बेनिफिशियल है आपके लिए क्योंकि जब भी आप मशीन लर्निंग एल्गोरिथम बनाते जाएं तो वहां पे कभी भी किसी का आउटपुट थोड़ा सा भी चेंज स आई आपको आउटपुट के अंदर इंप्रूव करने की जरूरत पड़े तो वहां पे आप इस नंबर को चेंजेज करके अपने मॉडल को थोड़ा सा इंप्रूव कर सकते हैं चलिए अब थोड़ा सा आगे बढ़ते हैं यहां पे और मुझे यहां पे क्या करना है एक बड़े डाटा के साथ इनकोडिंग करनी है तो मैं कैसे करूंगा तो एक चलते हैं हमारे उसी डेटा सेट के ऊ परस जिसके ऊपर हम पहले से बहुत टाइम से काम कर रहे हैं यहां पे और वो है हमारा लोन . सीएवी जैसा कि आप सबको पता है राइट तो मैं आ चुका हूं लोन . सीएवी के अंदर जहां पे मुझे इसकी अनकोडिफाइड अनकोडिफाइड है इसमें ही सेमी अर्बन भी है अब बेसिकली बात करें तो रूलर होता है आपके ग्रामीण इलाकों को फिर आता है सेमी अर्बन जो कि बड़े इलाके होते हैं ग्रामीण से थोड़े बड़े इलाके होते हैं यहां पे और फिर आता है अर्बन अर्बन का मतलब होता है शहरी मतलब जो आपका सिटी जिसे बोलते हैं यहां पे उनको अर्बन स्टेट बोलते हैं तो गाइ इस तरह से हम क्या कर सकते हैं इनके बीच में एक ऑर्डर रिलेशनशिप देख सकते हैं तो हम इनके अंदर ऑर्डिनल इनकोडिंग को परफॉर्म कर सकते हैं तो चलिए इनके अंदर ऑर्डिन इनकोडिंग को परफॉर्म करके देखते हैं तो मैं चलता हूं वापस जुपिटर नोटबुक के अंदर और मैं इसको परफॉर्म करने जा रहा हूं सबसे पहले मैं क्या करूंगा अपने डेटा सेट को गेट करूंगा डेटा सेट को गेट करने के लिए मैं डटा सेट के नाम से एक वेरिएबल बना देता हूं पीडी डॉट यहां पर मैं क्या करने वाला हूं ड सीएसवी को कॉल करने वाला हूं उसके बाद में मैं लोन ड सीएवी को कॉल करूंगा अब देखिए नड सए को कॉल करने के बाद में मैं अपने डेटा सेट को लूंगा यहां पे और डॉट हैड लगाते हुए तीन डाटा यहां पे देखूंगा मुझे मेरा सारा डाटा मिल चुका है अब इस डाटा में से मुझे क्या चाहिए मुझे इसमें से प्रॉपर्टी एरिया का डाटा चाहिए लेकिन अब प्रॉपर्टी एरिया में मुझे नाम याद नहीं है कि क्या-क्या नाम होने वाले हैं तो मैं एक काम करता हूं अपनी खुद की एक नई लिस्ट बनाऊगा उस लिस्ट के लिए मुझे नाम की जरूरत पड़ेगी तो नाम बहुत आसानी से आप निकाल सकते हैं कैसे आप अपने डेटा सेट के पास जाएंगे देन स्क्वायर ब्रैकेट और आप जाएंगे किसके ऊपर प्रॉपर्टी एरिया के ऊपर यस आप कहां जाएंगे प्रॉपर्टी एरिया में प्रॉपर्टी एरिया में आपको बस क्या लगाना है यूनिक लगाना है यूनिक लगाने से आपके पास क्या आएगा आपके जितने भी नाम है वो मिल जाएंगे अब देखिए अर्बन आ चुका है रूलर आ चुका है सेमी अर्बन आ चुका है नन आ चुका है अब इस नन को हमें हटाना पड़ेगा क्योंकि नन को हम नंबर नहीं दे सकते तो मुझे क्या करना पड़ेगा पहले नन वैल्यू को फिल करना पड़ेगा नन वैल्यू को फिल कर लेते हैं चलिए फटाफट यहां पे तो मैं डेटा सेट लूंगा यहां पे देन स्क्वायर ब्रैकेट उसके बाद मुझे क्या चाहिए प्रॉपर्टी एरिया चाहिए जहां पे मैं अपनी नल वैल्यू को फिल करूंगा उसके लिए मैं करूंगा यहां पे फिल एने का इस्तेमाल यस चलिए मैं फिल एने लगा देता हूं यहां पे फिल एने के अंदर मैं इसके अंदर क्या करूंगा कैटेगरी कल डाटा है तो मॉड फीलिंग करनी पड़ेगी मुझे यहां पे तो मैं मॉड फीलिंग यहां पे परफॉर्म करता हूं तो चलिए डेटा सेट को इस्तेमाल करते हैं फिर से उसके बाद में मैं चलता हूं यहां पे प्रॉपर्टी एरिया के पास में देन मैं यहां पे क्या निकालू मोड निकालूं और मोड के अंदर स्क्वायर ब्रैकेट ऑफ 0 से इसे फिल कर दूंगा उसके बाद में क्या करना है गाइज यहां पे मुझे इन प्लेस देना है यहां पे और इन पलेस को मैं कर देता हूं ट्रू अब फिल वैल्यू कैसे करते हैं हमने इसको बहुत अच्छी तरीके से समझ चुके हैं यहां पे तो मैं फिलहाल अभी यहां पे नहीं समझाने वाला हूं यदि इसको समझना है तो आप हमारे प्रीवियस वीडियो को जरूर जाके देखें चलिए मैं इसे फिल कर देता हूं फिल हो चुका है और उसके बाद मैं फिर से इसे फिल कर देता हूं तो मेरे पास डटा आ चुका है अब अर्बन रूलर सेमी अर्बन ये आपके पास डटा आ चुका है अब यहां पे इसे सेट करना चाहे तो आप सेट कर सकते हैं तो चलिए मैं यहां पे क्या करता हूं न अंड डटा अंड ओडी ऑर्डर मैंने न अंड डटा ऑर्डर दे दिया है यहां पे अब ये ऑर्डर मुझे कैसे देना है तो सबसे पहले मेरे पास क्या आएगा रूलर आएगा तो मैंने यहां पे सबसे पहले डाल दिया है रूलर रूलर के बाद में मेरे पास क्या आएगा गाइज यहां पे तो रूलर के बाद में मेरे पास आएगा सैमी अर्बन तो मैंने सैमी अर्बन दे दिया है सेमी अर्बन के बाद में मेरे पास क्या आएगा तो वो आने वाला है अर्बन तो मैंने यहां पे भी डाल दिया है अर्बन तो इस तरह से न ऑर्डर मेरे पास आ चुका है अब जब न ऑर्डर आ चुका है तो इसके अंदर इनकोडिंग कर लेते हैं तो देखिए हमने पहले ही ऊपर लेवल एंड कोडिंग को इंपोर्ट कर चुके हैं तो फिलहाल यहां नहीं करेंगे लेकिन मैं आपको एक बार के लिए फिर से दिखा देता हूं कैसे करना है यहां पे तो आप चलिए सेकंड लन के अंदर देन डॉट फिर उसके बाद किस पे जाएंगे आप यहां पे आपको जाना है यहां पे प्री प्रोसेसिंग के अंदर प्री प्रोसेसिंग के अंदर आप इंपोर्ट करेंगे और किसे करेंगे यहां पे ऑर्डिनल एन कोडिंग को तो मैं ऑर्डिनल इनकोडर को कॉल कर रहा हूं उसके बाद में यहां पे क्या करेंगे ओइ के नाम से एक वेरिएबल बना लेता हूं और उसके बाद मैं अपनी ऑर्डिन इनकोडेड को कॉल कर देता हूं यहां पे आपको मिलेगी कैटेगरी कैटेगरी में आपको क्या देना है _ ऑर्डर डाटा आपको देना है बस इतना सा काम करना है ई लीजिए डॉट यहां पे फिट ट्रांसफॉर्म का इस्तेमाल कर लीजिए क्योंकि हम डायरेक्टली डेटा के ऊपर काम करने वाले हैं तो इसके लिए मैं करूंगा डेटा सेट के पास जाऊंगा एंड देन स्क्वायर बैकेट डबल डॉट के साथ में मुझे यहां पे देना पड़ेगा हमारा प्रॉपर्टी एरिया बस तो प्रॉपर्टी एरिया मुझे यहां पे देना है और रन करना है तो इसने मुझे इनकोडिंग बना के दे दी है अब बस मुझे क्या करना है हमारे ओरिजिनल डटा से इसे रिप्लेस कर देना है तो कर देते हैं इसे यहां पे तो चलते हैं डटा सेट के अंदर देन स्क्वायर ब्रैकेट और डाल देते हैं इसे प्रॉपर्टी एरिया के अंदर तो अब हम क्या करते हैं इसे प्रॉपर्टी एरिया के अंदर स्टोर कर चुके हैं तो चलिए लास्ट वाले हम यहां पे एक काम करते हैं प्रॉपर्टी एरिया में जाके चेक कर लेते हैं कि क्या हमारा जो इनकोडिंग वाला डाटा है वो आ चुका है या नहीं तो चलते हैं डाटा सेट के पास यहां पे तो डाटा सेट के पास आ चुके हैं और हेड लगाते हुए टॉप 10 जो हमारा डाटा है उसे हम यहां पर देख लेते हैं तो चलिए टॉप 10 डाटा हम आ चुके हैं और उसके बाद हमने किसको किया था हमने प्रॉपर्टी एरिया को किया था तो देखिए प्रॉपर्टी एरिया के अंदर हमारी जो इनकोडिंग है वो यहां पर लग चुकी है और आज के इस वीडियो के जरिए हम समझने वाले हैं आउटलायर के बारे में और डाटा साइंस के अंदर आउटलायर एक बहुत ही बड़ी प्रॉब्लम रहती है तो इसको हमें हटाना बहुत ज्यादा जरूरी होता है और बेसिकली पहले तो हम ये देखेंगे कि आउटलायर दिखते कैसे हैं मतलब डिटेक्ट कैसे करते हैं और फिर उसे रिमूव करने की टेक्निक को भी हम समझने वाले हैं तो सबसे पहले बात करते हैं आउटलायर होते क्या है देखिए आपके पास जो भी आपका डाटा होता है वो एक गिवन रेंज के अंदर आपको देखने को मिलता है और यदि आपका डाटा उस रेंज से बाहर चला जाए तो हम उसे बेसिकली क्या बोलते हैं आउटलायर बोलते हैं और जनरली आउटलायर उसे बोला जाता है कि जब आपका डाटा एक नॉर्मल डिस्ट्रीब्यूशन के पैटर्न को फॉलो करता है और उसके अंदर जो जो टेल है उसकी वो टेल बहुत ही ज्यादा लंबी चली जाती है तो बेसिकली हम उसे आउटलायर बोलते हैं इसको थोड़ा ग्राफिकली फॉर्मेट में आपको दिखाऊं मैं यहां पे तो बेसिकली मेरे पास एक एग्जांपल है जिसके अंदर आप आउटलायर को बहुत अच्छे तरीके से पहचान सकते हैं तो इसको जरा ग्राफिकली जोड़ थोड़ा समझे यहां पे तो आप आउटलायर को समझा सकते हैं देखिए आपके पास जितना भी डाटा होता है वो आपके पास क्या होता है एक नॉर्मल डिस्ट्रीब्यूशन डटा होता है जैसा कि आप इस ग्राफ के थ्रू देख सकते हैं इस ग्राफ के अंदर जैसे ही आप यहां पे थर्ड स्टैंडर्ड डिवीजन से थोड़ा सा आप पहले से आगे चले जाते हैं तो ये सारे डाटा क्या कहलाते है आउटलायर कहलाते हैं अब इसको देखने का तरीका क्या होता है कि आप अपने बॉक्स प्लॉट के थ्रू देख सकते हैं इसके अंदर बॉक्स प्लॉट के अंदर आपके पास क्या होता है कि जो आपके विस्कर प्लॉट होते हैं और विस्कर प्लॉट की जो कैप्स होती है उस क्रैप के बाहर का जितना भी आपके पास डाटा होता है वो सारा का सारा क्या कहलाता है आउ आउटलायर कहलाता है ये आउटलायर आपके पास जितने भी मैथमेटिकल ऑपरेशंस होते हैं उनमें बहुत ज्यादा मिस्टेक करते हैं जैसे कि आप किसी भी डाटा का एवरेज निकालने जा रहे हैं स्टैंडर्ड डिवीजन निकालने जा रहे हैं मीन निकालने जा रहे हैं कुछ भी निकालने जा रहे हैं उसके अंदर ये बहुत ज्यादा आपके पास नॉइस क्रिएट करते हैं यहां पे और आपके पास जो आउटकम आपको निकलना चाहिए उसके अंदर भी डिस्टॉर्शन लाते हैं तो बेसिकली आउटलायर होते क्या है कि आपके पास कोई डटा आपके पास गिवन रेंज से बाहर चला जाता है तो हम उसे आउटल कहते हैं जैसे एग्जांपल के तौर पे बात करूं कि मेरे पास जो मेरा डाटा है है वो कुछ इस तरह से है कि 546 की रेंज के अंदर है या फिर 547 की रेंज के अंदर है लेकिन अचानक से उसके अंदर 13 एंटर कर जाए तो वो बेसिकली क्या कहलाएगा आउटलायर कहलाएगा उस पर्टिकुलर डाटा के लिए अब बेसिकली आउटलायर को हटाना क्यों ज्यादा जरूरी हो जाता है यहां पे क्योंकि हमारे पास मशीन लर्निंग के अंदर काफी ऐसी एल्गोरिथम्स होती है जो आउटलायर के आने से आपके पास रॉन्ग प्रिडिक्शंस देना स्टार्ट कर देती है मतलब वो आउटलायर की तरफ आपके पास यहां पे ट्रेंड हो जाती है और जिसकी वजह से हमारे डिजायर आउटपुट होते हैं वो हमें नहीं मिल पाते हैं और बेसिकली हमें रॉन्ग आंसर्स देखने को मिल सकते हैं जस्ट एग्जांपल के तौर पे बात करें यहां पे तो मान लीजिए मेरा डाटा कुछ इस तरह से है 5 6 7 फिर मैंने ले लिया 5.5 फिर ले लिया मैंने 6.5 फिर मैंने ले लिया 7.5 एंड उसके बाद मैंने ले लिया 99.5 एंड अचानक से मैंने ले लिया यहां पे 100 तो ये 100 मेरे लिए इस सिनेरियो के अंदर क्या बन जाएगा एक आउटलायर बन जाएगा अब हम यहां पे ये समझेंगे कि हमारे पास कोई डेटा सेट हो तो उस डेटा सेट के अंदर हम आउटलायर कैसे डिटेक्ट कर सकते हैं फिर उसके बाद हम आउटलायर को रिमूव करने की टेक्निक को भी समझने वाले हैं तो इसको देखने के लिए मेरे पास एक डाटा सेट पड़ा है यहां पे जैसा कि आप सबको पता है लोन . सीएवी के ऊपर हम काफी दिनों से काम कर रहे हैं यहां पे इसके अंदर जो एप्लीकेशन एंड को एप्लीकेशन वाला जो दो पार्ट है हमारे पास यहां पे इसके अंदर हमारे पास आउटलायर होने के चांसेस हो सकते हैं तो पहले मैं आपको ये बताऊंगा कि आउटलायर कैसे डिटेक्ट किया जा सकता है इन दोनों डाटा के अंदर तो इसके लिए चलते हैं जुपिटर नोटबुक के ऊपर जहां पे हम ये सारा कुछ काम करेंगे हम सबसे पहले इंपोर्ट करेंगे पांडा को क्योंकि हमारा जो जो डेटा सेट है उसे हम लोड कराना चाहते हैं तो पांडा एलियाज ऑफ पीडी मैं यहां पे लूंगा और उसके बाद में मुझे ग्राफ भी बनाना है तो उसके लिए मैं इंपोर्ट करूंगा किसे सी बन को इंपोर्ट करने वाला हूं सी बन एस ऑफ एनएस और मैट प्लक के बिना तो ग्राफ बनने वाला है नहीं तो उसके लिए हम यहां पे इंपोर्ट करेंगे किसे मैट पल लिप को फिलहाल मैट पलर लिप के बिना भी ग्राफ बन सकता है लेकिन मैट पलर लिप के अंदर सो फंक्शन के थ्रू हम हमारे ग्राफ को देख सकते हैं और इवन दैट यदि हमें उसे जूम करना है तब भी हम यहां पे आराम से कर सकते हैं तो मैटल लिप के अंदर चलेंगे और पीवा प्लॉट को हम कॉल करने वाले हैं एलियाज ऑफ पीएटी का इस्तेमाल करेंगे तो यह हमारी रिक्वायर्ड जो लाइब्रेरी है वो सारी आ चुकी है और उसके बाद में हम क्या करते हैं हमारे डाटा सेट को लेते हैं उसके बाद पीडी डॉट यहां पर _ सीएवी के थ्रू हमारी जो फाइल है उसे लोड करते हैं और फाइल का नाम है यहां पे लोन . सीएवी अब उसके बाद में हम हमारे डटा सेट को देखें और डटा सेट को देखने के बाद टा सेटड हैड लगा के तीन डाटा हम यहां पर देखना चाहेंगे तो ताकि हम हमारे डटा को ऑब्जर्व कर सके कौन-कौन सा डाटा है और किसके अंदर हमें आउटलायर फाइंड करने की जरूरत है इसके अंदर हमें यहां पे दो न्यूमेरिकल डाटा देखने को मिला है जिसके अर हमारे पास क्या है एक एप्लीकेशन इनकम है और दूसरा को एप्लीकेशन इनकम है तो फिलहाल हम चाहें तो इन दोनों के अंदर जो नल वैल्यू प्रेजेंट है उनको भी फिल कर सकते हैं अब ये नल वैल्यू आप कैसे पता करेंगे तो इसके बारे में हमने एक डेडिकेटेड वीडियो बनाया है जहां से आप नल वैल्यू को आप देख सकते हैं कि वो कैसे ऑब्जर्व किया जा सकता है फिलहाल मैं इसकी इंफॉर्मेशन निकालूं ताकि मुझे थोड़ा बहुत आईडिया लग सके कि इसके अंदर डेटा किस तरह से प्रेजेंट है नल वैल्यू प्रेजेंट है या नहीं है और इवन दैट हम यहां पे इसका डिस्क्राइब भी निकालेंगे ताकि हम इसकी मिनिमम और मैक्सिमम रेंज को पहचान सके ताकि हमें एक आईडिया लग सके कि क्या क्या इसके अंदर आउटलायर होने की पॉसिबिलिटीज है या नहीं है तो मैं डेटा सेट के अंदर चलूंगा और डॉट यहां पर इंफो निकालू और इंफो निकाल के रन करूंगा तो जैसे ही मैं रन करूंगा तो देखिए मेरे पास एप्लीकेशन और को एप्लीकेशन इनकम दो ऐसे डेटा सेट है जिनके अंदर आपके पास नल वैल्यू आपके पास प्रेजेंट है एप्लीकेशन इनकम के अंदर तो है और को एप्लीकेशन इनकम के अंदर फिलहाल नहीं है चलिए अब मैं थोड़ा इसका डिस्क्राइब निकालना चाहूंगा मैथमेटिकल कैलकुलेशन देखना चाहूंगा कि क्या इसके अंदर नल वैल्यू प्रेजेंट होने के चांसेस हैं तो वो हम देख सकते हैं कैसे डाटा सेट के अंदर चलेंगे डॉट यहां पर आप क्या निकालेंगे इसका डिस्क्राइब निकालेंगे जैसे ही आप डिस्क्राइब फंक्शन को कॉल करेंगे तो आपको एप्लीकेशन और को एप्लीकेशन इनकम के रिलेटेड सारी चीजें मिल जाएगी जैसे उसके अंदर टोटल नंबर ऑफ एलिमेंट्स कितने परजेंट है मतलब उसके अंदर डटा कितना प्रजेंट है मीन कितना है मतलब मिनिमम वैल्यू कितनी है यहां पे और मैक्सिमम वैल्यू कितनी है फिलहाल देखिए को एप्लीकेशन इनकम को यदि मैं गौर से देखूं तो इसके अंदर मिनिमम वैल्यू जीरो दिखा रही है यहां पे मैक्सिमम वैल्यू 41600 के आसपास यहां पे दिखाई जा रही है तो बेसिकली इसके अंदर आउटलाइन होने के चांसेस बहुत ही ज्यादा हो सकते हैं क्योंकि मिनिमम वैल्यू के करेस्पॉन्डिंग्ली इवन दैट आप इसके मीन को भी ऑब्जर्व करेंगे तो मीन जो है आपके पास यहां पे वो 1600 ही है यहां पे और उसके करेस्पॉन्डिंग्ली को देखूं तो वो बहुत ही ज्यादा हमारे पास यहां पर है तो बेसिकली को एप्लीकेशन इनकम के अंदर हमारे पास यहां पे आउटलायर होने की पॉसिबिलिटी सबसे ज्यादा है इवन दैट आप एप्लीकेशन इनकम को भी आप देखेंगे तो एप्लीकेशन इनकम के अंदर भी आप मिनिमम वैल्यू को देखेंगे तो 150 है और मैक्सिमम वैल्यू को देखेंगे तो 81000 है जो कि एक बहुत ही ज्यादा नंबर्स है यहां पे और इवन दैट आप यहां पे मीन को भी देखेंगे तो मीन आपके पास केवल और केवल 500 5000 के आसपास ही है यहां पे तो बेसिकली बात करें यहां पे तो एप्लीकेशन और को एप्लीकेशन इनकम ये दो ऐसी चीजें हैं जहां पे आपके पास आउटल होने की पॉसिबिलिटीज सबसे ज्यादा है तो चलिए अब इनके आउटलायर को हम फाइंड आउट करते हैं आउटलायर को यदि आपको देखना है तो उसके लिए आप बॉक्स प्लॉट का इस्तेमाल कर सकते हैं या फिर आप यहां पे डिस्ट्रीब्यूशन प्लॉट का भी इस्तेमाल कर सकते हैं लेकिन मेरी मानिए आप बॉक्स प्लॉट का इस्तेमाल कीजिए ताकि वहां पे आउटलायर को बहुत अच्छे तरीके से आप डिटेक्ट कर सके क्योंकि बॉक्स प्लॉट को जब आप यहां पर देखेंगे गौर से तो बॉक्स प्लॉट के अंदर एक चीज है यहां पे कि आपका जो बॉक्स प्लॉट होता है इसके अंदर जो बॉक्स होता है वो आपके पास यहां पे बीच वाला पार्ट होता है इसके अंदर जो बीच वाला पॉइंट होता है वो आपका मीडियन होता है इसके साथ-साथ यहां पे ये जो दो लाइन होती है इसके अंदर विस्कर प्लॉट मिल जाती है और विस्कर प्लॉट की कैप आपको मिल जाती है अब ये विस्कर प्लॉट की जो कैप होती है इसकी वैल्यू होती है यहां पे और इसकी वैल्यू होती है q3 + 1.5 * आ क और यहां पे इस स्क प्लॉट की कैप का रेंज होती है q1 - 1.5 * आ क और इसके आगे जितने भी डेटा पॉइंट्स हमारे पास प्रेजेंट होंगे ये सारे के सारे क्या कहलाते हैं हमारे आउटलाइंस यहां यहां पे लाते हैं तो बेसिकली गाइज बात करें तो हम आउटलायर को बहुत ही आराम से डिटेक्ट कर सकते हैं किसके थ्रू बॉक्स प्लॉट के थ्रू तो चलिए हम बॉक्स प्लॉट बनाते हैं और इसके थ्रू आउटलायर को डिटेक्ट करते हैं तो बॉक्स प्लॉट बनाने के लिए मैं c1 का इस्तेमाल करूंगा इसके लिए मैं sns2 प्लॉट का इस्तेमाल करने वाला हूं और फिलहाल मैं को एप्लीकेशन इनकम के बीच के लिए ही मैं यहां पे बॉक्स प्लॉट तैयार करूंगा एप्लीकेशन इनकम के लिए नहीं तैयार करूंगा क्योंकि इसके अंदर नल वैल्यू प्रेजेंट है तो पहले मैं इसके अंदर नल वैल्यू फिल कर लूंगा फिर उसके बाद बॉक्स प्लॉट बना लूंगा तो फिलहाल मैं अभी को एप्लीकेशन इनकम के ऊपर बॉक्स प्लॉट बनाने के लिए रेडी हूं यहां पे तो मैंने x इल टू मतलब x एक्सेस में मुझे बॉक्स प्लॉट बनाना है है और वो किसका बनाना है मुझे को एप्लीकेशन इनकम का बनाना है तो मैंने को एप्लीकेशन इनकम यहां पे डाल दिया उसके बाद मैंने यहां पे डाटा लिया है और डटा इक्वल्स टू मैंने क्या किया है यहां पे डेटा सेट को डाल दिया है उसके बाद इस ग्राफ को देखना है तो मैंने पीएटी डॉट यहां पर शो फंक्शन को अप्लाई कर दिया है देन जैसे ही रन करूंगा मेरा बॉक्स प्लॉट मेरे पास रेडी हो गया और जैसा कि आप इस बॉक्स प्लॉट में देख पा रहे हैं यहां पे कि जो आपका विस्कर लाइन है यहां पे मतलब विस्कर प्लॉट की जो कैप है आपके पास यहां पे उसके बाद में आपको बहुत सारे आउटलायर दिखाई दे रहे हैं यहां पे और जैसे कि हमने ऑब्जर्वेशन भी कर लिया था यहां पे कि आपकी मिनिमम वैल्यू जीरो है और मैक्सिमम वैल्यू जो आप देख पा रहे हैं यहां पे 41000 के आसपास दिखाई दे रही है और जो मीन है वो आपका 1600 ही है केवल यहां पे तो इसका मतलब डेफिनेटली आपके पास यहां पे क्या मिलेंगे आपको बहुत सारे आउट लायर्स देखने को मिलेंगे और जैसा कि आप यहां पे ग्राफ से भी देख पा रहे हैं कि इसके अंदर बहुत सारे आउट लायर्स प्रेजेंट है यहां पे ये जितने भी डॉट डॉट्स आपको दिखाई दे रहे हैं ब्लैक कलर के स्पॉट्स दिखाई दे रहे हैं ये सारे के सारे क्या कहलाते हैं आउटलाइंस कहलाते हैं अब एक काम करते हैं हम यहां पे एप्लीकेशन इनकम के अंदर भी देख लेते हैं कि एप्लीकेशन इनकम के अंदर भी आउटलायर है क्या या नहीं है तो मैंने जैसे ही एप्लीकेशन इनकम के अंदर डाला तो एप्लीकेशन इनकम के अंदर भी आप देख पाएंगे कि इसके अंदर भी बहुत सारे आउट लायर्स प्रेजेंट हैं यहां पे तो बेसिकली यदि आउटलायर आपको फाइंड आउट करना है तो आप बॉक्स प्लॉट के थ्रू आउटलायर फाइंड आउट कर सकते हैं इसके अलावा आप डिस्ट्रीब्यूशन प्लॉट के थ्रू भी आप आउटलायर फाइंड आउट कर सकते हैं डिस्ट्रीब्यूशन के अंदर आपको एगजैक्टली आउटलायर तो नहीं मिलेगा लेकिन आपको यदि नॉर्मल डिस्ट्रीब्यूशन कर्व की नॉलेज है तो वहां से आप उसकी टेल के थ्रू पहचान सकते हैं कि उसके अंदर आउटलायर है या नहीं है कैसे जरा इसको समझते हैं यहां पे तो जो डेटा सेट है इसके अंदर जो हमारी एप्लीकेशन इनकम है उसका डिस्ट्रीब्यूशन प्लॉट बनाने वाला हूं उसके बाद मैं पीएटी डॉट शो करके इस ग्राफ को देखूंगा यहां पे तो जैसे ही मैं इस ग्राफ को बनाऊंगा तो देखिए मेरे पास एक ग्राफ नजर आता है जो कि लुक लाइक अ नॉर्मल डिस्ट्रीब्यूशन दिखता है बट इसके अंदर जो इसकी टेल है वो टेल बहुत ही ज्यादा लंबी है अब ये टेल कैसे लंबी है जरा इसको देखें यहां पे तो ये जो आप टेल का ये वाला पार्ट देख रहे हैं ये वाला जो पार्ट देख रहे हैं जो कि आपका 20000 से आगे वाला है यहां पे ये टेल वाला जो पार्ट है वो काफी लंबा जा रहा है मतलब उसकी जो टेल है वो बहुत ही लॉन्ग स्ट्रेच हो रही है इसका मतलब क्या हो गया यहां पे आउटलायर प्रेजेंट है क्योंकि ये जो टेल है वो बहुत ज्यादा लंबी है यदि आपका जो कर्वेचर है यदि वो नॉर्मल डिस्ट्रीब्यूशन कर्व की तरफ होता तो वो केवल इतना ही कर्वेचर आता लेकिन आपके पास ये जो कर्वेचर है वो इस तरह से आगे जा रहा है इसका मतलब यहां तक का जो भी पार्ट है ये जितना भी पार्ट आप देख पा रहे हैं यहां पे ये सारे के सारे क्या है आपके आउट लायर्स हैं तो बेसिकली आउटलायर को डिटेक्ट करना है तो बॉक्स प्लॉट सबसे बेस्ट है बॉक्स प्लॉट के थ्रू आप आउटलायर को डिटेक्ट कर सकते हैं और नहीं तो आप यहां पे डिस्ट्रीब्यूशन प्लॉट्स भी बना के उसका आउटलायर डिटेक्ट कर स सते हैं अब बेसिकली बात करें आउटलायर तो हमने डिटेक्ट कर लिया है लेकिन आउटलायर से क्या-क्या प्रॉब्लम हो सकती है तो आउटलायर से जैसा कि मैंने आपको बताया था कि आपके जितने भी स्टैटिकल प्रॉब्लम्स होती है मतलब स्टैटिकल प्रॉब्लम का मतलब क्या है मीन मीडियन मोड जो भी आप निकालना चाहे यहां पे स्टैंडर्ड डेविएशन निकालना चाहे आगे चलते हुए मशीन लर्निंग एल्गोरिथम का भी आप इस्तेमाल करने वाले हैं तो इनके अंदर बहुत ज्यादा प्रॉब्लम्स क्रिएट हो जाती है ये आपके पास यहां पे रॉन्ग आउटपुट प्रिडिक्शन करना स्टार्ट कर देते हैं जैसे कि मैंने आपको स्टार्टिंग में भी एक एग्जांपल बताया था कि यदि आपके पास एक सैलरी रेंज पांच से सात के बीच में है तो एवरेज 6 लाख ही आता है लेकिन अचानक से उसके अंदर 12 लाख यदि मैं ऐड कर दूं तो वो एवरेज जो है वो आपका चेंज हो जाता है इसको जरा थोड़ा प्रैक्टिकल भी समझ लेते हैं ये कैसे होता है यहां पे जो कि मैंने बोला यहां पे कि आउटलायर का इफेक्ट आपको देखने को मिलता है जैसे मान लीजिए कि मेरे पास यहां पे कंपनी के कुछ एंप्लॉय है और उन कंपनी के एंप्लॉई का मैं क्या कर रहा हूं एवरेज निकालना चाह ताहा हूं यहां पे तो उनका कुछ डाटा यहां पर है 5 6 सा और उसके बाद मान लीजिए 5 4 6 सा और उसके बाद पांच ये कुछ आपका डाटा यहां पे प्रेजेंट है अब मुझे क्या करना है इसका मीन निकालना है तो मीन निकालना मतलब एवरेज निकालना यहां पे एवरेज निकालने के लिए मैं क्या करूंगा यहां पे मैं इसका इस्तेमाल करूंगा सम का सम ऑफ l लिखूंगा डिवाइड बाय यहां पे लेन ऑफ यहां पे l करने वाला हूं जैसे ही रन करूंगा इसका एवरेज आएगा 5.67 आने वाला है राइट ये हमारे पास इस तरह से आएगा लेकिन यदि मैंने यहां पे हमारा कुछ डाटा एक्स्ट्रा डाल दिया जैसे कि मैंने यहां पे डाल दिया एक 100 बीच में और फिर मैंने यहां पे रन किया तो देखो मेरा एवरेज जो है वो 16 पहुंच गया जो कि एक रॉन्ग आंसर है क्योंकि यदि मैं यहां पे 100 को देखूं तो 100 जो है वो मेरे डाटा के लिए एक आउटलायर है और वो मेरे जो प्रेडिक्शन आंसर्स हैं उनको यहां पे क्या कर रहा है थोड़ा सा मिस्टेक कर रहा है तो अब हमारा मेन टारगेट क्या होगा आउटलायर को रिमूव करने की जो टेक्निक है उसके अंदर जो सबसे फेमस टेक्निक है यहां पे वो है आई क्यूआर मेथड आपके पास है यहां पे इसके अलावा आपके पास यहां पे जड स्कोर मेथड भी है ये दो मेथड आपके पास है जो सबसे फेमस है और इनकी हेल्प से आप आउटलायर को बहुत ही आसानी से रिमूव भी कर सकते हैं तो आई थिंक आई होप सो समझ में आ चुका होगा कि आउटलायर क्या होते हैं और ये आपके पास किस तरह से इंपैक्ट कर सकते हैं आपके डाटा के अंदर आगे आने वाले वीडियो के अंदर हम आउटलायर को रिमूव करना सीखेंगे आईक मेथड के थ्रू भी और जड स्कोर के मेथड के थ्रू भी और आज के इस वीडियो के जरिए हम यह बात करने वाले हैं कि आई क्यूआर मेथड कैसे काम करता है आउटलायर को रिमूव करने के लिए आज की इस वीडियो के जरिए हम यहां पर देखने वाले हैं तो सबसे पहले बात करते हैं आउटलायर होते क्या हैं यहां पे तो यदि हमारे पास कोई एक डाटा गिवन रेंज के अंदर होता है और यदि हमारा कोई दूसरा जो डाटा है वो उस रेंज से बाहर चला जाता है यहां पे या फिर आप ऐसे मान लीजिए कि एक डाटा है जो एक रेंज के अंदर ही आपको देखने को मिलेगा और अचानक से उसके अंदर कोई ऐसे दो-तीन डेटा ऐसे आ गए या दो-तीन एलिमेंट ऐसे आ गए यहां पे जो उस रेंज से बहुत ही बियोंड चल रहे हैं बहुत ही बाहर चल रहे हैं यहां पे तो वो जो आपका डाटा होगा वो आपके लिए क्या होगा आउटलायर की तरह काम करने वाला है यहां पे अब ये आउटलायर कैसे डिटेक्ट करते हैं तो ये आउटलायर को डिटेक्ट करने के लिए हमने बॉक्स प्लॉट का इस्तेमाल किया था बॉक्स प्लॉट के थ्रू हम क्या करते हैं हमारे आउटलायर को डिटेक्ट करते हैं तो चलिए जरा इसको देखते हैं यहां पे आउटलाइन को डरेक्ट करते हैं और फिर से रिमूव करते हैं आई क्यूआर मेथड के थ्रू यदि आपको पाइथन मशीन लर्निंग डेटा साइंस एंड डेटा एनालिस फील में अपने आप को ग्रो करना है तो इसके लिए डब्ल्यू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपने स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो फिलहाल मैं अपने लैपटॉप में आ चुका हूं यहां पे और मैं अपना यहां पे जो रिक्वायर्ड जो लाइब्रेरीज है उनको इंपोर्ट कर चुका हूं और उसके बाद मैं अपना जो डेटा सेट है उसे भी लोड कर चुका हूं इस डेटा सेट के अंदर हमने देखा कि एप्लीकेशन इनकम और को एप्लीकेशन इनकम दो ऐसे हमारे पास डाटा है जिनके अंदर आउटलायर प्रेजेंट है और इनको ऑब्जर्व करने के लिए हमने क्या किया था डिस्क्राइब मेथड का इस्तेमाल भी किया था तो टा सेट डॉट यहां पर मैंने डिस्क्राइब को कॉल किया डिस्क्राइब के थ्रू हमें थोड़ा बहुत आईडिया लग जाता है कि इसके अंदर आउटलायर होने के चांसेस है या नहीं है और जो कि हमें यहां पे क्लियर बता रहा है कि यस इसके अंदर आउटलायर होने के चांसेस आपके पास है यहां पे अब बेसिकली हम इसे कैसे देख सकते हैं तो देखने के लिए मैं एए डॉट यहां पे बॉक्स प्लॉट का इस्तेमाल करूंगा और बॉक्स प्लॉट के थ्रू हम बहुत ही आराम से देख पाएंगे कि हमारे पासस आउटलायर है या नहीं है जैसे कि यदि मैं मुझे देखना है को एप्लीकेशन इनकम के अंदर आउटलायर यहां पे तो मैं को एप्लीकेशन इनकम दूंगा यहां पे और मैं डाटा इक्वल्स टू क्या दूंगा यहां पे गाइ यहां पे डेटा सेट देने वाला हूं इस ग्राफ को देखने के लिए मैं पीएटी डॉट यहां पर शो फंक्शन को कॉल करूंगा और रन करूंगा तो मुझे देखने को मिलेगा कि इसके अंदर बहुत सारे आउटलायर हमारे पास प्रेजेंट है यहां पे अब यहां पे मैं आईक्यू आर मेथड इस्तेमाल करूंगा इस आउटलायर को रिमूव करने के लिए तो फिलहाल ये आई क्यूआर मेथड होता क्या है पहले से समझते हैं यहां पे तो आई क्यूआर का पूरा नाम है इंटर क्वांटल रेंज यस इसका पूरा नाम क्या है यहां पे इंटर क्वांटल रेंज होती है यहां पे और ये इंटर क्वांटल रेंज जो होती है बेसिकली गाइज यहां पे ये आपके बॉक्स प्लॉट से ही आती है यहां पे जैसे कि आप इस डायग्राम के थ्रू समझ पा रहे होंगे अब ये जो आई क्यूआर है ये आई क्यूआर है क्या यहां पे बेसिकली तो ये एक रेंज है यहां पे और ये रेंज कौन सी है यहां पे आपके पास जो फर्स्ट कंटालू का डिफरेंस है अब ये क्वांटल क्या होता है तो ये एक मैथमेटिक्स का पार्ट है जिसके अंदर आप समझते हैं कि परसेंटेज और परसेंटाइल्स क्या होता है यहां पे उसी के अंदर आपका क्वानटाइल्स आता है इसको एक छोटे से समरी के तौर पे मैं आपको समझाऊं यहां पे कं टाइल के बारे में तो कुछ ऐसा है कि जैसे 100 लोग एक एग्जाम को दे रहे हैं और उस 100 लोग के एग्जाम के अंदर आपकी जो रैंक है वो फोर्थ आती है तो इसके अंदर जो आपका जो परसेंट टाइल्स होगा या फिर मैं बात करूं जो क्वांटा इल होगा यहां पे वो क्या होगा यहां पे 96 आपके पास क्या होने वाला है परसेंटाइल होने वाला है जो कि आपके पास क्या कर रहा है जो आपको डिफाइन कर रहा है कि उस एग्जाम के अंदर आपकी रैंकिंग क्या रही है यहां पे इसी तरह से आपके पास एक पूरा रेंज होता है उस रेंज को यदि हम छोटे-छोटे छोटे-छोटे पीसेज के अंदर तोड़ दें यहां पे तो वो हमारे पास क्या होता है कं टाइल होता है इसके अंदर जो फर्स्ट कं टाइल होता है मतलब फर्स्ट क्वांटल की बात करूं जो q1 होता है यहां पे वो आपके पास आपके डाटा का 25 परसेंटाइल्स होता है मतलब यदि आपके ओवरऑल आपका डाटा सेट लिया जाए यहां पे तो उसके अंदर जो 25 परसेंटाइल्स के ऊपर जो पर्सन बैठा होगा या जो डाटा होगा यहां पे वो आपका फर्स्ट क्वां टाइल होता है यहां पे और थर्ड क्वांटल के अंदर बात करें यहां पे बेसिकली बात करें तो वो होता है आपका 75 परसेंटाइल्स होता है यहां पे मतलब ओवरऑल डाटा के अंदर जो आपका 75 परसेंटाइल जो डेटा मैं अलग कर दूंगा यहां पे फिर जो पर्सन आपके सामने देखने को मिलेगा वो आपके पास क्या होगा आपका थर्ड कंटेल होगा अब यहां पे आपके पास क्या होता है आई क्यूआर आता है यहां पे आई क्यूआर क्या होता है इंटर कंटालू रेंज का मतलब क्या है दो क्वांटल के बीच की रेंज है यहां पे और ये कैसे निकाला जाता है ये निकाला जाता है q3 - q1 करने से मतलब थर्ड क्वांटल को फर्स्ट क्वांटल से यदि मैं सबट करूं तो मुझे आ क आ मिलेगा अब इसके अंदर देखिए जब भी आप बॉक्स प्लॉट बनाते हैं तो बॉक्स प्लॉट के अंदर आपने देखा होगा कि आपका जो बॉक्स प्लॉट होता है वो आपका यहां पे इस तरह से दिखाई देता है इसके अंदर ये जो दो लाइंस आपके पास देखने को मिलती है इनको हम विक्सर प्लॉट बोलते हैं और ये आपके पास एक विक्सर प्लॉट की कैप होती है ये विक्सर प्लॉट की कैप जो आपके पास होती है ये आपके मिनिमम डाटा को रिप्रेजेंट करती है और यहीं पे आपके पास ये मैक्सिमम डाटा को भी रिप्रेजेंट करती है मतलब इस रेंज के जो डाटा आगे आया यहां पे या इस रेंज से जो पीछे रेटा आपके पास आया यहां पे वो सारे के सारे आपके लिए क्या होंगे आपके आउटलायर के पार्ट होने वाले हैं अब ये जो आपके मिनिमम और मैक्सिमम रेंज है ये कैसे निकाली जाती है तो यदि आपको मिनिमम रेंज आपको निकालनी मतलब मिनिमम में कैप आपको निकालनी है तो ये कैसे निकलेगी कि जो आपका फर्स्ट क्वांटल है इसमें से आप सबस्टैक करेंगे किसे 1.5 * आ क्यूआर को मतलब आप आ क्यूआर से मल्टीप्लाई करेंगे 1.5 से और फिर उसके बाद उसको सबट कर देंगे q1 से मतलब फर्स्ट क्वांटल से सबस्टैक करेंगे तो आपको फर्स्ट मिनिमम रेंज देखने को मिलेगी और उससे नीचे का जितना भी डाटा होगा वो सारा आपके लिए क्या बनेगा एक आउटलायर की तरह काम करेगा क्या मिनिमम में भी आउटलायर हो सकते हैं बिल्कुल हां मिनिमम में भी आउटलायर प्रेजेंट हो सकते हैं आपके पास यहां पे ये डिपेंड करेगा आपके डटा सेट के ऊपर फिर उसी तरह से यदि आपके पास यदि मैं मैक्सिमम आउटलाइन निकालना चाहूं यहां पे मैं मैक्सिमम एक रेंज निकालना चाहूं यहां पे तो वो कैसे निकालूं तो ये आपका निकलेगा q3 प्स यहां पे आएगा 1.5 * आई क्यूआर से आपके पास यहां पे निकलने वाला है अब 1.5 आ क्यूआर को आप क्या करेंगे यहां पे q3 के साथ जैसे ही ऐड करेंगे आपको मैक्सिम रेंज मिल जाएगा और इसके बाहर का जितना भी आपका डाटा होगा वो सारा का सारा आपके लिए क्या करेगा आउटलायर की तरह काम करने वाला है तो इस तरह से आप अपने आउटलायर को यहां पे डिटेक्ट कर सकते हैं और उन्हें रिमूव भी कर सकते हैं चलिए जरा देखते हैं यहां पे कि ये किस तरह से डिटेक्ट होता है और किस तरह से रिमूव होता है तो इसके लिए मैं ले चलता हूं आपको जुपीटर नोटबुक पर जहां पेय सारा काम करने वाला हूं यहां पे अब सबसे पहले मैं क्या करूंगा हमारे डेटा सेट के पास जाऊंगा यहां पे और डॉट शेप लिखा निकालते हुए मैं क्या करूंगा यहां पे उसके रो एंड कॉलम को देखूंगा कितने रो एंड कितने कॉलम्स हमारे पास प्रेजेंट है तो 618 रोज है हमारे पास यहां पे 13 हमारे पास कॉलम है यहां पे अब बेसिकली जो हमारा को एप्लीकेशन इनकम है हमारा यहां पे इसके अंदर से आउटलायर मुझे रिमूव करना है यहां पे इसके अंदर मुझे आईक निकालने के लिए मुझे क्या चाहिए थर्ड क्वांटल एंड फर्स्ट क्वांटल चाहिए मुझे यहां पे तो मैं काम करता हूं यहां पे q1 के नाम से एक वेरिएबल बनाता हूं यहां पे और उसके बाद मैं अपने डेटा सेट के पास चलता हूं देन स्क्वायर ब्रैकेट और मुझे को एप्लीकेशन इनकम चाहिए तो मैं इसके अंदर क्या करूंगा यहां पे को एप्लीकेशन इनकम दे दूंगा यहां पे जैसे मुझे को एप्लीकेशन इनकम का डाटा मिल जाए उसके बाद हमारे पास क्या होता है कंटा इल नाम का एक फंक्शन होता है यहां पे मतलब आप यहां पे बोल सकते हैं मेथड होता है यहां पे जिसकी हेल्प से आप क्या कर सकते हैं आप यहां पे q1 को निकाल सकते हैं इसके अंदर यदि मैं 0.25 दूं तो ये मुझे क्या देगा 25 परज का जो डाटा है यहां पे वो मुझे दे देगा मतलब उस कंटल का डाटा मिलेगा और वो क्वांटल का डाटा हमें क्या मिला है यहां पे जीरो मिला है मतलब हमारा जो स्टार्टिंग एंगल है यहां पे वो जीरो से स्टार्ट है और ये बिल्कुल सही भी बोल रहा है यहां पे और मुझे अब क्या निकालना है थर्ड क्वांटल निकालना है तो थर्ड क्वांटल के लिए मैं क्या करूंगा यहां पे गाइस इसी को जस्ट कॉपी करूंगा और टेक्स्ट में यहां पे पेस्ट कर दूंगा अब इसके अंदर मुझे क्या करना है 25 को 75 में कन्वर्ट करना है तो इससे मुझे क्या मिलेगा थर्ड क्वांटल का डाटा मिल जाएगा थर्ड क्वांटल का जो डाटा मिला है मुझे यहां पे वो 2281 यहां पे मिला है और ये जो दो चीजें है ना ये चीजें आप ऑब्जर्व भी कर सकते हैं किसके थ्रू आप डिस्क्राइब फंक्शन के थ्रू भी कर सकते हैं देखिए डिस्क्राइब फंक्शन के अंदर जैसे ही आप यहां पे ओपन करेंगे इसे तो आपको यहां पे 25 परइ का जो डाटा है वो आपको यहां पे 0 पर मिलेगा और 75 परज को डाटा है जो आपके पास यहां पे 2281 आपको मिल जाएगा यहां पे बेसिकली तो आप यहां पे डायरेक्टली भी इसका आंसर यहां से निकाल सकते हैं लेकिन हमें यहां पे आ क निकालना था तो इसलिए मैंने q1 और q2 निकालना आपको यहां पे सिखाया है अब q1 एंड q3 तो हमारे पास आ गया लेकिन इससे हमें आ क निकालना है तो मैं एक काम करूंगा आई क्यूआर के नाम से एक वेरिएबल बनाऊंगा और उसके अंदर क्या करूंगा हमारे पास यहां पे जो q3 है उसमें से सबस्टैक कर दूंगा किसे q1 को तो यहां से मुझे मेरा क्या मिल जाएगा आ क मिल जाएगा अब मुझे क्या निकालनी है हमारे डाटा की एक मिनिमम रेंज निकालनी है और हमारे डाटा की मैक्सिमम रेंज में निकालनी है यदि मैं बात करूं मिन अंड रेंज की क्योंकि मुझे मिनिमम रेंज निकालनी है यहां पे तो मैं मिन रेंज निकालूं मिन रेंज निकालने के लिए मुझे क्या करना पड़ेगा मुझे मेरे q1 को लेना है यहां पे उसमें से सबै करना है और क्या सबस्टैक करना है 1.5 * i क आ को सबट करना है तो मैं यहां पे आ क आ दे देता हूं राइट और जैसे मैं आ क आ देखूंगा तो मुझे मेरी मिनिमम रेंज मिल जाएगी इसी तरह से मुझे मेरी मैक्सिमम रेंज भी निकालनी है तो मैक्स अंड रेंज के नाम से एक वेरिएबल बना लेता हूं यहां पे मै अ रेंज के नाम से एक वेरिएबल बना लेता हूं यहां पे ये क्या करेगा यहां पे q3 आपके पास यहां पे प्लस करेगा और किसे प्लस करना है यहां पे गाइ मुझे तो मुझे 1.5 * आ कू आ से मल्टीप्लाई करना है तो मैं 1.5 * एकवा कर दूंगा तो यहां से मुझे मेरी मिनिमम और मैक्सिमम रेंज भी मुझे मिल जाएगी अब मुझे यहां पे से देखना है तो मैं एक काम करूंगा मिन रेंज को कॉल करूंगा और इसी के साथ-साथ मैं अपनी मैक्स रेंज को भी कॉल करने वाला हूं जैसे रन करूंगा तो मुझे मेरी मिनिमम और मैक्सिमम रेंज मिल जाएगी अब देखिए मिनिमम रेंज जो मिली है वो मुझे नेगेटिव मिली है और वैसे कि मेरे पास डेटा नेगेटिव में है नहीं ऑलरेडी तो मैं अपनी मिनिमम रेंज को तो एज अ डिस्कार्ड कर दूंगा मतलब मुझे इसकी जरूरत नहीं पड़ेगी लेकिन मुझे मेरी मैक्सिमम रेंज की जरूरत पड़ेगी जो यहां पे मुझे रेंज मिली है वो 5000 के अराउंड यहां पे मुझे मिली है तो बेसिकली आप देख भी पा रहे हैं इस डायग्राम के अकॉर्डिंग कि 5000 के अराउंड आपके पास क्या है आपके आउटलायर प्रेजेंट है यदि आपको इसको और ज्यादा थोड़ा ज़ूम करेंगे तो आपको आउटलायर के अंदर और भी अच्छे से क्लेरिफाई हो जाएगा कि क्या नंबर है यहां पे उसका तो मैं एक काम करता हूं उसके लिए मैं पीएटी डॉट यहां पर फिगर का इस्तेमाल करूंगा जिसके थ्रू मैं करूंगा हमारे पास इस ग्राफ को थोड़ा और स्ट्रेच करूंगा और और अच्छे से देखूंगा कि आउटलायर की एक्चुअल में रेंज क्या है यहां पे तो मैं फिगर लूंगा और फिगर के अंदर मैं जाऊंगा यहां पे और फिक्स साइज का इस्तेमाल करने डाला हूं इसको मैं कर देता हूं 105 के अराउंड ताकि ये लंबा थोड़ा ग्राफ बन जाए और मुझे आराम से कुछ डाटा देखने को मिले तो आराम से देखिए यहां पे ये जीरो है और ये 10000 है तो इसके अराउंड मुझे 5000 तो मिलेगा ही मिलेगा एप्रोक्सीमेट यहां पे मैं इसको और थोड़ा स्ट्रेच करता हूं यहां पे 15 करता हूं ताकि मुझे और डटा देखने को मिले या तो अब आप देख पा रहे हैं यहां पे कि ये जो रेंज है इस रेंज के बाहर का बहुत सारा डाटा है और ये अराउंड 5000 के आसपास का तो डाटा एप्रोक्सीमेट होगा ही होगा यहां पे आप चाहे तो इसके जो एक्स ट्रिक है उसे चेंज कर सकते हैं औरस चेंज करके यहां पे 5000 के अराउंड इसे लेके आ सकते हैं लेकिन मैं ऐसा कुछ करूंगा नहीं यहां पे क्योंकि मेरा जो यहां पे मैक्सिमम रेंज है वो मुझे मिल चुकी है वो 57 100 के आसपास यहां पे मिली है और वो मुझे डाटा मिल चुका है अब मुझे क्या करना है मुझे मेरे ओरिजिनल डाटा से मुझे ये जो आउट लायर्स है उन्हें रिमूव करने है अब ये ओरिजिनल टा से आउटलायर कैसे रिमूव होंगे तो उसको जरा देखते हैं यहां पे तो उसके लिए सबसे पहले क्या करूंगा मैं अपना डेटा सेट को कॉल करूंगा डेटा सेट को कॉल करूंगा तो मुझे मेरे सारे डेटा यहां पे मिल जाएंगे इसके अंदर जाऊंगा मैं यहां पे और हमारा जो डेटा सेट है उसके अंदर जो हमारे पास यहां पे को एप्लीकेशन इनकम है उसमें से जो मैक्सिमम रेंज है उससे नीचे का जो डाटा है वो मैं एक्सेप्ट करूंगा अब उसको कैसे एक्सेप्ट करेंगे यहां पे तो आप अपने डेटा सेट के पास जाएंगे और मैं यहां पे थोड़ा फिल्टर लगाऊंगा यहां पे और फिल्टर के अंदर क्या करूंगा मैं अपनी जो को एप्लीकेशन इनकम है उसको मैं डालूंगा और को एप्लीकेशन इनकम के अंदर जो आपकी जो रेंज है उसको मिनिमाइज कर दूंगा मतलब यहां पे लेस दन लूंगा और लेस दैन किससे लेनी है यहां पे गाइ मुझे तो मुझे मेरी मैक्सिमम रेंज से लेनी है और जैसे ही मैं क्लिक करूंगा तो मुझे मेरा वो डाटा मिल जाएगा जिसके अंदर जो हमारी जो मैक्सिमम रेंज है उससे कम का डाटा हमारे पास को एप्लीकेशन इनकम के अंदर मिल चुका है अब इसको हम क्या करते हैं किसी और वेरिएबल के अंदर सेव कर लेते हैं इसको मैं डाल देता हूं न्यू अंड आपके पास डटा सेट के अंदर इसे सेव कर लेता हूं राइट अब ये न्यू अर डटा सेट के अंदर हमारा डटा जो है वो सेव हो चुका है अब देखिए मेरा जो पुराना डाटा है उसके अंदर क्या है 618 रोज है यहां पे अब मैं देखता हूं मेरे न्यू डेटा सेट के अंदर कितने रोज है यहां पे तो न्यू डाटा सेट के अंदर चलूंगा यहां पे और डॉट यहां पर शेप को कॉल करूं और रन करता हूं तो इसके अंदर देखिए मेरे पास 600 रो है इसका मतलब मेरे पास जो 18 रोज है वो यहां से हट चुकी है जिसके अंदर आउटलायर थे अब इसको देखने के लिए मैं करूंगा यहां पे वापस से बॉक्स प्लॉट बनाऊंगा और बॉक्स प्लॉट बनाने के लिए मैं यहां पे वापस बॉक्स प्लॉट का जो कोड है उसे लेके आऊंगा यहां पे ये जो मेरा ग्राफ बनेगा यहां पे वो मेरे पास न्यू अंडरस्कोर डाटा सेट के ऊपर बनने वाला है और फिलहाल इसे रन करते हैं तो देखिए इसके अंदर मेरे पास कोई भी आउटलायर प्रेसर नहीं है फिलहाल आप देख पा रहे हैं एक दो आउट लायर्स आपको दिख रहे हैं यहां पे जो कि डॉट्स के थ्रू दिख रहे हैं पे इतने मिनिमम आउटलायर आपके पास यहां पे रह सकते हैं यहां पे काफी बार रह भी सकते हैं और काफी बार प्रॉपर्ली आउटलायर हट भी सकता है तो देखिए जब आपके पास मिनिमम आउटलायर दो चार रह भी जाए यहां पे तो आप उसे इग्नोर कीजिए क्योंकि आपके पास क्या होता है कि जब आप आउटलायर को हटाते हैं तो उससे आपका डाटा का लॉसेस होता है यहां पे मतलब आपका जो इंपॉर्टेंट फीचर है क्या पता वो भी चले जा सकते हैं तो इसलिए आउटलायर को हम जितना कम हो सके उतना कम ही हटाने की कोशिश करें ये डिपेंड करेगा आपके पास यहां पे कि आप कौन सी एल्गोरिथम का इस्तेमाल कर रहे हैं यदि आपकी एल्गोरिथम आउटलायर के ऊपर डिपेंड नहीं करती है जैसे कि मैं बात करूं डिसीजन ट्री जो एल्गोरिथम्स है वो आउटलायर के ऊपर नहीं इफेक्ट करती है यहां पे तो आप उसके अंदर आउटलायर ना हटाएं यहां पे और जब आप लीनियर रिग्रेशन का इस्तेमाल कर रहे हैं वहां पे आउटलायर का बहुत ज्यादा इंपैक्ट पड़ता है तो बेसिकली उस वाले केसेस के अंदर आप आउटलायर रए लेकिन वहां पे भी थोड़ा ध्यान रखें कि आपका डाटा का लॉस ज्यादा नहीं होना चाहिए अब यहां पे कुछ एक आउटलायर हमारे पास बच चुके हैं अकॉर्डिंग टू 1.5 आईटीआर के होते हुए भी लेकिन उसके बावजूद भी हम इन आउटलायर को नहीं हटाएंगे और ये आउटलायर को हम यहां पर रहने देंगे तो इस तरह से आप क्या कर सकते हैं आउटलायर को आप अपने यहां पे डटा सेट से हटा सकते हैं और एक आपके पास यहां पे क्लीन डाटा जो है वो आपको देखने को मिल जाएगा अब आउटलायर को हटाने का सिंपल तरीका है और वो सिंपल तरीका क्या है यहां पे गाइ यहां पे कि आप अपने डटा सेट को लें और उसके बाद डटा सेट को लेके को एप्लीकेशन इनकम को लगाएं यहां पे और उसके बाद यहां पे उसके अंदर मैक्स रेंज को यहां पे लगा दें बस आपको इतना सा करना है जिससे आपके आउटलायर हट जाएंगे एक मैक्सिमम रेंज की जरूरत पड़ेगी जो कि आपके पास आउटलायर की एक रेंज आपको देगी जिसके थ्रू आप आउटलायर को हटा सकते हैं तो चलिए जरा इसको समझते हैं अच्छे तरीके से तो देखिए आउटलायर के अंदर हम बात करें तो आउटलायर हम किस तरह से देख सकते हैं उसको जरा पहले समझते हैं और उसके बाद हम जड स्कोर की हल्प से किस तरह से आउटलायर को हटा सकते हैं उसको भी हम देखेंगे यहां पे तो चलिए जरा इसको समझते हैं यहां पे तो देखिए सबसे पहले मैं बात करूंगा आउटलायर हम कैसे डिटेक्ट करते थे तो देखिए सबसे पहले हम आउटलायर डिटेक्ट करने के लिए हम बॉक्स प्लॉट का इस्तेमाल कर सकते हैं या फिर हम नॉर्मल डिस्ट्रीब्यूशन कर्व का भी इस्तेमाल कर सकते हैं दोनों के दोनों आपके पास क्या करते हैं आउटलायर को आपको बताते हैं यहां पे अब देखिए बॉक्स प्लॉट के अंदर हम किस तरह से आउटलायर डिटेक्ट करते हैं तो बॉक्स प्लॉट के के अंदर आपके पास क्या होती है एक मिनिमम वैल्यू और एक मैक्सिमम वैल्यू आपको मिल जाती है यस आपको एक मिलती है मिनिमम वैल्यू और एक आपके पास मैक्सिमम वैल्यू मिलती है ये मिनिमम वैल्यू जो होती है वो आपके पास क्या होती है q1 - 1.5 * आ क होती है और इसी तरह से हम यहां पे मैक्सिमम वैल्यू के अंदर देखें तो 3 + 1.5 आ q आ आपके पास यहां पर मैक्सिमम वैल्यू होती है इसके बाहर का जो भी डाटा होता है वो सारा का सारा क्या कहलाता है आपके पास यहां पे आउटलायर कहलाता है अब इसको हम थोड़ा नॉर्मल डिस्ट्रीब्यूशन कर्व की तरह थ्रू समझते हैं यहां पे तो देखिए नॉर्मल डिस्ट्रीब्यूशन कव के अंदर यदि हम देखें इस कव को तो इसके अंदर आपका जो डेटा क्या होता है वो आपके पास क्या होता है कुछ स्टैंडर्ड डिवीजन के अंदर डिवाइड होता है अब देखिए यहां पे आप देखेंगे तो आपके पास जो मिडल में आपके पास मिलता है वो आपके पास क्या मिलता है आपका पास म मिलता है मतलब आपका पास यहां पे मीन आपको मिलता है अब उसके बाद में आपका पास म माइनस वन स्टैंडर्ड डिविज और म प्लस वन स्टैंडर्ड डिविज को यदि आप उस डाटा को लेते हैं तो इसके अंदर आपके पास 68 पर जो आपका डाटा होता है वो आपके पास यहां पे आ जाता है उसके बाद यदि आप यहां पर सेकंड स्टैंडर्ड डिविजन वाला जो डाटा है वो आप यहां पर कंसीडर करते हैं तो उसके अंदर आपके पास ऑलमोस्ट 95 पर जो डाटा है आपके पास यहां पे वो आपके पास आ जाता है उसके बाद यदि आप थर्ड स्टैंडर्ड डिविजन को लेते हैं तो थर्ड स्टैंडर्ड डिवीजन के अंदर 99.7 पर जो डेटा आप पास होता है यहां पे वो आपके पास यहां पे आ जाता है अब हालांकि इसके अंदर हम आउटलायर को ज्यादा अच्छे तरीके से डिटेक्ट तो नहीं कर पाएंगे लेकिन ऐसा एक कांसेप्ट है कि थर्ड स्टैंडर्ड डिवीजन के बाद वाला जितना भी आपके पास डटा होता है वो सारा का सारा आउटलायर कहलाता है अब मान लीजिए कि आपका कर्व कुछ इस तरीके से होता है यहां प जिसके अंदर आपके आउटलायर है यहां तो ये डाटा आपके पास नॉर्मल डिस्ट्रीब्यूशन की तरह तो नहीं दिख रहा है यहां पे लेकिन हम इसमें से आउटलायर को फाइंड आउट कर सकते हैं कैसे हम इस कर्व को हम कंपैरिजन करेंगे हमारे नॉर्मल डिस्ट्रीब्यूशन कव के हेल्प से तो इसके अंदर क्या होगा कि आपका जो कर्वेचर होगा वो यहां कहीं जाके कट होगा अब जैसे ही यहां जाके कट होगा तो इसके आगे वाला जितना भी डाटा होगा वो सारा का सारा क्या हो जाएगा आपके लिए आउटलायर हो जाएगा अब ये आउटलायर हम कैसे डरेक्ट कर सकते हैं तो फिलहाल हमने क्या देखा था यहां पे बॉक्स प्लॉट के अंदर जिसके अंदर हम आई क्यूआर मेथड भी कहते हैं यहां पे तो बॉक्स प्लॉट के अंदर तो हमें मिनिमम और मैक्सिमम वैल्यू हमें मिल जाती है लेकिन यदि जब हम नॉर्मल डिस्ट्रीब्यूशन कर्व के अंदर चले तो यहां पे हमें इस्तेमाल करना पड़ता है z स्कोर अब ये z स्कोर की हेल्प से ही आप क्या करते हैं अपना आउटलायर डिटेक्ट करते हैं और उसे रिमूव भी करते हैं अब ये कैसे करते हैं जरा इसको देखिए यहां पे तो सबसे पहले हमें ये समझना पड़ेगा z स्को का फॉर्मूला क्या है तो z स्को का जो फॉर्मूला होता है वो क्या होता है z = आपको देखने को मिलती है वो आपके पास क्या करती है आपके जो पुराने डाटा है यहां पे अब जो भी पुराना डाटा है जस्ट लाइक आपके पास x आपका कोई पुराना डाटा है उस x के बाद में आप क्या करेंगे आप यहां पे पहले मीन को लेंगे और डिवाइड बाय स्टैंडर्ड डिवीजन को करेंगे तो आपको z की न्यू वैल्यू मिलेगी मतलब मान लीजिए आपके पास कोई x1 एक कॉलम है यहां पे और इसके अंदर कुछ डाटा है आप पास जैसे 70 30 40 50 60 एंड देन आपके पास यहां पे 100 अब इस तरह का डाटा यदि आपके पास प्रेजेंट है आप क्या करेंगे वन बाय वन अपने डाटा को लेंगे और उसके बाद में आप इस पूरे डाटा का क्या करेंगे मीन को लेंगे मीन को आप क्या करेंगे माइनस करेंगे सबट क्ट करेंगे और उसके बाद डिवाइड करेंगे इस पूरे डाटा का स्टैंडर्ड डिवीजन से तो आपके पास क्या मिलेगी z की न्यू वैल्यू मिलेगी अब जब आपके पास z की न्यू वैल्यू आपको देखने को मिलेगी सभी की तो आप क्या करेंगे z का आप वैल्यू डिसाइड करेंगे और ये z की वैल्यू क्या है आपके पास यहां पे थर्ड स्टैंडर्ड डिवीजन और ये हमें कहां से देखने को मिला तो ये चीज आप यहां पे नॉर्मल डिस्ट्रीब्यूशन के अंदर भी देख सकते हैं कि आपके पास थर्ड स्टैंडर्ड डिवीजन के बाद वाला जो टा आपके पास होता है वो सारा का सारा क्या करता है आउटलायर की तरह ट्रीट करता है तो इसका मतलब क्या हुआ यहां पे कि आप एक z की रेंज डिसाइड करेंगे और वो रेंज आपके पास क्या होगी -3 टू आपके पास थ्री के ऊपर अब यदि आपका डाटा आपके पास इस डाटा से बाहर चला जाता है डाटा आपके पास यहां पे तो वो आउटलायर की तरह ही ट्रीट होगा इवन दैट आप यहां पे क्या कर सकते हैं कि आपको पता है कि आपका जो डाटा है वो नॉर्मल डिस्ट कर्व के अंदर है तो इसके अंदर जो आपके पास थर्ड पार्टीशन होता है जहां पे आपका पास 99.7 डेटा आपके पास ग्राप हो जाता है यहां पे उसके बाहर का जितना भी डाटा होता है वो सारा का सारा क्या है आउटलायर है तो आप क्या कर सकते हैं आप यहां पे एक रेंज डिसाइड कर सकते हैं और वो रेंज कैसे डिसाइड करेंगे आप अपने डाटा का क्या करेंगे मीन निकालेंगे उसमें से थर्ड स्टैंडर्ड डिविजन को क्या करेंगे सबकट कर देंगे तो आपके पास यहां पे एक मिनिमम और मैक्सिमम रेंज मिल जाएगी और उससे आप आउटलायर को रिमूव कर सकते हैं फिलहाल देखा जाए तो ये वही चीज लिखी है जो कि जड स्कोर के अंदर लिखी है कैसे पता चला यहां पे z स्कोर के अंदर लिखी है तो देखिए यहां पे जो आपका मिनिमम और मैक्सिमम पॉइंट है वो क्या है म माइनस थर्ड स्टैंडर्ड डिविजन और म प्लस थर्ड स्टैंडर्ड डिविजन तो देखिए आपके पास म माइनस थर्ड स्टैंडर्ड डिवीजन एंड आपके पास म प्लस थर्ड स्टैंडर्ड डिविजन आपके पास क्या है मिनिमम और मैक्सिमम की रेंज है और z स्कोर के अंदर भी आप देखेंगे तो आपने क्या लिखा है यहां पे कि थर्ड पॉइंट और थर्ड पॉइंट इसका होना चाहिए और थर्ड पॉइंट थर्ड पॉइंट होना चाहिए इवन दैट आप z स्कोर के फॉर्मूले में देखेंगे तो यहां पे भी म और और आपका यहां पे स्टैंडर्ड डिवीजन सिग्मा जो है वो आपको देखने को मिल रहा है इसका मतलब चाहे आप जड स्कोर की मेथड की हेल्प से निकालिए या फिर आपके नॉर्मल डिस्ट्रीब्यूशन के अंदर थर्ड आपके पास जो पोजीशंस होती है उसके बाहर का डाटा यदि आप ले लीजिए तो वो सारा डाटा एक आउटलायर की तरह ट्रीट आपके पास होने वाला है अब हम क्या करते हैं इसको थोड़ा प्रैक्टिकली समझते हैं कि जेड स्कोर की हेल्प से कैसे निकाला जाएगा और यदि हम डायरेक्टली करना चाहे तो वो किस तरह से कर सकते हैं इसके लिए ले चलता हूं जुपिटर नोटबुक के अंदर अब हम आ चुके हैं जुपिटर नोटबुक के अंदर सबसे पहले हम डाटा यहां पे लेंगे और उसके बाद हम क्या करेंगे उसमें से आउटलाइन निकालेंगे तो मैं करने वाला हूं इंपोर्ट करने वाला हूं और इंपोर्ट क्या करूंगा यहां पे पांडा एलियाज ऑफ पीडी को इंपोर्ट करूंगा यहां पे उसके बाद हमारा जो डेटा सेट है उसे हम लोड करेंगे पीडी डॉट यहां पर रीड सीएसवी की हेल्प से मैंने क्या किया है डाटा को लोड किया है और डेटा सेट का नाम है लोन सए इसको मैंने ले लिया उसके बाद हम क्या करेंगे हमारा डटा सेट लेंगे डॉट यहां पर मैं हैड लेने वाला हूं और हैड के अंदर मैं तीन डाटा लूंगा अब इसमें से आउटलायर कहां निकाला जाएगा तो आउटलायर आप एप्लीकेशन इनकम को एप्लीकेशन इनकम इनमें आउटलाइन निकाल सकते हैं तो मैं क्या कर रहा हूं एप्लीकेशन और को एप्लीकेशन इनकम में से कोई भी एक ले लेता हूं लेकिन पहले मैं ध्यान रखूंगा कि हमारे डाटा के अंदर नल वैल्यू तो नहीं है यदि नल वैल्यू है तो हम क्या करेंगे पहले उसे फिल करेंगे देन उसे कंसीडर करेंगे तो मैं क्या करूंगा यहां पे डेटा सेट लूंगा एंड डॉट यहां पे मैं क्या करने वाला हूं इस नल को मैं यहां पे लूंगा और उसके बाद डॉट यहां पर सम को कॉल करने वाला हूं तो इसके अंदर हमें देखिए यहां पे लोन अमाउंट्स के अंदर नल वैल्यू मिल रही है यहां पे को एप्लीकेशन इनकम के अंदर नहीं है एप्लीकेशन इनकम के अंदर नहीं है तो देखिए को एप्लीकेशन इनकम के अंदर नल वैल्यू प्रेजेंट नहीं है तो हम इसमें से आउटलायर को देख भी सकते हैं और इसे एनालिसिस भी कर सकते हैं इवन दैट पहले हम यहां पे डाटा की एनालास कर लेते हैं कि क्या इसके अंदर आउटलायर है या नहीं है तो उसको पता लगाने के लिए हम हमारे डटा सेट के पास जाएंगे डॉट यहां पे क्या करूंगा डिस्क्राइब करूंगा डिस्क्राइब क्या करता है जितने भी न्यूमेरिकल डाटा होता है उसकी एक एनालिसिस लेके आता है जिसके अंदर आपको डाटा के बारे में काउंट बताता है मीन बताता है स्टैंडर्ड डिवीजन बताता है मिनिमम वैल्यू और आपके पास 25 परज पे कितनी वैल्यू है 50 परज प कितनी वैल्यू है 75 पर इस पे कितनी वैल्यू है और मैक्सिमम वैल्यू कितनी है ये सारी चीजें आपको यहां पे इंफॉर्मेशन देता है अब हमें जरूरत थी को एप्लीकेशन इनकम के अंदर तो को एप्लीकेशन इनकम के अंदर तो फिलहाल कोई नल वैल्यू प्रेजेंट नहीं है इसके अंदर मीन आप देख लीजिए मीन जो है आपके पास यहां पे 1600 पे आपके पास आया है जबकि आपका पास मैक्सिमम वैल्यू को देखेंगे तो ये क्या है 41000 है इसका मतलब डेफिनेटली इसके अंदर आउटलाइन होने वाला है और मिनिमम वैल्यू को देखेंगे तो मिनिमम वैल्यू क्या है ज जीरो भी है यहां पे और यहां देखिए 50 पर लाज का जो डटा है यहां पे 2000 तक का ही आपका यहां पर डेटा आपको देखने को मिल रहा है यहां तो इसका मतलब डेफिनेटली इसके अंदर आउटलायर मिलने वाला है तो चलिए इन आउटलायर को हम आइडेंटिफिकेशन आउटलायर किस तरह से दिखाई दे रहे है और यहां पे ग्राफ बनाने के लिए हमें मैट पल लिप का भी इस्तेमाल करना पड़ेगा क्योंकि इसकी हेल्प से हम यहां पे ग्राफ को थोड़ा और ज़ूम करके आराम से देख पाएंगे तो मैट पलर लिप के थ्रू हम यहां पे क्या करेंगे मैट पलर लिप को इस्तेमाल करेंगे मेट डॉट यहां पे क्या करेंगे पवाई प्लॉट को इस्तेमाल करने वाला है एलियास ऑफ यहां पे मैं पीएटी का इस्तेमाल करूंगा चलिए हमारा जो सी बन है वो यहां पे लोड हो रहा है और मैट पली भी लोड हो चुका है चलिए अब हम क्या करते हैं यहां पे एसएस डॉट यहां पे क्या करूंगा आपका बॉक्स प्लॉट बनाऊंगा इवन दैट यहां पे मैं यहां पे डिस्ट्रीब्यूशन प्लॉट भी बनाने वाला हूं मतलब एक नॉर्मल डिस्ट्रीब्यूशन का भी बनाने वाला हूं जिसकी हेल्प से ये देखूंगा कि इसके अंदर आउटलायर प्रेजेंट है या नहीं है तो इसके लिए हम क्या करेंगे बॉक्स प्लॉट का इस्तेमाल करेंगे तो मैंने यहां पे बॉक्स प्लॉट लिया है बॉक्स प्लॉट के अंदर जाके हम क्या करेंगे हमारा जो डेटा सेट है उसको लेंगे और स्क्वायर ब्रैकेट के साथ अब हमें किसका बॉक्स प्लोट बनाना है तो मुझे बनाना है हमारी को एप्लीकेशन इनकम का तो मेरी जो को एप्लीकेशन इनकम है इसको मैं यहां पे प्लेस करने वाला हूं यहां पे यस तो पहले मैं क्या करता हूं को एप्लीकेशन इनकम को कॉपी कर लेता हूं और यहां जाके को एप्लीकेशन इनकम को पेस्ट कर देता हूं तो देखिए हमारा बॉक्स प्लॉट बन चुका है जिसके अंदर आउटलायर भी प्रेजेंट है एक काम करते हैं इसको आउटलायर को अच्छे तरीके से आइडेंटिफिकेशन जो डेटा सेट है वहां से आया है तो मैं डटा इक्वल टू क्या करता हूं डेटा सेट के अंदर डाल देता हूं तो अब हमें यहां पे आराम से दिखाई दे रहा है कि इसके अंदर आउटलायर प्रेजेंट है अब हम क्या करेंगे नॉर्मल डिस्ट्रीब्यूशन कर्व भी बनाते हैं ताकि हमें पता चल सके कि थर्ड स्टैंडर्ड डिविजन के बाद में हमारा आउटलेट प्रेजेंट है या नहीं है इसके लिए हम क्या करेंगे सी बॉन के पास जाएंगे देन डॉट उसके अंदर हम क्या करेंगे डिस्क प्लॉट को इस्तेमाल करेंगे डिस्क प्लॉट क्या करता है डिस्ट्रीब्यूशन प्लॉट्स बनाता है आपके डाटा का तो आप जिसका भी डिस्ट्रीब्यूशन प्लॉट बनाना चाहते हैं मतलब आप यहां पे नॉर्म डिस्ट्रीब्यूशन को बनाना चाहते हैं तो वो आपको बना के आपकी हेल्प कर करता है तो ये किस पर बनाना है हमें ये हमें बनाना है को एप्लीकेशन इनकम के ऊपर और रन करते हैं तो देखिए हमारा डिस्ट्रीब्यूशन प्लॉट बन चुका है और इस डिस्ट्रीब्यूशन प्लॉट के अंदर देखेंगे तो इसकी जो टेल है वो काफी लंबी है जबकि आपका जो ऑलमोस्ट जो डाटा है वो आपका क्या चल रहा है 10000 से अंदर-अंदर ही चल रहा है जबकि आप इसके टेल को देखेंगे तो वो बहुत ज्यादा लंबी है इसका मतलब इसके अंदर आउटलायर प्रेजेंट है और जो कि हमने यहां पे भी देख रखा है अब हम क्या करेंगे इस आउटलायर को रिमूव करेंगे किसके हेल्प से जेड स्कोर की हेल्प से और इवन दैट डायरेक्टली तरीके से तो मैं दोनों तरीके को वन बाय वन यहां पे एक्सप्लेन कर तो अब हमें क्या करना है पहले तो हम करेंगे डायरेक्टली मेथड से डायरेक्टली मेथड के लिए हमें क्या चाहिए मिनिमम रेंज चाहिए एक तो तो मैंने एक मिनिमम रेंज ली है यहां पे दूसरा हमें यहां पे क्या चाहिए मैक्सिमम रेंज भी चाहिए तो मैंने यहां पे क्या किया है मैक्सिमम रेंज भी लिया है मैक्सिमम रेंज भी मैंने यहां पे डिसाइड कर लिया अब कैसे लिखेंगे यहां पे जो भी आप अपना डेटा सेट ले रहे हैं उस डेटा सेट के अंदर आपको क्या करना है सबसे पहले आपको क्या करना है उस डाटा का मीन लेना है और उसके बाद स्टैंडर्ड डिवीजन लेना है अब ये कौन सा है थर्ड स्टैंडर्ड डिवीजन और आपके पास कौन सा है थर्ड स्टैंडर्ड डिवीजन है तो मैं मम और मैक्सिमम रेंज इस तरह से डिसाइड होगी तो सबसे पहले मुझे मेरे डटा का क्या करना है मीन लेना है मीन लेने के लिए मैं क्या करूंगा यहां पे गाइस यहां पे अपना डेटा सेट लूंगा सबसे पहले देन स्क्वायर ब्रैकेट और मुझे लगाना है को एप्लीकेशन इनकम को को एप्लीकेशन इनकम का मुझे क्या करना है मीन को डिसाइड करना है तो मैंने क्या करना है यहां पे मीन को कॉल कर दिया है तो ये लेके आ जाएगा मेरे लिए मीन मीन लेने के बाद में मुझे क्या करना है माइनस करना है और माइनस करके क्या करना है थर्ड स्टैंडर्ड डेविएशन को अब थर्ड स्टैंडर्ड डेविएशन कहां से आएगा तो डेटा सेट के अंदर चलेंगे फिर से और यहां पे हम क्या निकालेंगे एप्लीकेशन इनकम को निकालेंगे उसके बाद में हम क्या निकालेंगे इसका स्टैंडर्ड डिवीजन इसके लिए मैं क्या करूंगा एसटीडी जो मेथड है उसे मैं कॉल करने वाला हूं तो ये मेरा थर्ड स्टैंडर्ड डिविजन आपके पास आ चुका है एक काम करते हैं इसको हम क्या करते हैं ब्रैकेट में क्या करते हैं क्लोज कर देते हैं चलिए तो ये हमारे पास क्या आ गया मिनिमम रेंज आ चुकी है अब इसी तरीके से हमें क्या करनी है मैक्सिमम रेंज भी डिसाइड करनी है तो डाटा सेट लिया हमने यहां पे उसके साथ हमने प्लस कर दिया तो मिनिमम और मैक्सिमम रेंज हमारे पास आ चुकी है चलिए मैं एक काम करता हूं मीडियम रेंज को कॉल करता हूं यहां पे और इसके साथ-साथ मैं अपनी जो मैक्सिमम रेंज है उसे भी यहां पे शो करता हूं तो मिनिमम रेंज तो मेरे पास नेगेटिव में आई है इसका मतलब हमारे पास नेगेटिव में तो कोई आउटलायर प्रेजेंट होगा ही नहीं क्योंकि नेगेटिव वैल्यू आपके पास आई है पॉजिटिव के अंदर क्या आई है यहां पे 10000 के आसपास हमारा डाटा यहां पे आया तो अब हमें क्या करना है इस रेंज के बाहर का जो भी डटा है उसे हमें रिमूव करना है डेटा को रिमूव करने के लिए हम क्या करेंगे हमारे सबसे पहले हम डेटा सेट को कॉल करेंगे देन स्क्वायर ब्रैकेट फिर हम फिर से डेटा सेट को कॉल करेंगे देन स्क्वायर ब्रैकेट और उसके बाद में हमारी जो को एप्लीकेशन इनकम है उसको हम कॉल करने वाले हैं अब को एप्लीकेशन इनकम के अंदर हम क्या बोलेंगे कि हमारा डटा लेस देन और इक्वल्स टू हमारे पास इस गिवन रेंज के अंदर कौन सी रेंज है हमारे पास यहां पे जो हमारी मैक्सिमम रेंज है उसके अंदर रहे यहां पे तो हमारे पास जो डाटा होगा वो हमारे पास क्या होगा आउटलायर रिमूवल डाटा आपके पास होगा मतलब आउटलायर हट चुका होगा वहां से तो रन करें तो ये हमारे पास डाटा आ चुका है जिसके अंदर आउटलाइन नहीं है एक काम करते हैं इस डेटा सेट को हम किसी न्यू वेरिएबल के अंदर सेव कर लेते हैं तो मैं न्यू अंडरस्कोर डाटा के अंदर क्या करता हूं उे सेव कर लेता हूं अब न्यू अंडरस्कोर जो डाटा आया है ना यहां पे अब हम यहां पे क्या करते हैं इसका बॉक्स प्लॉट बनाते हैं ताकि हम यहां पर देख पाएं कि हमारे पास आउटलायर रिमूव हुआ है या नहीं हुआ मतलब कितने आउटलाइंस हमारे पास प्रेजेंट है अभी भी तो मैं क्या करता हूं यहां पे डाटा के अंदर जाता हूं और न्यू डाटा को यहां पे प्रेस कर देता हूं रन करते हैं तो देखिए अब हमारे जो आउटलायर है वो काफी हद तक रिमूव हो चुके हैं अब ये कुछ-कुछ आउटलायर रह चुके हैं तो इन्हें हम यहां पर रने देते हैं क्योंकि आउटलायर जितने ज्यादा आप यहां पे रिमूव करेंगे तो आप डाटा के जो लॉसेस हैं वो आपके पास बहुत ज्यादा हो जाएंगे और कि आपको ये नहीं पता है कि जो डाटा आपके पास लॉस हो रहा है उसके अंदर आपके पास कोई इंपॉर्टेंट फीचर है या नहीं है तो आप जितने ज्यादा आउटलायर रिमूव करेंगे तो उतने ज्यादा आपके जो डाटा के फीचर्स जो हैं वो चले जा सकते हैं यहां पे तो इसलिए हमें जितना कम हो सके उतने कम डाटा को रिमूव करना चाहिए तो यहां पे हमने क्या देखा कि आप अपने डाटा को किस तरह से रिमूव कर सकते हैं बाय यूजिंग डायरेक्ट मेथड की हेल्प से जिसके अंदर हमने क्या किया कि जो हमारा डाटा है उसका मीन लिया उसमें से सबस्टैक किया किसे थर्ड स्टैंडर्ड डिवीजन को अब हम क्या करते हैं z स्कोर निकालते हैं और z स्कोर की हेल्प से हम क्या करते हैं यहां पे आउटलायर को रिमूव करते हैं अब z स्कोर की हेल्प से आप कैसे रिमूव करेंगे तो इसके लिए आपको क्या करना पड़ेगा z स्कोर की वैल्यू निकालनी पड़ेगी तो मैं एक काम करता हूं z आपके पास यहां पे स्कोर के नाम से एक वेलेबल बना देता हूं यहां पे अब इसके अंदर क्या करते हैं हमारा जो डटा सेट है उसको लेते हैं तो हमारा जो डटा सेट है उसको लिया यहां पर और इसके अंदर मैंने किसको लिया हमारे पास को एप्लीकेशन इनकम को लिया को एप्लीकेशन इनकम को लेने के बाद में हमारा जो फर्मूला है वो क्या बोलता है यहां पे कि हमारे डाटा में से सबस्टैक करना है किसे मीन को सबट क्ट करना है और उसके बाद डिवाइड करना है किसे स्टैंडर्ड डिवीजन को तो बस यही हम यहां पे काम करेंगे तो सबसे पहले क्या करूंगा यहां पे सबट करूंगा सबट कैसे करूंगा जो हमारा डटा सेट है उसको लूंगा देन सबस्टैक करूंगा यहां पे किसे को एप्लीकेशन इनकम को देन अब हम क्या करेंगे ये जो सबस्टैक हुआ है इसके बाद हम क्या करेंगे इसको डिवाइड भी करेंगे तो मैं इसे डिवाइड करने वाला हूं किससे स्टैंडर्ड डिवीजन से तो मैं अपना डेटा सेट लूंगा यहां पे ओके देन स्क्वायर ब्रैकेट और यहां पे को एप्लीकेशन इनकम को दोबारा कॉल करूंगा तो मैं यहां पे क्या करता हूं मीन ले लेता हूं तो मैं यहां पे क्या करता हूं मीन को कंसीडर कर लेता हूं उसके बाद में मुझे क्या करना है स्टैंडर्ड डिवीजन से डिवाइड करना है तो डॉट यहां पर मैं क्या लगाऊंगा एसटीडी लगाऊंगा तो मुझे मेरा स्टैंडर्ड डिवीजन भी मिल जाएगा अब एक काम करते हैं इसको भी हम क्या करते हैं एक ब्रैकेट्स के अंदर डाल देते हैं तो ये हमारा जड स्कोर तैयार हो चुका है अब देखिए जड स्कोर को एक बार देख लेते हैं कि जड स्कोर किस तरह से दिखा दे रहे है तो देखिए सबके जड स्कोर्स हमारे पास यहां पे आ चुके हैं अब इस जड स्कोर्स के अंदर हमें क्या करना है चेक करना है कि कौन सा जड स्कोर हमारे पास ग्रेटर दन थ है और मा लेस दन -3 है तो मैं ग्रेटर दन 3 वाले जो डा स्कोर है उसको देखूंगा तो बिल्कुल इसके अंदर कुछ कुछ फॉल्स है कुछ कुछ क्या है हमारे पास यहां पे ट्रू देखने को मिल रहे हैं यहां पे तो अब यहां पे जो भी जड स्कोर आया है यहां पे इससे हमें क्या करना पड़ेगा कंपैरिजन कराना पड़ेगा एंड देन उसके बाद में हमें देखना पड़ेगा कि हमारे पास किस तरह का डाटा हमारे पास आया है तो एक काम करते हैं इस डेटा सेट को हमारे ओरिजिनल डेटा सेट के अंदर प्लेस कर देते हैं देन उसके बाद में हम देखेंगे कि किस तरह से हमारे पास ज को देखने को मिल रहा है ओके तो मैं एक काम करता हूं हमारे डटा सेट को लेता हूं और इसके अंदर क्या करता हूं यहां पे z अको यहां पे स्कोर के नाम से स्कोर के नाम से क्या करता हूं यहां पे आपके पास यहां पे तैयार कर लेता हूं आपके पास कॉलम को और उसके अंदर ये जो जड स्कोर का जो भी डाटा है यहां पे आया है इसे मैं प्लेस कर दूंगा हमारा जो डेटा सेट है उसके अंदर क्या करता हूं जड स्कोर के नाम से इसे प्लेस कर लेता हूं तो अब हम यहां पे हमारे डेटा सेट को देखेंगे तो इसके अंदर एक नया कॉलम और ऐड हो चुका है और वो ऐड हो चुका है किसके नाम से जड स्कोर के नाम से अब हम क्या करेंगे इसमें से आउटलायर को रिमूव करेंगे अब इसमें से आउटलायर कैसे रिमूव होगा तो हम हमारा डटा सेट लेंगे उसके बाद हम हमारे फिर से ज डेटा सेट को लेंगे देन स्क्वायर ब्रैकेट और इसके अंदर जाके क्या करूंगा कि जो जड स्कोर वाला कॉलम है यहां पे इसके अंदर क्या करूंगा हमारा जो डाटा है वो क्या चाहिए हमें लेस देन चाहिए यस क्या चाहिए लेस देन चाहिए लेस देन किससे थर्ड जड स्कोर वाले डाटा से साथ तो ऐसे ही ऐसे रन करेंगे तो इसके अंदर वो डाटा आ चुका है हमारे पास जो कि थर्ड जड स्कोर से लेस देन है अब यहां पे देखिए हमारे डेटा सेट के अंदर कितना डटा बचा है तो इसके अंदर बताया है 612 रो बची है यहां पे अच्छा ओरिजिनल डेटा सेट के अंदर देखें यहां पे कि कितनी रो थी और कितने कॉलम थे तो इसके अंदर यदि आप देखेंगे तो इसके अंदर आपके पास यहां पे 618 रोज थी आई थिंक तो मैं चेक कर लेता हूं यहां पे डेटा सेट के अंदर चलता हूं डॉट यहां पे क्या करता हूं यहां पे शेप को कॉल करता हूं रन करता हूं तो 618 रोज थी और अब हमने क्या किया z स्कोर को लगाया तो जड स्कोर के अंदर थर्ड जड स्कोर को हटाया तो 612 रोज यहां पे आई है इसका मतलब आपके पास क्या हुआ काफी रो यहां पे डिलीट हो चुकी है अच्छा जो हमारा न्यू डेटा सेट था उसके अंदर भी जाके चेक कर लेते हैं एक बार कि उसके अंदर कितना डाटा सेट बचा है यस तो हमने न्यू डेटा सेट बनाया था यहीं कहीं तो ये रहा हमारा न्यू डटा सेट तो इसके अंदर भी चेक कर लेते हैं कि इसके अंदर हमारे पास कितना डाटा बचा है मतलब जब हमने इसमें से आउटलाइन हटा दिया था उसमें से े कितना बचा बचा है वो हम देख लेते हैं तो न्यू डाटा को यदि मैं जाके चेक करूं यहां पे और डॉट यहां पर शेप लगाऊं तो इसके अंदर भी देखिए 612 रो ही बची है और हमारे पास जो नीचे वाला डटा है इसके अंदर भी 612 रो ही बची है यहां पे तो आप एक चीज ऑब्जर्व कर पाएंगे कि आप चाहे जड स्कोर मेथड से अप्लाई करें या फिर आप डायरेक्ट मेथड का अप्लाई करें दोनों की वर्किंग फंक्शनालिस टू सेम वर्क करती है और सेम टू सेम डाटा रिमूवल करती है ओके तो देखिए यहां पर बात करें तो सबसे पहले हमा 618 रोज थी यहां पे इसके अंदर हमने क्या किया जो हमारा नॉर्मल मेथड था वो हमने लगाया कैसे मैंने क्या किया मीन लिया माइनस किया थर्ड स्टैंडर्ड डेविएशन को सबकट किया और यहां से हमारे पास क्या हुआ मिनिमम और मैक्सिमम रेंज आई फिर हमने हमारा क्या किया कि जो हमारा डेटा सेट है यहां पे जो हमारा मैक्सिमम रेंज आई है उससे नीचे वाला जो डटा है वो लिया तो हमारे पास एक नए डटा सेट का यहां पे डाटा आ चुका है जिसके अंदर आउटलायर हट चुके हैं और वो कितने है यहां पे 612 आपके पास आया अब यहां पे मैंने क्या किया z स् को निकाला ओके ये तो मेरा पहला मेथड था अब मैंने सेकंड मेथड के अंदर क्या किया z स्कोर निकाला जड स्कोर कैसे निकाला हमारे पास यहां पे कि हमारा डेटा सेट लिया उस सबकट किया किसे मीन को और डिवाइड स्टैंडर्ड डिविज से तो मेरा जड स्कोर आ चुका है अब इस जड स्कोर के अंदर थर्ड जड स्कोर से जो नीचे आपका डाटा है यहां पे उसको हमने कंसीडर किया यहां पे तो यह मैंने लिया और डॉट शेप निकाली मैंने यहां पे भी इसके अंदर भी देखिए आपके पास यहां पे 612 रोज यहां पे मि है इसका मतलब आप चाहे जड स्को से निकालिए चाहे डायरेक्ट निकालिए दोनों का जो वर्किंग फटी है वो सेम टू सेम वर्क करती है और आज के इस वीडियो के जरिए हम बात करेंगे यहां पे कि फीचर स्केलिंग टेक्निक क्या होती है और इसे कहां पे इस्तेमाल करना होता है तो बेसिकली मशीन लर्निंग के एल्गोरिथम को जब आप ट्रेड करते हैं तो उस वक्त आप जो भी आप अपना डाटा दे रहे हैं उस डाटा के अंदर एक बहुत बड़ी प्रॉब्लम आपको देखने को मिलती है और वो प्रॉब्लम क्या है कि आपके पास काफी ऐसे नंबर्स होंगे जो काफी लार्ज होंगे यहां पे जस्ट लाइक 10000 20000 और यहां पे 50000 ओके और काफी ऐसे नंबर्स होंगे जो लो होंगे जस्ट लाइक 0.5 हो गया रो हो गया टू हो गया थ्री हो गया इस तरह के कंपैरेटिव देखना पड़ेगा तो एक डाटा होगा जो सबसे लार्ज होगा और एक फीचर होगा जो सबसे लो होगा अब इस तरह के डेटा सेट को यदि हम मशीन लर्निंग मॉडल को देते हैं तो मशीन लर्निंग मॉडल क्या करता है कि जिस फीचर के अंदर आपके पास लार्ज डाटा होता है मतलब लार्ज अमाउंट में डटा आपके पास होता है यहां पे ये उसे डोमिनेटिंग कर देता है और उसी के ऊपर ट्रेंड हो जाता है जबकि जो लो अमाउंट वाला डाटा होता है यहां पे उसे क्या करता है नेगलिजिबल कर देता है और काफी बार केसेस के अंदर उस फीचर को ही एलिमिनेट कर देता है एलिमिनेट करने का मतलब है कि वो फीचर आप यहां पर देंगे लेकिन उसकी जो इंपॉर्टेंस है वो बिल्कुल जीरो हो जाती है तो इस वजह से इस प्रॉब्लम को दूर करने के लिए हम फीचर स्केलिंग करते हैं फीचर स्केलिंग की टेक्नीक के अंदर हम क्या करते हैं कि जो दोनों डाटा हमारे पास है एक लार्ज और एक आपका स्मॉल जो डाटा है यहां पे दोनों को हम बराबर लेवल पे लेके आते हैं मतलब बेसिकली दोनों को हम क्या करते हैं स्केलिंग करते हैं ताकि जो डाटा है वो सेम पिच प आ जाए अब यहां पे एक बहुत इंपॉर्टेंट क्वेश्चंस आप लोगों के दिमाग में आ रहा होगा कि यदि हम फीचर स्केलिंग कर रहे हैं तो इससे हमारा डाटा क्या लूज हो सकता है या हमारा डाटा का जो पैटर्न है वो चेंज हो सकता है क्या प्रॉपर्टी होने वाली है तो देखिए मैं आपको यहां पे यह बताने वाला हूं कि फीचर स्केलिंग जब आप यहां पे करते हैं तो उस समय डाटा का जो नेचर होता है वो वही का वही रहता है मान लीजिए आपका जो डाटा है वो नॉर्मल डिस्ट्रीब्यूशन का को फॉलो करता है तो उस केसेस के अंदर जब आप फीचर स्केलिंग करते हैं तो आपके डाटा का नेचर फीचर स्केलिंग के बाद भी सेम का सेम ही रहता है कोई चेंजेज वहां पे नहीं देखने को मिलता है अब यहां पे आता है कि डाटा का मैग्निटिया अब ये रिड्यूस होने का जो कांसेप्ट होता है ये आपके डिपेंड करता है कि आप कौन सी फीचर स्केलिंग प्रेफर कर रहे हैं फीचर स्केलिंग के बहुत सारे तरीके होते हैं उसके हिसाब से आपका जो डेटा का पैटर्न है वो यहां पे चेंज होता है इसको जस्ट एग्जांपल के तौर पे मैं बात करना चाहूं यहां पे मान लीजिए एक बहुत बड़ा सेम है और उसी के कंपैट आप एक छोटा सा सेम लेके आते हैं तो अब यहां पे बड़े सेम और छोटे सेम के अंदर दोनों में कंपेयर करें तो दोनों तो है ही सेव दोनों तो एल ही है यहां पे अब जब आप बड़े सेव के ऊपर बात करेंगे तो उसकी क्या साइज बड़ी है छोटा सेव है उसकी क्या है साइज छोटी है बट इंटरनली प्रॉपर्टी की बात करें यहां पे तो दोनों की दोनों क्या है सेम टू सेम है यहां पे इसी को हम फीचर स्केलिंग कहते हैं मतलब मैं बड़े सेम को कंप्रेस करके छोटे सेम के अंदर लेके आ रहा हूं यहां पे इसी को हम बोलते हैं फीचर स्केलिंग अब ये फीचर स्केलिंग कहां जरूरत होती है तो ऐसे बहुत से एग्जांपल है जहां पे फीचर स्केलिंग जरूरी है लेकिन मैं आपको सजेस्ट करूंगा आप डाटा को जब भी ट्रेन करने जा रहे हैं उससे पहले फीचर्स स्केलिंग जरूर कर दीजिए जिससे आपके डाटा के अंदर आपकी जो इंप्रूवमेंट है वो और अच्छी हो सके अब बात करते हैं फीचर स्केलिंग के कितने टाइप्स की होती है तो बेसिकली बात करूं फीचर स्केलिंग आपके पास दो तरीके की होती है पहली होती है आपके पास स्टैंडर्डाइजेशन दूसरी होती है नॉर्मलाइजेशन अब नॉर्मलाइजेशन में भी आपके पास बहुत सारे तरीके के टाइप्स होते हैं जिसके अंदर हम कवर अप करेंगे मिन मैक्स स्केलिंग को यहां पे दोनों के पैटर्न दोनों के काम करने के जो तरीके होते हैं वो डिफरेंट डिफरेंट होते हैं यहां पे स्टैंडर्डाइजेशन अलग तरीके से काम करता है और नॉर्मलाइजेशन अलग तरीके से काम करता है आज के इस पर्टिकुलर वीडियो के अंदर हम बात करेंगे यहां पे स्टैंडर्डाइजेशन के बारे में कि यह कैसे काम करती है और यह किस मैथमेटिकल फॉर्मूले के ऊपर वर्क करती है इसको जरा यहां पर समझते हैं यदि आपको पाइथन मशीन लर्निंग डेटा साइंस एंड डेटा एनालिस जैसी फील्ड में अपने आपको को ग्रो करना है तो इसके लिए डब्ल्यू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जवाइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो देखिए स्टैंडर्डाइजेशन जो फार्मूला इस्तेमाल करती है वो ये वाला फार्मूला इस्तेमाल करती है जिसके अंदर आपके पास जो भी नया डाटा बनता है वो क्या किया जाता है पुराने वाले डाटा को लेते हैं उसमें से मीन को सबट करते हैं और उसी डाटा का स्टैंडर्ड डेविएशन से डिवाइड कर देते हैं मतलब एक सिंपल सा एग्जांपल के तौर पे बात करूं यहां पे तो मान लीजिए आपका x1 एक फीचर है अब x1 एक फीचर है जो कुछ नंब सकता है जैसे कि टू रखा थ 4 फव और सिक्स अब इस डाटा का आप क्या करेंगे मीन निकालेंगे मतलब इस पूरे डाटा का आपको क्या करना है यहां पे मीन निकालना है यहां पे और इसके साथ-साथ आपको क्या करना है स्टैंडर्ड डेविएशन भी आपको निकालना है दोनों आप यहां पे क्या करेंगे इसको फाइंड आउट करेंगे अब दोनों जब आपके फाइंड आउट हो गए जसे मान लीजिए आपके पास यहां पे ये हुआ और ये q हुआ तो अब जब आप यहां पे फीचर स्केलिंग करेंगे तो फीचर स्केलिंग करने पर x1 न्यू आपको देखने को मिलेगा अब ये x1 न्यू आपके पास किस तरह से बन के आएगा तो ये इस तरह से आएगा 2 - ऑफ p डिवा बा ऑफ q फिर इसके नीचे आपके पास यहां पर सेकंड पॉइंट पे आएगा 3 - p डिवा बा q फिर आपके पास आएगा 4 - p और डिवा बा q इस तरह का आपका डाटा आपको मिलने वाला है और जब आप ये जो नया डाटा आप लेंगे इस नए डाटा के अंदर एक बहुत इंपॉर्टेंट चीज आपको देखने को मिलेगी कि इस डाटा का जब भी आप मीन निकालेंगे तो वो जो मीन होगा वो जीरो हो जाएगा एंड आपका जो इसका वेरियंस होगा यहां पे वो वेरियंस क्या हो जाएगा इक्वल टू 1 हो जाएगा मतलब आपका वेरियंस आपको क्या मिलने वाला है वन दिखने को मिला है इसको एक ज्योमेट्री इंटें से समझते हैं कि यदि मेरे पास डेटा सेट जिस तरह से दिखाई देता है उसके अंदर यदि फीचर स्केलिंग करें तो फर वो किस तरह से दिखाई देगा इसको समझने के लिए मैं ले चलता हूं वाइट बोर्ड के अंदर और वाइट बोर्ड के अंदर हम थोड़ा समझते हैं यहां पे कि इस तरह होने वाला है मान लीजिए कि आपका जो डटा पॉइंट है वो कुछ इस तरह से यहां पे लाई कर रहा है राइट तो ये आपके डटा पॉइंट का क्या है कुछ आपका डाटा यहां पे पड़ा हुआ है यहां पे अब मैं बात करूं यहां पे तो इस डाटा पॉइंट का जो मीन होगा वो मीन आपके पास क्या होगा यहां पे इस क हीं बीच में आपके पास लाइ हो रहा था और इसको मैं कलर कर देता हूं ब्लू कलर से कि मान लीजिए ये आपका मीन हो रहा होगा ठीक है इस पॉइंट को कर देते हैं मीन अब इस मीन की वैल्यू कुछ ना कुछ रही होगी और इस डाटा का वेरियंस की बात करें तो इस डाटा का वेरियंस जो है वो कुछ ना कुछ यहां से यहां तक रहा होगा अब जब मैं यहां पे इसे स्केलिंग करता हूं तो स्केलिंग करने के बाद में आप एक चीज को नोट कर पाएंगे कि आपका जो डाटा है वो कुछ इस तरह से आपके सामने देखने को मिलेगा मतलब मैं इस पूरे डाटा को क्या करने वाला हूं चेंज करने वाला हूं और पूरे डाटा जो होगा वो आपके पास कुछ इस तरह से आपके पास यहां पे आ जाएगा ये जो मैं बता रहा हूं यहां पे इस तरह के आपके पास यहां पे आ जाएगा अब नेक्स्ट चीज आएगा कि आपका जो मीन है मतलब इसके बीच में भी आपका डाटा है यहां पे अब ये जो मीन है आपके पास यहां पे वो मीन कहां आ जाएगा ये आपका जीरो पॉइंट पे आपके पास आ जाएगा जो कि कहीं इस जगह प पॉइंट पे था वो मीन आपके पास जाके क्या हो जाएगा इस पॉइंट पे आपको देखने को मिल जाएगा एंड वेरियंस की बात करें तो ये वेरियंस जो है वो -1 से व के बीच में आपको यहां पे देखने को मिलेगा मतलब आपके जो फैलाव है यहां पे डाटा का जो एक्सपेड स है यहां पे वो इस तरह देखेगा तो आपका डाटा स्केलिंग होके क्या हो जाएगा इस जगह पे आपके पास हो जाएगा अब यहां पे एक बहुत इंपॉर्टेंट क्वेश्चन आता है कि इन केस यदि हमारे पास आउटलायर हुए तो क्या होगा क्या आउटलायर इससे रिमूव हो जाएंगे नहीं स्केलिंग से आपके आउटलायर जो है वो रिमूव नहीं होते हैं आउटलायर आउटलायर की तरह ही काम करते हैं हां उनका मैग्निटिया फार्मूला जो हमने समझाइए लगाया कैसे जाता है इसको जरा समझते हैं तो इसके लिए मैं ले चलता हूं आपको जुपिटर नोटबुक के ऊपर एंड जुपिटर नोटबुक के अंदर मैं क्या कर रहा हूं यहां पे एक न्यू नोटबुक क्रिएट कर देता हूं यहां पे अब नए नोटबुक के अंदर क्या करूंगा गाइज यहां पे कि पहले अपना डेटा सेट लूंगा और आप सब लोगों को पता है कि हम क्या कर रहे हैं लोन डाटा सेट के ऊपर काम कर रहे हैं और यह डाटा सेट कुछ इस तरह से दिखाई देता है राइट तो ये जो हमारा लोन ड सीएसवी इसके ऊपर हम पहले से काम करते आ रहे हैं आप लोगों को पता है तो मैं इस डटा सेट के ऊपर ही क्या करने वाला हूं स्केलिंग करने वाला हूं अब यहां पे स्केलिंग करना इसलिए जरूरी है क्योंकि देखिए आप एप्लीकेशन इनकम को देखेंगे और अपने को एप्लीकेशन इनकम को देखेंगे लोन अमाउंट्स को देखेंगे और फिर उसके बाद क्रेडिट लोन लोन अमाउंट टर्म्स को देखेंगे यहां पे तो इनके बीच में बहुत डिफरेंस है एक आपके पास 5000 के ऊपर चल रहा है दूसरा आपके पास यहां पे 1000 के अंदर चल रहा है और तीसरा आप देखेंगे तो 100 के आसपास ही चल रहा है और यहां पे 300 के आसपास चल रहा है मतलब डाटा में इन बैलेंसिंग आपको देखने को मिल रही है यहां पे तो अब हम क्या करेंगे इसकी स्केलिंग करना स्टार्ट करेंगे तो इसके लिए मैं कर रहा हूं यहां पे इंपोर्ट कर रहा हूं यहां पे किसे मैं पहले सबसे पहले इंपोर्ट पांडा करता हूं यहां पे एलियाज ऑफ पीडी लगा के नेक्स्ट जो यहां पे मुझे जरूरत है चीजों की वो है मुझे सी बन की ताकि मैं आप लोगों को ग्राफ बना के दिखा सकूं सी बन एलियाज ऑफ एसएनएस लेंगे यहां पे और ग्राफ बनाने के लिए मुझे मैट पल लिप की भी जरूरत पड़ेगी तो मैट पल लिप की जरूरत पड़ेगी तो मैट पल लिप को भी ले रहा हूं यहां पर पे एंड इसके अंदर मैं पीवा प्लॉट ले रहा हूं यहां पे एलियाज ऑफ पीएटी का इस्तेमाल किया यहां पे ओके चलिए अब हम क्या करते हैं हमारे डटा सेट को लोड करते हैं तो मैंने डाटा सेट के नाम से एक वेरिएबल बनाया है पीडी डॉट यहां पर _ सीएवी के थ्रू मैं अपना डाटा सेट को लोड कर रहा हूं जो कि नाम है यहां पे लोन . सए एंड इसके साथ-साथ मैं अपना डाटा सेट जो है यहां पे इसका हेड के थ्रू तीन डाटा मैं यहां पे देखूंगा और रन करूंगा तो देखिए मेरे पास यहां पे आ चुका है एप्लीकेशन इनकम को एप्लीकेशन इनकम अब हमें जैसा कि पता है कि इसके अंदर क्या है नल वैल्यू प्रेजेंट है एप्लीकेशन और को एप्लीकेशन के अंदर तो पहले मैं नल वैल्यू को हटा देता हूं या फिर एक काम करते हैं को एप्लीकेशन इनकम के अंदर ही हम क्या करते हैं डायरेक्ट स्केलिंग लगाते हैं और इसको समझते हैं क्योंकि इसके अंदर मुझे नल वैल्यू नहीं मिलेगी क्योंकि हमें ये पता है क्योंकि हम यहां पे पहले से इसके ऊपर काम करते आ रहे हैं चलिए अब एक काम करते हैं यहां पे डटा सेट के अंदर नल वैल्यू को देख लेते हैं यहां पे तो मैं डेटा सेट के पास जाऊंगा डॉट मैं यहां पे क्या करूंगा यहां पे इस नल को कॉल करने वाला हूं यहां पे और इस नल के बाद में मैं डॉट यहां पर सम को कॉल करूंगा और जैसे ही मैं रन करूंगा यहां पे तो देखेंगे आप यहां पे कि इसके अंदर नल वैल्यू बहुत सारी प्र है और मेरा काम केवल एप्लीकेशन और को एप्लीकेशन से है तो एप्लीकेशन के अंदर आपके पास दो नल वैल्यू है हम इसे क्या करेंगे फिल कर देंगे अब फिल करने के लिए मैं डेटा सेट के पास जाऊंगा एंड उसके बाद मैं क्या करूंगा गाइ यहां पे एप्लीकेशन इनकम को कॉल करूंगा और डॉट यहां पर मैं क्या कर रहा हूं फिल एन ए फंक्शन को कॉल कर रहा हूं यहां पे और इसके अंदर मैं क्या कर रहा हूं हमारा जो डेटा सेट जो है यहां पे उसके अंदर एप्लीकेशन इनकम का क्या करने वाला हूं मैं मीन को फिल करने वाला हूं तो मैंने यहां पे मीन लिया यहां पे इसको फिल करने के लिए एंड इवन दैट मैंने यहां पे इन प्लेस इक्वल्स टू क्या कर दिया है ट्रू कर दिया है ताकि ये फिल हो सके चलिए अब मैं यहां पे चेक करूं मेरे डेटा सेट के अंदर तो अब मेरे पास कोई नल वैल्यू प्रेजेंट नहीं है एप्लीकेशन और को एप्लीकेशन दोनों में नेक्स्ट टारगेट क्या है गाइस यहां पे नेक्स्ट टारगेट है मुझे स्केलिंग करना लेकिन स्केलिंग करने से पहले मेरे डाटा का नेचर किस तरह से है वो मैं यहां पर देखना चाहूंगा मतलब क्या इसके अंदर आउटलायर प्रेजेंट है या नहीं है किस तरह का इसका नेचर है वो मुझे देखना बहुत ज्यादा जरूरी है तो इसको जरा देख लेते हैं यहां पे तो इसके लिए मैं क्या करूंगा गाइस यहां पे कि मैं यहां पे सी बन के अंदर आपके पास क्या होता है डिस प्लॉट होता है जिसके थ्रू आप क्या कर सकते हैं डिस्ट्रीब्यूशन प्लॉट्स यहां पर डिजाइन कर सकते हैं तो वो मैं प्लॉट कर जा रहा हूं यहां पे और अब मैं क्या करूंगा डेटा सेट को लूंगा यहां पे एंड देन स्क्वायर ब्रैकेट और एप्लीकेशन इनकम के अंदर जाके मैं क्या करूंगा उसका डिस्ट्रीब्यूशन प्लॉट प्लॉट करूंगा इसको देखने के लिए पीएटी डॉट मैं यहां पे शो फंक्शन को कॉल करूंगा और रन करूंगा अब मैं देखूंगा हमारे डाटा का नेचर किस तरह से है तो आप जब डाटा का नेचर को देखेंगे तो डेटा का नेचर आपके पास कुछ इस तरह से आपको देखने को मिलेगा जहां पे आपके पास क्या है इसकी टेल है मतलब इसके अंदर बहुत सारे आउटलायर प्रेजेंट है इवन दैट आप यहां पर देखेंगे तो आपके पास यहां पे जो मैग्नी ूडल सारी चीजें यहां पर देखने को मिली है अभ काम करते हैं डाटा का डिस्क्राइब देख लेते हैं कि आपका डाटा का नेचर किस तरह से चल रहा है यहां पे तो डटा सेट डॉट यहां पर मैं डिस्क्राइब करूंगा जिससे हमें यहां पे काफी चीजों को नॉलेज हो जाएगी इवन दैट मैं मीन और मीडियन स्टैंडर्ड डेविएशन भी मिल जाएगा मुझे यहां पे और मिनिमम और मैक्सिमम वैल्यू मिल जाएगी तो एप्लीकेशन इनकम के अंदर हम बात करें तो देखिए मिनिमम वैल्यू कितनी है 150 है मैक्सिमम वैल्यू कितनी है 81000 है मतलब आपके पास डाटा के अंदर आप देखेंगे तो डाटा आपका पास लार्ज अमाउंट में आपको देखने को मिल जाएगा अब मुझे यहां पे क्या करना है मेरे डाटा की स्केलिंग करनी है और स्केलिंग करके डाटा को क्या करना है रिड्यूस करना है अब स्केलिंग करने के लिए आप यहां पे डायरेक्टली मैनुअली भी कर सकते हैं लेकिन साइकेड लन आपको यहां पे एक फंक्शन प्रोवाइड करता है जिसके थ्रू आप स्केलिंग जो है वो ऑटोमेटिक भी कर सकते हैं तो मैं यहां पे साइक लन के थ्रू क्या करने वाला हूं इसकी स्केलिंग करने वाला हूं तो देखिए साइक लन के थ्रू स्केलिंग करते हैं साइक लन की स्केलिंग करने के लिए आप क्या करेंगे पहले फ्रॉम साइकल लन के अंदर चलेंगे यहां पे साइकल लन के अंदर जाने के बाद में आपको जाना है प्री प्रोसेसिंग के अंदर उसके बाद में आपको क्या करना है इंपोर्ट करना है और इंपोर्ट किसे करना है यहां पे आपको स्टैंडर्ड स्केलर को करना है तो मैंने यहां पे किसको इंपोर्ट किया स्टैंडर्ड स्केलर को इंपोर्ट कर दिया है ये मेरे पास क्या करेगा स्टैंडर्ड स्केलिंग यहां पर करने वाला है चलिए अब मैं स्टैंडर्ड स्केलिंग करने के लिए पहले मैं इसका ऑब्जेक्ट बना लेता हूं तो मैंने एसएस के नाम से इसका ऑब्जेक्ट बना लिया है और उसके बाद मैं अपने क्या कर रहा हूं स्टैंडर्ड स्केलर को कॉल कर रहा हूं यस तो मैंने स्टैंडर्ड स्केलर को कॉल कर दिया उसके बाद में मैं क्या करूंगा एसएस डॉट यहां पे मॉडल को क्या करूंगा यहां पे फिट ट्रांसफॉर्म करूंगा अब आप देखिए यहां पे चाहे तो फिट कर सकते हैं और उसके बाद ट्रांसफॉर्म कर सकते हैं या फिर ट्रांसफॉर्म एक साथ भी कर सकते हैं लेकिन जब आप मॉडल को ट्रेन करने जा रहे हैं तो उस वक्त पहले आप फिट कीजिए और उसके बाद उसको क्या करिए ट्रांसफॉर्म कीजिए तो मैं यहां पे क्या करूंगा पहले फिट करूंगा फिट करने के बाद में मुझे मेरा डेटा सेट चाहिए तो मैं डेटा सेट के पास गया देन स्क्वायर ब्रैकेट यहां पे मैंने क्या किया है अपना एप्लीकेशन इनकम का डाटा दे दिया है वो भी टू डायमेंशन के अंदर चलिए इसे रन करते हैं तो ये मेरा मॉडल जो है वो फिट हो चुका है अब उसके बाद एसस डॉट यहां पे मैं क्या करूंगा ट्रांसफॉर्म को कॉल करूंगा जिससे जो मेरा डाटा है जो मतलब स्केलिंग हुआ हुआ डटा है वो मुझे मिल पाए तो मैंने यहां पे क्या किया इसको जस्ट दोबारा वापस कॉपी कर लिया है और इस जगह पे ले जाके मैंने पेस्ट कर दिया देन रन करूंगा तो देखिए मेरा जो स्केलिंग हुआ हुआ जो डाटा है वो मुझे यहां पर देखने को मिल गया एज ए एरे फॉर्मेट के अंदर अब एक काम करते हैं इसको हम क्या कर देते हैं स्टोर कर देते हैं कहां पे हमारी डेटा सेट के अंदर तो चलिए डेटा सेट के अंदर स्टोर करता है ताकि हमें पता चल सके कि स्केलिंग होने के बाद में हमारे डटर का नेचर किस तरह से है और ग्राफिकल तौर पे किस तरह से दिखाई दे रहा है तो इसको देखने के लिए मैं क्या करूंगा गाइस यहां पे सबसे पहले क्या करूंगा कि इसको एक पांडा डटा फ्रेम में डाल देते हैं और उसके बाद जो डेटा फ्रेम मेरा तैयार होगा यहां पे उसको हम क्या करेंगे हमारी शीट में डाल देंगे तो शीट में डालने के लिए मैं डेटा सेट दैट स्क्वायर ब्रैकेट एंड उसके बाद में मेरे पास क्या है एप्लीकेशन इनकम है तो मैं एप्लीकेशन इनकम के तौर पे डालूंगा लेकिन ये स्टैंडर्ड स्केलर है तो मैं एसएस के नाम से डालूंगा अब उसके बाद मैं क्या कर रहा हूं गाइज यहां पे पीडी डॉट यहां पे इसी के अंदर डेटा फ्रेम को कॉल करूंगा डेटा फ्रेम में ये जो मेरा एरे वाला डाटा है वो चला जाएगा यहां पे देन उसके बाद में इसका नाम जाएगा नाम जानने के लिए मुझे यहां पे कॉलम डालना पड़ेगा देन मैं कॉलम का इस्तेमाल करूंगा और कॉलम के अंदर कुछ भी अभी आज प्रेजेंट x के तौर पे मैं डाल दूंगा तो ये मेरा एक डाटा फ्रेम तैयार हो जाएगा जिसके थ्रू हम यहां पे इसके अंदर डाटा ट्रांसफर कर पाएंगे देन मैं इसको क्लोज करता हूं और फिर मैं रन करता हूं तो मेरा डेटा सेट जा चुका है यहां पे एसएस के नाम से अब क्या करते हैं हमारा जो डेटा सेट है डॉट उसके बाद में हैड लगा के उसके अंदर तीन डाटा हम यहां पर रते हैं तो देखिए हमारे पास यहां पे लोन अमाउंट अभी भी वैसा का वैसा दिखाई दे रहा है लेकिन लोन अमाउंट एसस के नाम से हमने क्या किया यहां पे इसको स्टोर कर दिया डाटा को क्योंकि हमें यहां पे दिखाई देगा जो कि स्केलिंग हुआ हुआ डाटा है यहां पे और स्केलिंग का नेचर आप देखेंगे तो वो बहुत ही ज्यादा रिड्यूस हो चुका है अब मैं काम करता हूं यहां पे मेरे जो डेटा सेट है यहां पे उसका डिस्क्राइब चेक करता हूं कि इसका डिस्क्राइब क्या है यहां पे मतलब मीन क्या है स्टैंडर्ड डिवीजन क्या है वो चेक करना है तो देखिए एप्लीकेशन इनकम और एप्लीकेशन एसेस के अंदर देखेंगे यहां पे तो सबसे पहले हम मीन का कंपेयर करते हैं तो मीन आपका यहां पे फोर के आसपास यहां पे इन्होंने दिया है ठीक है लगभग लगभग ये जीरो है क्योंकि a टू द पावर -17 है यहां पे a टू द पावर -17 का मतलब है 10 टू द पावर -17 के आसपास यहां पे डाटा है और जब 10 टू द पावर -7 के 17 केप डाटा हैब इसको डिवाइड करेंगे तो 0.00 लगभग लगभग मिलेगा मतलब आपका जो मीन है वो रो के सैट्राइड आ चुका है यहां पे उसके बाद आप स्टैंडर्ड डेविएशन को देखेंगे तो स्टैंडर्ड डेविएशन के अंदर भी आपका जो आंसर है वो मिलेगा अब आप बोलेंगे वेरियंस और स्टैंडर्ड डेविएशन में क्या डिफरेंस है तो जो वेरियंस होता है वो स्टैंडर्ड डेविएशन का स्क्वायर होता है आपके पास यहां पे यदि आपके डाटा का यहां पे स्टैंडर्ड डेविएशन निकालते हैं और उसका स्क्वायर करते हैं तो आपको वेरियंस देखने को मिल जाता है अब यदि आप वन का स्क्वायर करेंगे तो आपको वन ही देखने को मिलेगा तो स्टैंडर्ड डेविएशन को यदि आप चेक करते हैं यहां पे तो स्टैंडर्ड डेविएशन आपको यहां पे क्या देखने को मिल रहा है वन के आसपास मिल रहा है अब यहां पे देखिए e टू द पावर क्या है 0 + 00 है मतलब वन के आसपास यहां पे डाटा मिल रहा है यहां पे आपके देख पाएंगे ऑब्जर्व कर पाएंगे कि वन के आसपास है अब मैं चेक करता हूं कि क्या मेरा डेटा डाटा का नेचर चेंज हुआ है क्या यहां पे मतलब डाटा का पैटर्न जो था पहले नॉर्मल डिस्ट्रीब्यूशन था लेकिन उसमें एक बहुत बड़ी टेल थी मतलब उसके अंदर आउटलायर प्रेजेंट थे अब मैं चेक करूंगा कि क्या मेरे डाटा का नेचर चेंज हुआ है इसके बाद में तो इसको भी जरा देख लेते हैं यहां पे इसको देखने के लिए मैं क्या करूंगा गाइज यहां पे कि मैं एए डॉट यहां पे डिस प्लॉट बनाने वाला हूं फिर से तो मैंने यहां पे एए ड डिस प्लॉट बनाया और डिस प्लॉट के अंदर मैंने क्या किया मेरा जो डेटा सेट है उसको लिया और इस बार मैंने एप्लीकेशन इनकम के अंदर जो एसएस वाला डाटा है उसको मैंने लिया और इसको ग्राफ को देखने के लिए मैंने पीएटी डॉट यहां पर शो फंक्शन को कॉल कर दिया अच्छा एक काम करते हैं दोनों ग्राफ पासपास बना लेते हैं बिफोर और आफ्टर मतलब पहले क्या था और अब क्या है यहां पे उन चेंजेज को हम देख लेते हैं तो उसके लिए पीएटी डॉट मैं यहां पे क्या करूंगा सब प्लॉट का इस्तेमाल करूंगा तो पीएटी डॉट मैंने क्या किया यहां पे सब प्लॉट का इस्तेमाल किया है सब प्लॉट के अंदर मैं क्या करने वाला हूं कि दोनों को पासपास रखना है मतलब नंबर ऑफ रो क्या करूंगा वन रखूंगा और कॉलम को टू कर दूंगा मतलब रो कॉमा यहां पे मैं इस्तेमाल करूंगा आपके पास यहां पे तो मुझे यहां पे क्या करना है कॉलम अ रो को वन करना है और कॉलम को क्या करना है टू करना है तो रो को वन करना है कॉलम को टू करना है तो रो रखूंगा वन कॉलम करूंगा टू और ये मिलेगा मुझे नंबर वन पोजीशन के ऊपर इसके साथ-साथ एक काम करेंगे पीएटी डॉट यहां पर मैं क्या कर रहा हूं फिर से सब प्लॉट का इस्तेमाल करूंगा यहां पे और सब प्लॉट्स के अंदर इसके बाद अब हम क्या करेंगे पीएटी ड सब प्लॉट का इस्तेमाल करेंगे और इस सब प्लॉट के अंदर मैं क्या करूंगा यहां पे गाइ कि मेरा जो ग्राफ है उसको सेकंड नंबर पे डिजाइन करूंगा तो सेकंड नंबर पे डिजाइन करने के लिए मैं यहां पे टू करूंगा और जो मेरा ऊपर वाला ग्राफ है उसका जो डाटा है उसको कॉपी करके ले आते हैं मतलब ये जो एप्लीकेशन इनकम के साथ हम बना रहे हैं इसको हम कॉपी करके लाते हैं और इसके बाद यहां पर पेस्ट कर देते हैं चलिए इसको यहां पर मैंने क्या कर दिया पेस्ट कर दिया तो मेरे पास जो मेरा डाटा है वो आ चुका है और उसका ग्राफ अब हमारे पास आने वाला है लेकिन इससे पहले मैं एक काम करता हूं थोड़ा सा टाइटल लगा देता हूं तो टाइटल लगाने के लिए मैं पीएटी डॉट यहां पे क्या इस्तेमाल करूंगा टाइटल का इस्तेमाल करूंगा और टाइटल की हेल्प से मैं टाइटल लगाने वाला हूं यहां पे और टाइटल क्या है यहां पे बिफोर तो मैं यहां पर लिखूंगा बिफोर एंड उसके बाद में लिखूंगा मैं यहां पे आफ्टर सेकंड प्लॉट में मुझे क्या लिखना है आफ्टर लिखना है तो मैं पीएटी डॉट यहां पे फिर से क्या करना हूं यहां पे टाइटल का इस्तेमाल करूंगा और टाइटल के अंदर मैं लिखा दूंगा आफ्टर तो आफ्टर ये मैंने लगा दिया है अब इस ग्राफ को क्या करते हैं रन करके शो करके देखते हैं तो ये हमारे पास कुछ इस तरह से ग्राफ दिखाई दे रहा है अब एक काम करते हैं ये ग्राफ काफी कंज ेड हो चुका है तो इस ग्राफ को थोड़ा सा बड़ा करते हैं और उसके बाद इस ग्राफ को समझते हैं कि ये ग्राफ हमें क्या डिसीजन बता रहा है यहां पे मैं अपने यहां पे कोड पे जाऊंगा यहां पे और कोड पे जाने के बाद में मैं क्या करूंगा यहां पे फिगर को कॉल करूंगा और फिगर को कॉल करने के बाद में मैं इसके अंदर करूंगा फिक्स साइज को कॉल फिक्स साइज के अंदर मैं करूंगा इसकी विड्थ बढ़ानी है मैं 10 कर देता हूं और हाइट को एज इट इज रखना है तो मैं इसको सेवन कर देता हूं तो चलिए इसे रन करते हैं फिगर के बाद में चेंज करने के बाद में हम इसे रन करते हैं और अब जरा ग्राफ को यहां पर समझते हैं तो देखिए हमारे ग्राफ को यदि हम ऑब्जर्व करें तो देखिए डेंसिटी के अंदर देखेंगे तो ग्राफ के नेचर के अंदर कोई फर्क आपको पास नहीं देखने को ला है बिफोर और आफ्टर के अंदर देखें यहां पे तो दोनों का दोनों सेम टू सेम है यहां पे ग्राफ देखिए जिस तरह पहले नेचर में था उसी तरह अभी भी नेचर के अंदर है यहां पे इवन दैट आप एप्लीकेशन इनकम को देखेंगे तो एप्लीकेशन इनकम के अंदर देखिए आपका जीरो से लगाकर 80000 का डाटा पहले था लेकिन यदि आप आफ्टर वाला डे डाटा देखेंगे तो ये -2 से लगाकर 14 तक की रेंज में अब हमारा डाटा आ चुका है यहां पे तो डटा जो है वो आपका क्या हो गया श्रिंक हो चुका है लेकिन आप नेचर को देखेंगे तो नेचर अभी भी वैसा का वैसा है यहां पे आपके पास पहले हेड था तो यहां पे भी देखेंगे आपके पास हैड है यहां पे और उसके बाद एक बहुत लंबी टेल है तो इसके अंदर भी आपको बहुत लंबी टेल देखने को मिलेगी अब आप यहां पे समझ चुके होंगे कि स्केलिंग करने से क्या फर्क पड़ता है स्केलिंग चलने से आपके डेटा का जो मैग्निटिया और यदि आप ऑब्जर्व करेंगे यहां पे तो देखिए आपका जो डाटा है वो श्रिंक हो चुका है काफी हद तक और इसका स्टैंडर्ड डिविजन वन आ चुका है और मीन की बात करें तो लगभग जीरो के करीब आपके पास देखने को मिलेगा और आज के इस वीडियो के अंदर हम बात करेंगे यहां पे मेन मैक्स स्केलिंग के बारे में जैसे नॉर्मलाइजेशन टेक्निक भी बोला जाता है ये कैसे वर्क करती है तो बेसिकली बात करें यहां पे स्टैंडर्ड स्केलिंग टेक्निक के अंदर हमने क्या देखा था कि आपके पास जो डाटा होता है उसका जो टोटल मीन होता है और जो आपके स्टैंडर्ड वैल्यू होती है उससे आप डिवाइड करते हैं तो आपका एक नया डाटा निकल के आता है जो पुराने वाले डाटा से क्या मिलता है आपको रिड्यूस होके मिलता है अब यहां पे एक बहुत ही इंपॉर्टेंट चीज है यहां पे कि आपके डाटा का जो भी नेचर होता है वो नेचर चेंज नहीं होता है नेचर जैसा पहले था वैसा का वैसा आपको बाद में भी देखने को मिलता है ये आपको मिलता है स्टैंडर्डाइजेशन टेक्निक के अंदर लेकिन जब आप यहां पे मिन मैक्स स्केलिंग का इस्तेमाल करेंगे तो इसके अंदर भी आपके पास जो डाटा का नेचर है वो जैसा था वैसा का वैसा ही दोबारा देखने को मिलता है यहां पे भी और इसके साथ-साथ एक और इंपॉर्टेंट चीज यहां पे है कि आपका जो डाटा यहां पर रिड्यूस होता है मिन मैक्स स्केलिंग के अंदर वो आपके डाटा की मिनिमम और मैक्सिमम वैल्यू के अकॉर्डिंग रिड्यूस होता है तो मतलब इसके अंदर जो आपका डाटा का रेंज मिलता है वो आपको मिलता है यहां पे रो और वन के बीच में आपको देखने को मिलता है तो इसका फार्मूला क्या रहने वाला है और ये कैसे वर्क करता है इसका ज्योमेट्री इंशन क्या है इसको जरा अब यहां पर समझते हैं तो देखिए नॉर्मलाइजेशन टेक्निक के अंदर मैं बात करूं यहां पे तो नॉर्मलाइजेशन टेक्निक के अंदर वैसे तो बहुत सारी टेक्निक्स आती है जिसके अंदर हम यहां पे फोकस कर रहे हैं मिन मै स्केलिंग के बारे में कि मिन मैक्स स्केलिंग क्या होती है तो मिन मैक्स स्केलिंग के अंदर आपके पास क्या होता है कि आपका जो भी डेटा पॉइंट है यहां पे उसके अंदर से आप क्या करते हो मिनिमम को माइनस कर देते हो और डिवाइड में क्या करते हो मैक्सिमम माइनस मिनिमम से आप फिर से डिवाइड करते हो अब ये मिनिमम माइनस मैक्सिमम है किस चीज का तो इसको समझने के लिए मैं एक काम करता हूं एक डेटा सेट का एग्जांपल लेता हूं तो मैंने क्या किया x1 एक डेटा सेट लिया इस x1 डेटा सेट के अंदर मैंने कुछ नंबर लिए हैं जैसे कि 2 3 4 5 6 और सेन अब इस डेटा सेट का जो मिनिमम वैल्यू है वो मिनिमम वैल्यू क्या है यहां यहां पे टू है और इस डेटा सेट की मैक्सिमम वैल्यू क्या है यहां पे मैक्सिमम वैल्यू सेवन है तो बस इसी के साथ हमारा वर्क होने वाला है अब इसके साथ यहां पे x1 ड का जो न्यू आपको मिलेगा वो किस तरह से मिलेगा कि आप टू में से क्या करेंगे टू को लस कर देंगे और डिवाइड में क्या करेंगे यहां पे आपको मैक्सिमम माइनस मिनिमम करना है मैक्सिमम माइनस मिनिमम का मतलब है 7 -2 आपको करना है तो आपका आंसर यहां पे रो मिलेगा इसी तरह से आपके पास क्या मिलेगा हर डेटा पॉइंट का स्केलिंग फॉर्मेट आपको देखने को मिलेगा अब यहां पे सबसे बड़ी चीज है कि आपका ये जो डाटा आपको देखने को मिलेगा इसका अर हर एक डेटा पॉइंट का जो रेंज होगा वो रो से वन के बीच में ही आपको देखने को मिलेगा इससे ज्यादा आपको डाटा नहीं देखने को मिलेगा तो अब इसका क्या है यहां पे ज्योमेट्री इंटू इसको भी जरा देख लेते हैं कि ज्योमेट्री इंटू हमारे पास किस तरह से देखने को मिलेगा तो मैं ले चलता हूं आपको ग्राफिकल तौर के ऊपर तो देखिए सबसे पहले मैं अपना ओरिजिनल डेटा सेट बनाता हूं तो देखिए ओरिजिनल जो डेटा सेट है आपके पास यहां पे वो कुछ इस तरह से आपके पास है जैसा कि ये आपके पास कुछ डाटा यहां पे पड़ा है अब यहां पे बात करें आपके पास यहां पे कि इस डेटा का आपके पास यहां पे स्केलिंग होने के बाद डेटा किस तरह से दिखाई देगा तो यदि मैं स्केलिंग होने के बाद यदि मैं डेटा की बात करूं तो डेटा जो है गाइज यहां पे वो आपके पास इस तरह से आ जाता है मतलब आपके पास ये जो जीरो है यहां पे ये जीरो पॉइंट हो गया और उसके बाद ये वन पॉइंट हो गया तो आपका डेटा पॉइंट जो है वो सारा का सारा इसके अंदर ही आपके पास आ जाता है इवन दैट यहां पे भी ये रो और वन के बीच में आपके पास आता है मैं इसको भी फिलहाल यहां से रफ करूंगा और यहां पे ही आपका जो डेटा पॉइंट है वो यहां पे लाके रख दूंगा तो आपका सारा का सारा डेटा पॉइंट जो है वो इस जगह पर आपके पास आके रुक जाएगा तो इस तरह से आपके पास क्या होती है मिन मैक्स स्केलिंग होती है चलिए अब इसे थोड़ा प्रैक्टिकली समझते हैं कि मिन मैक्स स्केलिंग कैसे परफॉर्म की जाती है मैं ले चलता हूं यहां पे आपको जुपिटर नोटबुक के ऊपर जहां पे मैं क्या करूंगा सबसे पहले हमारे पास जो भी हमारे पास रिक्वायर्ड लाइब्रेरी है उसको मैं यहां पे क्या करूंगा आपके पास इंपोर्ट करूंगा देन नेक्स्ट चीज़ क्या करूंगा मैं अपने डेटा सेट को लोड करूंगा अब डेटा सेट के अंदर मेरे को पता है कि यहां पे बहुत सारी नल वैल्यू है तो पहले मैं नल वैल्यू को हटा देता हूं या फिर एक काम करते हैं को एप्लीकेशन इनकम को लेके काम करते हैं क्योंकि कोई एप्लीकेशन इनकम के अंदर नल वैल्यू प्रेजेंट नहीं है अब ये मुझे कैसे पता चला क्योंकि हम रेगुलरली इसी डाटा के ऊपर काम कर रहे हैं जैसे कि आपने प्रीवियस वीडियो के अंदर भी देखा होगा तो वहां पे इस चीज को ऑब्जर्व कर चुके होंगे चलिए कोई बात नहीं इसे चेक कर लेते हैं यहां पे तो मैं डाटा सेट के पास जाऊंगा डॉट यहां पे क्या करूंगा इस नल को क्या करने वाला हूं मैं इस्तेमाल करने वाला हूं और डॉट सम को कॉल करूं यहां पे तो मुझे यहां पर देखने को मिलेगा यस मेरे पास जो लोन अमाउंट्स है उसके अंदर आपके पास नल वैल्यू है लेकिन को एप्लीकेशन इनकम के अंदर नहीं है और एप्लीकेशन इनकम के अंदर भी नल वैल्यू है तो मैं को एप्लीकेशन इनकम को लेके वर्क करने हूं लेकिन को एप्लीकेशन इनकम को वर्क करने से पहले मैं इसका ग्राफिकल रिप्रेजेंटेशन देखना चाहूंगा कि यह डाटा किस तरह से दिखता है इवन दैट इस डाटा का डिस्क्राइब ही पता करूंगा कि आपके पास इसके अंदर डटा के अंदर मीन वैल्यू क्या है मिनिमम वैल्यू क्या है मैक्सिमम वैल्यू क्या है और इसकी काउंटिंग क्या है ये सब चीजें देखेंगे तो इसको देखने के लिए मैं करूंगा डेटा सेट के पास जाऊंगा डॉट यहां पर मैं डिस्क्राइब को कॉल करने वाला हूं और जैसे ही मैं डिस्क्राइब को कॉल करूंगा तो मुझे वैल्यू की काउंटिंग आपको देखने को मिल जाएगी मीन वैल्यू मिल जाएगी स्टैंडर्ड वैल्यू मिल जाएगी मिनिमम वैल्यू जीरो है यहां पे और मैक्सिमम वैल्यू क्या है वन है यहां पे अब हम क्या करेंगे मिन मैक्स स्केलिंग का इस्तेमाल करते हुए इस डाटा को कंप्रेस करेंगे चलिए उससे पहले हम यहां पे इसका ग्राफिकल नीचे देख लेते हैं कि ग्राफिकल नेचर किस तरह से है तो मैं काम करता हूं इसका ग्राफिकल नेचर बनाने के लिए मैं डिस्ट प्लॉट का यूज़ करूंगा यहां पे और डिस्ट प्लॉट के अंदर मैं क्या करूंगा डेटा सेट को कॉल करूंगा और इसके अंदर मैं क्या करने वाला हूं यहां पे को एप्लीकेशन इनकम जो है हमारी इसको मैं लेने वाला हूं और इस ग्राफ को देखने के लिए मैं पीएटी डॉट यहां पे करूंगा शो फंक्शन को कॉल करूंगा जैसे ही मैं रन करूंगा मेरा ग्राफ मिल जाएगा और मेरे डाटा का मुझे नेचर देखने को मिल जाएगा ये नॉर्मल डिस्ट्रीब्यूशन क तो नहीं है लेकिन लुक लाइक नॉर्मल डिस्ट्रीब्यूशन हो सकता है यदि मैं इसमें से आउटलायर को रिमूव कर दूं और हमने जैसा पहले भी बता रखा है कि जब आप स्केलिंग करते हैं तो आउटलायर के ऊपर कोई इफेक्ट नहीं पड़ता आउटलायर आउटलायर की तरह ही होता है हां उसका जो मैग्निटिया पे तो इसके लिए आप कहां जाएंगे फ्रॉम साइक टन के अंदर जाएंगे यहां पे साइक टन के अंदर जाने के बाद आप जाएंगे प्री प्रोसेसिंग के अंदर प्री प्रोसेसिंग के अंदर जाने के बाद मैं इसके अंदर थोड़ा सा इसको ऊपर ले लेता हूं ताकि आप लोगों को थोड़ा ग्राफ वगैरह सब आराम से सब चीजें दिखने को मिले यहां पे राइट तो मुझे ये नहीं लेना चाहिए था एंड मैं इसको क्या करूंगा डिलीट कर दूंगा यस मुझे ये सब डिलीट करना पड़ेगा ओके तो देखिए अब मैं करूंगा यहां पे कि मुझे क्या करना है मिन मैक्स स्केलिंग लगानी है यहां पे तो मैं साइकल न के अंदर जाऊंगा डॉट यहां पे क्या करने वाला हूं मुझे यहां पे मुझे जाना है प्री प्रोसेसिंग के अंदर प्री प्रोसेसिंग के अंदर जाने के बाद दैट मैं यहां पे इंपोर्ट करने वाला हूं यहां पे मैं यहां पे क्या करने वाला हूं मिन मैक्स स्केलर को कॉल करने वाला हूं तो ये मेरा मिन मैक्स स्केलर कॉल हो चुका है उसके बाद में मैं यहां पे करूंगा एमएस के नाम से एक वेरिएबल बना लूंगा जो कि होगा मेरा ऑब्जेक्ट उसके बाद मैं करूंगा मिन मैक्स स्केलर को दोबारा यहां पे कॉल करूंगा और उसके बाद एमएस के अंदर डॉट करके मैं मॉडल को क्या करने वाला हूं फिट करने वाला हूं फिट के अंदर जाके क्या करूंगा मेरा जो डेटा सेट है उसको मैं लूंगा एंड उसके बाद में मैं क्या करूंगा यहां पे को एप्लीकेशन इनकम को यहां पे लगा दूंगा अब एक चीज का ध्यान रखिएगा यहां पे जो आपका डाटा देना होता है वो टू डायमेंशन डेटा सेट के ऊपर वर्क करता है तो मैं टू डायमेंशन डेटा सेट दूंगा और ये मेरा मॉडल जो है वो फिट हो चुका है अब फिट होने के बाद में मुझे क्या करना है इस मॉडल को ट्रांसफॉर्म करना है तो एमएस डॉट यहां पे मैं करने वाला हूं ट्रांसफॉर्म करने वाला हूं और ट्रांसफॉर्म के अंदर मेरा जो ये डाटा है मैं इसको जस्ट कॉपी करके वापस ले आता हूं क्योंकि मुझे इसी डाटा को ट्रांसफॉर्म करना है तो मैं इसको ले जाके क्या करूंगा ट्रांसफॉर्म के ऊपर ले जाके रन कर दूंगा जैसे रन करूंगा मेरा जो डाटा है वो यहां पे स्केल हो चुका है यहां पे अब स्केल होने के बाद मैं क्या करते हैं इस डेटा सेट को हमारे ओरिजिनल डेटा सेट के अंदर रिप्लेस कर देते हैं देखिए ओरिजिनल डेटा सेट में रिप्लेस करने के लिए मैं क्या करूंगा यहां पे डेटा सेट के अंदर जाऊंगा देन स्क्वायर ब्रैकेट और मैं क्या कर रहा हूं को एप्लीकेशन इनकम का यहां पे स्केलिंग कर रहा हूं और वह कौन सी यहां पर है स्केलिंग मिन मैक्स स्केलिंग है तो रन करेंगे तो यह वहां पे जाके डेटा लोड हो जाएगा अब एक काम करते हैं डाटा सेट केप चलते हैं डॉट यहां पर हैड लगा के आपके पास यहां पे तीन डाटा को देखते हैं तो जैसे मैं इसके तीन डाटा को देखूंगा तो देखिए सबसे पीछे-पीछे मुझे को एप्लीकेशन इनकम के अंदर मुझे मीन मैक्स स्केलिंग के अंदर जो डाटा है वह मुझे देखने को मिल जाएगा अब यहां पे मेरा जो डाटा है वह स्केलिंग हो चुका है देखिए कंपैटिबल बात करें यहां पे तो पहले ज़ीरो था अभी भी ज़ीरो है पहले आपका यहां पे 1500 था अब यहां पे देखेंगे तो 0.36 है मतलब आपकी वैल्यू काफी हद तक रिड्यूस हो चुकी है अब मुझे क्या करना है इसको ग्राफिकल तौर पे देखना है कि क्या मिन मैक्स स्केलिंग अब यहां पे आपके डाटा के नेचर को चेंज कर पाई है या नहीं कर पाई है तो हमें पता है कि डेटा के नेचर को चेंज नहीं करती है तो इसको हम देख भी लेते हैं इसके लिए मैं पीएटी डॉट सबसे पहले फिगर का इस्तेमाल करूंगा यस फिगर का इस्तेमाल करके मैं जो फिक्स साइज है उसको बढ़ाऊ ताकि मेरा जो ग्राफ है वो अच्छे से दिखाई दे यहां पे और फिगर जो साइज है यहां पे वो मैं करने वाला हूं यहां पे 10 अराउंड फाइव करने वाला हूं यहां पे उसके बाद में नेक्स्ट चीज जो है मेरे पास यहां पे वो क्या है मैं यहां पे सब प्लॉट का इस्तेमाल करूंगा ताकि मैं एक साथ दो-तीन प्लॉट को कंपेयर कर सकूं ताकि मैं यहां पे दोनों प्लॉट में कंपेयर कर सकूं तो मैं सब प्लॉट का इस्तेमाल करूंगा नंबर ऑफ रो एक कर दूंगा कॉलम दो कर दूंगा और वन पोजीशन पे है यहां पे उसके बाद मुझे क्या करना है टाइटल लगाना है पीएटी डॉट मैं क्या कर रहा हूं यहां पे टाइटल का इस्तेमाल कर रहा हूं और टाइटल के अंदर मैं लिख देता हूं बिफोर कि ये मेरे पहले का डायग्राम है यहां पे बिफोर लेने के बाद में मैं करूंगा यहां पे एसए डॉट यहां पे डिश प्लॉट इस्तेमाल करूंगा डिश प्लॉट से मैं अपने ग्राफ को आसानी से देख पाऊंगा तो उसके लिए मैं करूंगा य यहां पे डेटा सेट के अंदर जाऊंगा देन स्क्वायर ब्रैकेट और मुझे क्या करना है को एप्लीकेशन इनकम को यहां पे लेना है यहां पे देन नेक्स्ट अब मैं वापस आता हूं पीएटी डॉट यहां पे फिर से सब प्लॉट को कॉल करता हूं यहां पे और सब प्लॉट के अंदर मैं क्या करता हूं आफ्टर लिख देता हूं तो ए एफटीआर आफ्टर लिख दिया मैंने यहां पे आफ्टर लिखने के बाद में मैं लिख रहा हूं यहां पे पीएटी डट सब प्लॉट लिखना है और सब प्लॉट में मुझे प्लॉटिंग नंबर देना है यहां पे तो मैं प्लॉटिंग नंबर यहां पे दे चुका हूं टू नंबर पीएटी डॉट मैं चलता हूं टाइटल के अंदर टाइटल के अंदर मैं लिख देता हूं यह क्या है आपका आफ्टर है तो मैंने यहां पे ले लिया आफ्टर आफ्टर लेने के बाद में मैं यहां पे कर रहा हूं एए डॉट यहां पे डि प्लॉट फिर से दोबारा यूज और डिस्ट प्लॉट के अंदर जाके मेरे पास जो डेटा सेट है यहां पे इस डेटा सेट का को एप्लीकेशन इनकम जो है यहां पे उसकी मिन मैक्स स्केलिंग का जो डाटा है वो मैं यहां पे लेने वाला हूं उसके बाद मैं क्या कर रहा हूं गाइस यहां पे इस ग्राफ को शो करते हैं तो पीएटी डॉट मैं यहां पे क्या कर रहा हूं शो फंक्शन का कॉल करके इसको रन करूंगा तो यहां पे छोटी सी मिस्टेक बता रहा है कहीं पे अ फिगर साइज के अंदर अच्छा यह मेरा जो डटा है यहां पे मुझे एज ए टपल के तौर पे मुझे देना चाहिए था एंड उसके बाद मैं इसे रन करते हैं तो मेरा जो ग्राफ है वो मुझे दिखाई देगा ओके तो देखिए अब आप यहां पे अपने डाटा को ऑब्जर्व करेंगे तो आपके डाटा का जो नेचर पहले था वो का वो नेचर अभी भी आपको सेम टू सेम देखने को मिल रहा है पहले जो डेटा था वो आपका जीरो से लगा के 40000 तक का डाटा आपके पास देखने को मिल रहा था लेकिन अब जो डेटा की रेंज है वो जीरो से लगा के क्या हो गई है वन के बीच में आपके पास आ चुकी है मतलब आपका सारा का सारा जो डाटा है वो जीरो और वन के अंदर क्या हो चुका है रिड्यूस हो चुका है जैसा कि आप इस ग्राफ के जरिए देख पा रहे हैं तो आई थिंक आई होप सो समझ में आ चुका होगा कि मिन मैक्स स्केलिंग कैसे इस्तेमाल की जाती है और आज के इस वीडियो के जरिए हम डुप्लीकेट डाटा को हैंडल करना सीखेंगे अब देखिए डाटा क्लीनिंग के प्रोसीजर के अंदर डुप्लीकेट डटा को हटाना हमारे लिए बहुत ज्यादा जरूरी हो जाता है यदि आप डेटा सेट के अंदर डुप्लीकेट डाटा को नहीं हटाएंगे तो यह आपके लिए आगे चलते हुए कहीं ना कहीं प्रॉब्लम क्रिएट कर सकता है मशीन लर्निंग की एल्गोरिथम्स के अंदर या फिर आपके पास डेटा सेट्स के अंदर यदि आपके डुप्लीकेट्स कंटेंट है तो आपके डेटा सेट्स को बल्की डाटा में कन्वर्ट कर देता है और उसे मशीन लर्निंग एल्गोरिथम को प्रोसेस होने में टाइम लगता है और वो डाटा हमारे लिए इतना काम का भी डाटा नहीं होता है क्योंकि वो डाटा एकदम रिपीटेड डाटा है अब रिपीटेड डटा का मतलब ये नहीं है कि किसी भी पर्टिकुलर कॉलम के अंदर कोई डटा मेरा रिपीट हो रहा है तो वो रिपीटेड डाटा कहलाएगा नहीं हमारे पास पूरी की पूरी होती है यदि वो डुप्लीकेट है मतलब जितने भी कॉलम है उसके अंदर जितनी भी रोज आ रखी है यहां पे उस रो के अंदर कोई भी डाटा वापस दोबारा रिपीट कर रहा है दैट इज कॉल ऑफ डुप्लीकेट डाटा अदर वाइज यहां पे हम इसे डुप्लीकेट डाटा नहीं बोलने वाले हैं तो बेसिकली इस डुप्लीकेट डाटा को हमें रिमूव करना होता है तो अब इस वीडियो के जरिए हम ये पहले जानेंगे कि डुप्लीकेट डाटा को किस तरीके से हैंडल करना है देन सेकंड चीज हम ये जानेंगे कि इस डुप्लीकेट डाटा को किस तरीके से रिमूव करना है चलिए तो हम चलते हैं जुपिटर नोटबुक के अंदर और डुप्लीकेट डाटा को समझते हैं यदि आपको पाइथन मशीन लर्निंग डेटा साइंस एंड डेटा एनालिस जैसी फील्ड में अपने आपको को ग्रो करना है तो इसके लिए डब्लू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जवाइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं अभी देखिए मैं डायरेक्टली डुप्लीकेट डाटा के ऊपर काम नहीं करूंगा मतलब किसी भी बड़े डेटा सेट के ऊपर काम नहीं करने वाला हूं मैं पहले क्या करता हूं एक छोटा सा डेटा सेट लेता हूं या मैं खुद डेटा सेट यहां पर क्रिएट करने जा रहा हूं ठीक है उसके अंदर पहले मैं आपको डुप्लीकेट डाटा के बारे में समझाऊं और डुप्लीकेट डाटा को रिमूव करूंगा फिर हम बड़े डटा सेट के साथ यहां पर डुप्लीकेट डाटा को रिमूव करने का प्रोसेसर समझने वाले हैं तो चलिए उसके लिए हम क्या करते हैं इंपोर्ट कैसे करते हैं यहां पे पांडा एलियाज ऑफ पीडी को हम इंपोर्ट करते हैं अब एक काम करते हैं एक डेटा सेट क्रिएट करते हैं डेटा सेट क्रिएट करने के लिए मैं क्या करता हूं डेटा नाम से एक वेरिएबल बनाता हूं और एक डिक्शनरी क्रिएट करता हूं जिसके अंदर हम क्या लेंगे हमारे नेम्स लेंगे कुछ यहां पर और उसके बाद में हम क्या करने वाले हैं उसी के कुछ इंग्लिश हिंदी और मैथ्स के कुछ मार्क्सस लेने वाले है तो मैं काम करता हूं इंग्लिश के मार्क्स ले लेता हूं यहां पे यस अ इंग्लिश के मार्क्स ले लेता हूं यहां पे एंड इंग्लिश के मार्क्स लेने के बाद मैं यहां पर ही हम क्या करते हैं हिंदी के भी मार्क्स ले लेते हैं हिंदी के भी कुछ मार्क्स मैंने यहां पे ऐड कर दिए बस इसके अंदर हम क्या करेंगे हमारा डाटा सेट तो तैयार करेंगे अब देखिए नेम के अंदर हम क्या करते हैं कुछ नेम लेते हैं जस्ट लाइक ए एक नेम ले लिया मैंने यहां पे यस एक काम करते हैं यहां पे तो मैंने क्या किया यहां पे ए एक नेम ले लिया उसी के बाद में हमने क्या किया यहां पे बी के नाम से एक नेम ले लिया उसके बाद मैंने c नाम से एक नेम ले लिया एंड उसके बाद मैंने डी नाम से एक नेम ले लिया अब मैंने क्या किया डुप्लीकेट डाटा बनाने के लिए मैंने a वापस डाल दिया है यहां पे और मैंने c को भी वापस डाल दिया है अब चलिए नंबर्स की बारी यहां पे तो नंबर्स में से आउट ऑफ 10 नंबर ले रहा हूं जस्ट लाइक देखिए एट लिया मैंने यहां पे और उसके बाद में मैंने यहां पे सेवन लिया फिर फाइव लिया फिर एट लिया फिर नाइन ले लिया अब अच्छा एक काम करते हैं नंबर ऑफ डेटा काउंट करते हैं तो 1 2 3 और 36 है और यहां पे भी मेरे पास सिक्स डाटा होना चाहिए इवन दैट मेरा डुप्लीकेट डाटा भी होना चाहिए तो a के अंदर मैंने डुप्लीकेट कर दिया है c के अंदर मैंने डुप्लीकेट नहीं करना चाहूंगा ठीक है तो c के अंदर मैं क्या करूंगा डुप्लीकेट नहीं करना चाहूंगा ताकि मैं आप लोगों को बता सकूं कि किस कंडीशन के अंदर आप डुप्लीकेट डाटा बोलेंगे और किस कंडीशन के अंदर आप डुप्लीकेट डाटा नहीं बोलने वाले हैं तो चलिए मैं अब फिर से कुछ डाटा ले लेता हूं जस्ट लाइक देखिए यहां पे 2 3 4 5 यस ये मैंने ले लिया यहां पे उसके बाद मैंने दोबारा फिर से टू ले लिया फिर सिक्स और सेवन ले लिया अब ये हमारे पास क्या हो गया हमारा डेटा तैयार हो गया अब एक काम करते हैं डटा फ्रेम तैयार करते हैं डटा फ्रेम तैयार करने के लिए पीडी डॉट में डटा फ्रेम का इस्तेमाल करने हूं और यहां पर मेरा जो डाटा है इसको मैं पास करूंगा चलिए अब हम इसे रन करते हैं रन करने के बाद में हम क्या करते हैं डीएफ को प्रिंट करते हैं और डीएफ को जैसे प्रिंट करेंगे हमारा डेटा सेट आ चुका है अब देखिए जरा हम यहां पे डाटा को नोटिस करते हैं तो देखिए हमारे पास जो ए वाला कॉलम है यस जो हमारा जीरो नंबर कॉलम है जिसके अंदर a है एट है और टू है और इवन दैट हम फोर नंबर कॉलम को भी देखेंगे तो इसमें भी क्या है a है एट है और टू है तो इसका मतलब क्या हो गया कि हमारे पास जीरो नंबर जो रो है और जो फोर्थ नंबर रो है इसके अंदर हमारा डुप्लीकेट डाटा प्रेजेंट है इवन दैट अब आप देखेंगे यहां पे सेकंड नंबर रो के अंदर तो सेकंड नंबर रो के अंदर देखिए आपका जो नेम है वो सी है और यहां पे भी आपका नेम सी दे रखा है तो इसका मतलब ये डुप्लीकेट कंटेंट नहीं है अब एक काम करते हैं यहां पे फाइव है तो मैं इसको भी क्या करता हूं एक बार के लिए फाइव कर देता हूं और फिर मैं आपको बताता हूं कि इसे हम डुप्लीकेट बोलेंगे या नहीं बोलेंगे तो मैंने इसे फाइव किया और फिर से रन किया तो अब देखिए आपके जो सेकंड कंटेंट है और जो फिफ्थ नंबर कंटेंट है इसके अंदर हमारे पास दो कॉलम आपके पास क्या है सेम टू सेम है लेकिन यदि आप लास्ट वाले कंटेंट को देखेंगे तो वो आपके पास जो डाटा है वो सेम नहीं है इसका मतलब ये डुप्लीकेट कंटेंट्स हमारे पास नहीं है तो डुप्लीकेट कंटेंट की बात करें तो हमारे पास कौन सा है केवल जीरो नंबर रो है और उसी के करेस्पॉन्डिंग्ली केट है अब हम इसे कैसे पहचानेंगे तो आप क्या करेंगे डीएफ डॉ आप क्या करेंगे यहां पे डुप्लीकेट्स को कॉल करेंगे जैसे ही आप डीएफ डॉ डुप्लीकेट्स करेंगे तो ये आपको ट्रू एंड फाल्स के तौर पे दिखा देगा कि कौन-कौन से डुप्लीकेट्स है और कौन-कौन से डुप्लीकेट्स नहीं है तो इसने अभी हमें जस्ट बता दिया है कि फोर्थ नंबर जो आपका कॉलम है वो डुप्लीकेट है एक काम करते हैं इसको डीएफ के अंदर सेव कर लेते हैं ताकि हमें पता चल सके कि आपका कौन-कौन सा डुप्लीकेट है और कौन-कौन सा नहीं है तो मैं मैं यहां पे क्या कर रहा हूं आपके पास यहां पे डुप्लीकेट्स के नाम से ही इसमें क्या कर रहा हूं कॉलम्स डिजाइन कर रहा हूं चलिए अब डुप्लीकेट्स के नाम से कॉलम डिजाइन करने से क्या होगा कि मुझे इमीडिएट पता चल जाएगा कि कौन-कौन सा डुप्लीकेट्स है और कौन-कौन सा नहीं है तो जैसे ही रन करूंगा तो देखिए जहां-जहां आपका फॉल्स लगा रहा है इसका मतलब वहां डुप्लीकेट्स नहीं है और जहां हमारे पास ट्रू आ चुका है इसका मतलब ये जो डाटा है वो कहीं ना कहीं रिपीट हुआ है अब ये डटा हमें पता है कि ये जीरो नंबर पे रिपीट हो रहा है जैसा कि हमें यहां पर पता भी चल रहा है कि जीरो नंबर पे ये डाटा रिपीट हो रहा है इसलिए हमारे पास क्या आ चुका है ट्रू आ चुका है मैं यहां पे देखिए फाइव नंबर को कह रहा था कि ये डुप्लीकेट नहीं है देख कि फाइव नंबर जो है वो सेकंड नंबर से मैच कर रहा था लेकिन एक लास्ट कॉलम के मैच नहीं होने से ये डुप्लीकेट नहीं आया तो आप ये चीज यहां पे नोटिस भी कर पाएंगे कि देखिए आपके पास जो सेकंड नंबर जो कंटेंट है इसके अंदर देखिए आपका जो दो कॉलम है उनका डटा तो एज इट इज सेम है बट जो लास्ट वाला जो डाटा है उसका जो कॉलम है उसके अंदर जो डाटा है वो आपके पास अलग है यहां पे डेटा जो है वो अलग है तो इस वजह से हम यहां पे क्या बोलेंगे ये डाटा जो हमारे पास है वो डुप्लीकेट कंटेंट्स नहीं रखता है य अब हम क्या करते हैं हम इस डाटा को चेंज कर देते हैं जस्ट लाइक मैं एक काम करता हूं इस डाटा को कर देता हूं फोर अब रन करता हूं और अब रन करता हूं तो देखिए आपका जो सेकंड नंबर है और फिफ्थ नंबर है वो दोनों सेम हो चुके हैं अब मैं डुप्लीकेट कंटेंट को रेडी करता हूं और फिर से रेडी करता हूं तो देखिए लास्ट वाली जो दो लाइंस है वो मेरी डुप्लीकेट्स हैं और वो मुझे यहां पे आईडेंटिफाई भी करके बता रहा है और वो क्यों कर रहा है क्योंकि यहां पे आपका जो डाटा की रो है पूरी की पूरी वो डुप्लीकेट्स है इस वजह से हमें ये क्या कर रहा है ट्रू कर रहा है अच्छा एक काम करते हैं फिर से इसे चेंज कर देते हैं चलिए रन करते हैं फिर रन करते हैं फिर रन करते हैं और फिर रन करते हैं अब डुप्लीकेट टर्न होने से हमारे पास यहां पे हमें कोई ज्यादा बेनिफिट नहीं मिलने वाला है क्यों नहीं मिलने वाला क् देखिए ये जो रो हमको इंफॉर्मेशन देगी वही रो हमें यहां पे ऊपर वाली जो रो है वो भी इंफॉर्मेशन दे चुकी है तो पहली तो आपके पास है कि ये कोई ज्यादा अच्छी इंफॉर्मेशन नहीं देने वाला है कभी-कभी आपके पास मशीन लर्निंग में ऐसे भी मॉडल्स आपको मिलेंगे जहां पे डुप्लीकेट कंटेंट होने की वजह से आपके पास जो मॉडल है उसी के ऊपर प्रॉपर्ली ट्रेंड हो जाएंगे ऐसा मिलता है आपको क्लासिफिकेशन के अंदर क्लासिफिकेशन जब एनालिसिस करते हैं तो उस वक्त क्या होता है कि जब आपके पास डुप्लीकेट कंटेंट होता है तो वो क्या करता है डुप्लीकेट कांट के ऊपर ही आपका मॉडल ट्रेन हो जाता है वो डाटा के जो नेचर्स है उसे यहां पे अडॉप्ट कर लेता है और मशीन लर्निंग मॉडल को उसी के ऊपर बना लेता है तो इस वजह से डुप्लीकट कंटेंट हमें हटाना जरूरी हो जाता है कि हमें हमारे जो फीचर्स है वो हमें डिफरेंट डिफरेंट देना है ताकि अच्छे से मशीन लर्निंग मॉडल जो है वो डिफरेंट डिफरेंट पैटर्स के ऊपर आपका ट्रेंड हो सके और हमें एक अच्छा मॉडल यहां पर दे सके तो इसीलिए हम क्या करते हैं डुप्लीकेट जो डाटा होता है उमें हटाते हैं अब डुप्लीकेट डाटा हटेगा कैसे तो इसके लिए बहुत सिंपल है यहां पे डीएफ के अंदर ड्रॉप डुप्लीकेट लगाएंगे और यहां पे क्या करेंगे कीप यहां पे क्या करेंगे फर्स्ट कर देंगे तो एफ आई आर एसटी फर्स्ट लिख देता हूं यहां पे और रन करता हूं ओके तो यहां पे हमें हमारे जो डुप्लीकेट्स हैं वो हमें मिल चुके हैं तो अब हम क्या करते हैं इसमें से डुप्लीकेट्स हटाते हैं डुप्लीकेट हटाने से पहले आप क्या करें कि ये जो डुप्लीकेट्स नाम का जो आपने कॉलम बनाया है इसे पहले आप यहां से डिलीट कर दें मतलब मैं इसे क्या कर रहा हूं यहां से कट कर रहा हूं और ये जो डीएफ है इसको भी हम कट कर रहे हैं और वापस जाके हम क्या कर रहे हैं इसे रिसेट कर रहे हैं तो हमारा जो डीएफ है वो हमें आ चुका है और हमें दिखाई दे रहा है अब इसमें से हम डुप्लीकेट्स को हटाना चाहेंगे तो मैं यहां पे क्या करूंगा डीएड क्या करूंगा यहां पे ड्रॉप डुप्लीकेट्स को मैं कॉल करने वाला हूं जैसे ही मैं ड्रॉप डुप्लीकेट्स को करूंगा तो ये क्या करेगा डुप्लीकेट्स को रिमूव कर चुका है जैसे देखिए आपका रो आ चुका है फिर वन आ चुका है फिर टू आ चुका है थ्री आ गया थ्री के बाद सीधा फाइव लेके आया है जो फोर्थ नंबर वाली जो रो है वो आपका डुप्लीकेट्स हटा चुकी है अब हम क्या करना चाहते हैं इसको हमारे ओरिजिनल डेटा सेट के साथ रखना चाहते हैं इसके साथ-साथ देखिए यहां पे क्या है आपको कीप भी मिलेगा कीप आपके पास इसलिए आता है जैसे मान लीजिए एक से ज्यादा डुप्लीकेट्स हुआ और उसमें से जो पहला डुप्लीकेट्स है वो आपको यहां पे रखना है तो आप यहां पे क्या करते हैं कीप फर्स्ट का इस्तेमाल कर सकते हैं तो ये हमारा डुप्लीकेट जो है वो हट चुका है यहां पे अब डुप्लीकेट हटने के बाद में हम क्या करने वाले हैं गाइस यहां पे इसको इंप्लेस कर देते हैं इंप्लेस इसलिए करते हैं क्योंकि हमारा जो ओरिजिनल डाटा है उसके अंदर जाके ये क्या होना चाहिए रिप्लेस हो जाना चाहिए तो इसके लिए हम क्या करते हैं इंप्लेस करते हैं जैसे ही हम इंप्लेस करेंगे तो ये हमारे पास जो ओरिजनल डेटा सेट है उसमें से डुप्लीकेट्स हटा चुका है और वहीं पे उस डटा सेट के अंदर जाके रिप्लेस भी हो चुका है तो इस तरह से आप अपने डाटा में से डुप्लीकेट्स वैल्यू को हटा सकते हैं चलिए अब हम काम करते हैं यहां पे कि हम ओरिजिनल जो डेटा सेट होता है कट अब हम यहां पे काम करते हैं कि अब हम हमारे पास जो डेटा सेट्स हमें कंपनी के थ्रू मिलता है उसके अंदर से डुप्लीकेट निकालते हैं और फिर उसमें से ड्रॉप करते हैं तो देखिए मैं चलता हूं आपको डाटा सेट के ऊपर लेके और देखिए हमें यहां पे लोन . सए के ऊपर हम बहुत पहले से काम कर रहे हैं तो अब हम क्या करेंगे इसी में से हम क्या करेंगे डुप्लीकेट्स को हटाएंगे और इसी के अंदर से हम क्या करेंगे डुप्लीकेट्स को देखेंगे अभी तो मैं एक काम करता हूं इस डेटा सेट को लेके चलता हूं जुपिटर नोटबुक के अंदर और वहां पे मैं डुप्लीकेट्स को हटाता हूं तो देखिए अब हम क्या करेंगे सबसे पहले हम हमारा डाटा सेट के नाम से एक वेरिएबल बना लेते हैं उसके बाद पीडी डॉट यहां पर _ सीएसवी के थ्रू हमारी जो सीएसपी फाइल है उसे लोड कर लेते हैं और हमारी सीएसपी फाइल का नाम है यहां पे लोन . सीएवी उसको मैं लगा लेता हूं यहां पे और मैं अपना जो डाटा सेट है इसे मैं देख लेता हूं के अंदर क्या करता हूं डॉट हैड लगा के तीन डाटा मैं यहां पे देखता हूं तो मुझे मेरा डाटा मिल चुका है अब हम क्या करना चाहते हैं इसमें से डुप्लीकेट्स को फाइंड आउट करना चाहते हैं तो अब हम क्या करेंगे डुप्लीकेट्स को देखने के लिए क्या करेंगे यहां पे आपके पास डटा सेट को कॉल करेंगे और डॉट यहां पे क्या करना है डुप्लीकेट्स को कॉल करना है और डुप्लीकेट्स को जैसे ही कॉल करेंगे तो ये हमें बता देगा कि इसके अंदर डुप्लीकेट्स है या नहीं है फिलहाल सभी के अंदर फॉल्स निकल ज आ रहा है इसका मतलब ट्स नहीं है और आप यहां पे यदि बड़े डाटा सेट को नहीं देख पा रहे हैं तो आप इस तरह से भी पता लगा सकते हैं कि आपके डाटा के अंदर डुप्लीकेट्स है या नहीं है किस तरह से आप अपने डटा सेट को लीजिए यहां पे डॉट यहां पे क्या कीजिए शेप को कॉल कर दीजिए जैसे ही आप यहां पे शेप को कॉल करेंगे तो आपके पास नंबर ऑफ रो एंड नंबर ऑफ कॉलम आपको मिल जाएगा अब क्या करें यहां पे आप अपने डटा सेट को फिर से दोबारा लीजिए एंड उसके बाद आप क्या करें ड्रॉप डुप्लीकेट्स को कॉल कर दीजिए जैसे ही आप डॉप डुप्लीकेट को करेंगे और उसके बाद आप यहां पे इन प्लेस इक्वल्स टू ट्रू करेंगे तो यदि आपके पास जो नया वाला डाटा सेट जो आने वाला है उसके शेप के अंदर यदि आपको चेंजेज देखने को मिले इसका मतलब डेफिनेटली उसके अंदर कोई डुप्लीकेट वैल्यू थी और वह अब हट चुकी है तो उसको कैसे देखेंगे डॉट यहां पे सेव दोबारा लगाएंगे रन करेंगे तो देखिए डुप्लीकेट हटाने के पहले और डुप्लीकेट अह हटाने के बाद में यदि आप डाटा को देखेंगे तो इसके अंदर कोई चेंजेज नहीं आया है पहले भी आपके 618 रोज थी और 13 कॉलम थे अभी भी 618 रोज और 13 कॉलम हमें दिखाई देने को दिखाई दे रहे हैं इसका मतलब क्या हो गया गाइज यहां पे कि हमारे डाटा सेट के अंदर कोई भी डुप्लीकेट कंटेंट नहीं था तो अब हमने क्या किया डुप्लीकेट वैल्यू को किस तरह से हटा सकते हैं ये हमने यहां पे समझा अब हटाना क्यों जरूरी है तो वो मैं आपको बता चुका हूं कि काफी मशीन लर्निंग ऐसे मॉडल्स होते हैं जहां पे यदि आप डुप्लीकेट कंटेंट देंगे तो वो मशीन लर्निंग मॉडल उसी के ऊपर प्रॉपर ट्रेंड हो जाता है तो इससे आपके पास कोई दूसरे फीचर के ऊपर वो परफेक्टली ट्रेन नहीं हो पाता है और जब आप यहां पे कोई दूसरे फीचर का कोई डाटा उसे देते हैं तो वो उसे सही तरीके से आइडेंटिफिकेशन डुप्लीकेट्स वैल्यू को हटाते हैं और आज के इस वीडियो के जरिए हम दो टॉपिक को कवर करने वाले हैं पहला हम यहां सीखेंगे कि डटा को रिप्लेस कैसे किया जाता है क्योंकि डेटा क्लीनिंग के अंदर डेटा रिप्लेस करना हमारे लिए बहुत ज्यादा जरूरी होता है जब हमारे पास मिक्स डाटा आता है सेकंड चीज हम यहां पे ये देखेंगे कि यदि हमने डाटा रिप्लेस कर दिया है तो यदि हमें उस डाटा की डेटा टाइप को चेंज करना पड़े तो हम उस डेटा टाइप को किस तरह से चेंज कर सकते हैं ये देखने वाले हैं इससे पहले हम देखते हैं कि मिक्स डाटा किस तरह से आपका पास दिखाई देता है ले चलता हूं मैं आपको अपने सिस्टम के अंदर और सिस्टम के अंदर हम आने के बाद देखिए हमारे पास लोन ड सीएवी है ये फाइल एक्सल की इसी के ऊपर हम प्रॉपर्ली वर्क कर रहे हैं और इसी के अंदर हम देखते हैं मिक्स डाटा हमारे पास कहां मिल रहा है तो देखिए जो आपका डिपेंडेंस है इस डिपेंडेंट को यदि आप गौर से देखेंगे तो इसके अंदर आपके पास क्या आ रहा है 01 01 01 आ रहा है इसका मतलब प्रॉपर्ली सभी तरीके से नंबर्स यहां पे चल रहे हैं लेकिन अचानक से आप यहां पे देखेंगे प्लस थ आ चुका है जो कि ये नंबर्स को बिलोंग नहीं करता है ये कैटेगरी कल डाटा है यहां पर डाटा हमारे पास दो तरी का होता है एक नंबर डाटा होता है और दूसरा कैटेगरी कल डाटा होता है जिससे हम ऑब्जेक्ट टाइप का डाटा यहां पर बोलते हैं तो बेसिकली यहां पे अचानक से एक कैटेगरी कल डाटा आ गया जो कि प्लस थ है तो इस तरह से आपके भी डेटा सेट के अंदर कोई ऐसे अनवांटेड डाटा आ सकता है जो कि उस डेटा टेबल को मिसमैच कर रहा हो यहां पे इसको हम बोलते हैं मिक्सड डेटा टाइप जहां पे आपका दोनों डाटा जो है वो मिक्स्ड फॉर्मेट के अंदर आपको देखने को मिलेगा अब जब आपके पास डाटा मिक्स्ड फॉर्मेट में मिलता है तो आप क्या करते हैं सब सबसे पहले हम क्या करेंगे कि ये जो प्लस थ जो लिखा हुआ है डाटा इसे हम कन्वर्ट करेंगे देन सेकंड चीज इसका जो डेटा टाइप है वो आपको मिलेगा ऑब्जेक्ट टाइप का उसे हम कन्वर्ट करके इंटी जर फॉर्मेट के अंदर कन्वर्ट करेंगे तो ये प्रोसीजर हमारा यहां पे इस सिचुएशन में रहने वाला है अब आपके डेटा सेट के ऊपर डिपेंड करेगा कि आप किस तरह से उसे हैंडल करते हैं तो चलिए जरा इसको समझते हैं यहां पे कि ये किस तरह से वर्क करता है तो मैं आ चुका हूं जुपिटर नोटबुक के अंदर जुपिटर नोटबुक के अंदर आने के बाद सबसे पहले मैं इंपोर्ट करूंगा किसे पांडा एलियाज ऑफ पीडी को क्योंकि हम अपने डटा सेट को लोड करा सकें फिर उसके बाद क्या कर रहा हूं यहां पे डटा सेट्स के नाम से एक वेरिएबल बना रहा हूं जहां पे पडी ड यहां पर रीड की सीएसवी की हेल्प से मैं लोन ड सीएसवी जो हमारी है यहां पे उसे मैं लोड कर रहा हूं उसके बाद मैं यहां पे फिर से डाटा सेट को कॉल कर रहा हूं और हैड करते हुए यहां पे इसके तीन डाटा को देखूंगा इसके अंदर डिपेंडेंस के अंदर हमारे पास क्या है मिक्स टाइप का डाटा दिख रहा है अब एक काम करते हैं इसके अंदर हम क्या करते हैं इसकी डेटा टाइप को चेक करते हैं कि पहले इसकी डेटा टाइप क्या है डेटा टाइप को चेक करने के लिए आप क्या करेंगे डेटा को कॉल करेंगे डॉट यहां पे इंफो को लगा देंगे इंफो क्या करेगा हमें सारी इंफॉर्मेशन दे देगा कि इसके अंदर किस तरह की डेटा टाइप्स है इवन दैट इसके अंदर नल वैल्यू प्रेजेंट है या नहीं है तो देखिए यहां पर हम आ चुके हैं इसके अंदर हम डिपेंडेंस के अंदर जाएंगे डिपेंडेंस के अंदर आपके पास देखिए पहले तो नल वैल्यू है क्योंकि हमारे पास टोटल जो डाटा है वो 618 के अराउंड डाटा यहां पर है और जबकि डिपेंडेंस के अंदर आप देखेंगे तो 603 डेटा ही यहां पर है सेकंड चीज देखिए ये ऑब्जेक्ट टाइप का डाटा है जबकि हमारे पास यहां पे क्या चल रहा है नंबर्स चल रहे हैं तो इसको इंटी जर फॉर्मेट में या फ्लोटिंग फॉर्मेट में होना चाहिए था जबकि आप यहां पर देख पाएंगे कि ये फ्लोटिंग फॉर्मेट में नहीं है ये ऑब्जेक्ट टाइप का डाटा है मतलब एक कैटेगरी कल डाटा यहां पे दिख रहा है तो अब हम क्या करेंगे इसे कन्वर्ट करेंगे सबसे पहले इसकी मिसिंग वैल्यू को फिल करते हैं देन उसके बाद कन्वर्जन करते हैं अच्छा इसके साथ-साथ देखते हैं इसमें किस-किस तरह का डाटा यहां पर प्रेजेंट है और इसकी नल वैल्यू भी देखते हैं कि कितने परसेंट नल वैल्यू यहां पर है तो वन बाय वन सबी चीजों को देखते हैं तो सबसे पहले मैं क्या करता हूं यहां पे डेटा सेटस जाता हूं यहां पे एंड देन डॉट मैं यहां पे करूंगा इ नल को कॉल करूंगा ताकि मैं नल वैल्यू को चेक कर सकूं और उसके बाद डॉट सम लगाते हुए मैं इसकी नल वैल्यू को टोटल काउंटिंग करूंगा तो देखिए डिपेंडेंस के अंदर 15 कॉलम्स ऐसे हैं डिपेंडेंस के अंदर 15 रोज ऐसी है जिसके अंदर नल वैल्यू प्रेजेंट है मतलब 15 सेल्स भी इसे बोल सकते हैं चलिए अब हम काम करते हैं इसके अंदर डिफरेंट डिफरेंट डाटा है उनको देखते हैं कि ये कितने कितने तरीके डाटा है मतलब यूनिक डाटा क्या है यहां पर वो भी देख लेते हैं तो पहले तो मुझे यहां पे देखिए डिपेंडेंस के अंदर जाना पड़ेगा और उसके बाद में मैं यहां पे लगाऊंगा वैल्यू कं जैसे ही मैं वैल्यू काउंट लगाऊंगा यहां पे तो मुझे देखने को मिल जाएगा कि किस तरह का डाटा यहां पे प्रेजेंट है तो देखिए जीरो जो है वो काफी बार रिपीट हो रहा है वन रिपीट हो रहा है टू रिपीट हो रहा है और 3 प्लस रिपीट हो रहा है तो अब इस सिनेरियो के अंदर हम क्या करेंगे कि पहले तो मिसिंग वैल्यू को फिल करेंगे किससे जीरो से अच्छा एक और चीज यहां पे कि मैं मिसिंग वैल्यू को किस तरीके से फिल करूंगा तो बेसिकली मैं यहां पे मोड की हेल्प से फिल करने वाला हूं और इसके पीछे रीजन क्या है यहां पे कि देखिए ये डाटा हमारे पास न्यूमेरिकल डाटा है यदि मैं इसको कंसीडर करूं आपके पास यहां पे कैटेगरी कल डाटा के अंदर या ऑब्जेक्ट टाइप के डाटा के अंदर तब भी मैं यहां पे मॉड फिल करूंगा यदि मैं न्यूमेरिकल टाइप के डाटा मैं कंसीडर करूं यहां पे तो न्यूमेरिकल टाइप में ये डिस्क्रीट टाइप का डाटा है तो इसलिए हम यहां पे मॉड फिलिंग करेंगे तो फटाफट से मड फिलिंग कर लेते हैं इसके अंदर तो मैं क्या करूंगा डेटा सेट के पास जाऊंगा और यहां पे जाके मैं डिपेंडेंस को कॉल करूंगा उसके बाद मैं यहां पे फिने को कॉल करूंगा ताकि मैं डेटा सेट डाटा जो है वो फिल हो जाए फिल एने के अंदर जाने के बाद मैं फिर से डेटा सेट के पास जाऊंगा देन स्क्वायर ब्रैकेट और कहां जाने वाला हूं डिपेंडेंस के अंदर जाने वाला हूं देन डॉट यहां पे मैं मोड को कॉल करने वाला हूं और मड के अंदर स्क्वायर ब्रैकेट ऑफ जीरो से इसे फिल करूंगा देन उसके बाद में मैं इन प्लेस इक्वल्स टू ट्रू करूंगा अब ये फिल करने का क्या तरीका है क्या प्रोसेसर है इसके लिए हमने डेडिकेटेड वीडियो बना रखी है आप उस वीडियो को चेक आउट कर सकते हैं और आप फिल कैसे कर सकते हैं उसके डिफरेंट डिफरेंट तरीके को भी समझ सकते हैं चलिए अब आते हैं वापस अपने पॉइंट पे तो मैं यहां पे चलता हूं और देखता हूं इसके अंदर कोई नल वैल्यू प्रेजेंट नहीं है अब मुझे क्या करना है मुझे इस + 3 को रिप्लेस करना है अच्छा + 3 को यदि आप देखेंगे गौर से तो तो आप एक चीज नोटिस करेंगे कि जो प्लस थ है उससे पहले कोई थ्री ऑप्शन नहीं आ रखा है तो हम यहां पर प्लस थ को थ्री कर सकते हैं या फिर ये जो प्लस 3 है इसे फोर भी बना सकते हैं लेकिन देखिए आपकी जो काउंटिंग चल रही है वो 0 वट चल रही है लेकिन थ्री नहीं है बीच में और डायरेक्टली प्लस 3 आ चुका है तो इस प्लस 3 को थ्र कर देते हैं ताकि हमें अच्छे से रिजल्ट देखने को मिले तो पहले मैं क्या करूंगा इसे रिप्लेस करूंगा तो रिप्लेस कर देते हैं यहां प रिप्लेस करने के लिए क्या करेंगे डेटा सेट के पास जाएंगे और यहां पे मैं डिपेंडेंस को वापस कॉल करूंगा उसके बाद मैं यहां पे करूंगा रिप्लेस ओके तो मैं यहां पे यूज कर रहा हूं रिप्लेस फंक्शन का ताकि मैं इसे रिप्लेस कर सकूं तो मैंने रिप्लेस फंक्शन को कॉल कर दिया आप यहां पे रिप्लेस फंक्शन के अंदर आपको सबसे पहले ये बताना पड़ता है कि आप किसको रिप्लेस कर रहे हैं सेकंड चीज आप किससे रिप्लेस कर रहे हैं तो चलिए मैं यहां पे क्या करने वाला हूं कि जो थ प्लस लिखा है इसे रिप्लेस कर रहा हूं और इसे किससे रिप्लेस कर रहा हूं थ्री से अब आप लोगों को एक कंफ्यूजन होगा कि मैं डाटा दे रहा हूं यहां पे स्ट्रिंग फॉर्मेट में जबकि ऊपर चला नंबर फॉर्मेट में तो अभी तक हमने डेटा टाइप को को कन्वर्जन नहीं किया है डेटा टाइप अभी भी हमारी कैसी है ऑब्जेक्ट टाइप की डेटा टाइप है इसका मतलब स्ट्रिंग टाइप का डाटा ही इसके अंदर जाने वाला है चलिए तो मैं इसको थ्री से वापस रिप्लेस करने वाला हूं अब मैं क्या करूंगा यहां पे इन प्लेस इक्वल टू ट्रू कर दूंगा इन प्लेस इक्वल टू ट्रू इसलिए करते हैं ताकि हमारे पास ओरिजिनल डाटा के अंदर रिप्लेसिंग हो जाए ना कि एक्सल शीट के अंदर की बात कर रहा हूं यहां पे जो डाटा लोड हो रहा है उसके अंदर रिप्लेस हो जाए चलिए इसे रन करते हैं तो हमारा डाटा रिप्लेस हो चुका है वापस वैल्यू काउंट्स के ऊपर जाके एक बार फिर से रन करेंगे तो देखिए + 3 हमारा कन्वर्जन हो चुका है थ्री के अंदर अच्छा डटा टाइप को यदि हम फिर से देखें यहां पे तो डेटा टाइप अभी भी हमारे पास डिपेंडेंस वाले किस तरह की है ऑब्जेक्ट टाइप की डेटा टाइप यहां पे शो कर रहा है अब इस ऑब्जेक्ट टाइप की डेटा टाइप को हमें कन्वर्ट करना पड़ेगा किसके अंदर इंटी जर डेटा टाइप के अंदर या फिर फ्लोटिंग के डाटा के अंदर तो मैं इसे इंटी जर डेटा टाइप के अंदर कन्वर्ट करूंगा किस तरह से करते हैं इंटी जर डेटा टाइप के अंदर तो आप चलिए डेटा डेटा सेट के अंदर चलिए देन उसके बाद में आप डिपेंडेंस को कॉल कर दीजिए उसके बाद में यहां पे एएस डेटा टाइप आपके पास फंक्शन होता है जिसके थ्रू आप डेटा टाइप को कन्वर्जन कर सकते हैं इसके अंदर आपको बताना होता है कि आप किससे डेटा टाइप से कन्वर्जन कर र हैं तो फिलहाल मैं इंटी जर 64 बिट से इसे कन्वर्जन करने वाला हूं देन रन करूंगा तो ये मेरा सारा डाटा जो है वो इंटी जर फॉर्मेट में कन्वर्ट हो चुका है मैं इसे वापस अपनी ओरिजिनल पोजीशन से रिप्लेस कर देता हूं चलिए रन करते हैं तो हमारा डटा टाइप जो है वो रिप्लेस हो चुका है अब एक बार फिर से देख लेते हैं कि हमारा डाटा किस तरह से दिखाई दे रहा है और उसकी डटा टाइप क्या है डॉट इनो लगाते हैं यहां पे और इंफो लगा के मैं यहां पे रन करता हूं तो देखिए आपके पास जो डिपेंडेंस है वो अब बन चुका है इंटी जर 64 बिट्स का डाटा हमारे पास यहां पे इवन दैट यहां पे आप नंबर्स को भी देखेंगे तो नंबर्स आपके पास 0 1 2 3 आ चुका है तो जब भी आपके पास मिक्स डाटा यदि आपको देखने को मिले तो उनको हैंडल करने के लिए आप रिप्लेस का इस्तेमाल कर सकते हैं और फिर आपके जो डेटा टाइप है उसको नंबर्स में कन्वर्ट करने के लिए या किसी और फॉर्मेट में कन्वर्ट करने के लिए आप एएस टाइप का इस्तेमाल कर सकते हैं अच्छा नंबर फॉर्मेट में हम क्यों इस्तेमाल कर रहे हैं क्योंकि मशीन लर्निंग एल्गोरिथम हम आगे जाक इस्तेमाल करने वाले हैं इसी डेटा सेट के ऊपर तो मशीन लर्निंग एल्गोरिथम होती है एक मैथमेटिकल फार्मूला उस मैथमेटिकल फार्मूला के अंदर हमें नंबर्स की जरूरत होती है ना कि हमें कैटेगरी कल डाटा की जरूरत होती है तो इसीलिए हम इसे नंबर्स में कन्वर्ट करते हैं और इसीलिए मैंने यहां पे इंटी जर 64 बिट्स में मैंने इसे कन्वर्ट किया चाहता तो मैं यहां पे फ्लोटिंग 64 बिट्स में भी कन्वर्ट कर लेता लेकिन हां मैं ऑब्जेक्ट टाइप के अंदर इसे नहीं रख सकता था और आज के इस वीडियो के जरिए हम बात करेंगे फ फंक्शन ट्रांसफॉर्मेशन के बारे में देखिए फंक्शन ट्रांसफॉर्मेशन क्या काम करता है कि आपके पास कोई भी आपका डेटा सेट है उस डेटा सेट में जो भी कॉलम्स आप इस्तेमाल करना चाहते हैं उसके अंदर यदि आपके पास नॉन नॉर्मल डिस्ट्रीब्यूशन डाटा है और उसे आप नॉर्मल डिस्ट्रीब्यूशन डाटा में कन्वर्ट करना चाह रहे हैं तो उसके लिए आप फंक्शन ट्रांसफॉर्मेशन लगाते हैं अब इसके अंदर आप किसी भी तरह के फंक्शंस को यूज करके आप फंक्शन ट्रांसफॉर्मेशन लगा सकते हैं या फिर काफी बार क्या होता है कि आपका जो डाटा का पैटर्न होता है वो काफी बड़ा होता है आप स्केलिंग करके भी देखते हैं त भी आपका डटा का पैटर्न चेंज नहीं हो पाता है तो आप यहां पे लोगरिथम में भी उसे कन्वर्ट कर सकते हैं काफी बार आपके पास क्या होता है कि आपके पास सेल्सियस का डाटा होता है या सेंटीमीटर में डाटा होता है आप उसे मीटर में या फिर आप केल्विन में कन्वर्ट करना चाहते हैं मतलब आप अपने डाटा का पैटर्न चेंज करना चाहते हैं तो उसके लिए भी आप फंक्शन ट्रांसफॉर्मेशन का इस्तेमाल करते हुए आप डाटा के पैटर्न को चेंज कर सकते हैं अब ये किस तरह से काम करता है किस तरह से वर्क फ्लो है इसका इसको जरा यहां पे अब डिटेल के साथ समझते हैं यदि आपको पाइथन मशीन लर्निंग डेटा साइंस एंड डेटा एनालिस जैसी फील्ड में अपने आपको को ग्रो करना है तो इसके लिए ड कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो मैं आ चुका हूं अपने जुपिटर नोटबुक के ऊपर और इसके लिए मैं यहां पे इसे समझाने के लिए मैं एक डटा सेट का इस्तेमाल कर रहा हूं और उस डेटा सेट का नाम है लोन सवी आप सबको पता है हम इसके ऊपर पहले से काम करते आए हैं और इसके अंदर हमारे पास काफी मैसी डाटा है यहां पर जिसको हम काफी तर अलग-अलग तरीके से फिल्टर करके इसको क्लीन करने की कोशिश कर रहे हैं अब इसके अंदर हमें पता है कि को एपली और एप्लीकेशन इनकम दो ऐसे डेटा सेट है जो कि आपके पास क्या है यहां पे कि नॉन नॉर्मल डिस्ट्रीब्यूशन डेटा है अब हम इसे क्या करेंगे नॉर्मल डिस्ट्रीब्यूशन डेटा में कन्वर्ट करने की कोशिश करेंगे अब देखिए डायरेक्टली आप इसे नॉर्मल डिस्ट्रीब्यूशन डाटा के अंदर कन्वर्जन नहीं कर सकते हैं तो इसके लिए आप फंक्शन ट्रांसफॉर्मेशन का इस्तेमाल करते हुए आप इसे कन्वर्ट कर सकते हैं इसके लिए आप डिफरेंट डिफरेंट टाइप के फंक्शंस को इस्तेमाल करके इसके ऊपर वर्क कर सकते हैं चाहे आप पावर का फंक्शन इस्तेमाल कर सकते हैं चाहे लॉग का फंक्शन इस्तेमाल कर सकते हैं या फिर अपना कोई कस्टमाइज फंक्शन का भी इस्तेमाल करके काम में ले सकते हैं अब ये वर्किंग किस तरह से होने वाला है चलो इसको डिटेल के साथ समझते हैं तो मैं ले चलता हूं जुपिटर नोटबुक के अंदर यहां पे सबसे पहले क्या करूंगा मैं इंपोर्ट करूंगा किसे पांडा को मैं इंपोर्ट करने वाला हूं एस लगा के पीडी एंड देन उसके बाद में हम यहां पे डाटा सेट को लोड करेंगे डटा सेट को लोड करने के लिए मैं पीडी डॉट यहां पर र सीएवी का इस्तेमाल करूंगा और यहां पे मैं लोन डॉट जो सीएसवी हमारे डटा सेट है यहां पे उसे मैं ले लूंगा उसके बाद में मैं अपने डेटा सेट को यहां पे कॉल करूंगा और डॉट हैड लगाते हुए मैं इसका तीन डाटा यहां पे देखने वाला हूं अब एक काम करते हैं मुझे ग्राफ वगैरह बनाने की जरूरत भी पड़ेगी यहां पे तो इसके लिए मैं इंपोर्ट करूंगा कैसे बन को इंपोर्ट करूंगा एलियाज ऑफ मैं यहां पे एसएनएस लेने वाला हूं इसके साथ-साथ मैं यहां पे इंपोर्ट करने वाला हूं किसे मैट पलर लिप को इंपोर्ट करने वाला हूं और मैट पल लिप के अंदर जाके डॉ पवा प्लॉट एंड एलियाज ऑफ यहां पे हम इस्तेमाल करेंगे पीएटी का तो यहां पे मेरे पास जो प्लॉटिंग लाइब्रेरी है वो भी सारी आ चुकी है अब एक काम करते हैं कि मेरे पास यहां पे जो को एप्लीकेशन इनकम है इसी के अंदर मेरे पास नन वैल्यू नहीं है मतलब मिसिंग वैल्यू नहीं है तो हम इसी का इस्तेमाल करेंगे आप चाहे तो मिसिंग वैल्यू को देख सकते हैं मिसिंग वैल्यू को देखने के लिए डटा सेट डॉट यहां पर आप इनल का इस्तेमाल कीजिए यहां पे एंड उसके बाद में आप डॉट सम लगाते हुए आप यहां पे अपना डाटा देख सकते हैं इसी के अंदर हमारे पास देखिए कि हमारे पास को एप्लीकेशन इनकम है जिसके अंदर मिसिंग वैल्यू नहीं है तो हम इसका इस्तेमाल करने वाले हैं क्योंकि ये न्यूरल डाटा भी है अब ये हमारे पास क्या है एक नॉन गाउ शयन डिस्ट्रीब्यूशन डाटा है मतलब नॉन नॉर्मल डिस्ट्रीब्यूशन डाटा यहां पे अब इसको देखने के लिए मैं इसका ग्राफ का इस्तेमाल करूंगा तो उसके लिए एसएस डॉट मैं क्या करने वाला हूं यहां पे डिस्ट प्लॉट का इस्तेमाल करूंगा डिस्ट प्लॉट के अंदर क्या करूंगा कि मेरा जो डेटा सेट है उसको लूंगा यहां पे एंड देन उसके बाद में मैं क्या करने वाला हूं को एप्लीकेशन इनकम जो हमारी है उसे मैं यहां पे चूज करने वाला हूं को एप्लीकेशन इनकम चूज करने ने के बाद में मैं पीएटी डॉट यहां पर शो फंक्शन को कॉल करूंगा एंड देन रन करूंगा तो देखिए मेरे पास एक नॉन नॉर्मल डिस्ट्रीब्यूशन डाटा है जिसको आप यहां पर आराम से देख पा रहे हैं कि इसके अंदर बहुत बड़ी एक हेड है एंड उसके बाद इसके टेल को देखेंगे तो टेल इसकी काफी लंबी यहां पर दिखाई दे रही है काफी बहुत ज्यादा हद तक लंबी है यहां पे इसका मतलब इसके अंदर आउटलायर प्रेजेंट है यहां पे तो मैं इसका क्या करूंगा डाटा की जो साइज है इसको कम करके देखूंगा कि क्या पता है यहां पे ये नॉर्मल डिस्ट्रीब्यूशन में कन्वर्ट हो जाए या फिर हम डिफरेंट डिफरेंट टाइप के फंक्शंस को भी इस्तेमाल करके इसमें काम कर सकते हैं आप चाहे तो इसके अंदर पहले आउटलायर को रिमूव कर लें एंड देन उसके बाद आप यहां पे इसके ऊपर वर्क कर सकते हैं तो एक काम करते हैं हम यहां पे क्या करेंगे पहले आउटलायर को रिमूव करेंगे क्योंकि देखिए आउटलायर का जो डाटा है यहां पे वो नॉर्मल डिस्ट्रीब्यूशन कन्वर्ट करने में आपके पास यहां पे प्रॉब्लम कर सकता है तो मैं यहां पे पहले आउटलायर को रिमूव करूंगा एंड देन उसके बाद में जो हमारे पास बचा हुआ डाटा होगा उसके अंदर मैं फंक्शन ट्रांसफॉर्मेशन लगाते हुए इसे नॉर्मल डिस्ट्रीब्यूशन में कन्वर्ट करने वाला हूं तो मैं यहां पे क्या करूंगा सबसे पहले आउटलायर को रिमूव करूंगा आउटलायर को रिमूव करने के लिए मैं आई क्यूआर मेथड का इस्तेमाल करने वाला हूं अब ये आईक्यू आर मेथड होता क्या है यह कैसे काम करता है इसके लिए हमने डेडिकेटेड वीडियो बना रखी है आप वहां जाके इसे आराम से चेक आउट कर सकते हैं चलिए अब हम आई क्यूआर मेथड का इस्तेमाल करते हैं आई क्यूआर मेथड को इस्तेमाल करने के लिए मुझे यहां पे क्या चाहिए एक q1 चाहिए का q1 चाहिए इसके लिए मैं क्या करूंगा डटा सेट को कॉल करूंगा एंड देन मैं यहां पे को एप्लीकेशन इनकम को कॉल करने वाला हूं इसके अंदर मैं क्या करूंगा यहां पे कंटल को कॉल करूंगा इसके लिए मैं यहां पे क्या करने वाला हूं यहां पे इसकी क्वांटल को लगाने वाला हूं तो यहां पे मैं क्वांटल को क्वांटल लूंगा यहां पे और क्वांटल कन से लूंगा 0.25 25 ऑफ क्वांटल लूंगा उसके बाद मैं यहां पे क रहा हूं q3 लूंगा q3 के लिए मैं क्या करूंगा फिर से मैं डेटा सेट के पास जाऊंगा यहां पे एंड देन इसके अंदर मैं जाके को एप्लीकेशन इनकम को कॉल करने वाला हूं उसके बाद डॉट यहां पे फिर से मैं क्वांटल को कॉन करने वाला हूं यहां पे एंड कंटल कौन सी होगी 0 प आपकी 75 पर कंटल होगी यहां पे उसके बाद में मुझे क्या निकालना है आ क निकालना है तो मैंने आ क आ नाम से एक वेरिएबल बना रखा है इसके लिए मैंने क्या किया है यहां पे q3 माइनस यहां पे q1 का इस्तेमाल कर रखा है तो यहां से मेरा आ क आ जाएगा अब मुझे मिनिमम एंड मैक्सिमम वैल्यू निकालनी पड़ेगी तो मैं इसको रेंज का इस्तेमाल करेंगे इसके लिए हम क्या करेंगे q1 - आपके क्या करेंगे 1.5 * आ क तो मैं यहां पे 1.5 * यहां पे आ क आ का इस्तेमाल करने वाला हूं इसके साथ-साथ यहां पे मैक्स रेंज का भी इस्तेमाल करूंगा मैक्स अंडरस्कोर रेंज का इस्तेमाल करूंगा इसके लिए मैं क्या करूंगा यहां पे q3 प्लस यहां पे ब्रैकेट क्लोज एंड 1.5 * मैं यहां पे इस्तेमाल करने वाला हूं आई क्यूआर का तो ये मिनिमम और मैक्सिमम रेंज भी आ चुकी है अब देखिए यहां पे देखिए मिनिमम रेंज को यदि मैं प्रिंट करता हूं मन अ r को प्रिंट करूं एंड इसके साथ-साथ मैक्स अंड r को इस्तेमाल करूं यहां पे तो देखिए मिनिमम रेंज जो है वो नेगेटिव है मैक्सिमम रेंज आपके पॉजिटिव है तो मैं मैक्सिमम रेंज का इस्तेमाल करते हुए आउटलायर को फटाफट रिमूव कर लेता हूं तो इसके लिए मैं करूंगा डेटा सेट को फिर से कॉल करूंगा और यहां पे मैं फिर से अपने आप अपने डेटा सेट को कॉल करूंगा और मैं को एप्लीकेशन इनकम के जो डटा है उसको कॉल करूंगा एंड देन इक्व लेस दन कर लेते हैं यहां पे लेस दन और इक्वल्स टू ले लेते हैं यहां पे किसको लेंगे यहां पे मै अ r को कॉल करेंगे तो मै r को कॉल करने के बाद में मेरे पास डाटा मेरे पास इस तरह से दिखाई देगा अब इसको हम क्या करेंगे हमारे ओरिजिनल डेटा सेट से रिप्लेस कर लेते हैं ताकि मुझे बार-बार यहां पे से बार-बार कॉल करने की जरूरत ना पड़े तो मैंने इसे ओरिजिनल डेटा सेट से रिप्लेस कर दिया है अब जाके इसके ग्राफ को च बार चेक करते हैं फिर से तो रन करें तो देखिए इसमें से आउटलाइन हट चुका है और एक नॉन नॉर्मल डिस्ट्रीब्यूशन डाटा हमें यहां पर दिखाई दे रहा है जो कि एक गौशियन कर्व की तरह तो नहीं बन पा रहा है अब यहां पे देखिए आपके पास बहुत सारे छोटे-बड़े कर्व बन रहे हैं और काफी हद तक हमारा जो डटा है वो आ चुका है अच्छा देखिए ये जो रेंज है वो 57 तक रेंज होनी चाहिए थी लेकिन हां उससे आसपास की रेंज देखी है हमारा काम चल जाएगा अब देखिए यहां पे हम इसे नॉर्मल डिस्ट्रीब्यूशन में कन्वर्ट करना चाह रहे हैं इसके लिए हम यहां पे फंक्शन ट्रांसफॉर्मेशन का इस्तेमाल करेंगे फंक्शन ट्रांसफॉर्मेशन कैसे काम करता है तो उसके लिए हम हमें जरूरत पड़ेगी साइक लर्न की लाइब्रेरी की तो मैं क्या करूंगा फ्रॉम सबसे पहले जाऊंगा साइकल लन के पास यहां पे डॉट यहां पर प्री प्रोसेसिंग के पास जाऊंगा प्री प्रोसेसिंग में जाने के बाद मैं इंपोर्ट करने वाला हूं यहां पे किसे फंक्शन ट्रांसफॉर्मेशन को तो देखिए मैंने फंक्शन ट्रांसफॉर्मेशन को यहां पे रन कर दिया फंक्शन ट्रांसफॉर्मेशन में मुझे यहां पे क्या करना पड़ेगा इसका एक ऑब्जेक्ट बनाना पड़ेगा तो मैंने एटी के नाम से एक ऑब्जेक्ट तैयार किया और मैं फंक्शन ट्रांसफॉर्मेशन क्लास है इसे कॉल कर रहा हूं देखिए फंक्शन ट्रांसफॉर्मेशन की जैसे ही आप क्लास को कॉल करते हैं तो सबसे पहले आपके पास मांगा जाता है आपका फंक्शन कि आप कौन से फंक्शन को यहां पे अप्लाई करना चाह रहे हैं आप यहां पे अपना कस्टमाइज फंक्शन भी बना सकते हैं जो भी इसके अंदर आप आराम से फंक्शन बनाना चाहे वो फंक्शन बना सकते हैं तो फिलहाल मैं यहां पे क्या कर रहा हूं लॉग का फंक्शन को यहां पे यूज़ करूंगा अब ये लॉग का फंक्शन कैसे बनता है यहां पे तो इसको जरा समझते हैं यहां पे तो लॉग के फंक्शन को बनाने के लिए मुझे नपाई की जरूरत पड़ेगी तो मैं ऊपर जाके सबसे पहले इंपोर्ट करता हूं नपाई को तो यहां पे मैं क रहा हूं इंपोर्ट करूंगा यहां पे किसे नपाई को कॉल करूंगा और नपाई एलियास ऑफ मैं यहां पे एनपी रखने वाला हूं अब नेक्स्ट मुझे फंक्शन तैयार करना है फंक्शन तैयार करने के लिए मैं करूंगा यहां पे सबसे पहले मैं फंक्शन को कॉल करूंगा जो कि यहां पे मुझे दे देना है यहां पे फंक्शन लगा दिया है फंक्शन लगाने के बाद में मैं np1 पे आप लॉग को कॉल करेंगे तो देखिए log1 p को आप इस्तेमाल करना है अब देखिए लॉग 1 p का मतलब क्या हो रहा है देखिए लॉग बेस 10 का भी इस्तेमाल कर सकते हैं लॉग बेस e का भी इस्तेमाल कर सकते हैं देखिए लॉग बेस 10 का इस्तेमाल करेंगे और यदि मान लीजिए आपके पास यहां पे जीरो आ चुका है किसी कंडीशन के अंदर तो किसी कंडीशन के अंदर यदि आपका रो आ रखा है तो लॉग 0 की वैल्यू आपके पास यहां पे वर्क नहीं करती है यदि आप लॉग 0 लगाते हैं लॉग बेस 10 लगाइए लगवा c लगाइए जीरो वैल्यू देता है तो वहां पे आप प्रॉपर्ली वर्क नहीं कर पाता है यहां पे आप क्या करेंगे कि आपका जो डेटा है यहां पे उस डाटा में से आप वन को लेस करेंगे तो आपके पास यहां पे एक नॉर्मल वैल्यू आपके पास आ जाएगी तो कभी केस आपके पास इन केस यदि आपके डटा के अंदर जीरो प्रेजेंट हो रहा है तो उस वक्त भी आप चाहते हैं कि आपका डाटा जो है वो वर्किंग करता रहे एरर ना आपके शो तो इसके लिए आप वन प का इस्तेमाल करते हैं चलिए लॉग 1 प यहां पे क्यों दे रहे हैं लॉग बेस 10 क्यों नहीं दे रहे हैं इसको जरा समझते हैं देखिए आपके डेटा सेट के अंदर आपके पास डाटा के अंदर आपको पता नहीं है कि आपका डाटा क्या आने वाला है आपका डाटा जीरो से स्टार्ट होके आपका किसी भी डेटा पॉइंट पे जा सकता है मतलब किसी भी नंबर पे जा सकता है इंफिनिटी तक भी जा सकता है यहां पे डटा तो बेसिकली बात करें तो आपका डटा जीरो से स्टार्ट होता है अब जीरो से स्टार्ट होता है तो यदि आप लॉग बेस जीरो लेते हैं पले आप बेस के अंदर 10 लीजिए 10 बेस 0 आप इस्तेमाल कीजिए तब भी आपका डटा इंफिनिटी पे चला जाएगा या ई बेस के साथ भी आप जीरो का इस्तेमाल करेंगे तब भी आपका डाटा इंफिनिटी बन जाएगा तो उस केसेस में आपके पास क्या होगा आपको इंफिनिटी मिलने वाला है अब इंफिनिटी आपके पास कोई अनडिफाइंड चीज है यहां पे और वो आपके डेटा सेट को खराब कर सकती हैं तो इसीलिए हम यहां पे p -1 का इस्तेमाल करते हुए हम मतलब हमारे पास जो भी डाटा है उसमें से -1 का इस्तेमाल करते हुए काम में ले रहा है अब ये इसको जरा प्रैक्टिकली समझते हैं तो देखिए मैं कैलकुलेटर ओपन कर रहा हूं और कैलकुलेटर के अंदर देखिए मैं यहां पे देखिए लॉग का इस्तेमाल कर रहा हूं अब ये जो लॉग है यहां पे ये लॉग बेस 10 है यहां पे तो मैं यहां पे रो लिखूंगा एंड लॉग करूंगा यहां पे तो देखिए इनवैलिड इनपुट आ रहा है मतलब आपके पास इंफिनिटी की तरफ जा रहा है इनवैलिड आपके पास यहां पे इसके साथ-साथ यदि आप यहां पे जीरो लेके आप इनफ का इस्तेमाल करेंगे तब भी आपके पास क्या है इनवैलिड इनपुट है मतलब ये भी आपका इंफिनिटी बना रहा है आपके पास यहां पे तो कुल मिला के बात करें यहां पे कि लॉग बेस 10 लीजिए या e लीजिए आपके पास जीरो आता है तो ये इंफिनिटी की तरफ चला जाता है और ये कोई डिजर आउटपुट आपको नहीं देता है तो इसीलिए हम यहां पे वन प का इस्तेमाल कर रहे हैं वन प क्या कर रहा है यहां पे p -1 का आपका आउटपुट दे रहा है मतलब आपका डेटा पॉइंट के अंदर से वन को लस किया जा रहा है ताकि आपके पास यहां पे रिजल्ट जो है आपका सही बन सके और ये हमें पता है हमारे जो को एप्लीकेशन इनकम है इस को एप्लीकेशन इनकम के अंदर डेटा जीरो है लेकिन आपको कभी-कभी नहीं पता होता कि को एप्लीकेशन इनकम के अंदर डेटा जीरो है या नहीं है तो फिर उस केसेस में आप इसका इस्तेमाल कर सकते हैं अब देखिए मैंने लॉग बेस 10 का इस्तेमाल लॉग बेस का इस्तेमाल कर लिया यहां पे उसके बाद मैं एटी का यहां पे करूंगा यहां पे फिट करूंगा ठीक है उसके बाद मैं एटी डॉट यहां पे क्या कर रहा हूं यहां पे फिट का इस्तेमाल करूंगा फिट के अंदर क्या करूंगा अपना डेटा दूंगा अब डेटा देने के लिए मैं क्या करूंगा डेटा सेट का कॉल करूंगा और इसको मैं क्या करूंगा यहां पे को एप्लीकेशन इनकम को कॉल करने वाला हूं तो जो हमारी को एप्लीकेशन इनकम है अब एक काम कीजिएगा यहां पे इसको डबल स्क्वायर ब्रैकेट के अंदर दीजिएगा ताकि आपका पास यहां पे टू डायमेंशन डेटा सेट यहां पे जा सके आपका डाटा फिट हो चुका है लॉग बेस के अंदर यहां पे आपका डाटा ट्रांसफॉर्म भी हो चुका है उसके बाद एटी डॉट मैं यहां पे करूंगा यहां पे आपका ट्रांसफॉर्म करूंगा डाटा को मैंने ट्रांसफॉर्म का इस्तेमाल किया है और ट्रांसफॉर्म के अंदर जो मेरा डेटा सेट है इसी को मैंने दोबारा वापस अपना डाटा दे दिया है अब जैसे मैं यहां पे रख के रन करूंगा यहां पे तो हमारा डाटा ट्रांसफॉर्म होके हमारे सामने आ चुका है अब ये जो ट्रांसफार्म हो जो डाटा है यहां पे एक काम करता हूं मैं इसे यहां पे सेव कर लेता हूं इसे सेव करने के लिए मैं करूंगा डेटा सेट के पास वापस जाऊंगा यहां पे एंड देन मैं एक नया कॉलम बनाऊंगा जो कि होगा को एप्लीकेशन इनकम के साथ में लेकिन ये आपका टीएफ होगा मतलब ट्रांसफॉर्म डाटा होगा अब हम यहां यहां पे क्या करेंगे साइड बाय साइड ग्राफ को कंपैरिजन करेंगे कि ये किस तरह से हमारे पास शो करता है तो देखिए पहले हमारे पास क्या था डेटा सेट जो था प्लॉट उसको भी मैं ले लेता हूं यहां पे एंड देन जो मेरा यहां पे ट्रांसफॉर्म हुआ डाटा है उसी को भी हम प्लॉट कर लेते हैं अब देखिए मुझे दो अलग-अलग प्लॉट बनाना है तो उसके लिए मुझे सब प्लॉट का इस्तेमाल करना पड़ेगा तो पीएटी डॉट मैं यहां पे इस्तेमाल करूंगा किसे सब प्लॉट का इस्तेमाल करने वाला हूं सब प्लॉट के अंदर मैं क्या करूंगा यहां पे एक रो लूंगा दो कॉलम लूंगा और फर्स्ट नंबर पोजीशन पे मैं इसको प्लॉट कर दूंगा ये है हमारा बिफोर ठीक है तो मैं इसके अंदर कर देता हूं यहां पे लेबल मुझे देना है बिफोर तो लेबल दिखाने के लिए मैं यहां पे पीएटी डॉट यहां पे टाइटल का इस्तेमाल करूंगा क्योंकि मुझे टाइटल देना है यहां पे तो मैंने यहां पे इस्तेमाल कर लिया टाइटल का एंड टाइटल के अंदर मैंने लिख दिया यहां पे बिफोर तो ये मेरा बिफोर का है ग्राफ अब मुझे क्या करना है गाइज यहां पे मुझे अगला ग्राफ बनाना है तो इसी के लिए मुझे सेम टू सेम इसे दोबारा कॉपी करना है एंड देन नीचे आ जाता हूं मैं यहां पे और ये कर देता हूं सेकंड नंबर पोजीशन के ऊपर और ये मेरा जो ग्राफ है वो बिफोर की जगह क्या हो जाएगा यहां पे आफ्टर पे हो जाएगा अब ये डेटा सेटड को एप्लीकेशन इनकम नहीं है हमारे पास ग्राफ यहां पे इसकी जगह हम यहां पे को एप्लीकेशन इनकम की जगह को एप्लीकेशन इनकम ट्रांसफॉर्मेशन का इस्तेमाल कर रहे हैं और अब इस ग्राफ को शो करते हैं तो देखिए हमारे पास दोनों ग्राफ साइड बाय साइड आ चुके हैं यहां पे अच्छा देखिए नॉर्मल डिस्ट्रीब्यूशन ग्राफ में तो नहीं बन पाया लेकिन हां थोड़ा बहुत यहां पे ग्राफ जो है वो काफी सही हो चुका है यहां पे इसके लिए मैं करूंगा पीएटी डॉट पहले तो यहां पे फिगर का इस्तेमाल करते हुए इसको फिगर सही करूंगा यहां पे तो पीएटी डॉट मैं यहां पे क्या कर रहा हूं यहां पे फिगर का इस्तेमाल कर रहा हूं फिगर के अंदर मैं इस्तेमाल करूंगा गाइ यहां पे फिक्स साइज का फिक्स साइज के अंदर एक काम करते हैं 10 यहां पे से कर देते हैं ताकि ग्राफ थोड़ा सही दिखा दे ज्यादा बड़ा हो गया यहां पे तो इसको थोड़ा कम कर देते हैं 10 4 कर देते हैं यहां पे एंड रन करें ओके ग्राफ काफी आ गया है साइड बाय साइड आप बिफोर और आफ्टर को कंपैरिजन कर सकते हैं देखिए बिफोर वाला ग्राफ देखेंगे तो काफी अब तक आपके यहां पे क्या है इसकी टेल जा रही थी और ये नॉर्मल डिस्ट्रीब्यूशन का तो बकुल फॉलो नहीं कर रहा था लेकिन हां आप आफ्टर को चेक करेंगे तो आफ्टर के अंदर क्या हो रहा है गाइ यहां पे कि आपका जो कर्व है वो नॉर्मल डिस्ट्रीब्यूशन कर्व की फॉर्मेशन में आ रहा है यहां पे आया नहीं है कंप्लीट लेकिन हां काफी हद तक सही हो चुका है यहां पे जो इसकी टेल थी वो टेल बिल्कुल जा चुकी है यहां पे आप आराम से देख पाएंगे कि इसके अंदर बिल्कुल भी टेल आपके पास नहीं है जैसा है वैसा ही डाटा आपको दिखाई दे रहा है अब एक काम करते हैं मैं इसके अंदर आउटलायर को कंसीडर करते हुए ग्राफ बना के दिखाऊंगा कि आउटलायर को कंसीडर करने के बाद किस तरह से दिखाई देता है ये विदाउट आउटलायर है विदाउट आउटलायर में आप देख सकते हैं काफी हद तक इसने ग्राफ को सही कर दिया है यहां पे अब मैं आउटलायर को कंसीडर करते हुए इस ग्राफ को बनाऊंगा अब देखिए आउटलायर को कंसीडर करने के लिए देखिए मैंने जो आउटलायर की डटा लिखा था मतलब मैंने आउटलायर वाला कॉलम लिखा था मैं इसे क्या करूंगा यहां पे कमेंट आउट कर दूंगा राइट ताकि ये मेरे पास आउटलायर बिल्कुल भी वर्क ना कर सके चलिए अब मैं यहां पे स्टार्टिंग से फिर से डाटा को रन करता हूं यहां पे और फिर से मैं डटा को रन करता हूं और और इसके अंदर देखिए मैं फिर से डाटा को रन करता हूं तो देखिए इसके अंदर मेरा आउटलायर आ चुके है यहां पे अब मुझे इन दोनों की जरूरत नहीं पड़ेगी क्योंकि ये आउटलायर को रिमूव करने के लिए हेल्प कर रहे हैं यहां पे मैं फिर से अपने डेटा को देखूंगा यहां पे तो इसमें आउटलाइन मेरे पास प्रेजेंट है यहां पे अब मैं फिर से फंक्शन ट्रांसफॉर्मेशन लगाऊंगा फिर से फंक्शन ट्रांसफॉर्मेशन लगा रहा हूं फिर से लगा रहा हूं एक बार फिर से और एक बार फिर से ऐसे रन कर रहा हूं और फिर से मैं दोबारा रन कर रहा हूं अब देखिए मेरे पास पहले डाटा के अंदर आउटलायर प्रेजेंट है और अब आप देखिए फंक्शन ट्रांसफॉर्मेशन करने के बाद में इसमें से आउटलायर जा चुके हैं यहां पे और कंप्लीट मेरा जो डाटा है यहां पे वो नॉर्मल डिस्ट्रीब्यूशन की फॉर्मेशन में आ चुका है अब देखिए इसके अंदर बहुत सी लंबी टेल थी इसने क्या किया उस टेल को कट कर दिया है और कट करके आपका फंक्शन ट्रांसफॉर्मेशन ने क्या किया आपके डाटा को एक कंप्रेस फॉर्मेट में लाके रख दिया अब देखिए इसका इस्तेमाल कब करना है जब आपको लगता है कि आउटलायर के अंदर आपके बाद बहुत ही इंपॉर्टेंट डाटा छुपा हुआ है यहां पे जो कि आगे चलते हुए आपके डाटा के लिए बहुत ज्यादा इंपॉर्टेंट होने वाला है तो उस वक्त आप विदाउट आउटलायर को रिमूव करे हुए आप क्या कर सकते हैं फंक्शन ट्रांसफॉर्मेशन लगा के अपने फंक्शन को ट्रांसफर करके आप इसे यूज कर सकते हैं अब जरूरी नहीं है कि आप इस में वन प जो मैंने लॉग थम इस्तेमाल किया है आप इसका इस्तेमाल करें आप किसी और चीज का भी इस्तेमाल कर सकते हैं जैसे कि मैं एक एग्जांपल के तौर पे मैं आपको बताना जा रहा हूं यहां पे देखिए दोबारा मैं फिर से एक बार फंक्शन ट्रांसफॉर्मेशन लगा रहा हूं यहां पे और फिर से मैं अपने मॉडल को ट्रेन करूंगा और फिर से मैं आपको दिखाऊंगा यहां पे डाटा किस तरह से दिखाई देता है तो फिर से मैं यहां पे इस मॉडल को फिट करने वाला हूं फिट करने के बाद में फिर से मैं आपको यहां पे दिखाने वाला हूं अब देखिए यहां पे मैं ft1 का इस्तेमाल करूंगा यहां पे अगले पॉइंट के लिए मैं ft1 का इस्तेमाल करूंगा tf1 का इस्तेमाल करूंगा और यहां पे मैं ft1 का इस्तेमाल करूंगा और को एप्लीकेशन को भी करूंगा इस बार मैं np.log का इस्तेमाल नहीं करते हुए इस फंक्शन ट्रांसफॉर्मेशन के अंदर मैं x स् का इस्तेमाल करने वाला हूं x स् जब भी आप इस्तेमाल करने जा रहे हैं उससे पहले आप लडा फंक्शन का इस्तेमाल करें लडा के अंदर आप यहां पे जाए और x लिखें कॉलम लगाएं और यहां पे लगा के आप डबल स्टार करते हुए x स् का इस्तेमाल आप कर सकते हैं चलिए इसे रन करते हैं आपके पास x स् के हिसाब से आपका डाटा जो है वो ट्रांसफॉर्म हो चुका है अब एक काम करते हैं ग्राफ बना के देखते हैं कि अब x स् देने के बाद में किस तरह का ग्राफ दिखाई दे रहा है तो मैं फिर से फंक्शन ट्रांसफॉर्मेशन जाऊंगा और इस बार मैं कॉलम ट्रांसफॉर्मेशन के के अंदर मैं क्या करने वाला हूं यहां पे tf1 का ग्राफ बनाने वाला हूं जैसे ही मैं tf1 का ग्राफ बनाऊंगा तो देखिए आपका x स् के अंदर आपका जो डाटा है वो नॉर्मल डिस्ट्रीब्यूशन कर्व के अंदर कन्वर्ट हो चुका है देखिए काफी हद तक नॉर्मल डिस्ट्रीब्यूशन में कन्वर्ट हो चुका है लेकिन ये जो टेल है वो टेल नहीं गई है टेल जो है वो टेल अभी की अभी भी वैसी की वैसी है बट आप यहां पे शेप को देखेंगे तो शेप के अंदर आप देखेंगे कि एक छोटा सा कर्वेचर आ रहा था वो कर्वेचर यहां से जा चुका है अच्छा यहां पर यदि आप ये आउटलायर को हटा देते हैं तो आउटलायर हटाने के बाद में आप यहां पे एक बहुत ही चीज सरप्राइज ली देख पाएंगे क्योंकि आउटलायर हटाने के बाद में आपका जो डाटा है वो आपके पास सेम ए दिखेगा जैसे मैं क्या कर रहा हूं फिर से यहां पे आउटलायर को एक बार के लिए हटा रहा हूं यस मैंने क्या किया यहां पे ऊपर से इसे रन किया है वापस एक बार फिर से रन करते हैं देखिए 36 वाली लाइन को रन करते हैं फिर इसे रन करते हैं और ये ग्राफ को देखते हैं ग्राफ हमारा आ चुका है फिर मैं आउटलायर रिमूव करने के वाली जो टेक्निक है उसे लगा रहा हूं आउटलायर हटा रहा हूं यहां से आउटलायर हटाने के बाद में मेरा जो कर्वेचर दिख रहा है वो कुछ इस फॉर्मेशन में दिख रहा है अब देखिए फंक्शन ट्रांसफॉर्मेशन के अंदर मैं x स् का इस्तेमाल करूंगा जो कि लगभग लगभग मेरे पास नॉर्मल डिस्ट्रीब्यूशन को बना देगा यहां पे तो मैं करूंगा यहां पे कॉलम ये सब यहां पे कमेंट आउट करने वाला हूं क्योंकि मुझे इन सब की बिल्कुल भी जरूरत नहीं है ठीक है क्योंकि मैं यहां पे x स् वाला जो फॉर्मेट है उसे यूज़ कर रहा हूं मैं थोड़ा सा नीचे आता हूं यहां पे और एक बार इस ग्राफ को बंद कर देता हूं तो मैं थोड़ा सा नीचे आता हूं यहां पे और मैं x स् वाले फॉर्मेट को यूज़ करता हूं तो मैं फिर से से रन कर रहा हूं फिर से रन कर रहा हूं x स् वाले फॉर्मेट को रन कर चुका हूं x स् वाले फॉर्मेट को रन करने के बाद मैं जैसे ही रन करता हूं यहां पे तो देखिए पहले मेरे पास कर्वेचर कुछ इस तरह से दिखाई दे रहा था अब मेरा कर्वेचर कुछ इस तरह से कर देता है तो आपका डाटा नॉन नॉर्मल डिस्ट्रीब्यूशन से नॉर्मल डिस्ट्रीब्यूशन में आ चुका है अब ये डिपेंड करेगा कि आपके डेटा सेट का नेचर क्या है फिलहाल देखिए मेरे डेटा सेट के अंदर x स् के थ्रू नॉर्मल डिस्ट्रीब्यूशन में आया है लेकिन हो सकता है आपका लोगरिथम के थ्रू आए या हो सकता है कि आपके पास जो डाटा है वो किसी और फंक्शन के थ्रू आए तो आपको यहां पे डिफरेंट डिफरेंट फंक्शंस बनाते हुए आप अपना वर्क कर सकते हैं और अपने डाटा को नॉर्मल डिस्ट्रीब्यूशन में कन्वर्ट कर सकते हैं क्योंकि काफी ऐसी मशीन लर्निंग एल्गोरिथम होती है जो नॉर्मल डिस्ट्रीब्यूशन कर्व के ऊपर आपके पास बेटर रिजल्ट देती है बेटर आंसर आपको देती है तो इसलिए आपको वहां पे कन्वर्जन करना ज जरूरी है तो इसके लिए आपके पास वहां पर कन्वर्जन करेंगे तो आपको बेटर रिजल्ट आपको देखने को मिलेगा और आज के इस वीडियो के जरिए हम बात करेंगे फीचर सिलेक्शन टेक्निक के बारे में देखिए फीचर सिलेक्शन टेक्निक के अंदर क्या होता है कि आप क्या करते हैं फीचर को सेलेक्ट करते फीचर को सेलेक्ट करने का मतलब क्या हुआ देखिए मशीन लर्निंग और डेटा साइंस के अंदर आप जो डेटा सेट यूज करते हैं उस डेटा सेट के अंदर बहुत सारे नंबर ऑफ कॉलम्स होते हैं अब उन कॉलम्स में से कुछ ऐसे कॉलम्स होते हैं जो कि अन इंपॉर्टेंट होते हैं कुछ ऐसे कॉलम होते हैं जिनकी रिक्वायर्ड बहुत ही कम होती है कुछ ऐसे कॉलम होते हैं जो कि आगे चलते हुए मशीन लर्निंग एल्गोरिथम के अंदर कोई भी रोल इंपॉर्टेंट नहीं देने वाले राइट और कुछ ऐसे कॉलम्स भी होते हैं जिनको दो कॉलम को मर्ज करके एक कॉलम बनाया जा सकता है तो अब हमें क्या करना है कि हमारे पास बहुत सारे नंबर ऑफ कॉलम्स का एक डाटा पड़ा है उसमें से हमें उन उन कॉलम को निकालना है जो कि हमारे मशीन लर्निंग मॉडल बनने के लिए बहुत ही ज्यादा इंपॉर्टेंट है और आगे चलते हैं उन्हीं कॉलम का इस्तेमाल करते हुए हम क्या करेंगे हम उन्हीं कॉलम का इस्तेमाल करते हुए हमारे मशीन लर्निंग मॉडल को बनाएंगे तो यहां पर हमने क्या किया कि नंबर ऑफ कॉलम्स में से हमने क्या किया कुछ नंबर ऑफ कॉलम को सेलेक्ट किया और उन्हीं के थ्रू आगे मॉडल बनाया दैट इज कॉल्ड ऑफ फीचर सिलेक्शन यस हमारे पास जो कॉलम्स होते हैं उन कॉलम्स को हम क्या बोलते हैं फीचर बोलते हैं और हम उसमें से क्या कर रहे हैं कुछ कॉलम्स को सेलेक्ट कर रहे हैं दैट कॉल ऑफ फीचर्स जैसे एग्जांपल के तौर पे मैं बात कर रहा हूं तो देखिए यहां पर मेरे पास क्या है एक डेटा सेट है राइट अब इस डेटा सेट के अंदर यदि आप ऑब्जर्वेशन करेंगे तो इसके अंदर बहुत सारे कॉलम्स हैं यस इस कॉलम्स में से हम हमें कुछ इंपॉर्टेंट कॉलम्स ही हमें चूज करने है बाकी सारे कॉलम्स को हमें हटाना है यहां पर तो इस टेक्निक को हम क्या बोलते हैं फीचर सिलेक्शन टेक्निक बोलते हैं अब फीचर सलेक्शन टेक्निक आपके पास कोई परफेक्ट टेक्निक नहीं है मैं मतलब बेसिकली गाइज मैं बात करना चाहूं यहां पर कि यही टेक्निक अप्लाई करेंगे तो आपके पास हमेशा सही फीचर सेलेक्ट होंगे ऐसा कुछ भी नहीं है आपके पास अकॉर्डिंग टू योर डटा अकॉर्डिंग टू योर डोमेन नॉलेज के अनुसार आप क्या करते हैं फीचर को सेलेक्ट करते हैं देखिए जैसे कि क्या होता है कि कुछ फीचर्स हमारे लिए बिल्कुल भी इंपॉर्टेंट नहीं होते हैं जैसे इस पर्टिकुलर डेटा के अंदर बात करूं यहां पर तो इस पर्टिकुलर डटा के अंदर आप यहां पर ऑब्जर्वेशन करेंगे तो नंबर ऑफ रेटिंग और नंबर ऑफ ऑब्जर्वेशंस अब ये जो है ना यहां पर ये हमारे लिए काफी इंपॉर्टेंट नहीं है तो हम इनको हटा सकते हैं राइट हम क्या कर सकते हैं इसको हटा सकते हैं या फिर यहां पर कि आपको डोमेन की नॉलेज होना बहुत ज्यादा जरूरी है तभी आप क्या करेंगे फीचर सिलेक्शन कर पाएंगे अदर वाइज फीचर सिलेक्शन नहीं कर पाएंगे लेकिन आज के इस वीडियो के जरिए जो मैं फीचर सिलेक्शन टेक्निक के बारे में बताने जा रहा हूं इसके लिए यदि आपको डोमेन की नॉलेज नहीं होगी तब भी आप उसमें से फीचर सिलेक्शन कर सकते हैं लेकिन यहां पे मैं एक इंपॉर्टेंट चीज बता देता हूं कि ये टेक्निक जो है 100% आपके पास परफेक्ट टेक्निक नहीं है 100% परफेक्ट टेक्निक का मतलब यहां पे क्या है कि यदि आप यही टेक्निक हर बार इस्तेमाल करेंगे तो आपको हमेशा हर बार अच्छा रिजल्ट देखने को मिलेगा ऐसा बिल्कुल नहीं है तो बल्कि क्या है यहां पर इस टेक्निक का इस्तेमाल करते हुए आप आगे बढ़ सकते हैं तो आज हम क्या कर रहे हैं वो टेक्निक समझ रहे हैं बेसिकली उन टेक्निक को समझ रहे हैं जिसके अंदर हमें डोमेन की नॉलेज भी नहीं है और उसके बावजूद भी हमें फीचर सिलेक्शन करना है तो फिर हम कैसे करेंगे राइट तो हम उस टेक्निक को समझ रहे हैं और बेसिकली फीचर सिलेक्शन जो टेक्निक है गाइ यहां पर इसके लिए आपको ट्यूमेन की नॉलेज होना बहुत ज्यादा जरूरी है तो चलिए आज कौन सी टेक्निक समझ रहे हैं हम यहां पर हम यहां पर समझ रहे हैं फॉरवर्ड एलिमिनेशन और बैकवर्ड एलिमिनेशन को समझना है ये कैसे परफॉर्म किए जाते हैं और ये कैसे वर्किंग करता है तो सबसे पहले हम बात करेंगे फॉरवर्ड एलिमिनेशन के बारे में तो देखिए फॉरवर्ड एलिमिनेशन में क्या होता है कि आपके पास बहुत सारे नंबर ऑफ फीचर्स होते हैं जैसे कि मैं बात करूं f1 फीचर हो गया f2 फीचर हो गया f3 फीचर f4 फीचर हो गया फाइव फीचर हो गे राइट जैसे कि एग्जांपल के तौर पे हम बात करें यहां पर तो देखिए ये इतने सारे आपको फीचर्स आपको देखने को मिल रहे हैं यस ये सारे फीचर्स हो गए अब आपको क्या करना है आप कौन सा मशीन लर्निंग मॉडल लगाने वाले हैं इसके ऊपर पहले आप वो चूज कर लेते हैं जैसे कि मैंने चूज कर लिया यहां पर कि कोई हमारा क्या है m1 मॉडल है हम उसको चूज करें अब m1 मॉडल के थ्रू हम क्या करेंगे गाइस यहां पर कि हम इन सारे फीचर्स को वन बाय वन देंगे मतलब पहला फीचर देंगे फिर हम दूसरा फीचर देंगे फिर हम तीसरा फीचर देंगे फिर हम चौथा फीचर देंगे फिर हम क्या करेंगे पांचवा फीचर देंगे मतलब हम पांचों फीचर वन बाय वन देने वाले हैं अब पांचों फीचर वन बाय वन देने के बाद में इनके अंदर क्या आएगी कुछ ना कुछ एक्यूरेसी आएगी राइट इनकी कुछ ना कुछ एक्यूरेसी आएगी मतलब मशीन लर्निंग मॉडल का कुछ परफॉर्मेंस आएगा मशीन लर्निंग की परफॉर्मेंस में आपके पास कुछ ना कुछ परफॉर्मेंस आने पर जिसका सबसे हाईएस्ट स्कोर हो जैसे मुझे यहां पर थ्री का हाईएस्ट स्कोर दिख रहा है यहां पर तो मैं थ्री का हाईएस्ट स्कोर यहां पर चूज कर लूंगा मतलब ये वाला जो है आपके पास यहां पर कॉलम ये मैं चूज कर लूंगा राइट उसके बाद में क्या करना है गाइस यहां पर हमें नेक्स्ट प्रोसीजर में आगे बढ़ना है आगे बढ़ने पर क्या करना है जैसे कि यहां पे 75 पर एक्यूरेसी आई है ओके अब हमें क्या करना है आगे बढ़ना है आगे बढ़ने के बाद में हम क्या करेंगे यहां पर गाइज टूटू के पेयर्स बनाएंगे टूटू के पेयर्स बनाने का मतलब है गाइज यहां पर कि ये जो थ्री फीचर सेलेक्ट हुआ है इस थर्ड फीचर के साथ पहला फीचर को हम क्या करेंगे कंबाइन करेंगे फिर इस थर्ड फीचर के साथ सेकंड फीचर को कंबाइन करेंगे इस थर्ड फीचर के साथ फोर्थ फीचर को कंबाइन करेंगे फिर इस फाइव फीचर के साथ भी कंबाइन े तो ऐसे करके मेरे पास क्या बन जाएंगे कंबाइंड फीचर बन जाएंगे अब हम क्या करेंगे फिर से इन सबको एक-एक कर के हम हमारे मशीन लर्निंग मॉडल को देंगे ताकि इनसे भी क्या मिले हमें एक्यूरेसी मिले अब इनसे भी हमें जब एक्यूरेसी मिलेगी उन एक्यूरेसी को हम नोट डाउन करेंगे अब नोट डाउन करने के बाद में हम क्या करेंगे फिर से इसमें से जो हाईएस्ट एक्यूरेसी वो चूज करेंगे लेकिन यहां पे हमें एक चीज और ध्यान रखनी है यहां पर कि देखिए पहले वाली जो एक्यूरेसी थी दैट इज 75 उनसे इंप्रूव करी हुई जो एक्यूरेसी है वो हमें देखने को मिलनी चाहिए जैसे पहले हमने क्या किया 75 एक्यूरेसी मिली यहां पर अब मैं बात करूं यहां पर यदि मुझे ये 85 पर एक्यूरेसी देता है तो तो देन मैं फर्द इसको चूज करूंगा यदि 85 से कम मिलती है मतलब जैसे 75 से आपको कम मिलती है सारी की सारी सिक्यूरिटी स तो मैं फीचर थ्री को ही सेलेक्ट करूंगा मतलब बेसिकली गाइ यहां पर है कि जैसे मैं इन सब की फीचर एक्यूरेसी निकाल रहा हूं तो एक्यूरेसी मैंने इसकी निकाली जैसे कि यहां पर आई 76 इसकी एक्यूरेसी मैंने यहां पर निकाली इसकी एक्यूरेसी आ रही है 62 इसकी एक्यूरेसी निकाली मैंने यहां पर इसकी एक्यूरेसी आ रही है 52 इसकी एक्यूरेसी निकाली मैंने यहां पर इसकी एक्यूरेसी आ रही है 70 राइट तो अब हमें क्या करना है इस फीचर को सेलेक्ट कर लेना है क्यों सेलेक्ट करना है क्योंकि ये 70 फ से क्या है ज्यादा है पहली चीज तो सेकंड चीज गाइ यहां पर इन सब में भी क्या है हाईएस्ट एक्यूरेसी के साथ है अच्छा ऐसा होता कि यदि ये वाला जो है ये 73 पर एक्यूरेसी देता तो हम इसे सेलेक्ट नहीं करते हम फिर फीचर्स थ्री को ही लेते हुए आगे मॉडल बनाते क्योंकि दैट इज द हाईएस्ट एक्यूरिस ओके तो ऐसे करके हमने क्या किया फीचर सिलेक्शन किया और फिर उसके बाद में हमने क्या किया कि जो हमारा फीचर आया उसके साथ हमने तीन-तीन की वॉर्डिंग बनाई जैसे 1 2 3 आया आपके पास 1 3 आया फ उसके साथ टू के साथ बॉन्डिंग बनाई है फिर किसी और के साथ बॉन्डिंग बनाई है किसी और के साथ बॉन्डिंग बनाई है ए ऐसे करके हमने थथ की बॉन्डिंग यहां पे तैयार किए अब यहां पे एक चीज का ध्यान रखिएगा क्या ध्यान रखना है आप लोगों को यहां पर कि जैसे थ्री के साथ बॉन्डिंग बनाई ना आपने यहां पर तो ऐसे ही वन और टू की भी बनानी है क्या पता इनकी भी एक्यूरेसी हाईएस्ट निकल सकती है फिर उसके बाद टू और थ्री की भी बनानी है फिर टू और फोर की भी बनानी है टू और फाइव की भी बनानी है मतलब वन बाय वन सभी मॉडल की एक्यूरेसी आपको चेक करनी है फिर उनमें जो सबसे हाईएस्ट एक्यूरेसी होगी वो आपको देखने मिलेगी अब इसे फॉरवर्ड एलिमिनेशन क्यों बोलते हैं फॉरवर्ड एलिमिनेशन इसलिए बोलते हैं क्योंकि यहां पे वन बाय वन स्टेप्स यहां पर फॉलो हो रहा है मतलब सबसे पहले एक फीचर को लेके फिर उसके बाद दो फीचर लिए जा रहे हैं फिर उसके बाद तीन फीचर लिए जा रहे है उसके बाद चार फीचर लिए जा रहे हैं उसके बाद पांच फीचर लिए जा रहे है ऐसे करके हमारा जो यहां पर डाटा है वो यहां पर रेडी हो रहा है फॉर किसके लिए आपके पास फीचर सेलेक्शन के लिए इसीलिए हम इसको क्या बोलते हैं फॉरवर्ड एलिमिनेशन टेक्निक बोलते हैं क्योंकि यहां पर आपका ऐ क्या हो रहा है एक-एक करके स्टेप्स से आगे बढ़ा जा रहा है अब बात करते हैं हमारे नेक्स्ट स्टेप्स में जिसके अंदर हम बोलते हैं बैकवर्ड एलिमिनेशन बैकवर्ड एलिमिनेशन में जस्ट इसका अपोजिट हो जाएगा कि सबसे पहले जितने भी फीचर हैं उन सबकी एक्यूरेसी निकाली जाएगी फिर उसके बाद हम क्या करेंगे इसी में से एक फीचर को बाहर निकाल देंगे राइट हम क्या करेंगे चार-चार के ग्रुप्स बना लेंगे जैसे पांच है तो हम क्या करेंगे चार-चार के ग्रुप्स बनाएंगे अब चारचार के जितने भी ग्रुप्स हैं उन सब में सबसे हाईएस्ट एक्यूरेसी फाइंड आउट करने की कोशिश करें क्या वो पहले वाले से हाईएस्ट है यदि है तो हम फर्द उसको आगे लेते हुए फिर उसमें से क्या करेंगे तीन-तीन की एक्यूरेसी निकालेंगे फिर ऐसे करके दो-दो की निकालेंगे फिर एक-एक की निकालेंगे तो ऐसे करके हमें यहां पर क्या मिल जाएगा हमारे बेस्ट फीचर बन जाएगी तो दैट इज कॉल्ड ऑफ फीचर एलिमिनेशन टेक्निक यस फीचर सिलेक्शन टेक्निक जिसके अंदर हम क्या कर रहे हैं बैकड ंड फॉरवर्ड एलिमिनेशन का यूज करते हुए हमारे पास जितना भी डाटा है यहां पर उन सभी में से हम वजर को सेलेक्ट कर रहे हैं अब इसको थोड़ा प्रैक्टिकली समझते हैं कि कैसे वर्क करता है तो इसके लिए हमारे पास एक डेटा सेट है मैं आपको डेटा सेट दिखाऊंगा यहां पर तो देखिए मेरे पास एक टीड सए नाम से एक डेटा सेट है जहां पे मेरे पास बहुत सारे कॉलम्स हैं और एक मेरा यहां पे क्या है आउटपुट भी है जैसे ग्लूकोज हो गया ब्लड प्रेशर हो गया स्किन थिकनेस हो गया बीएमआई हो गया एज हो गया एंड आउटकम हमारे पास एक फीचर होंग राइट तो हमारे पास ये हमारा डेटा सेट है इस डेटा सेट के ऊपर मैं क्या करने वाला हूं फीचर सिलेक्शन टेक्निक को इस्तेमाल करने वाला हूं अब ये फीचर सिलेक्शन टेक्निक कैसे इस्तेमाल करेंगे तो इसके लिए हम चलते हैं जुपिटर नोटबुक के अंदर चलिए इसके लिए हमें जो रिक्वायर्ड आईपी है हम उसे इंपोर्ट कर लेते हैं जैसे इंपोर्ट पांडा एलियाज ऑफ पीडी करना पड़ेगा यहां पर सबसे पहले फिर उसके बाद में मैं क्या करूंगा यहां पर फ्रॉम एमएल एक्सटें मॉड्यूल के अंदर जाऊंगा यस एमएल एक्सटें मॉड्यूल में जाने के बाद मुझे क्या करना है यहां पे गाइस फीचर को सिलेक्शन करना है तो मैं फीचर सिलेक्शन करूंगा एंड देन मैं क्या करूंगा यहां पर आपके पास सीक्वेंशियल फीचर सलेक्शन को क्या करूंगा इंपोर्ट करूंगा चलिए अब हम क्या करते हैं गाइस यहां पर हम हमारा डाटा सेट को लोड करते हैं और पीडी डॉट यहां पर क्या करूंगा गाइज यहां पर रीड अंडर को सीएसवी का इस्तेमाल करूंगा जहां पे मेरे पास जो डायबिटी ड सीएसवी डाटा है मैं उसे लोड करूंगा अब मैं क्या कर रहा हूं गाइज यहां पर मैं अपने डेटा सेट को ले रहा हूं डटा सेट डॉट यहां पर क्या करूंगा हैड लगा के इसके तीन डाटा को मैं दे दूंगा अब मेरे पास जो डेटा आ चुका है इस डाटा से मैं क्या करूंगा यहां पर एक्स एक्सेस और वा एक्सेस के डटा को अलग-अलग कर लेता हूं तो देखिए एक्स एक्सेस का डाटा मैंने अलग किया है यहां पर और वो कैसे किया मैं अपने डेटा सेट के पास जा रहा हूं डॉट मैंने यहां पर आई लॉग का इस्तेमाल किया जहां पे सारी नंबर ऑफ रोज का इस्तेमाल किया कॉलम की बात करें तो मैं माइनस व रहा हू मैं y की बात कर रहा हूं यहां पर तो वो कैसे होगा डेटा सेट के पास जाऊंगा और फिर मैं क्या करूंगा यहां पे गाइज आउटकम कॉलर कर चलिए अब मुझे क्या करना है इसके ऊपर हमारा एक मॉडल तैयार करना है यस इसके ऊपर हमें एक मॉडल भी चाहिए का तो देखिए हमारे पास ये आउटकम कैसा है आउटकम कैसे दिख रहा है गाइज यहां पर आउटकम हमें यहां पे क्लासिफिकेशन नेचर का दिख रहा है तो अब हम क्या करेंगे गाइज यहां पर क्लासिफिकेशन एनालिसिस लगाएंगे और क्लासि एनालिसिस के अंदर मैं क्या कर रहा हूं यहां पे फ्रॉम साइकिल लान के अंदर जाऊंगा और उसके बाद में जाने के बाद में मैं क्या करूंगा गाइज यहां पर सेकंड लाइन के अंदर जाने के बाद मैं लीनियर मॉडर को चूज करूंगा और मैं इंपोर्ट करने वाला हूं किसे गाइज यहां पर लॉजिस्टिक रिग्रेशन को यस मैं लॉजिस्टिक रिग्रेशन यहां पर अप्लाई करने वारहा हूं चलिए लॉजिस्टिक रिग्रेशन को अप्लाई किया अब देखिए मैं एलआर के नाम से एक मॉडल बना लेता हूं और यहां पर क्या कर रहा हूं लॉजिस्टिक रिग्रेशन को यहां पर रन कर देता हूं चलिए अब हमें क्या करना है इस सीक्वेंशियल फीचर सिलेक्टर को स्ट यूज़ करना है तो चलिए कैसे यूज कर सकते हैं तो ये जो हमने यहां पर सीक्वेंशियल फीचर सिलेक्टर को इस्तेमाल किया यहां पर इसे मैं कॉल कर देता हूं सीक्वेंशियल फीचर सिलेक्टर को मैंने कॉल कर दिया यहां पर अब देखिए इसके अंदर क्या-क्या पूछा जा रहा है सबसे पहले आपका एस्टिमेटर पूछा जा रहा है फिर नंबर ऑफ के फीचर्स पूछे जा रहे हैं मतलब कितने फीचर्स आपको चाहिए उसके बाद आपको क्या चाहिए फॉरवर्ड एलिमिनेशन चाहिए या बैकवर्ड एलिमिनेशन चाहिए ये आप बता सकते हैं यहां पर और उसके बाद में आपके पास और भी बहुत सारे क्या है हाइपर पैरामीटर्स है अब ये सीक्वेंशियल फीचर सिलेक्शन हमें क्या देने वाला है एक आउटपुट देने वाला है जिसके अंदर हमें हमारे नंबर ऑफ फीचर्स हमें देखने को मिलेंगे चलिए मैं क्या करता हूं इस आउटपुट को कहीं ना कहीं स्टोर कर देता हूं जैसे मुझे फीचर सिलेक्शन करना है तो मैं एफएस के नाम से एक वेरिएबल बना देता हूं अब सबसे पहले ये क्या बोलता है आपका एस्टिमेटर एस्टिमेटर हमारे पास क्या है एलआर है एलआर होने के बाद में के नंबर ऑफ फीचर के बारे में बात की जा रही है तो मैं के नंबर ऑफ फीचर्स की बात करूं तो देखिए मेरे पास कितने फीचर्स है पहले मैं वो देख लेता हूं फिर उसके हिसाब से मैं बात करूंगा आगे चलते हुए तो गाइस मैं यहां पर x डॉट यहां पर क्या करूंगा शेप चेक करूंगा तो एक् डॉट शेप करने पर मुझे क्या मिलर है मेरे पास पांच फीचर है तो फिलहाल अभी मैं क रहा हूं फाइव फीचर के साथ इसे रन कर रहा हूं एंड देन हमारे पास जो अगला है यहां पर कि हमें फॉरवर्ड चाहिए या नहीं चाहिए मतलब फॉरवर्ड एलिमिनेशन चाहिए या बैकवर्ड एलिमिनेशन चाहिए ये हमें बताना है तो मैं क्या कर रहा हूं गाइज यहां पर मैं फॉरवर्ड ले रहा हूं और फॉरवर्ड को फिलहाल अभी के लिए क्या कर रहा हूं ट्रू कर रहा हूं ओके फिर मैं क्या कर रहा हूं यहां पर एए डॉट हमारे मॉडल को क्या करा जा रहा है यहां पर फिट किया जा रहा है यहां पर तो मैं फिट कर रहा हूं और फिट के अंदर मैं x y जो हमारे पास है वो दे रहा हूं अब ये रन हो रहा है यहां पर और ये ट्रेंड हो चुका है अब मुझे क्या करना है एफएस डॉट मुझे क्या करना है अपने फीचर को सेलेक्ट करना है मतलब फीचर के नेम चाहिए यहां पर तो फीचर के नेम आपके पास आ गए ये कौन से फीचर है ये हमारे जो ओरिजिनल फीचर है देखिए ग्लूकोज ब्लड प्रेशर स्किन थिकनेस बीएमआई और एज जो कि हमारे पास क्या है पांच फीचर है हमें क्या चाहिए यहां पर फीचर सेलेक्टर वाले चाहिए मतलब जो आपके पास यहां पर प्रॉपर में जो फीचर आए हैं यहां पर जो सेलेक्ट होके आए हैं वो चाहिए तो मैं यहां पर क्या कर रहा हूं के नंबर ऑफ फीचर्स के नाम ले रहा हूं यहां पर के नंबर ऑफ फीचर्स के अंदर देखिए ग्लूकोज ब्लड प्रेशर थिकनेस और बीएमआई एज क्योंकि हमने यहां पर पांच लिया है तो पांच ही हमें मिलेंगे यहां पर फिर उस उसके बाद देखिए मैं यहां पे क्या कर रहा हूं एफएस ले रहा हूं यहां पर और एफएस लेने के बाद में मुझे यहां पर स्कोर भी चाहिए तो मैं क्या कर रहा हूं यहां पर इसका स्कोर देखूंगा तो के स्कोर लूंगा और के स्कोर कितना आ रहा है 76 पर हमारे पास एक्यूसी आ रही है ये कब आ रही है गाइ यहां पर जब मैंने यहां पर फाइव फीचर्स सेलेक्ट किए हैं तब आ रही है अब ऐसे ही करके मैं क्या करूंगा यहां पर फोर फीचर लूंगा वापस यहां आ जाऊंगा मैं फोर फीचर डालूंगा फोर फीचर पे फिर से इसे रन करूंगा ये हमारे पास टोटल फाइव फीचर्स है मैं रन करूंगा यहां पर ये मेरे फोर फीचर्स है और फोर्थ फीचर पे एक्यूरेसी देखूंगा तो सेम टू सेम एक्यूरेसी दिख रही है कोई ज्यादा एक्यूरेसी में कुछ फर्क नहीं आया यहां पर अब मुझे क्या करना है गाइज यहां पर मैं फोर फीचर की जगह अब मैं क्या कर रहा हूं गाइ यहां पर मुझे थ्री फीचर्स चाहिए तो देखिए मैं अ इसे थ्री फीचर्स के ऊपर ट्रेन कर रहा हूं तो ये रहे हमारे तीन फीचर और उसके ऊपर एक्यूरेसी देखें तो देखिए ऑलमोस्ट आपके पास थोड़ी सी इंप्रूव हुई है देखिए 76.8 3 है यहां पर और जो पहले थी वो गाइ यहां पर आपके 76.8 3 आपके पास आ रही है इसी तरह से यदि मैं टू फीचर्स को सेलेक्ट करूं यस मैं यहां पे क्या कर रहा हूं फीचर सलेक्शन के अंदर मैं टू का इस्तेमाल करूं और फिर मैं रन करूं यहां पर एक-एक करके सारे फीचर्स को तो देखिए 75 प आपके पास 91 आ रहा है मतलब एक्यूरेसी आपके पास क्या हो गई है लो हो चुकी है तो अभी मैं क्या कर रहा हूं गाइ यहां पर वापस से थ्री फीचर डालूं और थ्री फीचर पे देखूं तो थ्री फीचर पे मुझे लिए अच्छी एक्यूरेसी मिल रही है इसी तरह से मैं फोर फीचर डालूं तो फोर फीचर पे मुझे यहां पर देखिए एक्यूरेसी अभी लो हो चुकी है प व लो हुई है लेकिन हुई है लो तो दैट इज अ फॉरवर्ड एलिमिनेशन नीक जहां पे आप क्या कर रहे हैं फॉरवर्ड एलिमिनेशन लगा रहे हैं अच्छा इसके अंदर यदि मुझे बैकवर्ड एलिमिनेशन लगाना हुआ तो बैकवर्ड एलिमिनेशन लगाना हुआ तो मैं यहां पे क्या करूंगा इसको फाल्स कर दूंगा देखिए फॉरवर्ड के लिए हमें क्या करना है यहां पर ट्रू करना है और बैकवर्ड के लिए हमें क्या करना है यहां पर सिंपल सा फाल्स करना है यदि मैं बैकवर्ड एलिमिनेशन लगाऊं यहां पर तो देखिए मेरे पास बैकवर्ड एलिमिनेशन में कितने है फोर है टेक्निक फोर पे देख लेते हैं यहां पर तो फोर पे भी वही मिलेगा यहां पर अब यहां पर मैं बात करूं कि थ्री पे कितना वाला है बैकवर्ड एलिमिनेशन के अंदर तो रन करने पर बैकवर्ड एलिमिनेशन में थ्री पे भी वही मिलेगा राइट तो बेसिकली गाइस बैकवर्ड एलिमिनेशन और फॉरवर्ड एलिमिनेशन आप यहां पर किसके हेल्प से लगा सकते हैं एमएल एक्सटेंड के थ्रू यहां पर फाइंड आउट कर सकते हैं तो सबसे पहले आपको क्या करना है फ्रीक्वेंसी सीक्वेंशियल फीचर सिलेक्टर को सबसे पहले कॉल करना है यहां पर यस सबसे पहला काम आपका ये है फिर एल आड के नंबर ऑफ फीचर्स आपको देना है यहां पर आप फीचर को अलग-अलग चेंज करते रहिए अपने आप आपके पास क्या करेगा इस एलआर के ऊपर अपने आप के मॉडल को ट्रेन करेगा ट्रेन करने के बाद वो क्या करेगा आपके आज जो इसने फीचर सबसे बेस्ट सेलेक्ट किए हैं वो आपको यहां पर दे देगा और उसके बाद आपको स्कोर दे देगा अब ये स्कोर आपको वन बाय वन वन बाय वन वन बाय वन आपको सेव कर लेना है जहां पे भी आपको सेव करना है वहां पे और आज के इस वीडियो के जरिए हम समझने वाले हैं कि डाटा सेट को ट्रेन और टेस्ट के अंदर कैसे स्प्लिट किया जाता है अब देखिए जब भी हम हमारे मशीन लर्निंग मॉडल को ट्रेन करते हैं उससे पहले मशीन लर्निंग मॉडल जो होता है वो एक छोटे से बच्चे की जैसा होता है उसको किसी भी तरह की नॉलेज नहीं होती है कि उसे क्या परफॉर्मेंस करनी है किस तरह का आउटपुट जनरेट करना है या किस तरह का प्रेडिक्शन करना है इसके लिए हम क्या करते हैं हमारे डटा सेट को ट्रेन करते हैं ट्रेन करने के लिए हमें ट्रेनिंग डाटा सेट की रिक्वायरमेंट होती है तो हम क्या करते हैं हमारे डेटा सेट को ट्रेन करते हैं ट्रेनिंग डेटा सेट के थ्रू अब हमें डेटा सेट को टेस्टिंग करने की भी जरूरत होती है उसके लिए हम चाहे तो हमारी कंपनी से दूसरे और डाटा भी मंगवा सकते हैं यदि आपकी कंपनी ये बोल दे कि आपके पास एक लिमिटेड अमाउंट ऑफ डाटा है उसी के थ्रू आपको ट्रेनिंग भी करनी है और उसी के थ्रू आपको टेस्टिंग भी करनी है तो फिर आप क्या करते हैं आप अपने डटा सेट में से कुछ पार्ट टेस्टिंग के लिए तोड़ देते हैं और तोड़ने के बाद में उसके थ्रू आप यहां पर टेस्ट करते हैं और टेस्ट करने के बाद अपने मॉडल की एक्यूरेसी को चेक करते हैं यदि मॉडल की एक्यूरेसी अच्छी है तो फिर आप यहां पे फर्द डिप्लॉयड हैं यदि मॉडल की एक्यूरेसी अच्छी नहीं है तो आप इसे फिर से रिट्रेन करते हैं अब यहां पे एक बहुत बड़ा कांसेप्ट यहां पे आता है कि आप अपने डेटा सेट को तोड़ क्यों रहे हैं दो पार्ट के अंदर ट्रेन और टेस्ट के अंदर आप चाहे तो आपका जो पूरा का पूरा डेटा सेट है वो आप ट्रेन के लिए लगा सकते हैं और सेम डेटा सेट आप टेस्टिंग के लिए भी डाल सकते हैं लेकिन ऐसा हमें बिल्कुल नहीं करना होता है यदि आपको python2 के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपने स् स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं इस कांसेप्ट को थोड़ा सा मैं आपको इजी करता हूं छोटे से इजी तरीके से मैं आपको समझाता हूं मान लीजिए कि आपका कल कोई टेस्ट है आपके टीचर ने आपके लिए एक टेस्ट कंडक्ट कराया है कल जो आपका टेस्ट होने वाला है यहां पे उसके लिए आपके टीचर ने क्या किया है 10 क्वेश्चंस आपके लिए रेडी किए हैं अब ये 10 क्वेश्चन आपको रेडी करके आपको देते हैं कि ये लो 10 क्वेश्चन कल एग्जाम में आने वाले हैं यहां पे आप लोग क्या करते हैं उन 10 क्वेश्चन को कंपलीटली रट लेते हैं मतलब आप उसे पूरा मेमोराइज कर लेते हैं अब जब कल आपके पास इन्हीं 10 क्वेश्चन का टेस्ट होने वाला है तो उस वक्त आप क्या करेंगे आप 100% क्वेश्चन को राइट करेंगे क्योंकि आपने उन क्वेश्चन को क्या कर लिया है मेमोराइज कर लिया है और उस वक्त आपका जो स्कोर बनने वाला है वो आपके पास क्या बनेगा आपका 100% स्कोर बनने वाला है सेम एज हमारे मशीन लर्निंग मॉडल के साथ भी होता है हमारे मशीन लर्निंग मॉडल को यदि मैं अपना 100% डाटा यहां पे ट्रेनिंग के तौर पे दे दूं और उसी के बाद उसी डेटा सेट को मैं टेस्टिंग के तौर पे यहां पे दूं तो मेरा मशीन लर्निंग मॉडल जो है वो 100% एक्यूरेट के साथ यहां पे ट्रेंड हो जाएगा यहां पे एक बहुत बड़ी प्रॉब्लम है और वो प्रॉब्लम आपके डे टू डे लाइफ में भी होती है मान लीजिए कि आपने वो 10 क्वेश्चन आपने रट लिए हैं मतलब आपने उस क्वेश्चन को समझ लिया है मेमोराइज कर लिया है और एग्जाम वाले दिन आपने उन्हीं 10 क्वेश्चन को वापस उसी तरह से टिक मार्क करके आपने 100% अपने आंसर दे दिए इन केस यदि मैं आपके सामने एक नया क्वेश्चन लेके आ जाऊं तो उस वक्त आप लोग क्या करेंगे उस क्वेश्चन को गलत कर देंगे आप नए क्वेश्चन को हैंडल करने के लिए कैपेबल नहीं हो पाएंगे सेम मैस हमारे मशीन लर्निंग मॉडल के साथ भी होता है यदि मैं अपने मशीन लर्निंग मडल को 100% डाटा को ट्रेनिंग के लिए दे दूं और उसी 100% डाटा को टेस्टिंग के लिए दे दूं तो एक्यूरेसी जो हमारा स्कोर होता है वो हमारे पास 100% मिल जाएगा लेकिन जब भी हमारे पास एक नई सिचुएशन आएगी नया डाटा आएगा उस वक्त वो मॉडल हैंडल नहीं कर पाएगा और उस वक्त वो अपना आंसर बहुत ही गलत देगा इसीलिए हम हमारे डटा को क्या करते हैं ट्रेन टेस्ट स्प्लिट करते हैं अब ट्रेन टेस्ट स्प्लिट को वापस तरीके से समझता है मान लीजिए कि आपके एग्जाम के अंदर 10 क्वेश्चन आने वाले हैं और आपके टीचर ने आपको बोला कि ये लो सेवन क्वेश्चन आप इसे लर्न कर लो इसी के सिमिलर आपके टेस्ट में क्वेश्चन आने वाले हैं आप क्या करते हैं उन सेवन क्वेश्चन को इजली तरीके से मेमराइज कर लेते हैं और उनको समझते हैं कि उनके कांसेप्ट क्या लगने वाले हैं पीछे क्या चीजें लगने वाली है फिर उसके बाद जब आप नेक्स्ट डे आते हैं तो आपके पास नए तीन क्वेश्चन होते हैं और नए तीन क्वेश्चन के हिसाब से आपको जज किया जाता है कि आप बेटर परफॉर्मेंस कर रहे हैं या नहीं कर रहे हैं सेम एज हम मशीन लर्निंग मॉडल के साथ भी यही करते हैं मशीन लर्निंग मॉडल को हम हमारा डाटा सेट देते हैं और वो भी कौन सा ट्रे डेटा सेट देते हैं फिर हमारा कुछ बचा हुआ डेटा होता है जो टेस्टिंग डाटा होता है वो अनसीन डटा होता है मशीन लर्निंग मॉडल के लिए उसके थ्रू हम ये जज करते हैं कि हमारा मशीन लर्निंग मॉडल उस अनसीन डाटा के साथ किस तरह से बिहेव कर रहा है क्या वो उसके अंदर भी बेटर एक्यूरेसी दे रहा है या नहीं दे रहा है यदि उस वक्त वो यदि बेटर एक्यूरेसी नहीं देता है तो हम ये मानते हैं कि हमारा मशीन लर्निंग मॉडल अच्छे तरीके से ट्रेन नहीं हुआ है मतलब उसने किसी भी कांसेप्ट को सही तरीके से नहीं समझा है तो फिर हम क्या करते हैं उसे फिर से दोबारा ट्रेन करते हैं इसीलिए हम हमारे डटा सेट को दो पार्ट के अंदर तोड़ते हैं ट्रेनिंग और टेस्टिंग के अंदर तो आई थिंक आई होप सो समझ में आ चुका होगा कि हमारे डटा सेट को ट्रेनिंग और टेस्टिंग के अंदर क्यों तोड़ा जाता है अब ये किस तरह से ब्रेक किया जाता है और इसके पीछे क्या आपका पास फंक्शन काम करता है इसको हम जरा प्रैक्टिकल कू समझते हैं तो मैं ले चलता हूं आपको जुपिटर नोटबुक के अंदर जहां पे मैं आपको ये समझाऊ कि हमारे डेटा सेट को किस तरह से ब्रेक किया जाता है इससे पहले मैं आपको डटा सेट दिखा देता हूं तो देखिए मेरे पास boostcamp.com मशीन लर्निंग का इस्तेमाल कर रहे हैं उसी वक्त आपका अपने डाटा को ट्रेन और टेस्ट के अंदर स्प्लिटिंग करना होता है यदि आप अनसुपरवाइज्ड मशीन लर्निंग का इस्तेमाल कर रहे हैं तो उस वक्त आपको ट्रेन और टेस्ट के अंदर स्प्लिटिंग नहीं करना होता है और एक और चीज़ आप यहां पर ध्यान रखिएगा कि जब आप सुपरवाइज मशीन लर्निंग का इस्तेमाल कर रहे हैं उस वक्त आपका जो डाटा होता है उसके अंदर आपका पास यहां पे इंडिपेंडेंट और डिपेंडेंट डाटा आपको देखने को मिलता है तो सबसे पहले फर्स्ट वर्क आपके पास ये होगा कि आप अपने डेटा सेट के अंदर से डिपेंडेंट और इंडिपेंडेंट डाटा को अलग-अलग कर लें मैं इसको एक सिंपल सेंटेंस में आपको समझाता हूं कि आप अपने डाटा को इनपुट और आउटपुट के अंदर डिवाइड कर लें इनपुट आउटपुट का मतलब ये होता है कि आप अपने डाटा के अंदर इनपुट क्या देने वाले हैं इनपुट देने का मतलब क्या है कांसेप्ट यहां पे कि आप कौन-कौन से फीचर जो हैं वो आप इनपुट्स देंगे मतलब अपने डेटा सेट को देंगे और उससे डिजायर आउटपुट क्या चाहता है जस्ट लाइक ये मेरा एक हाउस प्राइस प्रोडक्शन का डेटा सेट है इसके अंदर देखिए क्राइम znso4 उसके बाद मैं ट्रेन टस्ट पलेट के अंदर डिवाइड करूंगा तो इसको जरा समझते हैं यहां पे चलते हैं हम हमारे chrome's एलियाज ऑफ यहां पे पीडी के नाम से इसे यहां पे ले लिया है उसके बाद मैंने क्या किया यहां पे डटा सेट के नाम से एक वेरिएबल बनाया है और मैंने यहां पे पडी read.csv फंक्शन की हेल्प से हमारा जो डाटा है boostcamp.com डॉट हैड लगाते हुए मैं तीन डाटा देखूंगा अब हमारे डेटा सेट के अंदर सबसे पहले इनपुट और आउटपुट फीचर को अलग-अलग करते हैं तो मैंने यहां पे क्या किया इनपुट अंडर डटा के नाम से एक वेरिएबल लिया है और इसके अंदर मैंने क्या बना र है जो डेटा सेट है उसको लिया मैंने यहां पे और मुझे पता है मेरा इनपुट क्या है यहां पे क्राइम से लगाकर ये जो एल एसटीएसटीएस खा है डटा ये मेरे पास सारा इनपुट फीचर है तो मैं इस डटा सेट के अंदर जाऊंगा डॉट यहां पे आई लॉक का इस्तेमाल करूंगा यहां पे देन स्क्वायर बैके सारी नंबर ऑफ रो लेने वाला हूं यहां पे और मैं सारे नंबर ऑफ कॉलम लेने वाला हूं और मैं -1 छोड़ दूंगा -1 छोड़ने का हो है मैं अपने हाउस प्राइस को छोड़ दूंगा और फिलहाल मैं अपने इनपुट डाटा को आपको दिखाऊं यहां पे तो देखिए मेरा इनपुट डाटा आ गया है जिसके अंदर हाउस प्राइस नहीं है अब क्या करते हैं हमारे डटा को आउटपुट डटा के अंदर कन्वर्ट करते हैं यहां पे तो मैंने यहां पे आउटपुट अंडर डटा के नाम से एक वेरिएबल बना लिया है जहां पे मैं अपने डेटा सेट के पास जाता हूं और इसके अंदर से मेरा जो हाउस प्राइस वाला डाटा है उसको मैं कलेक्ट कर लेता हूं तो मेरा इनपुट आउटपुट डाटा यहां पे डिफरेंशिएबल हैं यहां पे कि इनपुट आउटपुट डेटा कन्वर्ट होने के बाद में ट्रेन टेस्ट स्लिटिंग कैसे करेंगे तो इसके लिए आपको जरूरत पड़ेगी साइकल लाइन की साइकल लन के अंदर आपको जाना है यहां पे उसके अंदर आपको जाना है मॉडल सिलेक्शन के अंदर क्योंकि मॉडल सिलेक्शन के थ्रू ही आप यहां पे इनपुट आउटपुट में कन्वर्ट कर पाएंगे तो आपको जाना है मॉडल सिलेक्शन के अंदर मॉडल सिलेक्शन के अंदर जाने के बाद ट इंपोर्ट करना है इंपोर्ट कैसे करना है ट्रेन ट स्प्लिटिंग के अंदर करना है तो आपको ट्रेन टस्ट स्प्लिट लेना है अब जो ट्रेन ट स्प्लिटिंग है ये आपको चार आउटपुट देने वाला है मतलब ये चार डाटा आपको देने वाला है अब ये चार डाटा कौन-कौन सा होने वाला है तो देखिए आप दे रहे हैं इनपुट आउटपुट दो डाटा अब ये इनपुट डाटा है इसको दो पार्ट में तोड़ेगा ट्रेनिंग और टेस्टिंग अदर आउटपुट टा है इसको भी दो पार्ट में तोड़ेगा ट्रेनिंग और टेस्टिंग अदर तो चलिए इसको कन्वर्ट करते हैं तो इसके लिए x ट्रेन के नाम से x x मैं यहां पे ट्रेन के नाम से एक वेरिएबल बना रहा हूं उसी बाद में x मैं यहां पे टेस्ट के नाम से एक वेरिएबल बना रहा हूं फिर वापस यहां पे y मैं यहां पे ट्रेन के नाम से एक वेरिएबल बना रहा हूं यहां पे अच्छा मैंने आगे एक छोटी सी ट्रेन की स्पेलिंग गलत लिख दी है तो मैंने टी आर ए आई एन ट्रेन की स्पेलिंग वापस सही कर दी है चलिए आगे चलते हैं यहां पे मैंने यहां पे y मैंने यहां पे टेस्ट के नाम से वेरिएबल बना रहा हूं ये चार मैंने वेरिएबल क्रिएट किए हैं जिसके अंदर चार अलग-अलग तरीके के डटा स्टोर होंगे अब मुझे क्या करना है ट्रेन ट स्प्लिट को यहां पे कॉल करना है ट्रंट स्प्लिट को जब आप कॉल करते हैं इसके अंदर सबसे पहले आपका मांगा जाता है इनपुट डाटा मतलब आपका एक्स एक्सेस का डाटा सेकंड चीज मांगा जाता है आपके वट आउटपुट डाटा मतलब y एक्सेस का डाटा आपका पास मांगा जाता है अब ये x एक्सेस और y एक्सेस का डाटा क्या है तो आप अपने डटा को जो इनपुट आउटपुट में कन्वर्ट कर रहे हैं इसको x और y बोला जाता है फिर उसके बाद में मांगा जाता है आपका ट्रेनिंग और टेस्टिंग की साइज अब देखिए ट्रेनिंग और टेस्टिंग की साइज में से कोई भी एक आप साइज दे सकते हैं जैसे मैं टेस्ट की साइज यहां पे देना चाहूंगा अब ये टेस्ट की साइज कितनी हो सकती है तो ये डिपेंड करेगा आपका डेटा सेट के अंदर डटा कितना प्रेजेंट है मतलब यदि आपका डटा 10000 से ज्यादा आपका डाटा यहां पर है तो आप अपने टेस्टिंग की जो साइज है वो 20 टू 30 पर आप रख सकते हैं लेकिन ज्यादातर केसस में 20 30 20 टू 20 रखा जाता है 202 25 इतना ऑलमोस्ट यहां पे रखा जाता है तो आप यहां पे टेस्टिंग साइज के अंदर 25 रख सकते हैं जस्ट लाइक मैं 25 रख रहा हूं तो 0.25 यहां पर रखूंगा एंड देन रन करूंगा तो मेरा डाटा जो है वो कन्वर्जन हो चुका है दो पार्ट के अंदर टूट चुका है चलिए इसको जरा देखते हैं यहां पे तो देखिए मैं x टेस्ट को इस्तेमाल करूं तो ये देखिए मेरा टेस्टिंग का डटा आ चुका है यहां पे फिर मैं x का इस्तेमाल करूं x यहां पे ट्रेन का इस्तेमाल करूं तो मेरा ट्रेनिंग का भी डेट आ चुका है इसी तरह से देखिए मैं y ट्रेन का इस्तेमाल करूं यहां पे तो मेरा y ट्रेन का भी डटा आ चुका है और इसी तरह से मैं y टेस्ट का इस्तेमाल करूं तो मेरा टेस्टिंग का भी आ चुका है तो इसने मेरे डटा को क्या कर चुका है दो पार्ट के अंदर डिवाइड कर चुके हैं अच्छा देखते हैं क्या क्या ये वाकई में ट्रेनिंग और टेस्टिंग के अंदर स्प्लिट करने की वजह से क्या ये 25 पर में स्प्लिट हुआ है तो उसको चेक करने के लिए मैं करूंगा डेटा सेट के पास जाऊंगा डॉट यहां पर मैं शेप को कॉल करने वाला हूं शेप को कॉल करता है तो मेरे पास यहां पे नंबर ऑफ रो दिख जाती है जो कि 500 है और कॉलम है हमारे पास 14 मैं क्या करता हूं यहां पे ट्रस्टिंग की सेस और ट्रेनिंग की शेप देखता हूं यहां पे तो मैं x ट्रेन डॉट यहां पर मैं शेप को इस्तेमाल करूं रन करूं तो मेरे पास यहां पे 379 दिखता है यहां पे x यहां पे टेस्ट डॉट यहां पर मैं शेप का इस्तेमाल करूं तो आप यहां पे देख पाएंगे कि 127 यहां पे मुझे दिखती है तो बेसिकली मेरा जो डाटा है वो वाकई में स्प्लिट हो चुका है यहां पे और यही चीज आप यहां पे वॉइस शेप को भी देखेंगे तो मैं y अ यदि मैं ट्रेन डॉट यहां पर मैं शेप को कॉल करूं तो देखिए मेरे पास यहां पे अ 379 और 379 आ चुकी है यहां पे और यहां पे y टेस्ट डॉट यस टेस्ट डॉट यहां पर मैं शेप को कॉल करूं तो देखिए यहां पे 127 यहां पे शप भी आ चुकी है तो मेरा जो डाटा है वो ट्रेनिंग और टेस्टिंग के अंदर यहां पे स्प्लिट हो चुका है ट्रेनिंग डाटा को कब देंगे यहां पे जब आप मॉडल बिल्ड कर रहे हैं तब यहां पे टेस्टिंग डाटा को कब देंगे आप यहां पे जब आप यहां पे मॉडल की एक्यूरेसी को चेक करना चाहते हैं कि वो नए डेटा सेट के साथ यहां पे कितना अच्छा परफॉर्म कर पाता है ये देखने के लिए क्या करेंगे आप यहां पे टेस्टिंग देंगे तो आई थिंक आई होप सो समझ में चुका होगा कि आप अपने डाटा को ट्रेन और टेस्ट के अंदर किस तरह से स्प्लिट कर रहे हैं और आज के इस वीडियो के जरिए हम बात करने वाले हैं रिग्रेशन एनालिसिस के बारे में देखिए जब भी आपके पास आपका डेटा सेट आता है और उस डेटा सेट के अंदर आपको आपको प्रोडक्शन करने के लिए बोला जाए तो वहां पे आपका जो भी आउटकम होता है उस आउटकम के बेसिस पे आप डिसाइड करते हैं कि यह रिग्रेशन एनालिसिस का होगा या फिर क्लासिफिकेशन एनालिसिस का होगा अब देखिए जो भी आपका आउटकम आ रहा है यदि आपका आउटकम कंटीन्यूअस इन नेचर के अंदर आपको देखने को मिले कंटीन्यूअस इन नेचर के अंदर मतलब है कि आपका जो आउटकम है वो लगातार चलता जा रहा है यहां पे मतलब एक नेचुरल नंबर के तौर पे आपको देखने को मिल रहा है यहां पे तो आप उसके अंदर रिग्रेशन एनालिसिस को आप इस्तेमाल करेंगे इसको समझने के लिए मैं आपको एक डेटा सेट दिखाता हूं और उस डेटा सेट के अंदर हम ये चीज देखते हैं तो चलिए मैं अपने एक डाटा सेट पे आ चुका हूं और ये है हमारे पास कार डेटा सेट अब ये कार डेटा सेट क्या है तो कार डटा सेट आपके पास बहुत सार सी डिफरेंट डिफरेंट कार का आपके पास एक डाटा सेट है जहां पे आपके पास उस कार का क्या नाम है वो कार कब लॉन्च हुई थी उसके अंदर कौन-कौन सी चीजें हैं यहां पे मतलब कौन-कौन से फीचर्स यहां पर है उसके बेसिस पे आप यहां पे अभी उस कार की करंट वैल्यू क्या हो सकती है वो आप डिसाइड करते हैं आपने काफी ऐसी वेबसाइट के ऊपर विजिट किया होगा जहां पे आप अपनी ओल्ड कार को सेल करने जाते हैं तो वो ओल्ड कार की सिचुएशन के हिसाब से आपको प्राइस प्रेडिक्शन करके देता है तो बस वही हमारे पास यहां पे डेटा सेट है अब इस डेटा सेट के अंदर हम यहां पर देखें तो आपको सबसे पहले आपको कार्ड नेम देखने को मिलेगा फिर आपको ईयर फिर प्रेजेंट अ प्राइस आपका किलोमीटर ड्राइव फ्यूल टाइप्स सेलिंग टाइप्स ट्रांसमिशन टाइप एंड ओनर्स ये सारी चीजें देखने को मिलेगी इसके बेसिस पे आपको ये चीज पता लगानी है कि इस कार की सेलिंग प्राइस क्या हो सकती है सेलिंग प्राइस को देखना है तो सेलिंग प्राइस के अंदर जब भी भी आप यहां पर चीजें देखते हैं तो आपको हमेशा और हमेशा कंटीन्यूअस इन नेचर के अंदर आपको देखने को मिलती है इसका मतलब बेसिकली गाइज बात करें यहां पे कि आपके पास यहां पे रिग्रेशन एनालिसिस लगने वाली है अब हम यहां पे ये जानते हैं कि रिग्रेशन एनालिसिस के अंदर हमारी कौन-कौन सी एल्गोरिथम्स होती है तो बेसिकली गाइज रिग्रेशन एनालिसिस की जो एल्गोरिथम्स हैं इनको दो पार्ट के अंदर कैटेगरी इज कर रखा है फर्स्ट है आपके पास यहां पे लीनियर आपके पास एल्गोरिथम्स और दूसरी है नॉन लीनियर एल्गोरिथम अब ये लीनियर एल्गोरिथम और नॉन लीनियर एल्गोरिथम हम किस बेसिस पे बोलते हैं तो बेसिकली जब आपके पास आपका जो इनपुट फीचर है और जो आपका आउटपुट फीचर है यदि आपका इनपुट और आउटपुट फीचर दोनों लीनियर आपके के पास रिलेशनशिप को रखते हैं तब आप इस्तेमाल करते हैं लीनियर एल्गोरिथम को और जब आपके पास आपका इनपुट फीचर और जब आपका आउटपुट फीचर के बीच में लीनियर रिलेशनशिप ना हो तब आप यहां पे नॉन लीनियर एल्गोरिथम को इस्तेमाल करते हैं मतलब बेसिकली आपके पास जितने भी आपके इनपुट फीचर्स हैं इनपुट फीचर का मतलब मैं यहां पे बेसिकली गाइज बात करूं कि देखिए सेलिंग प्राइस हमारे पास क्या है एक हमारा आउटपुट फीचर है मतलब हम यहां पे प्रेडिक्शन करने वाले हैं और बेसिकली कार नेम ईयर्स प्रेजेंट प्राइस फ्यूल टाइप्स वगैरह ये जितनी भी चीजें हैं ये हमारे पास क्या है हमारे इनपुट फीचर्स हैं तो बेसिकली गाइज हमारे पास जो हमारा आउटकम है और जो हमारा इनपुट्स है इनके बीच में यदि आपका लीनियर रिलेशनशिप है तो आप लीनियर एल्गोरिथम को प्रेफर करते हैं यदि इनके बीच में आपका लीनियर रिलेशनशिप नहीं है तो आप नॉन लीनियर को प्रेफर करते हैं तो इन्हीं के केसेस के अंदर हमने इनको दो पार्ट के अंदर कैटेगरी इज कर रखा है देखिए यदि मैं बात करूं यदि हमारे इनपुट फीचर और आउटपुट फीचर के बीच में लीनियर रिलेशनशिप है तब आप लीनियर रिग्रेशन को इस्तेमाल करते हैं लीनियर रिग्रेशन के अंदर आपकी जो पहली एल्गोरिथम होती है वो आपकी सिंपल लीनियर रिग्रेशन होती है उसके बाद आप चले जाते हैं मल्टी लीनियर के ऊपर जब आपके पास इनपुट फीचर एक से ज्यादा हो जाते हैं इसी के अंदर आपको लासो रिग्रेशन और रिज रिग्रेशन भी आपको देखने को मिलती है अब नेक्स्ट टॉपिक आता है यहां पे कि यदि आपके पास इनपुट आउटपुट फीचर लीनियर रिलेशनशिप के अंदर नहीं हो नॉन लीनियर हो तो कौन-कौन से एल्गोरिथम्स हैं तो इसी के अंदर आपका पॉलीनोट है इसी के अंदर आपका डिसीजन ट्री आपके पास आता है रैंडम फॉरेस्ट आता है सपोर्ट वेक्टर मशीन आता है और के नियरेस्ट नेबर एल्गोरिथम आती है तो ये कुछ एल्गोरिथम्स हैं जिनको हम फ्यूचर में आने वाले वीडियो के अंदर समझेंगे एक-एक करके हम सारी एल्गोरिथम को डिस्कस करेंगे और इनको प्रैक्टिकली तरीके से समझने वाले हैं और आज के इस वीडियो के जरिए हम यहां पर बात करने वाले हैं सिंपल लीनियर रिग्रेशन के बारे में कि सिंपल लीनियर रिग्रेशन की एल्गोरिथम क्या है और ये कैसे वर्क करती है और किस तरह के डेटा सेट के ऊपर हम इसका इस्तेमाल करते हैं तो चलिए वापस हम पहले वाली सिचुएशन पे आ जाते हैं देखिए कॉलेज ने हमें क्या बोला था कि सीजीपीए के बेसिस पे आप हमें पैकेज को प्रेडिक्शन करके दे दीजिए अब यहां पे सीजीपीए कैसा है आपके पास यहां पे हमें उसे कोई मैटर नहीं है लेकिन हमें प्रोडक्शन क्या करना है हमें पैकेज को प्रोडक्शन करना है तो पैकेज का नेचर क्या है हमें वो देखना पड़ेगा पैकेज के नेचर को यदि हम ढंग से देखें यहां पे यदि आपको पाइथन मशीन लर्निंग डाटा साइंस एंड डेटा एनालिसी फीड में अपने आपको को ग्रो करना है तो इसके लिए डब्ल्यू कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपने स्किल को इंप्रूव कर सकते हैं इसके लिए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो पैकेज का जो नेचर है आपके पास यहां पे वो कंटीन्यूअस इन नेचर के अंदर देखने को मिल रहा है इसका मतलब इसके अंदर लगने वाली है रिग्रेशन एनालिसिस लेकिन रिग्रेशन एनालिसिस की यदि मैं लिस्ट को उठा के देखूं तो वहां पे हमारे पास बहुत सारे एल्गोरिथम हैं इसके अंदर मैं कौन सी पर्टिकुलर एल्गोरिथम को यूज़ करूंगा तो इसके अंदर हम यहां पर इसके डेटा सेट के नेचर को देख के पता करेंगे कि इस डेटा सेट का नेचर कैसा है यदि इस डेटा सेट का नेचर लीनियर है आपके के पास यहां पे तो हम यहां पे लीनियर रिग्रेशन को फॉलो करेंगे वैसे हमारा टॉपिक है यहां पर सिंपल लीनियर रिग्रेशन के बारे में तो डेफिनेटली इस डेटा सेट का जो नेचर है वो आपके पास लीनियर रिग्रेशन ही आपको देखने को मिलेगा आगे चलते हुए मैं आपको यह प्रैक्टिकल के थ्रू प्रूफ करके दिखाऊंगा कि इन दोनों का नेचर जो है इन दोनों डेटा इस डेटा सेट का जो नेचर है वो लीनियर रिलेशनशिप को रखता है अब पहले ये जान लेते हैं कि लीनियर रिग्रेशन कैसे काम करता है और इसके अंदर सिंपल लीनियर रिग्रेशन कब इस्तेमाल करना होता है तो देखिए जब भी आपके पास यदि आप का इनपुट फीचर के अंदर केवल और केवल एक ही डाटा देखने को मिले इनपुट फीचर का मतलब है गाइज यहां पे कि आप यहां पे क्या चीज प्रिडिक्ट करना चाह रहे हैं उसको किसके बेसिस पे कर रहे हैं मतलब आपका यहां पे है कि इंडिपेंडेंट वेरिएबल कितने हैं तो बेसिकली इस डाटा को यहां से ढंग से देखें तो इसके अंदर इंडिपेंडेंट वेरिएबल कितना है एक सिंगल इंडिपेंडेंट वेरिएबल है इसका मतलब यहां पे हमारी सिंपल लीनियर रिग्रेशन एल्गोरिथम फॉलो होगी अब यहां पे हमें यहां पे सिंपल लीनियर रिग्रेशन फॉलो होने वाली है देखिए सिपल लीनियर रिग्रेशन तब लगती है जब हमारे पास इनपुट फीचर या फिर मैं बात करूं हमारा इंडिपेंडेंट फीचर केवल और केवल सिंगल हो तब हम यहां पर इस्तेमाल करते हैं अब ये कैसे वर्क करती है इसका वर्क फ्लो क्या है जरा इसको समझते हैं यहां पे तो देखिए जब भी हम बात करें यहां पे कि हमारा इनपुट फीचर सिंगल हो तब हम यहां पे इस्तेमाल करते हैं सिंपल लीनियर रिग्रेशन का जैसे कि हमारे पास सीजीपी हमारे पास क्या है सिंगल इनपुट फीचर है य हमारा जो आउटपुट है वो हमें प्रिडिक्ट करना है तो बेसिकली हम यहां पर सिंपल लीनियर रिग्रेशन का इस्तेमाल करते हैं अब सिंपल लीनियर रिग्रेशन काम कैसे करती है है तो सबसे पहले आप क्या करते हैं आपका जो भी आपका डाटा सेट है उसको आप प्लॉट करते हैं प्लॉट करने पर यदि आपके पास यहां पे लीनियर रिलेशनशिप देखने को मिले तो आप यहां पे इस्तेमाल करते हैं सिंपल लीनियर रिग्रेशन का अब सिंपल लीनियर रिग्रेशन की एल्गोरिथम क्या होती है तो सिंपल लीनियर रिग्रेशन की एल्गोरिथम होती है y = mx3 जो कि बचपन में आपने पढ़ी थी देखिए बचपन में आपने लाइन की इक्वेशन पढ़ी थी y = mx3 वही इक्वेशन आपके सिंपल लीनियर रिग्रेशन की होती है जिसके थ्रू आप प्रेडिक्शन करते हैं अब ये कैसे वर्क करती है जरा इसको समझते हैं यहां पे तो इसको समझने के लिए मैं ले चलता हूं आपको अपने वाइटबोर्ड के ऊपर देखिए आपके पास आपका जो भी डाटा दे रखा है आप उस डाटा को क्या करते हैं आप प्लॉट कर लेते हैं जस्ट हम कुछ इस तरह से देखते हैं मान लीजिए कि आपका कोई एक्स फीचर है या फिर आपके पास x आपके पास इनपुट है जहां पे आपने सीजीपीए आपने लगाया है और आपके पास y आउटपुट है जिसके अंदर आपको क्या करना है पैकेज को आपको प्रिडिक्ट करना है जो कि आपका y होगा अब आप क्या करते हैं कि आपके जो डाटा है इस डाटा को यहां पे प्लॉट करते हैं डाटा जैसे ही आपका प्लॉट होगा तो वो कुछ इस तरीके से यहां पे दिखाई देगा अब मुझे क्या करना है फ्यूचर का प्रेडिक्शन करना है फ्यूचर का प्रेडिक्शन करने का मतलब क्या है कि मेरे पास कोई नया पर्सन आपके पास आता है जिसका सीजीपीए कुछ यहां पर है तो उसके करेस्पॉन्डिंग्ली लीनियर रिग्रेशन की हेल्प से हम एक प्रेडिक्शन लाइन ड्रॉ करते हैं ये प्रेडिक्शन लाइन क्या करती है आपके जो भी डेटा सेट है इस डेटा सेट्स के बीच में से होके यहां पे गुजरती है अब यहां पे यह लाइन यहां से होके क्यों गुजरी है इसका रीजन हम आगे आने वाले वीडियो के अंदर समझेंगे मतलब यही लाइन क्यों बनी है यहां पे कोई और लाइन क्यों नहीं बनी है या फिर बेसिकली गाइज बात करें कि लाइन ही क्यों बनी है कोई और क्यों नहीं बनी है इस सभी का जो रीजन है आपको आगे आने वाले वीडियो के अंदर देखने को मिलेगा तो बेसिकली गाइज आप यहां पे क्या करते हैं कि आपका जो भी डाटा सेट है इस डेटा सेट के बेसिस पे आप यह लाइन को बनाते हैं इस लाइन के बेसिस पे आपका प्रेडिक्शन स्टार्ट होता है अब ये प्रेडिक्शन कैसे होता है जरा इसको देखते हैं यहां पे तो मान लीजिए आपका कोई ये डाटा है जो कि आपका सीजीपी दे रखा है इस सीजीपी के बेसिस पे आपको पैकेज प्रेडिक्शन करना है तो ये क्या करता है इस सीजीपीए को ले जाके इस लाइन के ऊपर ड्रॉ करता है ये ड्रॉ करी हुई लाइन को क्या करता है पैकेज के ऊपर वापस प्लॉट करता है तो यहां पे आपका जो भी पैकेज होगा वो पैकेज आपको देखने को मिल जाएगा बहुत ही सिंपल तरीके से आप यहां पे प्रेडिक्शन कर सकते हैं कि आपका जो भी डटा सेट है उस डेटा सेट के अंदर आप यहां पे एक बेस्ट फिट प्रोडक्शन लाइन बनाते हैं और उस प्रिडिक्शन लाइन के बेसिस पे आपके पास क्या होता है आपका प्रेडिक्शन होता है जैसा कि मैंने आपको यहां पे समझाया आपने क्या किया आपका जो भी डटा सेट है वो आपने लिया इसके ऊपर आपने क्या किया ये जो लाइन है वो यहां पे बनाई जो कि बेस्ट फट लाइन है मतलब एक एल्गोरिथम्स आपने यहां पे लगाई है और फिर आपके पास कोई भी नया डाटा आया है उस नया डाटा सेट को लेके आपने यहां पे रखा और उसके बेसिस पे आपका जो पैकेज है वो आपका प्रिडिक हो गया इस तरीके से आपके पास क्या करती है सिंपल लीनियर रिग्रेशन एल्गोरिथम आपके पास काम करती है सिंपल लीनियर रिग्रेशन के एल्गोरिथम मैं एक बार फिर से बता देता हूं y = आपके पास होती है mx3 अब ये y = mx3 क्या होती है है तो बेसिकली ये एक लाइन की इक्वेशन है जो कि आप यहां पर देख पा रहे हैं अब जरा यहां पे थोड़ा डिटेल के साथ समझते हैं कि ये y = mx0 कैसे है यहां पे m क्या है c क्या है इसको देखते हैं तो बेसिकली गाइज बात करें यहां पे तो देखिए आपके पास आपका जो भी कोऑर्डिनेट एक्सेस होता है जो कि आप यहां पे x एक्सिस और y एक्सिस के अंदर आप यूज करते हैं इसके अंदर यदि आप किसी लाइन को ड्रॉ करते हैं तो उस बनने वाली लाइन की जो इक्वेशन होती है वो आपके पास क्या होती है y = mx3 होती है अब बेसिकली ये लाइन की इक्वेशन बनती कैसे है तो लाइन की इक्वेशन बनाने के लिए आपको क्या चाहिए आपको दो डेटा पॉइंट की जरूरत होती है जस्ट लाइक सपोज कीजिए कि आपके पास यहां पे ये दो पॉइंट है मतलब बेसिकली गाइज यहां पे बात करें कि मैं यहां पे कोई अपनी एक लाइन बनाना चाहता हूं यह लाइन x एक्सिस के साथ कितना एंगल यहां पे रखती है कितना एंगल रखने का मत मतलब है गाइस यहां पे कि कितने डिग्री के साथ झुकी हुई है ये आपके पास क्या कहलाता है m आपके पास कहलाता है जिसे आप यहां पे स्लोप ऑफ द लाइन भी बोलते हैं और इसको हम अल्टरनेटिवली कफिट ऑफ x भी बोला जाता है सेकंड चीज आती है यहां पे ये जो सी सी क्या होती है सी आपके पास जो आपकी लाइन है यहां पे वो वा एक्सिस के साथ कितना कट रखती है वो आपका सी कहलाती है मतलब यहां पे बात करें कि ये y एक्सिस के साथ ये आपका 0 0 कोऑर्डिनेट से कितनी डिस्ट डिटेंस के साथ है यहां पे ये आपके पास क्या कहलाती है c कहलाती है इसको हम इंटरसेप्ट भी बोलते हैं अब देखिए यहां पे बात करें तो जो c होता है वो आपके पास क्या होता है इस पॉइंट से लगाकर इस पॉइंट का जो डिफरेंस होता है वो आपको देखने को मिलता है अब बेसिकली गाइज यहां पे बात करें कि मेरे पास यहां पर यदि दो पॉइंट है जैसे कि आपके पास x1 y1 x2 y2 हमारे पास दो पॉइंट है तो इससे लाइन की इक्वेशन कैसे बनेगी तो सबसे पहले आप क्या करते हैं यहां पर m को निकालते हैं m को निकालने का जो तरीका होता है वो x2 - x1 y2 - y1 ये होता है जो कि आपके पास यहां पे क्या कहलाता है स्लोप ऑफ द लाइन कहलाता है अब ये जो स्लोप ऑफ द लाइन होती है वो तीन तरीके की होती है आपके पास यहां पे कौन-कौन सी होती है जरा इसे समझते हैं देखिए यदि आपकी जो लाइन है वो 90° एंगल से छोटा एंगल बनाती है तो उस वक्त आपके पास जो स्लोप की जो वैल्यू आती है मतलब जो आपकी m की जो वैल्यू आती है वो आपको पॉजिटिव देखने को मिलती है यदि आपकी लाइन का जो एंगल है मतलब जो आपका स्लोप ऑफ द एंगल है यहां पे वो आपका ग्रेटर दन 90 है तो उस वक्त m की वैल्यू आपको नेगेटिव देखने को मिलती है मतलब बेसिकली गाइज यदि आपका ये जो थीटा है मतलब ये जो एंगल है ये आपका लेस दन 90 होगा तो आपको क्या मिलेगा आपको पॉजिटिव वैल्यू देखने को मिलेगी यदि आपका जो थीटा है वो ग्रेटर दन 90 होगा तो आपके पास यहां पे नेगेटिव वैल्यू मिलेगी m की वैल्यू जीरो कब मिलती है m की वैल्यू जीरो उस केसेस में मिलती है जब आपका जो एंगल है थीटा वो बराबर 0 डिी हो जाए मतलब ये जो लाइन है और और ये वाली जो लाइन है वो इक्वल हो जाती है तब आपको m की वैल्यू क्या मिलती है जीरो मिलती है ये होती है स्लोप की वैल्यू अब हम जानते हैं कि c की वैल्यू कितने टाइप्स की होती है तो c की वैल्यू आपको दो तरीके की मिल सकती है एक मिलेगी आपको पॉजिटिव सी दूसरा मिलेगा आपको नेगेटिव c अब इसे भी जरा यहां पर थोड़ा डिटेल के साथ समझ लेते हैं देखिए यदि आपकी जो लाइन है वो आपके पास 0 जीरो एक्सिस के ऊपर की तरफ कट करती है मतलब आपके पास पॉजिटिव y एक्सिस की तरफ कट करती है है तो उस वक्त आपको c की वैल्यू पॉजिटिव देखने को मिलेगी यदि आपकी जो लाइन की इक्वेशन है यदि वो आपके पास नेगेटिव कट करती है y एक्सिस के ऊपर मतलब 0 0 से जस्ट नीचे कट करती है यहां पे तो उस वक्त c की वैल्यू आपको नेगेटिव देखने को मिलेगी नहीं तो आपको पॉजिटिव देखने को मिलेगी तो ये थी आपकी सी की कहानी मतलब आपके पास इंटरसेप्ट की कहानी तो आई थिंक आई होप सो समझ में आया होगा कि आपके पास लाइन की इक्वेशन क्या होती है और ये कैसे काम करती है ये एक आपकी थोड़ी बेसिक मैथमेटिक्स थी जो कि आपके पास यहां पे प्रेडिक्शन के लिए यूज़ करती है आई थिंक आई होप सो आप लोगों को समझ में आ चुका होगा तो फिलहाल आज की वीडियो के लिए बस इतना ही रखते हैं कि सिंपल लीनियर रिग्रेशन कैसे काम करती है और बेसिकली इसकी एल्गोरिथम क्या होती है इसके ऊपर ही हम रखते हैं आने वाले वीडियो के अंदर हम इसे प्रैक्टिकली तरीके से समझेंगे कि सिंपल लीनियर रिग्रेशन कैसे वर्क करती है मतलब हम बेसिकली इस डेटा सेट के ऊपर काम करेंगे और इस डेटा सेट के ऊपर हम हमारी प्रोडक्शन लाइन बनाएंगे और हम हमार हमारे किसी डाटा का फ्यूचर प्रेडिक्शन भी करके देखेंगे और आज के इस वीडियो के जरिए हम बात करने वाले हैं सिंपल लीनियर रिग्रेशन के बारे में अब देखिए सिंपल लीनियर रिग्रेशन की मैं बात करूं तो सिंपल लीनियर रिग्रेशन के बारे में हमने लास्ट क्लास के बारे में डिस्कस किया था जहां पे हमने ये समझा था कि सिंपल लीनियर रिग्रेशन की जो इक्वेशन होती है वो होती है हमारे पास y = mx0 m+ c के जरिए हम क्या करते हैं हमारा एक प्रिडिक्टिव मॉडल बनाते हैं जिसके थ्रू फ्यूचर के अंदर यदि कोई पर्सन अपनी कोई वैल्यू देता है तो उसके करेस्पॉन्डिंग्ली के साथ हमने डिस्कस किया था आज हम यहां पे क्या करने वाले हैं इसके ऊपर एक प्रोजेक्ट बनाने वाले हैं मतलब बेसिकली बात करें तो हम एक डेटा सेट के ऊपर वर्क करेंगे जिसके थ्रू हम सिंपल लिनियर रिग्रेशन को समझने वाले हैं अब चलिए वही डेटा सेट के ऊपर वापस दोबारा देखते हैं तो देखिए ये हमारे पास डेटा सेट है जो कि प्लेसमेंट डेटा सेट है अब मान लीजिए आपके पास कोई कॉलेज आती है और कॉलेज आपको बोलती है कि ये हमारे पास कुछ सीजीपीए है और उन सीजीपीए के बेसिस पे हमारे कॉलेज के अंदर कुछ-कुछ प्लेसमेंट हुए है और ये प्लेसमेंट के कुछ पैकेज दे रखे हैं अब फ्यूचर के अंदर कोई पर्सन हमारी कॉलेज के अंदर एडमिशन लेता है और उसके कुछ सीजीपीए इस तरह से रहते हैं आपका पैकेज कितना लगने वाला है ये चीज हम यहां पे बताना चाहते हैं तो इसके लिए आप क्या करें एक प्रिडिक्टिव मॉडल तैयार कीजिए मतलब एक मशीन लर्निंग का मॉडल तैयार कीजिए जिसके थ्रू ये प्रेडिक्शन हो सके तो इसका मॉडल बनाना बहुत ही ज्यादा सिंपल है ये डाटा हमारे पास क्या है सीएसवी फॉर्मेट के अंदर है और इस सीएसवी फॉर्मेट का नाम है प्लेमें सवी तो चलिए इसका यूज़ करके हम यहां पे मॉडल बनाते हैं तो इसके लिए मैं ले चलता हूं जुपिटर नोटबुक के अंदर अब जुपिटर नोटबुक के अंदर आने के बाद में हम क्या करेंगे पहले सबसे पहले हमारे डेटा सेट को लोड करेंगे तो डेटा सेट को हम यहां पे क्या करते हैं लोड करते हैं और डेटा सेट को लोड करने के लिए हम यहां पे इस्तेमाल करने वाले हैं पांडा का तो मैं यहां पे क्या करूंगा इंपोर्ट करूंगा यहां पे किसे पांडा को इंपोर्ट करूंगा और इसका एक एलएस बना लूंगा पीडी के नाम से ओके उसके बाद में क्या करते हैं हम हमारे डेटा सेट को लोड करते हैं डेटा सेट को लोड करने के लिए मैं पीडी डॉट यहां पर _ सीएवी का इस्तेमाल करने वाला हूं यहां पे मैं अपनी फाइल का नाम विद उसका एड्रेस यहां पे दूंगा तो मैं चलता हूं हमारी ड्राइव के अंदर ओके तो जहां पे हमारी ये फाइल पड़ी है तो मैं आ चुका हूं ड्राइव के अंदर एंड ड्राइव के अंदर आने के बाद में मेरी जो फाइल पड़ी है वो डेटा सेट्स के अंदर जाके आपके पास वीडियो के अंदर फाइल पड़ी है अब मुझे क्या करना है इसका एड्रेस विद नेम देना है तो मैं इसके ऊपर राइट क्लिक करूंगा राइट क्लिक करने के बाद में मैं इसकी प्रॉपर्टी पे जाऊंगा प्रॉपर्टी पे जाने के बाद में पहले क्या करें आप इसका एड्रेस दे दें तो आप यहां जाएं और उसके बाद आप क्या करें अपना एड्रेस दें एड्रेस देने के बाद में आपको क्या करना है फाइल का नाम भी देना है तो मैं इसको कॉपी करके यहां पे आपकी इसकी फाइल का जो नाम है वो भी प्लेसमेंट कर दूंगा एंड देन इसके बाद में आप इसे आगे आल लगाना ना भूले क्योंकि ये रस्टिंग के तौर पे हमारे पास काम करती है तो मैंने इसके आगे क्या लगा दिया r लगा दिया r लगाने के बाद में हम क्या करेंगे हमारा डटा सेट लेंगे डॉट हेड लगाते हुए इसका तीन डाटा जो है यहां पे उसको विजुलाइजेशन करेंगे तो हमारे पास डटा आ चुका है जिसके अंदर हमारे पास सीजीपी है और पैकेज हमें यहां पे दिखाई दे रहा है अब सबसे पहले क्या करें आप अपने डेटा सेट के अंदर देखें कि क्या इसके अंदर कोई नल वैल्यू प्रेजेंट है या नहीं है तो नल वैल्यू प्रेजेंट है या नहीं है इस चीज को देखने के लिए मैं इनल का इस्तेमाल करूंगा तो मैं डेटा सेट के अंदर जाऊंगा डॉट यहां पर इनल को मैं यहां पे कॉल करने वाला हूं और डॉट यहां पर सम को कॉल करूंगा देन जैसे ही रन करूंगा तो इसके अंदर कोई भी नल वैल्यू प्रेजेंट नहीं है दैट इंश्योर हो चुके है हम यहां पे अब देखिए पहले तो आप ये डिसाइड कीजिए कि इसके अंदर इनपुट क्या है और आउटपुट क्या है तो इनपुट हमारा क्या रहने वाला है सीज पे रहने वाला है आउटपुट क्या रहने वाला है हमारा पैकेज रहने वाला है मतलब y = mx3 के अंदर जो हमारा डिपेंडेंट और इंडिपेंडेंट वेरिएबल होता है जैसे कि मैं आपको यहां पे लास्ट टाइम भी हमने बात की थी कि हमारे पास क्या होता है एक डिपेंडेंट वेरिएबल होता है और एक इंडिपेंडेंट वेरिएबल होता है तो सबसे पहले आप डिपेंडेंट और इंडिपेंडेंट वेरिएबल को अलग-अलग कर लें तो यहां पे देखिए y आपका पास क्या होता है डिपेंडेंट होता है और क्या होता है इंडिपेंडेंट होता है मतलब आप किसके बेसिस से क्या निकालना चाहते हैं तो मैं यहां पे सीजीपी के बेसिस पे पैकेज को निकालना चाह रहा हूं तो इसलिए मुझे इंडिपेंडेंट और डिपेंडेंट वैल्यू को अलग-अलग करना पड़ेगा तो देखिए कैसे अलग करेंगे तो देखिए x = टू एक वेरिएबल बना लेते हैं वहां पे जाके हम क्या करेंगे हमारा डेटा सेट को लेंगे एंड देन स्क्वायर ब्रैकेट करके यहां पे जो सीजी पे है उसे मैं कॉल कर दूंगा अब एक चीज का ध्यान रखिएगा जब भी आप मशीन लर्निंग एल्गोरिथम का इस्तेमाल करने जा रहे हैं या फिर साकल ंड के के अंदर कोई भी आप उसकी एल्गोरिथम को इस्तेमाल करने जा रहे हैं तो उस वक्त आपके पास जो डाटा होता है वो आपके पास क्या होना चाहिए मल्टी डायमेंशन डेटा सेट होना चाहिए मतलब बेसिकली गा बात करें कि आपका जो डेटा की जो डायमेंशन होनी चाहिए वो टू डायमेंशन होनी चाहिए फिलहाल अभी जो आपने यहां पे x = डेटाबेस जो आपने लिया है वो वन डायमेंशन डेटा सेट है यहां पे तो मैं यहां पे पहले देखिए डायमेंशन कैसे पता करूंगा x डॉट यहां पे क्या करूंगा एनम लगाऊंगा रन करूंगा तो मुझे इसके डायमेंशन क्या दिखेगी वन दिखेगी तो मुझे इसे कन्वर्ट करना पड़ेगा किसमें टू डायमेंशन डेटा सेट के अंदर अब देखिए टू डायमेंशन डेटा सेट में कन्वर्ट करने का सिंपल तरीका यहां पे कि इसके अंदर क्या करें आप डबल स्क्वायर ब्रैकेट लगा दीजिए जैसे ही आप रन करेंगे तो देखिए इसकी जो डायमेंशन है वो टू हो चुके है मतलब ये टू डायमेंशन डेटा सेट हमारा तैयार हो चुका है ये हमारा x आ गया अब जो y होता है हमारे पास यहां पे वो y आपका सिंगल डायमेंशन होगा ये आपका यहां पर सिंगल डायमेंशन ही चलेगा यहां पे तो मैं पैकेज ला देता हूं अब मेरा x और y जो है वो दोनों स्प्लिट हो चुके हैं लेकिन x और y दोनों स्प्लिट होने से पहले हमें यहां पे क्या करना पड़ेगा हमें हमारे डाटा का ग्राफ देखना पड़ेगा कि क्या ये लीनियर को फॉलो करता है या नहीं करता यदि हमारा जो ग्राफ है मतलब हमारे डेटा सेट का जो ग्राफ है वो लीनियर को फॉलो ही नहीं करेगा तो हम लीनियर डिग्रेशन को अप्लाई नहीं कर पाएंगे तो बेसिकली गाइज हमें यहां पे क्या करना पड़ेगा ग्राफ बनाना पड़ेगा ग्राफ बनाने के लिए मैं करूंगा यहां पे इंपोर्ट करूंगा इंपोर्ट किसे करूंगा यहां पे गाइज तो मैं सीमन को इंपोर्ट करने वाला हूं एलियास ऑफ एनए उसके बाद मैं यहां पे मैं इंपोर्ट एक और चीज को करने वाला हूं और वो चीज होगी हमारी मैट प्लर लिप तो मैं यहां पे मैट प्लर लिप को भी इंपोर्ट करने वाला हूं क्योंकि उसके बिना तो ग्राफ बिल्कुल नहीं बनने वाला है तो मैं मैट पड पवा प्लॉट और एलियाज ऑफ यहां पे पीएटी का इस्तेमाल करूंगा ओके अब पहले इसका ग्राफ बना लेते हैं ग्राफ बनाने के लिए मैं क्या करता हूं यहां पे इसके नीचे आता हूं और चेक करता हूं कि क्या इसका ग्राफ जो है वो लीनियर को फॉलो कर रहा है या नहीं कर रहा है ले इसको चेक करने के लिए मैं एए डॉट यहां पे क्या कर रहा हूं स्केटर प्लॉट को इस्तेमाल करूंगा तो मैंने स्केटर प्लॉट का इस्तेमाल किया स्केटर प्लॉट के अंदर एक्स एक्सेस के अंदर मैंने दिया यहां पे हमारा सीजीपी है ओके एक्स एक्सेस में मैं क्या डाला हूं हमारा सीजीपीए डाला हूं और मैं वा एक्सेस मतलब जो मेरा प्रिडिक्टेड है वो है हमारा पैकेज तो y एक्सेस को मैं पैकेज में डाल रहा हूं ओके और इसके साथ-साथ मैं क्या करूंगा यहां पे हमारा डाटा भी दूंगा और डाटा इक्वल्स टू मैं यहां पे हमारा जो डेटा सेट है वो मैं पास कराने वाला हूं अब ग्राफ को देखने के लिए मैं पीएटी ड शो फंक्शन का इस्तेमाल करूंगा और रन करूंगा देखिए जैसे मैं इसको शोरन को इस्तेमाल करता हूं तो मेरे पास ग्राफ मेरे पास बन के आ जाता है अब ये ग्राफ काफी बड़ा है और हम इसकी एनालिसिस एक बार में नहीं कर पाएंगे तो इस ग्राफ को थोड़ा सा छोटा कर देते हैं तो पीएटी डॉट मैं यहां पे क्या करूंगा आपके पास फिगर का इस्तेमाल कर डाला हूं तो पीएटी डॉट मैं यहां पे फिगर का इस्तेमाल करूंगा और फिगर के अंदर मैं इस्तेमाल करने वाला हूं किसका फिक्स साइज का फिक्स साइज के अंदर जाके हम क्या करेंगे इस ग्राफ को 56 या 76 ऐसा कुछ बना लेते हैं तो 75 या फोर लगा के रन करेंगे ओके अभी भी काफी बड़ा ग्राफ है यहां पे तो इसको कर देते हैं 4 कमा आपके पास फाइव का ग्राफ अ काफी बड़ा हो गया ग्राफ यहां पे तो इसको कर देते हैं फाइव और यहां पे ले जाके रख देते हैं थ्री ओके ग्राफ अभी ठीक है यहां पे अच्छी तरह से समझ में आ रहा है कि ये पैकेज वर्सेस सीजीपी का ग्राफ है ओके पैकेज वर्सेस सीजीपी के ग्राफ को यदि हम गौर से देखेंगे यहां पे तो हमारा जितना भी डाटा होता है वो एक लीनियर को फॉलो कर रहा है कैसे फॉलो कर रहा है क्योंकि देखिए आप इसका स्केटर प्लॉट का ग्राफ यहां पर ऑब्जर्व करेंगे तो स्केटर प्लॉट जो है आपके पास यहां पे जो स्केटर है आपके पास यहां पे वो अपवर्ड डायरेक्शन में जा रहा है मतलब हमारा जो डायरेक्शन है इसकी यहां पे इस ग्राफ की डायरेक्शन का आप ऑब्जर्व करेंगे ना तो वो सब कुछ क्या है एक डायरेक्शन के अंदर जा रही है अपवर्ड डायरेक्शन के अंदर जा रही है ना कि आपके पास यहां पे स्क्रेड हो रहा है राइट तो ये क्या हो रहा है एक ही डायरेक्शन के अंदर जा रहा है तो इसका मतलब क्या है डेफिनेटली इसके अंदर सिंपल लीनियर रिग्रेशन फॉलो हो जाएगा अब यहां पे मैंने सिंपल लीनियर रिग्रेशन फॉलो हो जाएगा ऐसा क्यों बोला क्योंकि देखिए सिंपल लीनियर रिग्रेशन के अंदर हमने जब डिस्कस किया था तब भी हमने ये बोला था कि सिंपल लीनियर रिग्रेशन के अंदर जो आपका इनपुट कॉलम होता है वो क्या होता है सिंगल होता है मतलब एक इनपुट के बेसिस पे आप अपना आउटपुट डिसाइड कर रहे हैं दैट अ सिंपल लीनियर रिग्रेशन हम आगे मल्टी लीनियर रिग्रेशन के ऊपर भी बात करेंगे ज जहां पे एक से ज्यादा इनपुट्स होंगे और उसके बेसिस पे हम हमारा एक सिंगल आउटपुट प्रोडक्ट करेंगे फिलहाल अभी य इस केस के अंदर हम सिंगल इनपुट के बेसिस पे सिंगल आउटपुट प्रेडिक्शन कर रहे हैं अब यहां पे इस ग्राफ को जरा ऑब्जर्व करिए ढंग से तो आपका जो ग्राफ है मतलब आपके सीजीपी वर्सेस पैकेज का यदि आप ग्राफ को ऑब्जर्व कर रहे हैं तो क्या है एक सिंपल लीनियर को फॉलो कर रहा है यस ना तो ये ज्यादा स्क्रेड हो रहा है ना तो ये ज्यादा क्या हो रहा है स्प्रेड हो रहा है ग्राफ तो मतलब एक सिंपल लीनियर को फॉलो कर रहा है तो यहां पे हमारा सिंपल लीनियर रिग्रेशन वर्क करेगा अब किस तरह से करेगा जरा सा यहां पर समझते हैं तो हमारे पास हमारा डाटा आ गया जहां पे हमने x और y के अंदर स्प्लिटिंग कर चुके हैं अब x और y के अंदर स्प्लिटिंग करने के बाद में हमारे पास कोई और एक्स्ट्रा डटा तो है नहीं अभी इस केसेस के अंदर हमें हमारा जो डाटा दे रखा है वो यही है मतलब मैं एक्सल शीट की बात करूं तो हमें केवल और केवल ये सिंगल एक्सल शीट प्रोवाइड कर रखी है और इसी सिंगल शीट के ऊपर हमें हमारा वर्किंग करना है यहां पे तो अब मुझे मेरे डाटा के अंदर मुझे इसकी ट्रेनिंग भी करनी पड़ेगी और टेस्टिंग भी करनी पड़ेगी तो इसीलिए हम क्या करेंगे हमारे डाटा को ट्रेनिंग और टेस्टिंग के अंदर क्या करेंगे स्प्लिटिंग करेंगे तो चलिए जरा ट्रेनिंग और टेस्टिंग के अंदर स्प्लिटिंग करते हैं तो मैं क्या कर रहा हूं x अंड क्या लूंगा यहां पे ट्रेन लूंगा एंड देन कॉमा x अंड आपके पास यहां पे टेस्ट लूंगा फिर उसके बाद क्या लूंगा y फिर मैं यहां पे ट्रेन लेने वाला हूं एंड देन मैं y अंडरस्कोर आपके पास यहां पे टेस्ट लेने वाला हूं ओके इससे पहले ट्रेन टेस्ट स्प्लिटिंग को यूज़ करने से पहले मुझे साइकेड लाइन के अंदर जाके ट्रेंट स्प्लिटिंग को कॉल करना पड़ेगा तो मैं ऊपर चलता हूं और ऊपर जाने के बाद मैं क्या कर रहा हूं गाइ यहां पे आपके पास यहां पे फ्रॉम मैं जा रहा हूं किसके अंदर साइकल न के अंदर जा रहा हूं सेकंड लान के अंदर जाने के बाद में मैं मॉडल सलेक्शन में जाने वाला हूं मॉडल सलेक्शन में जाने के बाद मैं इंपोर्ट करूंगा और किसे इंपोर्ट करने वाला हूं यहां पे गाइज ट्रें ट स्प्लिटिंग को तो यहां पे हम क्या इस्तेमाल करने वाले हैं ट्रें ट स्प्लिटिंग को यूज़ करने वाले हैं तो मैंने ट्रें ट स्लिटिंग का यूज़ कर लिया अब नीचे आऊंगा यहां पे और यहां आने के बाद में मैं ट्रेन टेस्ट पलेट को कॉल करूंगा इसके अंदर मुझे x और y का जो हमारा डाटा है वो देना है नेक्स्ट चीज हमें यहां पे देनी है हमारी टेस्टिंग साइज या ट्रेंडिंग साइज दोनों में से किसी एक को आप दे सकते हैं टेस्टिंग साइज को मैं कर देता हूं 0.2 मतलब 20 पर टेस्टिंग साइज दे रहा हूं और इसके साथ-साथ मैं क्या कर रहा हूं यहां पे रैंडम स्टेट को भी चूज करूंगा क्योंकि मेरा डाटा यहां पे जितनी बार भी रन करूंगा रैंडम चेंज होता रहेगा उस चेंज से बचाने के लिए मुझे रैंडम स्टेट का इस्तेमाल करना पड़ेगा तो रैंडम स्टेट ले रहा हूं यहां पे रें स्टेट की वैल्यू 42 ले रहा हूं ये आइडियल नंबर आप अपने हिसाब से इसको चेंज कर सकते हैं यदि आपका मॉडल 42 के ऊपर अच्छी तरीके से ट्रेन नहीं हो रहा है और अच्छी एक्यूरेसी लाके नहीं दे रहा है तो उस केसेस के अंदर आपको क्या करना पड़ेगा इस रैंडम स्टेट की वैल्यू को चेंज करना पड़ेगा और चेंज करके आपको अपने मॉडल की एक्यूरेसी अच्छी लेके आ सकते हैं चलिए फिलहाल अभी मैं 42 के ऊपर ही ट्रेन करने जा रहा हूं 42 के ऊपर हमारा जो मॉडल है वो स्प्लिट हो चुका है अब स्प्लिट होने के बाद में मुझे क्या करना है अब मुझे जरूरत है यहां पे लीनियर रिग्रेशन की जिसके थ्रू हम क्या करने वाले हैं हमारा मॉडल बनाने वाले हैं मतलब अब ये जो एल्गोरिथम आप देख रहे हैं y = mx3 इसको अब हम यहां पे कॉल करने वाले हैं अब ये कैसे करेंगे जरा देखते हैं यहां पे तो सबसे पहले आप क्या करें फ्रॉम वापस जाएं आप साइकल लन के अंदर साइकल लन के अंदर जाने के बाद आप क्या करें लीनियर मॉडल को कॉल करें लीनियर मॉडल के अंदर आपको इंपोर्ट करना है किसे आपको इंपोर्ट करना है लीनियर डिग्रेशन को तो जैसे ही आप यहां पे लीनियर मॉडल के अंदर लीनियर डिग्रेशन को कॉल करेंगे तो ये y = mx3 जो इक्वेशन की जो लाइन है वो आपके सामने आ जाएगी अब इसके अंदर आप अपने मॉडल को क्या करेंगे ट्रेन करेंगे मतलब आप अपने मॉडल को फिट करेंगे फिर ट्रेन करेंगे े एंड देन टेस्टिंग के ऊपर जाएंगे चलिए कैसे होने वाला है इसको प्रोसीजर को समझते हैं देखिए साइकल लान के अंदर जो लीनियर मॉडल है ये आपके क्या है एक मॉड्यूल है मतलब साइकल न एक लाइब्रेरी है जिसके अंदर लीनियर मॉड्यूल का एक मॉड्यूल है उस मॉड्यूल के अंदर लीनियर रिग्रेशन नाम की क्या है एक क्लास है अब इस क्लास का मुझे क्या बनाना पड़ेगा एक ऑब्जेक्ट तैयार करना पड़ेगा क्योंकि विदाउट एनी ऑब्जेक्ट हम इसके ऊपर काम नहीं कर पाएंगे तो मैं यहां पे क्या कर रहा हूं एलआर के नाम से एक ऑब्जेक्ट बना रहा हूं और यहां पे मैं अपनी लीनियर डिग्रेशन के क्लास को कॉल कर रहा हूं एलआर के अंदर क्या है आपके पास यहां पे फिट नाम का क्या है मेथड है अब ये फिट नाम का मेथड क्या करता है फिट नाम का मेथड क्या करता है कि आपके पास जो भी आपका डाटा है जैसे कि आपने यहां पे एकस एक्सस और वा एक्सेस का जो भी डाटा दिया है जोकि हमारे पास अभी ट्रेन और टेस्ट के अंदर आ चुका है यहां पे तो जो भी आपने अपना ट्रेनिंग का डाटा दिया है ये उस ट्रेनिंग के डाटा के ऊपर आपके पास क्या करेगा y = mx3 जो आपने यहां पे लाइन की इक्वेशन ली है इस इक्वेशन को ट्रेन करेगा अब यहां पे ट्रेन करने का मतलब क्या है बेसिकली यहां पे ट्रेन करने का बेसिकली मतलब ये है कि आपके पास जो भी आपने इनपुट और आउटपुट दिया है उसके बेसिस पे ये m और c की बेस्ट वैल्यू फाइंड आउट करेगा जो भी आपकी एओसी की बेस्ट वैल्यू इसको मिलेगी वो ये लाके आपको देगा ताकि आपके पास एक बेस्ट फिट लाइन मिले बेस्ट फिट लाइन का मतलब क्या है एक ऐसी लाइन मिले जो आपके पास यहां पे एकदम डाटा के बीच में से होकर गुजरे और आपके पास वहां पे एक बेटर प्रेडिक्शन आपको देखने को मिले बेसिकली इस लीनियर डिग्रेशन का क्या काम है लीनियर डिग्रेशन आपको एक फार्मूला देता है जो कि होता है y = mx3 जहां पे हमारे पास अननोन क्या क्वांटिटी होती है अननोन होती है हमारी एम और सी तो ये जो भी आपका डाटा होता है उस डाटा के अकॉर्डिंग m और c की वैल्यू को फाइंड आउट करके आपको लाके देता है क्लियर चलिए तो ये फिट मॉडल आपके पास क्या करेगा कि आप इसमें जो डेटा देंगे उस डेटा के अकॉर्डिंग ये एमओ सी की बेस्ट वैल्यू फाइंड आउट करता है ताकि आप एक परफेक्टली लाइन ड्रॉ कर सके और वहां से आप अपना प्रेडिक्शन स्टार्ट कर सके चलिए इसके अंदर हम हमारा डेटा दे दें और डेटा क्या करना है यहां पे x ट्रेन देना है दूसरा y मुझे क्या देना है ट्रेन देना है तो ये हमारा मॉडल के अंदर डेटा हमने पास ऑन करा दिया है पास ऑन कराने के बाद हमारा मॉडल जो है वो ट्रेंड हो चुका है अच्छी तरीके से अब अच्छी तरीके से ट्रेंड होने के बाद में अब हम क्या करेंगे हमारा ये मॉडल प्रिडिक्टेड के लिए तैयार है अब हम इसके अंदर हमारा जो भी डाटा देंगे ये उस डाटा के अनुसार हमें यहां पे प्रेडिक्शन लाके देगा चलिए जर इसको टेस्टिंग करते हैं यहां पे किस तरह से टेस्ट करेंगे तो वेरी सिंपल आप यहां पे क्या करें मैं थोड़ा सा एक स्पेस दे रहा हूं यहां पे एल डॉट यहां पे क्या कर रहा हूं प्रेक्ट का इस्तेमाल कर रहा हूं एल आड प्रिडिक्ट मतलब एलआर जो आपने लीनियर रिग्रेशन का जो आपने यहां पे ऑब्जेक्ट बनाया है इसी के अंदर प्रिडिक्ट फंक्शन होता है जिसके थ्रू आप प्रेडिक्शन कर सकते हैं अब ये प्रेडिक्शन कैसे करना है तो देखिए मैं इसमें टू डायमेंशन डेटा सेट दे रहा हूं चलिए इस प्रेडिक्शन को समझने के लिए मैं क रहा हूं यहां पे देखिए सीजी पे रखा है 6.89 ओके इसके अकॉर्डिंग इसका पैकेज जो है वो 3.26 का लगा है ठीक है तो मैं यहां पे भी क्या करूंगा सीजीपीएस 6.89 ही दूंगा यदि मेरा आंसर इसके लम समम करीब-करीब इसके पासपास आता है दैट इ माय राइट आंसर यदि नहीं आता है तो फिर हम मॉडल को फिर से रिटन करेंगे तो चलिए चेक करते हैं यहां पे तो यहां पे मैं इनपुट आउटपुट दोनों ले लेता हूं ठीक है और मैं इनपुट आउटपुट दोनों लेने के बाद में यहां पे रख लेता हूं और ये 6.89 क्या है हमारा इनपुट है तो मैं 6.89 को मैं अपना इनपुट दे देता हूं और रन करता हूं तोतो देखिए इसने क्या प्रेडिक्शन करके दिया है प्रोडक्शन करके दिया है 2.9 ओके ऑलमोस्ट पास है यहां पे थोड़ा सा दूर है लेकिन हां ऑलमोस्ट पास है यहां पे तो ये अच्छी तरीके से हमारा आंसर प्रिडिक्शन करके दे रहा है यदि हम इसे और अच्छा ट्रेंड करना चाहे तो वो भी हम कर सकते हैं लेकिन हम कैसे पता लगाएंगे कि ये अच्छी तरीके से आपके पास प्रोडक्शन करके दे रहा है या नहीं दे रहा है इसको चेक करने के लिए आपको चेक करना पड़ता है एक्यूरेसी स्कोर अभ ये एक्यूरेसी स्कोर क्या है एक्यूरेसी स्कोर ये है कि आपका जो ये y = m प् जो आपने मॉडल ट्रेन किया है फिट के थ्रू जहां पे आपने अपना ट्रेनिंग और टेस्टिंग ट्रेनिंग का डाटा दिया है यहां पे x ट्रेन बांड स् कोटन का जो आपने डाटा दिया है उसके बेसिस पे इसने कितने परसेंट एक्यूरेसी के साथ काम किया है अब ये एक्यूरेसी निकलेगी कैसे तो इस एक्यूरेसी को निकालने के लिए हम क्या करेंगे यहां पे हम यहां पे एक मेथड का इस्तेमाल करेंगे किसका एलआर के अंदर आपके पास क्या है स्कोर नाम का एक मेथड है इस स्कोर नाम के मेथड के अंदर आप अपना x टेस्ट दे दीजिए कॉमा y टेस्ट दे दीजिए मतलब अपना ट्रेनिंग और टेस्टिंग का डाटा दे दीजिए ये कंपेयर करके बता देगा कि कितने परसेंट एक्यूरेसी के साथ आपका आंसर मिल रहा है चलिए इसे रन करते हैं तो ये 77 पर एक्यू सी के साथ अपना आंसर दे रहा है आप कहेंगे 0.77 दे रहा है कोई बात नहीं आप इसे मल्टीप्लाई बाय 100 कर दीजिए क्योंकि परसेंटेज में आपको निकालना है तो मल्टीप्लाई बा 100 करना पड़ेगा जैसे ही आप रन करेंगे तो ये 77 पर आपको अच्छी एक्यूरेसी के साथ आंसर दे रहा है ओके अभी ये एक्यूरेसी बहुत ही ज्यादा पुअर एक्यूरेसी है मैं इसको अच्छी एक्यूरेसी नहीं मानता हूं क्योंकि देखिए जितनी ज्यादा अच्छी एक्यूरेसी होगी उतना ही मॉडल अच्छे तरीके से आपको रिजल्ट देने वाला है तो एक्यूरेसी स्कोर कितना अच्छा होना चाहिए तो ये कोई डिफाइंड चीज नहीं है एक्यूरेसी स्कोर कितना अच्छा होना चाहिए ये आपके डिपेंड करेगा आपके मॉडल टू मॉडल यस आपके मॉडल टू मॉडल वेरी करेगा कि कितना एक्यूरेसी आपके पास है लेकिन हां आपको बेस्ट टू बेस्ट एक्यूरेसी आपको लानी चाहिए ओके तो अभी जो एक्यूरेसी आई है 77 जो एक्यूरेसी आई है ये कोई इतनी ज्यादा अच्छी एक्यूरेसी नहीं है ये बहुत ही पुअर एक्यूरेसी है तो हम चाहे तो इसे रिट्रेन कर सकते हैं रिटेन करने के लिए मुझे क्या करना पड़ेगा रिटेन करने का तरीका यहां पे सिंपल सा है कि ये जो ट्रेन ट स्प्लिटिंग का जो मॉडल लिया है जहां पे मैंने रैंडम स्टेट इ 42 लिया है इस 42 की वैल्यू को चेंज करूंगा अब कहां से चेंज करूंगा तो जीरो से लगाकर आपके पास यहां पे 50 70 तक में मैं लगातार चेंज करता रहूंगा और हर एक की एक्यूरेसी स्कोर को नोट डाउन करता रहूंगा जहां पे मुझे बेस्ट एक्यूरेसी मिलेगी मैं वही मॉडल को सेलेक्ट करके अपने आंसर सेलेक्ट कर लूंगा राइट तो पहला तरीका यहां पे ये है दूसरे और भी तरीके हैं हमारे पास मॉडल की एक्यूरेसी बढ़ाने के लिए वो आने वाले वीडियो के अंदर हम अच्छे तरीके से समझेंगे लेकिन फिलहाल आज का काम हमारा एक्यूरेसी बढ़ाने का नहीं है आज हमें ये समझना है कि ये मॉडल कैसे काम कर रहा है राइट चलिए अब मैंने जैसा कि आपको बोला कि ये जो लीनियर रिग्रेशन है ये क्या इक्वेशन बनाता है ये इक्वेशन कुछ इस तरह से बनाता है जैसे कि मैं आपको बोलूं य यहां पे तो ये इक्वेशन बनाता है y = m मल्टीप्लाई का साइन लगाऊंगा x प्स आपके पास c ये इक्वेशन बनाता है तो क्या ये वाकई में यही इक्वेशन बनाता है और क्या ये वाक में यही आंसर हमें रिटर्न करता है चलिए तो देखिए कैसे पता लगाएंगे तो बहुत ही सिंपल है ये जो एलआर है यहां पे एलआर के अंदर जाके आप यहां पे कोफ को कॉल कीजिए कोफ अंडरस्कोर आपके यहां पे कोफ अंडरस्कोर कॉल कीजिए तो ये आपको रिटर्न करता है कफिट अब कोफिया होता है तो कफिट आपके पास जो यहां पे x के पास वाला जो m है दैट इज योर कफिट दैट इज योर कफिट चलिए अब यहां पे मुझे निकालना है इंटरसेप्ट तो मैं इंटरसेप्ट भी निकाल सकता हूं एल आ डॉट यहां पे क्या करूंगा इंटरसेप्ट को कॉल करूंगा तो इंटरसेप्ट भी मिल जाएगा इंटरसेप्ट क्या है यहां पे इंटरसेप्ट है आपके c की वैल्यू ये c की वैल्यू क्या आ रही है नेगेटिव आ रही है अब देखिए यहां पे आपके पास जो m की वैल्यू है मतलब m की वैल्यू है वो जो पॉजिटिव आई है m की वैल्यू पॉजिटिव आई है इसका मतलब क्या हुआ गाइ यहां पे कि यहां पे जो एंगल बना है मतलब जो लाइन के बीच का जो एंगल बना है वो 0 टू 90 के बीच में है राइट मैं जस्ट एग्जांपल के तौर पे आपको बताऊं यहां पे तो आपके पास जो एंगल बना है वो कुछ इस तरह से मतलब आपकी जो लाइन है वो कुछ इस तरह से आपके पास आ रही है जैसे कि आपके जो ये तो है आपकी बेस लाइन और ये है आपकी प्रोडक्शन लाइन कुछ इस तरह से आएगी क्योंकि एंगल जो है वो आपके पास क्या है आपका माइनस में नहीं है पॉजिटिव में है पॉजिटिव में है मतलब 90 से आपके पास कम है राइट पहली चीज तो ये हो गई सेकंड चीज क्या हुई कि आपके पास यहां पे जो इक्वेशन है इसके अंदर जो c की वैल्यू है आपके पास c की वैल्यू देखिए तो वो क्या है नेगेटिव में आई है नेगेटिव में आने का सेंस क्या है कि यहां पे कि ये जो 0 0 है इससे नीचे आपका पास कट की है मतलब नेगेटिव y एक्सिस के अंदर आपकी जो लाइन है वो आपके पास कट करके गई है चलिए अब यहां से इक्वेशन हम कैसे बना सकते हैं a = mx7 कैसे बना सकते हैं क्योंकि देखो प्रोडक्ट जो फंक्शन है यहां पे जो हमने यूज़ किया है यहां पे भी तो ये प्रोडक्शन लाइन यूज़ की गई है यहां पे भी तो ये चीजों को इस्तेमाल करके काम किया है बिल्कुल यहां पे यही चीजों का इस्तेमाल करके कि है कैसे जरा समझो यहां पे देखो y = m m की वैल्यू क्या है हमारे पास ये है हमारी m की वैल्यू तो मैं इसे कॉपी करके m की वैल्यू रखूंगा मल्टीप्लाई बाय x रखूंगा प्लस यहां पे c c की वैल्यू क्या है नेगेटिव में है तो मैं इसे कॉपी करूंगा और यह प्लस हटा के मैं नेगेटिव में डालूंगा तो फाइनली हमारे पास ये इक्वेशन बनी है मतलब ये हमारी इक्वेशन थी हमने मॉडल को फिट किया फिट करने के बाद उसने कफिट की वैल्यू ये लेके आया और इंटरसेप्ट की वैल्यू ये लेके आया इसके बेसिस पे ये इक्वेशन तैयार हुई है चलिए हम एक काम करते हैं 6.8 इस इक्वेशन में रख के देखते हैं कि क्या इससे ये आंसर निकल के आता है या नहीं आता चलिए जरा देखते हैं यहां पे तो मैं एक काम करूंगा इट्स वेरी सिंपल ये मैं यहां पे इसे कॉपी करूंगा नीचे ले जाकर पेस्ट करूंगा और इसे y को हटा देते हैं क्योंकि मुझे इससे कोई मतलब नहीं है और यहां पे ये जो 6.8 है ना मैं इसको क्या करूंगा जस्ट कॉपी करूंगा और यहां ले जाके मैं देन पेस्ट कर दूंगा चलिए एंटर करके रन करते हैं तो देखिए ये वाला जो आंसर है और ये वाला जो आंसर है एक्यूरेट हमारे पास सेम निकल के आया है यस आपके पास कहीं पे भी कोई मिस्टेक नहीं है हां ये 6 1.6 निकल के आया ये 1.4 निकल के आया क्योंकि ये आगे जो चीजें हैं वो आपके पास यहां पे कैरी फॉरवर्ड होके आपके पास सॉल्व हो चुकी है ओके तो मतलब क्या है गाइज यहां पे कि आपके पास ये जो फिट है ये फिट कर क्या रहा है ये फिट ये कर रहा है कि ये जो y = mx3 जो लाइन की इक्वेशन है यहां पे आपको m और c की वैल्यू लाके देता है ओके इस m और c की वैल्यू के अंदर आप जब भी अपना x रखते हैं यहां पे तो ये x के अकॉर्डिंग आपको प्रेडिक्शन मॉडल बना के देता है और ये प्रिडिक्ट मॉडल जो प्रिडिक्ट फंक्शन है ये प्रिडिक्ट फंक्शन यही काम करता है प्रिडिक्ट फंक्शन क्या काम करता है गाइज यहां पे कि आप जो भी अपना डाटा दे रहे हैं इस डाटा को ले जाके ये x में रख रहा है और x में ले जाके उस इक्वेशन को सॉल्व कर रहा है और सॉल्व करके आपको रिजल्ट निकाल के दे रहा है बस ये इसका यही काम है चलिए अब मैं यहां पे ये जानना चाहता हूं कि ये मेरा डेटा सेट है इस डेटा सेट के अंदर जो हमारे लाइन की इक्वेशन हमारे पास आई है y = m c है जो इक्वेशन आई है वो इसके अंदर कहां लाई कर रही है मतलब इसके अंदर से कहां से गुजर रही है ये चीज मुझे जानना है अब ये चीज मुझे जानना है तो ये कैसे जानेंगे तो जरा इसको समझते हैं यहां पे तो इट्स अ वेरी सिंपल टास्क आप क्या करें ये मैं ग्राफ को वापस नीचे ले चलता हूं यहां पे ठीक है मैं इस ग्राफ को कर रहा हूं नीचे ले जा रहा हूं यहां पे और नीचे ले जाके मैं पेस्ट कर देता हूं ओके ग्राफ की साइज को थोड़ा यहां पे इंक्रीज कर देते हैं क्योंकि ग्राफ बहुत छोटा दिख र दे रहा है तो मैं इस ग्राफ की साइज को थोड़ा बड़ा करूंगा तो इसकी जो विड्थ है इसको फोर डाल देते हैं एंटर करते हैं ओके अब ग्राफ काफी अच्छा दिखाई दे रहा है अब मुझे इसके अंदर क्या करनी है एक प्रोडक्शन लाइन बनानी है जो कि हमारी ये प्रोडक्शन लाइन है कौन सी है ये प्रोडक्शन लाइन ये आपका जो फिट है ना ये फिट ये फिट हमें एक प्रोडक्शन लाइन दे रहा है तो बस यही बनानी है तो अब कैसे बनाएंगे इट्स अ वेरी सिंपल टास्क मैं यहां पे क्या करूंगा पीएटी डॉट यहां पे क्या करूंगा आपके पास प्लॉट फंक्शन का इस्तेमाल करूंगा पीएटी डॉट प्लॉट फंक्शन के अंदर मुझे एकस एक्सिस का डाटा देना होता है तो मैं एकस एक्सेस का डाटा कैसे दूंगा तो एक्स एक्सेस का डाटा दूंगा मैं यहां पे हमारा डेटा सेट को ले के आऊंगा डेटा सेट को लाने के बाद में इसी के अंदर हमारा पास जो सीजी प है इसको कॉल करूंगा अब आप बोलेंगे एक तो आपने स्केटर प्लॉट इस्तेमाल किया सी बन का और प्लॉट इस्तेमाल किया है मैट पल लिप का बिल्कुल ऐसा कुछ यहां पे नहीं है आप जो मर्जी चाहे वो प्लॉट एक साथ इस्तेमाल कर सकते हैं चलिए तो मैंने यहां पे x एक्सेस ले लिया है अब बारी है हमारे y एक्सिस की कि मतलब इस एक्स एक्सिस के करेस्पॉन्डिंग्ली आसान है अल डॉट आप क्या करें यहां पे प्रिडिक्ट फंक्शन का इस्तेमाल करें अ डॉट प्रिडिक्ट फंक्शन का इस्तेमाल किया प्रिडिक्ट फंक्शन के अंदर चलिए मैं एक काम करता हूं ये जो मेरे पास डेटा है इस डेटा को बाहर लेके आ जाता हैं यहां पे तो मैं यहां से इसको कट करता हूं और कट करके मैं यहां पे पेस्ट कर देता हूं और ये क्या है मेरा वा पीआरडी मतलब इसका प्रोडक्शन आउटपुट क्या है तो मैं यहां पे y यहां पे पीआरडी लिखूंगा y पीआरडी लगा रहा हूं यहां पे अब इस प्रिडिक्ट फंक्शन के अंदर मुझे टू डायमेंशन डेटा सेट देना होता है अब इस टू डायमेंशन डेटा सेट के अंदर हम कौन सा डटा देते हैं इसके अंदर कौन सा डेटा सेट दें तो कौन से डेटा सेट के अंदर हमारे पास देखिए एक्स एक्सेस का जो डेटा है वो पहले से तैयार है डेटा सेट डबल स्क्वायर ब्रैकेट सीजीपीए पहले से तैयार है तो हम इसी का इस्तेमाल कर लेते हैं तो मैं यहां पे x डाल देता हूं और रन कर देता हूं तो मेरा y पीआरडी जो है वो रेडी हो चुका है ये प्रेडिक्शन लाइन बनाने के लिए रेडी है अ मैं एक स्पेस लाइन दे देता हूं ताकि यहां पे आपका गैप दिखाई दे ओके मैं यहां पे क्या दूंगा पीआरडी दूंगा मतलब इस एक्स एक्सिस के करेस्पॉन्डिंग्ली रन करते हैं बिल्कुल हमारी प्रेडिक्शन लाइन तैयार हो चुकी है अच्छा इस प्रेडिक्शन लाइन को थोड़ा सा अलग से दिखाने के लिए मैं क्या करने वाला हूं गाइ यहां पे मैं यहां पे रेड कलर की लाइन बनाऊंगा तो मैं कलर इक्वल्स टू क्या कर रहा हूं यहां पे आरडी रेड कलर यहां पे डाल देता हूं चलिए रन करते हैं तो ये रेड कलर की लाइन आ चुकी है चलिए एक काम करते हैं ये क्या है किस तरह का है तो मैं इसके लिए लेबल डाल देता हूं और लेबल के अंदर क्या कर रहे हैं गाइ यहां पे ये क्या है हमारा ओरिजिनल है तो मैं ओआरजी डाटा दे रहा हूं यहां पे और ये रेड कलर की लाइन है वो क्या है हमारे पास यहां पे तो ली बी एल लेबल डा देते हैं फिर से और लेबल के अंदर ये क्या लाइन है ये हमारी प्रेडिक्शन की लाइन है तो मैं प्रिडिक्ट लाइन लिख देता हूं यहां पे तो मैं क्या कर रहा हूं यहां पे प्रिडिक्ट आपके पास क्या कर रहा हूं यहां पे लाइन लिख रहा हूं तो अब मुझे क्या करना है गाइस यहां पे कि मुझे लेजेंड को दिखाना है ताकि ये पता चल सके कि ये ब्लू कलर का क्या है और रेड कलर क्या है तो चलिए इसको शो करते हैं कैसे करेंगे गाइज यहां पे बहुत सिंपल है मैं पीएटी डॉट यहां पे क्या करने वाला हूं लीजेंड को इस्तेमाल करने वाला हूं लीजन के अंदर जाऊंगा देन स्क्वायर ब्रैकेट और जो हमारा ओरिजिनल डाटा है सबसे पहले तो रजी लिखूंगा यहां पे यस ओरिजिनल डाटा एंड देन उसके बाद में क्या है हमारे पास यहां पे प्रिडिक्टर लाइन है तो मैं यहां पे लिख दूंगा प्रिडिक्ट लाइन तो इसके लिए मैं करना वाला हूं गाइज यहां पे प्रिडिक्ट आपके पास यहां पे लाइन का इस्तेमाल करने वाला हूं ओके चलिए रन करते हैं तो देखिए डॉट जो है वो ओआरजी मतलब ओरिजिनल डाटा को इस्तेमाल कर रहा है ठीक है रजी मैं यहां पे डाटा लिख देता हूं रिजनल डाटा को इस्तेमाल कर रहा है यहां पे और जो लाइन है यहां पे वो कै की है प्रिडिक्टेड लाइन है जो कि कुछ इस तरह से दिखाई दे रही है यहां पे एक्चुअल में प्रेडिक्शन हो कैसे रहा है वो चीज को जरा समझ लेते हैं तो ये चीज हमने लास्ट टाइम भी देखी थी चलिए एक बार और देख लेते हैं यहां पे तो देखिए मैं पटी पलेस ग्राफ को सेव कर लेता हूं और ग्राफ को सेव करने के लिए मैं सेव फिगर का इस्तेमाल करूंगा और सेव फिगर मैं क्या कर रहा हूं यहां पे आपके पास एक्स वाई जड के नाम से सेव कर लेते हैं सेव करने के लिए मैं यहां पे क्या करता हूं आपके पास प्रिडिक्ट फंक्शन के नाम से सेव कर लेता हूं ओके तो मैं यहां पे सेव करने के लिए प्रिडिक्ट डॉट यहां पे आपके पास जेपीजी में सेव कर लेता हूं राइट तो मैंने यहां पे जेपीजी में सेव कर लिया चलिए ओके तो ये हमारे पास ग्राफ आ चुका है मैं इसको कॉपी करता हूं एंड देन अब मैं समझाता हूं कि इसके अंदर प्रोडक्शन हो कैसे रहा है तो दैट्ची है अब प्रोडक्शन हो क्या रहा है लेट अजूम हमारे पास कोई सीजीपी है एट या फिर एट के आसपास का कोई है हमारे पास सीजी पे तो मैं मान लेता हूं हमारे पास एट सीजीपी है अब ट्स एट सीजीपी के बेसिस पे यह क्या करता है आपके पास इस प्रिडिक्शन लाइन की तरफ चलता है अ मैं परफेक्ट लाइन बनाने की कोशिश करता हूं यहां पे ठीक है तो यह कैसे बनेगा जरा देखें यहां पे तो मान लीजिए हमारे पास क्या हुआ है यहां पे एट से स्टार्ट हुआ है यहां पे तो यह क्या करता है एट से इस तरह से एक लाइन ड्रॉ करता है कुछ इस तरह से ठीक है यह लाइन आपके पास ड्रॉ हो गई है इस लाइन को ड्रॉ करने के बाद में यह क्या करता है इसके करेस्पॉन्डिंग्ली आपका जो पैकेज है वो उसको लेके आता है तो अब इसके करेस्पॉन्डिंग्ली कर देता हूं ताकि आप लोगों को पता चल सके कि हां ये काम क्या हो रहा है ठीक है तो मैं इस कलर ब्लू कर देता हूं अब जैसे कि क्या कर रहा है सबसे पहले क्या कर रहा है एट जो भी आपका पैकेज है ये उसके बेसिस पे वहां जा रहा है और वहां जाने के बाद में ये पैकेज पे जा रहा है अब पैकेज पे जाने के बाद में आपका जो रिजल्ट है वो पैकेज के करेस्पॉन्डिंग्ली तो इस तरह से हमारा प्रिडिक्टेड मॉडल तैयार हो जाता है अब मेन चीज आती है कि इस प्रिडिक्टेड मॉडल के अंदर हम किस तरह से प्रोडक्शन करेंगे मतलब ये जो प्रोडक्शन मॉडल हमारा तैयार हो चुका है तो अब कंपनी को हम कैसे देंगे मतलब किसी भी यूजर को हम कैसे देंगे तो ये जो आपका प्रिडिक्ट फंक्शन है यही आपको अपने यूजर को देना होता है मतलब जो भी आपका यूजर है वो इस यूजर इसके अंदर अपना डाटा डालेगा और डेटा डालने के बाद जो भी इसका रिजल्ट है वो रिजल्ट उसे मिल जाएगा अब मेन चीज यहां पे ये आती है कि यूजर जो डाटा हमें देता है वो कैटेगरी कल भी हो सकता है न्यूमेरिकल भी हो सकता है किसी भी तरह हो सकता है तो हमें क्या सारे प्रोसीजर को वापस दोबारा करके फिर इसके अंदर डटा डालना पड़ेगा यस आपको पास यहां पे सारे डाटा को आपको कन्वर्जन करके फाइनल जो भी आपका डटा न्यूमेरिकल डाटा बनेगा आपको उसमें लाना पड़ेगा और उसके बाद में इसके अंदर डालना पड़ेगा फिर ये आपको एक प्रोडक्शन आउटपुट देगा इस प्रोडक्शन आउटपुट को आप जहां पे क भी शो करना चाहे चाहे आप किसी वेबसाइट पे शो करना चाहे या किसी और चीज पे शो करना चाहे आप आराम से इस पे शो कर सकते हैं राइट तो ये प्रोसेसर है आपको बस सिंपल सिंपल क्या करना है कि आपका जो भी आपका डेटा सेट है जस्ट लाइक ये मेरा डेटा सेट बन के आया है यहां पे इस डाटा सेट के ऊपर आपको क्या करना है सिंपल सा मॉडल को ट्रेन करना है ये जो प्रोसीजर है ये हमारा ट्रेनिंग प्रोसीजर है जहां पे हम क्या कर रहे हैं फिट के थ्रू हमारी जो इक्वेशन है उसके अंदर जो भी हमारे कांस्टेंट एंड कफिट की वैल्यू है उनको फाइंड आउट करर हैं मतलब हम बेस्ट विट लाइन बनाने की कोशिश कर रहे हैं अब बेस्ट विट लाइन बनाने के बाद में हमें क्या करना है हमें बस हमारे जो यूजर है उस यूजर को ये पेडेक फंक्शन लाके देना है अब हमें किस चीज का ध्यान रखना चाहिए हमें हमारी एक्यूरेसी पे ध्यान रखना चाहिए एक्यूरेसी पे फोकस हमारा सबसे अच्छा होना चाहिए एक्यूरेसी जो है हमारे पास और ज्यादा इंप्रूव होनी चाहिए जैसे अभी जो है 77 पर एक्यूरेसी है ये कोई अच्छी एक्यूरेसी नहीं है इतनी ज्यादा अच्छी एक्यूरेसी के साथ हमें रिजल्ट नहीं दे रहा है हमें और अच्छी एक्यूरेसी के ऊपर फोकस करना चाहिए जितनी ज्यादा अच्छी एक्यूरेसी हमें मिलेगी उतना अच्छा प्रिडिक्टेड मॉडल हमें देखने को मिलेगा और आज के इस वीडियो के जरिए हम यहां पर बात करने वाले हैं मल्टीपल इनियर रिग्रेशन के बारे में देखिए सिंपल इनियर रिग्रेशन के अंदर हमारे पास क्या था केवल और केवल सिंगल इनपुट्स था लेकिन नेचर के अंदर हमें मल्टीपल इनपुट्स देखने को मिलते हैं तो अब इसके साथ कैसे डील की जाती है इसे हम समझते हैं यदि आपको डेटा एनालिसिस की फील में अपने आपको को ग्रो करना है तो इसके लिए डब्लू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो देखिए मल्टीपल लीनियर रिग्रेशन के अंदर हमारे पास जो इनपुट्स होता है वो आपके पास क्या होता है बहुत सारे होते हैं इसको जरा देखते हैं यहां पे तो देखिए आपके पास इस एग्जांपल के अंदर आपके पास क्या लिखा है एज लिखा है सैलरी लिखा है और एक्सपीरियंस लिखा है अब आपको बोला जाता है कि आपको एज और एक्सपीरियंस के बेसिस पे आप अपनी सैलरी को प्रेडिक्शन कर दीजिए तो इसके लिए आप इस्तेमाल करते हैं मल्टीपल लीनियर रिग्रेशन का अब देखिए यहां पे जो आप इनपुट्स देंगे तो इनपुट्स आपके पास क्या है दो है और वह कौन-कौन से हैं एक तो आपके पास क्या है एज आपका इनपुट होगा और दूसरा आपका एक्सपीरियंस आपका इनपुट होगा और इसके बेसिस पे सैलरी आपका पास क्या होगा प्रेडिक्शन होगा अब देखिए सिंपल लिनियर रिग्रेशन को जब हमने डिस्कस किया था तो उस वक्त क्या था कि हमारे पास एक इनपुट था और एक ही आउटपुट था उसके लिए हमने क्या किया था कि हमने एक सिंपल सा x एक्सिस एक ले लिया था और दूसरा y एक्सिस ले लेता और इसके बेसिस पे हमारा जो ग्राफ बन रहा था मतलब हमारे पास x और y एक्सिस के बीच में जो हमारा ग्राफ़ बन रहा था वो कुछ इस तरह से बन रहा था और हम क्या कर रहे थे इसके बीच में हम क्या कर रहे थे एक प्रेडिक्शन लाइन बना रहे थे जो कि हमें क्या कर रहा था फ्यूचर में जो भी हमारे पास डटा आएगा उसके बेसिस पे क्या आउटपुट जनरेट होने वाला है वो हमें प्रिडिक्ट करके देता था अब यहां पे जो हम इक्वेशन इस्तेमाल करते थे वो कौन सी इक्वेशन इस्तेमाल करते थे y = mx3 इक्वेशन को हम इस्तेमाल करते थे इसी के बेसिस पे हम हमारा प्रेडिक्शन करते थे लेकिन अब यहां पे हमारे पास क्या है इनपुट्स हमारे पास क्या है मल्टीपल है और आउटपुट हमारा सिंगल है तो अब इसके अंदर हमें क्या प्रोसेस उना पड़ेगा तो देखिए जब भी आप पास ये केसेस आता है तो आपको क्या करना पड़ेगा जैसे सपोज मान लीजिए x आपका एक इनपुट है और x2 आपका एक इनपुट है और आपके पास क्या है y आपका आउटपुट है तो आप सबसे पहले क्या करेंगे कि x1 और y के बीच में कैसा रिलेशनशिप है x2 और y2 के बीच में किस तरह का रिलेशनशिप है पहले वो आप चेक कीजिए पहले वो चेक कीजिए तो आप यहां पे क्या करेंगे कि आप यहां पर x1 और y के बीच में आप अपना रिलेशन देखेंगे सेकंड आप क्या करेंगे यहां पर x2 और y के बीच में आप अपना रिलेशन देखेंगे यदि ये दोनों रिलेशन आपके पास लीनियर नजर आ रहे हैं तो आप यहां पर मल्टीपल लिनियर रिग्रेशन को अप्लाई करेंगे जैसे कि आप इस ग्राफ के अंदर देख पाएंगे तो यहां पे मुझे दोनों जो आपके पास यहां पे रिलेशन है वो लीनियर नजर आ रहे हैं तो मैं क्या करूंगा यहां पे लीनियर रिग्रेशन को अप्लाई करूंगा और वो भी कौन सा मल्टीपल लीनियर रिग्रेशन को अप्लाई करूंगा इन केस यदि आपके पास यहां पर ये नजर नहीं आ रहा है ग्राफ यहां पे और यदि आपके पास ग्राफ कुछ इस तरह से नजर आ जाए जैसे कि ये लीनियर को फॉलो नहीं कर रहा है लीनियर को फॉलो करने का मतलब क्या है कि जैसे-जैसे x हमारे पास बढ़ेगा उसी तरह से हमारा y भी हमारा बढ़ता रना चाहिए ये हमारे पास क्या करता है लीनियर की को फॉलो करता है अब आपके पास ग्राफ नंबर यदि आप वन के अंदर देखेंगे यहां पे तो ग्राफ नंबर वन के अंदर आप यहां पर देख पाएंगे कि x के बढ़ने पर y भी हमारे पास क्या हो रहा है कंटीन्यूअसली बढ़ रहा है इसका मतलब यहां पे लीनियर रिग्रेशन अप्लाई होगा लेकिन ग्राफ नंबर यदि मैं यहां पे टू की बात करूं यहां पे यस ये ग्राफ वन है और ग्राफ टू की बात करूं यहां पे तो ग्राफ टू के अंदर यदि हम ऑब्जर्व करें तो इसके अंदर कोई भी लीनियर रिलेशन नहीं है क्योंकि x के बढ़ने पर y हमारा बढ़ नहीं रहा है हमारे पास यहां पे किसी रैंडम तरीके से हमारे पास आंसर्स नजर आ रहे हैं यहां पे तो बेसिकली ग्राफ टू के अंदर ऐसा नहीं हो रहा इसका मतलब यहां पे लीनियर रिलेशनशिप नहीं है तो अब इस केसेस के अंदर क्या करना पड़ेगा इस केसेस के अंदर हम फीचर सिलेक्शन कर सकते हैं लेकिन अभी हम यहां पे फीचर सिलेक्शन की बात नहीं कर रहे हम यहां पर बेसिकली नॉर्मल बेसिस पे बात कर रहे हैं तो मैं क्या करूंगा यहां पर यदि हमारा ग्राफ यदि फिर से आपका पास यहां पर लीनियर को फॉलो कर रहा है दोनों तरफ से तो हम यहां पर मल्टीपल लीनियर रिग्रेशन को अप्लाई करेंगे अब देखिए सिंपल लीनियर रिग्रेशन की इक्वेशन क्या थी सिंपल लिनियर रिग्रेशन की इक्वेशन थी y = mx3 आपकी इक्वेशन थी अब यहां पे हमारे पास क्या है नंबर ऑफ इनपुट्स बढ़ चुके हैं तो इक्वेशन क्या होगी तो यदि आपके पास नंबर ऑफ इनपुट्स बढ़ गए हैं तो y इल टू आपके पास क्या हो जाएगी यहां पे m1 x1 प्लस यहां पे m2 x2 + m3 x3 एंड एंड सो ऑन करते-करते + c आपके पास ये इक्वेशन बनने वाली है अब ये जो इक्वेशन होती है बेसिकली गाइज ये होती है एक प्लेन की इक्वेशन होती है ये जो इक्वेशन होती है ये आपके पास कहलाती है मल्टीपल लीनियर रिग्रेशन की इक्वेशन तो मैं बेसिक गाइज बात करूं यहां पे कि यदि आप मल्टीपल लीनियर रिग्रेशन को अप्लाई करने जा रहे हैं तो उस वक्त आपकी इक्वेशन क्या बनने वाली है उस वक्त आपकी इक्वेशन बनेगी आपके पास यहां पे y = आपके पास बनेगी m1 x1 प्लस यहां पे m2 x2 प्लस यहां पे m3 x3 प्लस यहां पे एंड सोन करते हुए प्लस करते हुए c बनेगी अब यहां पे डिपेंड करेगा नंबर ऑफ इनपुट कितने हैं उसके बेसिस पे क्या ग्राफ बनना चाहिए ये डिपेंड करेगा कैसे जरा समझिए देखिए यदि हमारे पास नंबर ऑफ इनपुट्स यदि टू है और उसके बेसिस पे हम यहां पे प्रेडिक्शन कर रहे हैं तो उस वक्त हमारे पास क्या बनेगी प्लेन बनने वाला है जैसे नंबर ऑफ इनपुट आपके पास क्या था सिंगल था तो हमने क्या किया था लाइन की इक्वेशन बनाई थी यदि हमारे पास नंबर ऑफ इनपुट्स एक से ज्यादा है तो हम यहां पे क्या इस्तेमाल करते हैं प्लेन का इस्तेमाल करते हैं यहां पे हमारे पास क्या बनने वाला है प्लेन की इक्वेशन बनने वाली है यदि आपके पास यहां पे नंबर ऑफ इनपुट तीन हो जाते हैं तो हाइपरप्लेन बनेगा उसी तरह से आगे के आगे आपके पास क्या होंगे अलग-अलग तरीके के कर्वेचर बनते रहेंगे और आप यहां पर प्रेडिक्शन कर सकते हैं तो बेसिकली गाइज यहां पर बात करें कि जब भी आपके पास नंबर ऑफ इनपुट एक से ज्यादा हो तो आप इस वाली इक्वेशन का इस्तेमाल करते हैं जिसके थ्रू आपका प्रेडिक्शन होता है अब ये वाली इक्वेशन हम किस तरह से इस्तेमाल करेंगे तो साइकिल लेन के अंदर जो हमने लीनियर रिग्रेशन का इस्तेमाल किया था मॉडल यहां पे जो कि आपके पास यहां पे लीनियर मॉडल के अंदर था आपके पास यहां पे वही आपके पास मल्टीपल लिनियर रिग्रेशन के अंदर भी वर्क करता है चलिए जरा इसको थोड़ा प्रैक्टिकली समझते हैं अब देखिए प्रैक्टिकली हमारे पास क्या है एक डेटा सेट पड़ा है जो कि आप यहां पर देख पाएंगे मैं इस डेटा सेट को ओपन करता हूं तो यहां पे हमारे पास क्या है एज दे रखा है एज के बेसिस पे आपके सैलरी भी है और एक्सपीरियंस भी है हमें क्या प्रेडिक्शन करना है हमें यहां पे ये सैलरी प्रेडिक्शन करनी है तो मैं एक बार के लिए यहां पे इसे क्या करता हूं कट कर देता हूं और यहां ले जाके इसे पेस्ट कर देता हूं और इस डाटा को यहां पे क्या करता हूं डिलीट कर देता हूं चलिए तो अब यहां पे हमें क्लियर नजर आ रहा है कि हमें क्या करना है एज और एक्सपीरियंस के बेसिस पे क्या करना है सैलरी को प्रेडिक्शन करना है अब इस ग्राफ को अंदर यदि आप एनालिसिस करेंगे तो आपके पास क्या है एज आपके पास बहुत सारी दे रखी है और उसके बेसिस पे आपका एक्सपीरियंस भी दे रखा है उसके बेसिस पे आपकी सैलरी दे रखी है ठीक है इसके अंदर यदि आप इनपुट्स की बात करेंगे तो इनपुट्स आपके पास क्या होगा एज होगा एक्सपीरियंस भी आपका इनपुट है और सैलरी आपका पास क्या होने वाला है आउटपुट होने वाला है चलिए इसके ऊपर हम काम करते हैं तो इसके लिए ले चलता हूं मैं आपको कहां पे ट नोटबुक के ऊपर जहां पे हम इसे वर्क करने वाले हैं तो सबसे पहले मैं क्या करूंगा यहां पे कुछ लाइब्रेरीज को इंपोर्ट करूंगा जस्ट लाइक मैं सबसे पहले यहां पे पांडा को इंपोर्ट करने वाला हूं क्योंकि हम डेटा सेट को लोड करेंगे तो पांडा एली से मैं पीडी ले लिया है उसके बाद मैं क्या कर रहा हूं यहां पे डाटा सेट के नाम से एक वेरिएबल ले रहा हूं और यहां पे पीडी डॉट यहां पर _ सीएवी की हेल्प से मैं इस शीट को लोड करने वाला हूं और इस सीट का नाम क्या है हमारी डिग्रेशन ड डटा सेट के नाम से लोड कर चुका हूं अब उसके बाद में हम क्या करेंगे डटा सेट को लेंगे और यहां पर हैड लगाते हुए इसके तीन डाटा को हम यहां पर देखने वाले हैं तो इसके तीन डाटा हमें दिख रहे हैं जिसके अंदर हमारे पास एज है एक्सपीरियंस है और उसके बेसिस पे पे हमारी सैलरी प्रेडिक्शन होने वाली है अब यहां पर मैं अपने डेटा सेट के अंदर जाऊंगा और डॉट यहां पर इसकी क्या करूंगा शेप देखूंगा कि इसके अंदर कितने नंबर ऑफ रो है और कितने नंबर ऑफ़ कॉलम है तो 1000 हमारे पास क्या है रो है और इसके अंदर तीन हमारे पास यहां पर कॉलम दिए गए हैं अब इसके साथ-साथ हम यहां पे एक और चीज़ चेक कर लेते हैं कि क्या इसके अंदर कोई नल वैल्यू तो प्रेजेंट नहीं है नहीं तो क्या होगा हमारे पास यहां पे वर्किंग नहीं होने वाली है तो नल वैल्यू को चेक कर लेते हैं नल वैल्यू को चेक करने के लिए हम क्या करेंगे डेटा सेट के पास जाएंगे डॉट यहां पर मैं करूंगा यहां पे इस नल को मैं कॉल करने वाला हूं और इस नल के बाद में मैं यहां पे डॉट सम लगाते हुए इसके नल वैल्यू को चेक करूंगा तो इसके अंदर मुझे कोई भी नल वैल्यू प्रेजेंट नहीं दिखाई दे रही है चलिए एक और अच्छी चीज हो गई है सेकंड चीज यहां पे मुझे स्केलिंग करने की जरूरत है नहीं मुझे स्केलिंग करने की नहीं जरूरत पड़ेगी क्योंकि यहां पे एज और एक्सपीरियंस का जो आप यहां पर नीचे देखेंगे तो दोनों आपके पास लगभग क्या है बराबर है तो मुझे यहां पर स्केलिंग करने की इतनी ज्यादा नीड नहीं पड़ने वाली है अब नेक्स्ट हमारा टारगेट क्या होगा कि हम एज वर्सेस सैलरी का ग्राफ बनाएंगे और इसके साथ-साथ एक्सपीरियंस वर्सेस सैलरी का ग्राफ बनाएंगे ताकि हम यहां पे देखेंगे कि क्या ये लीनियर टी को फॉलो कर रहे हैं यदि नहीं कर रहे हैं इसमें से कोई भी कॉलम तो हम उसे रिमूव कर सकते हैं या फिर कोई एक अल्टरनेटिव मेथड यूज़ करेंगे लेकिन अभी हम यहां पे क्या करेंगे सिंपल सा चेक करेंगे और उसके बाद मल्टीपल लीनियर डिग्रेशन को अप्लाई करेंगे मुझे ग्राफ बनाना है तो ग्राफ बनाने के लिए मैं यहां पे क्या करूंगा इंपोर्ट करूंगा और इंपोर्ट किसे करूंगा यहां पे गाइज सी बन एलियाज ऑफ एसएनएस को करेंगे और इसके साथ-साथ मैट पलट को इंपोर्ट करना ना भूले क्योंकि उसके बिना बहुत सारे काम रुक जाते हैं तो मैं यहां पे मैट पल लिप को इस्तेमाल करने वाला हूं मैट पल लिप डॉट यहां पर पवा प्लॉट एलियाज ऑफ यहां पर पीएटी बनाऊंगा चलिए इसे रन कर लेते हैं अब हम क्या करें हैं हमारे जो डेटा सेट है इसका ग्राफ बनाते हैं अब देखिए मेरे पास एक से ज्यादा ग्राफ बनाने हैं और वो भी मुझे स्केटर प्लॉट्स बनाने हैं तो इसके लिए मैं इस्तेमाल करूंगा यहां पे पेयर प्लॉट का पेयर प्लॉट के जरिए क्या होगा एज वर्सेस सैलरी का भी ग्राफ बन जाएगा और एक्सपीरियंस वर्सेस सैलरी का ग्राफ भी ऑटोमेटिक बन जाएगा यहां पे तो इसके लिए मैं करूंगा एसए डॉट यहां पर क्या करूंगा पेयर प्लॉट का इस्तेमाल करूंगा पेयर प्लॉट के अंदर मैं अपना डाटा दूंगा और डेटा के अंदर क्या करूंगा हमारा जो डेटा सेट है वो मैं पास करा दूंगा और ग्राफ को देखने के लिए मैं पीएटी डॉट यहां पे क्या करूंगा शो फंक्शन को कॉल करने वाला हूं चलिए इसे रन करते हैं तो पेयर प्लॉट क्या करेगा एक साथ ग्राफ बना देगा तो अभी हम यहां पे वर्क तो देखिए आपके पास हमें क्या-क्या देख र है ग्राफ यहां पे सैलरी वर्सेस एज का ग्राफ देखूं तो ये हमें लीनियर का ग्राफ नहीं दिखाई दे रहा है यहां पे सैलरी वर्सेस एक्सपीरियंस का ग्राफ देखूं तो ये भी हमें लीनियर का ग्राफ तो हमें बिल्कुल नजर नहीं आ रहा तो यहां पे हमारे पास लीनियर का ग्राफ हमें बिल्कुल नजर नहीं आ रहा है क्योंकि हम यहां पर देख चुके हैं पेयर प्लॉट से अच्छा एक बार और चेक कर लेते हैं लीनियर को और लीनियर को चेक करने के लिए हम क्या इस्तेमाल करेंगे हम को रिलेशन का इस्तेमाल करने वाले हैं तो मैं एए डॉट यहां पर हिट मैप बनाने वाला हूं और हिट मैप में क्या करने वाला हूं गाइज यहां पे डटा लेने वाला हूं और डेटा के अंदर क्या करने वाला हूं मैं यहां पे अपना जो डेटा सेट है वो मैं लूंगा यहां पे और डॉट यहां पर को रिलेशन उसका लगाऊंगा क्योंकि को रिलेशन से भी हमें यहां पे लीनियर का पता चलता है कि ये कितने आपके पास लीनियर है राइट तो अब यहां प क्या करेंगे को रिलेशन लगाएंगे को रिलेशन लगाने के बाद में हम इसका क्या करेंगे एनोड को ट्रू कर देंगे एनोड को ट्रू करने का मतलब है यहां पे कि इसके अंदर को रिलेशन का हमें नंबर्स भी पता चला उसके बाद में हम क्या करेंगे पीएटी डॉट यहां पर शो फंक्शन के साथ इसे रन करेंगे अ नोट इक्वल्स टू मुझे ट्रू करना था और अन इक्वल्स टू मैं यहां पे ट्रू कर देता हूं चलिए रन करते हैं तो अब देखिए यहां पे सैलरी वर्सेस एज को यदि हम नोटिस करेंगे तो ये इतना ज्यादा को रिलेशन नहीं है यहां पे सैलरी वर्सेस एक्सपीरियंस को भी देखेंगे तो ये भी आपके पास क्या है इतना अच्छा को रिलेशन नहीं है देखिए इतना अच्छा को रिलेशन नहीं है मतलब ये लीनियर को फॉलो इतने अच्छे तरीके से नहीं कर रहे हैं चलिए कोई बात नहीं हम यहां पे फिर भी हम यहां पे एज और एक्सपीरियंस के बेसिस पे सैलरी को प्रेडिक्शन करेंगे चलिए कैसे करते हैं यहां पे जरा उसको समझते हैं तो सबसे पहले क्या करें आप अपने इनपुट और आउटपुट को अलग-अलग कर लें तो इनपुट हमारे पास क्या होने वाला है मतलब हमारे पास x हमारे पास क्या बनने वाला है यहां पे तो जो हमारा डेटा सेट है उसको हम लेंगे डॉट यहां पर मैं आलग को लेने वाला हूं और उसके बाद में मैं सारी नंबर ऑफ रो का इस्तेमाल करूंगा एंड मैं यहां पे जो हमारी लास्ट वाली जो आपका पास कॉलम है उसे छोड़ दूंगा इसका मतलब क्या हुआ कि हमारे पास यहां पे एज और एक्सपीरियंस जो है वो हमें यहां पर देखने को मिल जाएगा चलिए ज अब हम इसे प्रैक्टिकली जरा समझते हैं यहां पे तो देखिए मैं अपने डेटा सेट के पास पहुंच चुका हूं और ये नाम है आपके पास मल्टीपल लीनियर रिग्रेशन डाटा हमारे पास है यहां पे यहां पे हमारे पास एज दे रखा है सैलरी दे रखा है और एक्सपीरियंस दे रखा है हम एज और एक्सपीरियंस के बेसिस पे हमारी जो सैलरी है वो हम यहां पे प्रेडिक्शन करने वाले हैं चलिए अब इसे जरा प्रेडिक्शन करते हैं तो बेसिकली सबसे पहले मैं क्या करूंगा यहां पर ये जो हमारी सैलरी है जो कि हमें यहां पे प्रोडक्शन करके है ये मिडल में दे रखी है तो मैं इसे क्या करता हूं सबसे लास्ट में लेके चल जाता हूं अ मैं इसे यहां पे क्या करता हूं कट कर देता हूं और सबसे ले जाके लास्ट में पेस्ट कर देता हूं और उसके बाद ये वाला जो कॉलम है इसे हम क्या करते हैं डिलीट कर देते हैं तो अब हमारे पास क्या हो गया एज हो गया एक्सपीरियंस हो गया और इसके बेसिस पे हमें क्या करनी है हमारी सैलरी प्रेडिक्शन करनी है चलिए इसे सेव कर लेते हैं और ले चलते हैं हम यहां पे जुपिटर नोटबुक के अंदर जुपिटर नोटबुक के अंदर सबसे पहले जो हमारी रिक्वायर्ड लाइब्रेरी है उसे इंपोर्ट कर लेते हैं जस्ट लाइक हमें यहां पे पांडा को इंपोर्ट करना पड़ेगा पांडा एलिज ऑफ पीडी क्योंकि हम अपने डाटा सेट को लोड करेंगे उसके बाद में नेक्स्ट हमारे पास क्या होगा यहां पे गाइस हम हमारे डाटा सेट को लोड करेंगे तो मैं यहां पे क्या कर रहा हूं हमारा जो डेटा सेट है उसे हम लोड कर रहे हैं और डाटा सेट को लोड करने के लिए मैं यहां पे पडी ड यहां पर read.csv का इस्तेमाल करने वाला हूं यहां पर मैं मल्टीलिनियर और सीएसवी का इस्तेमाल करूंगा मल्टीलिनियर रिग्रेशन सए का हम यहां पे इस्तेमाल करने वाले हैं चलिए अब हमारे डटा सेट को हम देख लेते हैं तो डेटा सेट को देखने के लिए मैं डॉट हैड का इस्तेमाल करूंगा इसके अंदर तीन डाटा रखूंगा यहां पे आगे के तीन डटा दिखेंगे जहां पे एज एक्सपीरियंस जो सैलरी है वह हमें यहां पर नज़र आने वाली है नेक्स्ट हमारा टारगेट क्या होगा कि इसके अंदर हमारी जो नल वैल्यू है वह हम यहां पर देख लेते हैं कि क्या इसके अंदर नल वैल्यू प्रेजेंट है या नहीं है तो यदि मुझे नल वैल्यू को चेक करना है तो उसके लिए मैं यहां पे क्या कर गा हमारा जो डेटा सेट है यहां पे उसे मैं लेने वाला हूं डटा सेट डॉट यहां पे क्या करने वाला हूं इस नल के जरिए मैं यहां पे नल वाले को चेक करूंगा क्योंकि यदि हमारे यहां पे डाटा के अंदर नल वैल्यू हुई तो हमारे आगे चलते हुए जब मॉडल हम बिल्ड करेंगे उस वक्त हमें यहां बहुत बड़ी प्रॉब्लम देने वाला है तो मैं इसे जैसे ही रन करूंगा तो देखिए एज में कोई नल वैल्यू नहीं है एक्सपीरियंस में भी नहीं है और सैलरी के अंदर भी नल वैल्यू प्रेजेंट नहीं है इवन दैट हम यहां पे ये भी चेक करेंगे कि एज और एक्सपीरियंस के अंदर मुझे स्केलिंग करने की जरूरत है क्या नहीं क्योंकि दोनों का जो डाटा का नेचर है वो लगभग लगभग आपके पास क्या है आसपास ही है मुझे यहां पे अपने स्केलिंग करने की भी जरूरत नहीं पड़ेगी चलिए अब नेक्स्ट टारगेट हमारे पास क्या होगा नेक्स्ट हमा टारगेट होगा कि हम इसमें चेक करेंगे कि क्या यह लीनियर को फॉलो करता है या नहीं करता है तो इसको चेक करने के लिए हम क्या करेंगे गाइज यहां पे हम कुछ लाइब्रेरीज का इंपोर्ट करेंगे क्योंकि हम इसे ग्राफिकल तरीके से चेक करने वाले हैं तो इसके लिए मैं यहां पे सी बन का इस्तेमाल करने वाला हूं सी बन एलियाज ऑफ एसएनएस का इस्तेमाल करूंगा इसके साथ-साथ मैट पल लिप को इंपोर्ट करना ना भूले क्योंकि मैट पल लिप के जरिए हम बहुत से मॉडिफिकेशन करते हैं तो मैं यहां पे मैट पल लिप का इस्तेमाल करने वाला हूं अगले जीए मे पलि डॉट यहां पर मैं पवा प्लॉट एलियाज ऑफ मैं पीएटी का इस्तेमाल करूंगा चलिए अब ने नेक्स्ट टारगेट हमारे पास क्या होगा कि हम इस डाटा का ग्राफ बनाएंगे अब देखिए मुझे एज वर्सेस सैलरी का बीच में ग्राफ बनाना है और एक्सपीरियंस वर्सेस भी सैलरी के बीच में ग्राफ बनाना है चेक करना है कि ये लीनियर को फॉलो करता है या नहीं करता है तो इसके लिए मैं यहां पे डायरेक्टली पेयर प्लॉट बनाने रहा हूं ताकि हम यहां पे एक बार में ही सारा कुछ चेक कर लेते हैं चलिए तो उसके लिए मैं एनएस डॉट यहां पर क्या करूंगा पेयर प्लॉट का इस्तेमाल करूंगा तो मैंने पेयर प्लॉट लिया पेयर प्लॉट के अंदर मैंने क्या किया है हमारा जो डटा है वो मैंने दिया है और डेटा के अंदर मैंने क्या कर दिया हमारा जो डेटा सेट है वो मैंने पास करा दिया ग्राफ को देखने के लिए मैंने पीएटी डॉट यहां पर स फंक्शन को कॉल कर दिया है जैसे ही मैं रन करूंगा मेरा पेयर प्लॉट बन जाएगा और जहां पे हम एनालिसिस कर पाएंगे चलिए मुझे क्या एनालिसिस करना है मुझे सैलरी वर्सेस एज को प्रेडिक्शन देखना है तो देखिए सैलरी वर्सेस एज देखेंगे तो ये लीनियर को फॉलो कर रहा है इवन दैट मैं सैलरी ट एक्सपीरियंस को भी देखूं तो ये भी क्या कर रहा है लीनियर को ही फॉलो कर रहा है तो इसका मतलब क्या है गाइ यहां पे कि ये आपके पास क्या कर रहा है दोनों आपके पास क्या कर रहा है लीनियर को फॉलो कर रहा है इसका मतलब मल्टीपल य डिग्रेशन यहां पे बहुत आराम से लगने वाला है अच्छा इसके साथ-साथ यदि आपके पास यहां पे डाटा बहुत ही ज्यादा हो और आपका पेयर प्लॉट बनने में बहुत ज्यादा प्रॉब्लम हो तो यहां पर आप को रिलेशन का भी इस्तेमाल कर सकते हैं कैसे करेंगे जरा उसको समझते हैं यहां पे तो मैं एएए डॉट यहां पे क्या करूंगा हिट मैप बनाऊंगा यहां पे और हिट मैप के अंदर क्या करने वाला हूं गाइस यहां पे मैं हमारा जो डाटा है वो पास करूंगा और डेटा के अंदर क्या पास करने वाला हूं मैं अपना डेटा सेट पास करूंगा लेकिन मैं यहां पे हमारी जो को रिलेशन मैट्रिक्स है उसे मैं यहां पे पास करने वाला हूं एंड उसके साथ-साथ मैं यहां पे क्या करूंगा हमारा जो अन नोट है अन नोट को मैं यहां पे ट्रू कर दूंगा ग्राफ को देखने के लिए मैं पीएटी डॉट यहां पर क्या करने वाला हूं शो फंक्शन को कॉल करने वाला हूं जैसे रन करूंगा मेरा हिट मैप बन के जो मेरा है वो तैयार हो जाएगा अब हिट मैप के जरिए हम क्या एनालिसिस कर सकते हैं हिट मैप के जरिए हम ये एनालिसिस करेंगे कि जो सैलरी है और जो एज है इसके बीच में हाईली को रिलेशन है मतलब हाईली पॉजिटिव को रिलेशन है मतलब ये आपके पास क्या करने वाला है इस तरह का ग्राफ को फॉलो करने वाला है ये आप को रिलेशन वाले वीडियो के अंदर चेक कर सकते हैं इसके साथ-साथ यदि हम सैलरी वर्सेस एक्सपीरियंस को भी देखें तो ये भी हमारे पास क्या है एक हाईली को रिलेटेड है इसका मतलब क्या हुआ गाइज यहां पे कि यदि मैं इसके लीनियर ग्राफ को देखूं तो ये भी क्या करेगा लीनियर को फॉलो करेगा चलिए हमारे पास यहां पे हाईली को रिलेटेड ग्राफ मिल चुके हैं यहां पे और अब हम यहां पर लीनियर रिग्रेशन को फॉलो कर सकते हैं और वो भी कौन सा मल्टीपल लीनियर रिग्रेशन चलिए मल्टीपल लीनियर रिग्रेशन एल्गोरिथम लगानी है तो उसके लिए पहले मुझे इनपुट और आउटपुट को अलग-अलग करना पड़ेगा मतलब बेसिकली डिपेंडेंट और इंडिपेंडेंट वेरिएबल को अलग-अलग करना पड़ेगा तो मैं x नाम से एक वेरिएबल ले रहा हूं जो कि हमारा इनपुट बनने वाला है और इसके लिए हम क्या करेंगे हमारा जो डेटा सेट है उसको हम लेंगे डॉट मैं यहां पे आई लॉक का इस्तेमाल करूंगा यहां पे आई लॉक के अंदर सारी नंबर ऑफ रो लूंगा यहां पे एंड कॉलम के अंदर बात करें तो मैं पीछे वाला कॉलम हटा दूंगा जो कि होगा हमारा सैलरी का चलिए इसको देख लेते हैं कैसे दिखाई देता है तो देखिए एज और एक्सपीरियंस हमें दिखाई दे रहा है सैलरी हमें नहीं दिखाई दे रही है अब मेरी बात है वा आउटपुट की वाई आउटपुट के लिए हम क्या करेंगे हमारा जो डेटा सेट है वो हम लेंगे इसके अंदर जो हमारी सैलरी है उसको हम यहां पे लेने वाले हैं तो हमारा इनपुट आउटपुट दोनों आ चुका है यहां पे अब हम क्या करेंगे हमारा जो डेटा सेट है इसे हम यहां पे ट्रेन और टेस्ट के अंदर स्प्लिटिंग करेंगे क्योंकि हमारे पास और कोई डेटा तो है नहीं यहां पे प्रेजेंट यहां पे या फिर कोई और डेटा आने वाला है नहीं अभी हमें इसी पे ट्रेनिंग करनी पड़ेगी और इसी पे हमें टेस्टिंग करनी पड़ेगी तो मैं यहां पे क्या करने वाला हूं ट्रेनिंग और टेस्टिंग का डाटा अलग-अलग करने वाला हूं इसके लिए मैं करूंगा यहां पे फ्रॉम साइकल लाइन के अंदर जाऊंगा यहां पे साइकल लाइन के अंदर जाने के बाद बाद में मैं मॉडल सिलेक्शन पे जाऊंगा मैं कहां जाऊंगा यहां पे मॉडल सिलेक्शन के अंदर जाऊंगा मॉडल सिलेक्शन के अंदर जाने के बाद मैं इंपोर्ट करने वाला हूं और इंपोर्ट किसे करने वाला हूं गाइ यहां पे मैं ट्रेन टस्ट स्लेटिंग को इंपोर्ट करने वाला हूं अब मैं यहां पे x मैं यहां पे ट्रेन के नाम से एक वेरिएबल बनाऊंगा उसके साथ-साथ x अंड मैं यहां पे टेस्ट के नाम से भी एक वेरिएबल बनाऊंगा और यहां पे y यहां पर मैं ट्रेन के नाम से वेरिएबल बनाऊंगा और y मैं यहां पे टेस्ट के नाम से एक वेरिएबल बनाने रहा हूं और उसके बाद मैं ट्रेन टेस्ट स्प्लिटिंग लेने वाला हूं अब मुझे क्या करना है अपना इनपुट आउटपुट दोनों देना है इसके साथ-साथ मुझे ट्रेनिंग और ट्रस्टिंग साइज में से कुछ भी एक देना है अब ट्रेनिंग और टेस्टिंग साइज देने से पहले मैं अपने डटा सेट के अंदर क्या करूंगा उसकी शेप देखूंगा शेप देखने के लिए क्या करूंगा यहां पे डटा सेट के पास जाऊंगा डॉट यहां पर मैं शेप को कॉल करने वाला हूं यहां पे और शेप को जैसे ही कॉल करूंगा देखिए मुझे 200 रो दिख रही है और थ्री कॉलम्स नजर आ रहे हैं यहां पे तो बेसिकली 200 रो है तो मैं इसके अंदर क्या करूंगा 80 पर क्या करूंगा ट्रेनिंग के अंदर डालूंगा और 20 पर टेस्टिंग के अंदर डालने वाला हूं तो मैं यहां पे टेस्टिंग साइज के अंदर क्या करूंगा 0.2 करने वाला हूं टेस्टिंग साइज के अंदर उसके बाद है मेरा रेंडम स्टेट रेंडम स्टेट के अंदर मैं 42 लेने वाला हूं अ एक आइडियल स्कोर है वो मैं यहां पर लेने वाला हूं चलिए ये हमारे पास ट्रेनिंग और टेस्टिंग के अंदर हमारा डाटा जो है वो अलग-अलग हो चुका है अब नेक्स्ट टारगेट हमारे पास क्या होने वाला है नेक्स्ट टारगेट हम क्या करेंगे हमारा मॉड बिल्ड करेंगे मॉडल बिल्ड करने के लिए मैं फ्रॉम फिर से मैं सेकंड लाइन के अंदर जाऊंगा डॉट मैं लीनियर मॉडल को यहां पे कॉल करने वाला हूं लीनियर मॉडल के अंदर मैं इंपोर्ट करने वाला हूं किसे यहां पे मैं इस्तेमाल करने वाला हूं लीनियर रिग्रेशन को लीनियर रिग्रेशन जो एल्गोरिथम है वो मल्टीपल लीनियर रिग्रेशन के ऊपर अप्लाई होती है क्योंकि जब आप यहां पे डेटा सेट को चूज करते हैं जो कि हमने ये डेटा सेट लिया है ये आपके पास क्या है टू डायमेंशन डेटा सेट है और जो कि मैंने आपको पहले भी बताया था सिंपल लीनियर रिग्रेशन के अंदर कि सिंपल लिनियर रिग्रेशन के अंदर जब भी आप डाटा देते हैं तो उसको आपको टू डायमेंशन में कन्वर्ट करके ही फिर यूज करना पड़ता है अदर वाइज प्रॉब्लम करता है तो यदि मैं x डॉट यहां पर क्या करूं यहां पे इसकी डायमेंशन चेक करूं एंड डीम के जरिए मैं इसकी डायमेंशन चेक करूं ना तो ये मुझे टू डायमेंशन ऑलरेडी पहले से दिखा रहा है तो इसका मतलब क्या है हम इसके अंदर डायरेक्टली हमारा डाटा पास करने वाले हैं चलिए अब हम क्या करेंगे यहां पे हम मैं यहां पे एलआर के नाम से एक वेरिएबल बनाने वाला हूं मतलब एक ऑब्जेक्ट बनाने वाला हूं और यहां पर मैं हमारा जो लीनियर रिग्रेशन है उसे मैं कॉल करने वाला हूं उसके बाद में मैं क्या करूंगा यहां पे अ डट मॉडल को करने वाला हूं फिट करने वाला हूं फिट के अंदर क्या करूंगा यहां पे x मेरा जो ट्रेन है वो मैं पास करूंगा और y जो ट्रेन है वो मैं यहां पे पास करने वाला हूं तो मेरा मॉडल जो है वो यहां पे ट्रेंड हो चुका है ट्रेंड होने के बाद में अब यहां पे बारी है इसकी स्कोर चेक करने की कि इसका स्कोर क्या बनने वाला है इवन दैट हम यहां पर जो हमारी एल्गोरिथम बनने वाली है अब यहां पे पहले मैं बात कर रहा हूं एल्गोरिथम क्या बनेगी तो एल्गोरिथम आपके पास ये बनने वाली है y इ टू आपके पास क्या बने वाला है m1 x1 बनने वाला है m1 x1 का मतलब है यहां पे जो आपका पहला इनपुट्स है राइट वो बनेगा प्लस उसके साथ-साथ यहां पे m2 और उसके बाद x2 प्लस यहां पे सी ये एल्गोरिथम बनने वाली है हमारे पास यहां पे तो ये एल्गोरिथम हम यहां पे देख लेंगे इसके साथ-साथ पहले हम यहां पे इसका स्कोर चेक कर लेते हैं तो अल डॉट मैं यहां पे क्या कर रहा हूं स्कोर को चेक करूं स्कोर के अंदर मैं यहां पे x टेस्ट y यदि मैं टेस्ट पास कराऊं तो ये 63 पर एक्यूरेसी के साथ हमारे पास आंसर दे रहा है जोकि हमारे पास बहुत ही पुअर एक्यूरेसी है राइट आगे चलते हुए हम इस एक्यूरेसी को कैसे इंप्रूव कर सकते हैं इसको हम डिटेल के साथ समझेंगे लेकिन अभी हम इसके ऊपर बात करें तो ये बहुत ही ज्यादा पुअर एक्यूरेसी के साथ हमें रिजल्ट दे रहा है चलिए कोई बात नहीं हम हमारे मॉडल को कंटिन्यू ू करते हैं और आगे की चीजें देखते हैं राइट अब हमें यहां पे क्या करना है हमें ये जो एल्गोरिथम यूज़ की है इस एल्गोरिथम को देखना है कि ये एल्गोरिथम कैसे काम करती है इसके साथ यदि मुझे प्रेडिक्शन करना है तो मैं प्रेडिक्शन कैसे करूंगा वो भी हम देखेंगे तो चलिए जरा इसे समझते हैं तो देखिए ये जो आपके पास इक्वेशन बनी है इस इक्वेशन का डाटा आएगा कैसे तो आपका जो एलआर है एलआर डॉट यहां पर यदि आप कफिट को कॉल करेंगे तो कफिट को जैसे आप यहां पर लगाएंगे तो आपके पास दो-दो कफिट नजर आएंगे आपके पास यहां पे दो-दो कफिट नजर आने वाले है इसके साथ एलआर डॉट यहां पे इंटरसेप्ट का इस्तेमाल करेंगे तो आपका इंटरसेप्ट की वैल्यू भी आपके पास आने वाली है राइट तो मतलब आपके जो इक्वेशन है वो इक्वेशन कुछ इस तरह से बनी है आपका y पडी यदि मैं लिखूं y पडी मतलब y प्रोडक्शन की बात करूं यहां पे तो y प्रेडिक्शन के अंदर m1 क्या बना है m1 हमारा ये बन चुका है अब यहां पे बेसिकली बात करें कॉलम कौन सा आएगा तो कॉलम को चेक करने के लिए मैं x डॉ यहां पर कॉलम का इस्तेमाल करूंगा ताकि मुझे यहां पे कॉलम के नाम पता चल जाए तो यहां पर है हमारे पास एज तो बेसिकली x डॉ यहां पर यदि मैं बात करूं तो आपके पास यहां पे m1 आ गया m1 किससे मल्टीप्लाई होगा इसके साथ मल्टीप्लाई होगा प्लस इसके साथ-साथ अब हमारे पास क्या है अगला कॉलम आने वाला है अगला वलब m2 आने वाला है m2 आपके पास आ गया m2 के साथ मल्टीप्लाई करना है आपको किसको एक्सपीरियंस को मल्टीप्लिकेशन करना है यहां पे प्लस यहां पे अब आपके आ रही है c की वैल्यू जोकि हमारे पास इंटरसेप्ट की वैल्यू है तो यह आपकी इंटरसेप्ट की वैल्यू भी यहां पे आ चुकी है तो बेसिकली आपके पास गाइज मैं बात करूं तो यह वाली इक्वेशन आपकी तैयार हो चुकी है इस इक्वेशन के जरिए आपका प्रेडिक्शन हो रहा है अच्छा प्रेडिक्शन कैसे करेंगे तो l डॉट आपका जो प्रोडक्ट फंक्शन है उसके जरिए ही आप क्या करेंगे प्रेडिक्शन करने वाले हैं फिर से यहां पे आप क्या करें x आप अपना क्या करें टेस्ट कर दें यहां पे आपका आउटपुट जो है वो नजर आ जाएगा इसके लिए जो इक्वेशन यूज हुई है वो इक्वेशन यह वाली यहां पे यूज हुई है तो आई थिंक आई होप सो समझ में आ चुका होगा कि मल्टीपल रिग्रेशन कैसे काम करता है यदि इसकी एल्गोरिथम की बात करें तो एल्गोरिथम क्या है यहां पे m1 x1 ् m2 x2 प्लस आपके c इस तरह से इक्वेशन होती है अब जैसे-जैसे नंबर ऑफ इनपुट्स बढ़ते रहेंगे वैसे-वैसे ये जो इक्वेशन है आगे से आगे आगे से आगे आपकी जो है वो बढ़ती रजर आपको दिखेगी और आज की इस वीडियो के जरिए हम बात करेंगे पॉलिनो मियल रिग्रेशन के बारे में अब देखिए हमने यहां पे रिग्रेशन एनालिसिस के अंदर बहुत सारे एनालिसिस देखी है जिसके अंदर हमने सिंपल लीनियर रिग्रेशन को देखा मल्टीपल लीनियर रिग्रेशन को देखा इन सभी के अंदर हमने क्या ऑब्जर्व किया था कि हमारा जो डेटा सेट था वो एक सिंपल लीनियर t को फॉलो कर रहा था मतलब आपके पास जो डटा यदि आप देखेंगे तो आपके पास क्या कर रहा है स्ट्रेट लाइन की तरफ ग्राफ चलता है लेकिन आपके पास पॉलिनो मियल डिग्रेशन के अंदर जो आपका डेटा सेट है वो लीनियर को फॉलो नहीं करता है और किसी रैंडम तरीके से आपके पास ग्राफ आता है इस तरीके के नेचर के अंदर जब आपको ग्राफ देखने को मिलता है तब आप यहां पे पॉलिनो मियल डिग्रेशन को अप्लाई करते हैं चलिए जरा इसको देखते हैं डिटेल के साथ तो देखिए मेरे पास एक डेटा सेट है जिस डेटा सेट के अंदर हर एक लेवल के अनुसार उसकी जो सैलरी है वो डिसाइड की गई है अब इस तरह के जो डाटा होते हैं वो आपको जनरली ऑफिसेससवीडियो होती है जैसे ही आपका लेवल अपग्रेड होता है आपकी सैलरी भी अपग्रेड हो जाती है तो बस वही हमारे पास डाटा है जिसके अंदर हर तरीके के लेवल के ऊपर आपकी जो सैलरी है वो यहां पर बताई गई है कि आपके पास कौन-कौन से लेवल के ऊपर किस-किस तरह की सैलरी है लेवल वर्सेस सैलरी इस तरह के फॉर्मेशन के अंदर जब डेटा देखने को मिलता है तो जनरली इन सारे केसेस के अंदर पॉलीनोट डिग्रेशन अप्लाई होता है लेकिन आपको एक बार श्यर हो जाना चाहिए कि आपका डटा सेट पॉलीनोट फीचर को फॉलो करता है या नहीं करता है अब ये कैसे आप चेक करेंगे तो इसके लिए हम ले चलते हैं जुपिटर नोटबुक के अंदर जुपिटर नोटबुक के अंदर सबसे पहले मैं क्या कर रहा हूं यहां पे जो मेरी रिक्वायर्ड लाइब्रेरी है उसको मैं इंपोर्ट कर रहा हूं जैसे कि मैं इंपोर्ट करूंगा यहां पे पांडा एलियाज ऑफ पीडी को क्योंकि हम डाटा सेट को लोड करने वाले हैं और उसके बाद में हम यहां पे इंपोर्ट करने वाले हैं किसे मैट पॉलिप को तो मैंने मैट पॉलिप डॉट यहां पर पवा प्लॉट पवा प्लॉट एलियाज ऑफ यहां पे पीएटी लगा दिया है उसके बाद यदि आप एडवांस ग्राफ बनाना चाहते हैं तो आप सी बोन को भी इंपोर्ट कर सकते हैं फिलहाल मैं इन दोनों को ही रखने वाला हूं उसके बाद में नेक्स्ट चीज क्या होगा कि आप अपने डटा सेट को लोड कीजिए तो डटा सेट को लोड करने के लिए पीडी डॉट यहां पर रीड एंडस को सीएसवी का इस्तेमाल कर सकते हैं अब जो मेरे डटा सेट का नाम है वो पोमल सवी है मैं यहां पे क्या करूंगा पनम . सवी को अप्लाई करने वाला हूं उसके बाद में मैं अपने डटा सेट को लोड करूंगा और मैं अपने डेटा सेट के अंदर जाके डॉट हैड लगा के इसके तीन डाटा को यहां पर देखने वाला हूं अब यहां पे लेवल वर्सेस सैलरी का ग्राफ बना के चेक करते हैं कि ये ग्राफ पॉलीनोट के नीचे को फॉलो करता है या नहीं करता है अच्छा चलिए तो इसको जरा देखते हैं ये कैसे करता है चलिए इसको जरा देखते हैं तो मैं यहां पे पीएटी डॉट क्या करने वाला हूं स्केटर प्लॉट बनाने वाला हूं स्केटर प्लॉट बनाने के बाद में मैं यहां पे क्या करूंगा अपना जो भी डाटा है उसको दूंगा जैसे कि डेटा सेट करना जाऊंगा और मैं यहां पे लेवल को दूंगा अब उसके बाद में नेक्स्ट यहां पे क्या करूंगा मैं अपने डेटा सेट को लूंगा यहां पे एंड देन यहां पे क्या करूंगा मेरी जो सैलरी है उसे मैं देने वाला हूं तो मैं सैलरी जो है वो यहां पर क्या करने वाला हूं देने वाला हूं चलिए अब उसके बाद में नेक्स्ट क्या होगा सैलरी जो है वो मैं यहां पे देने वाला हूं उसके बाद में मैं अपने पीएटी ड श की हेल्प से इस ग्राफ को देख लेता हूं कि ये ग्राफ कैसे दिखाई दे रहा है यदि आप इस ग्राफ को देखेंगे गाइ यहां पे तो ये लीनियर को फॉलो करता हुआ नजर नहीं आ रहा है बल्कि किसी और तरीके का रैंडम ग्राफ हमें नजर आ रहा है तो बेसिकली जनरली क्या दिखा गया है जब आप यहां पर सिंपल लिनियर रिग्रेशन को अप्लाई कर रहे थे उस समय जो आपके ग्राफ का नेचर था वो कुछ इस तरीके का था लेकिन अब जो ग्राफ आपके पास यहां पे हुआ है वो चेंज होके कुछ इस तरह के फॉर्मेशन में आपका बदल चुका है तो अब जब भी आपके ग्राफ लीनियर टी को फॉलो ना करते हुए किसी और तरीके की चीज को फॉलो करें तो उस केसेस में हम इस्तेमाल करते हैं पॉलीनोट का अब ये पॉलिनो मियल रिग्रेशन होती क्या है और ये कैसे वर्क करती है जरा इसको यहां पे समझते हैं तो देखिए पॉलीनोट रिग्रेशन के अंदर आपके डिपेंडेंट और इंडिपेंडेंट वेरिएबल सेम है जैसे हैं वैसे ही रहते हैं यहां पे लेकिन जब आप इस ग्राफ के नीचे को देखेंगे तो ये ग्राफ के नीचे कुछ इस तरह से नजर आते हैं अब जनरली आप आपके पास यहां पे ग्राफ के नेचर कुछ और तरीके से भी नजर आ सकते हैं जैसे कि मेरा जो ग्राफ का नेचर है वो कुछ इस तरह से नजर आ रहा है आपके ग्राफ किसी और तरीके नजर आएंगे तो जब आपके पास इस तरह के ग्राफ के नेचर्स नजर आते हैं तो उस समय हम सिंपल लीनियर इ ग्रेशन को अप्लाई नहीं कर सकते क्यों नहीं कर सकते उसका रीजन जरा समझते हैं कि देखिए जब आप सिंपल लीनियर रिग्रेशन को अप्लाई करते हैं तो आपकी जो सिंपल लीनियर रिग्रेशन की जो लाइन है वो कुछ इस तरह से पास ऑन होती है और जब ये लाइन इस तरह से पास ऑन होती है तो ये हो जाती है आपकी अंडरफिटिंग लाइन अब अंडरफिटिंग लाइन का मतलब बेसिकली गाइ क्या है यहां पे ज जस्ट सपोज यहां पे कोई पर्सन आपके पास है इस पर्सन का कोई आपके पास वैल्यू प्रोडक्शन करनी है मतलब y को प्रोडक्ट करना है अब जब आपके पास y को प्रोडक्शन किया जाता है तो ये आपके पास क्या करता है ये वाला जो आउटपुट है वो नजर आपके सामने दिखाता है कि ये वाला आउटपुट आपके पास आने वाला है यहां पे जबकि ओरिजिनल आउटपुट की बात करें हम यहां पे तो ओरिजिनल आउटपुट जो है वो यहां पे नजर आएगा मतलब ये y ड है और ये आपका y ओजी है तो ये आपके पास यहां नजर आएगा तो इन दोनों के बीच में काफी बड़ा डिफरेंस देखने को मिलता है और इस वजह से यहां पे हमें बहुत ज्यादा एरर्स देखने को मिलती है जनरली इस तरह के केसेस यदि आप यहां पे देखें तो इसके अंदर यदि आप सिंपल लीनियर रिग्रेशन को अप्लाई करें y = mx3 तो यहां पे आपके पास जो मॉडल होता है वह अंडर फिटिंग के अंदर चला जाता है अब यहां पे इस चीज़ को बचने के लिए आप क्या करते हैं पॉलिनो रिग्रेशन को इस्तेमाल करते हैं पॉलीनोट रिग्रेशन के अंदर क्या होता है कि आपकी जो लाइन की इक्वेशन है वह चेंज हो जाती है और चेंज होके पॉलीनोट के अंदर कन्वर्ट हो जाती है इसके अंदर जो आप कर्वेचर देख रहे हैं उस कर्वेचर के अकॉर्डिंग हमारी प्रेडिक्शन लाइन बनती है इससे यदि मैं कोई यहां पे आउटपुट चेक करना चाहूं इस पॉइंट के ऊपर यदि मैं आपका आउटपुट चेक करना चाहूं तो यह क्या करेगा मुझे ये आउटपुट देगा और प्रेडिक्शन आउटपुट भी सेम टू सेम देता है तो इस जब भी आपके पास आपके डाटा का नेचर यदि पॉलिनो मियल आ जाता है तो यहां पे आपको पॉलीनोट अप्लाई करनी पड़ती है अब जरा यहां पे देखिए पॉलिनो डिग्रेशन की इक्वेशन क्या होती है तो पॉलिनो डिग्रेशन की जो इक्वेशन है वो आपके पास कुछ इस तरह से होती है y = b नॉ b नॉ मतलब आपका जो कांस्टेंट है वो फिर आपके पास है b1 x1 + b2 x2 + b2 x3 एंड एंड सो ऑन करते हुए यहां पे चलती है यदि आप बात करें सिंपल लिनियर रिग्रेशन की इक्वेशन या मल्टीपल लिनियर रिग्रेशन की इक्वेशन क्या थी तो मल्टीपल लिनियर इक्वेशन की इक्वेशन की बात करूं तो वो थी b0 प्लस आपके पास क्या आएगा b1 x1 प्लस यहां पे क्या आएगा b2 x2 प्लस यहां पे आपका पास आएगा b3 और x3 एंड एंड सो ऑन चलती रहती है लेकिन मैं यहां पे बात करूं तो पॉलीनोट के अंदर क्या डिफरेंस हुआ पॉलीनोट के अंदर आपके पास क्या हुई आपके डाटा के अंदर पावर सप्लाई हो चुकी है पावर की वजह से आपके पास जो जो प्रेडिक्शन लाइन पहले कुछ इस तरह से जा रही थी वो प्रेडिक्शन लाइन चेंज होने के बाद में आपके पास कुछ इस तरह से चली जाएगी जब आप यहां पे पावर को ऐड डाउन करते हैं तो आपकी जो प्रेडिक्शन लाइन है वो प्रेडिक्शन लाइन स्ट्रेट स्ट्रेट लाइन से पॉलिनो मियल लाइन के अंदर कन्वर्ट हो जाती है अब इसी के अंदर आपकी जो लाइन है वो बाइनोरिया जाता है बायनोक्स ली जब तक आपके पास पावर टू की इक्वेशन को इस्तेमाल किया जाता है तो वो होती है बानो मियल इक्वेशन और उसके बाद जैसे-जैसे आप आगे बढ़ते रहते हैं उसी से पॉलिनो मियल इक्वेशन आपकी बढ़ती रहती है ओके चलिए अब जरा इसको थोड़ा प्रैक्टिकली समझते हैं कि ये कैसे होगा और जनरली हमने यहां पे हमारा जो डेटा सेट देखा है यहां पे इस डेटा सेट के अंदर तो हमारे पास क्या है केवल एक ही इनपुट है एक ही इनपुट है और एक ही हमारे पास आउटपुट है जबकि हम यहां पर देख रहे हैं कि हमारे पास जो इनपुट्स हैं उन इनपुट्स के अंदर हमें पावर में कन्वर्ट करना होता है तो ये पावर कैसे कन्वर्ट करा जाता है इसको जरा प्रैक्टिकली जरा समझते हैं तो ले चलता हूं मैं आपको प्रैक्टिकल सेशन के अंदर अब जरा देखिए हमारे पास जो हमारा डेटा सेट सेट है वो कुछ इस तरह से दिखाई दे रहा है यहां पे इसके साथ-साथ मैं यहां पे एक और चीज चेक कर लेता हूं इनके को रिलेशन को देख लेता हूं कि इनके बीच में को रिलेशन किस तरह से है तो को रिलेशन को चेक करने के लिए आप यहां पे क्या करें डटा सेट को कॉल करें एंड उसके बाद आप यहां पे क्या करें को रिलेशन को कॉल कर सकते हैं को रिलेशन क्या करेगा कि दोनों के बीच में किस तरह का को रिलेशन है वो आपको बता देगा तो देखिए सैलरी वर्सेस मैं यहां पे लेवल के को रिलेशन को देखूं तो ये एक हाईली को रिलेटेड है हाईली आपके पास क्या है को रिलेटेड है लेकिन इसके ग्राफ को देखा जाए तो ये क्या है पॉलीनोट रिग्रेशन को फॉलो करता है लेकिन ये लीनियर के अंदर बात करें तो य ये हाईली को रिलेटेड आपको दिखाई दे रहा है चलिए अब हम क्या करते हैं यहां पे इसको पॉलिनो मियल फीचर के अंदर कन्वर्ट करते हैं एंड देन उसके बाद में इसका प्रोडक्शन मॉडल बनाते हैं अब देखिए जब भी आपके पास आपका जो डाटा है उसको पॉलीनोट फीचर में कन्वर्ट करना है तो साइकेड लन की लाइब्रेरी के थ्रू आप उसे पॉलिनो फीचर में कन्वर्ट कर सकते हैं अब ये कैसे कन्वर्ट होता है जरा इसको समझें यहां पे तो सबसे पहले क्या करें आप अपने डाटा के अंदर इनपुट और आउटपुट को अलग-अलग कर लें मतलब डिपेंडेंट एंड इंडिपेंडेंट वेरिएबल को आप अलग कर लें चलिए मैं x एक्सेस यहां पे डाटा लेता हूं इसके अंदर क्या करता हूं मेरा जो डेटा सेट है उसको कॉल करता हूं और इसके अंदर क्या कर रहे हैं यहां पे हम हमारे जो प्रेडिक्शन है वो क्या कर रहे हैं लेवल वर्सेस सैलरी को कर रहे हैं चलिए इस ग्राफ के अंदर भी थोड़ा सा थोड़ा सा इसे एडिट कर देते हैं पीएटी डॉट मैं यहां पे क्या कर रहा हूं एक्स लेबल लगा लेता हूं यहां पे एक्स लेबल के अंदर एक्स एक्सेस के अंदर हम यहां पे क्या लेने वाले हैं एक्स एक्सेस के अंदर हम यहां पे ले रहे हैं लेवल को तो मैं x एक्सेस के अंदर लेवल लगाने वाला हूं और इसी तरह से मैं पीएटी डॉट यहां पे y लेवल को लेने वाला हूं तो पडी y लेबल की बात करें यहां पे तो पडी y लेबल के अंदर मेरे पास क्या है यहां पे सैलरी है तो प ड लेबल लगा ले सैलरी करते थे हैं तो ये लीजिए हमारा जो ग्राफ है बहुत ही अच्छे तरीके से सही नजर आ रहा है अब हमें क्या करना है हमारे डाटा के अंदर इनपुट आउटपुट का अलग-अलग करना है तो मेरे पास x एक्सेस में क्या आएगा गाइज यहां पे लेवल आएगा लेकिन हमेशा मुझे ध्यान रखना है कि जब भी मैं डटा लेता हूं तो वो हमारे पास क्या होना चाहिए मल्टी डायमेंशन डटा सेट होना चाहिए तो मैंने अपने डाटा को मल्टी डायमेंशन डेटा सेट में कन्वर्ट कर दिया है उसके बाद में मैं अपने डेटा सेट के पास जाता हूं और यहां पे मैं क्या कर रहा हूं सैलरी हमारे पास प्रोडक्शन मॉडल है तो मैं सैलरी को ले लेता हूं अभी हम हमारे डाटा को देखें तो ये पॉलिनो मियल नेचर के अंदर नहीं है लेकिन अब हमें से क्या करना पड़ेगा पॉलीनोट नेचर के अंदर कन्वर्ट करना पड़ेगा तो अब मैं यहां पे पॉलिनो मियल नेचर के अंदर कन्वर्ट कर रहा हूं किस तरह से मैं यहां पे फ्रॉम साइकिल लाइन के अंदर चलूंगा यहां पे साइकिल लान के अंदर जाने के बाद में मैं जाऊंगा प्री प्रोसेसिंग के अंदर प्री प्रोसेसिंग में जाने के बाद मैं इंपोर्ट करने वाला हूं और इंपोर्ट कैसे करने वाले हैं पॉलिनो मियल फीचर के अंदर तो यहां पे हमारे पास पॉलीनोट फीचर नाम का क्या है एक क्लास है उसको हम यहां पे इंपोर्ट करेंगे चलिए उसके बाद मैं पॉलिनो फीचर के लिए मैं एक ऑब्जेक्ट तैयार कर लेता हूं तो मैं इसे बना रहा हूं पीएफ के नाम से इसे यहां पे ऑब्जेक्ट यहां पे और फिर मैं अपने पॉलिनो मियल फीचर को यहां पे कॉल करने वाला हूं अब देखिए पॉलीनोट फीचर को जब आप यहां पे कॉल करते हैं तो यहां पे आपको देखने को मिलता है डिग्री डिग्री का मतलब बेसिकली गाइज मैं बात करूं यहां पे तो डिग्री का मतलब होता है कि आपकी जो यहां पे डाटा दे रखा है उस डाटा को कितने डिग्री तक आपको फॉलो करवाना है कितने डिग्री को तक फॉलो करवाना है मतलब क्या है गाइज यहां पे देखिए पॉलिनो रिग्रेशन को इस्तेमाल करते हैं तो पॉलिनो रिग्रेशन के अंदर जब आप यहां पे x को देखते हैं तो x की पावर क्या है अभी वन है फिर x की पावर क्या है टू है तो मतलब हम डिग्री टू तक फॉलो कर रहे हैं इसी तर से आप डिग्री थ्री को भी फॉलो कर सकते हैं डिग्री फोर को भी फॉलो कर सकते हैं डिग्री फाइव को भी फॉलो कर सकते हैं मतलब आप अपने डाटा को आप क्या कर रहे हैं यहां पे पॉलीनोट फीचर के अंदर कन्वर्जन कर रहे हैं मतलब पॉलीनोट के अंदर कन्वर्जन कर रहे हैं तो जब आप कन्वर्जन करने जाए तो आप अपने हिसाब से इसके अंदर क्या कर सकते हैं डिग्री को चेंजेज कर सकते हैं ये आपका डिपेंड करेगा आपका डेटा सेट किस तरह से है यदि आपके डेटा सेट यहां पर बानो मियल के अंदर मतलब डिग्री टू के अंदर आपके पास फॉलो हो जाता है तो आप बानो मियल को फॉलो करें यदि आपके पास डेटा सेट डिग्री टू के अंदर नहीं डिग्री थ्र फोर के अंदर होता है तो आप उसके अंदर जाके क्या करें फॉलो करवाएं चलिए अभी मैं यहां पे पॉलिनो मियल फीचर डिग्री टू को लेके चल रहा हूं क्योंकि मेरा डेटा सेट कुछ इस तरह से नजर आ रहा है यदि ये डिग्री टू के अंदर हमें परफेक्ट लाइन नहीं देता है तो हम यहां पे आगे मूव ऑन करेंगे डिग्री थ्री एंड डिग्री फोर के अंदर चलिए अभी मैं क्या करता हूं यहां पे इस पॉलिनो मियल फीचर को फिर से लेता हूं और इसके बाद में हम हमारा जो मॉडल है उसे फिट करते हैं फिट करने के बाद में मैं यहां पे अपना x डाटा देता हूं फिर मैं यहां पे पीएफ डॉट यहां पे क्या कर रहा हूं ट्रांसफॉर्म करता हूं तो पीएफ डॉट ट्रांसफॉर्म के अंदर यदि मैं x रखूं और रन करूं तो देखिए मेरा जो डाटा है वो डिग्री टू के अंदर यहां पे चेंजेज हो चुका है इसके अंदर जो आपका पहला फीचर है वो आपको हमेशा और हमेशा कांस्टेंट देखने को मिलेगा उस उसके बाद जो अगले फीचर्स आप देख रहे हैं वो आपके सारे जो फीचर है वो पॉलिनो मियल हो चुके हैं अब ये क्या बन चुका है आपका एक एरे नजर आ चुका है इस एरे को हम क्या करेंगे हमारे जो ओरिजिनल डेटा सेट है उसके अंदर वापस पास ऑन कर देंगे तो मैं यहां पे x के अंदर वापस पास ऑन कर रहा हूं अब यहां पे एक चीज का आपको ध्यान रखना पड़ेगा अब यदि आप अपने इस डाटा को डेटा सेट के अंदर ही वापस रखना चाहते हैं तो आप इनको नाम देने पड़ेंगे स्पेशली और वो नाम आप अपने हिसाब से दे सकते हैं लेकिन आप चाहते हैं कि नहीं इसको एरे के हिसाब से ही रखा जाए तो आप ऐसे एरे के तौर पे भी दे सकते हैं लेकिन एरे पे देने पर ऐसे कोई प्रॉब्लम नहीं आएगी और मॉडल ट्रेंड हो जाएगा चलिए मैं इसको क्या करता हूं अपने वापस x एक्सिस के डेटा के अंदर वापस डाल देता हूं अब यहां पे नेक्स्ट क्या करते हैं हमारा जो डाटा आ चुका है वो पॉलिनो फीचर में आ चुका है अब इसे हम क्या कर रहे हैं ट्रेन और टेस्ट के अंदर स्प्लिटिंग करते हैं और फिर प्रेडिक्शन करते हैं तो ट्रेन और टेस्ट के अंदर स्प्लिटिंग करने के लिए फ्रॉम साइकल लाइन के अंदर आपको जाना है डॉट यहां पे क्या करना है मॉडल सिलेक्शन को लेना है मॉडल सिलेक्शन को लेने के बाद में दैट इंपोर्ट करना है और इंपोर्ट में क्या करना है गाइज यहां पे ट्रेंट स्प्लिटिंग को करना है चलिए ट्रेंट स्लेटिंग ले लिया हमने यहां पे यहां से हमारे पास चार वेरिएबल बनेंगे जिसके अंदर चार अलग-अलग डाटा आएगा तो पहला होगा यहां पे x आपका ट्रेन आने वाला है दूसरा यहां पे x अंड आपके पास टेस्ट आने वाला है तीसरा y आपके पास क्या आने वाला है ट्रेन आने वाला है और चौथा आपके पास यहां पे y ंड आपके पास टेस्ट आने वाला है इसको ट्रेन ट स्प्लिटिंग में करने की वजह क्या है क्योंकि हमारे पास यही डाटा है इसी डाटा के ऊपर हमें ट्रेनिंग भी करनी है और टेस्टिंग करके रिजल्ट भी निकालना है चलिए टेस्टिंग करके इसकी चेक भी करना है कि ये कितनी एक्यूरेसी के साथ आपका आंसर देता है चलिए अब हम हमारा डाटा देते हैं यहां पे तो एक् एक्सेस का डाटा मैंने एट दिया वा एक्सेस का डाटा दे दिया है उसके बाद में हमारे पास यहां पे टेस्टिंग साइज है टेस्टिंग साइज को 0.2 करूंगा यहां पे उसके बाद हम यहां पे रैंडम स्टेट को लेंगे तो रैंडम स्टेट की जो वैल्यू है मैं यहां पे 42 लेने वाला हूं चलिए हमारा जो डाटा है ट्रेन टे स्प्लिट के अंदर हो ट्रें टे के अंदर स्प्लिटिंग हो चुका है अब हमें क्या करना है पॉलिनो मियल रिग्रेशन को अप्लाई करना है पॉलिनो रिग्रेशन सिंपल लीनियर रिग्रेशन मल्टीलिनियर रिग्रेशन सेम आपके पास सिंगल फॉर्मूले के ऊपर ही वर्क करते हैं तो इस सेम तरीके से वर्क करते हैं तो अब मैं क्या करने वाला हूं यहां पे फ्रॉम साइकल लाइन के अंदर चलूंगा यहां पे डॉट यहां पे लीनियर मॉडल को कॉल करने वाला हूं लीनियर मॉडल के अंदर जाने के बाद दैट मैं इंपोर्ट करूंगा और इंपोर्ट कैसे करने वाला हूं गाइज यहां पे आपके पास लीनियर डिग्रेशन को तो मैंने लीनियर रिग्रेशन को लिया है यहां पे लीनियर रिग्रेशन के लिए मैंने एलआर नाम से एक वेरिएबल बनाया है अ जो कि हमारा ऑब्जेक्ट होने वाला है लीनियर रिग्रेशन को मैंने कॉल किया है यहां पे फिर मैंने एल आड मॉडल को क्या किया है यहां पे फिट किया है फिट के अंदर मुझे क्या करना है x ट्रेन का डाटा देना है एंड y ट्रेन का डाटा देना है एंड रन करेंगे तो मेरा लीनियर मॉडल जो है वो यहां पे ट्रेंड हो चुका है अब लीनियर मॉडल ट्रेंड होने के बाद में मैं यहां पे पहले उसकी एक्यूरेसी चेक कर लेता हूं और उसके बाद हमारा क्या रिजल्ट बना है मतलब हमारे पास प्रेडिक्शन इक्वेशन क्या निकल के आई है उसको भी जरा चेक कर लेते हैं चलिए तो इसको भी जरा चेक कर लेते हैं तो मैं एलआर डॉट यहां पे क्या करूंगा स्कोर चेक करूंगा एलआर डॉट स्कोर के अंदर मैं हमारा जो x अंड टेस्ट है यहां पे वो दूंगा और y जो टेस्ट है वो मैं यहां पे देने वाला हूं चेक करता हूं तो मुझे यहां पे 99 पर एक्यूरेसी मिलती है मतलब ये यहां पे बहुत ही अच्छी एक्यूरेसी के साथ हमें यहां रिजल्ट दिखा रहा है 99.99 एक्यूरेसी बहुत ज्यादा अच्छी एक्यूरेसी होती है बहुत ही अच्छी एक्यूरेसी के साथ रिजल्ट दिखा रहा है अब हम एक काम करते हैं हम यहां पे देखते हैं कि हमारी प्रेडिक्शन जो लाइन है वो किस तरह से बनी है तो मैं एक काम करता हूं ये जो मेरा ग्राफ है इस ग्राफ को तो मैं नीचे ले चलता हूं और इसे रन करता हूं तो ये देखिए मेरे पास यहां जो लाइन है वो कुछ इस तरह से नजर आ रही है अब मुझे क्या करना है मुझे यहां पे एक प्रेडिक्शन लाइन बनानी है प्रेडिक्शन लाइन बनाने के लिए मैं यहां पे पीएटी डॉट यहां पे प्लॉट फंक्शन का यूज करने वाला हूं प्लॉट फंक्शन के अंदर मुझे मेरा एक्स एक्सेस का डाटा देना है तो एक्स एक्सेस का डाटा दे सकते हैं हम यहां पे डटा सेट डॉट लेवल के हिसाब से तो मैं डटा सेट डॉट लेवल दूंगा यहां पे एक एक्सेस के अंदर अब मुझे यहां पे मुझे प्रेडिक्शन का डटा देना है तो प्रेडिक्शन का डाटा मैं यहां पे पहले ऊपर बना ले देता हूं अब ये प्रेडिक्शन कैसा है मुझे ओवरऑल ऑल प्रेडिक्शन डाटा है तो मैं यहां पे पीआरडी के नाम से एक वेरिएबल बनाऊंगा जो कि क्या करेगा यहां पे एलआर डॉट यहां पे जो मेरा प्रिडिक्ट फंक्शन है उसके थ्रू ये प्रेडिक्शन करेगा अब प्रेडिक्शन के अंदर मुझे क्या करना है हमें हमारा डाटा देना है अब डाटा कौन सा देंगे हम यहां पे तो देखिए ये जो आपका ग्राफ बना हुआ है ये पूरे पूरे ओवरऑल ऑल डाटा के साथ बना हुआ है तो मैं भी क्या करूंगा इसे ऑल डाटा के साथ ही प्रेडिक्शन करूंगा तो इसलिए मैं अपना प्रेडिक्शन x के साथ कराने वाला हूं तो मैं यहां पे क्या करता हूं मेरा जो प्रेडिक्शन आउटपुट है y वो मैं यहां पे पास ऑन कर देता हूं उसके बाद मैं यहां पे क्या कर रहा हूं कलर देता हूं यहां पे और कलर यहां पे रेड कलर डाल देता हूं चलिए इसे रन करते हैं और रन करने के बाद देखिए मुझे एक रेड कलर की प्रोडक्शन लाइन दिख रही है और जो कि बहुत ही अच्छे तरीके से यहां पे जा रही है और ये हर एक डाटा पॉइंट को टच करते जा रही है और बहुत अच्छा प्रोडक्शन मॉडल बना है इससे यहां पे जो प्रोडक्शन होगा बहुत ही अ सही और बहुत ही अच्छी एक्यूरेसी के साथ मिलेगा और वो हम यहां पे देख भी रहे हैं स्कोर के मेथड के हेल्प से कि ये बहुत ही अच्छी एक्यूरेसी के साथ प्रोडक्शन कर रहा है अब एक काम करते हैं मैं यहां पे क्या कर रहा हूं लेजेंड लगा देता हूं कि ये कौन सी लाइन किसको शो कर रही है तो मैं यहां पे लेजेंड लगा रहा हूं और लेजेंड के आपके पास जो आपका डेटा सेट है वो आपके पास क्या कर रहा है ओरिजिनल डेटा सेट को दिखा रहा है तो मैं यहां पे रजी लिख लेता हूं ओरिजिनल डेटा सेट को और नेक्स्ट आपके पास क्या है यहां पे प्रेडिक्शन डाटा है पीआरडी रन करता रन करके रन करता हूं तो देखिए ओरिजिनल डाटा जो है वो मेरा ब्लू कलर का दिख रहा है और प्रेडिक्शन लाइन आप देख पाएंगे तो ये रेड कलर की दिख रही है अब ये सारा पॉसिबल किस वजह से हो पाया है ये सारा पॉसिबल आपके पास यहां पे डिग्री टू की वजह से हो पाया है अच्छा इस लाइन की इक्वेशन को जरा यहां पे देखिए कि ये लाइन की इक्वेशन किस तरह से नजर आएगी क्योंकि यदि हमने यहां पे लाइन की इक्वेशन को बात करें तो यहां पे जो प्रोडक्शन लाइन है या फिर मैं बा बात करूं प्रेडिक्शन पॉलिनो मियल जो कर्व है यहां पे राइट तो इस कर्व की इक्वेशन क्या होगी यहां पे तो ये कर्वेचर कुछ इक्वेशन इस तरह से बनेगी आपके पास यहां पे आपका m1 आपके पास बनेगा और उसके बाद x1 बनने वाला है प्लस उसके साथ से यहां पे m2 और x2 की पावर टू बनने वाली है मतलब मेरे पास यहां पे पावर टू आने वाली है उसके बाद प्लस बात करें तो c इस तरह की इक्वेशन आपके पास नजर आएगी चलिए यहां पे इस तरह की इक्वेशन आपको नजर आएगी तो मैं यहां पे m1 m2 और c की वैल्यू को निकालने वाला हूं अब ये कैसे निकालेंगे तो l आ डॉट आप क्या करेंगे यहां पे को एफिशिएंट को निकालेंगे तो एल डॉ कफिट अंडरस्कोर रखेंगे तो आपको तीन कफिट यहां पे देखने को मिल जाएंगे इवन दैट यहां पे आप एल आ डॉट यहां पे इंटरसेप्ट करेंगे तो इंटरसेप्ट भी आपको नजर आ जाएगा तो ये जो इक्वेशन है ये इक्वेशन अब किस तरह से कन्वर्जन हो चुकी है जरा उसको देखें यहां पे तो देखिए सबसे पहले आपको y मिलेगा y के बाद में आपका m1 मिलेगा ये रहा आपका m1 m1 के साथ में आपका मल्टीप्लाई हो जाएगा किसका x1 आपके पास मल्टीप्लाई हो जाएगा प्लस यहां पे आपका पास m2 m2 आपके पास करें यहां पे तो ये आपका m2 आपको मिलेगा प्लस उसके साथ से मैं बात करूं यहां पे x2 मिलेगा और x2 के साथ पावर टू मिलने वाली है एंड देन आपके पास + c मिलेगा और + c के अंदर आपके पास माइनस का 13 देखने को मिलेगा तो ये प्लस c आपके पास इस तरह चुका है तो ये आपके पास कुछ इस तरह से आपके पास पॉलीनोट इक्वेशन बनी है इसको और थोड़ा सा यहां पे आपको शो कराऊं तो ये कुछ इस तरह से आपको नजर आएगी देखिए ये आपका कुछ इस तरह से आपका नजर आएगी अब ये कफिट आगे यहां पे ये रो का इंडिकेट कर रहा है ये रो आपके पास एक और होता है जिसके अंदर x की पावर आपके पास रो होती है x की पावर जीरो का मतलब यहां पे आपके पास कोई आगे नंबर नहीं आ रहा क्योंकि हमने जब आपके पॉलिनो मियल डेटा सेट के अंदर जब इसे कन्वर्जन किया था तब आपने इसे देखा होगा कि आपके पास x के अंदर एक एक्स्ट्रा को एक एक्स्ट्रा आपके पास एलिमेंट आता है और वो क्या है आपके पास 1 1 1 आपके पास आता है इसका मतलब क्या है गाइज यहां पे कि आपको एक एक्स्ट्रा पैरामीटर आपको मिलता है एक वन का ओके तो आई थिंक आई होप सो क्लियर हो चुका होगा कि ये किस तरह से आपका पॉलिनॉमियल रिग्रेशन काम करता है अब जब कभी भी आपको प्रेडिक्शन करना है मतलब इस डेटा सेट को डिप्लॉयडी लॉय करते वक्त एक चीज का ध्यान रखिएगा कि जब आप यहां पे एल डॉट यहां पर प्रिडिक्ट फंक्शन को इस्तेमाल करने जा रहे हैं यहां पे तो प्रिडिक्ट फंक्शन के अंदर जो भी आपका डाटा आएगा वह पॉलिनो मियल नेचर का आएगा तो सबसे पहले आप क्या करेंगे कि आप अपने डाटा को पॉलीनोट फीचर के अंदर कन्वर्जन करेंगे मतलब मेरे पास कोई नया डाटा आया है तो नया डाटा को मैं क्या करूंगा पॉलिनो मियल फीचर के अंदर कन्वर्जन करूंगा अब ये पॉलिनो मियल फीचर के अंदर कैसे कन्वर्जन करेंगे तो इसके लिए आपने क्या किया रखा है यहां पे देखिए पए फिट का इस्तेमाल कर रखा है तो मैं सबसे पहले क्या करूंगा यहां पे आपके पास कोई भी नया डाटा आपके पास आता है रैंडम आपका पास कोई डाटा आता है तो मैं क्या करूंगा यहां पे पीएफ डॉट यहां पर फिट के पास जाऊंगा पीएफ डॉट यहां पे क्या करूंगा गाइज यहां पे ट्रांसफॉर्म के पास जाऊंगा ट्रांसफॉर्म के अंदर मैं क्या करने वाला हूं अपना जो नया डाटा आ रहा है उसे ट्रांसफर करूंगा चलिए इसको एग्जांपल के तौर पे देखते हैं कि ये किस तरह से काम करता है तो मैं इसे क्या कर रहा हूं यहां पे इसी एक वेरिएबल में सेव कर लेता हूं जैसे कि मैं यहां पे टेस्ट के नाम से इसे एक सेव कर लेता हूं और ये टेस्ट का जो भी डाटा आएगा मैं उसे देखूंगा टेस्ट का डाटा किस तरह से दिखाई दे रहा है एंड उसके बाद में मैं पेडिक के अंदर यह जो टेस्ट है इस टेस्ट को अप्लाई कर दूंगा अब मैं ट्रांसफॉर्म के अंदर मैं अपना कोई भी डाटा डालता हूं मतलब कोई भी एक लेवल डालता हूं तो जस्ट सपोज मैंने यहां पे टू डायमेंशन डेटा सेट के अंदर लेवल डाला यहां पे 45 तो मुझे 45 लेवल के ऊपर अपनी सैलरी को देखना है कि इसकी सैलरी क्या बनने वाली है तो मैंने 45 डाला एंड रन किया तो इसने मुझे यहां पे एक आउटपुट नजर दिया है यहां पे इस तरह से और इसी का ही मैंने क्या किया है गाइज यहां पे प्रोडक्शन के अंदर डाल दिया तो इसके अंदर मेरे पास क्या कर रहा है यहां पे कुछ ये आउटपुट नजर आ रहा है तो देखिए 45 नंबर पोजीशन के ऊपर हमारी ये सैलरी बन रही है तो इसको जरा चेक कर लेते हैं कि क्या ये रियल में सही यही सैलरी दे रहा है या कोई और सैलरी ही है तो इसको चेक करने के लिए मैं 45 नंबर पे जाऊंगा तो 45 नंबर पे यदि आप इस सैलरी को देखेंगे तो ये आपके पास सैलरी बन रही है और ये जो प्रोडक्शन सैलरी है वो आपके पास लगभग उसके पास ही है मतलब ओरिजिनल सैलरी को देखेंगे 45 पे तो आपके पास क्या है 1056 811 है और जबकि प्रेडिक्शन हमें क्या दिया है यहां पे 1057 494 आपके पास यहां पे दिया है तो ऑलमोस्ट ये आपके आसपास हमें रिजल्ट दे रहा है और ये काफी अच्छा रिजल्ट हमें यहां पे दे रहा है ओके यदि आप चाहते हैं कि आपकी एक्यूरेसी 100% चली जाए तो आप क्या करें इस पॉलिनो मियल फीचर के अंदर जो आपने डिग्री टू लिया है इसको डिग्री थ्री कर सकते हैं डिग्री फोर कर सकते हैं ये जो आपका मॉडल है वो और ज्यादा एक्यूरेट होता चला जाएगा और एक चीज का ध्यान रखिएगा इतने ज्यादा मॉडल को एक्यूरेट मत कीजिएगा कि ये ओवर फिटिंग के तौर प चला जाए तो आपको ओवर फिटिंग के सिनेरियो से भी बचना है तो आपको एक चीज का स्पेशली ध्यान रखना है कि आपका जो डाटा है वो ना तो ज्यादा ओवर फिटिंग हो जाए ना ही ज्यादा अंडर फिट हो जाए एक बेस्ट फिट आपको देखने को मिले जो कि अभी इस मॉडल के अंदर आपको देखने को मिला है कि बेस्ट फिट है आपके पास यहां पे तो इस तरह से आप अपना प्रेडिक्शन कर सकते हैं तो आपको सिंपल सा क्या करना है आपका जो भी डाटा है पहले उसे ट्रांसफॉर्म करना है ट्रांसफॉर्म करने के बाद में आपको यहां पे क्या करना है प्रेडिक्शन के अंदर देना है ताकि वो प्रिडिक्ट हो सके और आज के इस वीडियो के जरिए हम यहां पर बात करने वाले हैं कॉस्ट फंक्शन के बारे में कि कॉस्ट फंक्शन होता क्या है और ये कैसे वर्क करता है तो चलिए इसको जरा यहां पर समझते हैं यहां पे यदि आपको python2 के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं देखिए मैंने यहां पे एक क्लासिफिकेशन और एक रिग्रेशन का एग्जांपल ले रखा है अब हम इन दोनों के बारे में एक बार डिस्कस करते हैं चलिए पहले हम बात कर लेते हैं हमारे रिग्रेशन एनालिसिस के अंदर आप सभी लोगों ने प्रीवियस वीडियो के अंदर रिग्रेशन एनालिसिस को समझ रखा है और जिसके अंदर आपने सिंपल लीनियर रिग्रेशन एनालिसिस को आपने डिस्कस कर रखा होगा तो पहले हम रिग्रेशन एनालिसिस से डिस्कस करते हैं फिर क्लासिफिकेशन के ऊपर भी थोड़ा बात करेंगे अच्छा रिग्रेशन एनालिसिस के अंदर यदि आप आपने सिंपल लीनियर रिग्रेशन यदि आपने पढ़ा होगा तो सिंपल लीनियर रिग्रेशन में आपने देखा होगा कि हमें एक इस तरह से बेस्ट फिट लाइन देखने को मिलती है जो कि हमारी पास यहां पे फ्यूचर का प्रेडिक्शन करती है तो क्या कभी आपने सोचा कि ये लाइन ऐसी ही क्यों आती है ये लाइन आपके पास यहां पे क्यों नहीं आती है या फिर यहां क्यों नहीं चली जाती है या फिर ऐसे क्यों नहीं चली जाती है या फिर ऐसे क्यों नहीं चली जाती है या फिर हो सकता है कि ये लाइन ऐसे ही क्यों ना चली जाती है तो इसके पीछे रीजन होता है कॉस्ट फंक्शन का कॉस्ट फंक्शन की हेल्प से आप क्या करते हैं आपकी एक बेस्ट स् वेट लाइन को बनाते हैं जो कि आपका पास कुछ इस तरह से निकलती है और यदि मैं बात करूं यदि क्लासिफिकेशन के अंदर बात करूं तो यदि आप क्लासिफिकेशन के अंदर यदि आप अपने डटा को देखेंगे तो डाटा को आपको यहां पे स्प्लिट करना है जैसे कि ये ऑरेंज और यहां पे जो ग्रीन कलर का डाटा है इसे मुझे स्प्लिट करना है तो मैं लाइन को कुछ इस तरह से बनाऊंगा ताकि ये डाटा जो है हमारा स्प्लिट हो सके लेकिन आपने कभी सोचा होगा कि ये लाइन इस तरह से क्यों नहीं चली जा सकती है या इस तरह से क्यों नहीं चली जा सकती है इसके पीछे रीजन होता है कॉस्ट फंक्शन का क्योंकि कॉस्ट फंक्शन हमें बेस्ट फट लाइन बनाने में हेल्प करता है अब ये कॉस्ट फंक्शन काम कैसे करता है जरा इसको समझते हैं यहां पे तो कॉस्ट फंक्शन किस तरह से हेल्प करता है इसको जरा देखते हैं तो देखिए आपकी जो लाइन है वो इस तरह से भी बन सकती है लेकिन ये कॉस्ट फंक्शन क्या करता है कि आपके पास जो भी आपका डाटा होता है उस डाटा से जो प्रोडक्शन लाइन का जो डाटा है इसके बीच की जो एरर होती है ये एरर आपके पास क्या की जाती है फाइंड आउट की जाती है इस एरर की हेल्प से आप क्या करते हैं अपनी बेस्ट फीट लाइन को ढूंढते हैं अब देखिए जब कभी भी किसी भी मॉडल को आप बना रहे हैं चाहे आप रिग्रेशन के लिए बना रहे हैं चाहे क्लास फशन के लिए बना रहे हैं इन सबके अंदर एक चीज बहुत ही इंपॉर्टेंट रखी जाती है कि जो आपकी एरर होती है वो सबसे ज्यादा मिनिमम होनी चाहिए यदि आपकी मैक्सिमम हुई एरर तो आपको यहां पे बेस्ट आंसर देखने को नहीं मिलता है तो इसलिए ये क्या करते हैं कि जो आपकी एरर होती है उस एरर को हम क्या करते हैं बहुत ही ज्यादा मिनिमम रखते हैं मिनिमम करने का प्रोसीजर भी होता है यहां पे उसको हम आगे आने वाले वीडियो के अंदर डिटेल के साथ समझेंगे कि इस एरर को किस तरह से मिनिमम रखा जाता है तो ये जो साइकल लन की लाइब्रेरी होती है वो साइकल लन की लाइब्रेरी ऑटोमेटिक आपके पास क्या करती है आपकी जो एरर होती है उस एरर को मिनिमम करती है और मिनिमम करके आपके पास क्या करती है बेस्ट फट लाइन को आपको सामने लाके रखती है अब इसके पीछे रीजन होता है कॉस फंक्शन कॉस फंक्शन के अलावा एक लॉस फंक्शन भी होता है तोब ये कॉस फंक्शन और लॉस फंक्शन में क्या अंतर है तो देखिए बहुत ही मेजर सा डिफरेंस है यहां पे कॉस फंक्शन और लॉस फंक्शन के अंदर दोनों होते ही एरर के फंक्शन है मतलब दोनों ही आपके पास क्या करते हैं कि जो आपका ओरिजिनल डाटा है जो आपका प्रोडक्शन डाटा है इन दोनों के बीच का डिफरेंस ही दोनों निकालते हैं यहां पे बट मेजर डिफरेंस ये होता है कि यदि आप एक सिंगल रो के ऊपर काम कर रहे हैं सिंगल रो के ऊपर आप क्या कर रहे हैं उसकी एनालिसिस कर रहे हैं उसके अंदर लॉस को नि उसके अंदर आपके पास एरर को निकाल रहे हैं तो उसके लिए आप इस्तेमाल करते हैं लॉस फंक्शन का लेकिन जब हम यहां पे ओवरऑल पूरे डेटा सेट के ऊपर बात करते हैं अब डेटा सेट के अंदर नंबर ऑफ रोज हो सकती है अब इसके अंदर कितनी भी नंबर ऑफ रो हो सकती है यदि आप उस पूरे डेटा सेट के ऊपर बात करते हैं तो पूरे डेटा सेट के ऊपर जब आपकी एनालिसिस होती है तब हम इस्तेमाल करते हैं कॉस्ट फंक्शन का और जब हम यहां पे साइकिल एंड की लाइब्रेरी को देखते हैं और साइकल एन के लाइब के थ्रू प्रोडक्शन करते हैं तो वहां पे आपका कॉस्ट फंक्शन ही अप्लाई होता है और जब भी आप बेस्ट फट लाइन यदि आप मैनुअली खुद भी निकालना चाहेंगे यहां पे तब भी आपके पास क्या होता है कॉस्ट फंक्शन ही इस्तेमाल किया जाता है तो आई थिंक आपको समझ में आया होगा कॉस्ट फंक्शन होता क्या है तो कॉस्ट फंक्शन क्या करता है आपके पास यहां पे कि आपकी मशीन लर्निंग जो एल्गोरिथम है या फिर मशीन लर्निंग जो मॉडल है यहां पे वो एक बेस्ट तरीके से काम करें बहुत ही अच्छे तरीके से काम करें उसके लिए आपके पास क्या इस्तेमाल करते हैं कॉस्ट फंक्शन का इस्तेमाल करते हैं और ये क्या करता है आपके पास यहां पे आउटपुट और इनपुट के बीच में एक रिलेशनशिप बनाता है ताकि आपको एक बेस्ट फिट लाइन मिले अब जरूरी नहीं है बेस्ट फिट लाइन यदि हम रिग्रेशन की बात करें तो बेस्ट फिट लाइन होगी क्लासिफिकेशन की बात करें तो वहां यहां पे हमारे पास यहां पे अलग-अलग चीजें हो सकती है प्लेन हो सकता है यहां पे या फिर लाइन हो सकती है यहां पे और भी बहुत सारी चीजें हो सकती है तो उनके अंदर अलग से कॉस्ट फंक्शन अप्लाई होते हैं अब जरा बात करते हैं कि ये कितने टाइप्स के कॉस्ट फंक्शन होते हैं तो बेसिकली बात करें यहां पे तो कॉस्ट फंक्शन को हमने दो टाइप्स के अंदर डिवाइड कर रखा है एक रिग्रेशन कॉस्ट फंक्शन को और एक क्लासिफिकेशन कॉस्ट फंक्शन को मतलब यदि आप रिग्रेशन एनालिसिस का इस्तेमाल कर रहे हैं रिग्रेशन एनालिसिस का मतलब क्या है आपका जो आउटपुट है यहां पे वो कंटीन्यूअस इन नेचर के अंदर मिले तो वो आपका रिग्रेशन एनालिसिस है यदि आपका आउटपुट यदि क्लास इन नेचर के अंदर मिले क्लासिफिकेशन का मतलब यहां पे गाइज ट्रू एंड फाल्स यस नो कैट डॉग के अंदर मिले आपको यहां पे उसको हम बोलते हैं क्लासिफिकेशन और उसके अंदर हम लगाते हैं क्लासिफिकेशन कॉस फंक्शन तो इसके हिसाब से हमने इसको क्या कर रखा है दो कैटेगरी इज के अंदर कर रखा है अब रिग्रेशन के अंदर कौन-कौन से कॉस फंक्शन आते हैं और क्लासिफिकेशन के अंदर हमें कौन-कौन से कॉस फंक्शन पढ़ना है उनको जरा देखते हैं तो गाइज रिग्रेशन के अंदर बात करें तो रिग्रेशन के अंदर हमें कुछ इस तरह के कॉस फंक्शन हमें पढ़ने होते हैं जिसके अंदर आपके स होता है मीन स्क्वायर एरर होता है मीन एब्सलूट एरर होता है यहां पे रूट मीन स्क्वायर एरर होता है और r2 स्कोर होता है तो ये हमें कुछ कॉस फंक्शन पढ़ने पड़ते हैं जो कि आपके रिग्रेशन एनालिसिस के अंदर आते हैं इसी तरह से क्लासि एनालिसिस के अंदर बात करूं तो क्लासिफिकेशन एनालिसिस को हमने दो पार्ट के अंदर डिवाइड कर रखा है एक तो बाइनरी क्लास क्लासिफिकेशन के कॉस्ट फंक्शन होते है और एक मल्टी क्लास क्लासिफिकेशन के कॉस्ट फंक्शन होते हैं बाइनरी क्लास कॉस्ट फंक्शन वहां पे इस्तेमाल किया जाता है जहां पे आपका आउटपुट जो होता है वो ट्रू फॉल्स के अंदर डिवाइड होता है यस नो के अंदर डिवाइड होता है या कैट डॉग के अंदर डिवाइड होता है तो वहां पे हम बाइनरी क्लास क्रॉस फशन को इस्तेमाल करते हैं इसी जगह पर मल्टी क्लास कॉस फशन की बात करूं यहां पे तो जहां पे आउटपुट आपके पास दो से ज्यादा हो जाता है जैसे कैट डॉग काउ बफेलो इस तरह से मुझे डिफरेंशिएबल यहां पे एप्पल बनाना कैरट इसके अंदर मुझे डिफरेंशिएबल क्लास क्लासिफिकेशन की बात करता हूं यहां पे अब इनके अंदर जो यूज़ होने वाले कॉस्ट फंक्शन है वो आपके पास यहां पे या तो आप बाइनरी क्रॉस एंट्रोपिक इस्तेमाल करते हैं या फिर आप लॉग लॉस को इस्तेमाल करते हैं ये दो कॉस्ट फंक्शन के थ्रू आप क्या कर सकते हैं बेटर सेपरेशन कर सकते हैं अपने डाटा के अंदर और बेटर तरीके से आप प्रेडिक्शन कर सकते हैं तो ये थी कॉस्ट फंक्शन की कहानी आगे चलते हुए आने वाले वीडियो के अंदर ये जितने भी मैंने आपको कॉस्ट फंक्शन बताए हैं इनको हम डिटेल के साथ देखेंगे इनके मैथमेटिक इनट्यूशन के साथ देखेंगे और इसको प्रैक्टिकली तरीके से बना के भी देखेंगे कि ये किस तरह से वर्क करते हैं और आज के इस वीडियो के जरिए हम यहां पे बात करने वाले हैं रिग्रेस एंड कॉस्ट फंक्शन के बारे में कि इसके अंदर हमें कौन-कौन से कॉस्ट फंक्शन देखने को मिलते हैं सबसे पहले हम ये जानते हैं कि कॉस्ट फंक्शन हमारे पास किस तरह से हमारी हेल्प करते हैं तो देखिए ये हमारे पास एक डेटा सेट है इस डेटा सेट के अंदर जो आपके पास यहां पे ब्लू कलर के जो डॉट्स आपको दिखाई दे रहे हैं यहां पे ये सारे जितने भी ब्लू के डॉट्स हैं यस मैं यहां पे आपको बना देता हूं ब्लू कलर के डॉट्स को तो ये जितने भी आपके पास ब्लू कलर के डॉट्स आपको दिखाई दे रहे हैं ये आपके पास क्या है आपका ओरिजिनल डाटा है यहां पे और ये जो आप रेड कलर की जो लाइन देख रहे हैं ये रेड कलर की लाइन जो आप देख पा रहे हैं ये हमारे पास कौन सी है हमारी प्रोडक्शन लाइन है अब प्रोडक्शन लाइन के अंदर क्या होता है कि जो ब्लू कलर का डॉट्स है और ये हमारा जो रेड कलर का पॉइंट्स बन रहे हैं यहां पे ये इस तरह से हमारे पास डाटा प्रिडिक्ट होते हैं यहां पे अब इसके अंदर क्या होता है कि हमारा मेन मकसद क्या होता है मतलब हमारा मेन काम क्या होता है कि जो भी आपका डेटा पॉइंट है य यहां पे इन डेटा पॉइंट से हमें एक ऐसी प्रेडिक्शन लाइन को निकालना होता है जिसके हेल्प से हम यहां पे फ्यूचर का प्रेडिक्शन कर सकते हैं लेकिन ये प्रेडिक्शन लाइन कुछ इस तरह की होनी चाहिए कि आपके जो एरर है वो मिनिमम होनी चाहिए अब ये एरर मिनिमम होनी चाहिए इसका मतलब क्या है गाइज यहां पे कि ये जो आपके पास यहां पे जो प्रेडिक्शन आउटपुट है और जो ओरिजिनल आउटपुट है इसके बीच का जो डिफरेंस है आप यहां पर देख पा रहे हैं ये डिफरेंस आपके पास क्या होना चाहिए मिनिम होना चाहिए मतलब डेल्टा की जो वैल्यू है आपके पास यहां पे ये मिनिमम टू मिनिमम होनी चाहिए ये जितनी ज्यादा मिनिमम होगी आपके पास यहां पे उतनी ही अच्छी एक्यूरेसी के साथ आपको आंसर देखने को मिलेगा अब मेजर चीज यहां पे ये आती है कि ये जो लाइन आप बना रहे हैं ये लाइन आप बनाएंगे कैसे मतलब इस एरर को आप मिनिमम करेंगे कैसे तो इस एरर को मिनिमम करने के लिए हमें जरूरत पड़ती है किसकी कॉस्ट फंक्शन की कॉस फंक्शन के जरिए आप ये एरर क्या कर सकते हैं आप मिनिमम कर सकते हैं अब ये डिपेंड करता है कि आप किस समय कौन सा कॉस फंक्शन इस्तेमाल कर रहे हैं जिसकी हेल्प से आप ये एरर को मिनिमम कर सकते हैं अच्छा हमारा मेन काम क्या होता है यहां पे ये जो एरर होती है ये जितनी भी आपकी एरर होती है इस एरर का आप क्या करते हैं यहां पे स्क्वायर करते हैं और स्क्वायर करने के बाद में आप क्या करते हैं सम करते हैं और सम करके आप क्या करते हैं मीन निकाल लेते हैं जिसे आप यहां पे मीन स्क्वायर बोलते हैं क फंक्शन के थ्रू आप यहां पे ये बेस्ट फट लाइन को बनाते हैं अब हम यहां पे जानते हैं कि आपके पास कौन-कौन से कॉस फंक्शन देखने को मिलते हैं तो मेजर्ली आपके पास यहां पे तीन तरह के कॉ फंक्शन आपको देखने को मिलेंगे और ये तीन तरह के कॉस फंक्शन कौन-कौन से हैं सबसे पहले आपको यहां पे मिलने वाला है मीन स्क्वायर एरर यहां पे हम इसे एमएस भी यहां पे बोलते हैं सेकंड आपको मिलने वाला है मीन एब्सलूट एरर आपको मिलने वाला है और थर्ड वन के बात करें यहां पे तो आपके पास यहां पे रूट मीन स्क्वायर एरर आपको दिखने वाला है ये तीनों जो एरर आप देख पा रहे हैं ये तीनों एरर डिपेंड करता है कि आपका डेटा सेट किस तरह से है और आप रिक्वायर्ड क्या चाहते हैं उसके बेसिस पे आप क्या करते हैं ये एरर आप यहां पे फाइंड आउट करते हैं चलिए अब हम बात करते हैं इन तीनों एरर के बारे में कि इन तीनों के एरर का फॉर्मूला क्या है और कैसे काम करता हैसे पहले मैं बात करूंगा मीन स्क्वायर एरर के बारे में तो देखिए मीन स्क्वायर एरर का फॉर्मूला क्या है यहां पे कि आप अपने डाटा का जो भी आपके पास वैल्यू है यस जो भी आपके डटा की वैल्यू है उसमें से आप क्या करते हैं अपनी प्रेडिक्शन वैल्यू को सबस्टैक करते हैं और फिर इसका स्क्वायर करते हैं और उसके बाद मी निकालते हैं मतलब क्या हो रहा है गाइ यहां पे लेट्स सपोज ये आपके पास क्या है डेटा पॉइंट्स है यहां पे इन डेटा पॉइंट्स से आप क्या कर रहे हैं कुछ इस तरह से आप प्रेडिक्शन लाइन निकाल रहे हैं इस प्रेडिक्शन लाइन के अंदर आप क्या करते हैं कि आपके पास जो भी आपकी प्रेडिक्शन लाइन से जो भी आपका डिफरेंस है जैसे कि यह मेरा डिफरेंस है यहां पर है इन डिफरेंस की आप क्या करते हैं वैल्यू को निकालते हैं यहां पे y आपके पास क्या है ओरिजनल वैल्यू है और y हैड जो दे रखा है यहां पे ये क्या है आपका प्रिडिक्टेड वैल्यू है राइट जैसे कि आपके पास यहां पे आपका पास मान लीजिए y आपका ओरिजिनल है और y हैट आपका प्रेडिक्शन है जैसे कि मैंने यहां पे टू लिखा तो थ्री प्रेडिक्शन हुआ मैंने फोर लिखा तो आपका सेवन प्रोडक्शन हुआ इसी तरह से मैंने यहां पे फाइव लिखा तो ये आपका सिक्स प्रोडक्शन कर रहा है मैंने यहां पे सेवन लिखा तो यहां पे ये क्या कर रहा है यहां पे एट प्रोडक्शन कर रहा है और नाइन लिखने पर आपका 10 प्रोडक्शन कर रहा है तो आपका पास क्या करते हैं सबसे पहले कि ये जो एरर आप देख पा रहे हैं यहां पे ये जो डिफरेंस देख पा रहे हैं इस डिफरेंस को आप निकालते हैं डिफरेंस को निकालने के बाद में आप क्या करते हैं उसका स्क्वायर करते हैं मतलब आप अपनी वैल्यू का क्या करेंगे स्क्वायर करेंगे स्क्वायर करने के बाद में आप क्या करते हैं उसका मीन ले लेते हैं मीन लेने के लिए 1 / n का इस्तेमाल करेंगे तो आपके पास मीन आ जाएगा यहां पे जो n है ये n है आपके पास नंबर ऑफ रो यस एंड क्या है आपके पास यहां पे नंबर ऑफ आपके पास यहां पे रो है कितनी रो का आप इस्तेमाल करने जा रहे हैं वो आप क सता है अब मीन स्क्वायर एरर के थ्रू आप क्या करते हैं अपनी जो बेस्ट फिट लाइन है यह आप प्रेडिक्शन करते हैं मतलब अब ये बेस्ट फीट लाइन कैसे प्रोडक्शन की जाती है जरा इसको समझते हैं यहां पे तो एक छोटा सा एग्जांपल के तौर पे मैं आपको बताने जा रहा हूं मीन स्क्वायर एरर आपके पास बेस्ट फीट लाइन कैसे प्रोडक्ट करेगा तो देखिए ये आपके पास कुछ इस तरह से आपका डेटा सेट है लेट्स सपोज ये आपका कुछ यहां पे डेटा सेट आपके पास बना हुआ है इस डेटा सेट के अंदर आप क्या करते हैं सबसे पहले आपके पास कोई भी एक रैंडम आप एक प्रोडक्शन लाइन बना लेते हैं जैसे कि मैंने ये रि ये है सबसे पहले रेंडम मेरी प्रोडक्शन लाइन बना दी है अब रेंडम प्रोडक्शन लाइन बनाने के बाद में आप क्या करते हैं यहां से आपके जो डेटा पॉइंट्स हैं इनके एरर को फाइंड आउट करना स्टार्ट कर लेते हैं आपके जो भी डेटा पॉइंट्स हैं इनके एरर को फाइंड आउट करना स्टार्ट कर लेता है अब ये एरर आपके पास यहां पे आपको क्या करता है मैक्सिमम लगता है तो आप यहां पे क्या करते हैं अपनी जो लाइन है उनको चेंज करते हैं थोड़ा सा लाइन को चेंज करके यहां पे लेके आते हैं फिर से आप एरर निकालते हैं फिर से आप अपनी लाइन को चेंज करके अपनी एरर निकालते हैं फिर से आप अपनी चेंज करते हैं फिर से एरर निकालने के बाद अपनी फिर से लाइन बनाते प्रिडिक्शन निकालते हैं प्रेडिक्शन करके फिर से आप अपनी लाइन बनाते हैं लाइन करने के बाद अपनी प्रेडिक्शन वैल्यू को निकालते हैं और प्रेडिक्शन वैल्यू के बाद में एरर को निकालते हैं एरर जहां पे आपको सबसे ज्यादा मिनिमम आपको देखने को मिलेगी वहां पे आपकी जो प्रेडिक्शन लाइन है वो आपके पास बन जाएगी और वहां से आपके पास y इ mx-5 आपके पास फिर से लाइन एक बनाते हैं और फिर से उसका एरर फाइंड आउट करते हैं यदि पहले वाले से आपकी एरर जो है अब कम हो चुकी है है तो आप क्या करते हैं जो नई वाली लाइन है उसे ऑब्जर्व कर लेते हैं पुरानी लाइन को हटा देते हैं इस तरह से करते हुए आप क्या करते हैं अपने फाइनल आंसर पे निकलते हैं उसके लिए आप क्या करते हैं मीन स्क्वायर एरर का इस्तेमाल करते हैं अब मीन स्क्वायर एरर का इस्तेमाल करने के क्या फायदे हैं और क्या नुकसान है उसको जरा समझते हैं मतलब इसके क्या प्रॉन्स है उसको जरा समझते हैं यहां पे तो देखिए मीन स्क्वायर एरर का जब आप इस्तेमाल करते हैं तो ये क्या है गाइ यहां पे एक डिफरेंशिएबल इक्वेशन है डिफरेंशिएबल इक्वेशन का मतलब है यहां पे गाइज यहां पे कि आप इसका डिफरेंशिएबल करने की क्यों जरूरत पड़ती है तो देखिए जब भी आप यहां अपनी बेस्ट फिट लाइन को निकालने के लिए चलते हैं तो उसके लिए आपको एक इक्वेशन की जरूरत पड़ती है और वो इक्वेशन ये है कि आप कोई भी वैल्यू निकालने जा रहे हैं जैसे कि आपकी जो इक्वेशन है यस y = mx0 आपकी लीनियर इक्वेशन है इस लीनियर इक्वेशन में यदि आप m की वैल्यू निकालने जा रहे हैं तो m की वैल्यू को निकालने का एक फार्मूला होता है वो होता है m न्यू मतलब आप अपनी न्यू वैल्यू निकालने जा रहे हैं इक्वल्स टू m ओल्ड m का क्या करना है ओल्ल्ड लेना है माइनस यहां पे आता है लर्निंग रेट और लर्निंग रेट के बाद में आता है d ए बाय आपके पास है ये आपके पास आता है अब यहां पे आप क्या कर रहे हैं अपनी जो लॉस है लॉस का मतलब मैं गाइज बात करूं यहां पे ये जो मीन स्क्वायर एरर है यहां पे इसका आप क्या करते हैं डिफरेंशिएबल आती है एट अ पॉइंट आप जो भी आप रख रहे हैं यहां पे आपको पॉइंट रखना पड़ता है उस पॉइंट के ऊपर जो भी आप वैल्यू रखते हैं उसके हिसाब से आपके पास क्या मिलता है एक आपके dl4 है स्क्वायर फॉर्मूला होने का मतलब क्या है गाइज यहां पे कि यदि आप इसको जब प्लॉट करते हैं तो ये आपको क्या करता है एक पैराबोला बना के देता है और पैराबोला एक डिफरेंशिएबल इक्वेशन होती है आप इसका डिफरेंशिएबल चाहे वो आप आराम से निकाल पाते हैं लेकिन यदि आपके पास यहां पे स्क्वायर नहीं होता तो आपके पास यहां पे ये डिफरेंशिएबल इक्वेशन नहीं बन पाती और आपने बेस्ट फिट आंसर तक नहीं पहुंच पाते हैं तो आप क्या करते हैं यहां पे कि ये जो आपके इक्वेशन है इस इक्वेशन के मिनिमम पॉइंट तक आपको यहां पे पहुंचना पता है इसको हम ग्रेडिएंट डिसेंट बोलते हैं और ग्रेडिएंट डिसेंट के थ्रू आप यहां पे ये जो मिनिमम पॉइंट्स आप देख पा रहे हैं इस जगह पर आप पहुंच पाते हैं और इस जगह पे पहुंचने के बाद आपको बेस्ट आपको आंसर मिलना प मिलता है तो गाइज आप यहां पे जभी भी आप m और c की वैल्यू को निकालना चाहते हैं तो m और c को निकालने का फॉर्मूला क्या होता है कि आप अपने पुराने वाले को लेते हैं यहां पे उसमें से लैडा मतलब लर्निंग रेट ये होती है आपकी यहां पे लर्निंग रेट इस लर्निंग रेट को मल्टीप्लाई करते हैं किससे dlf1 करते हैं मतलब आपने लॉस फंक्शन को क्या करते हैं अ रिस्पेक्ट ऑफ m के रिस्पेक्ट में आप क्या करते हैं इसे डिफरेंशिएबल आता है तो यहां पे ये जो आपके इक्वेशन है ये एक डिफरेंशिएबल इक्वेशन है ये एक बहुत ही अच्छी चीज है ताकि आप यहां पे अपने मिनिमम पॉइंट तक आप आराम से पहुंच पाते हैं ये एक सबसे बड़ी बहुत ही इंपॉर्टेंट चीज है क्योंकि यहां पे आपने स्क्वायर का इस्तेमाल किया है तो मिन स्क्वायर एरर का ये सबसे बड़ा फायदा है मिन स्क्वायर एरर का सबसे बड़ा लॉस ये है कि ये आउटलायर के साथ बहुत ही रोबट है अब आउटलायर के साथ कैसे रोबट है जरा समझते हैं यहां पे तो देखिए लेट्स सपोज आपके पास कुछ डाटा आपके पास कुछ इस तरह से पड़ा है जैसे आपके पास जो डाटा आपके पास है वो कुछ इस तरह से पड़ा है और मान लीजिए आपके पास यहां पे कहीं आपके आउटलायर आ चुके हैं कुछ इस तरह से आउटलायर आ चुके हैं तो मीन स्क्वायर एरर क्या करेगा गाइज यहां पे कि आपके पास पहले तो आपकी प्रोडक्शन लाइन ये होनी चाहिए और ये आपको दिखा देगा लेकिन जैसे ही आपके पास आउटलायर गा तो आउटलायर आने से क्या होगा कि यहां पे जो एरर है वो एरर क्या हो जाएगी बढ़ जाएगी क्योंकि आपने स्क्वायर का इस्तेमाल किया है तो आपकी जो एरर है वो एरर क्या होगी टू के रिस्पेक्ट में बढ़ेगी मतलब स्क्वायर के रिस्पेक्ट में बढ़ेगी जैसे एरर आपकी थ्री है तो वो आपके पास क्या करेगी नाइन कर देगी आपकी एरर फोर है तो वो आपके क्या करेगी 16 करेगी तो एरर आपकी क्या हो जाएगी बढ़ जाएगी एरर जैसे ही बढ़ जाएगी तो आपकी जो लाइन है जो लाइन आपके पास यहां आनी चाहिए थी ये लाइन आपके पास यहां से चेंज होके कुछ इस तरह से चली जाएगी या फिर आपके पास कुछ इस तरह से चली जाएगी तो यह जो लाइन है अपनी जो ओरिजिनल पोजीशन से शिफ्ट होके आपके पास आउटलायर की तरफ शिफ्ट हो जाती है यह जो लाइन है आपके पास यहां पे जो ओरिजिनल पोजीशन से शिफ्ट होके क्या करेगी आउटलायर की तरफ शिफ्ट हो जाएगी इससे क्या होगा यहां पे हमारे रॉन्ग प्रेडिक्शन करना स्टार्ट हो जाएगा जब भी आपके सिस्टम में आउटलायर प्रेजेंट हो तो उस वक्त मीन स्क्वायर एरर जो है वो आपके पास यहां पे आपको रॉन्ग प्रेडिक्शन आउटपुट देती है क्योंकि ये आउटलायर के साथ इतना परफेक्टली अच्छे तरीके से वर्क नहीं कर पाती है ये एक सबसे बड़ा दिक्कत है यहां पे सेकंड अप सबसे बड़ी प्रॉब्लम यहां पे क्या है कि जब भी आप यहां पे कोई भी आप एरर निकालते हैं तो एरर आपको स्क्वायर के टर्म के देखने को मिलती है मतलब आपके पास जो यूनिट होती है वो यूनिट आपको स्क्वायर के टर्म में देखने को मिलती है मलब आप जैसे सेंटीमीटर डाल रहे हैं तो सेंटीमीटर नहीं मिलके सेंटीमीटर स्क्वायर आपको देखने को मिलता है तो ये आपके एक बहुत बड़ी प्रॉब्लम होती है कि आपको जो ओरिजिनल डाटा होता है मतलब एरर जो होती है आपके पास यहां पे वो ओरिजिनल फॉर्मेट के अंदर नहीं मिलती है आपको यहां पे स्क्वायर फॉर्मेट के अंदर देखने को मिलती है स्क्वायर के फॉर्मेट में आपको देखने को मिलती है तो ये दो बहुत बड़ी प्रॉब्लम थी यहां पे जब आप मीन स्क्वायर एरर का इस्तेमाल करते हैं अब हम बात करते हैं गाइज यहां पे नेक्स्ट आपकी एरर के बारे में जो है मीन एब्सलूट एरर अब मीन एब्सलूट एरर क्या करती है गाइज यहां पे मीन एब्सलूट एरर भी आपके पास क्या करती है आपको बेस्ट फीड लाइन प्रेडिक्शन करने के लिए यूज की जाती है इसका फार्मूला क्या है गाइज यहां पे 1 / n समेशन ऑफ मोड ऑफ आपके पास y - y हैट है आपके पास यहां पे अब देखिए मीन स्क्वायर एरर और मीन एब्सलूट एरर के अंदर बेसिक डिफरेंस क्या है कि यहां पे हम क्या कर रहे थे स्क्वायर का इस्तेमाल करते हैं और यहां पे हम क्या कर रहे हैं गाइज यहां पे मोड का इस्तेमाल कर रहे हैं मतलब हम यहां पे एब्सलूट वैल्यू ले रहे अब ये मोड का मतलब क्या है तो पहले थोड़ा मड का मतलब समझ लेते हैं यहां पे कि जस्ट सपोज आपके पास x = 2 लिखा हुआ है और यदि आपने यहां पे मड ऑफ x का इस्तेमाल किया है तो ये आपको आंसर क्या देगा टू ही देगा लेकिन आपने x = -2 दे दिया यहां पे और फिर से आपने मोड ऑफ x के अंदर डाला यहां पे तो ये आपको क्या करेगा यहां पे + 2 नजर आएगा मतलब यदि आपकी नेगेटिव वैल्यू है तब भी आपको पॉजिटिव आंसर मिलेगा यदि आपके पॉजिटिव वैल्यू है तब भी आपको पॉजिटिव आंसर देखने को मिलेगा तो मोड का आपका बेसिक कांसेप्ट ये होता है कि आपका चाहे नेगेटिव हो चाहे पॉजिटिव हो ये हमेशा और हमेशा क्या मिलता है पॉजिटिव आंसर देखने को मिलता है जब भी आप इसका ग्राफ बनाते हैं तो ग्राफ आपके पास कुछ इस तरह से नजर आता है जैसे कि आपके पास ये वाला पॉइंट आ गया और फिर इस तरह पॉइंट्स आ गया जब आप आप ग्राफ बनाते हैं तो ये ग्राफ आपको इस तरह से देखने को मिलता है अब ये जो ग्राफ आप देख रहे हैं ये डिफरेंशिएबल ग्राफ नहीं है तो ये एक सबसे बड़ी इसकी प्रॉब्लम है अब हम जान लेते हैं इसके क्या फायदे हैं और क्या नुकसान है तो देखिए सबसे पहले जो सबसे बेसिक बेनिफिट्स यहां पे ये है कि इसके अंदर जो आपकी एरर होती है वो एरर आपकी ओरिजिनल फॉर्मेट के अंदर ही देखने को मिलती है मतलब आपके पास जो रर है जो एरर है वो एरर आपको स्क्वायर के फॉर्मेट में नहीं देखने को मिलती है जैसे कि आपने यहां पे पीछ पीछे देखा था तो पीछे आपने क्या देखा था यहां पे जब मीन स्क्वायर एरर की हम बात कर रहे थे यहां पे तो मीन स्क्वायर एरर के अंदर आपने क्या देखा था कि आपकी जो एरर है वो स्क्वायरिंग हो जाती है जस्ट लाइक आपके जो एरर है यहां पे फोर आ रही थी तो ये क्या करता है इसको 16 दे देता है और ये एरर मान लीजिए सेंटीमीटर में आ रही थी तो ये क्या करता है सेंटीमीटर स्क्वायर कर देता है इसी तरह से 5 सेंटीमीटर की एरर आ रही थी तो ये क्या करेगा 25 सेमी स्क्वायर कर देगा तो एरर आपके क्या हो जाती है स्क्वायर हो जाती है यहां पे जो ओरिजिनल एरर है उसको निकालने में थोड़ी सी प्रॉब्लम होती है वहीं पे हम बात करें यहां पे मेन एब्सलूट एरर के बारे में तो ये आपको ओरिजिनल डाटा के अंदर आउटपुट के अंदर देता है मतलब ओरिजिनल एरर आपको यहां पे देता है लेट्स सपोज आपके पास यहां पे -4 एरर है हां लेकिन ये फोर एरर दिखाएगा लेकिन आपकी जो यूनिट होगी यदि आपके सेंटीमीटर के अंदर एरर है तो ये भी आपको सेंटीमीटर के अंदर ही एरर आपको शो करेगा मतलब यूनिट आपके पास कोई चेंजेज यहां पर नहीं होने वाली है ये अच्छा एक बेनिफिट है इसके साथ-साथ एक और अच्छा बेनिफिट ये भी है कि ये आउटलायर के साथ यहां पे अच्छे तरीके से ट्रीट करती है मतलब ये आउटलायर के साथ यहां पे सही तरीके से वर्क करती है कैसे जैसे देखिए यहां पर मैं कुछ यहां पे डेटा पॉइंट लेता हूं और यहां पे कुछ आउटलायर बना लेता हूं अब जब हम हम यहां पे बात कर रहे थे मीन स्क्वायर एरर का तो मीन स्क्वायर एरर क्या करती है आउटलायर के साथ क्या करती है रोब होती है रोब करने का मतलब क्या है आपका सही तरीके से वर्क नहीं करती है वो क्या करती है अपनी जो प्रोडक्शन लाइन है वो आउटलायर की तरफ ले जाती है ये कौन करता है आपका पास यहां पे मीन स्क्वायर एरर आपके पास करती है लेकिन मीन एब्सलूट एरर जो है वो आपके पास कुछ इस तरह से नहीं करती है वो आपके पास क्या करती है थोड़ा सा ही शिफ्ट होती है मतलब ज्यादा शिफ्टिंग नहीं होती है थोड़ा सा ही शिफ्ट होती है यदि आपके सिस्टम के अंदर आउटलायर प्रेजेंट है तो आप मीन एब्सलूट एरर के ऊपर ही जाएं उसकी एरर को ही कंपैरिजन करें वही आपके लिए क्या रहेगी बेस्ट रहने वाली है और फिर मैं बात करूं यहां पे तो ये कौन देता है मीन एब्सलूट एरर आपके पास ये रिजल्ट आपको देती है मतलब ये आउटलायर के साथ यहां पे अच्छे तरीके से वर्क करती है और आउटलायर के ऊपर यहां पे इतनी ज्यादा रोब नहीं होती है और आपको सही तरीके से प्रेडिक्शन करके देखती है ऐसा रीजन ये है कि आपका जो एरर है वो एरर स्क्वायरिंग नहीं हो पाता है और जब एरर आपकी स्क्वायर नहीं होती है तो आपके पास यहां पे आपको रिजल्ट देखने को मिलता है अब जानते हैं इसके अंदर सबसे बड़ा ड्रॉ बैक सबसे बड़ा ड्रॉबैक इसका यह है क्योंकि यह एक डिफरेंशिएबल इक्वेशन नहीं है डिफरेंशिएबल इक्वेशन का मतलब है गाइ यहां पे कि जब मैं इसको डिफरेंशिएबल हूं जैसा कि मैंने अभी आपको थोड़ी देर पहले बताया था कि जब आप यहां पे वैल्यू को प्रोडक्शन करते हैं मतलब आप यहां पे y = mx3 के अंदर जब आप इस m को प्रोडक्शन करने जाते हैं तो ये जो m का प्रोडक्शन का जो फार्मूला होता है वो क्या होता है यहां पे m न इक्व टू m ओल्ड और उसके साथ क्या आएगा यहां पे m ओल्ड माइनस क्या करते हैं लैडा और लडा करने के बाद में आप क्या करते हैं dl5 देखने को मिलता है ये शार्प कॉर्नर पॉइंट्स की वजह से आप यहां पे इसका डिफरेंशिएबल नहीं होता है तो आपका पास क्या करना पड़ता है आपके इसके आसपास के जो पॉइंट्स होते हैं वहीं पे ही आपका प्रोडक्शन करने को मिलता है जब आप यहां पे मीन एब्सलूट एरर की बात कर कर रहे होते हैं तब इस समय आपको सही तरीके से प्रिडिक्शन आउटपुट नहीं देखने को मिलता है क्योंकि ये आपके पास परफेक्टली एक डिफरेंशिएबल इक्वेशन नहीं होती है इस वजह से आपके पास यहां पे परफेक्टली आपको आंसर देखने को कम देखने को मिलता है अब हम बात करते हैं हमारी अगले एरर के अंदर तो जो अगली एरर है यहां पे रूट मीन स्क्वायर एरर है अब रूट मीन स्क्वायर क्या एरर है यहां पे कि जो आपकी मीन स्क्वायर एरर थी उसका आपने क्या कर दिया स्क्वायर रूट ले लिया तो आपके पास क्या बन गई रूट मीन स्क्वायर बन गई अब ये जो इक्वेशन है ये आपकी डिफरेंशिएबल इक्वेशन है और ये आउटलायर के साथ यहां पे रोबट भी नहीं है यहां पे परफेक्टली वर्क भी करती है इवन दैट जहां पे आपके पास मीन स्क्वायर एरर के अंदर जो एरर थी वो आपके पास यहां पे स्क्वायर्ड फॉर्मेट के अंदर आ रही थी मतलब आपका जो यूनिट थी वो स्क्वायर फॉर्मेट के अंदर आ रही थी ये आपके पास क्या करता है उसी को ओरिजिनल फॉर्मेट के अंदर आपके लाके रख देता है तो आपको यहां पे ओरिजिनल रिजल्ट यहां पर देखने को मिल जाता है तो ये थी आपके पास रूट मीन स्क्वायर एरर ये डिफरेंशिएबल भी है और ये आपके पास यहां पे मीन स्क्वायर एरर की तरह ही वर्क करती है तो यह थी कुछ आपके पास स्पेसिफिक एरर जिनका आप इस्तेमाल करते हुए अपने मॉडल को बेटर बना सकते हैं आज के इस वीडियो के जरिए हम यहां पे पता करने वाले हैं कि बैस्ट फीड लाइन कैसे निकाली जा सकती है यदि आपको पाइथन मशीन लर्निंग डेटा साइंस एंड डेटा एनालिस फील्ड में अपने आपको को ग्रो करना है तो इसके लिए डब्लू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पर कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं चलिए जरा से देखते हैं तो देखिए बेस्ट फड लाइन के ऊपर हम पता करने के लिए मैं एक काम कर रहा हूं मैं एक डटा सेट को कॉल करता हूं मतलब एक ग्राफ को कॉल करता हूं अब देखिए ये मेरे पास एक ग्राफ है जिस ग्राफ के अंदर मैं क्या कर रहा हूं यहां पे एक तरफ मेरे पास क्या है x एक्सिस है और दूसरी तरफ क्या है मेरे पास यहां पे y एक्सिस है ओके अब आपने यदि ऑब्जर्व किया होगा यदि आप साइकल लाइन की लाइब्रेरी को इस्तेमाल करते हैं तो साइकल लाइन की लाइब्रेरी क्या करती है आपको एकदम बेस्ट फीड लाइन बना के देती है मतलब एसी लाइन बना के देती है जो इसके बीचोंबीच से निकलती है जो कि एक बेस्ट फीड लाइन लाती है और वहां पे एक्यूरेसी आपको हाई देखने को मिलती है अब क्या आपने ये कभी नहीं सोचा है कि ये लाइन जो है यहां क्यों आई हमें ये लाइन जो है ऐसी ही क्यों देखने को मिली है ये लाइन ऐसे भी तो आ सकती थी ये लाइन ऐसे भी तो आ सकती थी ये लाइन ऐसे भी आ सकती थी या फिर बोला जाए तो ये लाइन ऐसे भी आ सकती थी ये लाइन ऐसे ही क्यों आई है क्या रीजन है इसके पीछे ऐसी लाइन आने का तो आज की इस वीडियो के जरिए हम यही देखने वाले हैं कि हाउ टू फाइंड बेस्ट फीट लाइन ये बेस्ट फीट लाइन कैसे पता की जाती है यहां पे इसको जरा आप देख रहे हैं अब देखिए जब भी आप लीनियर रिग्रेशन को इस्तेमाल करने जा रहे हैं तो लीनियर रिग्रेशन की एल्गोरिथम क्या होती है बेसिकली मैं एक इनपुट और एक आउटपुट के बेसिस पे मैं बात करने जा रहा हूं यहां पे तो लीनियर रिग्रेशन की एल्गोरिथम क्या होती है यदि मैं लीनियर रिग्रेशन की एल्गोरिथम की बात करूं तो लीनियर रिग्रेशन की एल्गोरिथम होती है y = आपके पास क्या होती है mx3 होती है अब ये mx3 जो आपको देखने को मिल रही है यहां पे m क्या है कफिट है और c क्या है कांस्टेंट है यहां पे बेसिकली ये स्लोप ऑफ द कर्व है यहां पे स्लोप ऑफ़ द लाइन है यहां पे ये क्या है आपके पास इंटरसेप्ट की वैल्यू है राइट अब इसकी बात करें तो ये हमें क्या देता है जनरली ये हमें एक लाइन की इक्वेशन बना के देता है जस्ट यहां पे मैं बात करूं तो यदि आपके पास यहां पे कोई x की वैल्यू होगी और आपके पास कोई y की वैल्यू होगी यदि दो पॉइंट होगी तो ये क्या करेगा एक इस तरह से लाइन आपको बना के देने वाला है यहां पे अब मैं कह रहा हूं यहां पे कि मेरे डेटा सेट के ऊपर ये लाइन कैसे बना के देता है तो इसके लिए यहां पे क्या वर्क करता है आपकी एरर वर्क करता है अब ये एरर क्या चीज होती है बेसिकली गाइ जरा इसको समझते हैं तो देखिए मैं एक डेटा सेट लेता हूं यहां पे एक डटा पॉइंट लेता हूं और यहां पे हमारी एक प्रेडिक्शन लाइन बनाता हूं लेट्स सपोज कीजिए कि आपके पास ये जो ब्लू कलर के जो आइकंस दिख रहे हैं दैट योर आपके पास ओरिजिनल डेटा पॉइंट यहां पे और ये जो लाइन दिख रही है ये आपकी बेस्ट फट लाइन है अब यहां पे क्या है कि ये आपका डेटा पॉइंट है इसके अकॉर्डिंग ये प्रोडक्शन लाइन क्या है प्रोडक्शन पॉइंट क्या है ये वाला प्रोडक्शन पॉइंट होगा इसके अकॉर्डिंग ये प्रोडक्शन पॉइंट होगा इसके अकॉर्डिंग ये प्रोडक्शन पॉइंट होगा इस पॉइंट के अकॉर्डिंग ये प्रोडक्शन पॉइंट होगा इस इसके अंदर ये प्रोडक्शन पॉइंट होगा और ये प्रोडक्शन पॉइंट होगा अब क्या है ना गाइज यहां पे कि ये जो आपके पास यहां पे ओरिजिनल डाटा है मतलब ये जो आपके पास क्या है ये तो आपका ओरिजिनल डाटा है और ये आपके पास क्या है आपका प्रेडिक्शन डाटा है रिजनल डेटा और प्रेडिक्शन डटा के बीच में जो आपको डिफरेंस देखने को मिलता है दैट इज कॉल्ड ऑफ एरर ये आपके पास क्या कहलाती है एरर कहलाती है अब जब भी हम हमारी बेस्ट फिट लाइन को सर्च करने के लिए निकलते हैं जैसे कि मैं यहां पे अपने ऊपर डटा सेट ऊपर पॉइंट के ऊपर ले चलू यहां पे जब भी मैं यहां पे अपनी बेस्ट फिट लाइन को सर्च करने के लिए लूंगा कि ये मेरी बेस्ट फिट लाइन होने वाली है ठीक है तो उस वक्त हम क्या करते हैं कि जो हमारी एरर होती है उस एरर को हम क्या करते हैं मिनिमम करते हैं जितनी ज्यादा मिनिमम एरर होगी उतनी ज्यादा हमें यहां पे ये प्रेस साइज लाइन मिलेगी मतलब यहां पे एक्यूरेट लाइन हमें देखने को मिलेगी यहां पे एक बेसिक तौर पे बोलूं तो मुझे यहां पे क्या मिलेगा एम और सी की बेस्ट वैल्यू देखने को मिलेगी यस m और c की हमें क्या मिलेगी एक बेस्ट वैल्यू मिलेगी देखिए जब भी आपके पास बोला जाए कि हम बेस्ट फीट लाइन को सर्च करें यहां पे हम बेस्ट फट लाइन को नहीं सर्च कर रहे होते हैं हम यहां पे एओ स मतलब आपके पास कफिट कांस्टेंट की वैल्यू या या फिर मैं बात करूं स्लोप और इंटरसेप्ट की वैल्यू को फाइंड आउट कर रहे होते हैं मतलब बेस्ट उसकी वैल्यू को फाइंड आउट कर रहे होते हैं अब इसके लिए हम क्या करते हैं एरर को मिनिमम करते हैं एरर का एक दूसरा नाम भी होता है गाइज यहां पे आप सब लोगों को पता होगा लॉस होता है यहां पे हम क्या करते हैं लॉस को मिनिमम करने के लिए चलते हैं अब लॉस को मिनिमम करने का मतलब क्या है कि बेसिकली यहां पे हमारे पास ओरिजिनल वैल्यू और आपके पास यहां पे आपके पास ये जो प्रिडिक्टेड वैल्यू है इसके बीच का जो लॉसेस है जिसके बीच का जो गैप है यहां पे उसको हम मिनिमम करने के लिए चलते हैं अब ये मिनिमम कैसे होता है और क्या है यहां पे तो इसके लिए आपको थोड़ा सा लॉस की इक्वेशन का पता होना जरूरी है यहां पे यदि मैं लॉस की इक्वेशन की बात करूं यस मैं लॉस की इक्वेशन की बात करूं तो जो हमारे पास लीनियर रिग्रेशन के अंदर लॉस की इक्वेशन इस्तेमाल की जाती है वो होती है यहां पे गाइ मीन स्क्वायर एरर लॉस अब ये मीन स्क्वायर एरर लॉस का मतलब क्या है गाइज यहां पे तो बेसिकली आप क्या करते हैं कि जो भी आपका ओरिजिनल डाटा है और जो भी आपका प्रेडिक्शन डटा है इसका आप क्या करते हैं पहले सबट क्शन करते हैं राइट तो मतलब आपको क्या करना है यहां पे जो भी आपका वा ओरिजिनल है इसमें से क्या करते हैं आप यहां पे y पीआरडी मैं वा हैड से डिनोट करता हूं पीआरडी को तो y हेड से आप क्या करते हैं सबट क्शन करते हैं सबट क्शन करने के बाद में आपको क्या करना होता है स्क्वायर करना होता है स्क्वायर के बाद में 1 / n और उसके बाद में समेशन मतलब आपने क्या स्क्वायर करना होता है स्क्वायर करने के बाद में आप क्या करते हैं समेशन करते हैं और समेशन करने के बाद 1 / n कर लेते हैं मतलब गाइज यहां पे मैं बात करूं कि ये जो आपके पास लॉस का फंक्शन है इसे लॉस फंक्शन नहीं हम यहां पे कॉस्ट फंक्शन बोलेंगे लॉस और कॉस्ट में बहुत बड़ा डिफरेंस होने वाला है आगे चलते हुए इस वीडियो के अंदर हम लॉस एंड कॉस्ट के अंदर बहुत बड़ा अंतर होता है यहां पे आप सभी लोगों को पता होगा यहां पे क्योंकि हमने लॉस और कॉस के ऊपर एक डेफिनेट वीडियो बनाई है जहां पे मीन स्क्वायर एरर के ऊपर भी हमने वीडियो बनाई है तो वहां पे आपने ऑब्जर्व कर लिया होगा यदि नहीं किया है तो आप हमारी प्रीवियस वाली वीडियो को जरूर देखें तो गाइ यहां पे हम क्या करते हैं कि ये जो कॉस फंक्शन होता है इस कॉस फंक्शन को हम क्या करते हैं मिनिमम करते हैं यस क्या करते हैं हम यहां पे कॉस फंक्शन को मिनिमम करते हैं और ये कॉस फंक्शन जब हमारा मिनिमम होता है तो यहां से एम और सी की हम एक बेस्ट वैल्यू मिलती है और एओसी की बेस्ट वैल्यू मिलने के बाद में हम क्या करते हैं इस तरह की एक प्रेडिक्शन लाइन बनाते हैं मतलब एक बेस्ट वेट लाइन बनाते हैं अब जरा बात करते हैं यहां पे कि ये मिनिमम होता कैसे है और क्या इसकी स्ट्रेटेजी है क्या इसका यहां पे वर्किंग होता है इसको जरा ढंग से देखते हैं तो देख ये कॉ फंक्शन है और ये क्या है यहां पे y - y हैड दिख रहा है और स्क्वायर दिख रहा है और 1 / m दिख रहा है अब थोड़ा सा इसको ऑब्जर्व किया जाए यस थोड़ा सा इसे ऑब्जर्व किया जाए तो ये जो फंक्शन है यहां पे जो हमारे पास क का फंक्शन है इस क के फंक्शन को मैं ऑब्जर्व करूं तो ये मुझे एक क्वाड्रेटिक फंक्शन देखने को मिलता है क्वाड्रेटिक फंक्शन का मतलब मैं बेसिकली गाइज बात करूं एक पैराबोलिक इक्वेशन देखने को मिलती है यदि आप इसको थोड़ा सा ऑब्जर्व करें यदि मैं कॉस्ट को एक तरीके से मैं p मान लूं कॉस्ट को मैं क्या लूं एक तरीके से p मान लूं ये 1 / n और समेशन जो आपके पास दिख रहा है इसको मैं यहां पे एक x अल्फा या कुछ भी मान लेता हूं यहां पे अल्फा मान लेता हूं अल्फा है यहां पे और ये y - y हैट है इसको मैं यहां पे q मान लेता हूं तो ये मुझे क्या दिख रहा है यहां पे p = अफ q स् दिख रहा है यदि हम p = अा q स् का ग्राफ बनाने के चले यहां पे राइट अल्फा की वैल्यू को अभी फिलहाल के लिए आप वन मान लीजिए तो मुझे ये जो कर्वेचर्स आपको देखने को मिलता है ये कर्वेचर आपके पास कुछ इस तरीके से आता है मतलब एक पैराबोलिक कर्वेचर्स आपको देखने को मिलता है इस पैराबोलिक कर्वेचर के अंदर बात करें तो इस तरफ हमारे पास क्या होगा यहां पे मतलब हमारे पास q के अंदर क्वांटिटी क्या होगी q के अंदर हमारी क्वांटिटी होगी y - y हैड की वैल्यू यस हमारे पास क्या होगी y - y हैड की वैल्यू मिलेगी और इस तरफ हमें क्या मिलेगा इस तरफ हमें मिलेगा कॉस्ट इसका मतलब यदि मैं कॉस्ट वर्सेस हमारे जो पैरामीटर्स हैं m और c जो हमारे पैरामीटर्स होने वाले हैं यहां पे इनके यदि ग्राफ को डिजाइन करूं तो इस तरह का कर्वेचर हमें देखने को मिलता है यदि आप इसे ऑब्जर्व करना चाहे तो आप इसे ऑब्जर्व भी कर सकते हैं जैसे मैं थोड़ा सा आपको ऑब्जर्वेशन दूं यहां पे तो आप देखिए यहां पे देखिए q की वैल्यू को यदि मैं वन रखता हूं q इल टू क्या करता हूं मैं वन रखता हूं यहां पे तो p की वैल्यू मुझे क्या मिलेगी वन मिलेगी यहां पे q की वैल्यू को यदि मैं टू रखूं तो p की वैल्यू मुझे क्या मिलेगी फोर मिलेगी q की वैल्यू को मैं थ्री रखूं तो p की वैल्यू मुझे क्या मिलेगी 9 देखने को मिलेगी तो आपके पास ऑटोमेटिक जो कर्वेचर है आपके पास क्या स्क्वायरिक शेप में आ रहा है यहां पे इसके साथ-साथ यदि मैं q की वैल्यू को नेगेटिव रखूं -1 रखूं तब भी मुझे p की वैल्यू वन मिलेगी q की वैल्यू को यदि मैं -2 रखूं तो p की वैल्यू को मुझे क्या मिलेगा आपके पास प्लस का फर मिलेगा तो इस तरह के हमें क्या मिलते हैं डाटा देखने को मिलता है तब आप इस कर्वेचर को प्लॉट करते हैं तो आपको हमेशा और हमेशा क्या मिलता है एक क्वाड्रेटिक कर्वेचर देखने को मिलता है यहां पे स्क्वायरिंग कर्वेचर आपको देखने को मिलता है कुछ इस तरह से राइट अब हम यहां से हमारा बेस्ट फीट लाइन को कैसे पता करते हैं यस हमें क्या करना होता है गाइ यहां पे इसके अंदर हमें हमारे कॉस्ट को मिनिमम करना होता है कॉस्ट मिनिमम का मतलब क्या है इस कर्वेचर के अंदर मुझे ये वाला जो पॉइंट है इस वाले पॉइंट को अचीव करना होता है बेसिक तौर पे अब इस वाले पॉइंट को कैसे अचीव करते हैं गाइ यहां पे तो इसके लिए हम इस्तेमाल करते हैं ग्रेडिएंट डिसेंट का यस ग्रेडन डिसेंट टेक्निक होती है जिसके हेल्प से आप ये जो मिनिमम पॉइंट है इसे अचीव कर पाते हैं अब इसके लिए आप क्या करते हैं इसके लिए आप क्या करते हैं सबसे पहले आप एक रैंडम कोई भी आप यहां पे m और c की वैल्यू को ऑब्जर्व करते हैं m और c की वैलू को ऑब्जर्व करना मतलब रैली अब्ज करना मतलब आप कहीं यहां पे भी हो सकते हैं या यहां कहीं पे भी हो सकते हैं मतलब आप इस वाले पॉइंट पे भी हो सकते हैं या फिर आप इस वाले पॉइंट्स पे भी हो सकते हैं अब आप क्या करते हैं धीरे-धीरे अपने m और c की वैल्यू को चेंजेज करते हैं और चेंजेज करके आप इस वाले पॉइंट के ऊपर पहुंच जाते हैं राइट आप क्या करते हैं धीरे-धीरे आप अपनी वैल्यू को चेंजेज करते हैं और चेंजेज करके आप इस वाले पॉइंट के ऊपर अचीव कर पाते हैं इसको बोलते हैं हम यहां पे ग्रेडिएंट डिसेंट टेक्निक अब इस ग्रे डिस्टेंट टेक्निक के अंदर जो हम यहां पे धीरे-धीरे चेंजेज कर रहे हैं इसका फार्मूला क्या बनने वाला है यस इसका हमारे पास इक्वेशन क्या बनने वाली है इसके ऊपर बात करें यहां पे तो इसकी इक्वेशन बहुत ही सिंपल है यहां पे यस मैं बेसिकली m की इक्वेशन यहां पे बता रहा हूं यहां पे तो यदि मैं m फाइंड आउट करने चल रहा हूं तो m की इक्वेशन क्या होगी कि m जो हमारा न्यू निकलने वाला है वो कैसे निकलेगा m जो हमारा ओल्ड है मतलब जो हमारा पुराना m है वो लेंगे उसमें से हम सबटेक्स्ट करेंगे किससे हम सबस्टैक करेंगे यहां पे गाइज यहां पे हम यहां पे सबकट करेंगे लडा को और लडा को सबस्टैक करने के बाद में गाइज यहां पे मैं बात करूं तो जब हमारा लॉस फंक्शन निकलने वाला है मतलब जो हमारा कॉस्ट फंक्शन है उसको dm1 करने वाले हैं राइट ये मिलने वाला है अब बात करते हैं ये लडा क्या चीज है ये लडा जो आप देख रहे हैं दैट इज कॉल ऑफ लर्निंग रेट यस ये हम क्या बोलते हैं लर्निंग आपके पास रेट बोलते हैं यहां पे यस ये क्या है आपका लर्निंग रेट है अब ये लर्निंग रेट ही डिसाइड करती है कि आपका चलने का तरीका क्या है अब मैं थोड़ा सा ऑब्जर्वेशन देना चाहूं कि ये इक्वेशन आपके पास क्या आपको शो करती है मतलब क्या इंडिकेट करती है आपके पास यहां पे थोड़ा सा इसे ग्राफिकली विजले करते हैं यहां पे कि ये क्या करती है तो देखिए ये इक्वेशन क्या करती है यहां पे आपके पास कस्ट कस्ट को मिनिमम करती है यस कॉस्ट को तो हमें वैसे ही मिनिमम करना है और कॉस्ट को मिनिमम करके ये क्या करती है हमारे पास यहां पे बात करें ये इक्वेशन हमारे पास m की वैल्यू को लेके आती है राइट अब जरा देखिए यहां पे कैसे करती है सबसे पहले आपने क्या किया रैंडम कोई m की वैल्यू को ऑब्जर्व किया और इसी तरह से आप यहां पे c की वैल्यू को भी ऑब्जर्व करेंगे यस इसी तरह से आप क्या करेंगे अपनी c की वैल्यू को भी क्या करने वाला है ऑब्जर्व करने वाला हैं तो सबसे पहले क्या होता है कि आपके पास यहां पे कुछ इस तरह से लाइन आपके पास आती है अब ये लाइन आपके एक्यूरेसी की तो है नहीं क्योंकि आपने यहां वाला पॉइंट डिसाइड किया है अब यहां वाले पॉइंट से आप क्या करते हैं अपडेट करते हैं आप m और c की वैल्यू को अपडेट करते जैसे ही ए में और c की वैल्यू को अपडेट करते हैं आप इस वाले पॉइंट पे आते हैं मतलब आप इस वाली लाइन से हटकर यहां पे आप इस वाली लाइन पे आ जाते हैं फिर क्या करते हैं आप फिर से एमओ स की वैल्यू को अपडेट करते हैं एओ स की वैल्यू को फिर से अपडेट करते हैं तो आप इस वाली लाइन पे आ जाते हैं फिर आप फिर से एमओ स की वैल्यू को अपडेट करते हैं एमओ स की फिर से वैल्यू को अपडेट करने के बाद आप यहां पे आ जाते हैं ये होता है एमओ स कांसेप्ट अब गाइज यहां पे डिपेंड करता है कि आप एम को अपडेट कर रहे हैं या सी को अपडेट कर रहे हैं क्योंकि देखिए जब आप फर्स्टली लाइन आप लेंगे यहां पे तो वो लाइन इस तरह से भी हो सकती है यस तो पहले लाइन आपके पास इस तरह से होगी यहां पे राइट उसके बाद में मैं सेकंड लाइन के अंदर बात करूं यहां पे तो मैं थोड़ी डिफरेंट डिफरेंट कलर के ऊपर डिफाइन करूंगा यहां पे तो देखिए आपके पास सेकंड लाइन ये हो सकती है यहां पे यस सेकंड पोजीशन पे आप यहां पहुंच सकते हैं थर्ड पोजीशन के ऊपर बात करें तो थर्ड पोजीशन के अंदर आप यहां वाले पॉइंट प पहुंचेंगे फोर्थ वाले पोजीशन के ऊपर बात करें तो फोर्थ वाले पोजीशन पे ऊपर आप इस तरफ भी पहुंच सकते हैं ऐसे करते करते आपके पास एक पॉइंट आएगा जहां पे आपको एक बेस्ट फिट लाइन आपको देखने को मिल जाएगी कुछ इस तरह की मतलब एम और सी को को चेंज करने पर आपके पास ये वैल्यू चेंज होती है और आपके यहां पे इफेक्ट रती है और आप अपनी बेस्ट फीड लाइन पे पहुंच पाते हैं तो बेस्ट फीड लाइन के ऊपर पहुंचने का तरीका क्या है बेस्ट फीड लाइन को पहुंचने का तरीका एकदम सिंपल तरीका है यहां पे कि आप क्या करते हैं गाइज यहां पे अपने लॉस को मिनिमम करते हैं जितना ज्यादा हो सके लॉस को आप क्या करते हैं मिनिमम करते हैं और जैसे ही लॉस को मिनिमम करते हैं आप एक इफेक्टिव आपके पास वैल्यू पे पहुंच जाते है ए और स की एक बेस्ट वैल्यू पे पहुंच जाते हैं जिसके थ्रू आपका प्रेडिक्शन हो पाता है मतलब ये y = m प c के अंदर आपके पास m और सी की बेस्ट वैल्यू आपको देखने को मिल जाती है अब यहां पे मैं आपको एक थोड़ा सा एक कांसेप्ट बताना चाहूंगा जो कि आपके लिए बहुत एक वैल्युएबल होगा यहां पे यस मैं बात करूं यहां पे m को चेंज करते हैं यदि आप लाइन की इक्वेशन के अंदर यदि इस जो कॉस फंक्शन के अंदर m को चेंज करते हैं तो m को चेंज क्या करने पर क्या फर्क पड़ता है m क्या है आपके पास यहां पे गाइस बात करें तो m है आपके पास एंगल मतलब आपके पास यहां पे एंगल है लाइन जो एक्स एक्सस के साथ कितना एंगल बना रही है वो आपके पास है यहां पे ठीक है स्लोप ऑफ द कर्व है तो m को चेंज करने पर आपके पास क्या होगा देखिए आपकी जो पहली लाइन है वो यहां मिलेगी दूसरी लाइन जो है वो यहां मिल सकती है तीसरी लाइन आपको यहां मिल सकती है चौथी लाइन आपको यहां मिल सकती है पांचवी लाइन बात करें यहां मिल सकती है छठी लाइन यहां मिलेगी मतलब आप क्या करेंगे एक एंगल के तौर पे रोटेशन करेंगे राइट एक एंगल के ऊपर क्या करेंगे आप रोटेशन करने वाले हैं यदि मैं बात करूं कि यदि मेरे पास सी के अंदर मैं चेंजेज करूंगा तो सी के अंदर चेंजेज करने पर क्या इफेक्ट देखने को मिलेगा यदि मैं सी के अंदर चेंजेज करने के की बात करूं तो पहली लाइन आपको यहां मिलेगी दूसरी लाइन यहां मिलेगी तीसरी लाइन यहां मिलेगी चौथी लाइन यहां मिलेगी पांचवी यहां मिल सकती है सिक्सथ लाइन यहां पे भी मिल सकती है तो बेसिकली गाइज यहां पे हमने क्या उ किया कि आपकी लाइन क्या कर रही है पैरेलल तौर पे y एक्सिस के अंदर क्या कर रही है शिफ्टिंग कर रही है ऊपर से नीचे यस पैरेलल तौर पे क्या कर रही है y एक्सिस के ऊपर आपके पास शिफ्टिंग करती है तो यदि मैं बात करूं यहां पे बेस्ट फिट लाइन निकालने के मेथड के ऊपर तो आप यहां पे क्या करते हैं ग्रेडिएंट डिस्टेंट टेक्निक को इस्तेमाल करते हैं ग्रेडिएंट डिस्टेंट टेक्निक के अंदर आप यहां पे इस तरह से इस्तेमाल करते हैं m न्यू लेते हैं यहां पे इसमें ओल्ड लेके आपके पास यहां पे लडा लेते हैं और लडा लेके dl1 dm1 ऑफ m एंड c यस विद रेस्पेक्ट ऑफ m और c तो ये कॉस फंक्शन का डाटा जो है ये किस तरह चेंज होगा यदि मैं इस कॉ फंक्शन को थोड़ा सा और लबरेट करूं आप लोगों के सामने यदि मैं इस कॉस फंक्शन को थोड़ा सा और यहां पे एक्सपेंड करूं यहां पे तो ये कैसे देखने को मिलता है तो यदि मैं कॉस्ट फंक्शन को देखूं तो कॉस फंक्शन क्या था है गाइ यहां पे 1 अप n सम ऑफ यहां पे क्या आएगा y - y हैड y हैड की वैल्यू क्या है गाइज यहां पे y हैड की वैल्यू क्या है mx6 आपके पास आएगा और माइनस का c आएगा और देन स्क्वायर आएगा दैट इज माय कॉस्ट फंक्शन अब इस कॉस फंक्शन की अंदर बात करें तो y हमें पता होता है x हमें पता होता है m और c हमारे एज ए वेरिएबल के तौर पे वर्क करते हैं तो बस इसी का ही हमें डिफरेंशिएबल देखने को मिलती है स्टार्टिंग के अंदर आप क्या करते हैं बेसिकली कोई भी इनिला वैल्यू लेते हैं आप रो जीरो भी ले सकते हैं यहां पे चाहे तो आप चाहे तो वव भी ले सकते हैं यहां पे फिर उसके बाद आपके पास एमओ की वैरी करती है वैल्यू और उस एमओ की वैल्यू के वैरी करने पर आपके पास डाटा के अंदर चेंजेज देखने को मिलता है और आप अपनी पैच फिट लाइन के ऊपर पहुंच पाते हैं इस पूरे प्रोसीजर को हम बोलते हैं ग्रेडिएंट डिजइन टेक्निक ग्रेडियन डिजइन टेक्निक की हेल्प से आप इस तरह से बेस्ट फिट लाइन को अचीव कर पाते हैं और आज की इस वीडियो के जरिए हम बात करने वाले हैं रेगुलेशन टेक्निक के बारे में ये टेक्निक क्या है और ये कब इस्तेमाल की जाती है रेगुलराइजेशन टेक्निक ज्यादातर हम लीनियर रिग्रेशन के अंदर इस्तेमाल करते हैं इसके अलावा आप कोई भी एल्गोरिथम यहां पे यूज करें उसके अंदर भी आप रेगुलराइजेशन टेक्निक इस्तेमाल कर सकते हैं चाहे आप लॉजिस्टिक रिग्रेशन का इस्तेमाल कर रहे हो तब आप इस्तेमाल कर सकते हैं या फिर आप डीप लर्निंग में भी रेगुलराइजेशन टेक्निक का इस्तेमाल कर सकते हैं तो अब हम ये जानते हैं कि रेगुलराइजेशन टेक्नीक करती क्या है मतलब इसका क्या मेजर रोल है यहां पे इसको जरा आप यहां पे समझते हैं तो रेगुलराइजेशन टेक्नीक क्या करती है गाइ यहां पे कि आपका जो भी मॉडल है ना है यहां पे उस मॉडल को इंप्रूव करने का काम करती है अब ये इंप्रूव कैसे करती है तो इंप्रूव करने के पीछे इसके दो तरीके होते हैं पहला तरीका यहां पे ये होता है कि जब भी आप किसी डेटा सेट को उठा रहे हैं उस डेटा सेट के अंदर काफी ऐसे डटा होते हैं जो कि आपके पास अनयूजेबल होते हैं अब ये अनयूजेबल हमें कैसे पता चलेगा तो जब भी देखिए आप कोई भी यहां पे एल्गोरिथम अप्लाई कर रहे हैं चाहे मैं लीनियर रिग्रेशन एल्गोरिथम अप्लाई करूं इस लीनियर डिग्रेशन एल्गोरिथम के अंदर आपके पास जो कफिट होता है उस कफिट की वैल्यू जो होती है वो बहुत ही कम आपको देखने को मिलती है जस्ट एग्जांपल के तौर पे मैं बात करूं यहां पे तो मेरे पास लेट्स सपोज मान लीजिए ये इक्वेशन है हमारे पास जैसे कि आपके पास यहां पे 200 x1 प्लस यहां पे 500 x2 प्लस यहां पे 0.5 x3 एंड बात करें यहां पे 0.005 आपके पास x4 इस तरह की जब आपके पास यहां पे इक्वेशन मिलती है तो इस इक्वेशन के अंदर हमें पता है कि ये जो आपके पास डाटा है या फिर ये मैं बात करूं यहां पे ये जो आपके पास वैल्यू है ये इतनी इंपॉर्टेंट नहीं है ये इतनी इंपॉर्टेंट नहीं होने के पीछे रीजन क्या है कि इसके कफिट की वैल्यू हमें क्या मिली है बहुत ही ज्यादा कम मिली है तब ऐसे सिनेरियो के अंदर रेगुलराइजेशन टेक्निक का इस्तेमाल करते हुए आप क्या कर सकते हैं इस चीज को रिमूव कर सकते हैं मतलब कि जो अनवांटेड आपका कॉलम होता है जिसके कोई यूज केस नहीं होता हमारे डेटा सेट के अंदर तो आप रेगुलराइजेशन टेक्निक के थ्रू आप यहां पे से हटा सकते हैं मतलब रेगुलराइजेशन टेक्नीक आपके लिए यहां पे क्या करती है फीचर सिलेक्शन का काम करती है देन नेक्स्ट आपके पास क्या करती है रेगुलराइजेशन टेक्निक आपके ओवरफिटिंग को कम करती है अब ये ओवरफिटिंग को कैसे कम करती है तो देखिए जब भी आप अपने इस लीनियर रिग्रेशन एल्गोरिथम को इस्तेमाल करेंगे तो इस लीनियर लीनियर रिग्रेशन एल्गोरिथम के अंदर आप देखेंगे कि काफी बार आपके जो कफिट है उसकी वैल्यू काफी ज्यादा बढ़ चुकी है और आप पीछे वाले को एफिशिएंट को देखेंगे तो ये बहुत ही ज्यादा लो है तो इस केसेस में क्या करती है कि जो कफिट की वैल्यू ज्यादा है आपके पास यहां पे उनके कफिट की वैल्यू को रिड्यूस करने का काम करती है जिसकी वजह से आप क्या करते हैं ओवर फिटिंग से बच जाते हैं तो गाइ यहां पे दो मेजर आपके पास रेगुलर एजन टेक्नीक आती है वैसे तो आपके पास तीन रेगुलर एशन टेक्नीक होती है पहली बात करें यहां पे रिज रिग्रेशन दूसरी आपके पास लासो रिग्रेशन है आपके पास यहां पे थर्ड आपकी इलास्टिक नेट होती है जो कि आपके पास यहां पे दोनों का कॉमिनेशन होती है तो देखिए यहां पे हम दो मेजर रेगुलेशन टेक्निक को डिस्कस करने वाले हैं देन रिज एंड लासो रेगुलेशन टेक्निक कि कौन सी क्या काम करती है और किस तरह से वर्क करती है तो चलिए जरा अब इसे डिटेल के साथ समझते हैं तो सबसे पहले मैं बात करूंगा यहां पे लासो रेगुलराइजेशन टेक्निक को जिसको हम यहां पे l1 रेगुलेशन टेक्नीक भी कहते हैं अब ये ए1 रेगुलराइजेशन टेक्नीक करती क्या है यहां पे ये l1 रेगुलेशन टेक्नीक आपके पास फीचर सिलेक्शन का काम करती है यस आपके पास क्या करती है फीचर सिलेक्शन का आपके पास यहां पे वर्क करती है अब फीचर सिलेक्शन का मतलब क्या है लेट्स सपोज आपके पास कोई डेटा सेट है उसके अंदर आपका x1 कॉलम है x2 कॉलम है x3 कॉलम है एंड x4 कॉलम है एंड x5 कॉलम है और उसके बाद आपके पास क्या है y आपका आउटपुट है अब इसमें से हमारे लिए मेन इंपॉर्टेंट फीचर कौन-कौन से रहने वाले हैं और कौन से ऐसे फीचर है जो कि अनवांटेड है अनयूज है जिसका हमारे मॉडल के ऊपर कोई यूज केस नहीं है तो फिर उसके लिए हम क्या करते हैं लासो रेगुलराइजेशन टेक्निक का इस्तेमाल करते हैं क्योंकि लासो लाइजेशन टेक्निक क्या करती है कि जो आपके कोफिनेक यूज कस हमारे मॉडल के अंदर नहीं है उनको क्या कर देती है ये एगजैक्टली जीरो कर देती है अब ये एगजैक्टली जीरो कैसे करती है तो ये अपने कॉस फंक्शन को चेंज करती है अब ब कॉस फंक्शन को कैसे चेंज करती है देखिए यदि हम इस डटा सेट के ऊपर लीनियर रिग्रेशन अप्लाई कर रहे हैं तो लीनियर रिग्रेशन के अंदर आप सबको पता होगा कि हमारा कॉस फंक्शन क्या होता है तो लीनियर रिग्रेशन के अंदर मेजर्ली हम क्या करते हैं मीन स्क्वायर एरर का हम इस्तेमाल करते हैं क्योंकि ये आपके पास क्या है एक डिफरेंशिएबल इक्वेशन है और यहां पे हम यहां पे आसानी से इसके मिनिमम पॉइंट को फाइंड आउट कर सकते हैं अब जब आप मीन स्क्वायर एरर का इस्तेमाल करते हैं तो यहां पे जब आप लीनियर रिग्रेशन का इस्तेमाल करेंगे तो लीनियर रिग्रेशन के अंदर आपके पास जो मीन स्क्वायर एरर का जो फार्मूला होगा वो क्या होगा यहां पे मीन स्क्वायर एर का फॉर्मूला होगा 1 / n समेशन ऑफ आपके पास क्या होगा y - y हैट का हो स्क्वा यह आपके पास होता है यहां पे अब यह जब मीन स्क्वायर एरर का फॉर्मूला होता है इस मीन स्क्वायर एरर के साथ में हम क्या कर देते हैं एक एक्स्ट्रा टर्म लैडा ऐड कर देते हैं लैडा इज़ द पैलेंट कॉर्नर जो आपके पास बताता है कि आपके को एफिशिएंट की वैल्यू को कितना रिड्यूस किया जाए यह आपके पास यहां पे बताता है फिर इसके बाद एक और एक्स्ट्रा टर्म ऐड हो जाती है दैट इज़ अ w अब यह w क्या है यह w है आपके वेटेज की वैल्यू अब यह वेटेज क्या होता है यहां पे तो देखिए जब जब आप यहां पे लीनियर रिग्रेशन एल्गोरिथम इस्तेमाल कर रहे हैं चाहे आप इस डेटा सेट के कर रहे हैं तो लीनियर रिग्रेशन एल्गोरिथम क्या होगी यहां पे लीनियर रिग्रेशन एल्गोरिथम होगी y हैट इक्टू आपके पास क्या होगा m1 x1 प्लस यहां पे m2 x2 प्लस आपके पास m3 x3 प्लस आपके पास यहां पे m4 x4 प्लस आपके पास होगा m5 x5 ये आपके पास इक्वेशन होनी र है यहां पे जो m1 m2 m3 m4 ये जो वैल्यू है आपके पास यहां पे इनका मॉड्यूस लेके यहां पे समेशन किया जाता है राइट इनका क्या करना पड़ता है मॉड्यूल देख के समेशन किया जाता है जिसे हम यहां पे वेटेज बोलते हैं आप यहां पे कफिट भी बोल सकते हैं या आप यहां पे स्लोप भी बोल सकते हैं तो देखिए गाइज हम क्या करते हैं यहां पे कि सबसे पहले हम क्या कर रहे हैं कि हमारा जो कॉस्ट फंक्शन है उसे हम चेंज करते हैं अब ये कॉस्ट फंक्शन चेंज करने से होता क्या है यहां पे कॉस्ट फंक्शन चेंज करने से आपके पास बहुत सी चीजें यहां पे चेंजेज होती है जैसे मान लीजिए कि आपके पास क्या है कि जब आप नेचुरल इस्तेमाल कर रहे थे मतलब आपके पास बेसिक लॉस फंक्शन इस्तेमाल कर रहे थे तो लॉस के बीच में यस लॉस और आपके पास यहां पे आपके पास ए और आपके पास क्या है प्लस आपके c m एंड स के बीच में जब आप यहां पे कर्व बनाते हैं तो ये कर्व आपके पास कुछ इस तरह से बनता है यहां पे राइट और यहां कहीं आपके पास यहां पे वैल्यू आती है कुछ ना कुछ वैल्यू आती है और ये आपके पास है रो पॉइंट और लेट्स सपोज मान लेते हैं ये आपके पास कोई फाइव या 10 पॉइंट होगा यहां पे अब जब आप यहां पे इसका इस्तेमाल करते हैं जब आप इस नए वाले कॉस फंक्शन का इस्तेमाल करते हैं तो जब नए वाले कॉस फंक्शन का इस्तेमाल करेंगे तो आपकी जो ये कॉस फंक्शन जो है ना यस मैं अ इस सम को यहां से एक बार के लिए रफ कर देता हूं ताकि आपको थोड़ा सा आईडिया लग सके कि हम करने वाले क्या हैं तो देखिए जब हम बेसिक लॉस फंक्शन के ऊपर बात करते हैं बेसिक लॉस फंक्शन मतलब ये वाला जो लॉस है यहां पे इसके ऊपर बात करते हैं तो हमारा कर्वेचर कुछ इस तरह से बनता है अब जब आप यहां पे ये एक्स्ट्रा ऐड कर लेते हैं मतलब एक्स्ट्रा पेनल्टी टर्म्स एंड यहां पे स्लोप ऑफ द कर्व का ऐड कर लेते हैं तो होता क्या है कि आपके पास एक नया कर्वेचर बन के आता है और ये नया कर्वेचर कुछ इस तरह से बनता है आपके पास एगजैक्टली वैल्यू तो यही रहती है और ये कर्वेचर इस तरह से बनता है अब ये कर्वेचर किसके ऊपर डिपेंड रहता है ये कर्वेचर रहता है लैडा के ऊपर डिपेंड यदि आप इस नए वाले कॉस फंक्शन के दर लैडा की वैल्यू को रो कर देते हैं तो लडा की वैल्यू रो करने पर आपके पास ये आ जाता है उसके बाद आप क्या करते हैं लडा की वैल्यू को जैसे-जैसे आप इंक्रीज करते हैं वैसे-वैसे ये उधर की तरफ कि सकता रहता है मतलब ये टुवर्ड्स टू ज़ीरो की तरफ क सकता रहता है आपका जो मिनिमम पॉइंट है देखिए ज़ीरो की तरफ जा रहा है फिर ये क्या करेगा फिर से और जीरो की तरफ आएगा फिर से ये क्या करेगा और जरो की तरफ आएगा फिर से ये रो की तरफ और आता रहता है मतलब बेसिकली गाइज बात करें यहां पे कि आपके पास जो आपका कॉ फंक्शन का जो कर्वेचर है वो आपका पास क्या होता है टुवर्ड्स टू जीरो की तरफ शिफ्ट होता रहता है जिसकी वजह से आपको क्या मिलता है यहां पे आपके काफी ऐसे कफिट होते हैं वो जीरो हो जाते हैं और उससे आपको फीचर सिलेक्शन देखने को मिल जाता है राइट तो ये होता है हमारा लासो रेगुलराइजेशन टेक्निक जो कि आपका क्या करती है फीचर सिलेक्शन करने के लिए आपका इस्तेमाल करती है और इसको हम l1 रेगुलराइजेशन टेक्निक भी बोलते हैं अब हम बढ़ते हैं हमारी नेक्स्ट रेगुलराइजेशन टेक्निक के ऊपर दैट इज द रिज रेगुलराइजेशन टेक्निक अब रिज लेशन टेक्निक के अंदर क्या होता है गाइ यहां पे तो रिज लेनाइन टेक्निक को हम बोलते हैं ओवर फिटिंग रिड्यूस ंग टेक्निक या फिर हम बोलते हैं कि ये ओवरफिटिंग को क्या करती है कम करती है अब जब ये ओवरफिटिंग को कम करती है इसका मतलब क्या हुआ कि आप ये कफिट एंड कांस्टेंट की वैल्यू को जीरो नहीं करेगी राइट इसका काम क्या होता है कि आप को एफिशिएंट एंड कांस्टेंट की वैल्यू को ये जीरो नहीं करती है ये टव टू 0 करती है ट ट 0 मतलब क्या है गाइज यहां पे कि कफिट एंड कांस्टेंट की वैल्यू को एकदम जीरो के नजदीक लेके चली जाती है अब जीरो के नजदीक ले जाने से क्या होता है गाइज यहां पे जीरो के नजदीक ले जाने से आपके पास ओवर फिटिंग की वैल्यू कम होती है अब ये ओ फिटिंग की वैल्यू कैसे कम करेगा तो देखिए जरा यहां पे समझते हैं लेट्स सपोज हमारे पास जो इक्वेशन है वो कुछ इक्वेशन इस तरह से है यस ये 5 क्या हो गया x1 हो गया प्लस आपके पास यहां पे 200 x2 हो गया प्लस आपके पास 300 x3 हो गया प्लस आपके पास y हो गया तो यहां पे आपको को फिश एंड कांस्टेंट की वैल्यू को देखेंगे तो बहुत ही लार्ज लार्ज है यहां पे क्या है यहां पे बहुत ही लार्ज है यहां पे जिसकी वजह से आपके पास ओवरफिटिंग के चांसेस सबसे ज्यादा रहते हैं तब हमें यहां पे क्या करना होता है इस कफिट कांस्टेंट की वैल्यू को हमें रिड्यूस करना पड़ता है जिसकी वजह से हम ये ओवरफिटिंग के सिनेरियो से बचते हैं अब ये क्या करता है कि देखिए आपके पास जो आपका लॉस फंक्शन था यस आपके पास जो लॉस लॉस फंशन था लॉस फंक्शन क्या था है यहां पे बात करें तो 1 / n समेशन ऑफ क्या होता है गाइज यहां पे y - y हैट का होल स्क्वायर राइट ये आपका लॉस फंक्शन था इस लॉस फंक्शन के साथ में ये आपके क्या करता है फिर से एक पैलेंट और उसके साथ जो आपका वेटेज है वेटेज का मतलब क्या है जो आपके कोफिया करके सम कर देता है यस उसकी वैल्यू को क्या करता है स्क्वायर करके सम कर देता है यदि मैं इसके कर्वेचर की बात करूं मतलब इसके बेसिक इंटू की बात करूं कि ये लैडा के साथ किस तरह से रिस्पांस करता है तो देखिए यहां पे आपका क्या है m और b की वैल्यू है और यहां पे क्या है आपका लॉस फंक्शन है यदि मैं लडा की वैल्यू को ज़ीरो कर दूं लडा की वैल्यू को ज़ीरो करूं तो हमारे पास कुछ इस तरह से कर्वेचर बनेगा लेकिन जैसे ही मैं लडा की वैल्यू को बढ़ाता हूं लडा की वैल्यू को बढ़ाता हूं तो ये भी क्या करेगा टुवर्ड्स टू ज़ीरो की तरफ ही जाएगा मतलब ये एगजैक्टली ज़ीरो तो नहीं होगा लेकिन टूव टू ़ की तरफ जाएगा तो ये लडा = टू आपके पास क्या है गाइज यहां पे ज़ीरो पे होगा ल = 1 पे यहां आएगा ल = 2 पे यहां आएगा ल = 3 पे यहां आएगा तो ऐसे करते-करते आपके पास क्या होता है ग्राफ आपका जो होता है वो शिफ्ट कर जाता है और ये कहां शिफ्ट करता है यहां पे एगजैक्टली जीरो की तरफ तो नहीं जाता मतलब आपके पास टुवर्ड्स टू जीरो की तरफ यहां पे चला जाता है जिसकी वजह से ओवर फिटिंग का सिनेरियो कम हो जाता है तो गाइस ये थी आपके पास दो टेक्निक जो कि आपके पास होता है रिज रेगुलराइजेशन और लासो रेगुलराइजेशन रिच को हम l2 बोलते हैं और लासो को हम यहां पे l1 रेगुलेशन टेक्निक बोलते हैं क्या काम के लिए आते हैं तो ये ओवर फिटिंग को रिड्यूस करते हैं आपके पास फीचर सिलेक्शन को करने के लिए काम रते हैं थर्ड मेजर इंपॉर्टेंट चीज रिज डेगन के थ्रू यहां पे होती है कि ये कंप्यूटेशनल पावर को कम करते हैं अब ये कंप्यूटेशनल पावर का मतलब क्या होता है गाइ यहां पे देखिए जब भी आप यहां पे मॉडल को ट्रेन करते हैं और मॉडल को ट्रेन करने पर कफिट कांस्टेंट की वैल्यू बहुत लार्ज हो जाती है तो उस वक्त आपको पता होगा कि मॉडल को ट्रेड होने में बहुत ज्यादा टाइम लगता है जिसकी वजह से आपको यहां पे हाई स्पीड कंप्यूटर की जरूरत देखने को मिलती है वहीं पे यदि हम रिज लेशन को इस्तेमाल करें तो ये क्या करता है को एफिशिएंट कांस्टेंट की वैल्यू को क्या करता है एकदम कम कर देता है रिड्यूस कर देता है जिसकी वजह से हमें क्या मिलता है यहां पे हमें एक स्पीडिंग पावर मिलती है मतलब हमें यहां पे बहुत ही कम टाइम के अंदर हमारा जो सिस्टम है वही सिस्टम हमें आंसर निकाल के दे देता है राइट तो बेसिक गाइस मैं यहां पे बात करूं तो ये कंप्यूटेशनल पावर को क्या करते हैं यहां पे हमें बचाते हैं मतलब कंप्यूटेशन पावर को क्या करते हैं रिड्यूस करते हैं हे एवरीवन वंस अगेन वेलकम टू डबल कपटेक माय सेल्फ करो और आज के इस वीडियो के जरिए हम यहां पर बात करने वाले हैं रेगुलराइजेशन टेक्निक के बारे में देखिए बेसिकली रेगुलराइजेशन टेक्निक क्या है और कितने तरीके होती है ये हमने जान लिया था हमारे लास्ट वाले वीडियो के अंदर आज के इस वीडियो के जरिए हम यहां पे एक डाटा सेट लेंगे और उसके ऊपर रेगुलराइजेशन टेक्निक को इस्तेमाल करेंगे देखेंगे कि बिफोर रेगुलराइजेशन और आफ्टर रेगुलराइजेशन के अंदर मॉडल की एक्यूरेसी में कितना फर्क पड़ता है ये चीज यहां पे हम ऑब्जर्व करने वाले हैं तो चलिए जरा अ इसे डिटेल के साथ देखते हैं यदि आपको पाइथन मशीन लर्निंग डाटा साइंस एंड डेटा एनालिस जैसी फील्ड में अपने आपको को ग्रो करना है तो इसके लिए w कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिया गया कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो देखिए मेरे पास एक डेटा सेट है यहां पे और ये डटा सेट एक हाउस प्राइस का डेटा सेट है जहां पे हमारे पास बहुत सारे फीचर्स दे रखे हैं जो कि हाउस से रिलेटेड है जैसे कि बेडरूम हो गया बाथरूम गया लिविंग स्क्वायर फिट एरिया वगैरह ये बहुत कुछ हो गया और इसके बेसिस पे हमें प्राइस को प्रिडिक्ट करना है तो ये बेसिक एक हमारे पास डेटा सेट है अब इस डेटा सेट को यदि मैं गौर से देखूं तो इसके अंदर हमारे पास क्या है कि सारा जो डाटा है मेरे लिए क्या है यूज़फुल है और ये मेरे कहीं ना कहीं आगे काम आने वाला है तो बेसिकली ये कहीं ना कहीं हमारे पास यहां पे बहुत इंपोर्टेंट रहने वाला है जब भी कभी मैं बेटर मॉडल बनाऊंगा यहां पे तब तो बेसिकली यहां पे हम रेगुलराइजेशन टेक्निक्स के थ्रू देखेंगे कि ये मॉडल की एक्यूरेसी बढ़ाने के लिए किन-किन फीचर को एलिमिनेट करता है एंड सेकंड चीज हम ये भी देखने वाले हैं कि ये को एफिशिएंट कांस्टेंट की वैल्यू को कितना रिड्यूस कर देता है यहां पे इन सारी चीजों के बारे में आज इस वीडियो के जरिए हम ऑब्जर्व करने वाले हैं अब देखिए गाइज इसके लिए हम चलते हैं जुपिटर नोटबुक के अंदर और वहां पे हम डाटा को लोड करते हैं और आगे की प्रोसेसर को समझते हैं देखिए मैं प्रैक्टिकल के लिए जाता हूं जुपिटर नोटबुक के अंदर जुपिटर नोटबुक के अंदर जाने के बाद में मेरी जो इंपोर्टेंट लाइब्रेरीज है इनको मैं यहां पे इंपोर्ट कर लेता हूं जस्ट लाइक सबसे पहले मुझे यहां पे इंपोर्ट करना पड़ेगा पांडा को क्योंकि मुझे डेटा सेट की जरूरत है तो मैं पांडा प्र लूंगा यहां पे नेक्स्ट हमें यहां पे इंपोर्ट करना पड़ेगा मैट प्लॉट लिप का क्योंकि काफी बार मैं ग्राफ बनाने वाला हूं यहां पे तो मैट प्लॉट लिप का मैं इस्तेमाल करूंगा और पीवा प्लॉट एलियाज ऑफ मैं पीडी लेने वाला हूं उसके बाद मैं इंपोर्ट करूंगा किसे यहां पर सीब का सी बन इसलिए क्योंकि एडवांस ग्राफ बनाने के लिए मेरी हेल्प करेगा एलिस ऑफ एएस और उसके बाद में यहां पे मैं क्या करूंगा फ्रॉम साइकल लाइन के अंदर चलूंगा और साइकल लाइन के अंदर जाने के बाद मैं डॉट यहां पर मुझे डाटा की स्केलिंग करनी पड़ेगी डेटा की स्केलिंग इसलिए जरूरी है क्योंकि देखिए आपका जो डेटा सेट है यहां पे इसके अंदर ऑब्जर्व करेंगे तो डेटा क्या है एक इन बैलेंसिंग डेटा सेट है जहां पे काफी वैल्यू बढ़ रही है काफी वैल्यू कम है तो स्केलिंग करना बहुत ज्यादा जरूरी है तो मैं स्केलिंग का इस्तेमाल करूंगा तो मैं साइक लन के अंदर चलूंगा साइकल न के अंदर जाके मैं प्री प्रोसेसिंग को मैं कॉल करने वाला हूं यहां पे और प्री प्रोसेसिंग के अंदर देखिए एक और साइकन आ चुका है तो इसे एक बार के लिए हटा देते हैं यहां पे प्री प्रोसेसिंग के अंदर जाने के बाद में दैट मैं यहां पे क्या करने वाला हूं इंपोर्ट करने वाला हूं और इंपोर्ट कैसे करूंगा यहां पे स्टैंडर्ड स्केल को कॉल करने वाला हूं राइट तो ये जरूरत पड़ेगी और उसके बाद में मुझे नेक्स्ट चीज की जरूरत पड़ेगी हमारे मॉडल को स्लिट करने की ट्रेन टेस्ट के अंदर तो उसके लिए मैं सेकंड चलूंगा डॉट मैं मॉडल सिलेक्शन को कॉल करने वाला हूं यहां पे राइट तो ये देखिए एक बार फिर से मुझे यहां पे दे रहा है तो मैं इसे एक बार के लिए हटा देता हूं मॉडल सिलेक्शन के चलूंगा मॉडल सिलेक्शन के अंदर जाने के बाद मैं इंपोर्ट करूंगा किसे ट्रेन और टस्ट स्लेडिंग को चलिए इसे रन करते हैं तो ये मेरे सारे जो रिक्वायर्ड मॉड्यूल है वो सारे आ चुके हैं अब उसके बाद में हम क्या करेंगे हमारा डेटा सेट को लोड करेंगे तो डटा सेट को लोड कर लेते हैं यहां पे और पडी डरी सीएसवी का इस्तेमाल कर लेते हैं यहां पे और मेरा जो डेटा सेट है उसका एड्रेस से डाटा लेके आता है तो ये रहा मेरा हाउ प्राइस सी इसके ऊपर राइट क्लिक करता हूं और कॉपी एज अ पाथ के ऊपर मैं जाके क्लिक कर लेता हूं ताकि मेरे जो पाथ है वो आ जाए यहां पे और यहां पे मैं पाथ को प्रेस्ट कर देता हूं अब इसे रस्टिंग बनाने के लिए मैं इसके आगे r ऐड कर लेता हूं मेरे वेरिएबल के अंदर में डेटा आ चुका है यहां पे और उसके बाद में हम यहां पे डेटा सेट को लोड करते हैं और हैड लगाते हुए इसके तीन डाटा को देखते हैं अब पहले हम यहां पे ये ऑब्जर्व करते हैं कि क्या इसके अंदर लीनियर डिग्रेशन अप्लाई होगा या नहीं होगा पहले हमें ये बहुत जानना जरूरी है तो बेसिकली गाइज इसके अंदर जानने के लिए हम क्या करेंगे हम इसके अंदर को रिलेशन मैट्रिक्स को बनाएंगे ताकि हमें यहां पे को रिलेशन पता चलके कि क्या ये हाईली को रिलेटेड है या नहीं है यदि हाईली को रिलेटेड नहीं होंगे तो डेफिनेटली हम इसके अंदर लीनियर रिग्रेशन अप्लाई नहीं करने वाले हैं लेकिन यदि ये हाईली को रिलेटेड नहीं होगा तब भी हम आज के इस वीडियो के अंदर हम इसी डेटा सेट के ऊपर ट्राई करेंगे और इसे यहां पे एक बेटर मॉडल बनाने की कोशिश करेंगे तो बेसिकली गाइज हम यहां पे क्या करने वाले हैं तो हम यहां पे कोलिशन मैट्रिक्स के थ्रू देखेंगे कि क्या इसमें ले डिग्रेशन अप्लाई हो सकता है या नहीं हो सकता है ठीक है और नहीं होने वाला है तब भी हम इसके ऊपर अप्लाई करेंगे और देखेंगे कि कांस्टेंट कॉएफिशिएंट की वैल्यू के ऊपर कितना डिफरेंस हमें देखने को मिलता है यदि हम सो एंड रिच को इस्तेमाल करें ठीक है तो चलिए इसके अंदर रिलेशन मैट्रिक्स बना लेते हैं पहले इसकी और को रिलेशन मैट्रिक्स बनाने के लिए हम यहां पे snap7 को लेने वाला हूं और डॉट यहां पे मैं करूंगा को रिलेशन को इस्तेमाल करने वाला हूं राइट तो मैंने यहां पे सीर को रिलेशन का इस्तेमाल किया है और उसके साथ-साथ मैं यहां पे क्या कर रहा हूं अट को भी ट्रू कर रहा हूं यहां पे तो मैंने यहां पे लिया नोट और नोट को मैं क्या करने वाला हूं गाइस यहां पे मैं ट्रू करने वाला हूं और ग्राफ को देखने के लिए मैं पीएटी डॉट यहां पे क्या करूंगा गाइस यहां पे शो फन को कॉल करूंगा और इसे रन करूंगा तो मेरे पास ग्राफ आ चुका है लेकिन ये बहुत ही कजस्ट्रॉय इस ग्राफ को हमें थोड़ा सा यहां पे स्ट्रेच करना पड़ेगा तो उसके लिए मैं यहां पे पीएटी डॉट क्या करने वाला हूं यहां पे फिगर का इस्तेमाल करने वाला हूं तो पीएटी डॉट फिगर के अंदर मैं क्या करूंगा गाइज यहां पे फिक्स्ड साइज को इस्तेमाल करूंगा और फिक्स साइज के अंदर जाके 10 10 का ग्राफ बनाने वाला हूं चलिए अब हम यहां पे थोड़ा सा ऑब्जर्व कर लेते हैं कि क्या हमारा कोलेशन चलने वाला है तो कोलेशन के अंदर यदि हम देखें कोई भी डाटा हमारे पास इतना हाईली को रिलेटेड नहीं दिखाई दे रहा है यहां पे बेसिकली और एक हमारे पास क्या है एक नेगेटिव कोलेशंस भी हमें यहां पे देखने को मिलता है फिर भी हम क्या करेंगे इसके ऊपर ट्राई करेंगे लीनियर रिग्रेशन अप्लाई करने का ठीक है तो ये हमारा डेटा सेट आ चुका है अब इस डेटा सेट के अंदर मुझे क्या करना पड़ेगा स्केलिंग की जरूरत पड़ेगी तो पहले मैं यहां पे इनपुट आउटपुट को अलग-अलग करता हूं मतलब डिपेंडेंट और इंडिपेंडेंट वेलेबल को अलग-अलग करता हूं तो हम यहां पे क्या करेंगे इस तरह से काम करेंगे अब हम क्या कर रहे हैं गाइज यहां पे हमारे डाटा को अलग-अलग करते हैं डिपेंडेंट डिपेंडेंट वेरिएबल को अलग-अलग करते हैं उसके लिए मैं एक्स एक्सेस लेने वाला हूं यहां पे और एक्सस के अंदर क्या करूंगा यहां पे अपना डेटा सेट लूंगा डॉट मैं यहां पे आलग का इस्तेमाल करने वाला हूं और आलग के अंदर सारी नंबर ऑफ रो को लूंगा सारे नंबर ऑफ कॉलम को लूंगा लेकिन मैं पीछे वाले कॉलम को छोड़ दूंगा चलिए x एक्सेस के डाटा को देखें यहां पे तो मेरे पास देखिए सारा डाटा आ चुका है सिवाय हमारे पास प्राइस का ठीक है चलिए प्राइस को हम क्या करेंगे y एक्सेस में डालेंगे तो y एक्सेस में डालने के लिए हम क्या करेंगे डेटा सेट को कॉल करेंगे और देन स्क्वायर ब्रैकेट और यहां पे मैं प्राइस को कॉल करने वाला हूं चलिए हमारा x एक्सिस और y एक्सिस के अंदर हमारा डटा जो है वो स्प्लिटिंग हो चुका है अब बारी है स्केलिंग की तो मैं एसी के नाम से एक वेरिएबल बनाऊंगा और स्टैंडर्ड स्केलर को कॉल करने वाला हूं स्टैंडर्ड स्केलर को कॉल करने के बाद मैं एसी डॉट में क्या करने वाला हूं मॉडल को फिट करूंगा मॉडल को फिट करने के लिए मुझे x एक का डाटा देना पड़ेगा फिर मैं 8 डॉट यहां पे क्या करने वाला हूं ट्रांसफॉर्म का इस्तेमाल करूंगा और ट्रांसफॉर्म के अंदर एक्स डालूंगा तो मेरा डाटा स्केलिंग हो चुका है अब नेक्स्ट टारगेट क्या होगा गाइज यहां पे मुझे इसका डटा फ्रेम बनाना होगा क्योंकि मुझे डटा फ्रेम से ज्यादा अच्छे ऑब्जर्वेशन होता है आप चाहे तो इसका भी डायरेक्टली इस्तेमाल कर सकते हैं लेकिन मैं डेटा फ्रेम बनाने में ज्यादा यहां पे इंटरेस्टेड हूं यहां पे तो गाइज मैं एक्सेस के अंदर वापस दोबारा वही डाटा डालने वाला हूं वैसे तो फिलहाल और पीडी डॉट में यहां पे डटा फ्रेम का इस्तेमाल करूंगा पडी ड डटा फ्रेम के अंदर एक्सीड ट्रांसफॉर्म डालेंगे यहां पे और उसके बाद में हम क्या करने वाले हैं हमारे कॉलम के नाम डालेंगे अब कॉलम के नाम के लिए मैं क्या करूंगा गाइज यहां पे मेरे पास जो x है उस x के अंदर जाके हम कॉलम्स को कॉल करते देंगे और इसे क्लोज कर देंगे और देखिए मैं अब आपको एक्स का डेटा दिखाऊं तो मुझे स्केलिंग हुआ हुआ डाटा मुझे यहां पर देखने को मिल जाएगा राइट चलिए अब हम क्या करेंगे हमारे डाटा को स्प्लिटिंग करेंगे ट्रेन और टस्ट के अंदर चलिए ट्रेन और टस्ट के अंदर स्प्लिटिंग करते हैं कैसे यहां पे हमने ट्रेन ट स्प्लिटिंग शायद पहले ले रखा है यहां पे ओके ट्रेन और टेस्ट के अंदर स्प्लिटिंग ले चुका है तो मुझे यहां पे चार वेलेबल बनाने पड़ेंगे x मैं यहां पे पहले बना रहा हूं ट्रेन के नाम से दूसरा मैं क्या कर रहा हूं गाइज यहां पे x मैं बनाने वाला हूं टेस्ट के नाम से उसके बाद मैं बनाने वाला हूं y अंडर मैं यहां बनाऊंगा ट्रेन के नाम से और उसके के बाद y अंडर मैं बनाऊंगा टेस्ट के नाम से ओके और ट्रेन टेस्ट स्लेडिंग को कॉल करेंगे यहां पे मैं x एक्सिस और y एक्सेस का मैं डाटा पास कराऊंगा उसके बाद गाइ यहां पे टेस्टिंग साइज की जरूरत पड़ेगी तो टेस्ट या ट्रेनिंग साइज में से कोई भी एक ले सकते हैं मैं टेस्टिंग ले रहा हूं 0.2 के नाम से 0.2 ले रहा हूं यहां पे अब बारी है हमारे रैंडम स्टेट की रैंडम स्टेट की वैल्यू ले लेता हूं 42 राइट और इसे रन कर देते हैं चलिए हमारा टा ट्रेन और टेस्टक के अंदर स्प्लिटिंग हो चुका है अब बारी है लीनियर मॉडल बनाने की लीनियर मॉडल बनाने के लिए मैं यहां पे फ्रॉम साइकल लान का कॉल करूंगा यहां पे डॉट अब मैं यहां पे कॉल करूंगा लीनियर मॉडल का और लीनियर मॉडल में जाके दैट मैं इंपोर्ट करने वाला हूं किसे आपके पास लीनियर रिग्रेशन को अच्छा लीनियर रिग्रेशन के साथ-साथ मैं यहां पे क्या करूंगा लासो को भी कॉल करने वाला हूं तो मेरे पास यहां पे लासो भी मिल जाएगा एंड देन उसके साथ-साथ मैं रिच को भी कॉल करने वाला हूं तो मैं रिच को भी कॉल कर देता हूं चलो हमारे तीनों मॉडल हमारे पास आ चुके हैं अब नेक्स्ट टारगेट में हमें क्या करना है हमें तीनों के आपके ऑब्जेक्ट बनाने हैं और मॉडल को फिट कराना है और चेक करना है कि क्या एक्यूरेसी रहती है चलिए लीनियर रिग्रेशन के लिए मैं एलआर के नाम से एक वेरिएबल बनाऊंगा और लीनियर रिग्रेशन को मैं कॉल कर देता हूं उसके बाद एल डॉट मैं क्या कर रहा हूं गाइज यहां पे मॉडल को फिट करूंगा फिट करने के लिए मैं x यहां पर ट्रेन एंड देन y ट्रेन का इस्तेमाल करूंगा देन रन करूंगा मेरा मॉडल फिट हो चुका है अब बारी है टेस्टिंग की टेस्टिंग की जगह मैं यहां पे क्या करूंगा स्कोर चेक करूंगा तो अल डॉ मैं क्या कर रहा हूं यहां पे गाइज स्कोर चेक कर रहा हूं स्कोर के अंदर गाइज मैं बात करूं यहां पे तो मैं x टेस्ट और y टेस्ट का यहां पे स्कोर चेक करूं तो ये आ रहा है आपके पास 30 पर दैट अ वेरी वेरी पुअर एक्यूरेसी बहुत ही 3 पर एक्यूरेसी बहुत ही ज्यादा पुअर एक्यूरेसी होती है इतना अच्छा ये मॉडल नहीं बना यहां पे हां मुझे पता भी था क्यों नहीं अच्छा बना है क्योंकि हमारे पास कोई अच्छा को रिलेशन यहां पर देखने को नहीं मिला है राइट लेकिन हम यहां पे यह जानने के लिए नहीं आए हैं यहां पे आज इस वीडियो के जरिए हम यह जान रहे हैं कि लासो और रिज हमारे लिए कितना बेनिफिशियल होता है मतलब ये कांस्टेंट को एफिशिएंट की वैल्यू कितनी लेके आ जाता है चेंज कितनी कर देता है उसको हम यहां पर समझना रहे हैं राइट तो देखिए हमारे पास ये मॉडल ट्रेंड हो चुका है एलआर के नाम से अब इस एलआर का जो मॉडल ट्रेंड हुआ है इसके कांस्टेंट और कफिट की वैल्यू को हम क्या करेंगे एक ग्राफिकल तौर पे रिप्रेजेंट करेंगे अब कैसे रिप्रेजेंट किया जाता है यहां पे तो देखिए मैं एलर डॉट यहां पे को एफिशिएंट की वैल्यू को देखूं यस को एफिशिएंट की वैल्यू को देखूं तो मेरे पास सारी को एफिशिएंट की वैल्यू यहां पे आ चुकी है तो क्यों ना हम इसका ग्राफ बना लिया जाए ग्राफ बनाने से क्या होगा हमें बैटर विजुलाइजेशन मिल पाएगा कि ये ग्राफ किधर की तरफ जा रहा है यहां पे और उसके हिसाब से यदि हम लास और रिच को नए वाले लेके आएंगे तो उसमें कितना इफेक्ट पड़ता है सेकंड चीज हम यहां पे क्या करेंगे हम यहां पे क्या करेंगे एक डेटा फेम भी बनाएंगे जहां पे लीनियर रिग्रेशन क्या आपका इफेक्ट करता है लासो क्या इफेक्ट करता है और रिच क्या इफेक्ट करता है तीनों में कंपैरिजन हो जाएगा तो मैं दोनों काम करने वाला हूं ग्राफ भी बना के दिखाऊंगा आपको विजुलाइजेशन कराएंगे और इसके साथ-साथ मैं यहां पे क्या करूंगा एक टेबल भी बनाएंगे यहां पे चलिए ग्राफ बनाने के लिए मैं क्या इस्तेमाल करूंगा यहां पे गाइस मैं यहां पे मैट प का इस्तेमाल करूंगा उसके लिए मैं पीएटी डॉट यहां पे क्या करूंगा बार ग्राफ का इस्तेमाल करूंगा राइट बार ग्राफ के अंदर मुझे एक्स एक्सिस का डाटा देना पड़ेगा अब एकस एक्सिस के अंदर मैं क्या करूंगा कि जो मेरे यहां पे एक्स ट्रेन है या फिर एक्स टेस्ट है जो भी एक्स एक्सिस है उसके कॉलम के नाम चाहिए गे मुझे तो कॉलम के नाम के लिए x डॉट यहां पे मैं क्या करेंगे कॉलम का इस्तेमाल करेंगे राइट अ एक् डॉट क्या करेंगे गाइज यहां पे कॉलम का इस्तेमाल करेंगे अब देखिए मैं यहां पे x डॉ कॉलम को बताऊं यहां पे तो x डॉट यहां पर यदि आप कॉलम्स को कॉल करते हैं तो आपके कॉलम के नाम आ जाते हैं ठीक है तो मैं यहां से कट करूंगा और कॉलम्स के नाम को पेस्ट करूंगा उसके बाद मुझे वा एक्सेस के अंदर डटा लाना है तो y एक्सेस के लिए मुझे क्या करना पड़ेगा यहां पे ये जो एलआर आया है एलआर डॉट मैं क्या करूंगा यहां पे को एफिशिएंट को कॉल करूंगा ये आ गया मेरे पास डाटा यहां पे बार ग्राफ के तौर पे अब ग्राफ को देखने के लिए मैं पीएटी डॉट यहां पर शो फंक्शन को कॉल करूंगा एंड देन रन करूंगा देखिए ये हमारा ग्राफ आ चुका है अब ये ग्राफ काफी कंजे ेड ग्राफ है यहां पे तो मुझे क्या करना पड़ेगा गाइज यहां पे इसको थोड़ा सा स्ट्रेच करने की जरूरत है और अच्छे से विजुलाइजेशन की जरूरत है तो मैं इसके लिए यहां पे पटी फिगर का इस्तेमाल करूंगा और पीएटी ड फिगर के अंदर जाके मुझे क्या करना है गाइज यहां पे फिक्स साइज को कॉल करना है फिक्स साइज के अंदर एक काम करते हैं इसकी विड्थ को बहुत ज्यादा बढ़ा लेते हैं और हाइट को सेवन कर देते हैं चलिए एक बार देखें या काफी थोड़ा छोटा बना देते हैं ग्राफ को यहां पे इसे फाइव कर लेते हैं और इसे यहां पर थोड़ा सा 15 कर लेते हैं ताकि ये बैटर ऑब्जर्वेशन आए यस हमारे पास एक बैटर ऑब्जर्वेशन आ चुके हैं यहां पे देखेंगे तो बेडरूम का तो बहुत ही मिनिमम मिनिमम चल रहे हैं यहां पे इनके कफिट वैल्यू काफी ज्यादा अच्छी चल रही है राइट अब ये ग्राफ किसका है तो थोड़ा सा यहां पे टाइटल वगैरह लगाते ते हैं पीएटी डॉट यदि मैं टाइटल का इस्तेमाल करूं तो टाइटल के थ्रू हम यहां पे लगाएंगे कि ये किसका है लीनियर रिग्रेशन का है ये ग्राफ राइट ये किसका है यहां पे लीनियर रिग्रेशन का ग्राफ है एंड उसके साथ-साथ पीएटी डॉट यदि मैं यहां पे x लेबल की बात करूं यहां पे यस x लेबल की अ बात करें तो एकस लेबल के अंदर क्या है हमारे पास यहां पे कॉलम है मतलब कॉलम के नाम लिखे हैं यहां पे तो कॉलम के नेम है मतलब लीनियर रिग्रेशन के डटा के कॉलम्स के नाम है एंड पीएटी डॉट ती मैं यहां पे अ वा लेवल की बात करूं यहां पे यस वा लेवल के अंदर बात करूं तो ये पर क्या है कफिट वैलू है तो मैं इसे कोफ लिख देता हूं यहां पे बेसिकली और रन कर लेते हैं ऐसे चलिए लीनियर रिग्रेशन का डाटा आ चुका है और काफी अच्छा यहां पे डटा दिखाई दे रहा है और 10 टू द पावर 6 तक चल रहा है यहां पे ओके और नीचे भी काफी चल रहा है ये हमें यहां पे डटा दिख रहा है ओके अब हमारा काम क्या होगा ये तो हो गया हमारे पास किसकी बारी यहां पे लीनियर डिग्रेशन की बारी अब बारी है हमारी लासों की एक काम करते हैं इसके अंदर एक हेडिंग डाल देते हैं ताकि आप लोगों को कंफ्यूजन ना रहे तो मैं काम करता हूं हेडिंग डाल देता हूं और यहां पे क्या डालता हूं हेडिंग के लिए ये किसका काम कर रहा है हमरे यहां पे लीनियर रिग्रेशन का काम कर रहा है ओके और इसको मैं कर देता हूं मार्क डाउन एंड रन कर देते हैं चलिए अब मेरा काम क्या है लासो का होने वाला है तो मैं लासो को इस्तेमाल करूंगा और लासो को ए1 रेगुलराइजेशन टेक्निक भी बोलते हैं आप लोगों को सभी को पता है यहां पे और ये जो टेक्निक हम इस्तेमाल करते हैं ये किस लिए करते हैं गाइज यहां पे ये टेक्निक हम इस्तेमाल करते हैं बेसिकली फीचर सिलेक्शन के लिए यस लासो हम किसके लिए करते हैं फीचर सिलेक्शन के लिए करते हैं तो हम देखते हैं इसमें से कौन-कौन से फीचर्स ये रिमूव करता है यहां पे चलिए लासो के लिए मैं क्या करूंगा यहां पे एए के नाम से एक वेरिएबल बनाऊंगा अच्छा पहले मैं चेक कर लेता हूं ऊपर क्या था एलआर था या एल के नाम से वेरिएबल बनाऊंगा और यहां पे मैं लासो को कॉल करने वाला हूं लासो को जैसे ही आप कॉल करेंगे इसके अंदर एक अल्फा वैल्यू पूछी जाती है अल्फा मतलब ये पेनल्टी कॉर्नर्स हमसे यहां पे आस्किंग करता है तो पैलेंट ऑनर की वैल्यू अभी क्या है वन है मतलब यहां पे बेसिकली चल रहा है यहां पे पैलेंट ऑनर मैं पैलेंट ऑनर थोड़ा चेंज करूंगा और चेंज करके 0.5 कर देता हूं ओके उसके बाद ए डॉट क्या करेंगे मॉडल को फिट करेंगे ए डॉट मॉडल को फिट करने के बाद मैं यहां पे x ट्रेन y में क्या करने वाला हूं ट्रेन देने वाला हूं इसके साथ-साथ मैं यहां पे क्या करूंगा एल डॉट यहां पे मैं क्या करूंगा मॉडल का स्कोर भी चेक करूंगा स्कोर के अंदर मैं यहां पे x टेस्ट y यहां पर टेस्ट देने वाला हूं रन करते हैं बहुत ही पुअर एक्यूरेसी के साथ इन्होंने आंसर दिया है यहां पे ये भी 3 पर के आसपास कि हमें यहां पे आंसर रिटर्न कर रहा है राइट और रन करते हैं तो 3 पर हमारे पास आंसर है 3.22 पर का आंसर है अच्छा ये कुछ वार्निंग दे रहा है इस वार्निंग को अभी फिलहाल क्या करते हैं इग्नोर करते हैं यहां पे क्योंकि वार्निंग है कोई एरर नहीं आ रही है यहां पे तो वार्निंग अभी के लिए इग्नोर की जा सकती है अच्छा 3.22 पर एक्यूरेसी दे रहा है मॉडल की पहले एक्यूरेसी चेक करें तो ये भी 3.86 स थी कोई ज्यादा इफेक्ट नहीं पड़ा यहां पे अच्छा अल्फा वैल्यू को एक बार चेंज करके देख लेते हैं अल्फा वैल्यू को लेके आके 10 कर देते हैं रन करते हैं तो अभी भी मॉडल की एक्यूरेसी कोई ज्यादा खास चेंज नहीं हो पाई है म मडल की एक्यूरेसी अभी भी फिलहाल वही है अब मेरा काम क्या होगा गाइज यहां पे ये ग्राफ बनाना तो मैं यहां पे क्या करता हूं ये वाला ग्राफ बना लेता हूं यहां पे लासो के लिए तो लासो के लिए ग्राफ बनाए लासो के अंदर यहां पे क्या करना है x कॉलम और y कफिट लिखना है यहां पे तो यहां पे एल की जगह एल एल करना है यहां पे मतलब एलआर की जगह एल करना है यहां पे और बेसिकली ये किसके लिए बनाया जा रहा है ये लासो के लिए बनाया जा रहा है तो मैं लीनियर रिग्रेशन को रिप्लेस करके लासो कर देता हूं रन करते हैं तो देखिए आपके पास कफिट कांस्टेंट की वैल्यू काफी ज्यादा कम हुई है यहां पे आप ऑब्जर्व कर पाएंगे देखिए आपका जो डाटा था वो और ये -4 के आसपास चल रहा था 50000 के आसपास चल रहा है और डाटा काफी कम हुआ है और अभी ग्राफ को ऑब्जर्व करेंगे तो काफी अच्छा सा ग्राफ हमें एनालिसिस भी हुआ है राइट तो इस तरह से हमें काफी अच्छे से एनालिसिस हुई है यहां पे अच्छा एक बार हम क्या करते हैं इसकी वैल्यू को एक बार कम करके देखते हैं कि यदि मैं 0.001 कर दूं तो फिर क्या इफेक्ट पड़ेगा यदि मैं 0.001 करूं या काफी यहां पे देखिए नेगेटिव को काफी रेडिशन की जा रही है यहां पे और पॉजिटिव के अंदर भी काफी रिड्यूस हो रही है राइट तो कफिट कांस्टेंट की वैल्यू काफी कम कर रहा है ओके अब बारी है हमारी रिज के बारे में तो मैं यहां पे रिज को समझाने जा रहा हूं यहां पे और तीनों के अंदर हम कंपैरिजन भी देखेंगे अभी फिलहाल थोड़ा सा वेट करेंगे हम यहां पे क्योंकि अभी मैं एक बार मॉडल ट्रेन कर दूं तो उसके बदे में हम उसके बाद में कंपैरिजन भी देखेंगे चलिए अभी मार्क डाउन कर लेते हैं इसे यहां पे और रन कर लेते हैं अब मुझे का है किसकी रिज की तो रिज के लिए मैं क्या कर रहा हूं आआ के नाम से एक वेरिएबल बनाता हूं और मैं यहां पे रिज रेगुलेशन टेक्निक को कॉल कर देता हूं राइट अब रीशन टेक्निक को जब भी आप ओपन करेंगे तो इसके अंदर भी आपको अल्फा वैल्यू देखने को मिलेगी तो आप यहां पे अल्फा वैल्यू लगा सकते हैं अल्फा वैल्यू यहां पे मैं क्या करता हूं 10 कर देता हूं ये क्या करता है यहां पे ये आपके कफिट की वैल्यू को रिड्यूस करता है और मडल को ओवर फिटिंग होने से बचाता है राइट आर लूंगा आर लेके मैं यहां पे क्या करूंगा मॉडल को फिट करूंगा फिट के अंदर मैं यहां पे x अ यहां पे क्या लेने वाला हूं ट्रेन लेने वाला हूं और मैं क्या लेने वाला हूं y लेने वाला हूं इसके साथ-साथ मैं यहां पे क्या करूंगा आर डॉट यहां पे क्या करूंगा स्कोर को चेक करूंगा आर डॉट स्कोर के अंदर मैं क्या करूंगा गाइज यहां पे x यहां पे टेस्ट और यहां पे y टेस्ट को मैं यहां पे लेने वाला हूं और रन करेंगे तो ये भी कुछ ज्यादा अच्छी एक्यूरेसी नहीं दे रहा है यहां पे ये हमें 3.2 पर एक्यूरेसी दे रहा है अच्छा ऊपर वाली क्या थी 3.22 थी ये कितनी थी 2 प 3.22 थी ऑलमोस्ट यहां पे लासो और नॉर्मल तो आपका सेम काम कर रहा है लेकिन रिच यहां पे थोड़ा सा अच्छे तरीके से वर्क कर रहा है और अच्छी एक्यूरेसी लाके दे रहा है यहां पे ओके चलिए अब हमारे पास क्या है इसका भी हम हमें ग्राफ बनाना पड़ेगा तो मैं यहां पे इसका भी हमें ग्राफ बनाना है तो हम इसका ग्राफ बना लेते हैं यहां पे और यहां पे पहला काम करते हैं रिज नाम डाल देते हैं पहले तो रिज डाल देते हैं यहां पे और यहां पे ए की जगह क्या करता हूं गाइ यहां पे r आ डाल देता हूं यस r ड को एफिशिएंट डाल देता हूं रन करते हैं ग्राफ देखते हैं ओके काफी रिड्यूस देखने को मिली ये है यहां पे को एफिशिएंट कांस्टेंट की वैल्यू और काफी अच्छे ंग से हमें एनालिसिस भी हो रहा है ग्राफ यहां पे चलिए अब हमारे पास तीनों मॉडल आ चुके हैं अच्छा तीनों मॉडल के अंदर कितनी कितनी एरर चल रही है यहां पे मीन स्क्वायर एरर मीन एब्सलूट एरर रूट मीन स्क्वायर एरर तो ये भी हम पता कर लेते हैं ताकि हमें पता के कि बेस्ट मॉडल कौन सा होने वाला है राइट हमें क्या करना पड़ेगा सेकंड लाइन के अंदर जाना पड़ेगा सेकंड लाइन के अंदर जाने के बाद में हमें जाना है यहां पे मैट्रिसेज के अंदर मैट्रिसेज के अंदर जाने के बाद मैं यहां पे क्या करूंगा इंपोर्ट करूंगा और इंपोर्ट करने के बाद मुझे क्या करना है यहां पे सबसे पहले मीन स्क्वायर एर को कॉल करना है तो चलिए मीन स्क्वायर एरर को कॉल करते हैं तो देखिए मीन एब्सलूट एरर मुझे पहले ही मिल गई है तो मीन एब्सलूट एरर पहले ले लेते हैं फिर मैं यहां पे मीन स्क्वायर एरर को कॉल कर देता हूं अच्छा आप बोलेंगे रूट मीन स्क्वायर एर के लिए तो रूट मीन स्क्वा डायरेक्टली आपको नहीं देखने को मिलती है उसके लिए आपको क्या करना पड़ता है गाइज यहां पे आपको नपाई का इस्तेमाल करना पड़ता है ट्स मैं यहां पे क्या करने वाला हूं गाइज यहां पे इंपोर्ट कर लेता हूं और इंपोर्ट कैसे करता हूं यहां पे नपाई एलियाज ऑफ यहां पे मैं एनपी को कर लेता हूं चलिए रन करते हैं ओके गाइज चलिए अब मैं क्या कर रहा हूं यहां पे इस लीनियर डिग्रेशन जो आपका मॉडल आया है यहां पे इसके अंदर मैं इसकी एरर देखता हूं कि ये कितने परसेंट एरर है क्या एरर चल रही है रूट में स्क्वा एरर क्या है किस तरह की है वो देख लेते हैं यहां पे तो सबसे पहले मैं बात करता हूं यहां पे किसके बारे में मीन स्क्वायर एरर के बारे में जब आप मीन स्क्वायर एरर को कॉल करते हैं तो ये आपसे दो वैल्यू मांगता है एक तो आपका पास ट्रू वैल्यू और एक प्रोडक्ट की वैल्यू देखिए आपके पास y ट्रू एंड y पीआरडी दो वैल्यू की डिमांड करता है चलिए दोनों वैल्यू दे देते हैं y ट्रू कासे मि लेखा यहां पे y टेस्ट आपका y ट्रू है यहां पे अब बारी है प्रेडिक्शन वैल्यू की कि प्रेडिक्शन वैल्यू कहां से आएगी तो प्रेडिक्शन वैल्यू एलआर के नाम से आएगी आपके पास यहां पे l डॉट आपके पास प्रिडिक्ट फंक्शन होता है जिससे आप प्रेडिक्शन कर सकते हैं और इसके अंदर आपको देना है यहां पे x टेस्ट जैसे ही आप रन करेंगे मीन स्क्वायर एरर की वैल्यू आपको देखने को मिल जाएगी और ये काफी ज्यादा है यहां पे देखिए आप ऑब्जर्व कर पाएंगे तो देखिए y2 एंड y पीआरडी देना था y पीआरडी हमने दिया एलर ड पीक्स फंक्शन के थ्रू x अंडर टेस्ट डाला और ये काफी ज्यादा है बहुत ही ज्यादा है यहां पे चलिए उसके बाद में मैं यहां पे क्या करता हूं आपके पास नेक्स्ट बात करता हूं यहां पे किसके बारे में मीन एब्सलूट एरर के बारे में राइट नेक्स्ट यहां पे बात करता हूं किसके बारे में मीन एब्सलूट एरर के बारे में तो मैं मेन एब्सलूट एलर ले रहा हूं यहां पे जहां पे मैं y अको क्या करूंगा टेस्ट लूंगा और प्रिडिक्शन वैल्यू के लिए मैं अल डॉट यहां पे प्रिडिक फंक्शन का इस्तेमाल करने वाला हूं लीनियर रिग्रेशन ड पडि का फंक्शन का इस्तेमाल कर रहे हैं यहां पे और एक्स अंडर्स को क्या करेंगे यहां पे गाइज टेस्ट डाल देंगे ओके रन करेंगे तो यहां पे इसकी भी वैल्यू मिल जाएगी अच्छा ये दोनों वैल्यू एक साथ नहीं आ रही है तो इसके लिए हम क्या करेंगे प्रिंट फंक्शन का इस्तेमाल करेंगे तो मैं यहां पे प्रिंट फंक्शन देता हूं और इसके साथ इसको भी प्रिंट करना है तो मैं यहां पे फिर से क्या करता हूं प्रिंट फंक्शन को डाल देता हूं चलिए तो प्रिंट फंक्शन डाल देते हैं और रन कर देते हैं दोनों की एरर आ चुकी है काफी ज्यादा हाई है यहां पे एरर यहां पे अब बारी है रूट मन स्क्वायर एरर की कैसे आएगा रूट मन स्क्वायर की वैल्यू तो देखिए प्रिंट कर लेते हैं पहले तो यहां पे नम पई में जाते हैं नपाई में आपका क्या स्क्वायर रूट मिलेगा तो नपाई के अंदर आ जाने के बाद आपको ए क आटी के अंदर स्क्वायर रूट मिलेगा इस स्क रूट के अंदर मीन स्क्वायर एरर की जो वैल्यू है इसे हम यहां पे प्लेस कर देंगे जैसे ही मैं इसके अंदर ये वैल्यू प्लेस कर देता हूं और रन करता हूं तो रूट स्क्वा व भी हमें मिल जाती है और देखा जाए तो काफी ज्यादा है यहां पे चलिए अी यहां पे हमने इसकी कंपैरिजन किया अब हमें क्या करना है हम नीचे वाले में भी कंपैरिजन कर लेते हैं चलिए लासो में चलते हैं और लासो में आने के बाद में मैं यहां पे क्या करता हूं इस तरह जाके पेस्ट कर देता हूं और लासो के अंदर क्या करते हैं एले का इस्तेमाल करते हैं तो मैं यहां पे एले लिया है और यहां पे भी मैं एले कर देता हूं और यहां पे भी जाके मैं एले कर देता हूं रन करते हैं लासो के एरर देखते हैं लासो के एरर भी काफी ज्यादा ही है कोई आपके पास इतना कोई माइनोट फर्क है यहां पे देखिए माइनर सा फर्क है यहां पे अब बारी है हमारी रिच की तो रिच के अंदर चलते हैं और रिच के अंदर हमारे पास आर आई मॉडल है यहां पे चलिए इसे रन करते हैं यहां पे और आरई मॉडल को देखने के बाद में यहां पे क्या करना है मुझे आरई देना है तो मैं इसे हटाता हूं और आरई डाल देता हूं यहां पे यस क्या ता हूं आर आई डाल देता हूं नेक्स्ट टारगेट पे चलता हूं यहां पे इसमें भी आर आई डाल देता हूं और इसके अंदर चलने के बाद में मैं क्या करता हूं इसमें भी आर आई डाल देता हूं राइट रन करने के बाद देखते हैं यहां पे जो एरर है यहां पे इतना ज्यादा इफेक्ट नहीं आया मतलब एरर के अंदर तो सब में बराबर ही चल रही है एरर कोई ज्यादा इफेक्टिव नहीं कर रही है यहां पे अब मेजर चीज है कि कौन सा मॉडल को चूज किया जाए तो बेसिकली हम यहां पे रिच को चूज करेंगे क्योंकि ये थोड़ी सी एक्यूरेसी बढ़ा रहा है अब पॉइंट पे बढ़ा रहा है लेकिन यहां पे बढ़ा रहा है एक्यूरेसी तो लेकिन हम रेज को इस्तेमाल करेंगे एक बार इनके कफिट की वैल्यू को भी कंपेयर कर ली जाए साइड बाय साइड तो कितना अच्छा रहेगा तो बिल्कुल कफिट की वैल्यू को कंपेय करते हैं साइड बाय साइड कैसे करेंगे कंपेयर तो मैं एक काम करता हूं एक डेटा फ्रेम तैयार कर लेता हूं डेटा फ्रेम तैयार करने के लिए मैं यहां पे क्या करूंगा डीएफ नाम से एक वेरिएबल बनाऊंगा पीडी डॉट यहां पे एक डेटा फ्रेम ले लेते हैं यहां पे और डटा फ्रेम के अंदर अब मेरे पास क्या होगा कि मुझे एक डिक्शनरी बनानी पड़ेगी ताकि हम यहां पे काम कर सके डिक्शनरी बना लेते हैं और डिक्शनरी के अंदर क्या करते हैं कॉलम नेम ले लेते हैं ठीक है तो मैं यहां पे कॉल अंडर नेम के नाम से एक वेलेबल बना रहा हूं यहां यहां पे कॉल नेम है यहां पे और कॉल नेम कसे आएंगे तो मैं x डॉट यहां पे क्या करूंगा कॉलम्स को कॉल करूंगा यस x डॉट कॉलम को इस्तेमाल करेंगे कॉलम नेम आ जाएंगे उसके बाद नेक्स्ट टारगेट क्या होगा गाइस यहां पे मुझे यहां पे लीनियर रिग्रेशन लासो रिग्रेशन और रि रिग्रेशन तीनों को कॉल करना पड़ेगा यस तो सबसे पहले मैं यहां पे कॉल करता हूं आपके पास लीनियर रिग्रेशन को तो मेरा लीनियर इशन आ चुका है इसी के नाम से मैं क्या कर रहा हूं गाइ यहां पे एक कॉलम का नाम बना लेता हूं यहां पे और यहां पे एलआर के नाम से हमारा मॉडल है एलआर डॉट यहां पे कफिट को कॉल करता हूं तो ये लीनियर रिग्रेशन का कॉलम आ चुका है उसके बाद मेरे पास क्या है लासो यस मैं लासो को कॉल कर देता हूं और लासो को एज ए कॉलम के तौर पे रख देते हैं राइट और यहां पे लासो के लिए है हमारे पास यहां पे एल एल डॉट यहां पे कफिट को वलू को कॉल करते हैं तो एल के को एफिशिएंट आ जाएंगे उसी के साथ-साथ अब मेरे पास क्या है गाइस यहां पे रिज है तो मैं यहां पे रिज को कॉल कर देता हूं तो मेरा रिज आ चुका है और रिज भी क्या करता हूं एज ए कॉलम की तरफ पे रख देता हूं यहां पे और रिज के अंदर क्या करेंगे यहां पे गाइ यहां पे तो आर के नाम से मेरा मॉडल है यहां पे यस आर आ डॉट यहां पे कफिट को कॉल कर देते हैं यस आआ डॉट कफिट कोते हैं तो ये हमारा डेटा फ्रेम तैयार है अब डीएफ को रन करके देखें यहां पे कॉलम के बार में साइड बाय साइड कंपेयर करें तो हमें कुछ देखने को मिलेगा देखिए बैडरूम के अंदर बात करते हैं बैडरूम के अंदर आपके पास जो वैल्यू है वो काफी ज्यादा आपके पास यहां पे रिड्यूज हुई है दोनों के अंदर आप कंपेयर करेंगे तो काफी यहां पे रिड्यूस हुई है इसके साथ-साथ बेडरूम के अंदर देखेंगे तो बाथरूम के अंदर देखेंगे तो बाथरूम में भी काफी ज्यादा वैल्यूज यहां पे चेंजेज आपको देखने को मिला है यहां पे रेज के अंदर हालांकि वैल्यू कंपैरिजन देखेंगे तो ये वैल्यू बढ़ चुकी है उसके साथ-साथ यदि लिविंग स्क्वायर फीट एरिया को देखेंगे तो ये नेगेटिव था यस ये नेगेटिव था तो इन्होंने दोनों ने क्या किया पॉजिटिव में इसे चेंजेज कर दिया यहां पे राइट उसके साथ-साथ यहां पे स्क्वायर फीट आप लॉट को देखें यहां पे तो इसके अंदर भी काफी वैल्यू चेंज हुई है और फ्लोर के अंदर भी देखेंगे तो वैल्यू काफी यहां पे चेंजेज हुई है तो इस तरह से आप यहां पे साइड बाय साइड कंपेयर कर सकते हैं और देख सकते हैं कि किस में ज्यादा कम हुआ यहां पे इसके साथ-साथ यदि आपको और ज्यादा यहां पे वेरिएशन चाहिए तो और ज्यादा वेरिएशन करने के लिए आप इसकी अल्फा वैल्यू को चेंज करके देख सकते हैं अल्फा वैल्यू से काफी फर्क पड़ता है यहां पे जितना ज्यादा अल्फा वैल्यू को चेंजेज करेंगे तो आपके पास यहां पे काफी फर्क पड़ता है यहां पे क्योंकि अल्फा एक हाइपर पैरामीटर है जिसके चेंजिंग करने पर हमारे मॉडल के जो एक्यूरेसी है उसमें काफी चेंजेज हमें देखने को मिलते है तो ये था हमारे पास यहां पे आज के प्रैक्टिकल के अंदर हमने समझा लीनियर रिग्रेशन कैसे वर्क करता है लासो कैसे वर्क करता है और रिज कैसे वर्क करता है और आज की इस वीडियो के जरिए हम बात करेंगे क्लासिफिकेशन एनालिसिस के बारे में देखिए क्लासिफिकेशन एनालिसिस कब इस्तेमाल की जाती है तो जब भी आपके पास जो आपका आउटपुट है मतलब देखिए आपके पास दो फीचर होते हैं एक होता है आपका पास इंडिपेंडेंट फीचर और एक होता है डिपेंडेंट फीचर इसमें से यदि आप आउटपुट फीचर के ऊपर बात करने जा रहे हैं यहां पे मतलब आपका टारगेट फीचर के ऊपर बात करने जा रहे हैं यदि आपके टारगेट फीचर को यदि आप गौर से देखें यदि आपका टारगेट फीचर को देखने पर आपको दिखाई देता है कि वो एक क्लासिफाई है क्लासिफाई का मतलब है बेसिकली गाइ यहां पे कि यदि उसके अंदर जो आउटपुट है वो कुछ इस तरह से है ट्रू फॉल्स या फिर कुछ इस तरह से आपको देखने को मिलता है यस नो या फिर कैट एंड डॉग एंड काउ इस तरह की आपके पास आउटपुट यदि नजर आते हैं मतलब आपको पास यहां पे जो आउटपुट है वो कंटीन्यूअस इन नेचर में ना मिलते हुए डिस्क्रीट इन नेचर के अंदर मिलता है मतलब आपको क्लासिफाई नेचर के अंदर मिलता है है तो उसको हम बोलते हैं क्लासिफिकेशन एनालिसिस यस उसके अंदर हम क्या करते हैं क्लासिफिकेशन एल्गोरिथम्स को लगाते हैं और हमारी आउटपुट को प्रिडिक्ट करते हैं तो बेसिकली क्लासि एल्गोरिथम क्या होती है गाइज यहां पे या फिर क्लासि एनालिसिस क्या होती है तो क्लासिल एनालिसिस वो एनालिसिस होती है जब आपका टारगेट फीचर जो होता है यहां पे वो डिस्क्रीट इन नेचर का होता है मतलब उसका जो आउटपुट होता है गाइज यहां पे वो आपके पास यहां पे क्लासिफाई होता है जैसे कि कैट डॉग काउ वगैरह इस तरह में क्लासिफाई होता है इस तरह की एनालिसिस को हम क्लासिफिकेशन एनालिसिस बोलते हैं और इसके अंदर जो एल्गोरिथम इस्तेमाल की जाती है गाइ यहां पे उसको हम क्लासिफिकेशन एल्गोरिथम्स बोलते हैं चलिए जरा इसको छोटे से एग्जांपल के तौर पे देखें जस्ट लाइक यहां पे एक ग्राफ बना हुआ है इस ग्राफ के अंदर यदि आप ऑब्जर्व करेंगे तो इसके अंदर देखिए मेरे पास दो फीचर ले रखे हैं जैसे कि आपके पास यहां पे x1 एक फीचर हो गया और x2 एक फीचर हो गया इसके बेसिस पे हमारे जो आउटपुट है इसको हमने क्या किया है दो पार्ट के अंदर क्लासिफाई किया है एक आपके पास क्या है एक सर्कल है जो कि ब्लू कलर का है दूसरा आपके पास ट्रायंगल है जो कि ग्रीन कलर का है इस तरह के एनालिसिस को हम क्लासिफाई एनालिसिस कहते हैं जिसके अंदर क्लास ए और क्लास बी के अंदर आपने क्या किया है इसे स्प्लिटिंग किया है दैट इज कॉल्ड ऑफ क्लासिफिकेशन एनालिसिस चलिए अब क्लासि एनालिसिस के अंदर हम बात करें तो ये कितने तरह की होती है तो बेसिकली ये दो तरह की होती है एक होती है बाइनरी क्लास क्लासिफिकेशन और दूसरी होती है मल्टी क्लास क्लासिफिकेशन अब ये बाइनरी क्लास क्लासिफिकेशन का मतलब क्या हुआ गाइज यहां पे तो जब भी आपके पास आपका जो टारगेट वेरिएबल है या फिर मैं बात करूं यहां पे जो भी आपका आउटपुट वेरिएबल है यदि वो बाइनरी के नेचर में मिले बाइनरी मतलब ट्रू फॉल्स कैट डॉग यदि दो ही आपको आउटपुट देखने को मिले यहां पे दैट इज कॉल्ड ऑफ बाइनरी क्लास क्लासिफिकेशन जैसे कि एक सिंपल सा जवाब मैं आपसे पूछूं यहां पे क्या ये माउस है यस एंड नो इसका आंसर दीजिए तो आप लोगों का सबका जवाब क्या होगा यस यस ये माउस है क्या मैं पूछता हूं ये माउस है तो आप सब लोगों का जवाब होगा नो ये माउस नहीं है ये एक पेन है अच्छा मैंने आंसर नहीं पूछा मैंने यस और नो के अंदर ही आपका आंसर पूछा है तो आप सब लोगों का जवाब क्या होगा नो ये दैट इज नॉट अ माउस राइट तो अब आपका आंसर क्या हुआ यस नो के अंदर आपके पास हो गया यहां पे तो जब आपका आंसर यस और नो के अंदर होता है यहां पे तो उसको हम क्या बोलते हैं बाइनरी क्लास क्लासिफिकेशन बोलते हैं तो बाइनरी क्लास क्लासिफिकेशन के अंदर आपका जो आउटपुट होता है वो आपके पास यहां पे आउटपुट के तौर पे दो ही आउटकम में देखने को मिलते हैं यहीं पे बात करें मल्टी क्लास क्लासिफिकेशन के अंदर तो देखिए मल्टी क्लास क्लासिफिकेशन के अंदर आपके जो आउटपुट है वो दो से ज्यादा आपको देखने को मिलते हैं जैसे कि एग्जांपल के तौर पे आपके पास आपके पास एनिमल को डिफरेंशिएबल डॉग एंड काउ बफेलो ये सारे आपके पास क्या हो र हैं बहुत सारे क्लासिफिकेशन हो रहे हैं यहां पे तो बेसिकली ये आता है मल्टी क्लास क्लासिफिकेशन के अंदर जैसे कि माउस पेन और मेरे पास एक और है चीज रिमोट ये आपके पास क्या है तीन अलग-अलग चीज हैं यहां पे यस ये आपके पास क्या है तीन अलग-अलग चीजें हैं एक है रिमोट है एक है माउस है एक आपके पास पन है तो यहां पे जब मैं इसे क्लासिफाई कर रहा हूं तो ये मेरे पास क्या है मल्टी क्लास क्लासिफिकेशन का एग्जांपल है क्योंकि कि यहां पे जो आउटपुट है यहां पे वो तीन है यहां पे यस यहां पे जो आउटपुट देख रहा है आपको यहां पे वो कितने है तीन है यहां पे डिफरेंशिएबल मल्टी क्लास क्लासिफिकेशन बोलेंगे राइट अब बात करते हैं कि क्लासिफिकेशन के अंदर कौन-कौन से एल्गोरिथम्स आती है मतलब मशीन लर्नी के एल्गोरिथम हमें कौन-कौन सी बढ़नी है तो इसके अंदर भी आपके पास दो तरीके की आती है पहली आती है आपके पास नॉन लीनियर आपके पास एल्गोरिथम दूसरी आती है आपके पास लीनियर एल्गोरिथम लीनियर एल्गोरिथम का बेसिक मॉडल मैं अंदर बात करूं यहां पे तो बेसिकली आपके पास ये जो आपने ग्राफ देखा जो सबसे पहले आपने ग्राफ देखा इस इसके अंदर जो आपका डाटा जब आपके पास यहां पे सेपरेबल होने जा रहा है मतलब दोनों अलग-अलग होने जा रहा है यहां पे तो वो क्या हो रहा है एक लाइन के थ्रू यहां पे सेपरेबल हो रहा है एक स्ट्रेट लाइन के थ्रू आप क्या कर रहे हैं यहां पे सेपरेबल कर रहे हैं तो इसको बोलते हैं यहां पे लीनियर एल्गोरिथम यस क्लास सजन के अंदर हम क्या कर रहे हैं इसको बोलते हैं लीनियर एल्गोरिथम और काफी बार ऐसा डाटा होता है जो लीनियर सेपरेबल नहीं हो पाता है तब हम यहां पे इस्तेमाल करते हैं नॉन लीनियर एल्गोरिथम अब देखिए लिनियर एल्गोरिथम के अंदर कौन-कौन सी है तो एक आती है के नियरेस्ट नेबर एल्गोरिथम आती है दूसरी होती है एसवीएम अब आप बोलेंगे एसवीएम मतलब सपोर्ट वेक्टर मशीन ये सपोर्ट वेक्टर मशीन होता है लेकिन सपोर्ट वेक्टर मशीन लीनियर के साथ-साथ नॉन लीनियर पे भी काम करता है क्योंकि इसके अंदर अलग-अलग क्या होता है कर्नल होते है यदि आप कर्नल को इस्तेमाल करेंगे तो वो नॉन लीनियर एल्गोरिथम की तरह ही वर्क करेगी उसके बाद आता है आपका न्यू बास एल्गोरिथम जो कि आपके पास क्या करती है गाइस यहां पे आपके पास प्रोबेबिलिटी के बेसिस पे आपके पास क्लासिफाई कर दिया उसके बाद आता है डिसीजन ट्री ये प्रॉपर्ली नॉन लीनियर एल्गोरिथम से यहां पे इसके अंदर किसी भी तरह की क्लासिफिकेशन हो यदि किसी भी तरह से आपके पास यहां पे आउटपुट आ रहा हो यहां पे यस तो ये किसी भी तरह के आउटपुट को यहां पे क्लासिफाई कर देती है उसी तरह से आपके पास आता है रैंडम फॉरेस्ट ये भी आपके पास क्या है डिसीजन ट्री का एक बेसिक एग्जांपल है अब बात करते हैं लीनियर मॉडल के अंदर तो लीनियर मॉडल के अंदर आपके पास आती है लॉजिस्टिक रिग्रेशन एंड सपोर्ट वेक्टर मशीन ये दो आपके पास एल्गोरिथम आती है जो कि लीनियर के अंदर आती है अब बेसिकली गाइ यदि मैं इनमें थोड़ा सा और क्लासिफाई करूं यस इसमें से थोड़ा सा और क्लासिफाई करूं तो प्योर यदि क्लासिफिकेशन एल्गोरिथम के अंदर बात करें प्योर क्लासिफिकेशन एल्गोरिथम का मतलब क्या है गाइ यहां पे केवल और केवल उसके अंदर क्लासिफिकेशन ही एनालिसिस हो सकती है कोई और तरह की एनालिसिस नहीं हो सकती है तो वो आपके से है लॉजिस्टिक रिग्रेशन और न्यू बायस एल्गोरिथम बाकी आप जितने भी एल्गोरिथम्स आप यहां पर नजर देख रहे हैं यहां पे सारी एल्गोरिथम जो आप देख रहे हैं यहां पे ये क्लासिफिकेशन के साथ-साथ रिग्रेशन पे भी वर्क करती है मतलब ये दोनों जगह यहां पे वर्किंग करने के लिए कैपेबल है लेकिन यदि मैं बेसिक तौर पे बात करूं लीनियर के लिए तो लीनियर में दो आती है एक होती है लॉजिस्टिक रिग्रेशन दूसरी आपकी सपोर्ट वेक्टर मशीन और नॉन लीनियर के अंदर ये सारी एल्गोरिथम्स आपके पास आती है राइट चलिए अब बात करते हैं यहां पे कि यदि हमने क्लासि एल्गोरिथम के थ्रू हमने आंसर निकाल दिया लेकिन उस आंसर के अंदर हम कैसे चेक करेंगे कि हमारा आंसर सही है या नहीं है मतलब जैसे हमने रिग्रेशन एनालिसिस जब डिस्कस की थी तो रिग्रेशन एनालिसिस के अंदर हमने लॉसेस को डिस्कस किया था जहां जिसके थ्रू हम ये पता लगा रहे थे कि किस मॉडल के अंदर कितनी परसेंट एक्यूरेसी है या किस मॉडल के अंदर कितनी वो मिस्टेक कर रहा है यह हमने वहां पे निकाला था सेम एज यदि हम क्लासि एनालिसिस के अंदर बात कर रहे हैं यहां पे तो हम यहां पे तीन तरीके से पता लगा सकते हैं कि हमारा जो मॉडल है व कितना अच्छी तरीके से वर्क कर रहा है यदि वो अच्छी तरीके से वर्क नहीं कर रहा है तो फिर हम क्या कर रहे हैं इसे इंप्रूव करने के अलग-अलग मेथड को डिस्कस करते हैं लेकिन उससे पहले हमें ये पता लगाना पड़ेगा कि हमारा जो मॉडल है वो कितने अच्छे तरीके से वर्क कर रहा है उसके लिए हम तीन तरीके के मेथड को इस्तेमाल करते हैं वो तीन तरीके के मेथड कौन-कौन से हैं एक तो है लॉग लॉस क्रॉस एंट्रोपय ये बेसिक है यहां पे ये क्या करता है गाइज यहां पे बेसिकली कि आपके पास जो भी आप एल्गो इस्तेमाल करने जा रहे हैं उस एल्गोरिथम के अंदर आपके पास लॉसेस को निकालता है लॉसेस को निकाल कर ग्रेडिएंट डिसेंट के थ्रू आपके पास यहां पे आउटपुट को लाने में आपकी हेल्प करता है सेकंड है आपकी कंफ्यूजन मैट्रिक्स ये बहुत ही इंपोर्टेंट होने वाली है इसको मैं स्टार मार्किंग लगाऊंगा क्योंकि क्लासिस एनालिसिस की ये सबसे बड़ी जान है जिसके थ्रू आपके पास ये बताता है कि यदि आपने मॉडल अपना अच्छा बना लिया है यदि आपकी एक्यूरेसी भी कितनी अच्छी है लेकिन एक्यूरेसी अच्छी होने के बावजूद भी काफी बार आपके मॉडल जो है वो रिजेक्ट हो जाते हैं और वो रिजेक्ट होने के पीछे न क्या है यहां पे कंफ्यूजन मैट्रिक्स कंफ्यूजन मैट्रिक्स आपको यह बताता है कि यह मॉडल क्यों रिजेक्ट हुआ है इसके अंदर क्या ऐसी कमी है जिसकी वजह से इसकी एक्यूरेसी हाई होते हुए भी ये मॉडल रिजेक्ट हो चुका है तो इसके लिए हम क्या करते हैं कंफ्यूजन मैट्रिक्स का डिस्कस करते हैं उसके बाद है एओसी आरओ काव एओसी आरओ का आपको बताता है कि आपका मॉडल कितने अच्छे तरीके से वर्किंग कर रहा है तो ये तीन तरीके होते हैं जिसके हेल्प से आप क्लासेस एनालिसिस के अंदर जो भी आपका मॉडल है उसको आप लेटिंग कर सकते हैं चलिए अब बात करते हैं यहां पे कि क्लासेस एनालिसिस कहां इस्तेमाल की जाती है रियल वर्ड के अंदर तो बहुत सारी ऐसी जगह है जहां पे क्लासेस एंड एल्गोरिथम इस्तेमाल की जाती है जैसे कि आप सभी ने gmail-id जो कि आपके पास क्या करता है क्लासिफाई करता है जैसे एग्जांपल के तौर पे यहां पे देखें तो देखिए मैं अपना मिता है जहां पे आपके जितने भी एडवर्टाइजमेंट से रिलेटेड मेल होते हैं वो सारे के सारे यहां पर आपको देखने को मिलते हैं तो सार डॉक्यूमेंट आ गए हैं उन्हें स्प्लिटिंग करना है कि ये पीडीएफ है ये या फिर यहां पे बात करें ये आपके पास यहां पे जेपीजी में है या फिर ये आपके पास यहां पे पीएनजी के अंदर है तो इस तरह की चीजें को यदि आपको यहां पे क्लासिफिकेशन करना है तब भी आप क्लासिफिकेशन एनालिसिस का इस्तेमाल करते हैं इसके साथ-साथ यदि मैं बात करूं तो कैट डॉग काउ यदि इन सब के अंदर भी आपको क्लासिफाई करता है तो आपके लिए इसके अंदर भी क्या आता है क्लासि अलगदम का इस्तेमाल किया जाता है तो ये सारी थे रियल वर्ल्ड के और भी एग्जांपल है लेकिन ये कुछ ऐसे एग्जांपल है है जो कि आप रियल वर्ल्ड में देखते भी हैं और जिनका इस्तेमाल भी करते हैं और आज के इस वीडियो के जरिए हम बात करने वाले हैं लॉजिस्टिक रिग्रेशन के बारे में देखिए क्लासि एंड एल्गोरिथम के अंदर हमारे पास बहुत सारी एल्गोरिथम्स आती है यदि आपको python2 के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपने स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं जिसके अंदर लॉजिस्टिक रिग्रेशन हमारे पास क्या है एक ऐसी एल्गोरिथम है जो कि आपके पास ऑब्जेक्ट को क्लासिफाई करती है मतलब यदि आपका टारगेट वेरिएबल क्लासिफिकेशन इन नेचर के अंदर है तो उस पे आप यहां पे लॉजिस्टिक रिगेशन अप्लाई करके आप उसे क्या कर सकते हैं आराम से क्लासिफिकेशन कर सकते हैं यदि आपका आउटपुट ट्रू फॉल्स यस नो या फिर कैट डॉग एंड काउ के अंदर क्लासिफाई हो रहा है तो उसके अंदर आप लॉजिस्टिक रिग्रेशन लगा सकते हैं लेकिन यहां पे एक इंपॉर्टेंट पॉइंट है कि आपका जो डाटा का नेचर होना चाहिए वह नेचर लीनियर सेपरेबल होना चाहिए यदि वह लीनियर सेपरेबल है तो आप लॉजिस्टिक रिग्रेशन को अप्लाई कर सकते हैं यदि आपका डाटा लीनियर सेपरेबल नहीं है नॉन लीनियर सेपरेबल डाटा है तो वहां पे आप लॉजिस्टिक रिग्रेशन नहीं अप्लाई कर सकते हैं तो पहले अपने डटा का नेचर देख लीजिए कि लीनियर सेपरेबल है या नहीं है लीनियर सेपरेबल है तो लॉजिस्टिक रिग्रेशन अप्लाई होगा अब ये लॉजिस्टिक रिग्रेशन काम कैसे करता है इसके पीछे कि एल्गोरिथम क्या है वर्किंग फंक्शन क्या है तो अब हम इसे डिटेल के साथ देखते हैं लेकिन उससे पहले हम लॉजिस्टिक रिग्रेशन के टाइप्स को देख लेते हैं कि लॉजिस्टिक रिग्रेशन कितने टाइप का होता है तो बेसिकली लॉजिस्टिक रिग्रेशन को हमने तीन टाइप के अंदर कैटेगरी इज कर रखा है पहली है हमारी बानो मियल कैटेगरी दूसरी है मल्टीनोमियल कैटेगरी और तीसरी है ऑर्डिनो मियल कैटेगरी देखिए बानो मियल कैटेगरी के अंदर जो भी आपका आउटपुट होता है वो आपके पास दो पार्ट के अंदर डिवाइड होता है जैसे कि बाइनरी पता चल रहा है तो बाइनरी का मतलब होता है दो और दो का मतलब होता है ट्रू फॉल्स यस नो या फिर कैट एंड डॉग इस तरह से दो पार्ट के अंदर क्लासिफाई सकता है दैट अ बाइनरी क्लासिफिकेशन एनालिसिस सेकंड आपके पास आती है मल्टीनोमियल लॉजिस्टिक आपके पास एनालिसिस जिसके अंदर आपके पास क्या होता है कि आपका जो डाटा होता है वो आपके पास दो से ज्यादा पार्ट के अंदर सेपरेबल होता है जैसे कि काउ डॉग बफेलो या फिर मैं बात करूं माउस पेन आपके पास रिमोट राइट इस तरह से आपका डाटा जो होता है वो बहुत सारे मल्टीपल पार्ट्स के अंदर डिवाइड होता है दैट इज कॉल्ड ऑफ मल्टीनोमियल कैटेगरी इसी के अंदर आपके पास आता है ऑडिनो मियल कैटेगरी ऑडिनो मियल कैटेगरी के अंदर आपके जो डाटा होता है वो बहुत सारे पार्ट के अंदर डिवाइड होता है लेकिन यहां पे एक चीज ये होती है कि आपके पास जो डाटा क्लासिफाई हो रहा है वो एक ऑर्डर के तौर प होता है ऑर्डर के तौर पे मतलब क्या है यहां पे लार्ज मीडियम और एक्स्ट्रा लार्ज इस तरह से या फिर मैं बात करूं यहां पे लो मीडियम हाई इस तरह से आपका डिवाइड होता है तो बेसिकली गाइ यहां पे बात करें कि आपका जो डाटा हो होगा वो इस तरह से क्या होगा आपके सेपरेबल तो होगा लेकिन क्या होगा एक ऑर्डर के तौर पे आपके पास जो डाटा होता है वो यहां पे सेपरेबल होता है ये आपके पास यहां पे क्लासिफिकेशन होती है जिसकी हेल्प से आप डाटा को इन इन पार्ट के अंदर क्लासिफाई कर सकते हैं अब हम जानते हैं लॉजिस्टिक रिग्रेशन जो एल्गोरिथम्स है यहां पे वो कैसे वर्क करती है तो जरा इसे एक छोटे से एग्जांपल के तौर प समझते हैं देखिए मेरे पास यहां पे ग्राफ है जो कि आपके पास क्या कर रहा है यहां पे एक इनपुट के बेसिस पे आपके पास आउटपुट को शो कर रहा है जस्ट एग्जांपल के तौर पे बात करें कि मेरे पास एक x हमारे पास इनपुट है जिसके बेसिस पे हम y आउटपुट को देख रहे हैं अब x इनपुट क्या है तो x इनपुट आप मान लीजिए यहां पे 0 1 2 3 4 5 6 7 8 9 10 इस तरह से आपके पास है राइट इसके बेसिस में आपका आउटपुट प्रेडिक्शन हो रहा है जैसे कि यहां पे 0 0 0 0 0 फिर उसके बाद रो फिर वन फिर व 1 1 1 इस तरह से आपका आउटपुट प्रोडक्शन हो रहा है राइट आउटपुट आपके पास शो किया जा रहा है यदि आप इसको जब आप यहां पे ग्राफ के तौर पे प्लॉट करते हैं तो यह ग्राफ कुछ इस तरह से दिखाई देता है जैसे कि मैं बात करूं यहां पे आपका x आएगा और इस जगह पर आपके पास y आएगा अब जब आपके पास यहां पे डाटा कुछ इस फॉर्मेशन के अंदर आपके पास शो होता है तो यहां पे अब हमें क्या करना पड़ता है इसे क्लासिफाई करना पड़ता है यदि मैं y आउटपुट के तौर पे देखूं तो यहां पे मुझे रो मिलेगा और यहां पे मुझे क्या मिलेगा वन मिलेगा अब मुझे यहां पे से क्या करना है क्लासिफिकेशन करना है तो इसके लिए क्लासिफिकेशन के लिए क्या इस्तेमाल कर सकते हैं तो अभी तक हमने लीनियर डिग्रेशन को इस्तेमाल किया था तो तो क्या हम इसे एक लीनियर लाइन के थ्रू सेपरेबल कर सकते हैं बिल्कुल नहीं ऐसा नहीं कर सकते हम लीनियर रिग्रेशन को इस्तेमाल नहीं कर सकते क्यों नहीं कर सकते लीनियर रिग्रेशन को इस्तेमाल इसके अंदर क्योंकि जब आप यहां पे x की वैल्यू को इस रेंज के बाहर लेके जाएंगे और वहां पे आप अपना प्रेडिक्शन सोचेंगे कि यहां प्रेडिक्शन क्या आना चाहिए जीरो आना चाहिए या वन आना चाहिए तो ये जो है इसके अकॉर्डिंग यहां पे कहीं लाइन पे प्रिडिक करेगा और ना तो ये जीरो दिखाएगा ना ये वन दिखाएगा तो ये आपका जो आउटपुट है वो आपके रॉन्ग प्रेडिक्शन करना स्टार्ट कर देगा तो गाइस ऐसे केसेस के अंदर हम यहां पे लीनियर लाइन को नहीं बना सकते तो फिर यहां पर हमें एक दूसरे ऑप्शन को सोचना पड़ेगा जो कि होती है लॉजिस्टिक रिग्रेशन की एल्गोरिथम और वो क्या होती है यहां पे यस उसके लिए हम इस्तेमाल करते हैं सिगमॉड एल्गोरिथम का राइट अब ये सिगमॉड एल्गोरिथम क्या करती है सिगमॉड एल्गोरिथम क्या करती है कि जो भी आपका डाटा होता है उस डेटा पे एक s लाइक शेप कर्व बना देती है जिसके थ्रू आपका प्रेडिक्शन होता है अब यदि आप इस डाटा के अंदर x का कोई ये वाला पॉइंट भी लाके दे दे और उसके ऊपर आप प्रेडिक्शन करने चले तो ये लाइन क्या करेगी यहां पे जाके टच करेगी और जब ये लाइन यहां जाके टच करेगी तो इसका आउटपुट हमें क्या मिलेगा वन मिलेगा तो हमारा प्रेडिक्शन क्या हो जाएगा ट्रू हो जाएगा राइट तो बेसिकली गाइज आप क्या कर रहे हैं कि जब भी आपके पास आपका डेटा सेट कुछ इस तरह के नेचर के अंदर आपको देखने को मिले तब वहां पे आप क्या करते हैं सिगमा सोइड का इस्तेमाल करते हैं और सिगमॉड किसके अंदर यूज किया जाता है लॉजिस्टिक रिग्रेशन के एल्गोरिथम में यदि हम लॉजिस्टिक रिग्रेशन के एल्गोरिथम के ऊपर बात करें तो लॉजिस्टिक रिग्रेशन के एल्गोरिदम किसके ऊपर वर्क करती है सिग्मो इड के ऊपर वर्क करती है अब ये सिग्मो इड दिखता कैसा है कैसा काम करता है जरा इसको समझे तो देखिए हमारे पास ये रहा y आउटपुट और ये र एक्स आउटपुट यही हमारा डेटा पॉइंट है यस इस डटा पॉइंट के ऊपर हम क्या कर रहे हैं सिग्मो इड आपके पास फंक्शन को इस्तेमाल कर रहे हैं सिग्मो इड फंक्शन क्या करता है एक एक्स लाइक शेप यहां पे डिजाइन करता है जो कि एक प्रेडिक्शन लाइन को बनाता है अब इसके अंदर हम क्या करते हैं एक बाउंड्री या फिर आप बोल सकते हैं एक थ्रेस होल्ड वैल्यू को डिसाइड करते हैं ये थ्रेसोल्ड वैल्यू होती है 0.5 यदि आपके पास जो आपका आउटपुट है वो 0.5 से ग्रेटर देन हो जाता है तो आपके पास यहां पे वन आ जाएगा और यदि आपका आउटपुट 0.5 से लेस देन हो जाता है तो फिर जीरो आ जाता है अब ये आपके पास आउटपुट 051 से 0.5 से ग्रेटर दन और 05 5 से लेस देन कैसे आ सकता है क्योंकि हमारा जो आउटपुट है वो तो 01 है तो अब इसे थोड़ा सा डिटेल के साथ समझते है सिगमॉड फंक्शन को तो देखिए यदि मैं सिगमॉड फंक्शन की बात करूं तो सिगमॉड फंक्शन की यदि आप इक्वेशन को नोटिस करेंगे तो सिग्मो इड फंक्शन की इक्वेशन आपके पास कुछ इस तरह से होती है अब यह क्या इक्वेशन है और पहली बात यहां पे यदि हम लॉजिस्टिक रिग्रेशन की बात कर रहे हैं तो यहां पे हमने रिग्रेशन को क्यों इस्तेमाल किया है जबकि हम तो क्लासिफिकेशन बात कर रहे हैं तो बेसिकली यहां पे लॉजिस्टिक क्लासिफिकेशन होना चाहिए तो रिग्रेशन का इस्तेमाल क्यों किया जा रहा है तो अब इसे जरा थोड़ा डिटेल के साथ समझेंगे तो आपको और ज्यादा क्लियर हो जाएगा देखिए सिगमॉड एक्टिवेशन फंक्शन जो होता है उसका फार्मूला क्या होता है 1 अप 1 + e टू द पावर - x होता है ये आपके पास y = टू आपके पास ये फॉर्मूला होता है इसके अंदर ये जो x की वैल्यू आप देख रहे हैं ये जो वैल्यू आपके पास देखी जा रही है ये आपके पास रिग्रेशन का काम करती है कैसे यदि आप यहां पे अपने डाटा के अंदर इसे सॉल्व करेंगे मतलब इस डाटा को लेते हुए आप अपने आउटपुट को सॉल्व करेंगे तो वहां से हमारा जो आउटपुट है एक रिग्रेशन आउटपुट मिलने वाला है मतलब वहां पे हमें जीरो और वन नहीं मिलेगा वहां पे हमारा जो आउटपुट है वो एक नंबर के तौर पर मिलने वाला है यस यहां पे हमारा जो आउटपुट एक नंबर के तौर पर मिलने वाला है फिर हम उसे क्या करते हैं हमारे सिगमॉड फंक्शन को देते हैं और सिगमॉड फंक्शन हमें ये आउटपुट निकाल के देता है कि ये जीरो आएगा या फिर वन आने वाला है राइट इस x को यदि मैं थोड़ा सा और एक्सपेंड करूं ये तो हमारे पास क्या है एक सिंगल इनपुट के बेसिस पे यदि हमारे पास मल्टीपल इनपुट के बेसिस पे हमारा आउटपुट प्रेडिक्शन करना हुआ तब क्या होगा तो ये जो इक्वेशन है वो चेंज हो जाती है कैसे चेंज होती है तो ये जो आप x देख रहे हैं ये जो आप यहां पर x देख रहे हैं यहां पे x जो नजर आ रहा है आपके पास यहां पे इस x की इक्वेशन चेंज हो जाती है और ये x की इक्वेशन क्या बन जाती है गाइज यहां पे बात करें तो ये x की इक्वेशन आपके पास कुछ इस तरह से बन जाती है आपके पास आ जाता है m1 x1 + m2 x2 प्लस यहां पे आपके पास b अब यहां पे मैंने दो ही इनपुट लि है लेकिन आप चाहे तो मल्टीपल इनपुट ले सकते हैं तो मैं यहां प इसे डॉट डॉट करके प् v कर देता हूं तो यहां पर आप देख पा रहे रहे हैं कि ये इक्वेशन किसकी है ये इक्वेशन जो होती है गाइ यहां पे ये हमारी लीनियर इक्वेशन है मतलब लीनियर रिग्रेशन की इक्वेशन है इस लीनियर रिग्रेशन की इक्वेशन को हम क्या करते हैं इस सिग्मो इड फंक्शन में देते हैं और सिग्मो इड फंक्शन हमें आउटपुट के तौर पे यहां पे हमें क्या देता है ट्रू एंड फाल्स के अंदर रिजल्ट देता है तो बेसिकली इसी वजह से हम इसे लॉजिस्टिक रिग्रेशन बोलते हैं क्यों क्योंकि रिग्रेशन एनालिसिस का जो पार्ट है वो इसके अंदर इस्तेमाल किया गया है अब बेसिकली गाइज बात करें यहां पे तो आपके पास यहां पे जो डाटा हो रहा है जो सेपरेबल हो रहा है वो किसके बेसिस पे हो रहा है लाइन के बेसिस पे हो रहा है मतलब यहां पे भी जो आपका डाटा यहां पे सेपरेबल हो रहा है वो क्या हो रहा है इस लाइन के बेसिस पे यहां पे सेपरेबल हो रहा है लीनियर सेपरेबल है इसलिए हम इसे लॉजिस्टिक रिग्रेशन बोलते हैं सेकंड यदि आपके पास मल्टीपल इनपुट्स हुए और उसके बेसिस पे आउटपुट प्रिडिक्शन करना हुआ तब क्या करेंगे हम लाइन से सेपरेबल करेंगे मतलब बेसिकली गाइज यहां पे बात करूं यदि मेरा डाटा मान लीजिए कि आपके पास ये आपके पास x1 और x2 होता यस मैं यहां पे थोड़ा सा इसे रफ कर देता हूं और यहां पे एक छोटा सा और एग्जांपल समझाता हूं यदि आपके पास यहां पे ये आपका x1 होता और ये आपका x2 होता तो हम क्या करते इस तरह से लीनियर सेपरेबल करते लीनियर पार्टीशन करते इसे राइट हम लाइन के थ्रू इसे पार्टीशन करते और यदि आपके पास यहां पे आपका डटा आपके पास मल्टीपल इनपुट प होता ना कि x1 x2 पे होता x1 x2 x3 x4 x5 होता तब हम क्या करते हैं तो यहां पर आप इस्तेमाल करते हैं प्लेन का या फिर हाइपर प्लेन का या फिर और भी चीजों का वहां से आप अपने डाटा को स्प्लिटिंग करते हैं तो आई थिंक आई होप सो समझ में आ रहा होगा कि लॉजिस्टिक रिग्रेशन जो होता है वो सिग्मो इड एक्टिवेशन फंक्शन का इस्तेमाल करता है लेकिन सिग्मो इड एक्टिवेशन का जो इनपुट्स होता है वो लीनियर रिग्रेशन का इस्तेमाल किया जाता है राइट आपका जो भी आपका डटा होता है उस डेटा के अंदर जो भी आपका इनपुट होता है यस उनको हम डालते हैं लीनियर रिग्रेशन के अ लीनियर रिग्रेशन का जो भी आउटपुट होता है वो जाता है सिगमॉड के फंक्शन के अंदर और सिमर्ड फंक्शन आपका पास आउटपुट नजर आता है ट्रू एंड फाल्स के अंदर इस तरह से आपके पास लॉजिस्टिक रिग्रेशन वर्क करता है आई होप सो आपको ये चीजें क्लियर हो गई होगी अब बात करते हैं लॉजिस्टिक रिग्रेशन कहां-कहां इस्तेमाल आता है तो लॉजिस्टिक रिग्रेशन आपके पास जैसे कि आपके पास ईमेल है उसके अंदर आपको पता करना है कि स्पैम है या हैम है इस तरह की चीजों के लिए या फिर आपके पास ऑब्जेक्ट क्लासिफिकेशन के लिए या फिर क्रेडिट कार्ड के फ्रॉड को डिटेक्शन करने के लिए कि ये क्रेडिट कार्ड फ्रॉड हुआ है या नहीं हुआ है इस तरह की चीजों को डिस्कस करने के लिए भी आप लॉजिस्टिक रिग्रेशन का इस्तेमाल करते हैं ठीक है थोड़ा सा प्रैक्टिकली समझते हैं इसके चीज को यस प्रैक्टिकली यदि हमारे पास डेटा सेट आएगा तो उसके ऊपर हम लॉजिस्टिक रिग्रेशन कैसे इस्तेमाल करेंगे इसको जरा आप यहां पे देखते हैं तो देखिए मेरे पास एक डाटा सेट है यहां पे मैं ले चलूं तो एक सोशल network.in एड्स के मतलब मैं बेसिकली एग्जांपल के तौर पे बोलूं तो मान लीजिए कि आपका पास कोई पर्सन है उसने पास एक डेटा सेट है यहां पे इस डाटा को आप देखेंगे तो इस डाटा के अंदर क्या कर रखा है आपके पास किसी पर्सन की एक एज दे रखी है उसकी एक एस्टीमेट सैलरी आपके पास दे रखी है उसके हिसाब से उसने उस सोशल मीडिया नेटवर्क्स को परचेस किया है या नहीं किया है इस तरह से क्लासिफाई कर रखा है कि कोई एक पर्टिकुलर एज का जो पर्सन है यस वो उस सोशल मीडिया नेटवर्क को परचेस कर रहा है या नहीं कर रहा है इस तरह का क्लासिफिकेशन हमें यहां पे देखने को दे यहां पे इस तरह से क्लासिफिकेशन का डाटा सेट हमें देखने को मिल रहा है अब हम यहां पे क्या करेंगे हम एज के बेसिस पे परचेस को फाइंड आउट करेंगे ना कि हम एस्टीमेट सैलरी भी साथ में लेंगे यदि हम एस्टीमेट सैलरी साथ देंगे तो ये क्या हो जाएगा गाइज यहां पे हमारे पास मल्टीपल इनपुट्स हो जाएगा मैं मल्टीपल इनपुट्स अलग से समझाऊ आपको अलग से हमारी जो अगला यहां पे वीडियो आने वाला है उसके अंदर हम मल्टीपल इनपुट्स को भी समझेंगे लेकिन अभी हम सिंगल इनपुट्स को समझ रहे हैं कि यदि आप एज के बेसिस पे परचेस को देखना चाहे कि एज के बेसिस पे परचेस किसी ने पर्सन ने किया है या नहीं किया है इसे आप देखना चाहेंगे तो कैसे देखेंगे और इसके ऊपर आप प्रेडिक्शन कैसे करने वाले हैं तो चलिए जरा से समझते हैं तो इसके लिए मैं ले चलता हूं आपको जुपिटर नोटबुक के अंदर जुपिटर नोटबुक के अंदर आने के बाद सबसे पहले हम क्या करेंगे जो हमारी रिक्वायर्ड मॉड्यूल है उसे हम इंपोर्ट करेंगे डटा सेट को लोड करेंगे और फिर इसके ऊपर वर्क करेंगे तो सबसे पहले मैं यहां पे इंपोर्ट कर रहा हूं किसे मैं यहां पे इंपोर्ट कर रहा हूं पांडा एलियाज ऑफ पीडी को उसके बाद मैं यहां पे क्या कर रहा हूं इंपोर्ट कर रहा हूं किसे यहां पे मैं मैट पॉलिप को इंपोर्ट करूंगा क्योंकि मुझे ग्राफ बनाने की जरूरत पड़ेगी तो मैट पॉलिप डॉट यहां पर मैं पवा प्लॉट और एलियास ऑफ पीएटी का इस्तेमाल करूंगा उसके बाद मैं यहां पे इंपोर्ट कर रहा हूं मुझे एडवांस ग्राफ बनाने की जरूरत पड़ेगी तो मैं यहां पे इंपोर्ट करूंगा करूंगा किसे सीब को एलियाज ऑफ एसएस को चलिए ये तीनों चीजें मैंने लोड कर दिया है उसके बाद मैं अपने टा सेट को लोड करता हूं पडी डरी सीएसवी की हेल्प से मैं अपने डेटा सेट को लोड कर रहा हूं अब मुझे डटा सेट का एड्रेस चाहिए तो ये रहा हमारा सोशल media.net एड्स के नाम से इसके ऊपर मैं राइट क्लिक करूंगा और यहां पे मुझे कॉपी एज पाथ दिखेगा मैं इसे कॉपी कर लेता हूं और यहां ले जाके मैं इसे पेस्ट कर लेता हूं बस उसके अगे मुझे आ लगाना है क्योंकि मुझे रॉ स्ट्रिंग बनानी है इसलिए चलिए इसे लोड करते हैं अब देखिए मैं अपने डेटा सेट को लोड करूं और टा सेटड हैड का इस्तेमाल करके इसके तीन डाटा को देखूं तो मुझे इस तरह से दिखता है अब मुझे क्या करना है मुझे सिर्फ एज और यहां पे परचेस के ऊपर ही बात करना है एस्टीमेट सैलरी के ऊपर बात नहीं करनी है तो इसके लिए मैं कर रहा हूं पहले से ही मैं अपने डटा सेट को लूंगा यहां पे डाटा सेट को लेने के बाद में मैं यहां पे क्या कर रहा हूं यहां पे बेसिकली गाइज ड्रॉप का इस्तेमाल कर रहा हूं क्योंकि ये आगे चलते रे लिए प्रॉब्लम करेगा तो इसलिए मैं क्या कर रहा हूं यहां पे ड्रॉप का इस्तेमाल कर रहा हूं और ड्रॉप के अंदर क्या कर रहा हूं यहां पे कॉलम का इस्तेमाल करूंगा और कॉलम के अंदर जाके मैं क्या करूंगा गाइस यहां पे मेरी जो एस्टीमेट सैलरी है इसे पहले से ही हटा दूंगा उसके बाद में गाइज यहां पे क्या करेंगे इन पलेस इक्वल टू मैं ट्रू करने वाला हूं ताकि मेरा जो डाटा है वो रिप्लेस हो जाए तो मैंने इंप्लेस इक्वल टू ट्रू कर दिया है और अब मैं देखें तो मेरे पास एज और परचेस देखने को मिल रहा है एज दिख रहा है और परचेस देखने को मिल रहा है इसके बेसिस पे ही मुझे क्या करना है अपना मॉडल बनाना है मतलब कोई पर्सन अपना एज देगा उस एज के बेसिस पे मुझे ये बताना है कि उसने वो सोशल मीडिया नेटवर्क्स परचेस किया है या नहीं किया है बेसिक सिंपल एग्जांपल है चलिए जरा से बनाते हैं लेकिन इससे पहले हम यहां पे इसे ग्राफ बना लेते हैं कि क्या ये आपके पास यहां पे लॉजिस्टिक रिग्रेशन के लिए एप्लीकेबल है या या नहीं है तो चलिए जरा इसे देखते हैं तो इसके लिए मैं क्या कर रहा हूं एनए डॉट यहां पर स्केटर प्लॉट बनाऊंगा यस स्केटर प्लॉट बनाने के बाद में मैं यहां पर क्या करूंगा एक्स एक्सेस के अंदर ए दे दूंगा और वा एक्सेस के अंदर गाइस यहां पर मैं परचेस को डाल देता हूं तो वा एक्सेस के अंदर मैंने क्या किया मैंने परचेस को डाला और डेटा इक्वल्स टू मैंने यहां पे डेटा सेट डाल दिया उसके बाद में गाइज यहां पे बात करें तो पीएटी डॉट मैंने यहां पे शो फंक्शन को कॉल किया है और रन करते हैं यहां पे बिल्कुल हमारा जो डाटा है वो आपके पास लॉजिस्टिक डिग्रेशन को फॉलो बढ़ता है हमारा डाटा यस और नो के अंदर आ रहा है और अलग-अलग एज के बेसिस पे किसी पर्सन ने वह सोशल मीडिया नेटवर्क परचेज किया है या नहीं किया है वो भी हमें यहां पे देखने को मिल रहा है अच्छा एक काम करते हैं इस ग्राफ को थोड़ा सा छोटा करते हैं तो उसके लिए पीएटी डॉट यहां पे क्या इस्तेमाल करते हैं फिगर का इस्तेमाल करते हैं और फिगर के अंदर मैं इस्तेमाल करूंगा फिक्स साइज़ का और फिक्स साइज़ के अंदर 5 * 4 का यहां पे साइज़ का एक ग्राफ बना लेता हूं बहुत छोटा सा राइट अ थोड़ा और छोटा करते हैं 4 * 3 के आसपास का ग्राफ बना लेते हैं यस काफी छोटा ग्राफ है और हमें बन चुका है अब हमें क्या करना है गाइस यहां पे हमें इसके अंदर लॉजिस्टिक रिग्रेशन को अप्लाई करना है और उसके ऊपर वर्क करना है लेकिन लॉजिस्टिक रिग्रेशन को अप्लाई करने से पहले हम क्या करेंगे इसके इस डाटा को आपके पास डिपेंडेंट और इंडिपेंडेंट वेरिएबल में अलग-अलग करेंगे मतलब इनपुट और आउटपुट के अंदर अलग-अलग करेंगे और ट्रेन और टस्ट के अंदर स्प्लिटिंग करेंगे चलिए जरा ऐसे करते हैं तो देखिए मैं x एक्सेस के अंदर ले रहा हूं यहां पे और डटा ले रहा हूं यहां पे और मुझे पता है कि डेटा हमारा टू डायमेंशन होना चाहिए तो मैंने इसके अंदर क्या कर रखा है पहले से ही मैंने इसे टू डायमेंशन डेटा सेट बना रखा है डबल स्क्वायर ब्रैकेट से इसके साथ अपना डेटा सेट लेता हूं इसके अर क्या करता हूं गाइज यहां पे मैं परचेज को ले देता हूं अब मुझे क्या करना है इस ग्राफ इस डेटा सेट को ट्रेन और टेस्ट के अंदर स्प्लिटिंग करना है तो मैं फ्रॉम साइकिल लाइन के अंदर चलूंगा डॉट मैं चलूंगा मॉडल सिलेक्शन के अंदर तो मैं मॉडल सिलेक्शन के अंदर आ चुका हूं इंपोर्ट करने वाले हैं हम इसे किसे हम इंपोर्ट करेंगे ट्रेन और टेस्ट स्प्लिटिंग को तो मैं ट्रेन टस्ट स्प्लिटिंग को लेने वाला हूं उसके बाद में मैं यहां पे चार यहां पे वेरिएबल बनाऊंगा x अंड मैं यहां पे ट्रेन का बनाऊंगा यहां पे उसके बाद x मैं यहां पे टेस्ट बनाऊंगा उसके बाद y अंडर मैं यहां पे ट्रेन बनाने वाला हूं उसके बाद y अंड मैं यहां पे टेस्ट बनाने वाला हूं राइट और उसके बाद हम ट्रेन और टेस्ट को स्प्लिटिंग करेंगे x वाला डाटा देंगे y वाला डटा देंगे उसके बाद हम यहां पे टेस्ट साइज को देने वाले हैं टेस्ट साइज 0.22 लेने वाले हैं रैंडम स्टेट की वैल्यू मैं 42 लेने वाला हूं राइट एक आइडियल वैल्यू है आप चाहे तो इसे चेंज करके अपने मॉडल को और ज्यादा इंप्रूव कर सकते हैं तो फिलहाल अभी मैं ये लेने वाला हूं उसके बाद मेरी बारी है यहां पे लॉजिस्टिक रिग्रेशन की कैसे इस्तेमाल करेंगे तो मैं फ्रॉम साइकल एन के अंदर चलूंगा और लीनियर मॉडल के अंदर चलूंगा लीनियर मॉडल में अंदर जाने के बाद में मुझे यहां पे मिलेगा मेरा लॉजिस्टिक रिग्रेशन सबसे नीचे नीचे मैं उसे एप्लीकेबल करूंगा और लॉजिस्टिक रिग्रेशन के लिए मैं यहां पे एलआर के नाम से एक ऑब्जेक्ट बना देता हूं यहां पे लॉजिस्टिक रिगेशन के लिए तो मैंने लॉजिस्टिक रिग्रेशन के लिए एलआर के नाम से ऑब्जेक्ट बना लिया है उसके बाद एल आ डॉट मैंने क्या किया है अपने मॉडल को फिट किया है फिट के अंदर मैं यहां पे x ट्रेन y ट्रेन यहां पे दूंगा रन करेंगे मेरा मॉडल फिट हो चुका है अब एडॉट में स्कोर को चेक कर लेता हूं कि कितने परसेंट एक्यूरेसी के साथ हमारा आंसर यह दे रहा है रिटर्न कर रहा है तो उसके लिए मैं यहां पे x अंड टेस्ट कॉमा y टेस्ट लगा के रन करूंगा तो ये मुझे 91 पर यदि परसेंटेज में निकालना है मल्टीप्लाई 100 करूंगा 91 पर एक्यूरेसी के साथ हमें यहां पे ये रिजल्ट निकाल के दे रहा है ट्स अ गुड एक्यूरेसी बहुत ही अच्छी एक्यूरेसी के साथ हमें ये रिजल्ट निकाल के दे रहा है चलिए थोड़ा से थोड़ा प्रेडिक्शन करते हैं यस हम प्रेडिक्शन करते हैं कि किसी पर्टिकुलर एज के ऊपर आपके पास उस पर्सन ने उस सोशल मीडिया ऐड को य उस सोशल मीडिया नेटवर्क्स को परचेस किया या नहीं किया है चलो इससे देखते हैं तो उसके लिए क्या करेंगे गाइज यहां पे एड मैं क्या करूंगा प्रिडिक्ट फंक्शन का इस्तेमाल करूंगा डबल स्क्वायर ब्रैकेट के अंदर मैं अपनी एज दूंगा अब लेट्स सपोज मैं एज डाल देता हूं 40 ईयर ओके तो मैंने डाला यहां पे 40 ईयर एंड रन किया है 40 ईयर पे आ रहा है नो यस उसने परचेज नहीं किया है और यदि आप ऑब्जर्व करेंगे तो 40 ईयर पे नो आपके पास यहां पर है व ईयर पे यस भी है लेकिन एक नो आपके पास आया है तो बेसिकली गाइज यहां पे हम ये देखेंगे कि यहां पे वो लाइन कैसे बनी है यस यहां पे वो प्रेडिक्शन लाइन कैसे बनी है वो अब यहां पर देख लेते हैं तो देखिए एगजैक्टली प्रेडिक्शन लाइन तो यहां पर नहीं नजर आने वाली है लेकिन मैं आपको थोड़ा बहुत आईडिया देने वाला हूं पक्ल लाइन का तो इसके लिए हम क्या करेंगे इस ग्राफ को दोबारा एक बार वापस कॉपी कर लेंगे यहां पे राइट इस ग्राफ को दोबारा कॉपी कर लेते हैं और उसके बाद में अब क्या करते हैं गाइस यहां पे एसएनएस डॉट यहां पर मैं इस्तेमाल करूंगा लाइन प्लॉट का यस एस डॉट मैं लाइन प्लॉट का इस्तेमाल करूंगा एक्स एक्सेस के अंदर की बात करें तो एक्स एक्सिस के अंदर मैं वापस यहां पर एज देने वाला हूं यस और y एक्सिस में बात करें तो y एक्सिस के अंदर हमारा प्रिडिक्ट आएगा अब y एक्सिस में प्रिडिक्ट कैसे आएगा तो मैं यहां पे एल आड प्रिडिक्ट का इस्तेमाल करूंगा यस एड प्रोडक्ट का इस्तेमाल करूंगा इस प्रिडिक्ट के अंदर मैं अपना x वाला जो डाटा है वो दे दूंगा अब x वाला डाटा कहां है तो ये देखिए मेरे पास यहां पे x x डाटा सेट ये मैंने बनाया है यहां पे ये मैं यहां पे डालने वाला हूं राइट अब ये मेरा जो डाटा है कहां से आ रहा है वो मुझे बताना पड़ेगा तो मैं डाटा इक्वल्स टू क्या करने वाला हूं डेटा सेट यहां पे देने वाला हूं और रन करते हैं यहां पे तो एक प्रेडिक्शन लाइन मेरे पास बन रही है हालांकि ये परफेक्टली आपके पास वो ऐसे कर्वेचर में नहीं बन रही है लेकिन हां एक जड शेप की लाइन बन रही है अच्छा इसको थोड़ा सा यहां पे कलर देते हैं यहां पे तो मैं यहां पे कलर देने वाला हूं कलर इक्वल्स टू रेड कलर डाल देता हूं प्रेडिक्शन लाइन का और फिर रन करते हैं राइट चलिए तो एक आपके पास यहां पे एक प्रेडिक्शन लाइन जरूर बन के दिखाई दे रही है हालांकि ये z शेप के अंदर दिखाई दे रही है लेकिन ये होती है एस शेप के अंदर है लेकिन ये इतना परफेक्टली नहीं बना पा रहा है लेकिन हां एगजैक्टली हमारे पास वो लाइन जरूर बना पा रहा है यदि आप ये लाइन नहीं बना के यदि आप यहीं पे आप स्केटर प्लॉट को बनाते हैं तो वो आपके पास एक परफेक्टली आपको बस बना के दे देगा यस अ स्केट प्लॉट बनाते हैं यहां पे तो यस ये आप पास यहां पे डॉट डॉट आपको दिखाई देगा लेकिन यहां पे लाइन आपके पास सही रहेगी क्योंकि आप प्रोडक्शन लाइन बनाना चाहते हैं तो उसके लिए आप लाइन का ही इस्तेमाल करें तो यदि आप लाइन प्लॉट बनाते हैं तो ये लाइन प्लॉट कुछ इस तरह से आपको देखने को मिलेगा इस ग्राफ को थोड़ा सा बड़ा कर देते हैं ताकि हम एनालिसिस अच्छे से कर सकें तो देखिए मैं जैसे ही रन करूंगा यहां पे तो ये मेरे ग्राफ की लाइन यहां पे आ चुकी है अब जैसा कि मैंने यहां पे पूछा था कि 40 ईयर की एज के ऊपर उसने वो सोशल मीडिया नेटवर्क परचेस किया या नहीं किया तो ये लाइन हमें प्रेडिक्शन क्या करके दे रही है नो करके दे रही है जीरो और ये चीज आप यहां पे ऑब्जर्व भी कर रहे हैं कि यहां आपका जो आंसर है वो जीरो मिल रहा है तो इस तरह से आप यहां पर क्या कर सकते हैं गाइस यहां पे यदि आपके पास आपका जो एनालिसिस है बाइनरी क्लास एनालिसिस है यहां पे यस बाइनरी क्लास एनालिसिस का मतलब है ये आपका ट्रू एंड फाल्स के अंदर मिल रहा है और सिंगल इनपुट्स के बेसिस प आप प्रेडिक्शन कर रहे हैं तो आप कुछ इस तरह से प्रेडिक्शन मॉडल बना सकते हैं और यहां पर आपका ये प्रेडिक्शन मॉडल प्रिडिक्ट फंक्शन के थ्रू बन चुका है आप इसका इस्तेमाल करते हुए आप क्लास एनालिसिस को वर्किंग कर सकते हैं और आज के इस वीडियो के जरिए हम यहां पर डिस्कस करने वाले हैं कि मल्टीपल इनपुट्स यदि हमारे सिस्टम में आ जाए तो उसके बेसिस पे बाइनरी क्लास क्लासिफिकेशन एनालिसिस को कैसे किया जाता है मतलब किस तरह से यहां पर प्रेडिक्शन किया जाता है उसको हम यहां पर देखने वाले हैं तो चलिए जरा इसे समझते हैं यहां पे मेरे पास एक डाटा सेट है जिसे मैं आपको सबको दिखाना चाहूंगा दैट अ प्लेसमेंट सीएवी अब ये प्लेसमेंट सीएसवी क्या है किसी भी पर्सन का सीजीपीए और स्कोर अब सीजीपीए क्या होता है अपने कॉलेज के अंदर बहुत सारे एग्जाम देते हैं राइट तो उस कॉलेज के एग्जाम के अंदर आपके जो फाइनल आपका रिजल्ट आता है उसे हम सीजीपी बोलते हैं तो वो सीजीपी होता है और स्कोर का मतलब यहां पर बेसिकली ये है कि आप उसके लिए कोई एक एग्जाम दे रहे हैं मतलब किसी प्लेसमेंट सेल्स के अंदर बैठने के लिए आप प्लेसमेंट का एग्जाम दे रहे हैं उस एग्जाम के अंदर आपका क्या स्कोर आया वो यहां पे दे रखा है उसके बेसिस पे किसी पर्सन का प्लेसमेंट हुआ या नहीं हुआ है उसके बेसिस पे यहां पे क्लासिफाई कर रखा है मतलब यहां पे एक डाटा सेट दे रखा है जिसके अंदर आपका सीजीपीए के और स्कोर के बेसिस पे उस बंदे का प्लेसमेंट हुआ है या नहीं हुआ है ऐसा कुछ हमें डाटा सेट दे रखा है अब हमें क्या प्रेडिक्शन करना है यदि हमें यहां पे कोई नए स्टूडेंट का सीजीपीए दे दी जाए और उसके साथ-साथ उसका स्कोर दिया जाए एग्जाम के अंदर का राइट तो उसका प्लेसमेंट होगा या नहीं होगा यह हमें इस डेटा सेट के थ्रू प्रेडिक्शन करना है तो आई थिंक आई होप सो समझ में आ गया होगा कि आज का हमारा लॉजिक क्या होने वाला है अब यहां पे आप इनपुट को देखेंगे तो दो हमारे इनपुट बनने वाले हैं सीजीपीए और स्कोर दो हमारे इनपुट है यहां पे और हमें क्या प्रिडिक्ट करना है हमें प्लेसमेंट को प्रिडिक्ट करना है मतलब उसका प्लेसमेंट होगा या नहीं होगा हमें यह प्रेडिक्शन देना है तो चलिए जरा इसे करते हैं तो उसके लिए ले चलता हूं मैं आपको जुपिटर नोटबुक के ऊपर जहां पे हम ये वर्क करने वाले हैं अब हम आ गए जुपिटर नोटबुक के अंदर सबसे पहले हम यहां पे जो रिक्वायर्ड लाइब्रेरी है उसे इंपोर्ट करेंगे तो मैं यहां पे इंपोर्ट करने वाला हूं किसे यहां पे पांडा एलियाज ऑफ पीडी को इसके साथ-साथ मैं यहां पे इंपोर्ट करूंगा किसे सी बन को करूंगा क्योंकि मुझे ग्राफ बनाना पड़ेगा तो सी बन एलियाज ऑफ यहां पे एसएनएस लेंगे इसके साथ-साथ मैं यहां पे इंपोर्ट करूंगा किसे मैट पलि डॉट यहां पर पवा प्लॉट को राइट एंड एलियास बनाएंगे पीएटी को राइट तो ये मैंने तीन लाइब्रेरी जो मेरी रिक्वायरमेंट है उसको मैंने इंपोर्ट किया उसके बाद हम हमारे डेटा सेट को लोड करते हैं तो डेटा सेट को मैंने लोड किया है डेटा सेट के अंदर और इसके लिए मैंने पडी डरी सीएवी का इस्तेमाल किया है जिसके अंदर हमारे पास क्या है प्लेसमेंट के नाम से है यहां पे तो प्लेमें सीएवी को से लोड कर दिया आप चाहे तो इसे डायरेक्टली कर सकते हैं और आप चाहें तो इसके ऊपर राइट क्लिक करके कॉपी एज अ पाथ भी ले सकते हैं तो मैं राइट क्लिक करके कॉपी एज अ पाथ लेने वाला हूं यहां पे क्योंकि यहां पे मे जो डेटा सेट है और वो मेरी जो सीएसपी फाइल है वो कहीं और भी हो सकती है तो इसके लिए हम ये इस्तेमाल कर रहे हैं एंड आ डालेंगे रॉ स्टिंग बनाने के लिए उसके बाद हम क्या करने वाले हैं गाइज यहां पे हम हमारा डाटा सेट लेंगे और डॉट हैड लगाते हुए इसके अंदर तीन डाटा को हम यहां पर देखने वाले हैं राइट अब हमारे पास सीजी पे है स्कोर है और प्लेसमेंट हमारे पास है राइट अब हम क्या करना है बेसिकली गाइ यहां पे ग्राफ बना के देखना पड़ेगा कि ये किस तरह से सेपरेबल है क्या ये लीनियर सेपरेबल है या नहीं है यदि ये लीनियर सेपरेबल है तो हम इसके ऊपर फर्द आगे वर्किंग करने वाले हैं यदि ये लिनियली सेपरेबल नहीं है तो हम इसे यहीं पे रोक देंगे और इसके ऊपर कोई और दूसरी एनालिसिस को इस्तेमाल करेंगे तो इसको कैसे पता करेंगे हम सी बन के थ्रू ग्राफ बनाएंगे और ग्राफ के थ्रू हम पता करने वाले हैं चलिए ग्राफ बनाते हैं तो मैंने एनए डॉट यहां पर क्या किया है स्केटर प्लॉट बनाया है यहां पे एक्स एक्सिस के अंदर मैंने क्या लिया है गाइस यहां पे सीजीपीए को ले लिया है एंड यहां पर मैं वा एक्सेस की बात करें तो वा एक्सेस के अंदर मैंने क्या किया है गाइस यहां पे स्कोर को ले लिया है इसके साथ-साथ यहां पर मैं बात करूं तो मेरा जो डाटा है वो डेटा सेट है यहां पे तो मैंने डेटा सेट ले लिया उसके बाद ग्राफ को देखने के लिए मैंने पीएटी ड शो फंक्शन का इस्तेमाल किया है और रन करते हैं तो हमारा ग्राफ यहां पे बन चुका है जहां पे स्कोर और सीजीपीए के बेसिस पे हमारा ग्राफ आ चुका है अब ये ग्राफ काफी बड़ा है तो पहले इस ग्राफ को थोड़ा सा छोटा कर देते हैं छोटा करने के लिए पीएटी डॉट मैं यहां पे क्या इस्तेमाल करूंगा फिगर का इस्तेमाल करूंगा ंगा और फिगर के अंदर मैं फिक्स साइज का इस्तेमाल करने वाला हूं जिसके अंदर ये जो ग्राफ है 54 का बनाने वाला हूं छोटा सा एक ग्राफ बनाऊंगा अब मुझे यहां पे ये पता करना है कि क्या ये लीनियर सेपरेबल है या नहीं है तो यदि लीनियर सेपरेबल है या नहीं है इसको पता करने के लिए मैं क्या करने वाला हूं गाइस यहां पे तो इसके अंदर एक ह्यू पैरामीटर होता है जिसके थ्रू आपके डाटा को क्लासिफाई किया जा सकता है तो मैं यहां पे क्या कर रहा हूं एक ह्यू आपके पास पैरामीटर दूंगा ह्यू के अंदर मैं क्या करने वाला हूं गाइस यहां पे ये प्लेड कोड डाल दूंगा एंड रन करूंगा देखिए मेरा जो ग्राफ है वो यरली सेपरेबल मुझे यहां पे दिखाई दे रहा है देखिए एक तरफ हमारे पास क्या है ब्लू कलर का है जोकि नॉन प्लेसमेंट है यहां पे और एक तरफ है हमारे पास यहां पे ऑरेंज कलर के जो कि एक प्लेसमेंट को रिप्रेजेंट कर रहे हैं राइट तो इस तरह से हमारा जो ग्राफ है वो यहां पे आ चुका है अच्छा एक काम करते हैं ये जो आप देख पा रहे हैं आपका लीजेंड वो आपके पास यहां पे गलत जगह पर आ रहा है तो इस लेजेंड को भी थोड़ा सा ही कर देते हैं तो पीएटी डॉट मैं यहां पे क्या करूंगा लेजेंड का इस्तेमाल करूंगा लीजेंड के अंदर लोकेशन का इस्तेमाल कर रहा हूं और लोकेशन को वन रख के इसे एंटर करूंगा तो ये अपनी सही जगह पे पहुंच चुका है चलिए अब यहां पे आप आराम से देख पाएंगे कि आपका पा जो ग्राफ है वो लीनियर सेपरेबल है क्यों क्योंकि मैं यहां पे एक बीच में लाइन बना सकता हूं इस तरह से एक बीन में लाइन बना सकता हूं जो कि ऑरेंज कलर के डाटा को और जो ब्लू कलर के डाटा को है अपने आप डिफरेंशिएबल तौर पे इसे डिफरेंशिएबल स्कोर आता है तो उसके बेसिस पे क्या रहने वाला है मतलब बेसिकली गाइज वो आपका प्लेसमेंट होगा या नहीं होगा हम ये प्रिडिक करेंगे तो चलिए जरा इसको करते हैं इससे पहले में हम क्या करेंगे हम हमारे जो डाटा सेट है उसको हम क्या करेंगे हमारे पास डिपेंडेंट और इंडिपेंडेंट वेरिएबल में अलग-अलग करेंगे मतलब इनपुट और आउटपुट के अंदर अलग-अलग करने वाला है तो इसके लिए मैं x एक्सेस लूंगा यहां पे जिसके अंदर मैं अपना डटा सेट लूंगा डॉट यहां पे मैं आ लॉग का इस्तेमाल करने वाला हूं यहां पे सारी रो को लेने वाला हूं और कॉलम के अंदर -1 के थ्रू पीछे वाला चीज को छोड़ दूंगा यदि मैं x के अंदर देखूं तो देखिए मुझे मेरा सीजीपी और स्कोर मुझे दिखाई देगा इसके साथ-साथ x का डायमेंशन भी आप चेक कर लीजिए एंडम के थ्रू तो मैंने एंडम लगा के रन किया तो ये मेरे जो टू डायमेंशन दिखाई दे रहा है अब मैं बात करूंगा मेरा वाय एक्सेस का तो y एक्सेस के अंदर मैं फिर से डटा सेट के अंदर जाऊंगा और यहां पे जाके यस जो मेरा प्लेड है उसे मैं कॉल कर दूंगा चलिए मेरा x और y आ गया उसके बाद में हम इसे ट्रेन टस के अंदर स्प्लिटिंग कर देते हैं तो फ्रॉम साइकन का इस्तेमाल करेंगे डॉट यहां पर मैं क्या इस्तेमाल करने वाला हूं मॉडल सिलेक्शन का इस्तेमाल करने वाला हूं मॉडल सिलेक्शन के अंदर इस्तेमाल करने के बाद में मैं इंपोर्ट करूंगा यहां पे किसे इंपोर्ट करूंगा मैं ट्रेन और टेस्ट स्प्लिटिंग को जिसके थ्रू हमारे डाटा को स्प्लिटिंग किया जाएगा अब यहां पे मैं x अंड यहां पे लूंगा ट्रेन का देन मैं x अंडर यहां पे लूंगा टेस्ट को मैं यहां पे लूंगा y ट्रेन को एंड y टेस्ट को राइट उसके बाद हम हमारे ट्रेन टेस्ट पलट को कॉल करेंगे x और y का डाटा यहां पे देंगे हम यहां पे देंगे टेस्टिंग साइज और टेस्टिंग साइज देंगे 20 पर उसके बाद हम इस्तेमाल करेंगे रैंडम स्टेट का दैट इज़ अ 42 रन करेंगे हमारा मॉडल स्प्लिटिंग हो चुका है अब बारी है हमारे मॉडल को बनाने की तो मैं यहां पे फ्रॉम साइकल एन के जाऊंगा और मैं यहां पे लीनियर मॉर्डर में जाऊंगा इंपोर्ट करूंगा किसे लॉजिस्टिक रिग्रेशन को तो मैं यहां पे इंपोर्ट कर रहा हूं लॉजिस्टिक रिग्रेशन को चलिए अब यहां पे एलआर के नाम से यहां पे वेरिएबल बना लेते हैं और लॉजिस्टिक रिग्रेशन को कॉल कर देते हैं उसके बाद एलआर डॉट यहां पे मैं क्या करता हूं गाइज यहां पे मॉडल को फिट करता हूं फिट मैंने लिया है यहां पे और फिट के अंदर मैंने यहां पे क्या दे दिया है x ट्रेन कॉमा y ट्रेन दे दिया है ये हमारा मॉडल फिट हो चुका है अब हम देख लेते हैं स्कोर कितना रहा है मतलब एक्यूरेसी कितनी अच्छी एक्यूरेसी के साथ काम कर रहा है यहां पे तो एल डॉट में यहां पे क्या कर रहा हूं यहां पे गाइज स्कोर देख रहा हूं स्कोर के अंदर मैं x टेस्ट कॉमा y टेस्ट डाल के रन करूंगा तो ये मेरे पास 100% एक्यूरेसी के साथ वर्क कर रहा है दैट इज अ नाइस 100% एक्यूरेसी कभी नहीं मिलती है लेकिन यहां पे हमारे मॉडल के अंदर 100% एक्यूरेसी मिली है मतलब ये बहुत ही एक्यूरेट के साथ काम कर रहा है चलिए इसे जरा चेक कर लेते हैं कि क्या ये वाकई में अच्छी एक्यूरेसी के साथ काम कर रहा है तो मैं अर् डॉट यहां पे क्या कर रहा हूं प्रिडिक्ट फंक्शन को कॉल करूंगा यस मैंने अर् डॉट पेडिक फंक्शन को कॉल किया है और टू डायमेंशन डाटा सेट के अंदर मुझे क्या देना है अपना यहां पे आपका एक सीजी पे देना है स्कोर देना है इसके बेसिस पे हमें चेक करना है कि क्ला प्लेसमेंट हुआ है या नहीं हुआ है तो मैं यही सीजीपीए और यही स्कोर यहां पे दे देता हूं राइट यही सीजीपीए और यही स्कोर मैं क्या करता हूं गाइस यहां पे इसको यहां पे दे देता हूं और चेक करता हूं तो बिल्कुल इसने राइट आंसर निकाल के दिया है 100% इसका प्लेसमेंट हुआ है वन यहां पे इसका आंसर आया है राइट इसका मतलब ये जो मेरा ग्राफ है ये लीनियर सेपरेबल हो चुका है यहां पे और ये अच्छे तरीके से सेपरेबल किया है इसने राइट अब मुझे यहां पे देखना है कि ये क्या ये कितने परसेंट एक्यूरेसी के साथ सेपरेबल किया है किस तरह से सेपरेबल क्या है ये मुझे चेक करना है यस यहां पे मुझे एक डिसीजन बाउंड्रीज बनानी है यस मुझे वो लाइन बनानी है जिसके थ्रू हम देख पाएंगे कि ये किस तरह से सेपरेबल कर रहा है कैसी लाइन बन रही है यहां पे वो मुझे देखना है तो यदि आपको डिसीजन बाउंड्री बनानी है तो इसके लिए आपको एक एक्स्ट्रा मॉड्यूल की जरूरत पड़ेगी दैट इज अ एमएल एक्सटेंड मॉड्यूल इसके लिए आप क्या करें पहले आप google2 जिसके थ्रू आप अपने सिस्टम के अंदर इसे इंस्टॉल कर सकते हैं कॉपी कीजिएगा नीचे सर्च ऑप्शन में जाइएगा कमांड प्रोम को रन कीजिएगा कमांड प्रोम सीएमडी लिख के कमांड प्रोम को रन कीजिएगा और यहां पे जाके एमएल एक्शन को इंपोर्ट कर दीजिएगा फिलहाल ये मेरे सिस्टम के अंदर इंस्टॉल है इसलिए रिक्वायरमेंट ऑलरेडी सेटिस्फाई दिखा जा रहा है यदि आपके सिस्टम में इंस्टॉल नहीं होगा तो आपके पास यहां पर इंस्टॉल हो जाएगा उसके बाद में अब हम क्या करेंगे हमें वो डिसीजन बाउंडी बनानी है कि ये किस तरह से सेपरेबल कर रहा है अपने डाटा को वो हमें देखना है तो इसके लिए मैं क्या करने वाला हूं गाइस यहां पे यहां पे फ्रॉम एल एक्सट का इस्तेमाल करूंगा य mx1 के अंदर जाके मैं किस पे जाऊंगा यहां पे प्लॉटिंग पे जाऊंगा प्लॉटिंग के अंदर जाने के बाद में मुझे क्या करना है गाइस यहां पे प्लॉट डिसीजन रीजन करना है तो मैंने प्लॉट डिसीजन रीजन को इंपोर्ट कर दिया राइट उसके बाद में मैं क्या करना है गाइज यहां पे मैं यहां पे इस्तेमाल करूंगा प्लॉट डिसीजन रीजन का प्लॉट डिसीजन रीजन आपसे क्या-क्या मांगता है सबसे पहले x इनपुट मांगता है फिर आपका y आउटपुट मांगता है फिर आपका सीएलएफ मांगता है सीएलएफ का मतलब है आपका मॉडल मांगता है कि आपका कौन सा मॉडल है लेकिन एक चीज का स्पेशली ध्यान रखिएगा यहां पे कि जो भी आपका इनपुट होगा और जो भी आपका आउटपुट होगा वो आपके पास क्या होगा एरे लाइक शेप में होगा एरे मतलब आपके पास बेसिकली गाइज बात करें हैं एक नं पाय एरे बनना चाहिए आपका जो वा आउटपुट है वो भी नपाई आरे बनना चाहिए और सीएलएफ का मतलब है आपका क्लासिफाई क्लासिफाइज यहां पे जो आपने लीनियर रिग्रेशन को इस्तेमाल किया है वो आपको देना पड़ेगा चलिए इसे देखते हैं और डिसीजन रीजन बनाते हैं यहां पे तो देखिए हमारे पास जो x है वो मैं x दूंगा यहां पे मुझे नं पाई एरे में बनाना है तो मैं यहां पे क्या करूंगा टू एरे के अंदर कन्वर्ट करूंगा यस या फिर आप यहां पे टू नं पाई का भी इस्तेमाल कर सकते हैं तो मैंने ट नपाई का इस्तेमाल किया जिसके थ्रू हमारा यह नपाई में कन्वर्ट हो चुका है y की बात करें तो y के अंदर भी जाएंगे और यहां पे 2 नपाई का इस्तेमाल करते हुए इसे भी नपाई में बदल देंगे उसके बाद है हमारी सीएलएफ की बारी सीएलएफ मतलब हमारे मॉडल की बारी मॉडल का नाम हमने एलआर दिया है हमने एलआर रख रखा है प्लॉट को शो करने के लिए मैं पटी श फंक्शन का इस्तेमाल करूंगा और इसे मैं रन करता हूं तो यह मुझे ग्राफ बना के देगा कि यह किस तरह से डिसीजन रीज़न बना रहा है तो आप देख पाएंगे एक लाइन हमारे पास बनके आई है जो कि हमारे डाटा को सेपरेबल कर रही है आप देखेंगे कि जो ब्लू कलर के डॉट्स है या फिर ब्लू कलर के जो भी आपके पास ऑप्शन आपके जीरो है वो अलग दिख रहे हैं और जो यहां पे ट्रायंगल बने हुए हैं यहां पे आप देख पा रहे हैं ऑरेंज कलर के वो अलग दिख रहे हैं और एक लाइन जो है वो हमारे पास हमारे डाटा को क्या कर रही है लीनियर सेपरेबल कर रही है राइट हम जो एल्गोरिथम यहां पे इस्तेमाल कर रहे हैं वो एल्गोरिथम क्या इस्तेमाल हो रही है गाइज यहां पे तो वो एल्गोरिथम है y = आपके पास 1 / 1 + e टू द पावर - x इस्तेमाल हो रही है अब यहां पे जो x बना हुआ है ये x क्या हुआ होगा गाइज यहां पे तो ये x हुआ होगा यहां पे मैं बात करूं तो y हैट आया होगा और वा हैट क्या आया होगा गाइज यहां पे m1 x1 प्लस यहां पे m2 x2 हमारे पास दो इनपुट है तो m1 m1 x1 m2 x2 प्लस यहां पे एक बायस आया होगा तो हमें यहां पे कांस्टेंट एंड कफिट दोनों की वैल्यू यहां पे मिलने वाली है चलिए जरा इसे देख लेते हैं कि क्या ये हमें कांस्टेंट कफिट की वैल्यू देता है तो बिल्कुल ये आपको कांस्टेंट कफिट की वैल्यू देगा कैसे l डॉट यहां पर यदि आप को को कॉल करेंगे तो ये आपको दो को एफिशिएंट देने वाला है इसके साथ-साथ ए डॉट यदि आप यहां पे इंटरसेप्ट को कॉल करेंगे तो य आपको इंटरसेप्ट भी देगा मतलब ये प्रॉपर्ली एक लाइन इक्वेशन बना के देगा फिर उसे 1 / 1+ e टू पावर x में डाल के आपके पास आपका प्रेडिक्शन आउटपुट बना के दे रहा है जो कि आप यहां पे देख पा रहे हैं वन और जीरो के तौर पे राइट तो इस तरह से हमारा मॉडल काम कर रहा है और इस तरह से ये आपके पास क्या कर रहा है सेपरेबल कर रहा है राइट तो आई थिंक आई होप सो समझ में आ चुका होगा कि जब भी आपके पास मल्टीपल इनपुट्स हैं और मल्टीपल इनपुट्स आपके पा लीनियर सेपरेबल है तो आप लॉजिस्टिक रिग्रेशन कैसे इस्तेमाल कर सकते हैं सीधा है जैसे आप यहां पर सिंगल इनपुट के साथ कर रहे थे उसी तरह से आप मल्टीपल इनपुट के साथ भी काम कर सकते और आज के इस वीडियो के जरिए हम समझने वाले हैं लॉजिस्टिक रिग्रेशन को विद पॉलिनॉमियल फीचर के साथ अब जरा चलिए इसे जरा देखते हैं ये कैसा है देखिए यदि आपको python2 के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपने स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं ये एक डाटा सेट है जिसे मैंने यहां पे खुद बनाया है इस डेटा सेट के अंदर डेटा वन हमारे पास दे रखा है डेटा टू दे रखा है उसके बेसिस पे हमारे पास आउटपुट यहां पे दे रखा है 0 व के तौर पे अब डेटा वन एंड डेटा टू और इसके बेसिस पे हमें आउटपुट प्रिडिक्ट करना है यदि हमें कोई डेटा वन और डेटा टू दे तो उसके बेसिस पे हम क्या आउटपुट आ सकता है वो हमें बताना है ये जो आपके पास डेटा सेट बना हुआ है ये आपके पास पॉलिनो मियल फीचर को फॉलो करता है तो मैं इस वीडियो को दो पार्ट के अंदर रखूंगा पहले पार्ट के अंदर हम विदाउट पॉलीनोट फीचर को इस्तेमाल करते हुए प्रेडिक्शन देखेंगे कि कितने परसेंट एक्यूरेसी आती है और क्या होता है हमारा रिजल्ट फिर हम क्या करेंगे उसके अंदर पॉलिनो मियल फीचर को ऐड करेंगे और उसके बाद देखेंगे कि उसके ऊपर क्या इफेक्ट पड़ता है चलो चलिए जरा ऐसे यहां पर देखते हैं तो चलते हैं हम जुपिटर नोटबुक के अंदर फटाफट और फिर हम हमारे जो रिक्वायर्ड लाइब्रेरी उसे इंपोर्ट करते हैं और उसके बाद में इसके ऊपर फटाफट वर्क करते हैं राइट इस रिक्वायर्ड लाइब्रेरी है उसे यहां पे इंपोर्ट करते हैं और फिर वर्क करते हैं तो मैं यहां पे इंपोर्ट कर रहा हूं सबसे पहले यहां पे पांडा एलियाज ऑफ पीडी को उसके बाद मैं यहां इंपोर्ट कर रहा हूं किसे मैटल लिप को ग्राफ बनाना है मुझे यहां पे तो मै प डॉट मैं यहां पे पवा प्लॉट एलियाज ऑफ यहां पे पी एलडी लूंगा उसके बाद मैं यहां पे इंपोर्ट करने वाला हूं किसे गाइ यहां पर मैं इंपोर्ट करूंगा सी बन को तो सी बन एलियास ऑफ यहां पर मैं एसस लेने वाला हूं चलिए अब हम क्या कर रहे हैं हमारे डेटा सेट को लोड करते हैं तो डेटा सेट को लड करने के लिए डेटा सेट के नाम से एक वेलेबल बनाया पडी डरी सए का इस्तेमाल करूंगा यहां पर जो मेरा डेटा सेट है उसका मैं लोकेशन लेके आऊंगा और विद नेम तो ये रहा मेरा पॉलिनो मियल क्लासि . सीएवी के नाम से मैं इसके ऊपर राइट क्लिक करूंगा और कॉपी ऐसे पाथ में क्लिक कर देता हूं उसके बाद मैं जाके यहां पे पेस्ट कर देता हूं और इसके आगे आर लगा देता हूं फॉर द रस्टिंग चलिए अब हमारे पास जो डेटा सेट है वो आ चुका है डटा सेट डॉट यहां पर हैड लगा के इसके तीन डाटा को देखेंगे तो हमारे पास डाटा आ चुका है अब हमें क्या करना है गाइज यहां पे यहां पे हमें ग्राफ बनाना है तो मैं काम करता हूं सी बन के थ्रू इसका ग्राफ बनाता हूं तो मैं एए डॉट यहां पर मैं स्केटर प्लॉट बनाने वाला हूं राइट गाइ स्केटर प्लॉट के अंदर एक् एक्सिस के अंदर हम क्या देंगे हमारा डाटा वन देने वाले हैं यहां पर मैं y एक्सिस के अंदर यस मैं यहां पे हमारा जो डाटा टू है वो मैं देने वाला हूं यहां पे और जो हमारा डटा आ रहा है वो कहां से आ रहा है डटा सेट से हमारे पास आ रहा है वो दूंगा और डाटा को डिफरेंशिएबल और ह्यू पैरामीटर के अंदर मैं अपना आउटपुट देने वाला हूं तो मैंने यहां पे हमारा आउटपुट दे दिया उसके बाद में गाइस यहां पे इस ग्राफ को देखने के लिए पीएटी ड शो फंक्शन का इस्तेमाल करेंगे ग्राफ को थोड़ा छोटा बनाने के लिए मैं पीएटी डॉट यहां पर मैं फिगर का इस्तेमाल करने वाला हूं फिगर के अंदर जाके मैं अपनी फिक्स साइज है उसे मैं लेने वाला हूं और यहां जाके 54 का मैं ग्राफ बनाऊंगा चलिए ग्राफ को देखेंगे तो ग्राफ यहां पर देख पाएंगे कि ये लीनियर सेपरेबल नहीं है यदि मैं एक लीनियर लाइन के थ्रू सेपरेबल करूं होगा तो ये मिस क्लासिफिकेशन कर जाएगा यहां पे क्योंकि कुछ रेड पॉइंट जो है वो ब्लू के अंदर भी आ चुके हैं और कुछ ऑरेंज पॉइंट जो है वो भी ब्लू के अंदर आ चुका है कुछ ब्लू पॉइंट पे है वो भी ऑरेंज के अंदर आ चुका है तो ये जो डेटा सेट आप देख पा रहे हैं ये सही तरीके से क्लासिफाई नहीं है राइट तो अब हम इसे क्या करेंगे क्लासिफाई करेंगे तो पहला मेथड मैं यहां पे क्या लूंगा गाइज यहां पे सिंपल जो हमारा नॉर्मल मेथड है लॉजिस्टिक रिग्रेशन को अप्लाई करेंगे और फिर उसके थ्रू देखेंगे दूसरे मेथड के थ्रू हम इसके अंदर पॉलीनोट फीचर को डालेंगे और फिर उसके बाद देखने वाले हैं मैं यहां पे क्या करने वाला हूं गाइ यहां पे तो सबसे पहले मैं करूंगा यहां पे इसे ट्रेन टस्ट स्लेडिंग करूंगा इनपुट आउटपुट को अलग-अलग कर लेता हूं फटाफट ये काम कर लेता है तो यहां पे एकस एक्सेस कर लेते हैं और इनपुट आउटपुट का मतलब डिपेंडेंट और इंडिपेंडेंट वेरिएबल को अलग-अलग करते हैं तो मैंने डेटा सेट लिया डॉट मैंने यहां पे आई लॉक का इस्तेमाल किया यहां पे मैं सारे नंबर ऑफ रो ले रहा हूं और सारे कॉलम ले रहा हूं यहां पे सिवाय आपके पास आउटपुट को छोड़ के तो आप x को देख पाएंगे आई लॉक या आई लॉक कर लेना है यहां पे रन करेंगे तो डेटा वन एंड डेटा टू आ चुका है आउटपुट हमारा रह चुका है इसी तरह से y आउटपुट लेना है तो डेटा सेट को लेंगे यहां पे एंड यहां पर मैं हमारे जो आउटपुट है उसको मैं यहां पे लेने वाला हूं चलिए मेरा x और y आ चुका है अब हम क्या करने वाले हैं गाइ यहां पे हम इसे ट्रेन और टस्ट के अंदर स्प्लिटिंग करेंगे तो उसके लिए फ्रॉम साइकल एन के अंदर चलेंगे डॉट मैं मॉडल सिलेक्शन के अंदर चलने वाला हूं गाइ यहां पे मॉडल सिलेक्शन के अंदर जाने के बाद मैं इंपोर्ट करूंगा किसे ट्रेन और टेस्ट स्प्लिट को राइट उसके बाद मैं गाइज यहां पे मैं x यहां पे लूंगा अ ट्रेन को उसके बाद मैं यहां पे x मैं लूंगा टेस्ट को मैं लूंगा y यस y मैं लूंगा ट्रेन को और y मैं यहां पे लेने वाला हूं टेस्ट को उसके बाद हम हमारे ट्र टेस्ट स्लिटिंग को लेंगे जहां पे हम हमारा x का डाटा और y डाटा देंगे और मैं यहां पे टेस्ट साइज जो हमारा है यहां पे ये लूंगा और टेस्ट साइज को कर दूंगा गाइज यहां पे 0.22 और रैंडम स्टेट की वैल्यू को कर देता हूं 42 राइट रैंडम स्टेट की वैल्यू को कर देता हूं 42 चलिए इसे रन करते हैं उसके बाद क्या है गाइस यहां पे हमारे मॉडल को बनाएंगे मॉडल को बनाने के लिए मैं यहां पे फ्रॉम साइकल एन के अंदर चलूंगा डॉट लीनियर मॉडल के अंदर चलूंगा और मैं इंपोर्ट करने वाला हूं किसे गाइस यहां पे आपके पास लॉजिस्टिक रिग्रेशन को उसके बाद गाइस यहां पे एलआर के नाम से एक ऑब्जेक्ट बना लेते हैं और लॉजिस्टिक रिग्रेशन को कॉल कर देते हैं फिर एल डॉट मॉडल को मैं क्या करता हूं गाइ यहां पे फिट करता हूं जहां पे मैं x ट्रेन कॉमा y ट्रेन मैं लेने वाला हूं चलिए उसके बाद मैं एलआर का स्कोर भी देख लेता हूं तो एलआर डॉट मैं यहां पे स्कोर चेक कर रहा हूं स्कोर के अंदर मैं यहां पे x टेस्ट कॉमा y जो टेस्ट है हमारा वो देने वाला हूं दैट अ 90 पर एक्यूरेसी बहुत ही अच्छी एक्यूरेसी आ रही है यहां पे 90 एक्यूरेसी बहुत ही सही एक्यू आ रही है मतलब ये सही तरीके सेपरेबल कर रहा है लेकिन हम इसे और भी अच्छे तरीके से सेपरेबल कर सकते हैं किससे बाय द यूजिंग ऑफ आपके पास पॉलिनॉमियल फीचर से लेकिन फिलहाल अभी क्या करते हैं गाइज यहां पे इसी के ऊपर हमारा मॉडल चेंज चेक करते हैं कि ये किस तरह से सेपरेबल कर रहा है तरह के इसके सेपरेबल को चेक करने के लिए हम यहां पे क्या करेंगे ग्राफ बनाएंगे और ग्राफ किसे थ्रू बनाएंगे एमएल एक्सटेंट के थ्रू बनाने वाले है राइट तो मैं क्या करने वाला हूं गाइज यहां पे फ्रॉम यहां पे इस्तेमाल करूंगा एमएल एक्सटें को राइट एमएल एक्सटें के अंदर जाने के बाद मैं यहां पे इस्तेमाल करूंगा प्लॉटिंग को मैं यहां पे इंपोर्ट करने वाला हू हूं किसे गाइज यहां पे आपके पास प्लॉट डिसीजन आपके पास रीज़न को यस प्लॉट डिसीजन रीजन को इंपोर्ट करेंगे उसके बाद मैं गाइज क्या करेंगे यहां पे प्लॉट डिसीजन रीजन को कॉल करेंगे राइट और यहां पर मेरे पास x एक्सेस का डटा देना है यहां पे तो x एक्सेस का डटा लूंगा लेकिन मुझे इसको नपाई एरे में कन्वर्ट करना पड़ेगा तो नपाई एरे में अंदर कन्वर्ट करने के लिए ट नपाई का इस्तेमाल करने वाले हैं हम यहां पे उसके बाद मुझे वा एक्सेस का डाटा लेना पड़ेगा तो y डॉट यहां पर मैं इस्तेमाल करूंगा नपाई का और यहां पे मुझे देना है सए सीफ मतलब हमारा मॉडल मॉडल हमारा कौन सा है एलआर मॉडल है उसके बाद मैं पीएटी डॉट क्या करने वाला हूं गाइस यहां पे इस ग्राफ को मैं शो करूंगा और रन करूंगा तो देखिए ये हमारे पास क्या कर रहा है लीनियर सेपरेबल कर रहा है लेकिन यहां पे आपके देख पाएंगे तो कुछ मिस क्लासिफिकेशन हो रहा है जैसे कि ये देखिए आपके पास क्या हो रहा है ये ऑरेंज कलर के जो डाटा है वो आपके पास ब्लू के अंदर है और ब्लू कलर का कुछ डाटा ऑरेंज कलर के अंदर है तो ये उस तरह से सही तरीके से क्लासिफाई नहीं कर पा रहा है तो अब हम क्या करेंगे इसे पॉलिनो फीचर देंगे और पॉलिनो फीचर के थ्रू इसे सही क्लासिफाई करेंगे तो पॉलिनो फीचर के लिए क्या कर रहा हूं गाइ यहां पे मैं एक नई और नोटबुक बनाऊंगा जहां पे मैं अपना पॉलिनो फीचर को अप्लाई करूंगा अब क्या करेंगे थोड़ा सा इसे कॉपी पेस्ट कर लेते हैं और मैं इसे क्या कर रहा हूं यहां पे गाइ साइड बाय साइड कर लेता हूं ताकि मैं इसे थोड़ा फटाफट कॉपी पेस्ट कर सकूं और दोनों को आप आराम से कंपैरिजन कर सके सबसे पहले मुझे ये तीन आपके पास रिक्वायर्ड लाइब्रेरी को इंपोर्ट करना है तो मैं इसे इंपोर्ट कर देता हूं उसके बाद में मुझे मैं अपने डेटा सेट को लड करना है तो मैं अपने डेटा सेट को लड कर लेता हूं इस तरफ हम पॉलिनॉमियल फीचर को कर रहे हैं और इस तरफ हमारा सिंपल लॉजिस्टिक रिग्रेशन लगा हुआ है राइट ये दो चीज कर रहे हैं हम यहां पे डेटा सेट को देखेंगे तो डेटा सेट हमारे पास आ चुका है उसके बाद ये ग्राफ भी बना लेते हैं राइट तो मैं ये ग्राफ बना लेता हूं साइड बाय साइड रख के ओके ग्राफ हमारा आ चुका है ग्राफ बनाने के बाद में अब हमारा नेक्स्ट टारगेट क्या होगा गाइज यहां पे हमारे डाटा को इनपुट आउटपुट में अलग-अलग करना तो मैंने अपने डाटा को इनपुट और आउटपुट के अंदर अलग-अलग कर चुका हूं अब यहीं पे हमारा काम होगा पॉलिनो मियल फीचर को लगाना किस तरह से लगाएंगे गाइज यहां पे तो मैं यहां जाऊंगा अब पॉलिनो मियल फीचर को लगाने जा रहा हूं गाइस यहां पे तो पॉलिन फीचर को कैसे लगाऊंगा यहां पर जाऊंगा फ्रॉम साइकल के अंदर जाऊंगा डॉट प्री प्रोसेसिंग में जाने वाला हूं प्री प्रोसेसिंग में जाने के बाद मैं इंपोर्ट करूंगा यहां पे किसे पॉलिनो फीचर को राइट बस यहीं से हमारा काम शुरू होगा मैं यहां पे पीएफ के नाम से एक वेरिएबल बना लेता हूं और पॉलिनो फीचर को मैं यहां पे कॉल कर देता हूं राइट पॉलिनो फीचर के अंदर आपके पास आता है डिग्री डिग्री को फिलहाल मैं यहां पे टू रखता हूं यहां पे और पीए डॉट मॉडल को क्या करता हूं गाइज यहां पे फिट करता हूं फिट के अंदर मैं अपना x दूंगा यहां पे उसके बाद पीएफ डॉट यहां पे हम क्या करेंगे ट्रांसफॉर्म करेंगे और ट्रांसफॉर्म के अंदर हमारा x देंगे और ये हमारा आ चुका है पॉलिनो फीचर का डाटा राइट अब इस पॉलीनोट फीचर के डेटा किस फॉर्म में आए है एरे के फॉर्मेट में आए है मैं वापस इसे डेटा सेट में कन्वर्ट कर लेता हूं डेटा सेट में कन्वर्ट करने के लिए मैक्स का ही वापस दोबारा इस्तेमाल करूंगा पीडी डॉट यहां पर मैं क्या करूंगा डटा फ्रेम का इस्तेमाल करने वाला हूं गाइस यहां पे और मुझे यहां पे क्या देना है कॉलम देना है तो कॉलम्स का इस्तेमाल करूंगा एक् डॉट यहां पर क्या करूंगा कॉलम्स को कॉल कर देता हूं राइट और कॉलम्स को कॉल करने के बाद मैं इसे क्लोज कर देता है अच्छा एक् डॉट यदि आप कॉलम्स लगा रहे हैं तो इस तरह से आपके पास जो कॉलम के नाम है वो आपके पास आ जाएंगे एक्सल आप कॉलम लगाएंगे कॉलम के नाम आपके पास आ जाएंगे राइट वही कर रहा हूं मैं यहां पे और फिर मैं सेे रन कर रहा हूं तो मेरा पॉलीनोट फीचर का जो डेटा सेट है वो तैयार हो जाएगा इसे हम डेटा फ्रेम में कन्वर्ट कर लेते हैं तो डेटा फ्रेम में कन्वर्ट करने के लिए मैं x का इस्तेमाल करूंगा और p डॉट यहां पर मैं डेटा फ्रेम का इस्तेमाल करने वाला हूं और मैं इसे क्या कर रहा हूं क्लोज कर देता हूं और रन कर देता हैं तो ये हमारा डेटा फ्रेम में कन्वर्ट हो चुका है x को देखेंगे तो ये हमारा डाटा फ्रेम में कन्वर्ट हो चुका है आप देख पा रहे हैं यहां पे डटा फ्रेम आ चुका है x के अंदर चलिए अब इसे मैं कैंसिल कर देता हूं अब मैं फिर से साइड बाय साइड चलता हूं और बाकी चीज को जस्ट सेम एज कॉपी पेस्ट करना है हमें यहां पे तो करते हैं तो अभी फिर से मैं कह रहा हूं यहां पे ट्रेन और टस्ट के अंदर स्प्लिटिंग करूंगा तो यहां पर मैं ट्रेन टस्ट स्प्लिटिंग के लिए सेकल ंड मॉडल को कॉल कर देता हूं उसके बाद मुझे ट्रेन र टस के अंदर स्प्लिटिंग करने के लिए ये इस्तेमाल करना पड़ेगा तो मैं ट्रेन ऑ टस के अंदर स्प्लिटिंग करने के लिए इसका इस्तेमाल कर रहा हूं ट्रेन ट स्प्लिटिंग मेथड का ये आ चुका है हमारे पास लॉजिस्टिक रिग्रेशन मुझे फिर से दोबारा लगाना है यहां पे तो मैं लॉजिस्टिक रिग्रेशन फिर से दोबारा लगाता हूं यहां पे उसके बाद मैं लीनियर मॉडल का इस्तेमाल करूंगा गाइ यहां पे तो मैंने लीनियर मॉडल का इस्तेमाल किया है यहां पे फिर से दोबारा यस फिर से मैं अपना स्कोर चेक कर लेता हूं कि स्कोर कितना आया है तो हम स्कोर देखेंगे तो स्कोर हमारा क्या रहा है 90 पर आ रहा है अभी भी स्कोर वही है सेम टू सेम है इतना ज्यादा अच्छे तरीके से स्कोर नहीं आया यहां पे अच्छा प्लॉट डिसीजन रीजन की बात करें तो प्लॉट डिसीजन रीजन हम यहां पे नहीं बना पाएंगे क्योंकि हमारे जो इनपुट फीचर है वो थोड़े बदल चुके हैं यहां पे क्योंकि जब हमने पॉलीनोट फीचर को इस्तेमाल किया था तब हमारे पास x एक्सेस को यदि आप देखेंगे x डॉट यहां पर यदि इसके शेप को देखेंगे तो आप यहां पर शेप को ऑब्जर्व करेंगे कि इसके अंदर सिक्स फीचर हो चुके हैं जबकि पहले आपके पास टू फीचर थे अब सिक्स फीचर हो चुके हैं तो इस वजह से हो रहा है अब ये एक्यूरेसी देखेंगे एक्यूरेसी इतनी अच्छी नहीं हुई है लेकिन हम यहां पे एक काम करते हैं डिग्री थ्री लगा के टन करते हैं तो डिग्री थ्री के साथ हिब से देखेंगे तो डिग्री थ्री के हिसाब से देखेंगे तो हमारी एक्यूरेसी इंप्रूव हो चुकी है इसी तरह से यदि मैं डिग्री फोर के ऊपर चलूं यस मैं डिग्री फोर के ऊपर चलूं यहां पे तो डिग्री फोर के अंदर हम एक्यूरेसी को ऑब्जर्व करेंगे यहां पे तो वेट करते हैं हमारा मॉडल जो है वो ट्रेन हो रहा है डिग्री आपके पास यहां पे फोर के ऊपर और ये ट्रेन होने के बाद में हमें बताएगा कि कितने परसेंट एक्यूरेसी आ रही है यहां पे ओके डिग्री फोर पे यहां पे हमें देखने को मिला कि डिग्री फोर में भी अभी ये 90 पर है राइट 95 है अच्छा डिग्री फाइव और डिग्री सिक्स के ऊपर ट्राई करें यहां पे तो मैं डिग्री सिक्स के ऊपर ट्राई कर रहा हूं यहां पे ओके मैं इसे ट्रेन और टेस्ट के अंदर स्प्लिटिंग कर रहा हूं और डिग्री सिक्स के ऊपर इस मॉडल को ट्रेन करूंगा और डिग्री सिक्स के ऊपर हम हमारे मॉडल को ट्रेन करने के पास एक्यूरेसी चेक करेंगे यहां पे कितने पर एक्यूरेसी आ रही है तो डिग्री सिक्स पे भी 95 पर एक्यूरेसी आ रही है तो डिग्री सिक्स के ऊपर जाने से कोई मतलब नहीं है क्योंकि ये मॉडल को ओवर फिटिंग के ऊपर ले जा रहा है यहां पे तो आप यहां पे डिग्री थी के ऊपर भी चलेंगे ना यहां पे तो डिग्री थ्री के ऊपर भी आपकी एक्यूरेसी काफी हद तक अच्छी आ रही है राइट अ कुछ कैरल आ गई है यहां पे इस एरर को हम थोड़ा सा सॉल्व करेंगे और इस एरर को सॉल्व करने के लिए हम क्या कर रहे हैं करर को थोड़ा सा रीस्टार्ट कर देते हैं यहां पे राइट ब को रीस्टार्ट कर देते हैं और फिर ऊपर दोबारा वापस हमारा जो मॉडल को है उसको ट्रेन कर देंगे यहां पे और जैसे ही मैंने रीस्टार्ट किया यहां पे दोबारा मॉडल को ट्रेन किया हमरे पास 10 इनपुट फीचर आए हैं यहां पे डिग्री थ के ऊपर रन करेंगे और इसे फिर से रन करेंगे इसे फिर से रन करेंगे इसके स्कोर को चेक करेंगे देर इज अ 95 एक्यूरेसी बहुत ही अच्छी एक्यूरेसी के साथ हमें यहां पे रिजल्ट यहां पर दे रहा है राइट गाइज तो इस तरह से हम हमारे मॉडल को यहां पे जब भी हमारे पास मॉडल जो है वो पॉलिनो फीचर के तौर पे आ रहा है यहां पे तो आप क्या कर सकते हैं इस तरह से अपने मॉडल को बिल्ड कर सकते हैं और पॉलिनो मियल फीचर के अंदर आंसर निकाल सकते हैं बस आपको क्या करना है चेक करना है कि आपका जो डाटा है वो आपके पास लीनियर सेपरेबल नहीं है तो पॉलिनो मियल सेपरेबल है तो पॉलिनो मियल फीचर को लगाते हुए काम कर सकते हैं राइट तो आई थिंक आई होप सो समझ में आ चुका होगा कि किस तरह से आप पॉलीमर फीचर के अंदर वर्क कर सकते हैं अब इसके अंदर यदि मैं एल्गोरिथम की बात करूं सेम एज लीनियर एल्गोरिथम ही होगई यहां पे यस कैसे जरा देखिए आपके पास इक्वेशन तो वही रहने वाली है y = 1 / 1 + e ^ - x ही रहने वाली है इस बार x की इक्वेशन थोड़ी चेंज हो जाएगी और x की इक्वेशन जो है यहां पे यस इसका नाम मैं यहां पे y हैड दे देता हूं और ये जो y हैड की इक्वेशन है वो कुछ इस तरह से बन जाएगी आपके पास यहां पे x1 आपके पास m1 आ जाएगा प्लस यहां पे m2 उसके बाद x स् आ जाएगा प्लस आपके पास m3 आपके पास यहां पे x3 आ जाएगा प्लस एंड सो ऑन करते हुए आपके पास b यस ये आपके पास इक्वेशन बन जाएगी और आज के इस वीडियो के जरिए हम बात करने वाले हैं कि लॉजिस्टिक रिग्रेशन के अंदर मल्टी क्लास क्लासिफिकेशन को कैसे इस्तेमाल किया जाता है देखिए जब भी आप लॉजिस्टिक रिग्रेशन को इस्तेमाल करने जा रहे हैं तो उस वक्त आपको पता होगा कि आप सिगमॉड फंक्शन को इस्तेमाल करते हैं और सिगमॉड फंक्शन आपके पास बाइनरी क्लास क्लासिफिकेशन को फॉलो करता है तो अब इस केसेस के अंदर मल्टी क्लास क्लासिफिकेशन को कैसे इस्तेमाल करेंगे तो देखिए यदि आप मल्टीक्लास क्लासिफिकेशन को इस्तेमाल करने जा रहे हैं लॉजिस्टिक फंक्शन के थ्रू तब इस्तेमाल किया जाता है ओवीआरडीबीएफ आप इस्तेमाल कर सकते हैं सॉफ्ट मैट फंक्शन का सॉफ्ट मैट फंक्शन के थ्रू भी आप मल्टी क्लास क्लास सेजन की प्रॉब्लम को सॉल्व कर सकते हैं चलिए जानते हैं ये ओआरडब्ल्यू आपका आउटपुट कन्वर्ट हो जाता है जब आपके पास कैट आएगा तो उस जगह वन आ जाता है बाकी सारे जीरो हो जाते हैं उसी तरह से यहां पे जीरो बाकी सब जगह वन और र जीरो फिर आपका रो फिर रो फिर वन इस तरह से आपके पास जो डाटा है वो कन्वर्ट हो जाता है मतलब आपके पास जो आपका मल्टी क्लास क्लासिफिकेशन है यहां पे वो कन्वर्ट हो जाता है किसके अंदर बाइनरी क्लास क्लासिफिकेशन के अंदर एंड देन उसके बाद आपके पास प्रिडिक्शन होता है और प्रिडिक्शन होके आपके पास आउटपुट आपके तौर पे दिखाई देता है तो बेसिकली गाइज जब भी आपके पास मल्टी क्लास क्लास इस्तेमाल होता है तो आप ओआरडब्ल्यू पिटर नोटबुक के ऊपर इससे पहले मैं आपको थोड़ा डेटा सेट दिखा देता हूं कि डेटा सेट क्या है तो आज जो हम यहां पे डेटा सेट इस्तेमाल करने जा रहे हैं दैट इज आयरस डेटा सेट ये एक आयस फ्लावर का डाटा सेट है जहां पे उस फ्लावर की पैटर्न लेंथ पैटर्न विड्थ सपल वंथ एंड सपल विड्थ के बेसिस पे उस फ्लावर की स्पेसस के बारे में बताया गया है अब इस डेटा सेट को यदि हम ऑब्जर्व करें यहां पे आपको चार इनपुट कॉलम दिख रहे हैं और एक आउटपुट कॉलम दिख रहा है और आउटपुट कॉलम की जो स्पेसेस है इसके अंदर हमारे पास तीन तरीके के स्पेसेस हैं एक है हमारे पास सेटो सा दूसरी है वर्सी कलर और तीसरी है यहां पे वर्जिनिका इन तीन कलर के बेसिस पे हमें यहां पे क्या करना है प्रेडिक्शन करना है अब ये प्रेडिक्शन कैसे होता है तो जरा इसे समझते हैं तो ले चलता हूं मैं आपको जुपिटर नोटबुक केऊ परस जहां पे हम कोडिंग के थ्रू इसके प्रेडिक्शन को समझेंगे ंगे तो इसके लिए आप सबसे पहले क्या करें इंपोर्ट करें पांडा एलियाज ऑफ पीडी को देन सेकंड चीज यहां पे मैं इंपोर्ट करना चाहूंगा मै पलि को तो मैं मैट पलि डॉट यहां पर मैं इस्तेमाल कर रहा हूं किसे पीवा प्लॉट को एंड उसके बाद एलियास ऑफ पीएटी लेंगे ग्राफ बनाने के लिए उसके बाद हम यहां पे इंपोर्ट करने वाले हैं किसे सी बन को इंपोर्ट करने वाले हैं एलियाज ऑफ एसएनएस ले चलिए अब हम क्या कर रहे हैं हमारे डाटा सेट को लोड करते हैं pd3 सए की हेल्प से मैं अपने डटा सेट को लोड करूंगा डटा सेट कहां है यह रहा मेरा आड डटा सेट इसके ऊपर राइट क्लिक करना है और यहां पे कॉपी एज ए पाथ को सेलेक्ट कर लेना है उसके बाद जाके यहां पे पेस्ट कर देंगे और इसके आगे आर लगा देंगे ताकि हमारा ये एड्रेस जो है एक आपके पास रिलेटिव एड्रेस बन जाए उसके बाद ताकि हमारे पास ये जो एड्रेस है ये रिलेटिव एड्रेस बन जाए और ये जो स्ट्रिंग है ये रॉ स्ट्रिंग में बदल जाए उसके बाद हम यहां पे हमारे डेटा सेट को यहां पे देखते हैं डटा सेट को देखने के लिए हैड लगा के इसके तीन डाटा को देखेंगे तो हमारा डेटा सेट आ चुका है अब मैं एक काम करता हूं इस डेटा सेट का ग्राफ बना के देखता हूं कि इस डेटा सेट के अंदर ग्राफ किस तरह से है मतलब इनके बीच में क्या रिलेशन है किस तरह का है यहां पर रिलेशन ये देखते हैं और ये देखते हैं कि मल्टीक्लास क्लासिफिकेशन है या नहीं है इसके लिए हम क्या कर रहे हैं गाइस यहां पे हम हमारे डटा सेट को लेते हैं और यहां पर स्पेसेस को चेक करते हैं स्पेसेस पे जाने के बाद मैं यहां पे यूनिक वैल्यू को चेक करना चाहूंगा ताकि देखूंगा कि यहां पे कितनी तरीके की यूनिक वैल्यू दिख रही है फिलहाल मैंने आपको बता दिया यहां पे कि इसके अंदर तीन तरह की यूनिक वैल्यू है फिर भी हम इसे चेक करेंगे य एन आई य य यूनिक अच्छा यूनिक वैल्यू के थ्रू देखेंगे तो इसके अंदर हमें तीन तरह की वैल्यू दिख रही है पहली है आपकी सेटो सा दूसरी है आपकी वर्सी कलर तीसरी है वर्षिका तो ये तीन आपको यहां पर स्पेसेस देखने को मिल रही है अब नेक्स्ट हम यहां पर ये जानेंगे कि ये तीनों कैसे वर्क करती है मतलब यहां पे ग्राफ बना के देखेंगे कि इनके बीच में क्या रिलेशनशिप है तो उसके लिए एसएनएस डॉट यहां पर मैं इस्तेमाल करूंगा किसका पेयर प्लॉट का मैं इस्तेमाल कर रहा हूं प्लेयर प्लॉट के अंदर मैं इस्तेमाल करूंगा डेटा का और डेटा के अंदर मैं इस्तेमाल करने वाला हूं मेरे डेटा सेट का उसके बाद मैं यहां पर गाइस डेटा के अंदर मैं इस्तेमाल करूंगा डेटा सेट का इसके साथ-साथ मैं अपना ह्यू पैरामीटर देने वाला हूं यहां पे और ह्यू पैरामीटर के अंदर मैं यहां पे दूंगा हमारी स्पेसेस को राइट तो मैं यहां पे इस्तेमाल करने वाला हूं य पैरामीटर य पैरामीटर में डाटा के अंदर जाएंगे और यहां पर हम देंगे हमारी स्पेसेस को चलिए ग्राफ को शो करने के लिए मैं पीएटी ड शो फंक्शन का इस्तेमाल करता हूं और ग्राफ को रन करते हैं चलिए जरा ग्राफ बनाते हैं ग्राफ बनाने के लिए मैं एएस्पायर प्लॉट का इस्तेमाल कर रहा हूं तो मैं यहां पे लूंगा पेयर प्लॉट को पेयर प्लॉट के अंदर मैं डाटा लूंगा हमारे पास यहां पे और डटा इक्वल्स टू मैं डेटा सेट को इस्तेमाल कर रहा हूं उसके बाद में गाइज यहां पर बात कर रहे हैं कि अगला चीज क्या होगा तो इस ग्राफ को शो करने के लिए मैं पीएटी डॉट यहां पर शो फंक्शन को कॉल करने आला हूं जैसे ही हम रन करेंगे मेरे जो ग्राफ है वो बन के आ जाएगा यहां पे देखिए ये मेरा ग्राफ बन के आ चुका है और ये हमें बता रहा है कि किस तरह के एपीसेस के अंदर कितना क्या रिलेशन है यहां पे अब देखिए यहां पर हम क्या निकालना चाह रहे हैं हम स्पीशीज के बेसिस पे निकालना चाह रहे थे लेकिन यहां पे हमें रिलेशनशिप बताया जा रहा है कि पैटल विड्थ और सपल विड्थ के बीच में कैसा रिलेशन है और उसके साथ-साथ पैटल विथ और सपल विड्थ के अंदर कैसा रिलेशन है और उसके बाद देखिए पैटल विड्थ और पैटल लेंथ के अंदर कैसा रिलेशन है ये सारे रिलेशनशिप के ये ग्राफ दिखाई दे रहे हैं अच्छा इस ग्राफ के अंदर मैं क्या करने वाला हूं एक हयू पैरामीटर्स देने वाला हूं तो मैंने हयू पैरामीटर दिया है और हयू पैरामीटर के अंदर मैं स्पेसस को दूंगा ताकि मैं देखूंगा कि इनके अंदर किस तरह का डिफरेंशिएबल रहा है तो मैंने य पैरामीटर के अंदर स्पेसेस को डाल दिया है ताकि हमें ये जो ग्राफ है वो तीनों में डिफरेंशिएबल अच्छा सबसे पहले मैं बात करूंगा यहां पे किसके बारे में सपल लेंथ के बारे में सपल लेंथ के अंदर यदि हम इस कर्वेचर को देखें तो ये तीनों कर्वेचर क्या है एक दूसरे को काफी ज्यादा ओवरलैपिंग कर रहे हैं मतलब इन तीनों कर्वेचर के अंदर डिफरेंशिएबल थोड़ा मुश्किल है नेक्स्ट यदि बात करें यहां पे तो आपके पास है सपल विड्थ सपल विड्थ में ये कर्वेचर और ज्यादा आपके पास क्या हो चुके हैं ओवरलैपिंग कर चुके हैं तो यहां से तो डिफरेंशिएबल हो चुका है यहां पे चलिए उसके आगे चले यहां पे तो देखिए सपल लेंथ है सपल लेंथ के कर्वेचर को देखें तो सपल लेंथ का जो कर्वेचर है वो काफी डिस्क्रीट है यहां पे कोई एक दूसरे को वो इतना ज्यादा ओवरलैपिंग नहीं कर रहा है यहां पे तो बेसिकली यहां से हम अच्छे तरीके से क्लासिफिकेशन कर सकते हैं सेकंड चीज चले यहां पे पैटन विड्थ के बारे में तो पैटल विड्थ के अंदर भी हमारा जो कर्वेचर है वो काफी डिफरेंशिया इन कर्वेचर से हमें क्या यहां पे नॉलेज मिल सकती है तो देखिए इन कर्वेचर से हमें फीचर सिलेक्शन की नॉलेज मिल सकती है फीचर सिलेक्शन का मतलब है कि आपको इन सारे फीचर में से कौन से फीचर को सेलेक्ट करना है जिससे आपका जो मॉडल है वो बहुत अच्छे तरीके से ट्रेंड हो जाएगा तो वो चीज हमें यहां पे नॉलेज मिलती है और उसके अंदर हमें क्या देखने को मिलता है कि जो हमारा सपल विड्थ है वो सबसे ज्यादा ओवरलैपिंग आ रहा है मतलब यदि मैं इस फीचर को लेके क्लासिफाई करने के लिए जाऊं यहां पे इस फीचर को लेके मैं अपने यहां पे स्पेसेस को को अलग-अलग करूं यहां पे तो बेसिकली ये स्पेसेस अलग-अलग नहीं हो सकती क्योंकि इनके जो कर्वेचर्स है इनके जो आपके पास ग्राफ देख पा रहे हैं यहां पे वो एक दूसरे के साथ बहुत ज्यादा ओवरलैपिंग पे आ चुके हैं और जब ये कर्वेचर एक दूसरे के साथ बहुत ज्यादा ओवरलैपिंग पे आ जाते हैं तो उनको एक दूसरे से डिफरेंशिएबल हो जाता है तो बेसिकली हम यहां पे इस कर्वेचर के थ्रू ये समझ पाए हैं कि बेसिकली हम यहां पर सपल विथ को यदि हमारे डेटा सेट के अंदर ना ले तो ये हमारे लिए ज्यादा बेनिफिशियल होने वाला है लेकिन मैं फीचर सिलेक्शन के ऊपर अभी फोकस नहीं कर रहा हूं मैं यहां पे फोकस कर रहा हूं लॉजिस्टिक रिग्रेशन विद मल्टी क्लास क्लासिफिकेशन के बारे में तो इसलिए हम इसे अपने डाटा सेट के अंदर होल्ड करके रखेंगे आने वाले वीडियो के अंदर हम फीचर सिलेक्शन के बारे में भी बात करेंगे जिसके थ्रू हम ये देखेंगे कि कौन सा फीचर हमारे लिए इंपॉर्टेंट है और कौन सा फीचर हमारे लिए इंपॉर्टेंट नहीं है तो फिलहाल के लिए अभी क्या कर रहा हूं इस डेटा सेट को ले रहा हूं मैं कंपलीटली और उसके बाद में हम यहां पर पता लगाएंगे कि इसकी एक्यूरेसी कैसे आने वाली है और इसके अर कैसे हमारा सिगमॉड फंक्शन काम करेगा और कैसे हमारा सॉफ्टवेर फंक्शन काम करेगा तो चलिए जरा इसे समझते हैं इसके अंदर क्या कर रहा हूं गाइज यहां पे कि हमारे पास जो डटा सेट है इसके अंदर हमारा जो इनपुट आउटपुट है मतलब डिपेंडेंट और इंडिपेंडेंट वेरिएबल है इसे हम अलग-अलग कर लेते हैं कैसे करेंगे गाइज यहां पे तो देखिए मैं x नाम का एक वेरिएबल बनाऊंगा जिसके थ्रू डेटा सेट के अंदर जाऊंगा और डॉट आलग का इस्तेमाल कर रहा हूं यहां पे सारे नंबर ऑफ रो को इस्तेमाल करूंगा देन कॉमा सारे नंबर ऑफ कॉलम को इस्तेमाल करूंगा बट माइनस व को मैं छोड़ दूंगा यहां पे और x को देखूं तो मेरे पास सपल लें सपल विथ पैटल लेन पैटल विड्थ दोनों दिख रही है चलिए मैं y कॉलम का इस्तेमाल करता हूं जहां पे मैं अपने डेटा सेट को लूंगा एंड देन स्क्वायर ब्रैकेट और यहां पर हम कॉल कर देंगे हमारी स्पेसेस को चलिए x और y हमारे पास अलग-अलग हो चुके हैं अब हमारा नेक्स्ट टारगेट क्या होगा ट्रेन और टेक्स्ट के अंदर स्प्लिटिंग करना चलिए फ्रॉम साइकिल लाइन के अंदर चलते हैं डॉट आपके पास क्या किसके ऊपर चलते हैं मॉडल सिलेक्शन के ऊपर चलते हैं मडल संग के पर जाने के बाद दैट मैं इंपोर्ट करूंगा किसे इंपोर्ट करने वाला हूं गाइज यहां पे ट्रेन टस्ट स्लिटिंग को क्यों इंपोट कर रहे हैं क्योंकि हमारे डटा को दो पार्ट के अंदर स्प्लिटिंग करेंगे तभी हम एक्यूरेसी के बारे में पता लगा पाएंगे कि ये मॉडल कितना अच्छा परफॉर्म कर पा रहा है चलिए उसके बाद नेक्स्ट हमारा टारगेट क्या होगा हमारे पास चार वेरिएबल बनाने हैं x मैं यहां पे वेरिएबल बनाऊंगा ट्रेन का यहां पर मैं बनाऊंगा x आपके पास टेस्ट का दूसरा मैं बनाऊंगा y मैं यहां बनाने वाला हूं ट्रेन का एंड चौथा मैं बनाने वाला हूं y टेस्ट का यस तो मैं y अर टेस्ट का बना लेता हूं ये चार वेरिएबल बन गए उसके बाद हम हमारे मॉडल को ट्रेन टेस्ट स्लिटिंग करते हैं x और y हमारा डटा देते हैं उसके बाद हम यहां पर देंगे हमारी टेस्टिंग साइज और टेस्टिंग साइज होगी 0.2 अगला होगा हमारा रैंडम स्टेट रैंडम स्टेट की वैल्यू कर देता हूं 42 चलिए ये हमारे चार वेरिएबल के अंदर हमारा डाटा जो है वो स्प्लिटिंग हो चुका है अब नेक्स्ट टारगेट क्या होगा हमारे पास लॉजिस्टिक रिलेशन लगाने का चलिए फ्रॉम सेक लन की हेल्प से हम क्या कर रहे हैं यहां पे आपके पास लीनियर मॉडल को कॉल कर रहे हैं लीनियर मॉडल के अंदर जाके हम जाएंगे यहां पे किसके बारे में लॉजिस्टिक रिग्रेशन के अंदर चलिए लॉजिस्टिक रिग्रेशन को इस्तेमाल करें हैं अब सबसे पहला जो मेथड मैं यहां पे इस्तेमाल करने जा रहा हूं दैट इज द ओआरडब्ल्यू सबसे पहले ओआरडब्ल्यू कि हम ओआरडब्ल्यू कि मैंने लॉजिस्टिक रिगेशन को अप्लाई किया है और फिर उसके बाद मैं लॉजिस्टिक रिगेशन को कॉल कर दूंगा अब जब आप लॉजिस्टिक रिगेशन को ओपन करते हैं तो यहां पे आपके पास मिलता है सबसे पहले पेनल्टी पेनल्टी का मतलब है कि यहां पर आप ला और रिग्रेशन को अप्लाई कर सकते हैं क्योंकि ये रिग्रेशन टेक्निक है और रिग्रेशन टेक्निक के अंदर रेगुलराइजेशन टेक्निक को इस्तेमाल कर सकते हैं तो इसलिए हम यहां पर आपके पास l1 ए2 रेगुलेशन को भी अप्लाई कर सकते हैं उसके बाद आप थोड़ा सा नीचे आएंगे तो आपके पास बहुत सारे और सारे हाइपर पैरामीटर्स मिलेंगे जिनके ऊपर आप ट्यूनिंग करके आप अपना काम कर सकते हैं फिलहाल वैसे मैंने हमें क्या करना है ओवी आरथु क्लास क्लासिफिकेशन आपको देखने को मिल जाएगा यस मल्टी क्लास क्लासिफिकेशन मिलल जाएगा मल्टी क्लास क्लासिफिकेशन में अभी आपके पास क्या चल रहा है ऑटो चल रहा है यहां पे इसी के अंदर आपको ओवीआरडीबीएफ साइकेड लर्न की लाइब्रेरी के अंदर जा सकते हैं तो मैं आपको थोड़ा सा यहां पे और डिटेल के अंदर दिखा देता हूं तो आप क्या करें साइक लन के अंदर जाइए साइक लन के अंदर जाने के बाद यहां पर जाने के बाद आप क्या करिए लॉजिस्टिक रिग्रेशन को ओपन कर दीजिए तो मैं यहां पे क्या कर रहा हूं लॉजिस्टिक रिग्रेशन को ओपन कर रहा हूं यहां पे चलिए यहां पे मैंने क्या किया लॉजिस्टिक रिग्रेशन को ओपन कर दिया लॉजिस्टिक रिग्रेशन को ओपन करने के बाद मैं देखिए यहां पे कुछ इसके हाइपर पैरामीटर दे रखे है जिसके अंदर पैलेंट के बारे में दे रखा है और भी बहुत सारी चीजें यहां पर दे रखी है अब इसके अंदर थोड़ा सा नीचे आने के ऊपर आपके पा यहां पे जस्ट थोड़ा सा नीचे आएंगे यहां पे तो नीचे आने के बाद में आपको यहां पे मल्टी क्लास क्लासिफिकेशन के लिए ऑप्शंस मिल जाएंगे मल्टी क्लास क्लासिफिकेशन के ऊपर अभी तो फिलहाल क्या चल रहा है ऑटो चल रहा है लेकिन यहां पे आपको बताया गया है कि इफ यू चूज द ओवी आर मेथड देन द बाइनरी प्रॉब्लम इज फिट द ईच लेबल यहां पे क्या कर रहा है जा रहा है कि बाइनरी लेबल के अंदर कन्वर्ट करके आपकी प्रॉब्लम को सॉल्व किया जाएगा देन फॉर द मल्टीनोमियल क्लासिफिकेशन को आप यद इस्तेमाल करते हैं तो ये आपका सॉफ्ट मैक फंक्शन का इस्तेमाल करके आपके पास आपको रिजल्ट के अंदर चेंजेज करके देता है राइट तो इसके बारे में और डिटेल्स यहां पे दे रखी है आप इनमें से किसी भी चीज को चूज कर सकते हैं फिलहाल मैं ओवी आर को इस्तेमाल कर रहा हूं तो मैं यहां पे क्या करूंगा मल्टी क्लास को ओआरजी और मल्टी क्लास को कॉल करूंगा यस मल्टीक्लास को कॉल करने के बाद में मैंने यहां पे डाल दिया ओवी आर चलिए इसे रन करते हैं और उसके बाद मैं डॉ एलआर डॉट यहां पे क्या कर रहा हूं मड डॉट फिट कर रहा हूं यहां पे और फिट के अंदर मैं यहां पे हमारा x ट्रेन y ट्रेन को मैं यहां पे देने वाला हूं चलिए ये हमारा मॉडल ट्रेड हो चुका है अब उसके बाद हम हमारी एक्यूरेसी देख लेते हैं तो एक्यूरेसी देखने के लिए एल डॉट यहां पे क्या करेंगे स्कोर चेक करेंगे स्कोर के अंदर मैं क्या करूंगा गाइज यहां पे x टेस्ट कॉमा y टेस्ट जो है मैं यहां पे पास करने गा हूं और जो एक्यूरेसी मिली है मुझे यहां पे 96 पर मिली है यूजिंग ओवी आर मेथड ओवी आर मेथड के थ्रू हमें 96 पर एक्यूरेसी मिल है दैट इज अ वेरी गुड और इनफ एक्यूरेसी बहुत अच्छी एक्यूरेसी यहां पे मिली है मुझे यहां पे चलिए अब हम क्या करते हैं यहां पे ओवी आर की जगह मैं यहां पे क्या कर रहा हूं मल्टी क्लास क्लास सेशन का यूज़ कर रहा हूं देखिए हमारे पास दूसरा मेथड क्या है मल्टीनोमियल है यस दूसरा हमारे पास क्या है मल्टीनोमियल है मल्टीनोमियल मतलब सॉफ्ट मैक्स फंक्शन के ऊपर हम बात करें यहां पे तो मैं यहां पे मल्टीनोमियल का इस्तेमाल करूंगा अब मल्टीनोमियल कैसे इस्तेमाल करेंगे तो वही मैं यहां पे क्या करूंगा एलआर व का इस्तेमाल करूंगा और यहीं पे क्या करूंगा मैं लॉजिस्टिक रिग्रेशन का इस्तेमाल करूंगा अब उसके अंदर क्या करने वाले है गाइज यहां पे मल्टी नोबल को कॉल करना है तो मैं यहां पे क्या कर रहा हूं मल्टी क्लास को पहले कॉल करूंगा एंड देन मल्टी नो मल यहां पे लगा देते हैं चलिए उसके बाद हम हमारे डाटा को फिट करेंगे फिट करने के लिए मैं यहां पे lr1 का इस्तेमाल करूंगा डॉट मॉडल डॉट यहां पर फिट का इस्तेमाल करने वाला हूं और x ट्रेन y ट्रेन का मैं इस्तेमाल करूंगा रन करेंगे हमारा जो मॉडल है वो बन चुका है उसके बाद में नेक्स्ट चीज क्या है हमारी स्कोर चेक करने की फिलहाल ये छोटी सी एक वार्निंग दे रहा है वार्निंग में कुछ यहां पर पॉइंट्स दिए जा रहे हैं कि ए नंबर ऑफ इटरेशन आपके चेंज हो चुके हैं तो वार्निंग को अभी हम क्या कर सकते हैं फिलहाल इग्नोर कर सकते हैं उसके बाद देखिए lr1 डॉट यहां पे क्या करने वाले हैं हम यहां पे हमारे मॉडल का स्को चेक करेंगे स्कोर के अंदर x यहां पर मैं क्या कर सकता हूं टेस्ट का इस्तेमाल कर सकता हूं और y टेस्ट का इस्तेमाल कर सकता हूं चलिए रन करते हैं और ये हमें 100% एक्यूरेसी के साथ रिजल्ट दे रहा है तो दोनों में आप देख सकते हैं कितना ज्यादा फर्क आ रहा है यहां पे ये 96 पर एक्यूरेसी के साथ दे रहा है और ये आपके पास क्या कर रहा है 100% एक्यूरेसी के साथ आपके पास आपका रिजल्ट लाके दे रहा है तो इस तरह से आपके पास जब भी मल्टी क्लास क्लासिफिकेशन हो तब आप इस्तेमाल कर सकते हैं तो ये था आपका मल्टी नोबल यहां पे अब देखिए यहां पर आप क्या कर सकते हैं डायरेक्ट मेथड का भी इस्तेमाल कर सकते हैं यदि आप डायरेक्ट लगाते हैं है तब भी ये डायरेक्टली काम कर लेता है यहां पे ऐसा कुछ नहीं है कि डायरेक्टली काम नहीं करेगा क्योंकि हमने यहां पे ऑटो लगा रखा है ऑटो क्या करता है कि ओवी आर को सेलेक्ट कर लेता है और आपके डेफिनेटली काम कर लेता है तो चलिए कैसे काम करता है तो वो भी आप देख लेते हैं यहां पे कि डायरेक्ट मेथड कैसे काम करेगा तो उसके लिए देखिए मैं क्या कर रहा हूं अलर्ट नाम से एक वेरिएबल बना रहा हूं यहां पे और फिर यहां पे कह रहा हूं लॉजिस्टिक रिग्रेशन को कॉल करूंगा यहां पे कोई मैं नहीं लगा रहा यहां पे मतलब मल्टी क्लास क्लासेन को अप्लाई नहीं कर रहा हूं डायरेक्ट ये ओआरडब्ल्यू ऑटोमेटिक यहां पे ऑटो लगा रखा है यहां पे ठीक है और यहां पर देखिए मैं lr2 मॉडल क्या कर रहा हूं गाइज यहां पे फिट कर रहा हूं यहां पे और फिट के अंदर मैं क्या कर रहा हूं गाइज यहां पे x ट्रेन एंड y x ट्रेन कॉमा यहां पर मैं y ट्रेन यहां पे लगाने वाला हूं और उसके बाद रन करते हैं तो ये ऑटोमेटिक आपके क्लास काम कर गई यहां पे उसके बाद देखिए गाइज यहां पे अड यहां पर मैं क्या करूं इस कोड को चेक करूं यस एडकोर को चेक करूं और यहां पर x टेस्ट y टेस्ट को यदि मैं अप्लाई करूं तो देखिए हमें 100% एक्यूरेसी दे रहा है राइट तो ये ऑटोमेटिक मैं क्या करता है गाइज यहां पे ऑटोमेटिक आपका जो डटा आउटपुट है यहां पे उसे डिटेक्ट कर लेता है कि ये कौन सी क्लास क्लासिफिकेशन का है बाइनरी क्लास क्लासिफिकेशन का है या मल्टी क्लास क्लासिफिकेशन का है उसको ये डिटेक्ट कर लेता है और डिटेक्ट करने के बाद में आपके पास मल्टी क्लास क्लासिफिकेशन को अप्लाई कर देता है तो आई थिंक आई होप समझ में आ चुका होगा जब भी आपके पास मल्टी क्लास क्लासिफिकेशन हो तो आपको क्या करना चाहिए राइट तो आप यहां पे ओवी आर मेथड का भी इस्तेमाल कर सकते हैं और आप चाहे तो मल्टीनोमियल का भी इस्तेमाल करके आप अपने आउटपुट को और अच्छा बना सकते हैं और आज के इस वीडियो के जरिए हम हम यहां पर बात करने वाले हैं कंफ्यूजन मैट्रिक्स के बारे में तो देखिए गाइस जैसा कि मैंने आपको स्टार्टिंग में बताया था कि काफी बार ऐसी सिचुएशन आ जाती है कि आपका जो मॉडल होता है वो बहुत ही अच्छी एक्यूरेसी देता है जस्ट लाइक 95 पर एक्यूरेसी 98 पर एक्यूरेसी उसके बावजूद भी आपके मॉडल जो होते हैं वो रिजेक्ट हो जाते हैं और उसके पीछे रीजन होता है आपकी मॉडल की रॉन्ग प्रेडिक्शन अब मॉडल का रॉन्ग प्रेडिक्शन तो हम एक्यूरेसी से भी निकाल सकते हैं कि गाइस हमारे पास जो मॉडल है वो 98 पर एक्यूरेसी दे रहा है और हमारा जो 2 पर है वो हमारे पास रॉन्ग प्रेडिक्शन दे रहा है तो फिर उसके बावजूद भी क्या प्रॉब्लम है प्रॉब्लम आपके पास आपको इंडिकेट होगी किससे कंफ्यूजन मैट्रिक्स से कंफ्यूजन मैट्रिक्स एक ऐसी मैट्रिक्स है जो कि आपके जो प्रेडिक्शन मॉडल आपने बनाया है जो भी आपने क्लासिफिकेशन मॉडल बनाया है उसकी बेटर एनालिसिस करके देता है कि किस सिचुएशन के अंदर आपका मॉडल फेल कर गया है और किस सिचुएशन के अंदर आपका मॉडल पास कर गया है तो इस बारे में एक बैटर एनालिसिस आपके सामने दिखाता है आज के इस वीडियो के जरिए मैं आपको कंफ्यूजन मैट्रिक्स को एकदम डिटेल के साथ बताने वाला हूं कंफ्यूजन मैट्रिक्स अपने आप में बहुत बड़ी कंफ्यूजन वाली चीज है लेकिन मैं इसको आज इतने सिंपलीफाई तरीके से आपको बताऊंगा कि आज के बाद कंफ्यूजन मैट्रिक्स जो है वो आपके लिए बहुत ज्यादा इजी हो जाएगी यदि आपको पाइथन मशीन लर्निंग डाटा साइंस एंड डेटा एनालिस जैसी फील्ड में अपने आप को ग्रो करना है तो इसके लिए डब्लू कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो चलिए जानते हैं कंफ्यूजन मैट्रिक्स होता क्या है तो देखिए जब भी आप अपना एक प्रेडिक्शन मॉडल बनाने जा रहे हैं क्लासि का प्रेडिक्शन मॉडल बनाने जा रहे हैं तो उस वक्त जब भी आप अपने टेस्टिंग के ऊपर जाएंगे तो टेस्टिंग के अंदर आप कह देते हैं आप अपना अपना इनपुट डाटा देते हैं उसके ऊपर आपका एक आउटपुट डाटा जनरेट होता है जब आपके पास जो आउटपुट डटा जनरेट हुआ है मतलब जो आपका प्रेडिक्शन आउटपुट डटा जनरेट हुआ है और जो एक ओरिजिनल आउटपुट डटा आपके पास पहले से पड़ा है उसके बी में आप जो मैट्रिक्स डिजाइन करते हैं उसको हम बोलते हैं कंफ्यूजन मैट्रिक्स जिसके थ्रू पता लगाया जाता है कि आपका मॉडल कितना अच्छा परफॉर्म कर रहा है तो बेसिकली गाइस इसे हम एक इलेशन मैट्रिक्स बोलते हैं या फिर हम इसे एक एरर मैट्रिक्स बोलते हैं जिसके थ्रू आप क्या कर सकते हैं आप पता लगा सकते हैं कि आपका मॉडल कितना अच्छा प्रेडिक्शन करेगा अब ये कंफ्यूजन मैट्रिक्स दिखती कैसी है तो मैं जरा आपको पहले दिखा देता हूं कि कंफ्यूजन मैट्रिक्स कैसे दिखती है तो कंफ्यूजन कुछ इस तरह के दिखाई देती है यस ये एक एरर मैट्रिक्स होती है जो कि आपके पास ओरिजिनल डाटा और प्रिडिक्शन डाटा के बीच में बनाई जाती है अब ये कैसे बनाई जाती है क्या इसका है यहां पे सीन किस तरह से काम करती है तो इसको जरा थोड़ा डिटेल के साथ समझते हैं देखिए जब भी आप अपना डेटा सेट लेते हैं मतलब मैं अपना जब भी अपना डेटा सेट ले रहा हूं यहां पे उस डेटा सेट को आप क्या करते हैं दो पार्ट के अंदर तोड़ते हैं पहला पार्ट क्या होता है गाइस यहां पे आपके पास आपका ट्रेनिंग डाटा होता है यस ट्रेनिंग डाटा होता है दूसरा आपका पास क्या होता है गाइज यहां पे आपका टेस्टिंग डाटा होता है अच्छा जब आप ट्रेनिंग डाटा लेते हैं तो ट्रेनिंग डाटा के अंदर भी आपके पास दो डाटा होते हैं यहां पे एक होता है x और एक होता है y मतलब आपका यहां पे इनपुट डाटा और आउटपुट डाटा इसी तरह से टेस्टिंग डाटा के अंदर भी आपके पास आपका x होता है दूसरा आपके पास y होता है अच्छा ये y जो आपके पास दिखाई दे रहे हैं ये कौन से डाटा है यहां पे ओरिजिनल y है यहां पे तो मैं यहां पे ओरिजिनल y लिख देता हूं अब आप क्या करते हैं कि जो आपका ट्रेनिंग डाटा है यहां पे उस ट्रेनिंग डाटा को देके आप क्या करते हैं आपका एक मशीन लर्निंग मॉडल बनाते हैं ये मशीन लर्निंग मॉडल आपको एक प्रिडिक्ट फंक्शन लाके देता है जिसके थ्रू आप क्या करते हैं प्रेडिक्शन करते हैं इस प्रेडिक्शन के अंदर आप क्या करते हैं गाइस यहां पे आप अपना इनपुट दे देता ता हैं और कौन सा इनपुट डाटा देते हैं गाइस यहां पे आप अपना टेस्टिंग का इनपुट डाटा देते हैं यस इनपुट का मतलब मैं गाइस बात करूं अब अब इनपुट में x देते हैं अच्छा ट्रेनिंग के अंदर क्या देते हैं ट्रेनिंग के अंदर आप दोनों देते हैं x y आप दोनों यहां पर देते हैं लेकिन टेस्टिंग के अंदर आप क्या देते हैं केवल और केवल इनपुट देते हैं और जब आप यहां पे प्रेडिक्शन के अंदर आप अपना इनपुट दे रहे होते हैं तब ये आपको क्या जनरेट करके देता है ये आपको आउटपुट जनरेट करके देता है मतलब बेसिकली गाइज मैं बात करूं ये आपको y जनरेट करके दे देता है राइट अब यहां पे कंफ्यूजन मैट्रिक्स कैसे बनती है कंफ्यूजन मैट्रिक्स ये जो y आपका ओरिजिनल आपको दिखाई दे रहा है और ये जो y आपका प्रेडिक्शन दिखाई दे रहा है यस ये y आपका ओरिजिनल और ये आपका जो y आपका प्रेडिक्शन है इन दोनों से मिलकर आपके कंफ्यूजन मैट्रिक्स बनती है और ये कंफ्यूजन मैट्रिक्स बताती है आपको कि ये मॉडल कितने अच्छे तरीके से ट्रेंड हुआ है और यह कहां मिस्टेक कर रहा है और किस सिचुएशन के अंदर आपको इस मॉडल को रिजेक्ट कर देना चाहिए तो इसके बारे में ये आपको इंडिकेट करता है अब ये कैसे इंडिकेट करता है क्या है यहां पे तो इसको मैंने जस्ट यहां पे आपको एक डेटा सेट के थ्रू बता रखा है जहां पे आपका एक्चुअल डाटा दे रखा है और वहीं पे आपको अपना प्रेडिक्शन डाटा दे रखा है अब ये एक्चुअल डाटा प्रेडिक्शन डाटा है क्या तो ये आपके पास जो आपका टेस्टिंग डाटा था यस जो आपका टेस्टिंग डाटा था उस टेस्टिंग डाटा का ये वाय ओरिजिनल डाटा है यहां पे और उसी टेस्टिंग डाटा का ये क्या है वाई आपका प्रेडिक्शन डाटा है तो ये आपके पास एक मैट्रिक्स जनरेट होके आई है मतलब ये आपका वाय प्रेडिक्शन टा है ये उसका एक डेटा सेट आपके सामने आ है अब इस डेटा सेट में ऐसा है क्या क्या है ऐसा जिसकी वजह से हमें कंफ्यूजन मैट्रिक्स बनाने की जरूरत पड़ गई तो उसका जवाब पहले मैं आपको दूंगा यहां पे तो लेट्स सपोज करते हैं एक छोटे से एग्जांपल के थ्रू समझते हैं लेट्स सपोज करते हैं कि आपको बुखार है या नहीं है इसके ऊपर हम एक प्रेडिक्शन मॉडल बना रहे हैं मतलब आप एक फार्मा इंडस्ट्रीज के लिए काम कर रहे हैं फार्मा इंडस्ट्रीज एक ऐसा मॉडल बनाना चाहती है जो कि आपके पास किसी भी पेशेंट के कुछ सिम्टम्स को नोट डाउन करेगी और नोट डाउन करने के बाद में आपको बताएगी कि उनको बुखार है या नहीं है एक सिंपल मॉडल बनाएंगे तो मान लीजिए लेट्स सपोज ये आपका एक मॉडल बन रहा है यहां पे जो कि आपको बताता है कि आपको बुखार है या नहीं है मतलब प्रिडिक्शन करके देता है आपके सिम्टम्स को देख के अब इसके अंदर क्या-क्या सिचुएशन हो सकती है जरा समझते हैं यहां पे मान लेते हैं पहली सिचुएशन कि आपको बुखार नहीं है बुखार नहीं है मतलब मैं जीरो से इंडिकेट कर रहा हूं जीरो मतलब फाल्स होता है और बुखार नहीं को मैं जीरो से इंडिकेट कर रहा हूं मान लीजिए आपको बुखार नहीं है आपने मॉडल को दिया यहां पे मॉडल ने आपको प्रेडिक्शन करके दिया यस इस पर्सन को बुखार नहीं है तो पहली सिचुएशन आ गई कि आपको जीरो आपका है यहां पर और इसी पर आपको जीरो भी देखने को मिला मतलब आपका मॉडल बहुत अच्छे तरीके से प्रेडिक्शन कर गया राइट इसको मैं यहां पर साइड में लिख लेता हूं जीरो पे आपका प्रेडिक्शन क्या आया जीरो आया ट्स गुड ये तो अच्छा मॉडल प्रिडिक्ट कर रहा है चलते अगली सिचुएशन देखते हैं य मान लीजिए कि आपको बुखार नहीं है और उसके बाद आपके मॉडल को दिया और मॉडल ने आपको प्रेडिक्शन करके दिया यस आपको बुखार है यह हमारा होता है रॉन्ग प्रेडिक्शन मतलब आपको बुखार नहीं था लेकिन आपके सिम्टम्स को देख के मॉडल प्रिडिक्शन करके दे दिया कि आपको बुखार है तो यह आपका एक रॉन्ग प्रिडिक्शन हो गया जीरो पे आपको वन मिल गया वन का मतलब ट्रू और ट्रू का मतलब बुखार होना चले आगे देखते हैं आगे क्या सिचुएशन हो सकती है मान लीजिए कि आपको बुखार है एक्चुअल में आपको बुखार है और आपने मॉडल को दिया और मॉडल ने आपको प्रोडक्शन दिया कि इस पर्सन को बुखार नहीं है मतलब आपके वन पे आपको जीरो आउटपुट दे रहा है दैट इज अ रंग प्रेडिक्शन फिर से यह आपका एक बहुत ही गलत प्रेडिक्शन है चलिए आगे बढ़ते हैं यहां पे आगे बढ़ते हैं अगला बान कहते हैं कि मान लीजिए आपको बुखार है यस मान लेते हैं कि आपको बुखार है और आपने मॉडल को दिया और मॉडल ने आपको प्रिडिक्शन करके दिया यस आपको बुखार है राइट तो यह आपके पास हो गया ट्रू प्रेडिक्शन तो ये आपका वन आ गया अब ये चार सिचुएशन आपको देखने को मिलती है किसमें बाइनरी क्लास क्लासिफिकेशन के अंदर मल्टी क्लास क्लासिफिकेशन के अंदर और भी ज्यादा हमें सिचुएशन देखने को मिलती है तो बेसिकली अभी हम बाइनरी क्लास क्शन के बारे में समझ रहे हैं कंफ्यूजन मैट्रिक्स को बाइनरी क्लास कैशन के थ्रू समझेंगे तो बेसिकली गाइस ये चार सिचुएशन आ सकती है और इन चार सिचुएशन के अंदर दो सिचुएशन हमारे लिए डेंजर हो सकती है कौन सी जीरो पे वन और वन पे जीरो आना बाकी दो सिचुएशन की बात करें तो वो दो सिचुएशन सही है तो बेसिकली गाइस ये हमारे पास जो एक्चुअल वा है और जो प्रिडिक्टेड वा है इन दोन दोनों से मिलकर हम क्या बनाते हैं एक मैट्रिक्स बनाते हैं जिसके थ्रू हम यह पता लगाते हैं कि रो पे वन कितने आए हैं और वन पे रो कितना है और इसी के बेसिस पे कोई भी कंपनी आपके मॉडल को रिजेक्ट कर सकती है यदि आपके मॉडल की एक्यूरेसी 100% यदि आपके मॉडल की एक्यूरेसी 95 पर ही क्यों ना हो अब ये मैट्रिक्स बनती कैसी है जरा इसको डिटेल के साथ समझते हैं तो देखिए ये आपके पास डेटा आ चुका है यस ये आपका जितना भी डाटा है इस डेटा को लेके यदि मैं बात करूं तो आपके पास इस डटा को लेके आप क्या करते हैं इस तरह की मैट्रिक्स बनाते हैं अब ये जो मैट्रिक्स आप देख रहे हैं इस मैट्रिक्स का जो रेफरेंस है वो साइकेड लन के थ्रू लिया गया है देखिए आपके पास बहुत सी अलग-अलग तरीके की मैट्रिक्स आपको देखने को मिलेगी लेकिन हम साइक र्न की लाइब्रेरी को इस्तेमाल करने जा रहे हैं इसलिए हम इसी मैट्रिक्स को फॉलो करेंगे राइट क्योंकि साइकेड लाइन की लाइब्रेरी जो है वो ये मैट्रिक्स को फॉलो करती है तो हम भी इस मैट्रिक्स को फॉलो करेंगे चलिए अब जरा समझते हैं क्या है तो देखिए सबसे पहले मैं बात करूंगा कि इस तरफ हम क्या करते हैं ट्रू लेबल ले लेते हैं ट्रू लेबल का मतलब क्या है गाइ यहां पे कि आप इस तरफ ले लेते हैं एक्चुअल वेल वैल्यू और इस तरफ ले लेते हैं आप अपनी प्रिडिक्टेड वैल्यू अब एक्चुअल वैल्यू के अंदर आपका जीरो हो सकता है और वन हो सकता है यहां पे भी जीरो हो सकता है और वन हो सकता है अब आप क्या करते हैं यहां पे काउंट करते हैं वैसे तो फिलहाल यहां पे काउंटिंग पहले से लिखी हुई आपको नजर आ रही है लेकिन हम यहां पे काउंटिंग करेंगे कैसे देखो वन पे वन आया है वन पे वन आना मतलब वन पे वन आना मतलब आप यहां पे वन कर देते हैं उसके बाद रो पे रो आया है रो पे रो आना मतलब आप यहां पे वन कर देते हैं फिर आप क्या करते हैं वन पे जीरो आया है वन पे रो आना मतलब एक्चुअल वैल्यू वन है और प्रिडिक्टेड वैल्यू जीरो है एक्चुअल वैल्यू वन है प्रिडिक्टेड वैल्यू जीरो है तो आप यहां वन कर देते हैं फिर आपके पास क्या है जीरो पे वन आना जीरो पे आपका वन आना मतलब आप यहां पे वन कर देते हैं चलिए ये हमारे चार पॉइंट निकल चुके हैं अगले पॉइंट पे चलते हैं जीरो पे जीरो आना जीरो पे जीरो आना मतलब आप यहां पे टू कर देते हैं फिर बात करें जीरो पे वन आना जीरो पे वन आना मतलब जीरो आपके पास एक्चुअल वैल्यू है यहां पे और प्रिडिक्टेड आपके पास क्या है गाइस यहां पे वन आना मतलब आप यहां आ चुके हैं यस जीरो पे वन आना मतलब आप यहां आ चुके हैं और यहां आने का मतलब क्या है गाइ यहां पे इसे ट्रू कर देते हैं चलिए वन पे वन आना वन पे वन आना मतलब आप इसे टू कर देते हैं इस तरह से बनती है आपकी कंफ्यूजन मैट्रिक्स क्या किया गाइज यहां पे कि जो आपके एक्चुअल वैल्यू और जो प्रिडिक्टेड वैल्यू का जो आपका डेटा सेट है उस डेटा सेट को लेके आप क्या करते हैं इस तरह के एक मैट्रिक्स डिजाइन कर लेते हैं जहां पे जो डाटा जितनी बार आया है उस रिकॉर्ड को हम सेव कर लेते हैं और उसके बाद फिर हम एनालिसिस निकालते हैं अब देखिए यहां से क्या एनालिसिस निकलती है जरा समझते हैं यहां पे तो देखिए सबसे पहली एनालिसिस निकलती है कि आपका मॉडल कितने अच्छे तरीके से ट्रेन करता है मतलब मॉडल की एक्यूरेसी क्या है तो मॉडल की एक्यूरेसी कैसे पता करेंगे तो देखिए जब आपके पास ओरिजिनल में ट्रू ओरिजिनल में फॉल्स है और प्रिडिक्टेड में भी क्या है फॉल्स है तो फॉल्स फॉल्स प जब आपका डाटा यहां पर आता है तो हम इस डाटा को कंसीडर कर रहे हैं ओके जब आपके पास वन है और एक्चुअल में भी वन है यहां पे और प्रेडिक्शन में भी वन है तो ये आपका मिलता है आप क्या करते हैं इन दोनों डाटा को क्या करते हैं सम करते हैं तो इस तरह से आपके पास क्या करती है आपकी कंफ्यूजन मैट्रिक्स बनती है अब कंफ्यूजन मैट्रिक्स बनने के बाद में हम थोड़े इसके टर्म्स लॉजी को समझ लेते हैं क्योंकि यहां पे देखिए t ए ए ए एफ ए कुछ लिखा ए प ए ए टीप कुछ लिखा हुआ है यहां पे तो इस टर्म लॉजी को समझ लेते हैं कि ये टर्म लॉजी है क्या देखिए जरा यहां पे बात करें तो ये t ए क्या है t ए है आपके पास यहां पे ट्रू आपके पास नेगेटिव यस t ए को हम क्या बोलते हैं ट्रू नेगेटिव बोलते हैं एफ ए की बात करें तो एफ ए का मतलब है आपके पास यहां पे फॉल्स नेगेटिव राइट क्या है फॉल्स नेगेटिव अच्छा एवी की बात करें एफ क्या है गाइस यहां पे आपके पास एवी है यहां पे फॉल्स पॉजिटिव राइट और टीपी की बात करें तो टीपी आपके पास क्या है यहां पे ट्रू पॉजिटिव अब गाइस देखिए यहां पे ये ट्रू पॉजिटिव फाल्स नेगेटिव है क्या जरा इस डिटेल के साथ समझते हैं और इसको याद कैसे रखा जा सकता है तो इसको याद रखने का बहुत ही सिंपल तरीका मैं आपको बता रहा हूं यहां पे देखिए प्रिडिक्टेड वैल्यू जो आपके पास है यहां पे प्रिडिक्टेड में यदि आपका पहला जीरो है तो इसे आप मान लीजिए कि ये आपकी नेगेटिव है क्या है नेगेटिव है और यहां पे आपके पास क्या है पॉजिटिव है बस ये चीज ध्यान रख लीजिए अब यहां पे पॉजिटिव पॉजिटिव लिखना है यहां पे आपको नेगेटिव नेगेटिव लिखना है अब ये ट्रू फॉल्स ट्रू फॉल्स कैसे डिसाइड होगा जरा समझते हैं यहां पे देखिए अब देखिए जीरो पे आपका जीरो आ रहा है जीरो पे जीरो आ रहा है मतलब जीरो और जीरो मतलब आपका रिजनल वैल्यू जीरो है प्रेडिक्शन वैल्यू जीरो है मतलब इसने जो बात बोली है वो ट्रू बात बोली है जब आपके पास ट्रू बात बोली है तो यह हो गया ट्रू जीरो क्या चीज है ने को रिप्रेजेंट करता है तो यह हो गया ट्रू नेगेटिव मतलब जीरो पे जीरो आना इट्स कॉल्ड ऑफ ट्रू नेगेटिव पहले तो वो सही बोल रहा है दूसरा नेगेटिव का सही बोल रहा है इसलिए होता है ट्रू नेगेटिव चलिए आगे बढ़ते हैं देखिए यदि मेरे पास जीरो के ऊपर वन आ रहा है जीरो के ऊपर वन आ रहा है मतलब एक्चुअल वैल्यू जीरो है और प्रेडिक्शन वैल्यू वन है प्रशन वैल्यू क्या है आपकी वन है इसका मतलब क्या हुआ गाइस यहां पे ये गलत बोल रहा है और गलत बोलने को हम बोलते हैं फाल्स गलत बोलने को हम क्या बोलते हैं फाल्स बोलते हैं मतलब गाइज मैं बात करूं यहां पे कि जीरो पे यदि आपके पास वन आपके पास प्रोडक्ट हो रहा है तो मतलब आपका फॉल्स बोला जा रहा है गलत बोला जा रहा है मतलब फॉल्स बोला जा रहा है और फॉल्स किसका बोला जा रहा है फॉल्स आपके पास पॉजिटिव का बोला जा रहा है क्यों क्योंकि यहां पे वन लिखा हुआ है इसलिए पॉजिटिव का बोला जा रहा है राइट चलिए आगे बढ़ते हैं यहां पे फिर से अब जरा देखिए और यदि मान लीजिए आपका वन है और वन पे आपका जीरो आ रहा है इसका मतलब वन पे रो आने का मतलब क्या है आप फिर से गलत बोल रहे हैं लेकिन किसका बोल रहे हैं गाइज यहां पे नेगेटिव का गलत बोल रहे हैं क्योंकि रो आपके पास है नेगेटिव तो यहां पे जीरो का नेगेटिव है इसलिए क्या बोल रहे हैं फॉर्स नेगेटिव बोल रहे हैं अगली बात करते हैं यहां पे वन पे वन आ रहा है वन पे वन आने का मतलब क्या है यहां पे आप ट्रू बोल रहे हैं और ट्रू किसका बोल रहे हैं गाइ यहां पे पॉजिटिव का बोल रहे हैं इस वजह से ये हो गया ट्रू पॉजिटिव राइट गाइज तो बेसिकली यहां पे ये चार टर्म्स लॉजिक का इस्तेमाल किया जा रहा है किस-किस कले का ट्रू नेगेटिव फॉल्स पॉजिटिव फॉल्स नेगेटिव ट्रू पॉजिटिव इन चारों को याद कर लीजिए बहुत सिंपल टर्म्स है याद कर लीजिए आगे जाते हुए आपके बहुत काम आएगी ठीक है सिंपल सा यदि ज़ीरो पे ज़ीरो आ रहा है तो आपके पास क्या हो गया ट्रू नेगेटिव हो गया ज़ीरो पे वन आ रहा है यहां पे तो फॉल्स पॉजिटिव हो गया वन पे ज़ीरो आ रहा है तो आपका फॉल्स नेगेटिव हो गया और वन पे वन आ रहा है तो ट्रू नेगेटिव हो गया तो ये चार टर्म्स सज आपको याद करनी है राइट अब यहां से हमारे पास बहुत सारी तरीके की एनालिसिस निकल के आती है क्या एनालिसिस है जरा समझते हैं यहां पे सबसे पहली एनालिसिस है एक्यूरेसी मॉडल हमारा कितने अच्छे तरीके से काम कर रहा है तो ये एक्यूरेसी हम कैसे निकालेंगे तो देखिए एक्यूरेसी कैसे निकाली जा सकती है जरा समझते हैं यहां पे एक्यूरेसी का मतलब है कि आपके पास ओरिजिनल वैल्यू और प्रिडिक्टेड वैल्यू दोनों सेम निकल के आ गई है कब-कब आ रही है यहां पे तो देखिए एक तो जीरो यहां पे है और रो यहां पे है और कहां क आ रही है वन यहां पे वन यहां पे मतलब एक तो इस जगह पर आ रही है और दूसरी इस जगह पर आ रही है मतलब ये दो पॉइंट्स आपको दिख रहे हैं ये दोनों पॉइंट आपके एक्यूरेसी के पार्ट बनेंगे तो एक्यूरेसी आप कैसे निकालेंगे यदि मैं बात करूं आप मॉडल की एक्यूरेसी कैसे डिफाइन करेंगे एक्यूरेसी डिफाइन करने के लिए आप क्या करेंगे ट्रू नेगेटिव प्लस यहां पे ट्रू पॉजिटिव को ऐड करेंगे अब डिवाइड किससे करना है यस डिवाइड कैसे करना है तो डिवाइड आपके सभी डाटा से करना पड़ेगा क्योंकि ये सभी डाटा तो आपके पास इस डेटा सेट से आया है तो आप डिवाइड कैसे करेंगे तो ट्रू नेगेटिव प्लस आपके पास ट्रू पॉजिटिव प्लस यहां पे फॉल्स पॉजिटिव एंड फॉल्स नेगेटिव यह होता है आपका एक्यूरेसी का पॉइंट यस ये आता है एक्यूरेसी का फंक्शन फॉर द क्लासि मैट्रिक्स चलिए जरा देखते हैं यहां पे यदि आप एक्यूरेसी का फंक्शन देखेंगे तो एक्यूरेसी का फंक्शन आप देख पा रहे हैं क्या है कि ट्रू पॉजिटिव प्लस ट्रू नेगेटिव यस आपके पास डिवाइड बाय आपके पास आ गया n और हमने क्या निकाला यहां पे तो हमारा भी यही है ट्रू पॉजिटिव एंड ट्रू नेगेटिव डिवाइड बाय आपका पास n n मतलब टोटल नंबर ऑफ डाटा अब बात करते हैं एरर क्या होगी यहां पे एरर मतलब हमारा मॉडल कितने अच्छे तरीके से काम नहीं कर रहा है ये कैसे निकालेंगे तो इट्स अ वेरी सिंपल रॉन्ग प्रेडिक्शन किस पे हो रहा है वन पे रो और किस पे हो रहा है रो पे वन इसका मतलब क्या हुआ गाइज यहां पे यदि मैं बात करूं एरर के बारे में तो एरर क्या होगा गाइज यहां पे फॉल्स पॉजिटिव फॉल्स नेगेटिव डिवाइड बाय यस डिवाइड बाय आपके पास क्या होगा n n मतलब टोटल नंबर ऑफ डेटा यदि आप एरर का फंक्शन यदि आप देखेंगे तो क्या है फॉल्स नेगेटिव फॉल्स पॉजिटिव डिवाइड बा n राइट अब यहीं पे आपके पास दो और तरीके की एरर आती है और ये दो एरर कौन-कौन सी है एक है फॉल्स नेगेटिव और दूसरी है फॉल्स पॉजिटिव राइट फॉल्स नेगेटिव को हम टाइप टू एरर बोलते हैं क्या बोलते हैं टाइप टू एरर बोलते हैं तो देखिए फॉर्स नेगेटिव कहां है ये र फॉर्स नेगेटिव और इसको हम क्या बोलेंगे टाइप टू एरर बोलेंगे और इस एरर को टाइप वन एरर बोला जाता है अब ये एरर कैसे हमारे मॉडल को रिजेक्ट कर सकती है अब इसे थोड़ा सा डिटेल के साथ देख लेते हैं कि ये एरर हमारे पास किस तरह से हमारे मॉडल को रिजेक्ट करेगी लेट्स सपोज मान लीजिए कि आप क्या कर रहे हैं मेडिकल इंडस्ट्रीज में काम कर रहे हैं राइट मतलब एक फार्मा इंडस्ट्रीज के लिए काम कर रहे हैं जो कि क्या कर रही है आपके बॉडी के सिम्टम्स को देख के बता रही है कि किसी पर्सन को फीवर है या नहीं है सिंपल ये एक मॉडल लेके चलते हैं राइट अब गाइस हो क्या रहा है यहां पे आपने मॉडल बनाया ट्रेनिंग की अब आरही है टेस्टिंग की टेस्टिंग के अंदर आप देख लीजिए क्या हो रहा है यहां पे देखिए यदि आपके पास किसी पर्सन को फीवर नहीं है और मॉडल प्रिडिक्ट करके दे रहा है फीवर है ट्स गुड यदि आपके पर्सन को फीवर नहीं है और मॉडल प्रिडिक्ट करके दे रहा है फीवर नहीं है ट इ गुड यह ब सही है यदि आपके पास किसी पन को फीवर है और मॉडल भी प्रिडिक्ट करके दे रहा है उस पर्सन को फीवर है दैट इज आल्सो गुड यस यह भी हमारे लिए सही सिचुएशन है अब मान लीजिए किसी पर्सन को फीवर नहीं है और मॉडल बता रहा है उसे फीवर है यह भी हमारी जो एरर है यह कंसीड बल है यस इसको हम कंसीडर कर सकते हैं क्यों कंसीडर कर सकते हैं लेट्स मान लीजिए आज मुझे बुखार नहीं है लेकिन मैंने मॉडल को चेक कराया मॉडल ने बोल दिया मुझे बुखार है तो मैं क्या करूंगा गाइस यहां पे मैं दो चार टैबलेट ले लूंगा और दो चार टैबलेट लेने से मेरी बॉडी के अंदर इतना ज्यादा इफेक्ट नहीं होने वाला है राइट और मैं दो चार दिन बाद फिर से मॉडल को चेक करवा दूंगा यस फिर से मैं अपने मॉडल को चेक करा दूंगा या फिर डॉक्टर के कंसल्ट कर लूंगा कि मुझे बुखार है देख लीजिए आप यहां पे तो एकदम ठीक है मतलब ओके यह वाली सिचुएशन हम कंसीडर कर सकते हैं लेकिन अगली जो सिचुएशन आने वाली है उसे हम कंसीडर नहीं कर सकते वो सिचुएशन क्या है लेट्स मान लीजिए आपको बुखार है और मॉडल ने बोल दिया बुखार नहीं है अब इस सिचुएशन में होगा क्या देखिए मान लीजिए मुझे बुखार है और मॉडल ने बोल दिया मुझे बुखार नहीं है तो मैं क्या करूंगा मैं एंजॉय करने लग जाऊंगा कि यस यार मुझे तो बुखार नहीं है यह शरीर ऐसे ही टेंपरेचर गर्म हो रहा है कुछ नहीं है धूप वगैरह की वजह से है तो रहने देते इसे और उसकी वजह से उस पर्सन की तबीयत और ज्यादा खराब हो गई और उस पर्सन की डेथ हो गई तो ये एक क्रिटिकल सिचुएशन हो सकती है राइट तो देखिए हमारे लिए कौन सी अभी यहां पर बात करूं इस सिचुएशन के अंदर हमारे पास कौन सी आयरल सबसे खराब है तो वन पे जीरो आना वन पे जीरो आना मतलब एक्चुअल वैल्यू हमारे पास क्या है वन है और प्रिडिक्टेड वैल्यू क्या है जीरो है तो यह हमारे है फॉल्स नेगेटिव अब मैं आपको केवल एक सिचुएशन बता रहा हूं ऐसी बहुत सारी सिचुएशन हो सकती है लेकिन अभी मैं एक सिचुएशन को कंसीडर करूं तो फॉल्स नेगेटिव जो है वो हमारे लिए डेंजरस है अब मान लीजिए आपका मॉडल आपके मॉडल की जो एक्यूरेसी है यहां पे 95 पर एक्यूरेसी है यस 95 पर एक्यूरेसी है और रिमेनिंग जो 5 पर आपके जो एरर आ रही है वो एरर फॉल्स नेगेटिव की हुई तो इसका मतलब क्या हुआ गाइस यहां पे कि आपको उस मॉडल को रिजेक्ट करना होगा कैसे तो जरा समझते हैं लेट्स मान लीजिए मेरे पास क्या है एक 100 डाटा है यहां पे 100 डाटा को ट्रेनिंग किया 100 डाटा की मैं वापस टेस्टिंग कर रहा हूं मान लीजिए 100 डटा टेस्टिंग के लिए लिया 100 डटा टेस्टिंग के लिए लिया यहां पे और मान लीजिए कि इस जगह पे मैं बात करता हूं इस जगह जगह पर मेरे पास 50 आ रहा है यहां पे इस जगह पर मेरे पास 45 आ रहा है ठीक है 50 और 45 को ऐड करूंगा तो मेरे पास 95 हो जाएंगे यस और रिमेनिंग जो मेरे फाइव है वो यहां आ रहे है और यहां पे हमारे पास जीरो आ र है तो इस सिचुएशन के अंदर अब ये रिजेक्टेड है क्यों रिजेक्टेड है क्योंकि यहां पे फॉल्स नेगेटिव जो आपके पास है वो फाइव है मतलब क्या हो रहा है गाइ यहां पे कि 100 जो लोग आ रहे हैं मेरे यहां पे चेकिंग कराने के लिए उसमें से पांच लोगों को यह मॉडल बोल रहा है कि आपको बुखार नहीं है जबकि उसको एक्चुअल में बुखार था एक्चुअल में बुखार था और मॉडल क्या बोरहा है उसे बुखार नहीं है तो ये सिचुएशन जो है बहुत डेंजरस हो सकती है और यह डेंजरस होने की वजह से क्या होगा यहां पे वो पांच लोगों की डेथ भी हो सकती है मे बी दैट हो सकती है राइट तो क्या होगा गाइ यहां पे हमारी जो हॉस्पिटल है उनके ऊपर क्या हो जाएगा कंप्लेन हो जाएगा हमारे मॉडल के ऊपर कंप्लेंट हो जाएगा और हमारा मॉडल जो है वो बैन हो जाएगा राइट मे बी बैन हो सकता है ठीक है तो बेसिकली गाइ ये एक क्रिटिकल सिचुएशन है इस पर्टिकुलर पॉइंट के लिए कि उस पर्सन को बुखार था और मॉडल ने बोल दिया बुखार नहीं है और वो पर्सन एंजॉय करने लग गया उसकी तबीयत और ज्यादा खराब हो गई और मे बी दैट सिचुएशन पे आ गया तो ये जो फाइव दिख रहा है यहां पे मान नहीं मैं ये फाइ तो बहुत छोटा है लेकिन यदि हम उसे थोड़ा कंसीडर करें तो ये बहुत ज्यादा है ये आपके पास बुखार का नहीं कैंसर का होता यस ये कैंसर का मॉडल प्रिडिक्शन मॉडल होता और पांच लोगों को बोलता कि कैंसर नहीं है जबकि उसको कैंसर है और वो मेडिसिन नहीं लेते तो मे भी उनकी थ हो जाती और 100 में से पांच लोगों की डेथ इज वेरी वेरी क्रिटिकल चीज है राइट तो बेसिकली ये हमारी ली कंसीडरेबल नहीं है तो अब क्या करें ये फाइव नहीं ये फाइव हमारे लिए कंबल हो गई यदि मैं इस सिचुएशन के अंदर बात करूं तो यह फाइव मेरे लिए कंसीडर होगी तो टाइप टू एरर जो है वह हमारे लिए डेंजरस हो सकती है इसके किसी और सिनेरियो के अंदर टाइप वन भी डेंजरस हो सकती है तो जैसे कि मैंने स्टार्टिंग के वीडियो के स्टार्टिंग में बताया कि काफी बार आपके मॉडल जो होते हैं यस काफी बार जो मॉडल होते हैं वह अच्छी एक्यूरेसी देते हैं उसके बावजूद भी रिजेक्ट हो जाते हैं उसके पीछे रीज़न होता है यह फॉल्स नेगेटिव और फॉल्स पॉजिटिव एरर के अंदर टाइप वन और टाइप टू जो एरर आपको यहां देखने को मिल ही है इसकी वजह से आपके मॉडल जो हैं वो रिजेक्ट हो जाते हैं आई थिंक आई होप सो समझ में आ चुका होगा कि टाइप वन और टाइप टू एरर क्या होती है और किस वजह से रिजेक्ट हो जाता है और ये कंफ्यूजन मैट्रिक्स हमारे लिए कितनी इंपॉर्टेंट है ये कंफ्यूजन मैट्रिक्स आपको किस तरह की सिचुएशन के अंदर आपका मॉडल काम करेगा किस सिचुएशन के अंदर काम नहीं करेगा ये आपको कैसे बताती है आई थिंक आपको क्लियर समझ में आ गया होगा और आज की इस वीडियो के जरिए हम यहां पर बात करने वाले हैं कंफ्यूजन मैट्रिक्स के कुछ टर्म्स लॉजी जैसे कि ए1 स्कोर प्रेसीजन रिकॉल ये क्या होते हैं और किस सिनेरियो के अंदर हमें किस चीज का ध्यान रखना होता है आज के इस वीडियो के जरिए समझेंगे तो चलिए जरा इस एग्जांपल की दते लेट्स सपोज आप किसी कंपनी में काम कर रहे हैं और वह कंपनी क्या करती है कि उनके अंदर जितने भी मेल आ रहे होते हैं उस मेल को आपको स्पैम और नॉट स्पैम में फिल्टर करने के लिए बोलते हैं अब इसके लिए क्या कर रहे हैं दो मेंबर्स को असाइन किया जाता है आप और आपका फ्रेंड लेट्स आप सपोज a हैं और आपका फ्रेंड क्या है b है राइट अब क्या हो रहा है यहां पे आप दोनों ने अपने-अपने मॉडल्स तैयार किए हैं और मॉडल्स को तैयार करने के बाद में आप दोनों ने मॉडल सबमिट कराया अब यहां पे आपके दोस्त का मॉडल सेलेक्ट हो रहा है और आपका मॉडल सेलेक्ट नहीं हो रहा है क्योंकि आपके दोस्त ने कंफ्यूजन मैट्रिक्स की बहुत अच्छी तरीके से एनालिसिस की है और कंफ्यूजन मैट्रिक्स में होने वाली जो प्रॉब्लम्स है उस प्रॉब्लम को आइडेंटिफिकेशन मैट्रिक्स की एनालिसिस है क्या तो देखिए यहां पर मैंने दो सिनेरियो लिए हैं एक a है और दूसरा b है अब दोनों के दोनों सेम मॉडल्स हैं और हमें पता है कि कंफ्यूजन मैट्रिक्स क्या होती है यदि आपको नहीं पता है कंफ्यूजन मैट्रिक्स क्या होती है तो आप हमारी लास्ट वाली वीडियो जरूर देखें लेकिन यदि आपको पता है कंफ्यूजन मैट्रिक्स क्या होती है तो मैं थोड़ा सा एक आइडिया देना चाहूंगा कंफ्यूजन मैट्रिक्स के बारे में तो दैट इज अ कंफ्यूजन मैट्रिक्स इसके अंदर क्या होता है यहां पे हमारी ट्रू वैल्यू होती है और इस तरफ हमारी प्रेडिक्शन वैल्यू होती है अब ये ट्रू वैल्यू क्या चीज होती है तो ये आपकी ओरिजिनल वैल्यू होती है और ये मॉडल ने प्रेडिक्शन कर रखी वो वैल्यू होती है इसके हिसाब से आप क्या करते हैं अपनी एक मैट्रिक्स तैयार करते हैं दैट इज कॉल ऑफ कंफ्यूजन मैट्रिक्स अब बात करते हैं कि ये दोनों की मॉडल की शायद एक्यूरेसी अलग-अलग हो सकती है तो पहले हम इन दोनों मॉडल की एक्यूरेसी पता कर लेते हैं अच्छा इस मॉडल की यदि मैं एक्यूरेसी पता करूं तो वो क्या होगी आपके पास यहां पे 100 + 700 क्योंकि देखिए आपके पास स्पैम के ऊपर स्पैम इंडिकेट हो रहा है नॉट स्पैम के ऊपर आपके पास नॉट स्पैम इंडिकेट हो रहा है और वो टर्म्स ये है तो यदि मैं बात करूं गाइज यहां पे तो आपके पास क्या हुआ 100 + 700 ये आपके पास क्या हो गए आप क ट्रू वैल्यू मतलब जो आपके एक्चुअल वैल्यू आई है उसके बाद क्या करते हैं आप सभी का सम कर देते हैं चलिए सम करते हैं यहां पे तो क्या होगा 100 + 170 + 30 प्स आपके पास 700 ओके चलिए एक्यूरेसी निकालते हैं तो ऊपर आपके पास बन गया 800 नीचे बात करें तो ये आपके पास बन जाएगा 1000 कैसे तो देखिए आपके पास यहां पे इन दोनों को जोड़े तो 200 200 + 100 300 300 और 700 हो गया आपके पास यहां पे 1000 राइट अब यहां इसका परसेंटेज निकाले तो देखिए परसेंटेज निकालने के लिए इसको कट करते हैं एंड देन इसको कट करते हैं देन 80 पर आपके पास एक्यूरेसी आ रही है मतलब इस मॉडल की एक्यूरेसी आपकी 80 पर है अब बात करते हैं इस मॉडल की एक्यूरेसी कितनी है तो इस मॉडल की एक्यूरेसी अब देखिए फिर से निकाल लेते हैं तो देखिए 100 प्लस आपके पास कितना हुआ गाइस यहां पे यस 100 प्लस आपके पास 700 700 दोनों मिला के कितना हो गया 800 आपके पास हो गया देन नीचे बात करें तो ये देखिए ये दोनों मिला के आपके पास क्या है 200 और यह हो गया 800 और 200 हो गया आपके पास 1000 और यहां पे इसको कट करें तो यह भी आपको 80 पर दे रहा है इसका मतलब क्या है कि इन दोनों पर्सन ने जो मॉडल बनाया है इन दोनों पर्सन ने जो मॉडल बनाया है इन दोनों पर्सन की मॉडल की एक्यूरेसी की बात करें तो वो 80 पर है यस इन दोनों मॉडल की एक्यूरेसी आपके पास कितनी आ रही है 80 पर है लेकिन उसके बावजूद भी इन दोनों में से एक मॉडल रिजेक्ट होने वाला है वो कौन सा मॉडल रिजेक्ट होने वाला है जरा समझते हैं यहां पे लेट्स सपोज मैं एग्जांपल के तौर प बात करूं यहां पे तो देखिए जीरो पे जीरो आना मतलब नॉट स्पैम पे नॉट स्पैम बताना दैट इज द राइट पॉइंट ओके यदि स्पैम पे स्पैम बताना दैट इज द राइट पॉइंट हमारे लिए है अब देखिए यहां पे होता क्या है यदि मान लीजिए कि आपके पास आपकी कोई कंपनी का मेल है जो कि एक स्पैम मेल है और हमारा मॉडल उसे नॉट स्पैम कर देता है तो ये जो होता है दैट इज अलाउ यदि आपने देखा होगा कि जीमल के अंदर भी क्या होता है गाइस यहां पे काफी ऐसे मेल होते हैं जो कि नॉट स्पैम होते हुए जो स्पैम होते हुए भी हमारे पास नॉट स्पैम में आ जाते हैं मतलब हमारे इनबॉक्स के अंदर आ जाते हैं दैट इज कंस रेबल लेकिन मान लीजिए एक नॉट स्पैम मेल स्पैम में चला जाए तो क्या होगा इसको ऐसा मान लीजिए लेट्स सपोज आपकी किसी कंपनी में जॉब लगी है और जॉब से रिलेटेड आपका जो जॉब से रिलेटेड आपका जो कॉल लेटर है वह आपके पास आया अब मॉडल ने उसे स्पैम बना दिया है मॉडल ने क्या किया है उसे स्पम स्पैम बना दिया और उसे स्पैम बॉक्स में डाल दिया और लेट्स सपोज आपने वो स्पैम बॉक्स ओपन ही नहीं किया तो इससे होगा क्या कि वो जॉब के रिलेटेड जो कॉल लेटर आया था वो आप नहीं देख पाएंगे मतलब एक नॉट स्पैम मेल को स्पैम बताना हमारे लिए एक प्रॉब्लम एक प्रॉब्लम हो सकती है तो इसका मतलब क्या हुआ गाइस यहां पे कि जीरो को वन बताना यस जीरो मतलब आपके पास क्या है नॉट स्पैम मेल को स्पैम बताना दैट इज नॉट अ कंसर्ट बल हम इसे कंसर्ट बल नहीं कर सकते राइट तो जरा देखते हैं इनमें से कौन सी है राइट इनमें से वो कौन सी एरर है यहां पे तो देखिए एक नॉट स्पैम मेल को मेरे पास सेंड टू स्पैम मेल करना दैट इज अ 30 और यहां पे देखिए नॉट स्पैम मेल को स्पैम में बदलना दैट इज अ टैग राइट तो बेसिकली आप इन दोनों में से कौन सा मॉडल चूज करेंगे तो मॉडल मैं चूज करूंगा मॉडल ऑफ प इसका मतलब यदि आपका फ्रेंड का मॉडल यहां पर सेलेट हुआ है तो उसने क्या ध्यान रखा है कि यह वाली जो एरर आपका मॉडल जो कर रहा है वो मिनिमम रखी है राइट हां यदि आपका पास कोई स्पैम मेल है और उसे नॉट स्पैम के अंदर वो भेज रहा है तो दैट इज अ कंसर्ट बल ये कंफर्टेबल है ये कंफर्टेबल है 190 है ये कंबल है य कितनी भी ज्यादा होगी कंबल है बट गाइस मैं बात करूं यहां पे तो एक नॉट स्पैम मेल को स्पैम के अंदर भेजना दैट इज नॉट अ कंबल यह एप्लीकेबल नहीं होगा इसी वजह से आपका जो मॉडल है वो रिजेक्ट हुआ है और आपका जो फ्रेंड का जो मॉडल है वो सेलेक्ट हुआ है क्योंकि उसने इस चीज का ध्यान रखा है क्योंकि उसने ये जो 10 है ना ये 10 ये जो वैल्यू है इस चीज का ध्यान रखा है इसने इस चीज को कम बनाया है राइट क्योंकि उसने मॉडल के अंदर जो रिक्वायरमेंट है उसको समझा एंड देन उसके हिसाब से इसको कम बनाया अब ये क्या चीज है ये होता है आपका फाल्स नेगेटिव यस वन पे आप का जीरो आना यस वन पे क्या आना आपके पास यहां पे जीरो आना यस वन पे जीरो आना दैट इज कॉल्ड ऑफ फॉल्स नेगेटिव यस ये क्या होता है गाइज यहां पे दैट इज अ फॉल्स नेगेटिव तो उस पर्सन ने फॉल्स नेगेटिव वैल्यू को क्या रखा है कम रखा है अब लेट्स सपोज आप कोई एक मॉडल बना रहे हैं तो उसमें आप कैसे पता करेंगे कि फॉल्स नेगेटिव वैल्यू को जीरो रखना है तो इसके लिए हम इस्तेमाल करते हैं किसका प्रेसीजन का राइट क्योंकि प्रेसीजन यहां पे हमें बताता है कि फॉल्स नेगेटिव वैल्यू कितनी है यदि आपके पास फॉल्स नेगेटिव वैल्यू कम होगी तो प्रेसीजन की वैल्यू आपके पास हाई हो जाएगी कैसे जरा देखिए इस प्रेसीजन के फॉर्मूले को तो प्रेसीजन का फॉर्मूला क्या है गाइस यहां पे प्रेसीजन का फार्मूला है ट्रू पॉजिटिव अपॉन ट्रू पॉजिटिव प्लस फॉल्स पॉजिटिव यस फॉल्स पॉजिटिव यस हमें भी तो फॉल्स पॉजिटिव निकालना था तो आपको क्या करना है गाइस यहां पे फॉल्स नेगेटिव वैल्यू को कम कर करना है अब फॉल्स नेगेटिव वैल्यू कैसे एनालिसिस की जाती है गाइस यहां पे तो इसको जरा समझते हैं तो देखिए हमें क्या करना था यहां पे हमें नॉट स्पैम मेल को स्पैम इंडिकेट कर रहा था मतलब इस वाली वैल्यू को हमें क्या करना था कम करना था इस वैल्यू को कम करने मतलब आपके पास क्या है फॉर्स नेगेटिव वैल्यू को हमें कम करना है फॉल्स नेगेटिव वैल्यू को कम करने का मतलब है गाइ यहां पे आपको रिकॉल को बढ़ाना है मतलब यदि आप कोई मॉडल बना रहे हैं और मॉडल के ऊपर अलग-अलग तरीके से एनालिसिस कर रहे हैं तो उस वक्त आपको इस चीज का ध्यान रखना पड़ कि रिकॉल की वैल्यू आपके पास क्या होनी चाहिए हाई होनी चाहिए अब ये रिकॉल की वैल्यू कैसे हाई होनी चाहिए तो जरा इसको समझते हैं तो देखिए रिकॉल का फार्मूला देखिए आप यहां पे रिकॉल का फार्मूला है गाइ यहां पे ट्रू पॉजिटिव डिवाइड बाय ट्रू पॉजिटिव प्लस आपके पास होता है फॉल्स नेगेटिव अच्छा ट्रू पॉजिटिव की बात करें तो ट्रू पॉजिटिव की वैल्यू क्या है गाइ यहां पे यदि नॉट स्पैम पे नॉट स्पैम इंडिकेट हो रहा है दैट इज कॉल्ड ऑफ ट्रू पॉजिटिव राइट इसके ऊपर आप क्या कर रहे हैं फॉल्स नेगेटिव की वैल्यू को ले रहे हैं अब आपके पास क्या होगा यदि आप आपके पास फॉल्स नेगेटिव की वैल्यू जितनी कम होगी आपके पास रिकॉल की वैल्यू क्या होगी गाइ यहां पे उतनी ही ज्यादा बढ़ने वाली है क्योंकि रिकॉल जो है वो आपके पास क्या है इन्वर्सली प्रोपोर्शनल है किसके गाइज यहां पे फॉल्स नेगेटिव के तो आपको हर बार यहां पे कंफ्यूजन मैट्रिक्स के अंदर जाके ये चेक करने की जरूरत नहीं है मतलब आप यहां पे किसी एक डेटा सेट के ऊपर डिफरेंट डिफरेंट मॉडल्स बना रहे हैं यहां पे अभी तो केवल हमने यहां पे क्या समझा लॉजिस्टिक रिग्रेशन को ही समझा है लेकिन आगे चलते हुए हमारे पास बहुत सारे डिफरेंट डिफरेंट डि मॉडल होने वाले हैं तो यदि आप एक डाटा सेट के ऊपर यदि आप डिफरेंट डिफरेंट मॉडल बनाने जा रहे हैं तो उस वक्त आप क्या चेक करेंगे रिकॉल की वैल्यू चेक करेंगे यदि आपके पास फॉल्स नेगेटिव वैल्यू को कम करना है मैं किसी पर्टिकुलर एग्जांपल की नहीं बात कर रहा मैं यहां पे ये बात कर रहा हूं कि यदि आपको फॉल्स नेगेटिव की वैल्यू कम चाहिए तो उसके लिए आपको क्या करना पड़ेगा रिकॉल की वैल्यू को हाई रखना पड़ेगा राइट चलिए एक और दूसरा सीन लेते हैं यहां पे लेट्स सपोज आप किसी मेडिकल इंडस्ट्रीज के लिए काम कर रहे हैं जो कि क्या कर रही है एक मॉडल बना रही है और उस मॉडल को देख के बताया जा रहा है कि किसी पर्सन को कैंसर है या नहीं है राइट अब यहां पे भी आप क्या करते हैं दो मॉडल बनाते हैं मॉडल ए और मॉडल बी इसमें से भी आपका एक मॉडल रिजेक्ट हो जाता है अब ये रिजेक्ट क्यों होता है जरा समझते हैं यदि आप इस दोनों मॉडल की एक्यूरेसी देखेंगे तो एक्यूरेसी लगभग एक्यूरेसी आपके पास यहां पे सेम है यदि आप चेक कर सकते हैं यहां पे एक्यूरेसी को तो देखिए 8000 प् 1000 कितना हो गया 9000 9000 डिवाइड बाय यहां पे ये हो गया 1000 तो ये हो गया 10000 यस 9000 यस 9000 डिवाइड बाय आपका क्या है 10000 को आप यहां पे परसेंटेज के तौर पर निकालेंगे तो 90 पर यदि आप यहां पे मॉडल की एक्यूरेसी है राइट 90 पर आपके मॉडल की एक्यूरेसी है इस तरफ यदि आप निकालते हैं तो 90 पर आपकी मॉडल की एक्यूरेसी है लेकिन उसके बावजूद भी आपका इसमें से एक मॉडल रिजेक्ट होने वाला है अब वो कौन सा मॉडल रिजेक्ट होने वाला है जरा समझते हैं यहां पे लेट्स सपोज आपको कैंसर नहीं है और मॉडल ने भी बता दिया वो कैंसर नहीं है दैट्ची बल लेट्स सपोज आपको कैंसर नहीं है और मॉडल ने बता दिया आपको कैंसर है राइट मॉडल ने बता दिया कैंसर है ये भी एप्लीकेबल है यदि आपको कैंसर नहीं है और मॉडल ने बताया आपको कैंसर है तो आप ज्यादा से ज्यादा क्या करेंगे आप टैबलेट लेना स्टार्ट कर देंगे आप क्या करेंगे टैबलेट लेना स्टार्ट कर देंगे और जैसे ही आप टैबलेट लेंगे ठीक है आपके अंदर कुछ चेंजेज आपको देखने को मिल जाएंगे आप वापस दोबारा ट्रीटमेंट करवा लेंगे दोबारा चेक करवा लेंगे तो मॉडल आपको रिजेक्ट कर देगा राइट मतलब मॉडल आपको बोल देगा कि आपको कैंसर नहीं है लेकिन यदि मान लीजिए आपको कैंसर था और मॉडल ने बोल दिया कैंसर नहीं है मॉडल ने क्या बोला कैंसर नहीं है तो उस केसेस में क्या होगा उस केसेस में आप मेडिसिन नहीं लेंगे और आप और ज्यादा बीमार हो जाएंगे तो गाइस यदि आपको कैंसर है और मॉडल नॉट कैंसर डिटेक्ट कर रहा है दैट इज अ बिग मिस्टेक यस जरा समझते हैं यहां पे इस डायग्राम के थ्रू कि इनमें से कौन सा मॉडल यहां प परफेक्ट है मान लिया तो देखिए यदि किसी पर्सन को कैंसर है और मॉडल कह रहा है उसे कैंसर नहीं है मतलब नॉट डिटेक्ट कर रहा है यहां पे दैट इज अ वैल्यू ओके उस पर्सन को कैंसर है और मॉडल उसे नॉट डिटेक्ट कर रहा है यहां पे दैट इज अ वैल्यू अब इन दोनों वैल्यू को कंपेयर करें यहां पे तो जिसकी वैल्यू कम होगी हम उसी मॉडल को कंसीडर करेंगे यहां पर देखेंगे तो इस जगह 200 है और इस जगह 500 है तो मॉडल a सेलेक्ट हो चुका है मॉडल a क्या हो चुका है गाइ यहां पे आपका सेलेक्ट हो चुका है अच्छा इसके ऊपर बात करें कि ये क्या चीज होती है मतलब इस वाले पॉइंट के ऊपर बात करें तो दैट इज अ फॉल्स पॉजिटिव वैल्यू यस दैट इज अ फाल्स पॉजिटिव वैल्यू यस इस जगह पे बात करें दैट इज अ फॉल्स पॉजिटिव वैल्यू तो आपको क्या रखना है यहां पे फॉल्स पॉजिटिव वैल्यू को कम करना है क्या करना है फॉल्स पॉजिटिव वैल्यू को कम करना है अब फॉल्स पॉजिटिव वैल्यू को कम नहीं करना है इसकी जगह आपको प्रेसीजन को हाई करना है क्यों क्योंकि जो प्रेसीजन का फॉर्मूला होता है गाइज यहां पे वो क्या होता है ट्रू पॉजिटिव अपॉन ट्रू पॉजिटिव अपॉन फॉल्स पॉजिटिव राइट हमें क्या करना है फॉल्स पॉजिटिव वैल्यू को कम करना है तो फॉल्स पॉजिटिव वैल्यू को जैसे ही आप कम करेंगे आपका प्रेसीजन ऑटोमेटिक क्या हो जाएगा हाई हो जाएगा तो जब भी आप एक से ज्यादा मॉडल बनाने जा रहे हैं और आपको कभी लगता है कि आपकी फॉल्स पॉजिटिव वैल्यू कम होनी चाहिए तो वहां पे आप प्रेसीजन को बढ़ा सकते हैं जितना ज्यादा प्रेसीजन होगा उतनी ही ज्यादा फॉल्स पॉजिटिव की वैल्यू कम होगी और उसके अंदर आप वही मॉडल को सेलेक्ट करेंगे तो गाइस डिफरेंट डिफरेंट सिनेरियो के ऊपर डिफरेंट डिफरेंट सिनेरियो के ऊपर आप अपना मॉडल चूज करते हैं कभी आप यहां पे प्रेसीजन को हाई करते हैं कभी आप रिकॉल को हाई करते हैं लेकिन ये डिपेंड करता है सिचुएशन के ऊपर क्योंकि फॉल्स पॉजिटिव वैल्यू और फॉल्स नेगेटिव वैल्यू दोनों ही डेंजरस है हमारे पास अलग-अलग सिचुएशन के ऊपर राइट तो इनमें से आपको क्या करना है दोनों को कम करना है लेकिन कभी कभी हमारे पास ऐसे सिनेरियो भी आते हैं जहां पर हमें दोनों को कम करने की जरूरत पड़ती है या फिर कभी-कभी ऐसे सिनेरियो आते हैं जहां पर हमें कोई आईडिया नहीं लगता है कि हम फॉल्स पॉजिटिव वैल्यू को कम करें या फॉल्स नेगेटिव वैल्यू को कम करें क्योंकि उस वक्त हमें डोमेन की ज्यादा एक्सपर्टीज नहीं होती है तो फिर उस केसेस में हम क्या करेंगे तो उस केसेस में हम जाएंगे ए1 स्कोर के ऊपर हम यहां पर f1 स्कोर को हाई करने की सोचेंगे क्योंकि f1 स्कोर का जो फार्मूला है वो आपके पास प्रेसीजन और रिकॉल से मिक्स होके बना है यहां पे तो यहां पे आपके पास क्या होगा जितना ज्यादा आपके पास यहां पे प्रेसीजन और रिकॉल ज्यादा होगा f1 स्कोर उतना ही ज्यादा हो जाएगा तो इस केसेस में आपको क्या करना है गाइज यहां पे आपको f1 स्कोर फाइंड आउट करना है जब भी आपको लगे कि आप डेटा सेट के बारे में ज्यादा नॉलेज नहीं रखते हैं तो उस वक्त आपको f1 स्कोर के ऊपर फोकस करना चाहिए और आपको f1 स्कोर की वैल्यू को बढ़ाना चाहिए जितनी ज्यादा f1 स्कोर की वैल्यू होगी वही मॉडल कंसीडरेबल होगा क्योंकि f1 स्कोर जो है वो आपके पास क्या है हार्मोनिक मीन है क्या है गाइस यहां पे हार्मोनिक मीन है किसका गाइस यहां पे आपके पास प्रेसीजन एंड रिकॉल का प्रेसीजन एंड रिकॉल का हार्मोनिक मीन कौन सा है गाइज यहां पे f1 स्कोर होता है राइट तो आपको क्या करना है हर आपको f1 स्कोर की वैल्यू बढ़ानी है तो गाइस कभी भी आप क्लासि मैट्रिक्स बनाना चाहे तो उस वक्त एक चीज का ध्यान रखें प्रेसीजन हाई होना चाहिए रिकॉल हाई होना चाहिए f1 स्कोर हाई होना चाहिए राइट यदि आप तीनों नहीं कंसीडर कर रहे तो आपको कंफ्यूजन मैट्रिक्स को देखकर उसकी एनालिसिस करनी चाहिए अब जरा यहां पर समझते हैं कि ये कैसे फाइंड आउट की जाती है मतलब थोड़ा प्रैक्टिकली समझते हैं ये तीनों वैल्यू को कैसे निकाला जाता है कंफ्यूजन मैट्रिक्स को कैसे बनाया जाता है तो इसको थोड़ा प्रैक्टिकली समझते हैं तो देखिए प्रैक्टिकली समझने के लिए मेरे पास एक डेटा सेट है जो कि एक प्लेसमेंट ड सीएसवी का डेटा सेट है मतलब आपके पास किसी कॉलेज में प्लेसमेंट हो रहे हैं या नहीं हो रहे उसके रिलेटेड हमारे पास डाटा सेट है जहां पे किसी पर्सन की सीजीपीए और स्कोर के बेसिस पे उसका प्लेसमेंट हुआ है या नहीं हुआ है यहां पे इंडिकेट किया गया है चलिए जरा इसके ऊपर मॉडल बनाते हैं और इसके ऊपर ये सारी चीजें फाइंड आउट करते हैं तो मैं चलता हूं यहां पे एक नई नोटबुक लेता हूं जुपिटर नोटबुक के अंदर और डटा सेट को लोड करता हूं और उसके बाद में हम इसके ऊपर मॉडल बना रहे हैं तो सबसे पहले हम क्या कर रहे हैं जो भी हमारे रिक्वायर्ड लाइब्रेरी है उसे इंपोर्ट कर रहे हैं जैसे कि पांडा हो गई मेलि हो गई सीन हो गई इनको फटाफट इंपोर्ट करते हैं तो पांडा देंगे क्योंकि हमें डाटा सेट को लोड करना है उसके बाद में हम इंपोर्ट करेंगे किसे हम इंपोर्ट करेंगे सीब को एलियाज ऑफ sns2 को लोड करने के लिए हमें पांडा की जरूरत पड़ेगी panda.com सवी है इसके ऊपर क्लिक करेंगे एंड क्लिक करके कॉपी एज पाथ मतलब इसका पाथ हम लेंगे ताकि हमारे जो शी थीरिया है वो लोड हो सके चलिए ये हमारा डटा सेट लोड हो चुका है अब डेटा सेट को हैड लगाते हुए इसके तीन डाटा को हम देखेंगे तो ये हमारे पास डेटा आ चुका है अब हमारा काम क्या है यहां पे इस डेटा में से डिपेंडेंट और इंडिपेंडेंट वेरिएबल को अलग-अलग करना चलिए जरा उसको करते हैं यहां पे तो एक्स एक्सेस लेते हैं यहां पे चलते हैं डेटा सेट के पास डॉट आई लॉक लेते हैं सारी रो लेंगे एंड सारे कॉलम्स लेंगे लेकिन -1 को हम छोड़ देंगे यहां पे एक्स एक्सेस का हमारा डाटा आ चुका है इसी तरह से आप वा एक्सेस के डाटा की बात करें यहां पे तो डेटा सेट के पास चलते हैं देन स्क्वायर ब्रैकेट और उसके बाद में हम प्लेस्ट को रन कर देते हैं चलिए अब हमारा डाटा आ चुका है डेटा आने के बाद में अब इस डटा के साथ क्या करते हैं ट्रेन और टस्ट के अंदर स्प्लिटिंग करते हैं क्योंकि हमारे पास यही डाटा है तो इसके अंदर ट्रेन और टस्ट के अंदर स्प्लिटिंग करना पड़ेगा तभी जाके आगे वर्क होगा तो ट्रेन और टस्ट के अंदर स्प्लिटिंग कर चलिए फ्रॉम साइकल एन के अंदर चले डॉट यहां पे चलेंगे मॉडल सिलेक्शन के ऊपर तो मैं च रहा हूं मॉडल सिलेक्शन के ऊपर दैट मैं इंपोर्ट करूंगा और इंपोर्ट किसे करना है गाइज यहां पे ट्रेन और टेस्ट स्प्लिटिंग को करना है उसके बाद में मैं चार वेरिएबल बनाऊंगा यहां पे x मैं बनाऊंगा ट्रेन ट्रेन देन मैं यहां पे बनाऊंगा x यहां पे बनाऊंगा टेस्ट देन y मैं बनाने वाला हूं ट्रेन एंड आपके पास क्या होगा यहां पे y आपके पास टेस्ट यस y टेस्ट होने वाला है राइट और उसके बाद हम ट्रेन और टेस्ट को लेंगे जिसके अंदर x और y डाटा देंगे उसके बाद हमारे पास है रैंडम स्टेट रैंडम स्टेट की वैल्यू मैं 42 रखूंगा और टेस्टिंग साइज की बात करें तो वो हो जाएगा 0.2 मतलब 20 मैं यहां पे ले रहा हूं हमारी टेस्टिंग साइज का राइट चलिए गाइस अब बढ़ते हैं इसे रन करते हैं अब हम यहां पे क्या करेंगे अब हम यहां पे मॉडल बनाते हैं मॉडल बनाने के लिए मैं फ्रॉम सेकंड न चलूंगा यहां पे डॉट लीनियर मॉडल के पास चलने वाला हूं और इंपोर्ट करूंगा किसे गाइस यहां पे आपके पास लॉजिस्टिक रिग्रेशन को उसके बाद एलआर के नाम से एक वेरिएबल बना लेते हैं और लॉजिस्टिक रिग्रेशन को कॉल कर देते हैं एल आड मॉडल को क्या करते हैं गाइ यहां पे मैं फिट करता हूं फिट के अंदर मैं x ट्रेन y ट्रेन डाल केसे रन करेंगे चलिए हमारा मॉडल बन चुका है एल डॉट यहां पे मैं स्कोर को चेक करूं तो स्कोर के अंदर हमारे जो एक्यूरेसी आएगी हम उे चेक करेंगे x टेस्ट और y टेस्ट की हेल्प से स्कोर आ रहा है 100% मतलब ये 100% एक्यूरेट मॉडल है लेकिन हमें यहां पे क्या करना है कंफ्यूजन मैट्रिक्स बनाना है रिकॉल और प्रेसीजन सबको देखना है तो चलिए जरा कंफ्यूजन मैट्रिक्स बनाते हैं और रिकॉल ऑफ प्रेसीजन को देखते हैं तो देखिए क्या करेंगे उसके लिए आप फ्रॉम सक लन के अंदर चलेंगे उसके बाद डॉट मैट्रेस के अंदर चलेंगे यस मैट्रेस के अंदर जाने के बाद दैट इंपोर्ट करना है किसे इंपोर्ट करना है आपको सबसे पहले इंपोर्ट करना है कंफ्यूजन मैट्रिक्स को तो यहां पे जाके कंफ्यूजन मैट्रिक्स को इंपोर्ट करना है देन आपको चाहिए प्रेसीजन तो यहां पे मैट्रिसेज के अंदर ही मैट्रेस के अंदर ही आपको प्रेसीजन मिल जाएगा तो ये रहा प्रेसीजन स्कोर उसके बाद में आपको क्या चाहिए रिकॉल चाहिए तो आपको यहां पे रिकॉल स्कोर मिल जाएगा उसके बाद में आपको क्या चाहिए f1 स्कोर चाहिए तो ये f1 स्कोर आपको मिल जाएगा तो ये तीनों मैट्रेस आपके पास आ चुके हैं अब हमें क्या करना है कंफ्यूजन मैट्रिक्स बनाना है तो चलिए कंफ्यूजन मैट्रिक्स बनाते हैं तो कंफ्यूजन मैट्रिक्स बनाने के लिए आपको चाहिए ट्रेनिंग का डाटा एंड आपके पास चा ये प्रेडिक्शन डाटा देन उसके बाद में आपकी कंफ्यूजन मैट्रिक्स जो है वो बन जाएगी तो एक तो y ट्रू चाहिए और एक क्या चाहिए y प्रोडक्शन चाहिए अच्छा y ट्रू कहां से मिलेगा तो y ट्रू मिलेगा y टेस्ट से और y प्रिडिक्शन कहां से मिलेगा तो एल आ डॉट यहां पे क्या इस्तेमाल करेंगे प्रिडिक्ट फंक्शन का इस्तेमाल करेंगे और उसके अंदर x यहां पे डालेंगे टेस्ट एंड देन रन करेंगे तो ये आपकी कंफ्यूज मैट्रिक्स बन चुकी है जिसके अंदर क्या है आपके पास ट्रू पॉजिटिव फाल्स नेगेटिव फाल्स पॉजिटिव एंड ट्रू नेगेटिव की वैल्यू आपके सामने दिखाई दे रही है अब क्या करते हैं इसको ग्राफिकल तौर पे रिप्रेजेंट करते हैं क्यों ये तो एक बेसिक मैट्रिक्स है यदि इसको ग्राफिकल तौर पे रिप्रेजेंट करना है तो उसके लिए मैं एस डॉट क्या करूंगा हिट मैप का इस्तेमाल करूंगा और हिट मैप के अंदर ये जो कंफ्यूजन मैट्रिक्स आई है इसको मैं क्या करूंगा सीएफ के नाम से एक वेरिएबल के अंदर सेव कर लूंगा और उसके बाद में मैं सीएफ को रन करूंगा और इसके अंदर मैं सीएफ डाल देता हूं राइट और इसके साथ-साथ मैं अन नोट को क्या कर दूंगा गाइज यहां पे ट्रू कर देता हूं उसके बाद में पीएटी डॉट यहां पर मैं शो करता हूं ताकि हम ग्राफ को देख सक और रन करते हैं तो ये हमारी कंफ्यूजन मैट्रिक्स बन चुकी है जिसके अंदर हम यहां पे आराम से इसकी एनालिसिस कर सकते हैं और ये जो कंफ्यूजन मैट्रिक्स बनी है आप इसे गौर से देखिए गाइ यहां पे यही कंफ्यूजन मैट्रिक्स को हमने पढ़ा है क्योंकि साइकेड लर्न की ही मॉड्यूल को हम इस्तेमाल कर रहे हैं तो मेक शयो ध्यान रखें क्योंकि अ यदि आप कहीं पे भी और स्टडी कर रहे हैं राइट तो वहां पे भी आपको कंफ्यूजन मैट्रिक्स अलग-अलग तरीके से बनेगी लेकिन हम जो कंफ्यूजन मैट्रिक्स इस्तेमाल कर रहे हैं वो साइकेड लाइन की कंफ्यूजन मैट्रिक्स है इसीलिए मैंने आपको यही कंफ्यूजन मैट्रिक्स स्टडी कराई है चलिए अब बात करते हैं ये तो हो गई हमारी कंफ्यूजन मैट्रिक्स उसके बाद में हमें क्या निकालना है प्रेसीजन एंड रिकॉल की वैल्यू निकालनी है हाउ टू फाइंड द प्रेसीजन एंड रिकॉल तो देखिए अभी हमने प्रेसीजन स्कोर निकाला था प्रेसीजन स्कोर को जब आप ओपन करते हैं तो यहां पे भी आपको ट्रू एंड प्रेडिक्शन वैल्यू पूछी जाती है तो ट्रू वैल्यू क्या है यहां पे y टेस्ट है प्रिडिक्शन वैल्यू क्या है यहां पे गाइज यहां पे तो एर डॉट आपके पास है पिटे फंक्शन तो मैं एक काम करता हूं इसी को जस्ट कॉपी कर लेता हूं और जस्ट कॉपी करने के बाद में यहां पे मैं पेस्ट कर देता हूं राइट और इसको कर देते हैं मल्टीप्लाई बाय 100 क्योंकि प्रेसीजन स्कोर आएगा तो उसको मल्टीप्लाई बा 100 करने पर आराम से वैल्यू हम एनाला कर सकते हैं दैट इज 100% दैट इज अ वेरी गुड एक्यूरेसी अब हम लेते हैं रिकॉल स्कोर तो मैं रिकॉल ले रहा हूं यहां पे रिकॉल के अंदर जाने के बाद y ट्र और वा पीआरडी की वैल्यू मांगी जा रही है y ट्रू क्या है गाइज यहां पे y टेस्ट है और पीआरडी वैल्यू क्या है यहां पे तो एलआर डॉट यहां पे मैं क्या करूंगा प्रिडिक्ट फंक्शन का इस्तेमाल करूंगा जिसके अंदर x में टेस्ट यहां पे देने वाला हूं राइट तो ये हमें क्या दे रहा है वन दे रहा है और इसके अंदर यदि मैं मल्टीप्लाई बाय 100 करूं यस क्या करने वाला हूं गाइ यहां पे मल्टीप्लिकेशन बाय 100 कर रहा हूं यहां पे अ एक छोटा सा एक और ब्रैकेट लग गया है यहां पे मल्टीप्लाई बा 100 करें तो हमें परसेंटेज में रिकॉल मिल जाएगा इसी तरह से हमें f1 स्कोर निकालना है तो चलिए f1 स्कोर भी निकाल देते हैं यहां पे इसके लिए क्या करेंगे y टेस्ट मैं यहां पे दूंगा और उसके बाद एलर ड प्रिडिक्ट फंक्शन का इस्तेमाल करूंगा जिसके अंदर x अंडर जो टेस्ट है हमारा वो मैं देने वाला हूं और मल्टीप्लिकेशन बाय 100 करते हैं तो ये भी आपके आ मिल जाती है तो आपको हमेशा जब भी आप मॉडल बनाना चाहे तो आपके पास एटलीस्ट आप यहां पे प्रेसीजन रिकॉल एंड f1 स्को जरूर चेक करें और ये तीनों की वैल्यू क्या होनी चाहिए हाई होनी चाहिए क्योंकि ये कहीं ना कहीं आपके पास आपके पास फॉल्स नेगेटिव और फॉल्स पॉजिटिव वैल्यू को कम कर रहे होते हैं तो मेक श्यर प्रेसीजन रिकॉल की वैल्यू को क्या करें हाई रखें f1 स्कोर की वैल्यू को भी क्या करें हाई रखने की कोशिश करें राइट तो आई थिंक आई होप सो समझ में आया होगा प्रेसीजन क्या होता है रिकॉल क्या होता है ए1 स्कोर क्या होता है राइट ये तीन मैट्रिक्स आपके पास क्लासि एनालिसिस के लिए बहुत ही ज्यादा इंपॉर्टेंट होती है और आज के इस वीडियो के जरिए हम बात करेंगे इन बैलेंसिंग डाटा सेट के बारे में देखिए क्लासि एनालिसिस के अंदर जो सबसे बड़ी प्रॉब्लम होती है वो होती है इन बैलेंसिंग डेटा सेट की इन बैलेंसिंग डेटा सेट का मतलब यह है कि आपके पास जो भी डेटा सेट है उस डेटा सेट के अंदर जो भी आपकी कैटेगरी बनी हुई है उस कैटेगरी के अंदर कोई एक कैटेगरी बहुत ही ज्यादा बार आ जाती है लेट्स सपोज इसका एक एग्जांपल लेते हैं मान लीजिए आप किसी एयरपोर्ट कंपनी के लिए काम कर रहे हैं मतलब एयरपोर्ट ऑथराइज कंपनी के लिए काम कर रहे हैं वो आपके पास से एक मशीन लर्निंग सिस्टम बनाना चाहती है मतलब एक एआई सिस्टम बनाना चाहती है जिसके थ्रू वो किसी भी ह्यूमंस का फेस को डिटेक्ट करके या फेस को रीड आउट करके पहचान सके कि ये जो पर्सन है वो इंडियन है या नहीं है राइट ऐसा कुछ यहां पे वो सिस्टम बनाना चाहती है अब इसके लिए उनको डेटा सेट चाहिए का अब डेटा सेट चाहिए का तो वो क्या करते हैं वो आपको बोलते हैं कि आइए हमारी यहां पे और डेटा सेट को नोट डाउन कीजिए अब आपने क्या किया कोई भी एक एयरपोर्ट पकड़ा और वहां पे जाक के बैठ गए अब वहां पे जब आप बैठते हैं तो आपको पता है कि यदि आप इंडियन एयरपोर्ट प बैठे हैं तो वहां पे इंडियन पीपल सबसे ज्यादा जाते हैं और फॉरेन के जो पीपल है वो कम आते हैं अब जब भी आप अपना मॉडल बनाने चलेंगे इस डाटा के ऊपर तो आपको इंडियन पीपल्स का जो डाटा है वो सबसे ज्यादा देखने को मिलेगा और फॉरेन पीपल का जो डाटा है वो आपको कम देखने को मिलेगा इससे होगा क्या इससे यह होगा कि आपका जो मॉडल है वो बायस हो जाएगा बायस का मतलब है कि वो इंडियन डाटा के ऊपर या फिर मैं बात करूं इंडियन डाटा के जो पर्सन के फीचर है उनके ऊपर ट्रेंड हो जाएगा और जब भी आप कोई नया डाटा लाके दोगे वो हमेशा और हमेशा इंडियन डाटा को ही रिप्रेजेंट करेगा या फिर इंडियन पर्सन को ही रिप्रेजेंट करेगा इस सिचुएशन को बोलते हैं इन बैलेंसिंग डेटा सेट तो इन बैलेंसिंग डेटा सेट से क्या होता है दिक्कत यहां पे दिक्कत बहुत ही सिंपल है कि आपका जो मॉडल है वो बायस हो जाता है किसी पर्टिकुलर एक ही आउटपुट को रिप्रेजेंट करता है यदि आपको पाइथन मशीन लर्निंग डेटा साइंस एंड डेटा एनालिस जैसी फील्ड में अपने आपको को ग्रो करना है तो इसके लिए डब्लू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं जैसे कि एग्जांपल के तौर पे बात करें यहां पे लेट्स सपोज कि आपके पास यहां पे 500 रोज का डाटा है यस 500 रोज का डाटा है इस 500 रोज में से आप 400 100 जो रोज है वो आप कैट के लिए ट्रेन कर रहे हैं और 100 जो रोज है वो आप डॉग के लिए ट्रेन कर रहे हैं तो आप जब अपना मॉडल बनाने चलेंगे यहां पे तो मॉडल क्या होगा यहां पे कैट के अकॉर्डिंग हो जाएगा अब यहां पे आप डॉग का डाटा देंगे तब भी मॉडल आपका क्या कहेगा कैट को ही बताएगा और उसके पीछे रीजन क्या है क्योंकि आपका मॉडल बायस हो चुका है पर्टिकुलर एक डाटा के ऊपर इस प्रॉब्लम को दूर करने के लिए हम यहां पे एक टेक्निक इस्तेमाल करते हैं जिसकी हेल्प से आप इन बैलेंसिंग डाटा को बैलेंसिंग डाटा के अंदर कन्वर्ट करते हैं अब यह टेक्निक कौन सी है तो इसके लिए हम यहां पर दो टेक्निक का इस्तेमाल करते हैं पहली टेक्निक के अंदर बात करेंगे तो पहली टेक्निक हमारे पास यहां पे है रैंडम अंडर सैंपलिंग यस पहली टेक्निक के अंदर बात करें हम यहां पे तो वो कौन सी है रैंडम अंडर सैंपलिंग है यहां पे और दूसरी टेक्निक की बात करें तो दूसरी टेक्निक है हमारी रैंडम ओवर सैंपलिंग अब ये रैंडम अंडर सैंपलिंग और ओवर सैंपलिंग कैसे काम करती है जरा समझे देखिए रेंडम एंडल सेपलिंग के अंदर क्या होता है कि जो भी आपका डाटा लार्ज जो डाटा होता है जिस कैटेगरी का डाटा लार्ज होता है उस कैटेगरी के लार्ज डाटा में से रैंडम आप क्या करते हैं कुछ कुछ सैंपल्स निकालते हैं और आपके पास जो लोएस्ट डाटा होता है उसके इक्वल कर देता है मतलब लेट्स अभी मैंने यहां पर बताया था आपको कि 500 डाटा आपके पास पड़ा है यहां पे 500 डाटा में से 100 डाटा जो है वो डॉग को रिप्रेजेंट करता है और आपके पास यहां पे जो 400 डाटा है वो क्या करता है कैट को रिप्रेजेंट करता है तो आप क्या करेंगे यहां पे यस आप इस टेक्निक के अंदर क्या करेंगे कि ये जो कैट का डाटा है यहां पे इसमें से रैंडम क्या करने वाले हैं 100 कैट का डाटा निकालने वाले हैं तो आप क्या करते हैं यहां से 100 रैंडम कैट का डाटा आपने क्या किया यहां से गेट किया यहां पे बस ये काम किया अब आपके पास जो डेटा सेट होगा वो नया वाला डेटा सेट ये होगा ना कि ये होगा आपके पास ये डाटा होगा इस टेक्निक को हम बोलते हैं रैंडम अंडर सपली राइट अब बढ़ते हैं अगले टेक्निक के ऊपर दैट इज अ रैंडम ओवर सैंपलिंग रैंडम ओवर सैंपलिंग में क्या होता है गाइज यहां पे लेट्स आपके पास यहां पे 500 डाटा है इस 500 डाटा के अंदर आपके पास क्या है 400 डाटा किसका है कैट का है और 100 डाटा आपके पास किसका है डॉग का है राइट इसके अंदर हम क्या करते हैं गाइ यहां पे कि ये जो डॉक का डाटा है इस डॉक के डाटा को रिपीटेशन कर देते हैं अकॉर्डिंग टू दिस डाटा मतलब मैं यहां पे क्या कर रहा हूं कि आपके पास इस डॉक के डाटा को कन्वर्ट करके 400 डॉक के डाटा को बना रहा हूं अब ये 400 डॉट के डाटा जो मैंने बनाए यहां पे ये क्या होगा इसी के डुप्लीकेसी चलती रहेगी मतलब 100 100 100 100 के मैंने क्या किया यहां पे चार पैकेज बना दिए दैट इज अ 400 डाटा और इस तरह से हमारे पास यह वाला डाटा और यह वाला डाटा एक सेम बैलेंस में आ जाता है राइट तो ये टेक्निक होती है रैंडम ओवर सैंपलिंग तो रैंडम अंडर सैंपलिंग रैंडम ओवर सैंपलिंग से आपके डाटा के अंदर जो इन बैलेंसिंग चल रही है आप उस इन बैलेंसिंग को दूर कर सकते हैं अब यह कैसे होता है प्रैक्टिकली इसको जरा समझते हैं तो देखिए मेरे पास एक डेटा सेट है पहले मैं आपको उस डेटा सेट के बारे में दिखा देता हूं यस उस डेटा सेट के बारे बात कर लेते हैं तो ये मेरा डटा सेट है जो कि हमारे पास किस नाम से है यहां पे सोशल मीडिया नेटवर्क से नाम से अब ये सोशल मीडिया नेटवर्क कैसे है जैसे कि आपने इस डेटा सेट के बारे में पहले भी देखा होगा इस डेटा सेट के ऊपर हमने पहले भी वर्क किया है और नहीं किया है तो इसको डेटा सेट को समझते हैं यहां पे ये डटा सेट क्या करता है कि किसी पर्टिकुलर एज और उसकी सैलरी के ऊपर उस पर्सन ने कोई भी सोशल मीडिया नेटवर्क्स खरीद रखा है या नहीं खरीद रखा है उसके बारे में डटा जस्ट लाइक आप यह मान लीजिए कि किसी पर्सन ने सप्शन खरीदा है या नहीं खरीदा है उससे रिलेटेड ये डटा है यहां पे क्या कर रखा है एज और एस्टिमेटर के बेसिस पे बताया गया है कि किसी पर्सन ने उसको खरीदा या नहीं खरीदा मतलब आपके पास amazonflex.in पे हम यह काम करने वाले हैं अब सबसे पहले मैं क्या करता हूं हमारे डटा सेट को लोड करता हूं डटा सेट को लोड करने के लिए मैं यहां पे पंडा को इंपोर्ट कर देता हूं उसके बाद यहां पर मैं क्या करता हूं डेटा सेट के नाम से एक वेलेबल बनाता हूं पडी ड यहां पर _ सीएवी के हल से ये जो सोशल मीडिया नेटवर्क्स है इसे मैं रन कर लेता हूं उसके बाद मैं अपने डटा सेट को देखता हूं डॉट हैड लगाते हुए इसके तीन डाटा को राइट अब मेरे को परचेस को चेक करना है कि क्या ये डटा इन बैलेंसिंग है या नहीं है चलिए चेक करते हैं यहां पे चेक करने के लिए क्या करेंगे आप यहां पे आप अपने डाटा सेट के पास जाएंगे एंड आप यहां पे परचेज को कॉल करेंगे यस यहां पे क्या करना है आपको सिंपल सा परचेज को कॉल करना है परचेज को कॉल करने के बाद में आपको यहां पे क्या करना है इसकी वैल्यू काउंट्स करनी है वैल्यू काउंट से क्या होगा कि आपके पास जितने भी यूनिक डाटा है उनकी काउंटिंग होगी कि ये कितनी बार रिपीटेशन हो रहा है तो मैं यहां पे क्या करूंगा वैल्यू अंडरस्कोर आपके पास जो काउंट्स जो फंक्शन है आपके पास यहां पे उसको अप्लाई करूंगा तो जब मैंने वैल्यू काउंट्स को अप्लाई किया तो मुझे पता चला कि जो जीरो है वो आपके पास कितना वाला है 257 टाइम आया है और जो वन है वो आपका 143 टाइम आया है मतलब यहां पे डटा में इन बैलेंसिंग है अब जब मैं अपना यहां पे मॉडल तैयार करूंगा तो इसमें होगा क्या इसमें ये होगा कि मेरा जो मॉडल है वो जीरो के अकॉर्डिंग बन जाएगा मतलब जीरो के ऊपर बायस हो जाएगा अब जब भी मैं इसमें कोई भी इनपुट दूंगा तो ये हमेशा और हमेशा मुझे क्या देगा जीरो आंसर देगा मतलब मोस्ट ऑफ केसेस में हमेशा तो हमेशा नहीं बोल सकता मैं यहां पे अब मोस्ट ऑफ केसेस के अंदर मुझे जीरो आंसर देगा बहुत ही लेस्ट केसेस के अंदर मुझे क्या देगा आपके पास वन आंसर देगा चलिए इसके ऊपर पहले मॉडल बनाते हैं और उसकी एक्यूरेसी को चेक करते हैं कि कैसी बनने वाली है तो इसके ऊपर मॉडल बनाने के लिए मैं क्या करने वाला हूं गाइ यहां पे अ मैं सिंपल सा क्या करूंगा गाइज यहां पे पहले तो ये परचेस को अलग करूंगा एज और एस्टीमेट सैलरी को अलग करने वाला हूं तो एज और एस्टीमेट सैलरी को अलग करने के लिए मैं यहां पे x नाम का एक वेरिएबल बनाऊंगा और उसके बाद मैं डाटा सेट को लूंगा डॉट यहां पर मैं आलग को लेने वाला हूं और आई लॉक के अंदर मैं सारी रो को लूंगा एंड देन कॉलम की बात करें यहां पे यस तो मैं यहां पे सारे कॉलम लूंगा सिवाय परचेस के मैं एक् के डाटा को देखूं तो ये हमारा एक्स का डाटा आ चुका है इसी तरह से मुझे मुझे वा का डाटा देखना है तो मैं डेटा सेट के पास जाऊंगा एंड यहां जाके मैं परचेस को कॉल करने वाला हूं तो ये मेरा वा का डटा आ गया इसके बाद हम क्या करने वाले हैं हमारे डाटा के अंदर ट्रेन और टेस्टक के अंदर स्प्लिटिंग करने वाला है तो मैं फ्रॉम साइकिल एंड के अंदर चलूंगा डॉट यहां पे जाके क्या करने वाला हूं गाइस यहां पे मॉडल सिलेक्शन को लेने वाला हूं क्योंकि मैं अपना मॉडल को ट्रेन और टस्ट मेरा जो डेटा सेट है इसे मैं ट्रेन और टस्ट के अंदर स्प्लिटिंग करना हूं तो इसके लिए मॉडल सिलेक्शन का इस्तेमाल करूंगा और उसके अंदर ट्रेन टस्ट स्प्लिटिंग दूंगा अब यहां पे x अंड मैं यहां पे ट्रेन के नाम से एक वेरिएबल बना लेता हूं x अ मैं यहां पे टेस्ट के नाम से एक वेरिएबल बना देता हूं y मैं यहां पे ट्रेन के नाम से एक वेरिएबल बना ले रहा हूं फिर से एंड y मैं यहां पे टेस्ट के नाम से वेरिएबल बना देता हूं उसके बाद हम ट्रेन ट स्लिटिंग कर लेते हैं उसके बाद x y का डाटा दे देते हैं और यहां पे रैंडम स्टेट की वैल्यू दे देते हैं 42 एंड इसके साथ-साथ मैं यहां पे दूंगा हमारी टेस्टिंग साइज तो टेस्ट साइज दे देते हैं 0.2 20 ओके चलिए इसे रन करते हैं हमारा जो डाटा है वह ट्रेन और टेस्ट के अंदर स्प्लिटिंग हो चुका है अच्छा ट्रेन टेस्ट की स्प्लिटिंग के अंदर मेरी थोड़ी स्पेलिंग मिस्टेक हो गई है तो t एंड ट्रेन की स्पेलिंग चेंज कर देता हैं ओके तो ट्रेन टस्ट के अंदर स्प्लिटिंग हो चुका है अब बात करते हैं हमारे मॉडल के लिए तो हम यहां पे लगाने वाले हैं सिंपल आपके पास लॉजिस्टिक डिग्रेशन लगाने वाले हैं ओके तो मैं लॉजिस्टिक रिग्रेशन लगा रहा हूं फ्रॉम साइकन की हेल्प से डॉट यहां पे लीनियर मॉडल के अंदर चलूंगा लीनियर मॉडल के अंदर चलने के बाद दैट मैं इंपोर्ट करने वाला हूं किसे यहां पे लॉजिस्टिक रिग्रेशन को राइट तो मैंने लॉजिस्टिक रिग्रेशन ले लिया उसके बाद एलर नाम से एक वेरिएबल बना देते हैं और लॉजिस्टिक रिग्रेशन को कॉल कर देते हैं उसके बाद एल डॉट मॉडल को क्या करते हैं गाइ यहां पे फिट करते हैं फिट के अंदर x अंडर मैं यहां पे ट्रेन लेने वाला हूं अब यहां पे कोई भी ले सकते है वैसे फिलहाल मैंने दो अलग-अलग वेरिएबल बना रखे है इसलिए और यहां पे एकस को टेस्ट ले सकते हैं हमारा जो मॉडल है वो यहां प फिटिंग हो रहा है वई शुड बी वन डायमेंशन अरे एंड गेट टू डायमेंशन एक छोटी सी प्रॉब्लम हो चुकी है देखते हैं यहां पे ओके y अंड टेस्ट ले लेते हैं x ट्रेन और y जो ट्रेन है यहां पे वो ले लेते हैं और रन करते हैं तो हमारा मॉडल जो है वो बन चुका है अब बात करते हैं इसके स्कोर के बारे में तो देखिए अला डॉट यहां पे स्कोर की चेक करें तो स्कोर के अंदर मेरे पास यहां पे चेक करने के लिए x टेस्ट y टेस्ट देना पड़ेगा और रन करूंगा तो एक्यूरेसी जो मुझे मिल रही है यहां पे वो मिल रही है मुझे 65 पर एक्यूरेसी ओके अब मुझे चेक करना है कि क्या ये आपके पास बायस हो चुका है या नहीं हो चुका है इसको चेक करने के लिए अ डॉट मैं यहां पे क्या करूंगा प्रिडिक्ट फंक्शन का इस्तेमाल करूंगा यहां पे अब हमारा डाटा देना पड़ेगा अब डाटा के लिए मैं चलू ऊपर तो देखिए 19 और यहां पे ये चलता हूं पहला डाटा ये लगाता हूं 19 और 000 19000 लगाता हूं यहां पे राइट देखते हैं इसके अंदर क्या रिजल्ट आता है रन करते हैं यहां पे चलिए अब जरा थोड़ा डाटा को प्रेडिक्शन करते हैं तो अलर डॉट में यहां प प्रक फंक्शन का इस्तेमाल अ डट मैं यहां प प्रेक्ट फंक्शन का इस्तेमाल करने वाला हूं यहां पे इसके अंदर मैं टू डायमेंशन डेटा सेट लेता हूं यहां पे और ये 19 और 19000 पहला ही डाटा यहां पे उठा द हैं मतलब मैं यहां पे अपना जो पहला डाटा है उसको रख रहा हूं यहां पे और पहला डाटा को रखने के बाद में मैं यहां पे क्या कर रहा हूं रन कर रहा हूं ठीक है ये ज़ीरो आंसर दे रहा है दैट्ची बात है क्योंकि ये आपका रो भी है और ये ज़ीरो आंसर भी दे रहा है मुझे चेक करना है वन के केसेस पे कि वन के केसेस में क्या ये ज़ीरो देता है चलिए वन के केसेस वाला रिजल्ट ढूंढते हैं यहां पे तो देखिए वन के केसेस के ये रहा रिजल्ट हमारा जहां पे 40 और 26 है राइट तो मैं इस डाटा को क्या कर रहा हूं कॉपी कर लेता हूं और मैं आप लोगों को वहां प्रेडिक्शन करके दिखाता हूं जहां पे मैंने प्रिडिक्ट फंक्शन बनाया अब एक काम करते हैं जो 19 है उसे हटा के एक बार 45 डाल देते हैं और यहां से ये डाटा हटा के क्या करते हैं 26 डाल देते हैं चलिए इसे रन करते हैं यहां पे तो देखिए आप यहां पे ऑब्जर्व करेंगे इसका जो आंसर आपको मिला है वो जरो मिला है ना कि यह वन मिला है अब रीजन उसका यही है सिंपल सा कि ये वन होते हुए भी रो दिखा रहा है क्यों क्योंकि आपका डाटा यहां पे इन बैलेंसिंग है यहां पे जीरो जो है वो डोमिनेटिंग हो चुका है चलिए एक बार और कोई दूसरा मॉडल ट्राई करते हैं जैसे 46 और 288 पे ये वन आपके पास है इसको थोड़ा ट्राई कर लेते हैं तो इसको ट्राई करने के लिए मैं वापस यहां पे देखिए प्लेस कर देता हूं इस बार मैं 45 की जगह क्या करता हूं 46 कर लेता हूं और ये आपके पास जो 26 है इसको 28 कर देता हूं ओके और इस बार मैं रन करता हूं तो इस बार भी मुझे जो आंसर है वो रो मिल रहा है इसका मतलब हमारा पास यहां जो मॉडल बना है वो बायस हो चुका है यहां पे हर एक कैटेगरी के अंदर हमें जीरो ही रिप्रेजेंट कर रहा है मतलब मोस्ट ऑफ द आंसर्स यहां पे मुझे जीरो मिलने वाले हैं अब इस बायनेस को दूर कर करने के लिए हमें क्या करना पड़ेगा डेटाबेस के अंदर इस बायस नेस को दूर करने के लिए हमें इस क्या करना पड़ेगा कि जो डेटा सेट है इसे बैलेंसिंग करना पड़ेगा अब ये बैलेंसिंग के लिए आप दो टेक्निक इस्तेमाल कर सकते थे जैसे कि मैंने आपको बताया रैंडम ओवर सैंपलिंग और रैंडम एंडन सैंपलिंग चलिए इन दोनों को टेक्निक को इस्तेमाल करते हैं लेकिन इस टेक्निक को इस्तेमाल करने से पहले हमें क्या करना पड़ेगा हमें एक मॉड्यूल की जरूरत पड़ेगी जिस मॉड्यूल का नाम है आई एम बैलेंस मॉड्यूल चलिए जरा यहां पर उस मॉड्यूल को इंपोर्ट करते हैं तो आपको क्या करना है ब आई एम बी लर्न के नाम से यहां पे मॉड्यूल है यस जो कि डाटा सेट को बैलेंसिंग करता है इसको पहले क्या करना है सबसे पहले आप इसको क्या करें इंपोर्ट कर ले तो पेप इंस्टॉल आ आईम बी लर्न मॉड्यूल है यहां पे इसको इंपोर्ट करें इसको क्या बोल रहा हूं यार आज मैं भी ओके सबसे पहले इसके लिए हमें एक मॉड्यूल की जरूरत पड़ेगी जिसका नाम है आईएम बी लर्न मॉड्यूल है यहां पे जिसकी हेल्प से डाटा सेट आपके पास क्या आता है बैलेंसिंग होता है चलिए पहले हम क्या करते हैं अपने सिस्टम के अंदर उसे डाउनलोड कर लेते हैं कैसे हां हेलो यस हां अरे क्या बात कर रहे हो अरे रुको मैं आपको वापस भेजता हूं मुझे यार मैं कुछ काम कर रहा था एक व जूम आईडी तो बनाओ सर आज वाले बंदों में से कितने इंटरेस्टेड है फीस दे दी दे देंगे नहीं दे देंगे और दे दी में बहुत अंतर होता है दे देंगे चलो मैंने लिंक भेजा है लिंक भेज ना तो इसके लिए हम यहां पे इस्तेमाल करेंगे आई एम बल आई एम बील मॉड्यूल का ओके तो सबसे पहले इसे क्या करते हैं हमारे सिस्टम के अंदर डाउनलोड करते हैं देन उसके बाद में हम इसके ऊपर वर्क करते हैं चलिए जरारा इसको इस्तेमाल करते हैं तो मैं यहां पे क्या करूंगा आई एम बी लर्न आपका यहां पे रन करूंगा तो आपको देखिए पाइथन का ऑफिशियल वेबसाइट मिल जाएगी जहां पे आईम बी लर्न मॉड्यूल मिलेगा आप यहां पे जाएं पिप इंस्टॉल आईम बी लर्न को कॉपी करें नीचे जाके आप यहां पर क्या करें कमांड प्रम को ओपन करें और यहां से अपने सिस्टम के अंदर इस मॉड्यूल को इंस्टॉल कर लें मतलब डाउनलोड कर लें तो ये हमारे पास डाउनलोड हो रहा है फिलहाल ये हमारे सिस्टम में डाउनलोड नहीं है तो डाउनलोड हो रहा है यदि आपके सिस्टम में डाउनलोड है ऑलरेडी तो डाउनलोड अ आपके सिस्टम में डाउनलोड है तो डाउनलोड यदि आपके सिस्टम में ऑलरेडी डाउनलोड है कट इस तरह से आप अपने सिस्टम के अंदर डाउनलोड कर लें जैसे कि मैंने यहां पे किया है चलिए अब इसे मैं क्या करता हूं यहां से क्लोज कर देता हूं वापस आ जाता हूं यहां पे अब एक काम करते हैं एक नया यहां पे सेटअप तैयार करते हैं और उसके अंदर सीखते हैं कि आईम बी लर्न मॉड्यूल कैसे वर्क करता है तो इसके लिए मैं क्या कर रहा हूं यहां पे एक नई जुपिटर नोटबुक की जो फाइल है वो रेडी कर लेता हूं अब इसमें से मुझे काफी फाइल यहां से कॉपी पेस्ट करनी पड़ेगी तो मैं इस फाइल को क्या कर रहा हूं साइड बाय साइड कर रहा हूं ताकि हम यहां पे आराम से इसमें कॉपी पेस्ट कर सके जैसे कि फर्स्ट टू लाइंस है उनकी जरूरत तो मुझे बार-बार चाहिए गी तो सबसे पहले मैं यहां पे पांडा को इंपोर्ट करूंगा हम राइट साइड में हम क्या कर रहे हैं यहां पे आईम बी लर्न मॉड्यूल का इस्तेमाल कर रहे हैं मतलब मैं बेसिकली राइट हैंड साइड में जो आप देख रहे हैं यहां पे इसके अंदर मैं क्या करने वाला हूं यहां पे आपके पास डेटा सेट को बैलेंसिंग करने वाला हूं तो चलिए एक बार मैं इसके लिए हेडिंग डाल देता हूं यहां पे डेटा सेट चलिए एक काम करते हैं इस डाटा सेट इस इस फाइल के अंदर हम क्या करते हैं इसके हेडिंग डाल देते हैं मतलब आईएम बी लर्न का इस्तेमाल कर रहे हैं तो मैं इसको रिनेम कर देता हूं ताकि आप लोगों को आईडिया रहे कि हम क्या करने वाले हैं तो देखिए राइट हैंड साइड के अंदर हम आईम बी लर्न वाले मॉड्यूल का इस्तेमाल करते हुए डटा सेट को बैलेंसिंग करेंगे एंड देन उसके साथ काम करेंगे और लेफ्ट साइड के अंदर जो हमारे पास चल रहा है दैट्ची कितना डेटा सेट है यहां पे तो हमने डेटा सेट के भी वैल्यू काउंट देख लिए अब मुझे क्या करना है डेटा सेट को बैलेंस करना है अब डेटा सेट को बैलेंस कैसे किया जाता है तो हम उसके लिए इस्तेमाल करेंगे आईम बी लर्न मॉड्यूल कैसे इस्तेमाल करेंगे जरा समझे यहां पे तो फ्रॉम सबसे पहले यहां पे आईम बी लर्न मॉड्यूल को यहां पे इंपोर्ट करें ओके आईम बी लर्न मॉडल को इंपोर्ट करें यहां जाने के बाद में आपके पास क्या करना है आपको यहां जाने के बाद में अब आपको यहां पे क्या करना है सैंपलिंग को चूज करना है सैंपलिंग कौन सी आप अंडर सैंपलिंग का इस्तेमाल कर रहे हैं या ओवर सैंपलिंग का इस्तेमाल कर रहे हैं उसमें से आपको कोई भी एक सैंपलिंग चूज करनी है ठीक है तो मैं यहां पे आपको पहले ही बता देता हूं ओवर सैंपलिंग में क्या होता है कि जो आपका लो डाटा होता है उसको हाई डाटा में कन्वर्ट करते हैं और अंडर सैंपलिंग में क्या होता है कि जो आपका हाई डाटा होता है उसे आप लो डाटा में कन्वर्ट करते हैं तो मैं सबसे पहले अंडर सैंपलिंग के ऊपर बात करूंगा तो सबसे पहले आई एम बी लन में जाऊंगा यहां पे और यहां जाके मैं अंडर सैंपलिंग को कॉल करूंगा अंडम सैंपलिंग को कॉल करने के बाद मैं यहां पे इंपोर्ट करने वाला हूं किसे आपके पास रैंडम अंडर सैंपल को यस आपको क्या करना है रैंडम अंडर सैंपलिंग को कॉल करना है अब जैसे ही आप रैंडम अंडर सैंपलिंग को कॉल करते हैं यहां पे ये आपके पास क्या करता है आपको चार डाटा रिटर्न करके देता है मतलब ये आपसे क्या करता है आपसे दो डाटा लेता है इनपुट और आउटपुट के तौर पर डाटा लेता है और ये आपको फोर डाटा रिटर्न करता है जो कि आपका से एक बैलेंसिंग डाटा सेट होता है चलिए जरा देखते हैं यहां पे कैसे यहां पे ले रहा है तो देखिए आप यहां पे क्या करेंगे आप अपना जो भी डाटा सेट है वो इसके अंदर देंगे कट टा करके देता या क्या बोल रहा हूं कट ओके तो वापस अब हम यहां पे रैंडम अंडर सैंपलिंग का इस्तेमाल करने वाले हैं चलिए अब रैंडम अंडर सैंपलिंग के अंदर किस तरह से वर्क होता है तो देखिए रैंडम अंडर सैंपलिंग जो है आपके एक क्लास है इसके लिए हम एक क्या करेंगे एक ऑब्जेक्ट बनाएंगे तो आरयू के नाम से मैंने एक ऑब्जेक्ट बनाया है और रैंडम अंडर सैंपल को कॉल किया यहां पे राइट उसके बाद में मुझे क्या करना है अपने डटा सेट की सैंपलिंग करनी है तो उसके लिए पहले मुझे क्या करना पड़ेगा डेटा सेट को इनपुट और आउटपुट के अंदर अलग-अलग करना पड़ेगा तो मैं डेटा को इनपुट और आउटपुट के अंदर अलग-अलग कर देता हूं मतलब x डाटा को और y डाटा को अलग-अलग कर लेता हूं उसके लिए क्या कर रहा हूं यहां पे मैं अपने डेट साइड के पास जाऊंगा डॉट यहां पे आलग के पास जाऊंगा सारी रो लूंगा सारे कॉलम लूंगा लेकिन -1 छोड़ के मतलब परचेज वाले कॉलम को छोड़ दूंगा इसी तरीके से मैं क्या करने वाला हूं गाइज यहां पे मैं y एक्सेस का डाटा लेने वाला हूं यहां पे इसी तर से मैं क्या करने वाला हूं y एक्सेस का डाटा लेने वाला हूं जिसके लिए मैं डेटा सेट को कॉल करूंगा और यहां पर मैं अपने परचेज को कॉल कर दूंगा तो मेरे ये दोनों डाटा आ चुके है उसके बाद में मैं क्या करने वाला हूं गाइस यहां पे आरयू डॉट यहां पर मैं करूंगा फिट सैंपलिंग या फिर आप यहां पर पहले फिट कर सकते हैं फिट के अंदर एक्स और y का डाटा आप रन कर सकते हैं तो यहां से आपका डाटा जो है वो फिट हो चुका है अब मुझे सैंपलिंग करनी है तो मैं आरयू डॉट यहां पर क्या करूंगा गाइस यहां पे ट्रांसफॉर्म का कॉल करूंगा आरयू डॉट मैं यहां पे क्या करने वाला हूं गाइस यहां पे मैं यहां पे आरयू डॉट क्या करने वाला हूं गाइस यहां पे मैं फिट रि सैंपलिंग का इस्तेमाल करने वाला हूं अरे यार कितना गलत हो रही है लाइ कट ओके वापस अब गाइज यहां पे इनपुट आउटपुट के अंदर अलग-अलग करने के बाद में अब मैं यहां पे क्या कर रहा हूं आरयू डॉट यहां पर फिट री सैंपल का इस्तेमाल करूंगा जिससे मेरा डाटा क्या होगा यहां पे सैंपलिंग होगा इसके अंदर मुझे क्या करना पड़ेगा मुझे x एक्सेस और y एक्सेस का डाटा देना है और रन करना है ये हमें चार ये हमें दो डाटा वापस रिटर्न करके देगा मतलब ये हमें दो वेरिएबल हमें बना के देगा तो मैं क्या करता हूं गाइ यहां पे मेरे पास यहां पे आर य x के नाम से एक वेरिएबल बनाते हैं और r य y के नाम से एक वेरिएबल बनाते हैं यहां पे और इसे रन करते हैं अब देखिए आय अ जो x है आपके पास यहां पे इसको रन करेंगे तो इसके अंदर एज और एस्टिमेटर जो है आपके पास एज इट इज मिलेगा यस इसी के साथ-साथ यदि मैं यहां पे आर य अंडरस्कोर यदि मैं y लाके दूं आपके पास यहां पे यस आर य अर मैं y लाके दूं तो आपको y वाला डाटा भी आपको देखने को मिल जाएगा अब मुझे यहां पे देखना है क्या देखना है गाइस यहां पे मुझे यहां पे देखना है कि क्या मेरा डाटा सैंपल हुआ या नहीं सपल हुआ इसके अंदर हम क्या इस्तेमाल कर रहे हैं अंडर सैंपलिंग का और अंडर सैंपलिंग क्या करता है गाइस यहां पे कि जो भी आपका लार्ज डाटा होता है उसको लो डाटा में नट करता है तो अब हमें यहां पे चेक करेंगे कि क्या हमारे पास जीरो जो है वो 143 हुआ है या नहीं हुआ है कैसे चेक करेंगे तो गाइस इसके पीछे मैं क्या लगाने वाला हूं वैल्यू काउंट्स फंक्शन को अप्लाई करने वाला हूं तो मैंने यहां पे क्या किया है इसके पीछे वैल्यू काउंट फंक्शन को अप्लाई कर दिया यहां पे ओके मैंने इसके पीछे क्या किया है गाइस यहां पे मैं डॉट लगा के वैल्यू काउंट फंक्शन को अप्लाई किया है तो मुझे देखने को मिला है कि जो जीरो है गाइस वो 143 हो चुका है और जो वन है वो भी हमारा 143 हो चुका है इसका मतलब क्या हो गया है हमारा डाटा जो है यहां पे वो बैलेंस हो चुका है किसके हेल्प से रैंडम अंडर सैंपलिंग की हेल्प से तो रैंडम अंडर सैंपलिंग की हेल्प से हमने क्या किया हमारे डेटा सेट को क्या कर रखा है बैलेंसिंग कर दिया यहां पे अब बैलेंसिंग करने के बाद में हमारे पास क्या हुआ है नए एक्स और y आए हैं और वो नए एकस और y कौन से हैं गाइ यहां पे वो है हमारे पास आय x और आय अंडर y राइट चलिए अब इसके ऊपर हमारा मॉडल टेंड करते हैं और देखते हैं कितनी एक्यूरेसी आती है और किस तरह से हमारा रिजल्ट देखने को मिलता है इसके लिए हम क्या करेंगे सबसे पहले हम हमारे डेटा सेट को अलग-अलग कर चुके हैं x और y के अंदर मैं यहां पे ट्रेन और टेस्ट के अंदर हमारे डेटा सेट को स्प्लिटिंग करूंगा उसके लिए मैं ट्रें ट स्प्लिटिंग मॉडल को कॉल कर रहा हूं यहां पे ट्रेंट स्लिटिंग को कॉल कर रहा हूं यहां पे देन उसके बाद में गाइस यहां पे मेरे एक्स और वा जो है ये चेंज होंगे और ये चेंज होके क्या बनेंगे आर य अ x बनेंगे इस बार यस क्योंकि हमारा डाटा जो है वो री सैंपल होके आया है तो आर य x और आर य अको जो y है वो बनने वाले हैं मेरे डटा सेट अब मैं इसे रन करूंगा तो हमारा ट्रेन और टेस्ट के अंदर हमारे जो डेटा है वो स्प्लिटिंग हो चुका है फिर से देखिए मैं आई एम बैलेंसिंग जो डेटा सेट है वो राइट साइड में इस्तेमाल कर रहा हूं और जो नॉर्मल डाटा है वो आपके पास लेफ्ट साइड में इस्तेमाल कर रहा हूं अब क्या करना है गाइज यहां पे मैं लॉजिस्टिक रिग्रेशन को अप्लाई कर ने वाला हूं ओके लॉजिस्टिक रिग्रेशन को अप्लाई करते हैं यहां पे फिर से और उसके बाद देखिए एलआर के नाम से मैं मॉडल बना रहा हूं और लॉजिस्टिक रिग्रेशन को कॉल कर रहा हूं उसके बाद मैं एल आड मॉडल को क्या करूंगा गाइ यहां पे फिट करने वाला हूं यहां पे फिट के अंदर मैं यहां पे क्या करूंगा x अंडर जो हमारा ट्रेन है देन y जो ट्रेन है वो मैं यहां पे दूंगा मेरा मॉडल फिट हो चुका है एलर डॉट मैं यहां पे क्या करने वाला हूं स्कोर चेक करूंगा यहां पे स्कोर के अंदर मैं x टेस्ट एंड y एंडर स्को टेस्ट को यहां रखूंगा तो मेरा स्कोर जो है वो 58 पर आ चुका है मतलब स्कोर हमारा घट चुका है यहां पे ओके चलिए एक बार चेक कर लेते हैं कि क्या मॉडल के अंदर एक्यूरेसी के अंदर कुछ इंप्रूवमेंट आया है या नहीं आया है इसको देख लेते हैं यहां पे तो इसके लिए क्या करेंगे गाइ यहां पे अब फिडिक फंक्शन को कॉल करने के बाद में मुझे यहां पे डाटा देना है उससे चेक करना है कैसा स्कोर रहा है यहां पे तो चलिए पहले मैं 19 और 1900 19000 को देता हूं इसके र हमारा जीरो आंसर आना चाहिए तो मैंने 19 एंड 1900 जो है वो यहां पे पास किया है इसके ऊपर हमारा जो आंसर है वो वन आ रहा है मतलब हमारा रॉन्ग प्रिडिक्शन स्टार्ट हो चुका है चलिए अब यहां पे देखिए बात करें इसके बाद देखते हैं 46 और 28 पे क्या आंसर आ रहा है मैं 46 और 1 पे 28 पे चेक करूं आंसर को तो ये हमें क्या आंसर दे रहा है तो इसको भी देख लेते हैं तो मैं यहां पे चलूंगा और यहां चलके मैं 46 लेने वाला हूं इस तरफ और इस तरफ मैं कर रहा हूं 26 यस क्या कर रहा हूं यहां पे 20 28 कर रहा हूं राइट और रन करने पर देखिए मेरा आंसर वन आने लग गया इसका मतलब हमारा मॉडल काफी हद तक सही हो चुका है यहां पे अब देखिए 46 26 और वन पे देखें तो यह आंसर वन आना चाहिए इसको भी जरा चेक कर लेते हैं तो मैं वापस चलता हूं यहां पे और इस बार मैं 40 फ यस इस बार मैं क रहा हूं 45 और 26 प अपना चेक करूंगा मॉडल यहां पे तो 46 और 26 पे आंसर हमारा क्या आ रहा है वन आ रहा है इसका मतलब क्या हो रहा है गाइ यहां पे हमारे पास यहां पे एक्यूरेसी यहां पे कम आई है हमारे पास यहां पे एक्यूरेसी जो है वो बहुत ही कम आई है लेकिन हमारा मॉडल यहां पे बायस नहीं हुआ है क्यों नहीं हुआ है बायस यहां पे क्योंकि हमारा जो डेटा सेट है वो बैलेंस हो चुका है पहले हमारा डेटा सेट जो था वो ये था और फिर हमने यहां पे इस डेटा सेट के अंदर देखा किसे देखा यहां पे आर य अंडर पहले हमारे पास जो डटा सेट था वो ये था और फिर मैंने जब इसे बैलेंस किया है यहां पे तो बैलेंस करने के बाद में हमारे पास जो x और y की जो वैल्यू है हमारे पास जो जीरो और वन की जो वैल्यू है वो बराबर हो चुकी है 143 और 143 दैट इज कॉल्ड ऑफ रैंडम अंडर सैंपलिंग अब हम यहां पे क्या करने वाले हैं रैंडम ओवर सैंपलिंग को इस्तेमाल करने वाले हैं अब रैंडम ओवर सैंपलिंग कैसे वर्क करेगा जरा उसको देखते हैं तो मैं क्या करने वाला हूं गाइस यहां पे यहां पे बहुत सारे स्पेसेस दे देता हूं ताकि मैं रैंडम ओवर सैंपलिंग को यहां लगा सकूं अब रैंडम ओवर सैंपलिंग को कैसे अप्लाई करेंगे तो उसके लिए हम फ्रॉम फिर से फिर इसे इसके लिए हम फिर से फ्रॉम यहां पे आई एम बी लर्न के अंदर चलेंगे यस मैं आईएमबी लर्न के अंदर चलता हूं दैट यहां पर मैं ओवर सैंपलिंग को कॉल करता हूं और मैं यहां पे इंपोर्ट कर देता हूं किसे रैंडम ओवर सैंपलर को राइट अब मुझे क्या करना है रैंडम ओवर सैंपलर को अप्लाई करना है तो मैं आओ के नाम से इस बार अवेलेबल बनाता हूं और रैंडम ओवर सैंपल को कॉल कर देता हूं उसके बाद आओ डॉट मैं यहां पे क्या कर रहा हूं यहां पे फिट रि सैंपल को कॉल करता हूं और x और y श करता हूं अब ओवर सैंपलिंग में होता क्या है कि जो आपका डाटा कम है वो क्या करता है यहां पे अपने आप को रिपीट करता है और जो आपके पास ज्यादा है उस डाटा के बराबर कर लेता है दैट इज कॉल ऑफ रैंडम ओवर सैंपल ओके तो चलिए इसको जरा देख लेते हैं तो मैंने यहां पे आपके पास यहां पे री सैंपल को कॉल कर दिया है और री सैंपल को कॉल करते ही यहां पे मेरा जो डेटा साइड है वो बैलेंस हो चुका है अब ये जो आरओ जो है यहां पे ये आपको फिर से दो रिटर्न डाटा देगा यहां पे आ x देगा एक यहां पे और आओ y यहां पे देने वाला है यदि मैं आओ y को देखूं यस मैं आ y को देखूं और इसकी वैल्यू काउंट करूं वैल्यू अंडरस्कोर यहां पे काउंट्स को कॉल करूं गाइज यहां पे तो मुझे देखने को मिला 257 और 257 मतलब हमारे पास जो वन था वो क्या था 143 था इसने अपने आप को डाटा को रिपीट किया है अब डेटा को रिपीट कैसे किया है गाइज रैंडम रिपीट किया है यस जो डटा आपके पास बराबर यदि सीक्वेंस ली आता है तो सीक्वेंस कर रहा है नहीं तो रैंडम अपने आप को डाटा को रिपीट करके आपके पास क्या कर रहा है 257 के बराबर कर रहा है किसमें रैंडम ओवर सप ठीक है अब हम क्या करेंगे इसका मॉडल ट्रेन करेंगे इसके लिए मुझे फिर से क्या कर करना पड़ेगा ट्रेन ट स्प्लिटिंग करनी पड़ेगी तो इस बार मैं यहां पे ट्रेन ट स्लिटिंग करने जा रहा हूं फिर से देखिए यहां पे ओके इस बार मैं करूंगा यहां पे जो डेटा सेट है इसका डाटा को चेंज करूंगा x1 करूंगा एक्स टेस्ट को टेस्ट वन करूंगा यहां पे टेस्ट वन करूंगा ट्रेन वन करूंगा और टेस्ट वन करने वाला हूं अब यहां पे जो r u x है इसे चेंज करके आओ x करेंगे यहां पे यस आओ x करने वाला हूं और यहां पे भी मैं आओ यस आओ y इस्तेमाल करने वाला हूं और रन करूंगा तो ये मेरा डाटा ट्रेन और टेस्ट के अंदर स्प्लिट हो चुका है कौन सा आ y ओके अब मुझे फिर से क्या करना है लॉजिस्टिक रिग्रेशन लगाना है तो मैं lr1 के नाम से एक रेबल बना रहा हूं और लॉजिस्टिक रिग्रेशन को फिर से कॉल कर रहा हूं फिर से मैं एल lr1 यस lr1 डॉट मैं कर रहा हूं मॉडल को फिट कर रहा हूं और फिट के अंदर x आपके पास ट्रेन वन एंड x अ आपके पास x ट्रेन व एंड y आपके पास जो ट्रेन वन है वो यहां पे देने वाला हूं ओके अब मैं स्कोर चेक कर लेता हूं तो आर एल आरव डॉट मैं यहां पे स्कोर को चेक करूंगा एंड स्कोर लूंगा स्कोर के अंदर x आपके पास क्या होगा यहां पे टेस्ट वन हो जाएगा और y आपके पास क्या होगा टेस्ट वन हो जाएगा स्कोर देखें 45 पर एक्यूरेसी आई है बहुत ही पुअर एक्यूरेसी है यहां पे एक बार चेक करते हैं क्या मॉडल अच्छे तरीके से वर्क कर रहा है तो lr1 डॉट यहां पर मैं क्या करूं यहां पे प्रिडिक्ट फंक्शन को कॉल करूं यस lr1 डॉट मैं यहां पे क्या कर रहा हूं प्रिडिक्ट फंक्शन को कॉल कर रहा हूं यहां पे और प्रिडिक्ट फंक्शन के अंदर यहां पे दे देते हैं 19 और 19000 रन करें इसके ऊपर आंसर वन आ रहा है दैट्ची कर लेते हैं किसके ऊपर 45 26 और इसके ऊपर चेक कर लेते हैं तो मैं यहां पे 45 यस इस 19 को चेंज करके मैं यहां पे कर रहा हूं 45 और यहां पे कर रहा हूं 26 यस इसके ऊपर चेक करते हैं यहां पे इसके ऊपर आंसर वन आ रहा है और एक्चुअल में हमारा आंसर वन हालांकि यहां पे एक्यूरेसी बहुत कम है बट हमारा जो प्रेडिक्शन है वो आपके पास काफी तक सही हो चुका है तो देखिए काफी ऐसी सिचुएशन होती है जहां पे आपको डेटा सेट को बैलेंसिंग करने की जरूरत पड़ती है तो वहां पे रैंडम अंडर सैंपल और रैंडम ओवर सैंपल का इस्तेमाल करते हुए आप डेटा सेट को बैलेंसिंग कर सकते हैं और अपनी एक्यूरेसी को इंप्रूव भी कर सकते हैं या फिर अपने मॉडल को इंप्रूव कर सकते हैं तो आई थिंक आई होप सो समझ में आ चुका होगा रैंडम ओवर सैंपल और अंडर सैंपल कैसे वर्क करता है और आज के इस वीडियो के जरिए हम बात करेंगे न्य बास एल्गोरिथम के लिए देखिए जब हम क्लासिफिकेशन एल्गोरिथम पढ़ते हैं तो उस क्लासिफिकेशन एल्गोरिथम के अंदर नबास एल्गोरिथम आती है और यह प्योर क्लासिफिकेशन एल्गोरिथम्स है जो कि प्रोबोटिक बेसिस पे काम करती है अब ये प्रोबोटिक बेसिस के अंदर आपकी कंडीशनल प्रोबेबिलिटी के ऊपर काम करती है कंडीशनल प्रोबेबिलिटी का मतलब बेसिक समझाऊं मैं आप लोगों को जैसे कि यदि मुझे मूवी देखने जाना है और बाहर आपके पास मौसम सही नहीं है मतलब बादल आए हुए हैं तो मैं यहां पे क्या बोलूंगा यदि बारिश हुई तो मैं मूवी देखने नहीं जाऊंगा यदि बारिश नहीं हुई तो मैं मूवी देखने जाऊंगा तो यहां पे मैंने मूवी जाने के ऊपर एक कंडीशन लगा रखी है और वो कंडीशन कौन सी है बारिश का होना और नहीं होना तो बेसिकली दैट इज द प्रोबेबिलिटी मतलब हम इस चीज की प्रोबेबिलिटी निकालते हैं तो ये हमारे पास क्या कहलाती है कंडीशनल प्रोबेबिलिटी कहलाती है इसी के ऊपर आपके पास जो नेयो बास एल्गोरिथम है वो अप्लाई होती है और इसके ऊपर आपके पास वर्किंग चलती है तो देखिए जरा समझते हैं नेव बस एल्गोरिथम कैसे वर्क करती है तो देखिए नेव बस एल्गोरिथम आपके पास क्लासि एंड डिग्रेशन दोनों में वर्क करती है एंड ये बेसिकली कंडीशनल प्रोबेबिलिटी के ऊपर वर्क करती है एंड इसके अंदर बात करें तो न्यू का मतलब यहां पे बेसिकली गाइज होता है आपके जो फीचर मतलब आपने जो भी डटा सेट के अंदर अपने फीचर दे रखे हैं वो आपके क्या कहलाते हैं न्यू कहलाते हैं और इसके अंदर आपकी जो बायस थ्योरम है वो अप्लाई होती है अब ये बायस थ्योरम होती कैसे है कैसे आती है तो इसको जरा थोड़ा डिटेल के साथ समझते हैं तो इसको समझने के लिए मैं आपको थोड़ा सा प्रोबेबिलिटी के ऊपर लेके जाऊंगा एंड प्रोबेबिलिटी से फिर हम ने बाज थ्योरम के ऊपर आएंगे अच्छा मैं बेसिक यहां पे बोलूं कि आप प्रोबेबिलिटी का मतलब क्या समझते हैं प्रोबेबिलिटी का मतलब होता है संभावना या फिर अंश कि ये काम हो जाएगा इस टाइम के अंदर दैट इज अ प्रोबेबिलिटी अच्छा प्रोबेबिलिटी का यदि मैं फॉर्मूलेशन की तरफ बात करूं तो फॉर्मूलेशन क्या होता है p ऑफ e p ऑफ e मतलब प्रोबेबिलिटी ऑफ इवेंट कोई भी आप इवेंट अकर हो रहा है उसका तो ये कैसे निकलता है कि आपका फेवरेबल आउटकम कौन सा है फेवरेबल आउटकम का मतलब क्या है गाइ यहां पे आप क्या चाहते हैं और उसमें से आप क्या करते हैं डिवाइड करते हैं टोटल नंबर ऑफ आउटकम से कि मतलब आपके कितने आइटम निकल चुके हैं कितने नंबर ऑफ आपके पास यहां पे आउटकम हो चुके हैं दैट इज अ टोटल नंबर ऑफ आउटकम राइट तो दैट इज अ प्रोबेबिलिटी ये आपके पास क्या कहलाती है प्रोबेबिलिटी कहलाती है इसको समझने के लिए हम कुछ इस तरह से समझ सकते हैं लेट आप कंसीडर कर लीजिए कि आपके पास एक बैग है इस बैग के अंदर आपके पास क्या है कुछ रेड बॉल पड़ी है और आपके पास कुछ ब्लू बॉल पड़ी है अब आपको बोला जा रहा है कि यदि आप इसके अंदर हाथ डालें तो हाथ डालने के बाद रेड बॉल आने के क्या चांसेस हैं मतलब रेड बॉल यदि मैं हाथ डालूं तो रेड बॉल क्या चांसेस है कि आपके रेड बॉल आ सकते हैं तो यहां पे जो आप चांसेस की बात कर रहे हैं दैट इज अ प्रोबेबिलिटी अब ये प्रोबेबिलिटी निकलेगी कैसे तो देखिए इस बैग के अंदर आपके पास नंबर ऑफ रेड बॉल कितनी है तो नंबर ऑफ यदि मैं रेड बॉल की बात करूं तो वो आपके पास कितनी है थ्री है और नंबर ऑफ यहां पे बात करूं ब्लू बॉल के बारे में तो आपके पास कितनी है टू है हमें क्या चाहिए प्रोबेबिलिटी चाहिए किसकी रेड बॉल आने की चाहिए तो प्रोबेबिलिटी ऑफ रेड बॉल कितनी होने वाली है गाइ यहां पे तो रेड बॉल क्या है आपका फेवरेबल आउटकम है मतलब आपका यहां पे आप उस चीज को चाहते हैं आप उस चीज की प्रोबेबिलिटी निकालना चाहते हैं तो रेड बॉल क्या है आपका फेवरेबल आउटकम है फेवरेबल आउटकम की वैल्यू कितनी है थ्री है अब यहां पे टोटल कितने आउटकम निकल सकते हैं आउटकम का मतलब है कि यदि आप इस बैग के अंदर हाथ डालेंगे तो कितने टोटल नंबर ऑफ आप यहां पे बाहर चीजें निकाल सकते हैं तो टोटल इसके अंदर हम फाइव चीजें बाहर निकाल सकते हैं तो टोटल आउटकम कितना हो गया गाइज यहां पे फाइव हो गया तो गाइ यहां पे प्रोबेबिलिटी ऑफ रेड कितना हो गया गाइज यहां पे 3/5 हो गया यहां पे तो दैट इज अ सिंपल वे ऑफ प्रोबेबिलिटी यस इसको हम क्या बोलते हैं प्रोबेबिलिटी बोलते हैं अब आप एक और एग्जांपल ले सकते हैं जैसे कि यदि मैं एक डाइस लूं और उस डाइस को मैं रोल करूं और रोल करने के बाद में मैं आप लोगों से बोलूं कि मेरे सिक्स आने के क्या चांसेस हैं तो अब सिक्स आने के चांसेस कैसे पता चलेंगे तो देखिए गाइस यहां पे इस डाइस को रोल करने पर हमारे कौन-कौन से इवेंट्स होते हैं इवेंट का मतलब है जब मैं डाइस को रोल करता हूं तो मेरे पास क्या-क्या चीजें मुझे दिखाई देती है दैट इज माय इवेंट अब इवेंट की बात करें तो गाइज इवेंट क्या-क्या होंगे वन होगा टू होगा थ्री होगा फोर होगा फाइव होगा और सिक्स होगा ये हमारे टोटल सिक्स नंबर ऑफ इवेंट होते हैं अब इसमें से आप कौन सा इवेंट चाहते हैं तो हम यहां पे चाहते हैं सिक्सथ नंबर ऑफ इवेंट यदि हम यहां पे सिक्सथ नंबर ऑफ चाहते हैं तो वो आपका क्या है फेवरेबल आउटकम है फेवरेबल आउटकम आपके पास कितना है केवल और केवल एक फेवरेबल आउटकम है अच्छा टोटल नंबर ऑफ इवेंट कितने है मतलब टोटल नंबर ऑफ आउटकम कितने निकलने वाले हैं यहां पे तो टोटल नंबर ऑफ आउटकम की बात करें तो वो आपके सिक्स है तो आपके पास जब आप एक डाइस को रूल करते हो तो डाइस को रोल करने के बाद में जो आपके पास यहां पे आउटकम आते हैं उन आउटकम में यदि आप सिक्स आउटकम को चाहते हैं तो उसकी जो प्रोबेबिलिटी होती है वो क्या होती है 1/6 होती है तो इस तरह से हम क्या करते हैं हमारी प्रोबेबिलिटी को डिफाइन करते हैं अब मैं यहां पे एक और इंपोर्टेंट चीज बताना चाहूंगा कि ये जो प्रोबेबिलिटी होती है यहां पे इस प्रोबेबिलिटी की जो वैल्यू होती है वो आपके पास लेसन इक्वल टूव होती है और ग्रेटर दन इक्व ट 0 होती है मतलब प्रोबेबिलिटी की जो वैल्यू होगी वो रो और वन के बीच में रहेगी रो भी हो सकती है और वन भी हो सकती है जीरो किस केसेस में होगी जब आपके पास यहां पे मैं बोलूं कि इस डाइस के अंदर सेवन आने के चांसेस कितने हैं यस सेवन आने के चांसेस कितने हैं तो आप क्या बोलेंगे कि इसके अंदर तो सेवन है ही नहीं तो सेवन है नहीं तो सेवन आने के चांसेस क्या क्या होंगे जीरो हो जाएंगे र ठीक इसी तरह से मैं बोलूं कि इसके अंदर आप हार डालिए और सारी बॉल को एक साथ निकाल दीजिए सारी बॉल को क रही है एक साथ निकालने के चांसेस कितने हैं तो सारी बॉल को एक साथ निकालने के तो आपके पास यहां पे एक ही है मतलब सिक्स बॉल्स आ गई और सिक्स ही टोटल आपके इवेंट है तो आपके पास इसकी प्रोबेबिलिटी क्या हो गई वन हो गई तो बेसिकली वन प्रोबेबिलिटी भी होती है और आपके पास यहां पे जीरो प्रोबेबिलिटी भी होती है यहां पे तो देखिए प्रोबेबिलिटी की जो रेंज होती है वो जीरो से वन के बीच में रहती है अब यहीं पे अब ये कंडीशनल प्रोबेबिलिटी कैसे वर्क करती है कंडीशनल प्रोबेबिलिटी को समझने से पहले आप लोगों को समझना पड़ेगा कि प्रोबेबिलिटी की दो टाइप्स और होती है अब वैसे तो प्रोबेबिलिटी की बहुत सारी टाइप्स होती है लेकिन जो हमारा कंडीशनल प्रोबेबिलिटी के ऊपर जो फोकस है यहां पे इसके अंदर आपको दो तरीके की और प्रोबेबिलिटी समझनी पड़ेगी वो कौन-कौन से तरीके की प्रोबेबिलिटी है यहां पे तो दैट इज अ डिपेंडेंट प्रोबेबिलिटी और दैट इज अ इंडिपेंडेंट प्रोबेबिलिटी अब ये डिपेंडेंट और इंडिपेंडेंट प्रोबेबिलिटी होती क्या है जरा उसको समझते हैं यहां पे देखिए जस्ट मैं यहां पे बात करूंगा पहले आपके पास यहां पे इंडिपेंडेंट प्रोबेबिलिटी यस इन डिपेंडेंट प्रोबेबिलिटी अब इंडिपेंडेंट प्रोबेबिलिटी का मतलब क्या हुआ जस्ट वापस एक काम करते हैं डाइस को रूल करते हैं देखिए यदि मैं एक डाइस को रोल करूं यहां पे राइट और मैंने कहा एक डाइस को रोल कर दीजिए सिंपल सा तो इसके अंदर क्या-क्या इवेंट्स हो सकते हैं तो आपने इवेंट बोला वन हो सकता है टू हो सकता है थ्री हो सकता है फोर हो सकता है फाइव हो सकता है और सिक्स हो सकता है अच्छा इसके अंदर यदि मैं बोलूं कि आप एक बार डाइस को रोल कीजिए क्या नंबर आ रहा है तो आपने बोला यहां पे सिक्स आ रहा है तो इसकी प्रोबेबिलिटी क्या होगी 1/6 होगी फिर से मैंने कहा फिर से डायस को रोल कीजिए यहां पे तो आपने फिर से डायस को रोल किया आपकी प्रोबेबिलिटी क्या होगी फिर से 1/6 होगी मतलब आप डायस को जितनी बार भी रोल करेंगे आपकी प्रोबेबिलिटी की वैल्यू चेंज नहीं होने वाली है मतलब आपकी प्रोबेबिलिटी जो यहां पे निकल रही है दैट इज अ इंडिपेंडेंट प्रोबेबिलिटी यह किसी के ऊपर डिपेंड नहीं हो रही है यहां पे मतलब जो पहले वाली वैल्यू है और जो आने वाली वैल्यू है वो एक दूसरे के ऊपर इंडिपेंडेंट है आगे इसके ऊपर कोई इफेक्ट नहीं पड़ रहा है दैट इज अ इंडिपेंडेंट प्रोबेबिलिटी अब यहां पे जो आती है सेकंड प्रोबेबिलिटी दैट इज अ डिपेंडेंट प्रोबेबिलिटी और डिपेंडेंट प्रोबेबिलिटी से ही आपके पास यहां पे कंडीशनल प्रोबेबिलिटी बनती है जिसे हम कंडीशनल प्रोबेबिलिटी भी बोलते हैं कैसे जरा इसे हम यहां पर समझते हैं लेट्स सपोज यदि मैं आप लोगों को बोलूं कि ये मेरा एक बैग है इस बैग के अंदर आपके पास यहां पे तीन रेड बॉल है और आपके पास दो ब्लू बॉल है अब आप इस बैग के अंदर हाथ डालिए और एक बॉल निकाल के जाइए जो कि आपके पास रेड बॉल होनी चाहिए और उसको वापस रिप्लेस नहीं करना है मतलब वापस नहीं रखना है तो आपने कहा ठीक है यदि मैं यहां पे प्रोबेबिलिटी ऑफ रेड बॉल बोलू यहां पे बैक के अंदर हाथ डाल के निकालूं तो वो कितनी होगी तो वो आपके पास होगी 3/5 क्यों थ्री रेड बॉल है और टोटल नंबर ऑफ आउटकम कितने फाइव है बट मैंने यहां पे कंडीशन क्या बोली है यहां पे कि आपको वापस नहीं रखना है और देन मैं इमीडिएट बोल देता हूं आप लोगों को कि अब आप यहां पे ब्लू बॉल निकालिए और उसकी क्या प्रोबेबिलिटी होने वाली है तो आप यहां पे क्या बोलेंगे कि ब्लू बॉल के जो प्रोबेबिलिटी होने वाली है गाइ यहां पे वो क्या होगी अब देखिए आपके पास एक रेड बॉल आपने पहले ही निकाल दी तो उस रेड बॉल को मैं हटा दूं यहां पे तो अब यहां पे ब ब्लू बॉल कितनी है टू है और टोटल नंबर ऑफ बॉल कितनी है आपके पास यहां पे फोर है तो अब जो प्रोबेबिलिटी होने वाली है दैट इज अ 2/4 अभी मैं रेड बॉल वापस रख लेता हूं ताकि आपको कंफ्यूजन ना हो राइट तो प्रोबेबिलिटी ऑफ व्यू बॉल कितनी हो जाएगी आपके पास 2/4 होगी अब देखिए प्रोबेबिलिटी ऑफ जो व्यू बॉल है आपके पास यहां पे वो आपके पास डिपेंड कर रही है यहां पे किसके ऊपर प्रोबेबिलिटी ऑफ रेड बॉल के ऊपर देखिए आप यहां पे गौर से देखिए आपके पास यहां पे जो प्रोबेबिलिटी आई है वो आपके पास सेम नहीं आई है दैट इज अ डिपेंडेंट ओके यदि आप चाहते हैं कि नहीं मुझे ब्लू बॉल को भी थ्री कर देना है तो यदि आप ब्लू बॉल को भी थ्री कर देंगे तो प्रोबेबिलिटी थोड़ी सी चेंज हो जाएगी जस्ट ये फाइव हो जाएगी और यहां पे थ्री हो जाएगी राइट लेकिन आप यहां पे फिर से नोटिस करेंगे कि आपके प्रोबेबिलिटी की जो वैल्यू है यहां पे वो चेंज हो चुकी है ये चेंज होने के पीछे रीजन क्या है कि जो ब्लू बॉल आपने निकाला यहां पे वो डिपेंड कर रही है किसके ऊपर रेड बॉल के ऊपर क्योंकि फर्स्ट ऑफ ऑल आपने क्या निकाला रेड बॉल निकाली है देन उसके बाद आपने क्या निकाली है ब्लू बॉल निकाली है इस वजह से ब्लू बॉल की जो प्रोबेबिलिटी है वो यहां पर चेंज हुई है अच्छा जो ब्लू बॉल की प्रोबेबिलिटी निकाली है यहां पे इसको हम एक और तरीके से लिख सकते हैं दैट इज द प्रोबेबिलिटी ऑफ़ ब्लू बॉल डिपेंडेंट ऑफ r बॉल राइट तो इसको हम यहां पे p p ब स् ऑफ r बोल सकते हैं क्योंकि यहां पे जो ब्लू बॉल है वो r के ऊपर डिपेंड कर रही है राइट कि ये r पहले निकल चु है उसके नंबर ऑफ टोटल इवेंट्स कम कर दिए हैं अब यहां पे ब्लू बॉल निकली है दैट p ऑफ बफ r यस इसी को हम क्या बोलते हैं कंडीशनल प्रोबेबिलिटी बोलते हैं मतलब एक प्रोबेबिलिटी किसी और प्रोबेबिलिटी के ऊपर डिपेंडेंट है और उससे प्रोबेबिलिटी की वैल्यू चेंज हो जाए यहां पे दैट इज कॉल्ड ऑफ आपके पास कंडीशनल प्रॉबिटी यहां पे आपके कंडीशंस के बेसिस पे प्रॉबिटी लग चुकी है अब ये जो आपके पास p ऑफ बफ r है यहां पे यस ये जो p ऑफ ब ऑफ आर है यहां पे इसको हम एक और तरीके से लिख सकते हैं दैट वो लिखने का तरीका क्या है गाइज यहां पे यदि मैं p ऑफ यहां पे बोलूं यस यदि मैं यहां पे p ऑफ r और यहां पे p ऑफ ब की बात करूं यहां पे तो इसको लिखने का एक और तरीका है दैट अ p ऑफ r और यहां पे हम लिख सकते हैं मल्टीप्लाई ऑफ p ऑफ बफ r राइट ये एक और तरीका है इसको लिखने का अब यहां पे थोड़ा सा फॉर्मेशन स्टार्ट होता है किसके लिए बायस थ्योरम के ऊपर क्योंकि बायस थ्योरम जो आपके पास यहां पे है वो कंडीशनल प्रोबेबिलिटी के ऊपर डिपेंड करती है यहां से हमारे पास एक फॉर्मूला निकल के आया p और b इक्वल्स टू क्या होता है मतलब इन दोनों का कंबाइंड फॉर्मूला यदि मैं निकालू यहां पे तो यदि दैट इज कॉल ऑफ कंडीशनल प्रॉपर्टी ओके अब देखिए यहां पे आपको यदि प्रॉब्लम सॉल्व करना है क्या प्रॉब्लम सॉल्व करना है यदि आप लोगों से पूछे यहां पे कोई एक सवाल कि जब यहां यदि आपसे लोगों से कोई भी एक सवाल पूछे यहां पे कि उस समय की प्रोबेबिलिटी बताइए जब आपके पास पहले आर बॉल निकली है एंड देन उसके बाद आपकी ब्लू बॉल निकली है मतलब दैट फर्स्ट कम r एंड सेकंड वन इज ब्लू देन ब्लू की प्रोबेबिलिटी क्या होगी देन आप इस तरह से निकालेंगे लेकिन जब आपको बोले कि यहां पे फर्स्ट आ देन सेकंड आपके पास यहां पे फर्स्ट आर देन सेकंड आपके पास ब्लू है तो उसके लिए हम क्या करते हैं इस तरह से कुछ इस तरह से इसको हम यहां पे क्या करते हैं कुछ इस तरह से लिखते हैं क्या लिख रहे हैं यहां पे प्रोबेबिलिटी ऑफ r और ऑ प्रोबेबिलिटी ऑफ b इसको हम किस तरह से लिखेंगे प्रोबेबिलिटी ऑफ b स् ऑफ r एंड क्या करेंगे यहां पे प्रोबेबिलिटी ऑफ r यहां पे इस तरह से लिखा जाएगा राइट ये हमारे पास एक नया फार्मूला बन के आता है और यदि मैं कंडीशनल प्रोबेबिलिटी की बात करूं तो दैट इज माय कंडीशनल प्रोबेबिलिटी ओके अब यहीं से आपकी बेस थ्योरम बन के तैयार होती है अब ये बेस थ्योरम कैसे बनती है जरा इसको समझते हैं तो गाइस मैं इसको थोड़ा सा रफ कर देता हूं क्योंकि अब हम कंडीशन प्रॉपर्टी के ऊपर चल रहे हैं कि अब हम चल रहे हैं बेस थ्योरम के ऊपर गाइ तो बेस थ्योरम कैसे बनेगी तो उसके लिए मुझे इसकी जरूरत नहीं पड़ेगी तो एक बार के लिए मैं इसे यहां से हटा देता हूं देन अब हम आगे बढ़ते हैं राइट चलिए तो ये हमारे पास यहां पे फॉर्मूलेशन आ चुका है इसको मैं एक थोड़ा सा आइडियल फॉर्मूलेशन बना लेता हूं आइडियल फॉर्मेशन का मतलब क्या है गाइज यहां पे इसको सही तरीके से नोटेशन कर देते हैं देखिए p ऑफ r को मैं क्या लिखता हूं r को लिख देता हूं a एंड देन और को हम यहां पे क्या लिखते हैं इंटरसेक्शन लिखते हैं एंड देन b लिखते हैं उसके बाद मैं p ऑफ यहां पे क्या लिख सकता हूं गाइ यहां पे b p ऑफ ब स्लश ऑफ यहां पे a लिख सकते हैं एंड यहां पे लिख सकते हैं p ऑफ a लिख सकते हैं राइट दैट इज अ नोटेशन मतलब मैंने इसको क्या किया थोड़ा सा सिंपलीफाई फॉर्मेशन में किया है अब यहां पे मैं आपको एक छोटा सा कांसेप्ट बताना चाहूंगा जो कि आपके लिए बहुत इंपॉर्टेंट रहने वाला है उसको जरा ढंग से समझिए यहां पे देखिए यदि मैं प इंटरसेक्शन ऑफ b की बात करूं मतलब प ए और b की बात करूं यहां पे या फिर p बी और और a की बात करूं यहां पे तो दोनों की वैल्यू आपके पास क्या होती है सेम होती है सेम होने के पीछे रीजन क्या है यहां पे तो जरा इसको थोड़ा सा वैन डायग्राम के थ्रू समझते हैं देखिए मैं यहां पे एक वन डायग्राम बना रहा हूं जिसके अंदर मैं एक ए इवेंट अकर हो रहा है वो दे रहा हूं यहां पे और एक बी इवेंट अकर हो रहा है वो मैं यहां पे ले रहा हूं राइट अब देखिए ए इवेंट के अंदर कुछ डटा रख रहा हूं जैसे कि वन टू एंड थ्री उसके बाद फोर और फाइव यहां रख लेता हूं सिक्स सेन और एट मैं यहां रख लेता हूं अब यदि मैं आपको बोलूं a एंड b का वैल्यू क्या हुई मतलब a इंटरसेक्शन ऑफ b की वैल्यू a और b की वैल्यू क्या हुई तो मतलब मतलब a इंटरसेक्शन b की बात कर रहा हूं यहां पे a इंटरसेक्शन b का मतलब गाइज यहां पर है कि आप यहां पे क्या निकाल रहे हैं a इंटरसेक्शन b का मतलब है आप यहां पे फोर और फव निकाल है यदि मैं आपसे क्वेश्चन थोड़ा सा रिवर्स कर दूं कि b इंटरसेक्शन ऑफ a की वैल्यू क्या हुई मतलब b और a की वैल्यू क्या हुई तब भी आप क्या करेंगे b इंटरसेक्शन ऑफ a की बात करें यहां पे तब भी आप यहां पे क्या करेंगे 4 5 ही बताएंगे मतलब a इंटरसेक्शन b और b इंटरसेक्शन a की वैल्यू दोनों की क्या होती है सेम ही होती है राइट तो इसका मतलब क्या हुआ गाइज यहां पे कि यदि मैंने यहां पे इस तरह से लिखा है मतलब मैंने a इंटरसेक्शन ऑफ b लिखा है यहां पे या फिर b इंटरसेक्शन ऑफ a लिखा है ये दोनों की वैल्यू क्या है यहां पे सेम ही कहलाती है अब मेन पॉइंट पे आते हैं यहां पे कि ये दोनों सेम होने से हमें क्या फायदा होगा तो देखिए यहां पे हम क्या कर रहे हैं यहां पे p b इंटरसेक्शन ऑफ a की यदि मैं वैल्यू लिखूं तो मैं क्या लिखूंगा p a b देन आपके पास क्या लिख सकता हूं p ऑफ b लिख सकता हूं अब जैसा कि मैंने आपको बोला है कि इन दोनों के राइट हैंड साइड के जो पार्टीशन है वो दोनों क्या है सेम है जैसे कि देखिए आप यहां पे ये सेम है और ये सेम है तो किसी के राइट हैंड साइड के पार्टीशन सेम है तो इसका मतलब क्या हुआ उनके लेफ्ट हैंड साइड के पार्टीशन भी क्या होंगे सेम होंगे इसका मतलब ये दोनों भी क्या हो जाएंगे आपके इक्वल हो जाएंगे चलिए इन दोनों को इक्वल कर देते हैं तो मैं यहां पे क्या लिख सकता हूं p ब a यहां पे लिखूंगा p a = p a b एंड क्या लिख सकता हूं p ऑफ b इस तरह से लिख सकते हैं अब इसको थोड़ा सा फॉर्मूलेशन को थोड़ा सही करते हैं यहां पे तो देखिए मैं यहां पे क्या कर सकता हूं प ऑफ बी निकालने जा रहा हूं यहां पे तो इसका आंसर क्या लिखूंगा p ब स् ऑफ a एंड p ऑफ ए यस प ऑफ ए देन क्या लिख सकता हूं p ऑफ बी दैट इज यस य दैट इज ये जो आपके सामने यहां पे आया है इसको हम बोलते हैं बेस थोरम यस दैट इज अ बेस थ्योरम और ये किसके ऊपर होता है कंडीशनल प्रोबेबिलिटी के ऊपर होता है अब ये फार्मूला आपके पास क्या इंडिकेट करता है ये फार्मूला इंडिकेट आपके इस तरह से करता है कि व्हेन ए इवेंट अकर हो जाता है तो बी आने की प जब कट ये ये आपके पास यहां पे क्या इंडिकेट करता है ये इंडिकेट अकर करता है कि जब आपके पास कोई बी इवेंट अकर हो जाता है तो उसके ऊपर a आने के चांसेस क्या है या फिर आप इसे भी बोल सकते हैं कि जब आपके पास a इवेंट अकर हो सकता है और जब आपको b निकालना है तो इस फॉर्मूलेशन को थोड़ा सा चेंज कर दीजिए राइट तो मैं इसको इस तरह से बोलूंगा कि जब हमारा b इवेंट अकर हो चुका है तो a आने के चांसेस जो है वो कितने हैं मतलब उसके क्या पॉसिबिलिटी है तो आप क्या बोलोगे p बफ a * पफ a और p ब इसी को हम क्या बोलते हैं बेस थ्योरम बोलते हैं तो ये देखिए हमारे पास बेस थ्योरम का फॉर्मूला है यहां पे p b = p b p ऑफ a एंड p ऑफ b राइट और p स् ऑफ b का मतलब क्या है प्रोबेबिलिटी ऑफ़ अ प्रोबेबिलिटी ऑफ़ हाइपोथेसिस ऑफ़ a व्हेन ऑब्जर्व द पॉइंट ऑफ़ b मतलब जब आपका b ऑब्जर्व हो चुका है तो उसके बाद a की प्रोबेबिलिटी क्या है दैट इस तरह से निकाल जाती है p बफ a का मतलब क्या है गाइज यहां पे प्रोबेबिलिटी ऑफ़ b व्हेन a इज अरिंग राइट इसी तरह से प्रोबेबिलिटी ऑफ़ a और प्रोबेबिलिटी ऑफ़ b का मतलब तो सिंपल आपके पास होता ही है अब मेजर्ली यहां पे एक चीज आती है कि इसके थ्रू आप यहां पे प्रेडिक्शन कैसे करते हैं तो चलिए इसको थोड़ा प्रेडिक्शन नॉलेज से भी समझते हैं तो इसकी अब हमें जरूरत नहीं है क्योंकि अब हमने ये चीज सीख ली है तो अब मैं इस फॉर्मूलेशन के थ्रू आपको प्रेडिक्शन करना सिखाऊंगा कि आप प्रेडिक्शन कैसे इसके अंदर कर सकते हैं तो देखिए कंडीशनल प्रोबेबिलिटी का पहले फॉर्मूला हम यहां पे राइट कर लेते हैं यहां पे देखिए कंडीशनल प्रोबेबिलिटी का जो फॉर्मूला है यहां पे p a ब आपके पास है यहां पे इसको आप कैसे लिखेंगे यहां पे p ब a एंड इसके साथ क्या लिख सकते हैं p p ऑफ a एंड नीचे क्या लिख सकते हैं यहां पे p ऑफ ब राइट आप यहां पे देख सकते हैं तो यह फार्मूला आपके पास कुछ इस तरह से लिखा हुआ है देखिए p बेसस ऑफ a p ऑफ a और p ऑफ b राइट अब आते हैं यहां पे कि हमारा प्रेडिक्शन कैसे होगा लेट्स सपोज कंसीडर करते हैं कि आपके पास एक x1 कॉलम है एक x2 कॉलम है और एक आपका पास x3 कॉलम है और उसके बाद एक आपका पास क्या है आउटपुट कॉलम है आउटपुट कॉलम के अंदर जो आपके पास आंसर्स आ रहे हैं वो आपके पास यस नो के अंदर आ रहे हैं जैसे कि मैं यहां पे यस लिख दूं और नो लिख दूं यहां पे यस और नो लिख दूं राइट इस तरह से आपके आउटपुट यहां पे आ रहे हैं तो आप क्या करते हैं यहां पे अपना जो डाटा है वो इस कंडीशन प्रोबेबिलिटी को देते हैं मतलब जो आपका नया डाटा है वो आप क्या करते हैं इस प्रोबेबिलिटी को देते हैं पहले आप इससे क्या करते हैं ट्रेन करते हैं और आपकी वैल्यू प्रेक्ट करते हैं एंड देन उस वैल्यू पहले आप यहां पे करते हैं इसे ट्रेन करते हैं ट्रेन करने के बाद मैं प्रेडिक्शन सनरी पे आता हूं कि प्रेडिक्शन कैसे होता है तो आप क्या करते हैं गाइज यहां पे कि क प्रेडिक्शन वैल्यू के अ फिर आप क्या करते हैं ट्रेनिंग देते हैं देन आपके पास यहां पे प्रेडिक्शन के लिए अप्लाई करते हैं अब यहां पे ये कंडीशन प्रोबेबिलिटी कैसे वर्क करती है जरा इसे समझते हैं तो ये क्या करती है p ऑफ s निकालती है मतलब प्रोबेबिलिटी ऑफ s निकालती है कब जब आपके पास x1 x2 और x3 ये तीनों अरिंग हो चुके हैं तब अब इसकी प्रोबेबिलिटी निकलेगी कैसे गाइज यहां पे तो ये प्रोबेबिलिटी निकलेगी p ऑफ यहां पे आप पास क्या आएगा x1 x2 x3 अपन यहां पे क्या आएगा s आएगा और फिर हमें क्या निकालना है प्रोबेबिलिटी ऑफ s निकालना है कि s की प्रोबेबिलिटी कितनी है देन डिवाइड बाय क्या करना है यहां पे प्रोबेबिलिटी ऑफ x1 x2 एंड x3 आपको निकालना अब ये x1 x2 x3 एक साथ तो प्रोबेबिलिटी निकलेगी नहीं तो फिर यहां पे ये जो फॉर्मूला है वो थोड़ा सा चेंज हो जाता है आपके पास यहां पे अब ये चेंज होके क्या रहता है यहां पे प्रोबेबिलिटी ऑफ यहां पे मैं पहले लिख देता हूं यस लिख देता हूं उसके बाद क्या आता है प्रोबेबिलिटी ऑफ यहां पे क्या आता है x1 अपॉन क्या आता है यहां पे s आता है फिर उसके बाद प्रोबेबिलिटी ऑफ यहां पे क्या आता है x2 अपॉन क्या आता हैय आ जाता है फिर क्या आता है प्रोबेबिलिटी ऑफ x3 अपॉन क्या आ जाता है गाइज यहां पे यस आ जाता है और नीचे बात करें यहां पे तो यहां पे आ जाएगा प्रोबेबिलिटी ऑफ x1 एंड प्रोबेबिलिटी ऑफ x2 देन प्रोबेबिलिटी ऑफ़ आपके पास क्या आएगा x3 आ जाएगा यह आपका पास s का फॉर्मूला होता है मतलब s की प्रोबेबिलिटी निकलती है यहां से देन इसी तरह से आप क्या करते हो नो की प्रोबेबिलिटी आप निकालते हो नो की प्रोबेबिलिटी वही आपके पास x1 x2 एंड x3 के ऊपर आपका निकलती है कैसे निकालेंगे प्रोबेबिलिटी ऑफ़ नो आपके पास आएगा यहां पे यस प्रोबेबिलिटी ऑफ़ क्या आने वाला है नो आने वाला है देन प्रोबेबिलिटी ऑफ़ x1 / न आएगा यस प्रोबेबिलिटी ऑफ़ क्या आएगा x1 अप क्या आएगा नो हो जाएगा फिर उसके बाद प्रोबेबिलिटी ऑफ़ x2 अपॉन क्या आ जाएगा नो आ जाएगा देन प्रोबेबिलिटी ऑफ x3 अप क्या आ जाएगा नो हो जाएगा एंड नीचे बात करें गाइज यहां पे तो प्रोबेबिलिटी ऑफ x1 देन प्रॉपर्टी ऑफ x2 देन प्रॉपर्टी ऑफ यहां पे क्या आएगा x3 आपके सामने आ जाएगा इस तरह से आपके पास यहां पे ये फॉर्मूला अप्लाई होता है अब ये फॉर्मूला अप्लाई होने के बाद हमारा चांसेस कैसे निकलता है रिजल्ट कैसे निकलता है तो गाइज ये जो आपके पास यहां पे इनपुट्स होते हैं इसके बेसिस पे आप इस फॉर्मूले को ट्रेड करते हो देन उसके बाद में गाइज यहां पे बात करें कि आपके पास कोई भी नई वैल्यू आती है वो इस फॉर्मूले में अप्लाई होती है अप्लाई होने के बाद यहां से आपके क्या निकलती है आपकी प्रोबेबिलिटी निकलती है जैसे कि मान लीजिए आपके पास कोई नया डाटा पॉइंट आया उस नए डाटा पॉइंट पे यस जो आपके पास है यहां पे यस आने के जो चांसेस है गाइ यहां पे वो आपके पास यहां पे आया 0.75 पर ओके 0.75 आया और नो आने के जो चांसेस है गाइज यहां पे वो आपके पास आ गया जस्ट 25 अब किसकी प्रोबेबिलिटी आपके पास ज्यादा आई है यस की प्रोबेबिलिटी ज्यादा आई है तो बेसिकली उसका रिजल्ट क्या आ जाएगा यस आ जाएगा तो इस तरह से प्रोबेबिलिटी के बेसिस पे आपके पास यहां पे आंसर्स निकाले जाते हैं अब यहां पे मैं एक और चीज बताना चाहूंगा कि देखिए इसके नीचे जो आप देख रहे हैं यहां पे x p1 ऑफ x1 p1 ऑफ x2 p1 x3 ये तीनों दोनों में क्या है सेम टू सेम है तो हम बेसिकली इसका डिवाइड नहीं करते हैं यस इसको आप हटा दीजिए तब भी कोई फर्क पड़ेगा नहीं क्योंकि आप दोनों में एक साथ डिवाइड कर रहे हैं तो वैसे इस फॉर्मूले के अंदर चेंजेज होगा नहीं राइट तो बेसिकली हम क्या करते हैं इसका जो रिजल्ट है ये जो आप देख रहे हैं इसका रिजल्ट हम निकालते हैं यूजिंग दिस प्रोबेबिलिटी तो ये होता है बेस थ्योरम के थ्रू आपका प्रोबेबिलिटी निकालना राइट और न्यू बेस कहने का पीछे रीजन क्या है न्यू का मतलब है हमारे फीचर और बेस का मतलब है बेस थ्योरम हम अप्लाई करते हैं अब देखिए ये जो न्यू बेस थ्योरम है ना यहां पे ये तीन तरीके की होती है कौन-कौन सी एक तो होता है गौश एंड बी यह तीन तरह की होती है कौन-कौन सी तो पहला है गौश दूसरा है मल्टीनोमियल और तीसरा है बर्नोली अब ये तीनों कब और किस समय अप्लाई करनी होती है तो उसको जरा देखते हैं तो देखिए गाउस एंड बी की बात करें यहां गाउस नबाज थ्योरम की बात करें मतलब गाउस एंड बी की बात करें यहां पे तो बेसिकली यह आपके पास उस वक्त काम की जाती है जब आपके पास जो इनपुट डाटा है जैसे x1 x2 और x3 आपके पास इनपुट डाटा दिख रहे हैं यदि इनपुट डाटा का जो नेचर है वो आपके पास ऑलमोस्ट नॉर्मल डिस्ट्रीब्यूशन आए यहां पे मतलब नॉर्मल डिस्ट्रीब्यूशन कर्वेचर को तरफ आए यहां पे तो आप क्या करते हैं गाउन एन बी को अप्लाई करते हैं वहां पे आप गाउ ए बी के थ्रू मॉडल डिक्लेयर करते हैं राइट यदि आपके पास आपका जो डाटा है यहां पे तब आप क्या करते हैं गाउस एनबी को अप्लाई करते हैं अब जानते हैं यहां पे बनोली के बारे में तो बेसिकली बनोली उस वक्त अप्लाई की जाती है जब आपके पास जो आपका डाटा सेट है मतलब आपका x1 x2 x जो आपका डेटा सेट है यहां पे इसके अंदर सारे के सारे जो कॉलम्स है आपके पास यहां पे वो बुलियन डटा से फिल हो बुलियन डाटा का मतलब है गाइ यहां पे सिर्फ और सिर्फ जीरो और वन से ही फिल हो मतलब आपके पा आपके जो डेटा सेट की वन हॉट इनकोडिंग कर रखी हो तो उस वक्त आप क्या करते हैं बर्नोली एनबी का इस्तेमाल करते हैं मतलब बनोली न्य बास एल्गोरिथम का इस्तेमाल करते हैं क्योंकि ये उस वक्त आपके पास क्या करता है बेस्ट आंसर देता है और इसके पीछे रीजन है आपका बनोली कव यस बनोली कव आपके थ्रू इस बनोली कव होने की वजह से आपके पास ये आपके पास क्या करता है रो और वन के ऊपर वर्किंग करता है अब बात बात करते हैं यहां पे मल्टी नोबल की मल्टी नोबल का एस यहां पे टक्स टैक्सिंग के अंदर किया जाता है मतलब जब भी आपके पास यहां पे टेक्चुअल डाटा यहां पर आता है मतलब जैसे कि आप यहां पे किसी रिव्यू का प्रेडिक्शन करने जा रहे हैं ये रिव्यू ट्रू मतलब रिव्यू अच्छा है या पूरा है यहां पे तो उस वक्त आपके पास क्या करते हैं मल्टी नोमल एनबी का इस्तेमाल करते हैं और इसके अलावा मैं एक और चीज बता दूं यदि आपका जो डाटा है यहां पे वो डिस्क्रीट डाटा है डिस्क्रीट डाटा है या फिर नॉर्मल डिस्ट्रीब्यूशन सही तरीके से नहीं है तो आप क्या करेंगे मल्टी न्यूमेल का इस्तेमाल करेंगे तो इस तरह से आपके पास क्या करती है नेव बास एल्गोरिथम वर्क करती है हे एवरीवन वंस अगेन वेलकम टू डबल कपटेक माय सेल्ल गरा और आज के इस वीडियो के जरिए हम यहां पर समझने वाले हैं कि निव बस एल्गोरिथम को प्रैक्टिकली कैसे अप्लाई किया जाता है देखिए लास्ट वा लेक्चर के अंदर हमने नबास को समझा कि ये कैसे वर्किंग करता है और इसके साथ-साथ हमने ये भी समझा कि नबास एल्गोरिथम के कितने टाइप्स होते हैं तो इनको हमने डिटेल के साथ देख रखा है यहां पे अब हम यहां पे ये जानेंगे कि इसको प्रैक्टिकली कैसे अप्लाई करेंगे यदि हमारे पास कोई डेटा सेट आ जाए तो उसके ऊपर कैसे अप्लाई कर जाता है और डिसीजन रीज़न कैसे बनाता है यदि आपको python2 के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं इसके लिए हम ले चलते हैं डेटा सेट के ऊपर अब देखिए डटा सेट मेरे पास यहां पे पड़ा है दैट अ प्लेमें cspc.co.in सीजीपीए और स्कोर की बेसिस पे किसी पर्सन का प्लेसमेंट हुआ है या नहीं हुआ है ये आपको प्रिडिक्ट करना है अब आप देखिए सीजीपीए का मतलब क्या है जैसे आप कॉलेज स्टूडेंट है तो आपका सीजीपी बनता है एनुअल स्कोर बनता है और स्कोर का मतलब क्या है किसी ने उसने कोई एग्जामिनेशन दिया है यहां पे तो उसके बेसिस पे उस पर्सन का प्लेसमेंट हो रहा है या नहीं हो रहा है दैट ये आपको यहां पे प्रेडिक्शन करना है तो चलिए इसको प्रेडिक्शन करते हैं तो इसके लिए मैं ले चलता हूं आपको जुपिटर नोटबुक के ऊपर एंड जुपिटर नोटबुक के र हम क्या करते हैं सबसे पहले एक फाइल बना लेते हैं ताकि हम यहां पर ये जो प्लेसमेंट वाला डेटा सेट है इसको लोड कर सकें और उसके ऊपर काम कर सकें अब इसके लिए मुझे जो रिक्वायर्ड लाइब्रेरी है पहले मैं उन रिक्वायर्ड लाइब्रेरी को इंपोर्ट कर लेता हूं जस्ट लाइक सबसे पहले मुझे इंपोर्ट करना है किसे यहां पे पांडा को क्योंकि इसके थ्रू हम अपना डाटा सेट लोड करेंगे उसके बाद मैं यहां पे इंपोर्ट करने जा रहा हूं किसे मैट पव को ताकि मैं ग्राफ बना सकूं यहां पे तो मैट प डॉट यहां पे मैं पवा प्लॉट एलियाज ऑफ में पीएटी का इस्तेमाल करूंगा फिर मैं इंपोर्ट करूंगा यहां पे किसको सी बन को ताकि मैं एडवांस ग्राफ बना सकूं यहां पे एलियास ऑफ एसएस उसके बाद मैं यहां पे फ्रॉम यहां पर mx1 के पास जाऊंगा क्योंकि mx1 क्या करेगा यहां पे गाइज प्लॉट डिसीजन रीजन बनाएगा मतलब मैं एक रीज़न बना के देगा यहां पे तो मैं mx1 के पास जाऊंगा mx1 के अंदर जाने के बाद मैं जाऊंगा प्लॉटिंग के ऊपर अब ये दो बार आपके पास आ चुका है तो एक बार आप इसे हटा दीजिए इस तरह से राइट तो प्लॉटिंग पे आ चुके हैं प्लॉटिंग आने के बाद दैट इंपोर्ट करते हैं और इंपोर्ट करने के बाद कैसे करना है प्लॉट डिसीजन रीज़न को राइट कैसे करेंगे आप यहां पे प्लॉट डिसीजन रीज़न को चलिए इसे हम लोड कर देते हैं उसके बाद हम क्या करते हैं डटा सेट लेते हैं यहां पे पीडी डॉट यहां पर मैं क्या करूंगा रीड अंडर सीएवी का इस्तेमाल करूंगा उसके बाद में मेरी जो सीएसवी फाइल है वो कौन सी है प्लेमें सवी इसके ऊपर हम राइट क्लिक करेंगे और कॉपी एज पाथ पे आ जाएंगे एंड उसके बाद यहां पे मैं पाथ को प्लेस कर दूंगा और उसके बाद यहां पे आर लगा दूंगा ताकि ये रॉ स्टिंग बन जाए ओके चलिए अब हम क्या करते हैं डेटा सेट लेते हैं और इसे हैड लगा के इसे लोड करके देखते हैं कि कितना क्याक डटा है तो इसमें आपको स्कोर दिख रहा है सीजी पे दिख रहा है और प्लेसमेंट दिख रहा है पहले हम इसके अंदर नल वैल्यू चेक कर लेते हैं ताकि इसके अंदर कोई मिसिंग कंटेंट ना हो यहां पे तो डेटा सेट के पास चलते हैं डॉट इस नल को मैं यहां पे अप्लाई करता हूं एंड डॉट मैं यहां पे करूंगा सम करूंगा रन करूंगा तो फिलहाल इसके अंदर कोई नल वल प्रेजेंट नहीं है तो मुझे यहां से इसे हटा देना चाहिए अब नेक्स्ट चीज यहां पे देखिए स्केलिंग करने की जरूरत है क्या नहीं मुझे स्केलिंग करने की जरूरत नहीं है यहां पे मुझे इतनी रिक्वायर्ड नहीं लग रही है ठीक है सेकंड चीज क्या होगी गाइ यहां पे मैं अब यहां पे क्या करूंगा यहां पे इसका ग्राफ बना के देखूंगा कि ये किस तरह से सेपरेबल है क्या लीनियर सेपरेबल है या नॉन लीनियर सेपरेबल है वो हम चेक कर लेते हैं तो उसके लिए एसस डॉट क्या करने वाला हूं गाइ यहां पे स्केटर ब्लट बनाऊंगा क्योंकि दैट गिव मी एडवांस क्राफ्ट देन एक्स एक्सेस के अंदर क्या करने वाले हैं गाइ यहां पे सीजीपी को रखेंगे एंड मैं यहां पे बात करूं वा एक्सेस के अंदर क्या रखने वाले है गाइस यहां पे वा एक्सेस के अंदर मैं स्कोर को रखने वाला हूं राइट उसके बाद में गाइ यहां पे मैं क्या करूंगा अपना डाटा दूंगा और डाटा के अंदर मैं अपना डाटा सेट देने वाला हूं उसके बाद में मैं अपना ह्यू पैरामीटर दूंगा ताकि थोड़ा डिफरेंशिएबल कि जीरो कितने है और वन कितने है तो उसके लिए हम प्लेस का इस्तेमाल करेंगे और प्लेस को रख देते हैं उसके बाद में गाइज यहां पे पीएटी डॉट क्या करने वाला हूं शो करने वाला हूं इस ग्राफ को एंड रन करते हैं तो देखिए हमारा डटा आ चुका है और मुझे ऑलमोस्ट लीनियर सेपरेबल डाटा दिख रहा है कोई इतना हार्डन नहीं है यहां पे लिनियली सेपरेबल है इस ग्राफ को थोड़ा सा छोटा कर देते हैं तो पीएटी डॉट क्या करेंगे यहां पे आपके फिगर का इस्तेमाल करेंगे राइट और फिगर के अंदर क्या करने वाला हूं गाइज यहां पे फिक्स साइज का इस्तेमाल करने वाला हूं जिसके अंदर 43 एक स्मॉल ग्राफ बना लेता हूं और यहां पे हमें दिख रहा है कि ये लीनियर सेपरेबल है आराम से लीनियर सेपरेबल होगा लेकिन इसके अ कुछ-कुछ मिस क्लासिफिकेशन होने वाला है तो वो भी चीज हमें यहां पे नजर आ रही है राइट चलिए अब हम क्या करते हैं अब इस डाटा को इनपुट और आउटपुट के अंदर अलग-अलग करते हैं मतलब डिपेंडेंट और इंडिपेंडेंट फीचर के अंदर अलग-अलग करते हैं देन उसके बाद में हम क्या करेंगे ट्रेन और टक के अंदर स्प्लिटिंग करेंगे एंड देन उसके बाद इसके ऊपर वर्किंग करेंगे चलिए तो मैं यहां पे क्या करता हूं इन दोनों को अलग-अलग कर लेता हूं चलिए एक्स एक्सेस के अंदर जाता हूं यहां पे डाटा सेट के पास चलते हैं डॉट यहां पर आई लॉक का इस्तेमाल करते हैं सारी नंबर ऑफ रो चाहिए यहां पे एंड कॉलम के अंदर बात करें तो मैं -1 लगा देता हूं उसके बाद वा एक्सेस चाहिए यहां पे डाटा सेट के पास चलते हैं देन स्क्वायर बैक्टर लगा के मैं प्लेस्ट के पास चला जाता हूं राइट तो इस तरह से मेरे पास x एक्सेस और वा एक्सेस का डाटा अलग-अलग हो चुका है अब मुझे क्या करना है ट्रेन टस्ट प्लेटिंग करनी है तो मैं फ्रॉम कहां जाऊंगा यहां पे साइकल एन के पास जाऊंगा एंड डॉट यहां पे इसके पास जाने लाहा हूं आपके पास साइकिल एंड के अंदर जाने के बाद मैं जाऊंगा मॉडल सक्शन के अंदर मॉडल सिलेक्शन के अंदर जाने के बाद दैट मैं इंपोर्ट करने वाला हूं किसे ट्रें टेस्ट स्लेडिंग को राइट तो ट्रें टेस्ट स्लेडिंग नाम का हमारे पास क्या हो गया यहां पे क्लासेस आ गई है अब यह हमें क्या करर है चार डाटा देने वाला है तो मैं x अंडर क्या करूंगा यहां पे ट्रेन लूंगा और x अंडर मैं टेस्ट लेने वाला हूं मैं y अंडरस्कोर आपके पास ट्रेन लेने वाला हूं यहां पे एंड y अंडरस्कोर मैं टेस्ट लेने वाला हूं और यहां से ट्रेन टेस्ट स्लिटिंग को कॉल करने वाला हूं यहां पर मैं एक्स एक्सेस का डाटा दूंगा वा एक्सेस का डाटा दूंगा और उसके बाद मैं क्या करूंगा टेस्ट टे साइज लूंगा टेस्ट साइज में 0.2 20 टेस्ट साइज है यहां पे एंड रैंडम स्टेट की बात करें तो रैंडम स्टेट इ 42 लेने वाला हूं और इसे हम रन करते हैं चलिए हमारा डटा स्प्लिटिंग हो चुका है अब हमारी बारी है मॉडल बनाने की मॉडल बनाने से पहले हम हमारे डाटा को देख लेते हैं कि ये डाटा नॉर्मल डिस्ट्रीब्यूशन है या नहीं है तो देखिए नॉर्मल डिस्ट्रीब्यूशन का पता कैसे चलेगा तो इसके लिए हमें बनाना पड़ेगा केडी प्लॉट राइट केडी प्लॉट बनाएंगे जिससे हमें थोड़ा सा आईडिया लगेगा कि ये नॉर्मल डिस्ट्रीब्यूशन है या नहीं है तो मैं एक काम करता हूं एए डॉट यहां पे चलता हूं केडी केडी मतलब मैं इसका डिस्ट्रीब्यूशन प्लॉट बनाने जा रहा हूं बेसिकली राइट तो तो मैं चलता हूं डाटा के अंदर और डाटा के अंदर जाके मैं क्या करूंगा डेटा सेट को कॉल करूंगा और उसके अंदर जाके मैं किसको कॉल कर रहा हूं सीजीपी को कॉल कर रहा हूं ग्राफ को देखने के लिए मैं पलटी श फंक्शन को रन करूंगा एंड रन करूंगा तो देखिए मुझे ऑलमोस्ट नॉर्मल डिस्ट्रीब्यूशन तो नहीं दिख रहा लेकिन ठीक है येय आपके पास यहां पे लाइट स्क्यूड का भी नहीं है ठीक है ऑलमोस्ट सही कर हु है यहां पे ठीक है स्कोर के अंदर चलते हैं स्कोर को भी एक बार देख लेते हैं तो मैंने स्कोर डाला यहां पे रन किया स्कोर तो ऑलमोस्ट पूरा नॉर्मल डिस्ट्रीब्यूशन लगभग लग रहा है मुझे यहां पे लेकिन हां थोड़ा सीजी पे नहीं लग रहा है यहां पे ओके तो मुझे यहां पे एक छोटे आईडिया लग गया यहां पे कि मेरा जो ग्राफ है कर्वेचर है वो किस तरह से दिख रहे हैं यहां पे तो मतलब बेसिकली गाइस यहां पे हमने क्या समझा था लास्ट क्लास के अंदर कि आपके पास जो आपका डाटा होता है उस डाटा के बेसिस पे आप क्या कर सकते हैं यहां पे अपने मॉडल को लगाएंगे जैसे र एबी कब लगता है गाइस यहां पे जब आपका डाटा नॉर्मल डिस्ट्रीब्यूशन हो बनोली एनबी कब लगता है जब आपका डाटा बाइनरी फीचर के साथ हो और इसके साथ मल्टीनोमियल कब लगता है जब आपका डाटा टेक्चुअल डाटा हो या फिर डिस्क्रीट डाटा हो चलिए अप्लाई करके देखते हैं तीनों के तीनों कि अप्लाई कौन-कौन से होते हैं तो मैं यहां पे फ्रॉम सकन के अंदर चलूंगा डॉट मैं चलूंगा ने बायस के ऊपर ने बायस के अंदर जाने के बाद दैट मैं यहां पे क्या करने वाला हूं इंपोर्ट करने वाला हूं इंपोर्ट किसे करने वाला है यहां पे तो देखिए आप यहां पे का ए भी को कर सकते हैं मल्टी नोबल को करना है तो मल्टी नोबल एनबी को कर सकते हैं और यदि आपको यहां पे बनोली एनबी करना है तो आप यहां पे बनोली ए बी को भी कर सकते हैं चलिए एक-एक करके तीनों मॉडल बनाते हैं और ट्राई करते हैं वैसे तो क एन बी ही लगने वाला है लेकिन तीनों मॉडल बनाएंगे तो मैं यहां पे g ए बी के नाम से एक रिबल बना लेता हूं राइट और गाश ए बी को कॉल कर देते हैं उसके बाद में देखिए जीएनबी को फिर से लेते हैं और डॉट मलो डॉट क्या करते हैं यहां पे फिट करते हैं फिट के अंदर x ट्रेन एंड y ट्रेन लेंगे यहां पे और रन करेंगे ये हमारा मॉडल ट्रेंड हो चुका है अब देखते हैं एक्यूरेसी कितनी आई है जीएनबी की तो जी एन बी की एक्यूरेसी चेक करने के लिए मैं डॉट यहां पे क्या करने वाला हूं स्कोर को चेक करूंगा यहां पे और इसके अंदर मैं क्या करूंगा x टेस्ट एंड y टेस्ट देने वाला हूं और मल्टीप्लाई बाय क्या करेंगे गाइ यहां पे यस मल्टीप्लाई बाय क्या करने वाला है 100 करने वाला है 100% एक्यूरेसी मतलब बहुत अच्छा एक्यूरेट मॉडल चुका है यहां पे चलिए जीएनबी को फिर से देख लेते हैं डॉट यहां पे स्कोर चेक कर लेते हैं राइट स्कोर के अंदर क्या करेंगे x अंड ट्रेन एंड y अकोर क्या करने वाला है यहां पे ट्रेन लेने वाले है और मल्टीप्लाई बाय 100 करेंगे और रन करेंगे 97 और 100% एक्यूरेसी तो येटस ग टू एक्यूरेसी टेस्टिंग कर अच्छी है इसका मतलब सही है यहां पे काम तो सही कर रहा है चलिए काम सही कर रहा है अब यहां पे आगे बढ़ते हैं एक बार मल्टी नोबल को भी ट्राई करते हैं तो मल्टी नोमल के लिए मैं क्या कर रहा हूं एम ए बी कर रहा हूं एम एन बी या एम एन बी ले रहे है यहां पे मल्टीनोमियल को स्माल कर रहे हैं यहां पे तो मैं यहां पे मन एबी को ले रहा हूं यहां पे उसके बाद एमएनबी को लूंगा यहां पे डॉट मडल डॉट क्या करने वाला हूं यहां पे फिट करने वाला हूं फिट के अंदर x ट्रेन एंड y क्या लेने वाला हूं ट्रेन लेने वाला हूं रन करते हैं मेरा मॉडल रेडी है यहां पे काम करने के लिए अब इसका भी स्कोर चेक कर लेते हैं तो एम एनबी डॉट क्या करेंगे यहां पे स्कोर चेक करेंगे स्कोर के अंदर x ट्रेन एंड y ट्रेन मैं दे देता हूं राइट और मल्टीप्लाई बा क्या करता हूं गाइस यहां पे 100 कर लेते हैं उसके साथ-साथ एम एबी मैं क्या करूंगा स्कोर चेक करूंगा किसका एक अंडरस्कोर आपके पास यहां पे टेस्ट एंड y अंडरस्कोर टेस्ट का और मल्टीप्लाई बाय 100 कर लेता हूं रन करते हैं देखिए पहले वाले के कंपैटिबल में पूरा एक्यूरेसी मिली है और हमें पता भी है मल्टी नोबल टैक्स के ऊपर अच्छा आंसर देता है इसके ऊपर इतना अच्छा आंसर नहीं देता अभी हम डिसीजन डिजन के थ्रू भी देख लेंगे डिसीजन डिसीजन में कितना फर्क पड़ता है राइट चलिए अब हम क्या करने वाले हैं बनोली को लेने वाले हैं तो बनोली के लिए क्या कर रहा हूं यहां पे बीएनबी के नाम से एक वेबल बना रहा हूं और फिर मैं क्या करने वाला हूं बनोली को लेने वाला हूं अच्छा हमें पता है कि जो नोली होता है यहां पे वो किसके ऊपर अच्छा आंसर देता है तो वो आपका अच्छा आंसर उस वक्त देता है जब आपके पास इनपुट जो फीचर है वो आपका 01 के अंदर हो राइट तो भी हम यहां पे क्या कर रहे हैं ट्राई कर रहे हैं यहां पे तो b एब डॉट यहां पे क्या कर रहा हूं मॉडल डॉट फिट कर रहा हूं यहां पे फिट के अंदर x अंडर क्या कर रहे हैं ट्रेन ले रहे हैं एंड y अंडर क्या करने वाला हूं गाइ यहां पे ट्रेन ले रहा हूं राइट तो ये हमारा मॉडल ट्रेन हो चुका है अब चेक कर लेते हैं किसकी एक्यूरेसी कितनी आई है तो बीएनबी डॉट क्या करते हैं यहां पे स्कोर चेक कर लेते हैं यहां पे स्कोर के अंदर x आपके पास यहां पे ट्रेन एंड y ट्रेन ले लीजिए और मल्टीप्लाई बा 100 कर लीजिए इसके साथ-साथ ब एनबी डॉट फिर से क्या कर रहा हूं यहां पे स्कोर चेक कर रहा हूं किसका x टेस्ट एंड y अर स्कोर क्या कर रहा हूं टेस्ट का और मल्टीप्लाई बाय 100 कर रहा हूं रन कर रहे हैं बिल्कुल 50 % आई है बहुत ही बेकार एक्यूरेसी आई है कंपली आप देखा जाए तो इन तीनों में राइट अब एक काम करते हैं इनके डिसीजन डिजन से पता करते हैं कि किसमें कितना डिसीजन रीजन बनर है मतलब कौन अच्छा यहां पे स्प्लिटिंग कर रहा है दैट वो हमें चेक करना है तो डिसीजन डिजन बनाने के लिए मैं क्या कर रहा हूं यहां पे प्लॉट एनबी अब देखिए जीएनबी का ट्राई कर रहा हूं यहां पे कशन एब का ट्राई रहा हूं मैं यहां पे है ना ओके पीएटी मुझे यहां पे डिसीजन डिजन बनाना है तो मैं क्या करूंगा प्लॉट डिसीजन डिजन को कॉल करूंगा यहां पे एक्सस का डाटा देना है तो एक्स एक्सस में है ही है तो इसको क्या करना है सिंपल सा ू नम पा में कॉल करना है 2 अंड मुझे नम पाई बना देना है राइट इसी तरह से मुझे y का चाहिए तो y डॉट क्या करेंगे यहां पे 2 नपाई को कॉल करके इससे नपाई बना लेंगे इसके बाद हम क्या करेंगे सीएलएफ लेंगे और सीएलएफ में क्या करने वाले है जीएनबी लेने वाले हैं मतलब क एनबी को लेने वाला है उसके बाद पीडी डॉट क्या करेंगे यहां पे शो फंक्शन को कॉल करेंगे और रन कर देते हैं देखिए कशन भी ने आपके पास ऑलमोस्ट सही तरीके से प्रोडक्शन करने की कोशिश की है और बहुत ही परफेक्ट कट निकाला यहां पे राइट और एक दो मिस क्लासिफिकेशन है लेकिन हां हालांकि बहुत अच्छा प्रेडिक्शन करके दिया है यहां पे ओके अ ग्राफ को थोड़ा छोटा कर देते हैं क्योंकि काफी बड़ा ग्राफ है तो इसके लिए हम इस पड फिगर का इस्तेमाल करेंगे राइट तो मैं यहां पे पटी फिगर का इस्तेमाल करते हुए इस ग्राफ को छोटा बना देता हूं ओके अब सेम टू सेम ग्राफ मुझे एक और बनाना है तो मैं नीचे चलता हूं मल्टीनोमियल के अंदर ये मल्टीनोमियल एबी का है मल्टीनोमियल एबी के अंदर देखिए ये ग्राफ बनाते हैं यहां पे और यहां पे जीएनबी की जगह चेंज करके एमएनबी कर देता हूं क्या करना है एम एन बी यस मल्टीनोमियल के लिए ट्राई कर रहे हैं मल्टी नोबेल के लिए ट्राई करें यहां पे तो देखिए इसने एक परफेक्ट लाइन बनाई है लेकिन यह लाइन इतनी अच्छी से नहीं बनी है यस इसे हम परफेक्ट लाइन नहीं बोल सकते ठीक है एक लाइन बना के दी है यहां पे क्योंकि देखिए इसने बहुत ज्यादा मिस क्लासिफिकेशन किया है देखो यहां पे देखिए बहुत ज्यादा मिसक्लासिफिकेशन किया है यहां पे भी बहुत ज्यादा मिस क्लासिफिकेशन किया है तो ये परफेक्टली काम नहीं कर रहा है किसमें मल्टीनोमियल एनबी के अंदर अब बात कर लेते हैं यहां पे बर्नोली में तो ब के लिए हमें क्या करना है बीएन बी का इस्तेमाल करना है तो बीएन बी का इस्तेमाल करते हैं और रन करते हैं तो बीएन बी में तो आपका डिसीजन डीजन ही नहीं बना है क्योंकि 550 चांसेस है यहां पे राइट तो डिसीजन रीजन भी आपका परफेक्टली नहीं बन पाए तो इस तरह से आप अपने डाटा सेट को देख के ट्राई कर सकते हैं कि आपको न्यू बाइस के अंदर कौन सी एल्गोरिथम लगानी है जैसे मुझे देखिए पहले डेटा सेट को देखिए पता चल रहा था कि मेरा जो डेटा सेट है वो नॉर्मल डिस्ट्रीब्यूशन है यदि मैं इसको और अच्छे से नॉर्मल डिस्ट्रीब्यूशन करता जैसे सीजी प नॉर्मल डिस्ट्रीब्यूशन नहीं है लेकिन यदि मैं फंक्शन ट्रांसफॉर्मेशन लगा के इसको और अच्छे से नॉर्मल डिस्ट्रीब्यूशन बनाता तो यह एक्यूरेसी और ज्यादा अच्छी बन जाती और यह जो कर्वेचर है वो और ज्यादा परफेक्ट कर्वेचर की तरफ चला जाता राइट अ बाकी मल्टी नबल आपका टेक्स्ट के ऊपर अच्छा आंसर देता है और आपके पास बंडोल की बात करें तो यदि आपका 01 के अंदर आपके पास है इनपुट फीचर तब ये परफेक्ट अच्छा आंसर देता है राइट तो आई थिंक आई होप सो समझ में आया होगा कि किस तरह से आप यहां पे ने बायस एल्गोरिथम को अप्लाई कर सकते हैं किसके लिए फ्यूचर प्रेडिक्शन के लिए अब प्रेडिक्शन की बात है यहां पे तो प्रेडिक्शन किस तरह से करेंगे तो जैसे मैं प्रेडिक्शन करना चाहूंगा यहां पे किसके ऊपर जीएनबी के ऊपर तो जीएनबी के ऊपर आप प्रेडिक्शन कैसे करेंगे तो देखिए आप यहां पर लगाइए जीएनबी यस क्या लगाएंगे जीएनबी देन आप क्या करेंगे यहां पर प्रिडिक्ट फंक्शन को कॉल करेंगे प्र फंक्शन को कॉल करने के बाद डबल स्क्वायर बैकेट में दे देता हूं अपना डाटा जैसे कि फर्स्ट डटा या सेकंड डटा दे देते हैं सेकंड डटा से चेक कर लेते कि सेकंड डटा के हिसाब से इसका आंसर क्या आएगा तो यह रहा हमारा जीएनबी और इसके आगे कमेंट लगा के ये डटा पेस्ट कर लेता हूं और डाटा क्या है यहां पे 617 देन कॉमा 5.17 और रन करके देखें दैट जीरो आंसर बिल्कुल सही प्रेडिक्शन करके दिया है यहां पे काफी अच्छा प्रेडिक्शन करके दिया है यहां पे राइट इस तरह से आप प्रेडिक्शन कर सकते हैं तो आई थिंक आई होप सो समझ में आ चुका होगा और आज के इस वीडियो के जरिए हम बात करने वाले हैं डिसीजन ट्री एल्गोरिथम्स के बारे में देखिए डिसीजन ट्री जो एल्गोरिथम्स है ये आपके पास रिग्रेशन एंड क्लासिफिकेशन दोनों तरीके के डाटा के अंदर वर्क करती है चाहे आपका डाटा रिग्रेशन है चाहे आपके पास डेटा क्लासिफिकेशन एनालिसिस को फॉलो करता है ये आपके पास दोनों के अंदर वर्क करती है इसके अंदर जो यूज़ आने वाली जो एल्गोरिथम्स है दैट इज अ कार्ट एल्गोरिथम इसके अंदर और भी बहुत सारे एल्गोरिथम्स यूज होती है लेकिन जो सबसे पॉपुलर एल्गोरिथम्स होती है वो हमारे पास कार्ट एल्गोरिथम है कार्ट एल्गोरिथम का मतलब है क्लासिफिकेशन रिग्रेशन ट्री एल्गोरिथम्स यहां पे यूज़ की क्लासिफिकेशन रिग्रेशन टी एल्गोरिथम्स यूज़ की जाती है अब यह जो एल्गोरिथम्स है आपके डाटा को क्या करती है गाइज यहां पे आपके स्प्लिटिंग कर देती है और कौन सी स्प्लिटिंग करती है यह आपके डाटा सेट को बाइनरी स्प्लिटिंग करती है मतलब सेम एज कंडीशनल स्टेटमेंट की तरह आपके डाटा को स्प्लिटिंग करती है और जो भी आपको प्रेडिक्शन करना है वो प्रिडिक्शंस आंसर आपको लेके देती है जैसे कि अभी हमने यहां पे देखा कि यह हमारा डेटा सेट है इस डेटा सेट को क्या करती है गाइज यहां पे ये इस तरीके के कंडीशनल स्टेटमेंट में ब्रेक करती है मतलब बाइनरी स्प्लिटिंग करती है और स्प्लिटिंग करके आपके पास आपका जो आंसर है जो भी आप इससे प्रेडिक्शन कराना चाहते हैं वो प्रेडिक्शन आपके पास के देती है दैट इज अ काट एल्गोरिथम अब बात करते हैं यहां पे कि ये डिसीजन ट्री वर्क कैसे करती है अब जानते हैं कि डिसीजन ट्री किस तरीके के डाटा के ऊपर वर्क करती है तो डिसीजन ट्री हमेशा हमेशा नॉन लीनियर आपके पास स्प्लिटिंग डाटा के ऊपर वर्क करती है अब नॉन लीनियर स्प्लिटिंग डाटा का मतलब क्या हुआ तो देखिए लेट्स सपोज आपके पास कोई डेटा सेट है जैसे कि x1 एक कॉलम है और x2 एक कॉलम है और इसके ऊपर आपका जो डाटा है वो कुछ इस तरीके से पड़ा है जैसे कुछ आपके पास ब्लू कलर से है और और कुछ जो डाटा है आपके पास यहां पर वह आपका ग्रीन कलर से है अब जब आपके पास डाटा जो है वह इस तरह से आपके पास होता है तब आपके पास यहां पर आप क्या इस्तेमाल करते हैं लीनियर सेपरेबल एल्गोरिथम्स यूज करते हैं और लीनियर सेपरेबल एल्गोरिथम के अंदर बात करें तो आप लॉजिस्टिक रिग्रेशन का इस्तेमाल कर सकते हैं या फिर आप एसवीएम का इस्तेमाल कर सकते हैं लेकिन आपके पास डाटा लीनियर सेपरेबल ना हो मतलब आपके पास डाटा इस तरह के फॉर्मेशन में ना हो तो तब क्या होगा मतलब आपका डाटा जो है वो कुछ इस तरीके के फॉर्मेशन में आ जाए जैसे कि अभी मैं यहां पे स्ट्रक्चर बना रहा हूं यहां पे लेट्स आपका जो डाटा है वो इस तरीके के फॉर्मेशन में आ जाए तब क्या होगा यहां पे तब आपका जो डाटा है वो लीनियर सेपरेबल नहीं हो सकता है क्योंकि यदि आप इस डाटा को लीनियर सेपरेबल करने चलेंगे तो आपका प्रेडिक्शन सही नहीं होने वाला है तब ऐसे केसेस के अंदर आप डिसीजन ट्री को इस्तेमाल कर सकते हैं क्योंकि डिसीजन ट्री नॉन लीनियर सेपरेबल एल्गोरिथम है जो कि नॉन लीनियर डाटा को सेपरेबल करती है और डिसीजन ट्री जो वर्क करती है गाइज यहां पे वो आपके पास कंडीशन स्टेटमेंट की तरह वर्क करती है अब यह डिसीजन ट्री किस तरह से ट्री लक स्ट्रक्चर बनाती है जरा उसे समझते हैं तो ये ट्री लक स्ट्रक्चर कुछ इस तरह से बनता है अब इस ट्री लक स्ट्रक्चर में कुछ पॉइंट्स होते हैं जिन्हें हमें समझना है इस लाक स्ट्रक्चर के अंदर जो सबसे पहला जो आपका नोड होता है दैट इज कॉल्ड ऑफ रूट नोड अब ये रूट नोड मतलब जैसे कि आप किसी ट्री को देखते हैं यस जैसे आप क्या करते हैं किसी ट्री को देखते हैं तो ट्री के अंदर सबसे पहले क्या होता है नीचे आपके पास रूट्स होते हैं उसी तरह से डिसीजन ट्री के अंदर जो आपका पहला पॉइंट्स होता है दैट इज कॉल ऑफ रूट नोड होता है उसके बाद में आपका जो ट्री है वो स्प्लिटिंग होता है अब हम यहां पे कार्ट एल्गोरिथम को इस्तेमाल करते हैं तो ये स्प्लिटिंग क्या करता है बाइनरी स्प्लिटिंग करता है यस किस तरह से स्प्लिटिंग करता है आपके डाटा की बाइनरी स्प्लिटिंग करता है दो पार्ट के अंदर तोड़ता है यहां पे तो इसने क्या किया दो पार्ट के अंदर तोड़ा है और दो पार्ट के अंदर तोड़ा है तो दो पार्ट कौन-कौन से हो गए इस तरह से डिसीजन नोट्स हो गए अब जब आपके जो नोट्स है वो फिनिश हो जाते हैं मतलब इसके बाद आपका आंसर खत्म हो जाता है [संगीत] दैट्ची कहलाता है और दूसरा पार्ट होता है वो दूसरा सब ट्री कहलाता है इसके अंदर कुछ पेरेंट्स नोट होते हैं कुछ चाइल्ड नोट्स होते हैं इनको डिटेल के साथ समझेंगे लेकिन पहले ये बनता कैसे है जरा उसको डिस्कस कर लेते हैं तो चलिए मैं उसी डाटा सेट प ले चलता हूं और यहां पर मैं क्या कर रहा हूं इसी डाटा सेट के ऊपर अपना डिसीजन ट्री बनाना हूं यहां पे अब मैं इसके ऊपर डिसीजन ट्री कैसे बनाऊंगा सबसे पहले मैं क्या करूंगा अपना एक रूट नोट बनाऊंगा दैट्ची पार्ट के अंदर स्प्लिटिंग हो रही है अभी मैं बाइनरी स्प्लिटिंग को नहीं ले रहा मैं मल्टीपल स्प्लिटिंग को ले रहा हूं तो ये जो है हमारे पास तीन पार्ट के अंदर स्प्लिटिंग हो रही है कौन-कौन सी है स्प्लिटिंग यहां पे दैट्ची है [संगीत] flipkart-in प्रोग्रामर तो इन तीनों को मैं शॉर्ट चार्ट में लिखूंगा सेल्स एग्जीक्यूटिव को एससी लिख रहा हूं यहां पे बिजनेस मैनेजर को मैं बी लिख रहा हूं और पाइथन प्रोग्रामर को पीपी लिख रहा हूं राइट इसी तरीके से कंपनी को सबसे ऊपर इसका मतलब कंपनी क्या बनने वाली है हमारी यहां पे रूट नोड बनेगी राइट इसके बाद कंपनी ने क्या किया यहां पे और फरदर स्प्लिटिंग की है मतलब मैं बेसिकली गाइस बात करूं यहां पे तो मैंने क्या किया यहां पे जॉब्स स्प्लिटिंग की है तो जॉब जो हमारा हो जाएगा यहां पे दैट इज कॉल ऑफ डिसीजन नोट्स यस जॉब क्या है हमारा यहां पे डिसीजन नोट्स है अब मैं बात करूं यहां पे तो देखिए है बोट अपनी सेपरेट है इसका मतलब क्या है गाइ यहां पे ये तीनों अलग-अलग सेपरेटेड चीजें चल रही है इसका मतलब ये तीनों की तीनों जो चीजें चल रही है दैट इज अ सबट्री जैसे कि एक पेड़ के अंदर एक टहनी होती है उसी तरह से कंपनी जो है आपके पास एक पेड़ का रूट है यहां पे और उसकी जो टहनी है दैट्ची दोनों क्या हो गई आपके पास यहां पे आपके पास सब ट्रीज हो जाते हैं राइट उसके बाद में देखिए गाइस मैं यहां पे और यहां पे डिसीजन नोट्स बनाने जा रहा हूं यहां पे जैसे यहां पे मैं सेल्स एग्जीक्यूटिव बिजनेस एनालिटिक्स और पाइथन प्रोग्राम ओके चलिए अब हम इसके अंदर डिग्री लेंगे डिग्री के अंदर हम देखें तो सभी के अंदर क्या है दोदो डिग्री चल रही है बैचलर एंड मास्टर बैचलर एंड मास्टर बैचलर ए मास्टर ओके तो हम क्या करेंगे फर्द से स्प्लिटिंग करेंगे दैट अ बैचलर एंड मास्टर फिर फर्द स्प्लिटिंग किया मैंने यहां पे बैचलर एंड मास्टर फिर फर्द स्प्लिटिंग किया गाइज यहां पे बैचलर एंड मास्टर इसको भी मैंने स्प्लिटिंग किया मैंने बैचलर और मास्टर के अंदर राइट अब नेक्स्ट जो चीज आती है गाइस यहां पे इनकी सैलरी जैसे सेल्स एग्जीक्यूटिव के अंदर बैचलर की सैलरी 50 के नहीं है और मास्टर के अंदर 50 के नहीं है इसका मतलब इनकी सैलरी प्रोडक्शन जीरो और जीरो होगा अब मेरा जो क्वेश्चन था उस क्वेश्चन का आंसर आपको यहां पर मिलेगा अकॉर्डिंग इस डिसीजन ट्री कैसे लेट्स मैं यहां पे मैं बात करूं तो मेरी जो अगली यहां पे डिग्री है दैट इज अ बिजनेस दैट इज अ बैचलर डिग्री और यहां पे क्या मुझे 50 के सैलरी मिलेगी तो दस आंसर इज नो बिकॉज जीरो यहां पर आ रखा है तो गाइस यहां पे इस तरीके से प्रेडिक्शन होता है इसको थोड़ा सा और सिंपलीफाई करूं तो यहां पे आपके पास होता क्या है कि आपका पहला डिसीजन नोट्स जो होता है यस पहला जो डिसीजन नोट्स होता है वो दो पार्ट के अंदर स्प्लिटिंग होता है वो किसकिस अर होता है यस एंड नो के अंदर राइट यदि यस आता है तो आप क्या करते हैं फर्द इस पार्ट के अंदर चलते हैं और आगे चलते हैं यहां पे यदि नो आता है तो आप दूसरे पार्ट के ऊपर मूव करते हैं फिर आप क्या करते हैं फिर से आपके पास यस और नो आता है उस पर्टिकुलर पॉइंट के ऊपर यस यहां पे भी क्या आता है यस एंड नो आपके आता आता है पर्टिकुलर पॉइंट के ऊपर फिर आप यहां पे छोटे-छोटे और प्लाट्स के अंदर स्प्लिटिंग करते हैं इस तरह से आपका डिसीजन ट्री वर्क करता है मतलब डिसीजन ट्री यहां पे आपका एक ट्री लाइक स्ट्रक्चर बनाता है जहां पे यस नो के बेसिस पे आपका प्रेडिक्शन होता है अब बात करते हैं यहां पे कि इस डिसीजन ट्री के अंदर किस चीज को क्या बोलते हैं तो यहां पर हमने समझा कि जो सबसे पहला जो नोड होता है जहां से आप स्टार्टिंग करते हैं दैट इज कॉल्ड ऑफ रूट नोड उसके बाद में जितने भी अगले नोड होते हैं दैट इज कॉल ऑफ डिसीज नोड्स और जहां पे आपका जो डाटा है वो फिनिश हो जाता है जैसे कि देखिए मेरे पास यहां पे जो डिग्री है दैट इज द माय फिनिशिंग पॉइंट यहां पे मुझे अपना फाइनल प्रेडिक्शन देना है यस स्नो के अंदर तो ये मेरा लास्ट पॉइंट है यहां पे दैट इज कॉल्ड ऑफ लीफ नोड यस ये आपका क्या कहलाता है गाइज यहां पे लीफ नोड कहलाता है तो किसी भी डिसीजन ट्री के अंदर जो सबसे लास्ट वाला पार्ट होता है दैट इज लीफ नोड आपके पास कहलाता है इस तरह से आपका जो डिसीजन ट्री होता है वो डिजाइन होता है इसके अंदर अब बात करें यहां पे तो ये जो नोड आप देख रहे हैं दैट इज कॉल्ड ऑफ पैरेंट्स नोड और ये जो नोड आप देख रहे हैं दैट इज कॉल्ड ऑफ चाइल्ड नोड यस ये इसका क्या कहलाता है चाइल्ड नोड कहलाता है बिकॉज़ दैट्ची इल्ड नोड अब नेक्स्ट प्रोसीजर के अंदर बात करें तो ये क्या बनेगा गाइज यहां पे ये पैरेंट्स नोड बनेगा और ये इसी का क्या बनेगा गाइज यहां पे चाइल्ड नोड बनने वाला है यस क्या बनने वाला है चाइल्ड नोड बनने वाला है तो पैरेंट्स नोड क्या होता है उसके ऊपर का जो डिसीजन नोड्स होता है दैट द पैरेंट नोड्स और उसके नीचे वाला क्या होता है गाइज यहां पे चाइल्ड नोड होता है अब यहीं पे आपका सब ट्री का कांसेप्ट आता है तो सब ट्री कांसेप्ट क्या है गाइज यहां पे तो आपका जो ट्री है यस आपका जो ट्री है वो क्या किया हमने यहां पे दो पार्ट के अंदर स्प्लिटिंग किया है तो ये वाला जो है ये आपका क्या कहलाएगा एक सब ट्री आपके पास कहलाने वाला है ओके चलिए अब इसके टर्म्स लॉजी को एक बार देख लेते हैं तो देखिए रूट नोट कौन सा होता है हमारा स्टार्टिंग नोड रूट नोट होता है देन स्प्लिटिंग का मतलब है है यहां पे तोड़ना मतलब आपके यहां पे जो डिसीजन नोड्स है उसको आप क्या करते हैं फरदर दो पार्ट के अंदर तोड़ते हैं सब नोड्स के अंदर तोड़ते हैं दैट इज कॉल्ड ऑ स्प्लिटिंग उसके बाद है आपका डिसीजन नोड्स जो आपके नोड्स स्लेडिंग होने के बाद जो बनते हैं दैट इज कॉल्ड डिसीजन नोड लिफ नोड को हम टर्मिनेट नोड भी बोलते हैं जो सबसे लास्ट वाला नोड होता है आपके पास यहां पे इसी के अंदर आपका आता है प्रूनिंग अब प्रूनिंग क्या है गाइस यहां पे काफी बार आपके जो डिसीजन ट्री होता है यह बहुत ही लंबा बन जाता है मतलब बेसिकली गाइस बात करें कि काफी बार क्या होता है आपके पास यहां पे ये डिसीजन ट्री बहुत लंबा बन जाता है जिसकी वजह से ओवर फिटिंग के चांसेस बढ़ जाते हैं और इस ओवर फिटिंग से बचने के लिए हम यहां पे क्या करते हैं प्रीनिंग करते हैं प्रीनिंग करने का मतलब बेसिक सिंपल सा है कट करना जैसे आपके पास आपके घर के आसपास कोई ट्री होता है वो ट्री की ब्रांचेस बहुत ज्यादा बढ़ जाती है तो आप क्या करते हैं उस ट्री की ब्रांचेस को कट कर देते हैं उसी तरह से हमारा ये जो डिसीजन ट्री है ये क्या करता है गाइज यहां पे काफी बार बहुत ही ज्यादा कॉम्प्लेक्टेड के सिनेरियो को कम करने के लिए हम यहां पे प्रूनिंग का इस्तेमाल करते हैं प्रूनिंग क्या करता है यहां पे जितना आपके पास यहां पे चाहिए उतने में आप इसे क्या कर देते हैं कट कर देते हैं दैट इज कॉल्ड ऑफ फनिंग अब बात करते हैं यहां पे अगला पॉइंट क्या है यहां पे ब्रांच एंड सबट्री तो आपके पास किसी भी डिसीजन नोट को आप फरदर स्प्लिटिंग करते रहेंगे तो आपके ब्रांच और सबट्री आपके बनते रहेंगे उसके बाद पैरेंट्स चाइल्ड नोट्स तो आपका जो डिसीजन नोट्स होता है उसके नीचे के लीफ नोट या उसके अगले जो नोट्स है वे स्टाइल नोट और जो डिसीजन नोट्स आपके पास होता है दैट अ पैरेंट नोट्स अब यहीं पे सिनेरियो के अंदर एक पॉइंट आता है आपके पास कि सर आपके पास यह जो डाटा है यहीं पे एक पॉइंट आता है क्या पॉइंट आता है कि आपके पास ये जो डाटा है इस डाटा को आपने कंपनी से ही क्यों स्प्लिटिंग किया आपने यहां पे बैचलर डिग्री से क्यों नहीं स्टार्ट किया मतलब डिग्री से क्यों नहीं स्प्लिटिंग की या फिर जॉब से क्यों नहीं स्प्लिटिंग की आपने ब्रांचेस से ही क्यों स्प्लिटिंग की इसका जवाब आपको मिलता है यहां पे इन तीन पॉइंट्स के ऊपर यस यहां पे आपने इंफॉर्मेशन गेन सेकंड पॉइंट इज एंट्रोपय क्या होते हैं जरा समझते हैं यहां पे तो गाइस एंट्रोपय जिन इंडेक्स की हेल्प से ही हम यहां पे हमारा पहला रूट नोट कौन सा होगा और उसके बाद में उसका अगला जो डिसीजन नोट्स होने वाला है कौन सा होगा वो पता लगाते हैं अब ये पता कैसे लगाते हैं तो जरा समझते हैं तो देखिए एंट्रोपिक मैं आपको मतलब यहां पर बताऊं यहां पर एंट्रोपिक मतलब होता है इंप्योरिटी इसका मतलब क्या हुआ गाइस यहां पे कि जो आपके पास सबसे लो इंपोर डाटा होगा देन वो आपका डिसीजन नोट्स बनने वाला है मतलब जरा समझते हैं गाइस यहां पे जरा देखिए इस डटा सेट के थ्रू जैसे मैंने यहां पे क्या कर रखा है कंपनी के थ्रू स्प्लिटिंग कर रखा है और एक तरफ मैंने डिग्री के थ्रू स्प्लिटिंग कर रखा है कंपनी के थ्रू स्प्लिटिंग किया मैंने यहां पर जैसे मैं यहां पे इन डेटा को स्प्लिटिंग करता हूं राइट जब मैं इन डेटा को स्प्लिटिंग करता हूं तो मेरा जो डेटा है जो पीछे बचा हुआ डेटा सेट है वो कुछ इस तरीके के फॉर्मेशन में मुझे नजर आता है डेटा सेट अभी भी वही है लेकिन मेरा जो डेटा सेट है वो कुछ इस तरीके की फॉर्मेशन में नजर आता है अब यहां पे हम क्या निकालते हैं हम एंट्रोपिक हैं यूजिंग दिस फॉर्मूला यस यूजिंग दिस फॉर्मूला दैट माय एंट्रोपय हम इस एंट्रोपय करते हुए हम क्या करते हैं दोनों डेटा सेट की क्या करते हैं का मतलब है हम इंप्योरिटी फाइंड आउट करते हैं और हम लेस एंप्योर डेटा सेट को प्रेफर करते हैं मतलब लेस इंपोर जो हमारे पास कॉलम है उसे प्रेफर करते हैं अगली स्प्लिटिंग के लिए क्यों क्योंकि वो हमें बेटर इंफॉर्मेशन देता है और बेटर इंफॉर्मेशन देता है इसका मींस मतलब हमें यहां पे इंफॉर्मेशन गेन बैटर देता है अब ये क्या सिनेरियो है जरा समझते हैं यहां पे लेट्स हमारा डाटा सेट है उसको हमने क्या किया उसको हमने बैचलर और मास्टर के अंदर स्प्लिटिंग किया अब मैं इन दोनों में से किसी एक नोड को हमारा फर्स्ट नोड जिसे हम बोलते हैं आपका रूट नोट बनाने जा रहा हूं तो इनमें से कौन सा प्रेफर करूंगा तो जिसके अंदर हमारे पास जो एंट्रोपय पे लो एंट्रोपय इंफॉर्मेशन मिलेगी मतलब इंफॉर्मेशन गेन हमें मिलेगी हम उ डेटा सेट को लेंगे अब ये कैसे पता चलेगा जरा समझो देखो यदि कोई पर्सन आपके पास कंपनी को चूज करता है amazon's करता है तो amazon2 वन है राइट चलिए अब मैं बात करूं यहां पे कि यदि मैं बोट कंपनी को देखूं तो बोट कंपनी में अंदर मेरे सारे एलिमेंट क्या है वन वन है इसका मतलब जीरो जो है वो जीरो है और वन जो है वो कितने है 1 2 3 4 5 सिक्स टाइम है ओके चलिए अब बात करते हैं इसके ऊपर इसके अंदर बात करें तो इसके अंदर नंबर ऑफ जीरो और नंबर ऑफ वन को काउंट कीजिए तो देखिए 1 2 3 4 जीरो है हमारे पास यहां पे और आपके पास यहां पे 1 2 3 4 ही हमारे पास वन है ओके अब वा पस इसके अंदर हमें जीरो काउंट करना है इसके अंदर वन काउंट करना है तो देखिए जीरो काउंट करू तो इसके अंदर टू जीरो है और व काउंट करें तो ट 3 4 5 स है यहां प ओके अब यह मतलब हुआ क्या इसका मतलब हुआ क्या इसको जरा थोड़ा समझते हैं यहां पे थोड़ा सा एक एग्जांपल के तौर पर समझते हैं लेट्स सपोज आपके पास एक बास्केट है इस बास्केट के अंदर मैंने कुछ प्लस रख रखे हैं इस बा के अ मैंने कुछ प्लस रख रख है और मैंने एक माइनस रख रखा है अब मैंने कहा यहां पर यदि मैं हैंड डालता हूं तो मुझे सबसे ज्यादा चीजें क्या मिलती है तो आपको मिलेगा यहां पर ज्यादातर प्लस मिलेगा मतलब इसका मतलब क्या हुआ ये आपके पास लेस इंपोर है क्या है लेस इंपोर है यहीं पे यदि मैं आपके पास तीन प्लस और तीन माइनस डाल दूं तो आप क्या बोलेंगे दैट इज आप यहां पे बोलेंगे ये हाईली इंपोर डाटा है वाइली हाई इंपोर डाटा क्योंकि जब आप इसके अंदर हैंड डालते हैं तो आपके पास प्लस आने की जितने चांसेस हैं उतने ही माइनस आने के चांसेस हैं इसका मतलब ये जो डेटा सेट है दैट इज अ हाईली इंपोर डाटा यस क्या है यह हमारे पास हाईली इंपोर डटा है तो बस अब हम यही काम इसके साथ करने वाले हैं किसके साथ इसके साथ यहां पर हमें क्या पता चला गाइ यहां पे यदि कोई पर्सन कंपनी को चूज करता है कंपनी को चूज करता है और वोह पूछता है आपसे यहां पे कि मेरी 50 के सैलरी होगी या नहीं होगी तो आप कैसे जवाब देंगे तो यहां पर यदि वो पर्सन वोट को चूज करता है तो 101 पर आप यहां पे क्या बोलेंगे कि आपकी 50 की सैलरी होने वाली है क्यों क्योंकि यदि वो पर्सन कोई भी स्टीम से आ रहा हो यस चाहे वो बैचलर और मास्टर से आ रहा हो या कोई भी जॉब के लिए अप्लाई कर रहा हो उस हर किसी पोजीशन के अंदर आपकी 50 के सैलरी से अबोव है आप देखिए यहां पे वन वन है यहां पे आपको कोई भी ज्यादा आपको फर्द स्प्लिटिंग करने की जरूरत नहीं है यहीं पे आपका सारा आंसर आपको मिल रहा है देन amazononline.in ही जीरो है ्र ही वन है यहीं पर यदि मैं डिग्री के थ्रू चलूं मैं बोलूं कि यदि मेरी बैचलर डिग्री है क्या मेरी 50 के सैलरी लगेगी तो यहां पे हमें रिजल्ट बता पाना थोड़ा मुश्किल है क्यों क्योंकि देखिए बैचलर डिग्री के अंदर आपके पास फोर और फोर का रेशो है मतलब आपके पास बराबर चीज है तो आपके पास बता पाना थोड़ा मुश्किल होगा यहीं पे मैं मास्टर की बात करूं तो मास्टर के अंदर भी बता पाना मुश्किल होगा तो अब हमें यहां पर क्या पता चलता है कि यदि मैं कंपनी के थ्रू अपने ने डाटा को स्प्लिटिंग करता हूं क्या करता हूं कंपनी के थ्रू अपने डाटा को स्प्लिटिंग करता हूं तो मेरे पास क्या मिलता है यहां पे लो एंट्रोपय क्या मिलती है लो एंट्रोपिया जबकि डिग्री की तरह स्प्लिटिंग करने पर मुझे हाई एंट्रोपय मतलब सिंपल सा है गाइस यहां पे कि कंपनी के थ्रू स्प्लिटिंग करने पर मुझे प्योर डाटा देखने को मिलता है यहां पे और यहां पे बोट के अंदर ही क्यों ना मिल रहा हो लेकिन एक पॉइंट के सिनेरियो पे तो मुझे मिल रहा है राइट मतलब यदि कोई पर्सन वोट के लिए आता है स्पेशली तो उसके अंदर मुझे फर्द स्प्लिटिंग करने की जरूरत नहीं पड़ेगी मुझे फर्द क्लासिफिकेशन नहीं करने की जरूरत पड़ेगी मैं डायरेक्ट अपना आंसर बोल सकता हूं यस आपको 101 पर आपको 50 के से अबोव सैलरी मिलने वाली है तो कंपनी से स्प्लिटिंग करने पर हमें क्या मिल रहा है गाइज यहां पे आपके पास लो एंट्रॉपिज कि डिग्री से स्प्लिटिंग करने पर हमें हाई इंट्री मिलती है तो जब भी आप अपना डिसीजन ट्री बनाना जा रहे हैं जैसे कि मैंने यहां पे सिने के अर डिसीज एंट्री बनाया है तो इसके अंदर होता क्या है आप जस्ट लाइक आपके पास जो कंपनी है आपके पास यहां पे दैट इज योर फर्स्ट कॉलम ओके कंपनी आपके पास क्या है पहला कॉलम है तो इसकी एंट्रोपिक जाती है इसके अंदर स्प्लिटिंग करने पर कितनी इंप्योरिटी आ रही है सेम एज जॉब के अंदर भी यही होता है जॉब के अंदर भी आप क्या करते हैं अपनी एंट्रोपिक करते हैं उसके बाद आप क्या करते हैं डिग्री के अंदर भी आप अपनी क्या करते हैं एंट्रोपिक करते हैं इसके अंदर जो सबसे मिनिमम एंट्रोपय वो आप का पहला डिसीजन नोटस बनेगा जैसे कि आपके पास कंपनी के अंदर आपके पास क्या आई है सबसे लो एंट्रोपय है तो कंपनी आपका क्या बनेगा पहला डिसीजन नोट्स आपका बन जाएगा फिर आपकी कंपनी के थ्रू फर्द स्प्लिटिंग होने के बाद में जो बचे हुए दो कॉलम होते हैं जस्ट लाइक जॉब एंड डिग्री यस इनकी फिर से एंट्रोपिक जाती है एंड इनकी फिर से एंट्रोपय इनमें जो मिनिमम एंट्रोपय यहां पे दैट वो फर्द ली जाती है जैसे कि डिग्री है तो डिग्री आपके पास ली जाएगी देन लास्ट में जो बचा है आपके पास यहां पे जॉब दैट इज अ फाइनल आपका लीप नोट बनने वाला है ओके तो आपका पास क्या हो रही है गाइस यहां पे आपकी जो है यहां पे लो एंट्रोपिया जाता है अब जब आप लो एंट्रोपय से हाई इंफॉर्मेशन गेन आपको देखने को मिलता है हाई इंफॉर्मेशन गेन का मतलब है गाइस यहां पे कि यहां से हमें बैटर अंडरस्टैंडिंग देखने को मिलती है कैसे यदि कोई पर्सन बोट कंपनी को चूज करता है तो डेफिनेटली उसकी जो सैलरी है वो 50 के से अबोव होने वाली है यस क्योंकि यहां पे मुझे एक बार में ही सारी इंफॉर्मेशन मिल गई है मतलब ये वाली जो स्प्लिटिंग है दैट्ची जन नोट्स आपका बनाया जाता है यहां पे तो डिसीजन नोट्स को लेते वक्त आपका सबसे पहले हम एंट्रोपिक केसेस के अंदर आप एंट्रोपय फिर जिनि इंडेक्स को देख सकते हैं दोनों ही आपके पास यहां पे आपके पास इंप्योरिटी को ही प्रेफर करती है तो आप एंट्रोपय जिनियर इंडेक्स दोनों में से एक ले सकते हैं राइट यह आपको बताती है कि अगला डिसीजन नोट्स कौन सा बनने वाला है और यहां पे हमें हाई इंफॉर्मेशन गेन मिल रहा है या नहीं मिल रहा है तो बेसिकली ये तीन पॉइंट्स होते हैं जिन के थ्रू आपका जो डिसीजन ट्री है वो फॉर्मेशन होता है और आप फर्द स्प्लिटिंग के लिए चलते हैं अब मैं बात करू इंफॉर्मेशन गेन का फॉर्मूला क्या है तो इंफॉर्मेशन गेट का फॉर्मूला ये आपके पास ये होता है एंड नेक्स्ट बात करें एंट्रोपिक का फॉर्मूला आपके पास यहां पे ये होता है एंड नेक्स्ट अब बात करें यहां पे तो जिन इंडेक्स का जो फार्मूला होता है वो आपके पास य और आज की इस वीडियो के जरिए हम बात करेंगे डिसीजन ट्री के बारे में अच्छा डिसीजन ट्री के प्रैक्टिकल करने से पहले मैं आपको थोड़ा डटा सेट दिखाना चाहूंगा यदि आपको पाइथन मशीन लर्निंग डाटा साइंस एंड डेटा एनालिस जैसी फील्ड में अपने आपको को ग्रो करना है तो इसके लिए डब्लू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जवाइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं और डाटा सेट के अंदर आपके पास यहां पर है सोशल नेटवर्क्स के नाम से अब सोशल नेटवर्क्स का मतलब है यहां पे कि जस्ट लाइक यहां पे डाटा है अब ये इस डाटा के अंदर बात करें तो आपके पास क्या-क्या है तो बेसिकली आपके पास यहां पे एज दे रखा है उसके ऊपर क्या आपकी एस्टीमेट सैलरी दे रखी है कि मतलब किसी पर्सन की ये ऐज है और उसकी एस्टीमेट सैलरी ये है एंड उसने यह सोशल नेटवर्क खरीदा या नहीं खरीदा है उसके रिकॉर्डिंग आपको यहां पर ये डाटा दे रखा है अब हम क्या करने वाले हैं इसके ऊपर डिसीजन ट्री अप्लाई करेंगे और डिसीजन ट्री के थ्रू प्रोडक्शन करना स्टार्ट करेंगे चलिए कैसे करते हैं तो इसको जरा समझते हैं तो मैं ले चलता हूं आपको जुपिटर नोटबुक के ऊपर जहां हम ये काम करने वाले हैं अब यहां जाके मैं क्या करता हूं एक नई नोटबुक क्रिएट कर लेता हूं जहां पे हम ये प्रॉपर वर्क करेंगे अब इसके अंदर सबसे पहले क्या करेंगे जो मेरे रिक्वायर्ड मॉड्यूल है उनको हम इंपोर्ट करेंगे और डाटा को लोड करेंगे डाटा को लोड करने के बाद में हम उसके ऊपर प्रेडिक्शन करेंगे चलिए तो मैं यहां पे सबसे पहले क्या कर रहा हूं इंपोर्ट कर रहा हूं और इंपोर्ट क्या करने वाले हैं यहां पे पांडा एलियाज ऑफ पीडी को देन मैं यहां पे इंपोर्ट करूंगा किसे यहां पे मैट पल लिप को क्योंकि मुझे ग्राफ बनाने की जरूरत है मैट पल लिप डॉट यहां पर मैं इस्तेमाल करने वाला हूं पीवा प्लॉट एलियाज ऑफ मैंने यहां पे पीएटी रखा है उसके बाद में मैं यहां पे इंपोर्ट करने वाला हूं किसे व वन को एलियाज ऑफ यहां पर एसएनएस लेर हूं चलिए ये तीन रिक्वायर्ड मॉड्यूल है अभी मुझे फिलहाल तो मैंने इन तीन रिक्वायर्ड मॉड्यूल को इंपोर्ट कर रखा है उसके बाद हम क्या कर रहे हैं यहां पे डेटा सेट्स के नाम से एक वेरिएबल बना रहे हैं जहां पे हम हमारा डेटा सेट लोड करेंगे पडी . को सीएसवी के हेल्प से हम हमारी सीएसवी फाइल को लोड करेंगे चलिए सीएसपी फाइल कहां है तो ये रही सल media.net के नाम से हमारे सीएसपी फाइल है इसके ऊपर राइट क्लिक करना है एंड राइट क्लिक करने के बाद में यहां पे आपको मिलेगा कॉपी एज अ पाथ मतलब आपका जो पाथ है वो कॉपी हो जाएगा उसके बाद में जो आपके डबल कोड्स हैं उसे हम यहां पे हटा के यहां पेस्ट कर देंगे चलिए तो ये हमारा जो डेटा सेट है वो लोड हो चुका है हम इसे रिलेटिव पाथ बना लेते हैं और लोड कर देते हैं उसके बाद यहां पर हम हमारा डेटा सेट जो है इसे हम देखते हैं डॉट हैड लगाते हुए इसके तीन डाटा को तो मेरे पास यहां पे एज एस्टीमेट सैलरी और परचेस जो तीनों है यहां पे कॉलम वो मुझे देखने को मिल गए अब मुझे क्या करना है यहां पे एज और एस्टीमेट सैलरी को अलग करना है दैट इज द माय इनपुट पार्ट और परचेस को मुझे यहां पे अलग करना है लेकिन अलग करने से पहले मैं यहां पे चेक करूंगा कि क्या इसके अंदर नल वैल्यू है या नहीं है यदि नल वैल्यू नहीं है तो फिलहाल हम आगे बढ़ेंगे और नल वैल्यू है तो हम यहां पे आगे नहीं बढ़ने वाले चलिए तो मैं क्या करने वाला हूं सबसे पहले चेक करने वाला हूं तो देखिए क्या कर रहे हैं गाइ यहां पे डाटा सेट के अंदर जाएंगे डॉट यहां पर मैं इज नल का इस्तेमाल करूंगा और डॉट सम लगाते हुए इसके अंदर नल वैल्यू को चेक करूंगा तो फिलहाल इसके अंदर कोई नल वैल्यू नहीं है एज के अंदर भी नहीं है एस्टीमेट सेलरी में भी नहीं है परचेस के अंदर भी नहीं है अब नेक्स्ट टारगेट हमारा क्या होगा नेक्स्ट टारगेट होगा हमारा इनपुट और आउटपुट को अलग-अलग करना मतलब डिपेंडेंट और इंडिपेंडेंट वेरिएबल को अलग-अलग करना चलिए तो मैंने x नाम से एक वेरिएबल बनाया है जिसके अंदर मैं क्या करूंगा हमारा डेटा सेट लूंगा डॉट यहां पर मैं आ लॉक लेने वाला हूं जिसके थ्रू मैं सारी रोज लेने वाला हूं एंड कॉमा लगा के कॉलम के अंदर मैं यहां पे केवल आपके पा परचेस को छोड़ के सारे कॉलम ले लूंगा एज इनपुट के अंदर x को यदि मैं देखूं तो ये रहे मेरे x के कॉलम जिसमें एज और एस्टीमेट सैलरी है अब इसी तरीके से मुझे y लेना है तो मैं अपने डेटा सेट के पास जाऊंगा देन स्क्वायर ब्रैकेट और परचेस को कॉल कर देता हूं तो मेरा x और y जो है दोनों के दोनों आ चुके हैं यहां पे अब नेक्स्ट टारगेट क्या होगा कि देखिए हमारा जो डेटा सेट है इसके अंदर जो एज है उसका जो डाटा है वो बहुत ही कम है और आपके स्टिमेट सैलरी देखेंगे तो उसके कंपैटिबल बहुत ज्यादा लार्ज जाए तो बेसिकली मुझे क्या करना पड़ेगा गाइज यहां पे कि मुझे इन दोनों की स्केलिंग करनी पड़ेगी तब जाके हमारे पास यहां पे जो आउटपुट होगा वो बहुत ही अच्छी तरीके से प्रोडक्शन होगा तो बेसिकली मुझे इन दोनों की क्या करनी है स्केलिंग करनी है अब इन दोनों की स्केलिंग हम कैसे करेंगे जरा समझते हैं यहां पे तो मैं चलता हूं फ्रॉम साइकल लाइन के अंदर डॉट यहां पे चलूंगा गाइज यहां पे प्री प्रोसेसिंग के अंदर एंड प्री प्रोसेसिंग में चलने के बाद दैट मैं इंपोर्ट करने वाला हूं और इंपोर्ट कैसे करूंगा गाइज यहां पे मैं स्टैंडर्ड स्केलर को इंपोर्ट करूंगा तो स्टैंडर्ड स्केलर ले लिया मैंने यहां पे अब उसके बाद देखिए एससी के नाम से एक वेरिएबल बना लेते हैं और स्टैंडर्ड स्केलर को मैं यहां पे कॉल कर लेता हूं राइट और स्टैंडर्ड स्केलर को कॉल करने के बाद में नेक्स्ट हमारे पास एससी डॉट मैं क्या करूंगा यहां पे मॉडल को फिट करूंगा फिट के अंदर मैं अपना डटा जो x है वो मैं पास करूंगा एंड रन करूंगा तो मेरे जो स्केलिंग है वो हो चुकी है अब नेक्स्ट टारगेट में हम क्या करेंगे गाइज यहां पे एसी डॉट यहां पे ट्रांसफॉर्म करने वाला हैं तो ट्रांसफॉर्म के अंदर मैं x रखूंगा तो मेरा जो डाटा है वो स्केलिंग होके मेरे पास आ जाएगा अब मुझे इसको वापस डेटा फ्रेम के अंदर कन्वर्ट करना पड़ेगा तो कैसे करेंगे तो देखिए x नाम का वही दोबारा वेरिएबल बनाएंगे पीडी डॉट यहां पे क्या करने वाला हूं यहां पे डेटा फ्रेम क्रिएट करूंगा और डटा फ्रेम के अंदर जाके मैं यहां पे क्या एक नया कॉलम बनाऊंगा पडी डटा फ्रेम के तरफ से मैं एक डाटा फ्रेम तैयार कर रहा हूं जहां पे हमारा जो स्केलिंग करा हुआ जो डाटा है वो हम यहां रखने वाले हैं अब यहां पे मुझे देना है कॉलम के नाम क्योंकि कॉलम के नाम मुझे यहां प देने पड़ेंगे क्योंकि जो डेटा फ्रेम बनेगा उसके अंदर कॉलम की जरूरत पड़ेगी तो मैं एक् डॉट यहां पे कॉलम्स का इस्तेमाल करूंगा कॉलम के नाम के लिए चलिए इसे मैं क्लोज कर देता हूं और रन करता हूं तो x हमारा वापस आ चुका है जो कि स्केलिंग होके आया है देख एक् को देखें तो ये देख हमारा जो डाटा है वो स्केलिंग होके आ चुका है एक फिक्स रेंज के अंदर हमारा डाटा आ चुका है चलिए अब नेक्स्ट टारगेट में हम क्या करेंगे हमारे डाटा को ट्रेन ऑफ टेस्ट के अंदर स्प्लिटिंग करेंगे ट्रेन ऑफ टेस्ट के अंदर स्प्लिटिंग करने के लिए मैं फ्रॉम साइ के टन के जाऊंगा यहां पे डॉट यहां पे जाऊंगा मॉडल सिलेक्शन के अंदर तो मैं गया मॉडल सिलेक्शन के अंदर ट्स मैंने यहां पे इंपोर्ट किया और इंपोर्ट किसे कर रहे हैं गाइ यहां पे ट्रेन टेस्ट स्प्लिटिंग को कर रहे हैं जिससे हम हमारे डेटा सेट के अर क्या करें ट्रेन और ट्र के अर स्प्लिटिंग कर सके डाटा को चलिए उसके बाद में मैं यहां पे एक्स अंडरस्कोर मैं यहां लूंगा यहां पे टी आर ए आई एन ट्रेन एंड नेक्स्ट मैं यहां पे लूंगा एक्स अंडर टेस्ट लेने वाला हूं यहां पे देन y अंडरस्कोर मैं यहां पे ट्रेन लेने वाला हूं यहां पे ट्रेन लेने वाला हूं यहां पे देन y अंडरस्कोर मैं यहां पे टेस्ट लेने वाला हूं राइट और ट्रेन टेस्ट स्प्लिटिंग ले लिया मैंने यहां पे उसके अंदर x और y का जो डेटा है वो मैंने पास करा दिया उसके बाद हमारी जो टेस्टिंग साइज है वो दे रहे हैं यहां पे 0.22 उसके बाद हम हमारा रैंडम स्टेट देने वाले हैं रैंडम स्टेट इल 42 रखा है चलिए इसे रन करते हैं अब नेक्स्ट हमारा टारगेट क्या होगा गाइज यहां पे नेक्स्ट हमारा टारगेट होगा कि जो ट्रेन और टेस्ट के अंदर स्प्लिट डटा है इसके थ्रू हम हमारा मॉडल बनाए और मॉडल कौन सा बनाने वाले हैं हम यहां पे डिसीजन ट्री मॉडल को बनाने वाले हैं तो हम हमारे जो मॉडल की जो रिक्वायर्ड लाइब्रेरी है उसे हम इंपोर्ट करते हैं तो चलिए मैं फ्रॉम साइकल न के अंदर चलता हूं यहां पे डॉट इसके अंदर जाने के बाद में मैं जाऊंगा ट्री के अंदर जहां पे हमें मिलेगा डिसन ट्री अच्छा हम इंपोर्ट करते हैं डिसीजन ट्री को तो देखिए डिसीजन ट्री जो है गाइ यहां पे ये दो तरीके से काम करता है डिसीजन ट्री क्लासिफाइज कि मैंने आपको बोला था कि जो डिसीजन ट्री है ये रिग्रेशन एंड क्लासिफिकेशन दोनों तरह के एल्गोरिथम्स के अंदर वर्क करता है तो यहां पे आपको दोनों तरीके के मॉडल्स आपको देखने को मिलेंगे तो फिलहाल हम यहां पे क्लासिफिकेशन को इस्तेमाल करेंगे क्योंकि हम क्लासिफिकेशन मॉडल बनाने जा रहे हैं क्योंकि आप देखेंगे इसके आउटपुट को देखेंगे तो 01 01 के फॉर्मेट में आ रहा है इसका मतलब ये क्लासिफिकेशन मॉडल है और इसके ऊपर क्लासिफिकेशन एनालिसिस होने वाली है तो इसलिए मैंने डिस एंट्री क्या लिया है क्लासिफाई माल किया है अब डिस एंट्री क्लासिफाई को इस्तेमाल करने के लिए मैं क्या करूंगा dt3 क्लासिफाइज में देखिए गाइज यहां पे मैं मॉडल का स्कोर चेक कर रहे हैं यहां पे कैसे x यहां पे टेस्ट से एंड देन y टेस्ट से मैं इस मॉडल का स्कोर चेक कर रहा हूं दैट 83 मेरे पास यहां पे एक्यूरेसी आ रही है तो इस तरह से हमारा जो डिसीजन ट्री मॉडल है वो हमारा तैयार हो चुका है अब इसके थ्रू हम यहां पे क्या कर सकते हैं प्रेडिक्शन भी कर सकते हैं इस तरह से करेंगे यहां पे तो टी डॉट यहां पे आपको मिलेगा प्रिडिक्ट फंक्शन प्रिडिक्ट फंक्शन के अंदर जाने के बाद में आप डबल स्क्वायर ब्रैकेट करके हुए आप अपना डाटा दे सकते हैं चलिए एक काम करते हैं पहला टेस्ट करते हैं यहां पे पहले नंबर वाले डाटा को ही कि यदि मैं 19 और 90000 देता हूं यहां पे तो यह मुझे क्या प्रेडिक्शन कर देता है फिलहाल ये 83 पर एक्यूरेसी है तो बहुत ही कम यहां पे प्रेडिक्शन करके देगा लेकिन फिलहाल हम एक बार फिर से चेक भी कर लेते हैं कि क्या प्रेडिक्शन करके देगा तो मैंने 19 लिया है और यहां पर मैंने 19000 यहां पे एंटर कर दिया देन जैसे ही मैं रन करता हूं ये प्रेडिक्शन मुझे वन करके देता है मतलब ये रॉन्ग प्रेडिक्शन करके दे रहा है चलिए इसी तरह से दूसरा चेक कर लेते हैं कि 35 है और आपके पास यहां पे 2000000 है तो इसके ऊपर आपका क्या रिजल्ट निकल के आएगा 30000 है और 20 2000000 है तो यहां पे इसका क्या रिजल्ट निकल के आएगा चलिए इस हम यहां पर देख लेते हैं तो मैंने यहां पे दिया 35000 और और यहां पर मैंने कर दिया 20000 ओके एंड रन करता हूं तो इस पे प्रोडक्शन वन आया है यहां पे और एक्चुअल प्रोडक्शन यहां पे जीरो है मतलब इतने अच्छी तरीके से तो प्रोडक्शन नहीं करके दे रहा है हां लेकिन यहां पे ठीक ठाक है आपके पास एक्यूरेसी आपके पास कितनी आ रही है आपके 83 पर एक्यूरेसी आपको देखने को मिल रही है राइट चलिए अब हम यहां पे क्या करते हैं ये जो डिसीजन ट्री तैयार हुआ है इस डिसीजन ट्री के अंदर हमारा रूट नोड क्या बना है यहां पे बेसिकली और उसके बाद में आपके पास यहां पे सब डिसीजन नोट्स क्या बने यहां पे और ये किस तरह से प्रेडिक्शन हुआ है इसका थोड़ा सा ग्राफ की एनालिसिस करना चाहते हैं तो इसकी ग्राफ की एनालिसिस कैसे कर सकते हैं जरा इसको समझते हैं यहां पे तो देखिए मैं इसके लिए क्या करूंगा फ्रॉम साइक लन के अंदर चलूंगा यहां पे ठीक है साइक लन के अंदर चलने के बाद में मैं मैं यहां पे ट्री पे जाऊंगा ट्री के अंदर जाने के बाद मैं यहां पे इंपोर्ट करने वाला हूं यहां पे क्या प्लॉट ट्री को यस तो मैं प्लॉट ट्री का इस्तेमाल करूंगा जिसके थ्रू हम हमारा ट्री जो है वो प्लॉट कर पाएंगे अब देखिए प्लॉट ट्री के अंदर हम सबसे पहले क्या करेंगे प्लॉट ट्री को कॉल करेंगे प्लॉट ट्री को कॉल करने के बाद में ये आपसे मांगेगा आपका डिसीजन ट्री जो भी आपने डिसीजन ट्री ये दिया है वो आप डिसीजन ट्री दे सकते हैं तो फिलहाल मैं यहां पे क्या कर रहा हूं अपना डिसीजन ट्री दे र हूं दैट द को देखने के लिए मैं पीएटी डॉट यहां पर शो फंक्शन का कॉल करूंगा ताकि हम डिसीजन ट्री को बना सके देन मैं जैसे ही रन करता हूं यहां पे तो देखिए किस तरह का ग्राफ बन के आता है उसको जरा एनालिसिस करते हैं देखिए ओके इसने एक बहुत ही अच्छा ट्री लाक स्ट्रक्चर बना के दिया है जहां पे ये अच्छे तरीके से स्प्लिटिंग कर रहा है अब मैं एक काम करता हूं इस ग्राफ को थोड़ा सा बड़ा बनाता हूं ताकि आप इसे एनालिसिस कर सक और सेकंड चीज हम इसे क्या करते हैं सेव कर लेते हैं सेव करने से क्या होगा कि हम यसे आराम से बाहर से एनालिसिस कर पाएंगे कि ये किस तरह से स्प्लिटिंग कर चुका है और हम यहां पे ये भी देख पाएंगे कि ये किस तरह से डाटा को स्प्लिटिंग करके काम में ले रहा है ओके तो मैं यहां पे क्या करूंगा कि इसे पीएटी डॉट यहां पे क्या करूंगा फिगर की साइज को बड़ा करूंगा तो पीएटी डॉट मैं क्या करूंगा यहां पे फिगर को इस्तेमाल करूंगा फिगर के बाद में मैं जाऊंगा यहां पे फिक्स साइज के अंदर फिक्स साइज के अंदर जाने के बाद में नेक्स्ट हमारा टारगेट क्या होगा गाइज यहां पे कि इसके अंदर हमारी साइज जो है उसकी बड़ी करेंगे तो मैं काम करता हूं 20 * 20 पिक्सल का बना लेता हूं ग्राफ ताकि अच्छे से दिखाई दे और ग्राफ बनने के बाद में मैं इसमें क्या करना चाहता हूं इस ग्राफ को सेव करना चाहता हूं सेव करने के लिए मैं पीएटी डॉट यहां पे क्या करूंगा आपके पास यहां पे सेव फिगर का इस्तेमाल करूंगा सेव फिगर के अंदर जाने के बाद मैं इसका नाम यहां पे डेमो डॉट यहां पर जेपीजी रखूंगा ताकि ये जेपीजी के अंदर क्या आ जाए सेव हो जाए अब हम क्या करेंगे इसे रन करेंगे तो ये मेरा जो ग्राफ है वो 20 20 पिक्सल्स के अंदर जो है वो ट्रेंड हो जाए सेव हो जाएगा एंड देन हम उसके अच्छी तरह से एनालिसिस कर सकते हैं इसके बाद नेक्स्ट चीज मैं यहां पे आपको ये भी बताऊंगा कि इसकी डिसीजन बाउंड्रीज क्या रही होगी डिसीजन बाउंड्रीज का मतलब यहां पे ये है कि जैसे हम इसका ग्राफ बनाते हैं तो ग्राफ बनाने के बाद इसने कैसी-कैसी बाउंड्रीज बना के इसको डिफरेंशिएबल नियर एल्गोरिथम है तो बेसिकली ये लाइन से तो स्प्लिटिंग नहीं करता है तो लाइन से स्प्लिटिंग नहीं करता है तो फिर ये किस तरह से स्प्लिटिंग करता है वो भी हम एनालिसिस कर पाएंगे चलिए जरा हम पहले इस ग्राफ को देख लेते हैं कि ये ग्राफ क्या हमें दिखा रहा है डिसीज ट्री किस तरह से बना है तो देखिए ये हमारा ो . जेपीजी के नाम से हमारा सेव हो चुका है जिस लोकेशन हमने दी है वहां पे हमारा ये ग्राफ जो है वो सेव हो चुका है इसे मैं ओपन करता हूं और इस ग्राफ के एनालिसिस को आपको जरा समझाता हूं देखिए ग्राफ को जूम करते हैं हम यहां पे और ग्राफ अभी भी मेरा काफी ब्लर आ रहा है तोक मुझे चीजें अच्छी तरह से नहीं दिखाई दे रही है तो फिलहाल मैं क्या करूंगा इस ग्राफ को यहां से डिलीट कर दूंगा और वापस से दोबारा ग्राफ बनाऊंगा दैट अ 50 50 पिक्सेल से तो इसको कर देते हैं 50 50 पिक्सल से ताकि ये अच्छे से ग्राफ बन सके और हम इस इसके अच्छे से एनालिसिस कर सके चलिए फिर से इसे रन करते हैं और कुछ देर के लिए वेट करते हैं चलिए हमारा जो ग्राफ है वो बन के आ चुका है और अब मैं इस ग्राफ को ओपन करता हूं आपको थोड़ी सी एनालिसिस समझाता हूं देखिए अब मैं जैसे ही इस ग्राफ को ओपन किया है तो ओपन करने के बाद सबसे पहले क्या कर रहा है ये किस तरह से आपका रूट नोट बना रहा है वो आपको दिखाई दे रहा है रूट नट के बाद में देखिए हमने यहां पे कौन सी एल्गोरिथम इस्तेमाल की है हमने यहां पे कार्ट एल्गोरिथम इस्तेमाल की है कार्ट एल्गोरिथम क्या करती है आपके डाटा को बाइनरी स्प्लिटिंग करती है मतलब आपका जो भी डाटा होगा उसको बाइनरी पार्ट के अंदर स्प्लिटिंग करेगी मतलब दो आपके पास पॉइंट अप में तोड़ेगी उसके बाद में क्या करगी ये फरदर और दो पॉइंट के अंदर तोड़ेगी फिर से फर्द दो और पॉइंट के अंदर तोड़ेगी ऐसे करते हुए आपकी जो कार्ट एल्गोरिथम है वो यहां पे वर्क करती है तो फिलहाल देखिए आपके पास हमेशा आपको क्या करती है बाइनरी स्प्लिटिंग आपको देखने को मिलेगी हर जगह पे और देखिए सबसे पहले आपको यहां पे क्या मिल रहा है सबसे पहला आपको यहां पे नोड मिल रहा है दैट इज अ रूट नोड उसके बाद में आपके दो डिसीजन नोट्स हैं उसके बाद में फिर से आप देख पाएंगे और भी नोट्स बन रहे हैं उसके बाद देखिए और भी नोट्स बन रहे हैं एंड और भी नोट्स बनते बनते हैं ये फाइनल आपके पास क्या बन रहे है यहां पे आपके लीफ नोट्स बन रहे हैं काफी जगह पे आपको लीफ नोट्स यहां पे आराम से दिखाई देने लग जाएंगे अब मेन पॉइंट पे यहां पे आते हैं कि ये किस तरह से स्प्लिटिंग हुआ है और यहां पे ये क्या-क्या चीजें किस तरह से दिखाई दे रही है जरा उसको समझते हैं देखिए मैं एक काम करता हूं इस ग्राफ को साइड बाय साइड कर लेता हूं ताकि आपको अच्छे से तरीके से एनालिसिस हो सके कि इस ग्राफ के अंदर क्या-क्या चीजें दिखाई दे रही है सबसे पहले पॉइंट आते हैं हमारे सबसे पहले पॉइंट के ऊपर दैट इज अ डिसीजन नोट्स या फिर आप इसे रूट नोट्स कर सकते हैं नोट्स रोट के लिए इसने x ऑफ 0 का इस्तेमाल किया है अब x ऑफ 0 क्या चीज है गाइज यहां पर जरा समझे तो देखिए आपके पास जो डेटा सेट है इस डेटा सेट के अंदर आपने इनपुट के अंदर कितने कॉलम दिए हैं दो कॉलम दिए हैं इसमें पहला कॉलम आपके पास क्या है x ऑफ 0 है और दूसरा कॉलम कॉलम x ऑफव है तो इसने सबसे पहला जो स्प्लिटिंग की है मतलब सबसे पहला जो आपका स्प्लिटिंग पॉइंट लिया है यहां पे दैट इज x ऑफ 0 लिया है x ऑफ 0 मतलब a से स्प्लिटिंग की है यहां पे ना कि एस्टीमेट सैलरी से की है क्योंकि मे बी इसका जिन इंडेक्स जो है यहां पे वो कम रहा होगा या फिर एंट्रोपय होगी सेकंड पॉइंट पे यहां पे आते हैं कि दैट्ची इंडेक्स एंट्रोपिलोरिक किया है 320 सैंपल्स के अंदर इसने 205 सैंपल को अलग किया है और 115 सैंपल्स को अलग किया है मतलब जो आप का पहला कॉलम इसने लिया है इस पहले कॉलम के अंदर इसने दो तरह के इंप्योरिटी देखी है कुछ इंप्योरिटी अलग रही होगी एंड कुछ इंप्योरिटी अलग रही होगी तो इस तरीके से आपके दो पार्ट के अंदर स्प्लिटिंग किया है यि आप लोगों को याद नहीं है तो हमने पिछली बार एक एग्जांपल लिया था जो कि आपका कंपनी बेसिस पे था चलिए मैं थोड़ा उससे एग्जांपल के ऊपर वापस ले चलता हूं तो मेरे पास यहां पे उस पीपीटी पे है और पीपीटी में हम चलते हैं उस वापस एग्जांपल के ऊपर देखिए हमने ये एग्जांपल लिया था कि हमारे पास बहुत सारी कंपनीज हैं अब लेट्स सपोज मैंने कंपनी को एक कॉलम के तौर पे चूज किया है तो कंपनी के अंदर हमारे पास क्या है तीन कंपनी है जिसमें amazononline.in प्रिंट जो डटा है वो आपका अलग तरीके से कैटेगरी इज हो रहा है इस तरह से देखिए आपका जो डाटा है वो फर्द आपके स्प्लिटिंग हुई है फिर यहां पे देखिए अगला जो कॉलम इन्होंने चूज किया स्प्लिटिंग करनेके लिए वो x1 को चूज किया है मतलब एस्टीमेट सैलरी को चूज करके यहां पे काम किया है एस्टीमेट सैलरी को फिर से चूज किया यहां पे फिर उसके बाद देखिए आपके पास कहीं पे x1 0 कहीं x1 x1 को इस्तेमाल करते हुए आपके डाटा की प्रॉपर पूरी तरीके से क्या की है स्प्लिटिंग की है अब बात करते हैं कि इसके अंदर जो टोटल डाटा इन्होंने बताया है दैट इज अ 320 यहां पे बताया तो चलिए जरा देखते हैं कि क्या इसमें वाकई में 320 डेटा है क्या तो देखिए हमारा ने यहां पे जो डेटा लिया है दैट इज एक्स डाटा यस इस एक्स डाटा के अंदर हमने क्या किया एक्स ट्रेन को यहां पर स्लिटिंग किया तो मैं यहां पे x ट्रेन को लूंगा एंड डॉट यहां पर इसकी शेप निकालूं शेप निकालने पे मुझे पता चला है 320 हमने इनपुट के अंदर डाटा दिया है और इन्होंने भी 320 लेते हुए इनके ऊपर स्लिटिंग का काम किया है राइट तो पहली चीज तो हमें यहां पे ये चीज क्लियर हो गई सेकंड चीज ये ग्राफ कैसे बन रहा है आई थिंक आपको क्लियर हो चुका होगा थर्ड पॉइंट पे आपके पास आ रहा है यहां पे कि आप यहां पे स्प्लिटिंग गने के लिए क्या कर रहे हैं जीनी इंडेक्स का इस्तेमाल करें अब जैसा कि मैंने आपको बताया था कि यदि आप कोई डाटा स्प्लिटिंग करते हैं तो इसके लिए दो चीज आपके पास मो इंपोर्टेंट वर्क करती है दैट इज द जीन इंडेक्स एंड सेकंड चज एंट्रोपय को लेके आपके यहां पे वर्क करते हैं जिसका जीन इंडेक्स सबसे कम होगा हम उस डेटस के थ्रू स्प्लिटिंग करेंगे देन सेकंड चीज जिसके अंदर एंट्रोपिक होगी उसके अंदर भी हम स्प्लिटिंग करेंगे इसके साथ-साथ इंफॉर्मेशन गेन जो होती है वो आपके पास हाई होनी चाहिए जितनी ज्यादा हाई इंफॉर्मेशन गेन होगी उतना ही डाटा आपके पास यहां पे स्पेडिंग होने में आसानी से होगा राइट तो बेसिकली यहां पे जन इंडेक्स का इस्तेमाल किया गया है हम चाहे तो यहां पे एंट्रोपिक का भी इस्तेमाल कर सकते हैं राइट और भी चीजों का इस्तेमाल करके हम इस मॉडल को और ज्यादा इंप्रूव कर सकते हैं अब उन पॉइंट पे आते हैं जिनके थ्रू हमारा ये जो मॉडल है वो इंप्रूव होने वाला है राइट तो उसके लिए हम क्या करते हैं गाइज यहां पे वापस बैक टू द पॉइंट पे चलते हैं अब पहली चीज हम यहां पे देखते हैं कि हमारा जो डटा स्प्लिटिंग हुआ है दैट जीनी से हुआ है यदि हमें एंट्रोपिक करना होता तो हम क्या करते तो देखिए ये जो डिसीजन ट्री है इस डिसीजन ट्री को जैसे ही आप थोड़ा सा ओपन करेंगे यहां पे ओपन करने के लिए आप क्या करेंगे शिफ्ट और टैब का इस्तेमाल करेंगे ये जो डिसीजन ट्री है वो ओपन हो जाएगा ओपन होने का बेसिक मतलब यहां पे ये है कि इसके अंदर के जितने भी हाइपर पैरामीटर्स हैं वो आपको शो हो जाएंगे एक तरीके से बात करें यहां पे कि ये जो फंक्शन है ये फंक्शन क्या-क्या फंक्शनालिस चीज के बारे में सब कुछ आपको आइडेंटिफिकेशन हैं जैसे जिनी आता है देन एंट्रोपिया है एंड देन लॉक लॉस आता है तो आप चाहें तो एंट्रोपय माल कर सकते हैं तो फिलहाल मैं एक काम करता हूं एक और नया डिसीजन ट्री बनाता हूं और उसके अंदर एंट्रोपिक थ्रू यहां पे क्या करता हूं प्रेडिक्शन करता हूं तो मैंने इसको फिलहाल यहां से कॉपी कर रखा है और dt1 कर देते हैं यहां पे एंड d1 कर देते हैं इस बार क्राइटेरिया को थोड़ा सा चेंज करते हैं और क्राइटेरिया को चेंज करके हम क्या करते हैं एंट्रोपय के चेक करते हैं कि एंट्रोपय पास कितना फर्क देखने को मिलता है तो यदि मैं यहां पे आपका काटेरिन चेंज करूं और काटेरिन के अंदर मैं एंट्रोपिक गाऊं तो हमारा मॉडल ट्रेंड हो जाएगा एंड देन सेकंड चीज हमारे पास यहां पे आ गया स्कोर स्कोर में कितना फर्क देखने को मिलेगा तो यदि मैं dt1 का इस्तेमाल करूं एंड देन स्कोर चेक करूं तो देखिए dt1 के स्कोर के अंदर कोई ज्यादा फर्क नहीं देखने को मिल है तो देन आप बात करें एंट्रोपय पे जीन इंडेक्स के अंदर तो इतना कुछ ज्यादा मेजर डिफरेंस आपको नहीं देखने को मिलेगा लेकिन काफी बार ऐसी जगह आएगी जहां पे एंट्रोपय और जेनी इंडेक्स के अंदर काफी चीजों के अंदर मेजर डिफरेंस देखने को मिलेगा इस तरह से आप अपना डिसीजन ट्री बना सकते हैं अब जैसा कि मैंने आप लोगों को बोला था कि डिसीजन ट्री एक नॉन लीनियर एल्गोरिथम है तो बेसिकली जब आप यहां पे डेटा स्प्लिटिंग करने जा रहे हैं कट जब आप यहां पे डेटा को अलग-अलग डिफरेंशिएबल नियर लाइन बननी चाहिए तो पहले तो हम ये देखते हैं कि हमारा जो डेटा सेट है उसके अंदर डेटा किस तरह से स्प्लिटिंग है मतलब हमारे डटा के अंदर किस तरह का ग्राफ बन के नजर आ रहा है वो देखते हैं यहां पे ग्राफ बनाने के लिए मैं पहले ऊपर जाऊंगा और यहां से अपना ग्राफ तैयार करूंगा अब देखिए इसके लिए मैं क्या कर रहा हूं यहां पे एए डॉट यहां पर स्केटर प्लॉट का इस्तेमाल कर रहा हूं क्योंकि इसके अंदर हमारे पास क्या होता है ह्यू पैरामीटर है होता है जिसके थ्रू हम हमारे ग्राफ के स्प्लिटिंग को देख सकते हैं कि उसके अंदर जो कैटेगरी है वो किस तरह से स्प्लिटिंग हो रही है चलिए एकस एक्सेस का डाटा लेते हैं यहां पे एक्स एक्सेस के अंदर मैं क्या कर रहा हूं यहां पे एज ले लेता हूं देन अब मैं क्या कर रहा हूं यहां पे y एक्सेस का डाटा लेता हूं और y एक्सेस के अंदर मैं लेने वाला हूं यहां पे एस्टीमेट सैलरी तो मैंने y इक्वल टू एस्टीमेट सैलरी है और डेटा इक्वल टू की बात करें यहां पे तो डटा इक्वल टू हम यहां पे ले रहे हैं हमारा डेटा सेट उसके बाद में मैं यहां पे हू पैरामीटर लेने वाला हूं और ू पैरामीटर के अंदर मैं डालूंगा यहां पे परचेस्ड को जिसके थ्रू हमें यहां पे डटा को स्प्लिटिंग आराम से हो पाएगी देन इस ग्राफ को देखने के लिए मैं यहां पे पटी ड सो फंक्शन का इस्तेमाल करूंगा एंड रन कर देता है इस ग्राफ को तो देखिए अब हम इस ग्राफ को देखें तो ये हमारे पास क्या है एक नॉन लीनियर स्प्लिटिंग ग्राफ है कैसे क्योंकि देखिए कुछ ऐसे आपके रेड पॉइंट है जो ब्लू पॉइंट के साथ मिक्स हो रहा है और कुछ ऐसे ब्लू पॉइंट है जो कि रेड पॉइंट के साथ मिक्सिंग हो र है बेसिकली यहां पे लीनियर लाइन आपके पास प्रॉपर्ली वर्क नहीं करेगी यहां पे नॉन लीनियर लाइन ही हमारे लिए प्रॉपर्ली वर्क करेगी तो अब ये नॉन लीनियर लाइन कैसे स्प्लिटिंग हुई है जरा उसको देख लेते हैं ते हैं तो इसके लिए मुझे एक मॉड्यूल की रिक्वायरमेंट पड़ेगी तो उस मॉड्यूल को इंपोर्ट करते हैं तो उसके लिए हम चलेंगे फॉर्म आपके पास यहां पे एमल एक्सटें मॉड्यूल के अंदर एमएल एक्सें अंदर मॉड्यूल के अंदर जाने के बाद मैं यहां पे चलूंगा आपके पास प्लॉटिंग के अंदर mx1 मॉड्यूल के बाद में हम यहां पे चलेंगे इसके प प्लॉटिंग के ऊपर तो मैं यहां पे प्लॉटिंग कर लेता हूं अब प्लॉटिंग हमारे पास दो बार हो रही है तो मैं एक बार इसे हटा देता हूं ए मॉडल को देन प्लॉटिंग के अंदर जाने के बाद में इंपोर्ट करने वाला हूं गाइ किसे यहां पे डिसीजन डिजन को तो मैं यहां पे इस्तेमाल करूंगा प्लॉट डिसीजन रीजन को जिसके थ्रू हमारा यहां पे ग्राफ बनेगा कि किस तरह से हमारे पास जो डाटा है वो स्प्लिटिंग हुआ है चलिए अब हम वापस आ जाते हैं सबसे नीचे जो डिसीजन टी ने काम किया है यहां पे अब नेक्स्ट टारगेट के अंदर हम क्या करेंगे इस ग्राफ को बनाएंगे इसके लिए हम क्या करेंगे प्लॉट डिसीजन रीजन को यहां पर इस्तेमाल करेंगे इसके अंदर हमें सबसे पहले क्या चाहिए x एक्सस का डाटा दूसरा में y एक्सेस का डाटा तीसरा हमारा मॉडल जिसके थ्रू हम यहां पे स्लेडिंग कर रहे हैं राइट तो ये तीन चीजें हमें यहां पे देनी है सबसे पहले एक् एक्सिस का डाटा अब यहां पे स्केलिंग या नॉन स्केलिंग वाला डाटा देना पड़ेगा तो बेसिकली आपको स्केलिंग वाला डाटा देना है क्योंकि आपने मॉडल स्केलिंग के साथ बनाया यहां पे तो मैं स्केलिंग वाला डाटा दूंगा यहां पे x एक्सिस के अंदर x का ही डाटा देन y एक्सिस के अंदर y का डाटा दूंगा यहां पे एंड cf1 dt50 पे देन इस ग्राफ को शो करने के लिए मैं पीएटी डॉट यहां पर शो फंक्शन को कॉल करूंगा एंड रन करूंगा तो ये मुझे क्या करेगा प्रॉपर ग्राफ बना के देगा अब यहां पे बोला जा रहा है कि x और y जो होना चाहिए वो न पा एरे होना चाहिए तो x और y को न पाई एरे बनाने के लिए मैं यहां पे टू आपके पास एरे का इस्तेमाल करूंगा यहां पे जिसके थ्रू टू नं पाई का इस्तेमाल करूंगा जिसके थ्रू आप यहां पे से नम पाई बना सकते हैं तो मैंने यहां पे इसे नम पाई अरे बना दिया है और y को भी नम पाई अरे बनाना है तो बेसिकली मैं यहां पे टू नपाई का इस्तेमाल करने वाला हूं जिसके थ्रू आपका नपाई अरे क्रिएट हो जाएगा चलिए रन करते हैं और देखते हैं किस तरह से रीजन बन रहा है दैट्ची तरीके से ये रीजन बना पा रहा है जो आपके ब्लू पॉइंट है उनको बहुत ही बारीकी से आपके पास क्या कर रहा है डाटा को कैप्चर कर रहा है अब इसी के अंदर एक बहुत ही बड़ी प्रॉब्लम आपके सामने देखने को मिल रही है कि ये जो ब्लू वाला रीजन है जिसके अंदर ये ब्लू को ले रहा है वहीं पे काफी बार ऐसे रीजंस भी आ रहे हैं जहां पे आपका इस रेड पॉइंट को भी ये कैप्चर कर रहा है जैसे आप देखिए यहां पे रेड पॉइंट कैप्चर हो रहा है यहां पे रेड पॉइंट कैप्चर हो रहा है यहां पे बेसिकली ये पूरी जो लाइन है यहां पे भी आपके पास क्या हो रहा है रेड पॉइंट कैप्चर हो रहा है तो यदि आप इस तरह के डेटा सेट के अंदर नॉन लीनियर डेटा सेट के अंदर यदि आप डायरेक्टली लीनियर एल्गोरिथम को लगाएंगे तो आपको परफेक्टली रिजल्ट नहीं देने वाला रीजन क्यों क्योंकि लीनियर एल्गोरिथम क्या करेगी यहां पे एक परफेक्टली लाइन को ड्रॉ करेगी इस तरह के डेटा सेट को लाइन से स्प्लिटिंग करना एकदम गलत चीज है यहां पे क्योंकि लाइन से स्प्लिटिंग करने पर ये परफेक्टली आपके पास डटा स्प्लिटिंग नहीं होगा तो इस तरह के डेटा सेट के ऊपर हमें क्या करना चाहिए इस तरह के डेटा सेट के ऊपर हमें बेसिकली डिसीजन ट्री या हमारे जितने भी नॉन लीनियर एल्गोरिथम्स हैं उनको यहां पर अप्लाई करके ट्राई करना चाहिए जैसे कि हम यहां पर कर रहे हैं और यहां पर देख रहे हैं कि आपके पास एक्यूरेसी किस तरह से आ रही है अच्छा यहां पर मैंने सीएलएफ dt1 का सीएलएफ के अंदर डीटी का इस्तेमाल क्या है एक बार मैं dt1 के मॉडल को देखता हूं कि dt1 का मॉडल किस तरह से वर्क करता है dt1 के मॉडल को देखिए यहां पे तो dt1 का मॉडल ऑलमोस्ट सेम वर्क कर रहा है और इसके अंदर भी काफी मिस क्लासिफिकेशन आ रही है जैसा कि आप यहां पर देख पा रहे हैं राइट तो बेसिकली सेम वर्क कर रहा कोई ज्यादा यहां पर डिफरेंशिएबल करके आपके सामने यहां पर शो करता है राइट अब यहां पे बात करते हैं कि जब जब ये काइन के अंदर आप जाते हैं तो काटेरिन के अंदर और भी बहुत सारे हाइपर पैरामीटर्स आते हैं इन हाइपर पैरामीटर में एक मैक्स डेप नाम का एक पैरामीटर आता है दैट इज कॉल्ड ऑफ प्रूनिंग अभी प्रूनिंग के बारे में हम यहां पर फिलहाल नहीं समझने वाले हैं नेक्स्ट वीडियो के अंदर हम प्रूनिंग को समझेंगे फिलहाल जब हमने यहां पे थ्योरी को समझा था तो थ्योरी के अंदर हमने कांसेप्ट को समझा था दैट अ प्रूनिंग इस प्रूनिंग के बारे में हमने डिटेल के साथ तो नहीं देखा था लेकिन अभी जो हमारा नेक्स्ट वीडियो आएगा उसके अंदर हम प्रूनिंग को डिटेल के साथ समझेंगे कि ये प्रूनिंग क्या होता है और इस प्रूनिंग की हेल्प से आप अपने मॉडल की एक्यूरेसी कैसे बढ़ा सकते हैं सेकंड चीज आप अपने मॉडल को ओवर फिटिंग होने से कैसे बचा सकते हैं दैट्ची हम यहां पर अच्छे तरीके से समझने वाले हैं और आज के इस वीडियो के जरिए हम बात करेंगे प्रूनिंग के बारे में देखिए पहले प्रूनिंग को समझते हैं प्रूनिंग होता क्या है उसके बाद डिसीजन ट्री के अंदर हम इसे कैसे अप्लाई करेंगे उसको हम समझेंगे देखिए मेरे पास एक डिसीजन ट्री का मॉडल यहां पे बना हुआ है इस मॉडल को मैंने क्या किया नॉर्मली तरीके से जैसे बनाया था वैसे ही हम जैसे नॉर्मल तरीके से जैसे हम बनाते हैं उसी तरह से मैंने इसको डिजाइन किया है यहां पे अब जब हम डिसीजन ट्री इस्तेमाल करते हैं जैसे डिसीजन ट्री का मॉडल इस्तेमाल करते थे डिसीजन ट्री का मॉडल इस्तेमाल करते हैं उसी तरह से मैंने ये मॉडल बनाया ये देखिए लास्ट वीडियो के अंदर हमने कुछ इस तरह से मॉडल बनाया था अब इस मॉडल को बनाने के बाद मेरा जो ट्री है लाइक स्ट्रक्चर वो कुछ इस तरह से बना है यहां पे अब ये ट्री लाइक स्ट्रक्चर के अंदर हमें क्या करने की जरूरत है प्रिंटिंग करने की जरूरत है ये हमें क्या करने की जरूरत है प्रिंटिंग करने की जरूरत है अब देखिए प्रिंटिंग आपको ऐसा नहीं है कि हर बार प्रिंटिंग करना है यदि आपको लगता है कि आपका मॉडल ओवर फिटेड हो रहा है तो आप प्रूनिंग करेंगे यदि आपका मॉडल ओवर फिटेड नहीं हो रहा है तो आप प्रूनिंग नहीं करेंगे प्र ंग करने का बेसिक मतलब क्या होता है यहां पे बेसिक उसको समझे तो लेट्स सपोज मान लीजिए आपका डिसीजन ट्री है अब इस डिसीजन ट्री के अंदर बात करें तो बहुत सारे आपके स्टेप्स होके आपका ट्री जो है वो कंप्लीट हुआ अब इस कंप्लीट से पहले ही हम क्या करेंगे स्टसन ट्री को रोक देंगे जैसे कि मैं क्या करूंगा यहां पे इस पर्टिकुलर पोजीशन के ऊपर ही मैं अपने ट्री को रोक दूंगा मतलब ये जो लास्ट आपकी लाइन दिख रही है आपके पास यहां पे यस ये लास्ट जो आपके पास यहां पे लाइन दिख रही है यहां पे मैं यहीं पे हमारे डिसीजन ट्री को क्या करूंगा रोक दूंगा मतलब यहीं पे अपने ट्री को क्या करूंगा कट कर दूंगा तो इसका मतलब होता है प्रूनिंग अब प्रूनिंग जो होती है वो दो तरीके की होती है एक होती है प्री प्रूनिंग और दूसरी होती है पोस्ट प्रूनिंग देखिए प्री प्रूनिंग के अंदर क्या होता है कि आप जब अपना मॉडल बनाने जा रहे हैं उससे पहले ही प्रूनिंग कर देते हैं पोस्ट प्रूनिंग के अंदर क्या होता है कि पहले आप अपने मॉडल को ट्रेन करते हैं और उस ट्रेन करने के अंदर आप क्या करते हैं डिफरेंट डिफरेंट लेवल को देते रहते हैं और जैसे-जैसे आप लेवल को देते रहते हैं वैसे-वैसे आपका मॉडल जो है वो प्रोनिंग होता रहता है उसके बाद में जो भी आपका फाइनल रिजल्ट होता है वो आप यहां पर देख लेते हैं तो इस तरह से दो तरीके की प्रूनिंग होती है एक होती है प्री प्रूनिंग और दूसरी होती है पोस्ट प्रूनिंग अब इस क्रिंग को समझते हैं कि ये डिसीजन डी को एक्चुअल में कट कैसे करता है तो जरा से समझते हैं तो मैं अ आपको ले चलता हूं अपने डटा सेट के ऊपर देखिए मेरे पास जो डेटा सेट है वो सोशल मीडिया नेटवर्क्स का डेटा सेट है इस डेटा सेट के ऊपर हम पहले से भी काम कर चुके हैं और इस डेटा सेट के ऊपर हमने लास्ट वाली वीडियो के अंदर एक बहुत अच्छा सा प्रोजेक्ट भी बनाया है यहां पे अब बात करें यहां पे कि इस डटा सेट के अंदर यदि मैं एक्यूरेसी को देखूं तो लास्ट वाली वीडियो के अंदर हमने इसकी एक्यूरेसी देखी थी और एक्यूरेसी जो थी वो 87 पर हमारे पास एक्यूरेसी आई थी और हमने यहां तक भी ऑब्जर्व किया था कि हमारा जो डटा सेट है वो किस तरह से ट्रेंड हो रहा है राइट तो मैं इसी डेटा सेट को लेते हुए इसी मॉडल को लेते हुए अपना अगला काम करूंगा अब मुझे क्या करना है इसकी प्रिंटिंग करनी है वैसे तो देखा जाए तो आपका मॉडल यहां पे ट्रेंड हो चुका है और किस तरह से ट्रेंड हुआ है वो भी आपको दिखाई दे रहा है लेकिन पहले हम क्या करेंगे इसकी प्रूनिंग करेंगे अब प्रूनिंग कौन सी कर रहे हैं हम यहां पे प्री प्रिंग कर रहे हैं देन उसके बाद मैं आपको इसकी पोस्ट प्रिंटिंग भी करके आपको समझाऊं लेकिन हम यहां पे पहले क्या कर रहे हैं प्री प्रिंटिंग कर रहे हैं प्री पिटिंग करने से पहले आप अपने मॉडल को चेक कर ले कि आपका मॉडल ओवर फिटेड तो नहीं हो रहा है अब ओवर फिटिंग की सिनेरियो को कैसे चेक करेंगे तो ओवर फिटिंग के सिनेरियो को कुछ इस तरह से चेक कर सकते हैं कि आपकी ट्रेनिंग की एक्यूरेसी ज्यादा आ रही है और टेस्टिंग की एक्यूरेसी आपके पास बहुत ही ज्यादा लो आ रही है मतलब ट्रेनिंग और टेस्टिंग की एक्यूरेसी में बहुत ज्यादा डिफरेंस आपको देखने को मिल रहा है इसका मतलब क्या हुआ गाइज यहां पे कि आपका मॉडल क्या हो रहा है ओवर फिटेड हो रहा है अब इसके लिए मुझे क्या करना पड़ेगा ट्रेनिंग की एक्यूरेसी को भी चेक करना पड़ेगा अब ट्रेनिंग की एक्यूरेसी कैसे चेक करेंगे तो टीड स्कोर आपके पास दिखाई दे रहा है मैं इसी का ही दोबारा इस्तेमाल करूंगा यहां पे इस बार x ट्रेन की टेस्ट की जगह x क्या करूंगा ट्रेन डालूंगा और y टेस्ट की जगह क्या करूंगा गाइज यहां पे y ट्रेन डालने वाला हूं और मैं रन कर करता हूं तो मेरे पास इसकी एक्यूरेसी मिल जाती है अब देखिए दोनों की एक्यूरेसी में यदि मैं आपके पास यहां पे गौर करूं तो देखिए आपके पास जो ट्रेनिंग की एक्यूरेसी है वो 99 पर एक्यूरेसी आपके पास आ रही है जबकि टेस्टिंग की एक्यूरेसी की बात करें तो वो 83 पर ही एक्यूरेसी आ रही है इसका मतलब ट्रेनिंग के अंदर तो बहुत ज्यादा अच्छे तरीके से वर्क कर रहा है और टेस्टिंग के अंदर बिल्कुल अच्छे से वर्क नहीं कर रहा इसका मतलब हमारा मॉडल जो है वो ओवर फिटेड हो चुका है अब इस ओवर फिटेड के सिनेरियो को बचाने के लिए हम इस्तेमाल करते हैं प्रीनिंग का अब यहां पे इसके लिए हम इस्तेमाल करते हैं प्रीनिंग का अब यहां पे पहला जो स्टेप मैं बताऊंगा जो कि है प्री प्रूनिंग प्री प्रूनिंग कैसे करते हैं कि जब आप यहां पे डिसीजन ट्री बनाने जा रहे हैं इसी डिसीजन ट्री के अंदर आपके पास होता है मैक्स स्टेप मैक्स स्टेप काम क्या करता है मैक्स्ट टेप आपके पास किसी भी डिसीजन ट्री के अंदर कितने डेप्थ तक आपको नीचे जाना है मतलब कितना इन डेप्थ आपको यहां पे वर्किंग करना है यह आपको यहां पे सजेस्ट करता है अब यहां पे प्रीपोनिंग के अंदर क्या करते हैं कि हम मैक्स टेप की वैल्यू पहले से ही रख लेते हैं अब मैक्स टेप की वैल्यू पहले से कितनी रखनी है तो आप कुछ भी रख सकते हैं दैट आप प्री पंग कर रहे हैं तो इसके लिए आप कुछ भी अप्लाई कर सकते हैं जैसे कि 2 3 4 5 जो भी आपको लगता है तो वो आप कुछ भी अप्लाई कर सकते हैं तो जैसे लेख के मैंने यहां पे फाइव मैप लगाया और अपने मॉडल को वापस रिटेन किया रिटेन करने के बाद में मैंने यहां पे स्कोर चेक किया तो दैट इज अ 90 पर स्कोर आया यहां पे और यहां पे ट्रेनिंग का स्कोर चेक किया तो ट्रेनिंग का स्कोर भी मेरे पास 93 पर आया इसका मतलब मेरे मॉडल के अंदर आपके पास जो यहां पे देखने को मिल रहा है ओवरफिटिंग का सिनेरियो वो कम हो चुका है इसके साथ-साथ हम डिसीजन ट्री के मॉडल को एक बार चेक कर लेते हैं तो डिसीजन ट्री के मॉडल को यदि मैं चेक करूं तो देखिए काफी हद तक ये जो मॉडल है वो एकदम सही तरीके से काम कर रहा है अच्छा टी की जगह dt1 की जगह यदि मैं यहां पे चेक करूं तो ये देखिए काफी अच्छे तरीके से काम कर रहा है यहां पे अब हम यहां पे कुछ ट्री को स्ट्रक्चर देख लेते हैं तो ट्री का स्ट्रक्चर आपका इस तरह से दिखाई दे रहा है अब जरा समझते हैं कि मैक्स डब की वैल्यू कितनी है तो मैक्स टेप की वैल्यू हमने यहां पे फाइव रखी है इसका मतलब फाइव स्टेप्स तक हमारा मूव ऑन करेगा चलिए इस ग्राफ को हम जरा ऑब्जर्व करते हैं तो मैं एक काम करता हूं इस ग्राफ को आप लोगों को दिखाता हूं ये रहा हमारा फोल्डर जहां पे मैंने डेमो ड जेपीजी के नाम से इसे सेव कर रखा है इसको ओपन करते हैं ओपन करने के बाद देखिए मैक्स ड आपने कितना लिया फाइव लिया है तो देखो पहला डेप देन सेकंड डेप थर्ड देन फोर्थ एंड फिफ्थ मतलब आप ऊपर से गिने गे तो आपका देखिए पहला आपके पास यहां पे आ चुका है देन दूसरा आ चुका है फिर तीसरा फिर चौथा फिर पांचवा इसका मतलब फाइव डेप तक आपने यहां पे वर्किंग की है फाइव डेप तक वर्किंग करने के बाद में आपने क्या ऑब्जर्व किया यहां पे कि आपके पास जो ट्रेनिंग एक्यूरेसी है और टेस्टिंग एक्यूरेसी है इसका जो डिफरेंस है वो बिल्कुल खत्म हो चुका इसका जो डिफरेंस है वो बिल्कुल कम हो चुका है यहां पे इसका मतलब आपका जो मॉडल है वो ओवर फिटिंग से बच चुका है इस तरह से आप क्या करते हैं यहां पे प्री प्रिंटिंग करते हैं पोस्ट प्रिंटिंग के अंदर क्या है कि आप क्या करेंगे कि इसके अंदर जो आपके पास मैक्स स्टेप की वैल्यू है वो लगातार लगातार चेंज करते रहेंगे और फिर उसके बाद कोई आपका रिजल्ट आएगा उस रिजल्ट के बेसिस पे आप यहां पे आंसर निकालेंगे अब वो रिजल्ट कैसे आएगा और कैसे काम होगा तो इसको जरा यहां पे थोड़ा डिटेल के साथ समझते हैं तो मैं अब आपको बता रहा हूं पोस्ट पिडिंग के बारे में पोस्ट पिडिंग के अंदर हम क्या करेंगे एक लूप लगाएंगे और उस लूप के अंदर मैक्स टप की वैल्यू को हम डिसाइड करेंगे देन उसके बाद फर्द आप यहां पे ट्रेनिंग करेंगे और ट्रेनिंग करने के बाद जो एक्यूरेसी आपको मिलती है वो एक्यूरेसी जो एक्यूरेसी मिलती है और जो डेप्थ आपको मिलती है वो हम एक्सेप्ट करेंगे और उसके बाद उस एक्यूरेसी और इस डेप के ऊपर जाके हम वापस बॉडल को ट्रेन करेंगे और ट्रेन करने के बाद जो भी आपका रिजल्ट आएगा वो हम यहां पर देखेंगे तो ये आपके पास क्या कहलाता है पोस्ट प्रिंटिंग कहलाता है यहां पे अब पोस्ट प्रिंटिंग कैसे हो रही है जरा समझे यहां पे देखिए फोर आ देखिए यहां पे तो मैं यहां पे सबसे पहले क्या कर रहा हूं लूप लगा रहा हूं फॉर आई इन क्या करने वाला हूं रेंज का इस्तेमाल करना हूं यहां पे रेंज के अंदर मैं यहां पे टोटल जो डेप्थ है यहां पे वो फर्स्ट डेप्थ से लगाकर मैं 20 डेप्थ यहां पे लूंगा मतलब 20 19 डेप्थ यहां पे मैं लेने वाला हूं उसके बाद मैं क्या करूंगा यहां पे डिसीजन ट्री मॉडल तैयार करूंगा अब डिसीजन ट्री मॉडल तैयार करना है तो मैं क्या कर रहा हूं dt2 के नाम से एक वेलेबल बना रहा हूं और जो हमारा डिसीजन ट्री है क्लासियर उसको मैं यहां पे कॉल करूंगा इस इसके अंदर हमारे पास मिलेगा हमें मैक्स डप तो मैक्स डप की वैल्यू को मैं क्या कर देता हूं यहां पे i से रिप्लेसमेंट कर लेता हूं अब यहां पे क्या करना है मुझे dt2 को क्या करना है मॉडल को फिट करना है तो मैं dt2 का मॉडल जो है वो फिट करूंगा और फिट के अंदर मैं क्या करूंगा x ट्रेन कॉमा y जो ट्रेन है इसे मैं लगाने वाला हूं देन सेकंड चीज क्या आएगी यहां पे ट्रेन होने के बाद में अब मुझे इसकी एक्यूरेसी देखनी पड़ेगी अब एक्यूरेसी के अंदर मैं क्या करूंगा आपके पास ट्रेनिंग और टेस्टिंग दोनों की एक्यूरेसी यहां पे निकालने वाला हूं क्योंकि मुझे मेरे मॉडल को ओवर फिटिंग से बचाना है तो इसलिए मुझे ट्रेनिंग और टेस्टिंग की दोनों की एक्यूरेसी चाहिए होगी और कौन से मैक्स डप पे आया है ये भी मुझे देखना पड़ेगा तो चलिए जरा इसे देखते हैं यहां पे कैसे करेंगे यहां पे तो मैं यहां पे क्या कर रहा हूं प्रिंट करूंगा और प्रिंट के अंदर क्या करर हूं यहां पे देखिए dt2 के अंदर जाके मैं क्या करने वाला हूं स्कोर चेक करने वाला हूं तो मैं स्कोर लेने वाला हूं और स्कोर के अंदर क्या करेंगे गाइज यहां पे x ट्रेन कॉमा y ट्रेन का जो यहां पे है वो डेटा लूंगा देन उसके बाद मैं क्या करूंगा dt2 लूंगा देन फिर से मैं क्या करूंगा इसका स्कोर चेक करूंगा जहां पे मैं x टेस्ट y जो टेस्ट है यहां पे लेने वाला हूं इसके साथ से कौन से मैक्स डप पे आया है उस मैक्स टप की वैल्यू भी लूंगा यहां पे देन मैं ये सारी चीजें लूंगा और उसके बाद क्या करूंगा अपने मॉडल को ट्रेन करूंगा ट्रेन करने के बाद देखिए ये मेरा जो मॉडल है वो 20 टाइम आपका ट्रेन हो चुका है इसके अंदर हम एक्यूरेसी को ढूंढेंगे कि कौन सी एक्यूरेसी सबसे बेस्ट रहने वाली है तो देखिए पहली वाली जो है आपके पास यहां पे वो बेस्ट नहीं है सेकंड वाली को यदि हम देखें तो लगभग लगभग आपके ट्रेनिंग की एक्यूरेसी और टेस्टिंग की एक्यूरेसी लगभग आपके पास बराबर आ चुकी ऑलमोस्ट आपके पास बराबर आ चुकी है यहां पे सेकंड वाले स्टेप के अंदर थर्ड वाले स्टेप के अंदर भी देखेंगे तो ऑलमोस्ट आपके पास बराबर है फोर्थ वाले में देखेंगे तो ये थोड़ा सा आपका डिफरेंस है फिफ्थ वाले में भी थो ज्यादा डिफरेंस है और सेवंथ वाले सिक्स्थ में भी ज्यादा डिफरेंस है से सेवंथ में भी है एथ में भी है ऑलमोस्ट सभी के अंदर आपका ज्यादा डिफरेंस आपको देखने को मिल रहा है लेकिन आपका जो सेकंड और थर्ड नंबर पोजीशंस है यहां पे आपका डिफरेंस जो है वो बहुत ही कम आपको देखने को मिल रहा है मतलब ऑलमोस्ट आपके पास इक्वल टू ही देखने को मिल रहा है इसका मतलब मैक्स टेप की वैल्यू आपके पास क्या होनी चाहिए टू नंबर पे होनी चाहिए तो अब हम चलते हैं वापस हमारे मॉडल के ऊपर और मॉडल के ऊपर जाने के बाद ये जो मैक्स डप की वैल्यू है इस मैक्स डप की वैल्यू को सेकंड नंबर कर देते हैं या फिर थर्ड नंबर कर देते हैं चलिए थर्ड नंबर देखिए हम यहां पे ट्रेन करें और यहां पे एक्यूरेसी निकाले तो 91 ये मिल रही है और यदि मैं टेस्टिंग की एक्यूरेसी निकालूं तो ट्रेनिंग की एक्यूरेसी निकालूं तब भी व हमारे पास क्या मिल रही है 91 मिल रही है इसका मतलब हमारा मॉडल जो है वो ओवर फिटिंग से सिनेरियो से बच चुका है यहां पे ओवरफिटिंग से सिनेरियो से बच चुका है और इवन दैट हमारे डटा की प्रूनिंग भी हो चुकी है अच्छा डिसीजन ट्री के यदि हम इसको देखें मॉडल को तो बिल्कुल इसने बहुत ही अच्छे तरीके से ट्रेन किया है ये वाला जो इता है इसको हमने यहां पे ब्लू कलर से दे रखा है और बाकी सब वाला यहां पे क्या कर रखा है आपके आपके पास रेड कलर से यहां पे इंडिकेट कर रखा है और कुछ-कुछ इसके अंदर ब्लू पॉइंट है दैट वो आपके पास क्या कर रहे हैं काम यहां पे आपके पास यहां पे रॉन्ग प्रेडिक्शन के लिए यूज़ हो रहा है लेकिन हां काफी तक हमारा जो डाटा है वो सही तरीके से प्रेडिक्शन कर रहा है तो हम इसे यहां पर ले सकते हैं लेकिन हम थोड़ा सा और नीचे ग और करें तो मैक्स स्टेप नंबर जो फाइव है इसको भी हम चूज कर सकते हैं मैक्स नंबर आपका जो थ्री है इसे फोर को भी हम यहां पे ऑलमोस्ट चूज कर सकते हैं तो फोर और फाइव जो है इसे भी हम ऑलमोस्ट तरीके से चूज कर सकते हैं लेकिन उसके बाद के जो मैक्स स्टेप है आप देखिए यहां पे सिक्स नंबर को देखिए सेवन वाले देखिए एट नंबर नाइन नंबर वालो को देखेंगे तो यहां पे आप एक चीज़ को ऑब्जर्व कर पाएंगे कि जो ट्रेनिंग की एक्यूरेसी है और जो टेस्टिंग की एक्यूरेसी है उनके अंदर मेजर्ली 10 का डिफरेंस आपको आपको देखने को मिल रहा है जबकि आपके पास ऊपर जितने भी हैके पास मतलब आपके पास 2 3 4 5 तक यहां पे आपके पास हार्डली 1 से 2 पर का डिफरेंस ही आपको देखने को मिल रहा है जबकि आप जितना नीचे जा रहे हैं यहां पे जितना मैक्स डेप में घुस रहे हैं यहां पे उससे ट्रेनिंग और टेस्टिंग की एक्यूरेसी के अंदर आपके पास बहुत ज्यादा फर्क देखने को मिल रहा है मतलब आपका मॉडल ओवर फिटिंग होने के सिनेरियो में जा रहा है तो उस ओवरफिटिंग से बचाने के लिए हम यहां पे क्या कर रहे हैं प्रिंटिंग कर रहे हैं और प्रिंटिंग के अंदर हमने क्या प्रिंग निकाली कि आप यहां पर फाइव नंबर तक के पॉइंट तक आप यहां पर चूज कर सकते हैं फाइव नंबर तक आपके मॉडल की एक्यूरेसी जो है वो काफी अच्छी आ रही है तो फाइव नंबर तक आप चूज कर सकते हैं 3 4 5 जो भी आप यहां पर लेना चाहे उसमें से आप यहां पर चूज कर सकते हैं दैट इज कॉल्ड अ प्रूनिंग मतलब आप मैक्स डेप की वैल्यू जो डिसाइड करते हैं वो आपके पास क्या कहलाती है प्रूनिंग कहलाती है अब जैसे कि मैंने यहां पे थ्री लिया थ्री लेने पर हमारे पास जो यहां पे प्रूनिंग हुई है प्रूनिंग होने के बाद जो हमारा क्लासि फायर दिख रहा है वो क्लासियर कुछ इस तरह से दिख रहा है और इसके ऊपर यदि मैं अपना डिसीजन ट्री मॉडल यहां पे आपको शो करूं तो डिसीजन ट्री के अंदर आपके पास क्या कितने मिलेंगे स्टेप तीन स्टेप मिलने वाले हैं जैसे कि ये फर्स्ट स्टेप हुआ यहां पे दैट द फर्स्ट स्टेप उसके बाद ये सेकंड स्टेप और ये आपका थर्ड स्टेप तो थर्ड स्टेप तक यह क्या कर रहा है आपका फाइनलाइज कर रहा है आपके मॉडल को ओवर फिटिंग के सिनेरियो से बचा रहा है तो आई थिंक आई होप सो समझ में आ चुका होगा कि पुडिंग क्या होती है और कैसे कर रही है और आज की इस वीडियो के जरिए आज हम यहां पे बात करने वाले हैं डिसीजन ट्री के बारे में अब देखिए डिसीजन ट्री जो है वो रिग्रेशन एंड क्लासिफिकेशन दोनों में काम करता है क्लासिफिकेशन में किस तरह से काम करता है उसके बारे में हमने डेडिकेटेड वीडियो बना रखी है रिग्रेशन के अंदर कैसे वर्क करता है आज की इस वीडियो के जरिए हम यहां पर समझने वाले हैं तो चलिए जरा इसे समझते हैं यदि आप आपको पाइथन मशीन लर्निंग डेटा साइंस एंड डेटा एनालिस जैसी फीड में अपने आपको को ग्रो करना है तो इसके लिए डब्लू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं मैंने यहां पे क्या कर रखा है एक डटा सेट का ग्राफ ले रखा है आप कुछ इस तरह से समझ सकते हैं कि एक तरफ आपके पास क्या लिखी है एज लिखी हुई है यहां पे और दूसरी तरफ उनकी क्या कर रख है सैलरी दे रखी है यहां पे अब एज वर्सेस सैलरी का ग्राफ जो है आपके पास यहां पे कुछ इस तर तरीके से आता है मतलब आपका कुछ लीनियर के फॉर्म में आता है मैं यहां पे एज वर्सेस सैलरी के ग्राफ को दिखा रहा हूं आप ग्राफ ए को ही पॉइंट आउट कीजिएगा यहां पे अभी ग्राफ a को ही पॉइंट आउट करना है तो मैं एज वर्सेस यदि सैलरी का ग्राफ बनाऊं आप लोगों के सामने तो मेरे पास कुछ इस तरह से बना आता है अब जब आपके पास ग्राफ इस तरह से बना आता है तो आप यहां पे क्या करते हैं आप यहां पे सिंपल सा लीनियर रिग्रेशन अप्लाई करते हैं क्योंकि लीनियर आपको देखने को मिल रही है तो आप क्या करते हैं सिंपल सा एक लीनियर रिग्रेशन अप्लाई करते हैं और लीनियर रिग्रेशन क्या करता है एक इस तरह से सिंपल सी प्रेडिक्शन लाइन आपके पास क्रिएट करके दे देता है जिसके थ्रू आप बेसिक प्रेडिक्शन कर सकते हैं आपको आंसर यहां पे मिल जाएगा लेकिन यदि आप केस ऑफ सिनेरियो बी में चले जाए यहां पे तो इस केस में क्या होगा यहां पे भी वापस में एज वर्सेस सैलरी का यदि मैं ग्राफ बनाना चाहूं यहां पे यस तो आपके पास कुछ इस तरह से नजर आता है तो इस तरह के ग्राफ के अंदर आप किस तरह से प्रेडिक्शन कर पाएंगे तो देखिए इस तरह के ग्राफ के अंदर आपका प्रोडक्शन कर पाना सिंपल पॉसिबल नहीं है यदि आप सिंपल लीनियर रिग्रेशन का इस्तेमाल करते हैं तो लीनियर रिग्रेशन क्या करेगा कुछ इस तरह से ये लाइन जो है वो आपको बना के दे देगा मतलब इस तरह से आपकी प्रेडिक्शन लाइन बन जाएगी और ये जो प्रेडिक्शन लाइन है गाइ यहां पे ये एक रॉन्ग प्रेडिक्शन लाइन है और यहां से जो आपका रिजल्ट मिलने वाला है वो आपका रॉन्ग मिलने वाला है और आपकी जो एक्यूरेसी है वो भी बहुत कम मिलने वाली है मतलब यदि आपके पास डाटा सिंपल लीनियर रिग्रेशन को फॉलो करता है तो आप लीनियर रिग्रेशन अप्लाई कर सकते हैं लेकिन जब आपके पास डाटा सिंपल लीनियर रिग्रेशन को फॉलो नहीं करता है मतलब लीनियर को फॉलो नहीं करता है तो उस वक्त आप सिंपल लीनियर रिग्रेशन को अप्लाई नहीं कर पाते हैं तो उस केसेस में हमें क्या करना चाहिए तो उस केसेस में हमें इस्तेमाल करना चाहिए डिसीजन ट्री को अब ये डिसीजन ट्री किस तरह से इस्तेमाल होता है इसके अंदर उसको जरा समझते हैं तो देखिए यहां पर मैं उसी डाटा सेट को वापस ले रहा हूं यहां पे जहां पे इस तरफ हमारे पास क्या लिखा है एज लिखा हुआ है और इस तरफ हम क्या कर रहे हैं उसकी सैलरी को प्रोडक्शन कर रहे हैं एज और सैलरी के बारे में यहां पे बताया गया है चलिए एज को थोड़ा सा डिफाइन कर लेते हैं यहां पे तो एज यहां पे मान लीजिए आपके पास यहां पे 20 जज है यहां पे और उसके बाद यहां पे बात करें तो ये आपके पास लगभग लगभग 30 जज मान लीजिए 30 के बाद में ये आपके पास क्या है होगा 40 या 50 मान लीजिए अराउ 50 मान लेते हैं और 50 के बाद में ये आपका 60 यक है ठीक है तो इस तरह से हमारे पास जो डेटा है वो स्प्लिटिंग किया गया एज के अंदर सैलरी के अंदर बात करें तो सैलरी आपके पास यहां पे स्टार्टिंग सैलरी मान लीजिए यहां पे आपके 10k है 10k के बाद में थोड़ा सा और ऊपर ले चले तो आपके पास यहां पे मान लीजिए 30k तक है यहां पे 30k से थोड़ा सा और ऊपर चले यहां पर तो ये आपके पास अराउंड मान लीजिए 60k तक है और यहां तक आपके पास बात करें तो ये आपके पास क्या है 90 के तक है तो आपका सैलरी कुछ इस तरह से है और एज कुछ इस तरह से आपका डिफरेंशिएबल डिसीजन ट्री कैसे वर्क करता है तो डिसीजन ट्री क्या करता है यहां पे मल्टीपल स्प्लिट्स लगाता है जैसा कि आप सब को पता है कि डिसीजन ट्री क्या करता है यहां पे एक मल्टीपल स्प्लिट्स लगाता है अब मल्टीपल स्प्लिट्स कैसे लगाएगा तो फर्स्ट आपका जो स्प्लिटिंग होगा जरा देखिए मैं आपको थोड़ा सा अलग कलर से आपको स्प्लिटिंग लगा के बताऊं यहां पे तो फर्स्ट जो स्प्लिटिंग होगा वो आपके पास कुछ इस तरह से आपके पास स्लिटिंग होगा सेकंड जो स्प्लिटिंग होगा वो आपके पास इस तरह से स्प्लिटिंग होगा और फोर्थ जो स्प्लिटिंग होगा वो कुछ इस तरह से आपके पास यहां पे स्प्लिटिंग होने वाला है तो लगभग लगभग आपके पास कुछ इस तरह से आपके पास जो स्प्लिटिंग है वो लगने वाले हैं जिसके थ्रू आप अच्छे तरीके से प्रोडक्शन कर पाएंगे अच्छा यदि मैं इस पॉइंट की बात करूं यहां पे तो ये जो पॉइंट आपके पास मान लीजिए कि आपके पास अराउंड 80 के के आसपास होगा यहां पे ठीक है तो ये भी आपके पास एक नया और स्प्लिटिंग आपके पास लग चुका है डिजन अब यहां पे कैसे वर्क करेगा तो देखिए आपके पास डेटा सेट क्या है डेटा सेट आपके पास है यहां पे एज और आपके पास दूसरी क्या है यहां पे सैलरी अभी केवल मैं दो ही डाटा के ऊपर लेके चल रहा हूं यहां पे तो फर्स्ट वन है आपके पास एज तो ये क्या करेगा एज को लेके यहां पे रेडी करेगा एज को लेके आपके पास क्या बनाएगा आपके पास सबसे पहले आपका डिसीजन नोड्स बनाएगा मतलब आपका रूट नोड यहां पे बनाने वाला है रूट नट के बाद में यहां पे क्या करेगा क्वेश्चन करेगा अब ये क्वेश्चन किस तरह का हो सकता है तो उसको जरा समझ लेते हैं यहां पे तो सबसे पहले ये जो क्वेश्चन है ये क्वेश्चन आपके पास यहां पे ये होगा कि एज की जो वैल्यू है यहां पे वो ग्रेटर दन 30 है या नहीं है मतलब एज जो है वो ग्रेटर दन 30 है या नहीं है पहला आपके पास ये क्वेश्चन होगा और दूसरा यहां पे ये होगा कि एज की जो वैल्यू है यहां पे वो आपके पास लेस दन 30 है या नहीं है बस ये दो क्वेश्चन होंगे यदि आपके पास एज की वैल्यू लेस दन 30 है यदि आपके पास एज की वैल्यू क्या है लेस दन 30 है तो यहां पर हम डायरेक्टली कह सकते हैं कि जो आपकी सैलरी होगी मतलब अब यहां पे हम हमारी सैलरी को प्रोडक्शन कर रहे हैं तो जो सैलरी होगी वो आपके पास क्या होगी 20 टू आपके पास 30 के बीच में आपके पास आने वाली है मतलब 22 30 के एवरेज पार्ट जो होगा यहां पे वो आपको यहां पर देखने को मिलेगा अब इसी केसेस में बात करें कि यदि आपकी सैलरी ग्रेटर दन 30 आती है तो क्या होगा इसी केसेस में बात करें कि एज जो है वो आपके पास ग्रेटर दन 30 है तो क्या होगा तो एज ग्रेटर दन 30 है तो ये क्या होगा गाइज यहां पे फिर से फरदर स्प्लिटिंग होगा जैसे हमने क्या किया ये वाला पिक पॉइंट पकड़ा इस पिक पॉइंट के जस्ट पीछे आपके पास यहां पे आता है इस पिक पॉइंट के जस्ट आपके पास पीछे आता है तो आपके पास यहां पे क्या कर रहा है आपकी जो सैलरी है वो 10 टू आपके पास कितनी हो रही है 30 के बीच में आ रही है अराउंड 10 टू 30 के बीच में आपके पास आ रही है तो 10 टू 30k के बीच में आपके पास क्या होगी आपकी सैलरी होगी लेकिन अब जो अगला पॉइंट पकड़ा जाएगा वह क्या होगा यहां पे 50 वाला होगा तो मैं क्या बोलूंगा यहां पे गाइ कि जो एज है आपके पास यहां पे यस जो एज है आपके पास यहां पे वो ग्रेटर दन आपके पास 50 है या नहीं है यस एज क्या है ग्रेटर दन 50 है या फिर एज की जो वैल्यू है वो लेस दन आपके पास 50 है ये हमें इंडिकेट करके बताना है अच्छा एज की वैल्यू आपके पास यहां पे यस आपके पास ग्रेटर दन 50 है तो आपके पास क्या होगी सैलरी जो होगी आपके पास क्या होगी 30 या 60 के बीच में होगी तो यहां पर आपके पास यहां पे लीफ नोड क्या बन जाएगा गाइ यहां पे लीफ नोड बन जाएगा कि जो सैलरी है वो 30 के से लगाकर 60 के के बीच में रहने वाली है अच्छा यदि आपकी जो एज है वो लेस दन 50 रहेगी तो आपकी सैलरी जो है वो 80 या 90 के बीच में 80 या 90 के बीच में ना बोल के मैं 60 या 90 के बीच में ही बोलूंगा यहां पे कि इसके बीच में इसकी एवरेज सैलरी रहने वाली है तो यहां पे जो सैलरी रहने वाली है वो क्या रहेगी 60 टू 90 के के बीच में इसकी सले रहने वाली है तो इस तरह से आपका क्या बनता है आपका डिसीजन टी बनता है लेट्स सपोज आपके पास एक कोई पर्सन आता है और वो अपनी एज लेके आता है 45 ईयर यस वो अपनी 45 ईयर एज लेके आता है यहां पे तो वो बोलता है हमारी सैलरी कितनी रहने वाली है तो इसका प्रेडिक्शन आप कैसे करेंगे इसका प्रेडिक्शन आप कुछ इस तरह से कर सकते हैं सबसे पहले एज इज इक्वल टू क्या है 45 है अच्छा ग्रेटर दन 30 है या लेस दन 30 है तो ग्रेटर दन 30 है तो आप यहां आ जाएंगे ग्रेटर दन 30 होने के बाद में यहां पे क्या है कि आपके पास यहां पे ग्रेटर दन 50 है या लेस दन 50 है तो बेसिकली लेस दन 50 है लेस दन 50 है तो आप इस जगह पे आ जाएंगे इस जगह पे आने के बाद आपकी जो सैलरी है वो 60 और 90 के बीच में यहां पे रह वाली है जो कि आप यहां पर बता सकते हैं तो बेसिकली आपके पास इस तरीके से रिग्रेशन एनालिसिस के अंदर प्रेडिक्शन होता है मतलब आपका जो डेटा सेट है यदि वो नॉन लीनियर है यहां पे तो आप यहां पे लीनियर रिग्रेशन नहीं अप्लाई कर सकते तो यहां पे आपको मल्टीपल स्प्लिट्स लगाने पड़ते हैं और उस मल्टीपल स्प्लिट्स के बेसिस पे आपका प्रिडिक्शन यहां पे होता है तो इस तरह से आप क्या कर सकते हैं डिसीजन ट्री का इस्तेमाल कर सकते हैं ऑन अ रिग्रेशन एनालिसिस अब इसको थोड़ा-थोड़ा प्रैक्टिकली तरीके से समझ लेते हैं प्रैक्टिकली तरीके से समझने के लिए मेरे पास एक डेटा सेट है पहले मैं आपको डेटा सेट दिखाना चाहूंगा तो मेरे पास जो डेटा सेट है यहां पे वो कुछ इस तरह से है कि एज और एक्सपीरियंस के बेसिस पे आपकी सैलरी का प्रेडिक्शन हो रहा है अब यहां पे एज दे रखी है और एक्सपीरियंस दे रखा है और सैलरी प्रेडिक्शन करना है इसके ऊपर हम क्या करेंगे डिसीजन ट्री को अप्लाई करेंगे और देखेंगे कि किस तरह से ये वर्क करता है चलिए इसको जरा देखते हैं तो मैं ले चलता हूं आपको जुपिटर नोटबुक के ऊपर और यहां पे जाके एक नई नोटबुक मैं यहां पे क्रिएट कर लेता हूं ओके इसके अंदर क्या करेंगे सबसे पहले हमारे जो रिक्वायर्ड लाइब्रेरी है उनको इंपोर्ट करेंगे तो सबसे पहले मैं यहां पे इंपोर्ट करने वाला हूं किसे पांडा एलियाज ऑफ पीडी को देन नेक्स्ट मैं यहां पे क्या करूंगा इंपोर्ट करूंगा किसे मैट पल लिप को यस मैट पल लिप डॉट यहां पर मैं करूंगा पवा प्लॉट एलियाज ऑफ यहां पे मैं पीएटी लेने वाला हूं उसके बाद में मैं यहां पे इंपोर्ट करने वाला हूं किसे सी बन को यस सीन एलियाज ऑफ यहां पर एसएनएस लूंगा राइट चलिए रन करते हैं उसके बाद में हम क्या करते हैं हमारे डेटा सेट को लोड करते हैं तो मैंने डटा सेट लिया यहां पे और पडी डॉ यहां पर री सीएवी की हेल्प से मेरे पास जो मल्टीलिनियर के नाम से डटा सेट है उसे मैं यहां पे लोड कर लेता हूं उसके बाद क्या करता हूं टा सेटड हैड लगाते हुए हुए इसके तीन डाटा को मैं यहां पे देखूंगा अब पहले हम इस ग्राफ के अंदर चेक कर लेते हैं कि कोई नल वैल्यू प्रेजेंट है या नहीं है तो चेक करने के लिए डटा सेट डॉट यहां पर मैं करूंगा इज नल का इस्तेमाल करूंगा यहां पे देन डॉट यहां पर सम लगा दूंगा यहां पे रन करूंगा अभी मेरे पास कोई भी नल वैल्यू प्रेजेंट नहीं है चलिए कोई भी नल वैल्यू प्रेजेंट नहीं होने के बाद में नेक्स्ट हमारा पास यहां पर काम क्या होगा नेक्स्ट हमारे पास यहां पे होगा कि आपके पास इसके ऊपर ग्राफ चेक करेंगे कि एज वर्सेस सैलरी का क्या ग्राफ है एक्सपीरियंस वर्सेस सैलरी का क्या ग्राफ है ये लीनियर का है या नॉनलीनियरिटीज चेक करले ते हैं इसको चेक करने के लिए मैं एस डॉट यहां पर पेयर प्लॉट बनाने वाला हूं पेयर प्लॉट के अंदर मैं डाटा दूंगा यहां पे और डाटा के अंदर क्या करूंगा मेरा जो डेटा सेट है वो दूंगा उसके बाद ग्राफ को देखने के लिए पटी ड शो फंक्शन को रन करूंगा और पटी शो फंक्शन दूंगा और रन करूंगा तो देखिए मेरा ग्राफ आ चुका है और फिलहाल ये लीनियर टी के ग्राफ को मुझे शो करके दिखा रहा है ये भी लीनियर है ये भी लीनियर है फिलहाल ये लीनियर डिग्रेशन का ग्राफ है लेकिन हम यहां पर डिसीजन ट्री लगा के देखेंगे कि ये प्रेडिक्शन कैसे बना के देता है चलिए अब डिसीजन ट्री मुझे यहां पे लगाना है तो सबसे पहले क्या करना पड़ेगा गाइज यहां पे मुझे मेरे डाटा को इनपुट और आउटपुट के अंदर अलग-अलग करना पड़ेगा मतलब डिपेंडेंट और इंडिपेंडेंट वेरिएबल के अंदर डिफरेंशिएबल बनाते हैं डाटा सेट लेते हैं डॉट मैं आलग का इस्तेमाल करता हूं यहां पे ठीक है सारी रो को कॉल करता हूं और सारे कॉलम को लेता हूं लेकिन -1 लगा के छोड़ देता हूं पीछे वाले को x को देखूं तो मुझे एज और एक्सपीरियंस दोनों दिख रहे हैं अच्छा इस तरह से मैं y लूं यहां पे और डाटा सेट लेके उसके अंदर जाके क्या करने वाला हूं गाइज यहां पे एक्सपीरियंस को लेने वाला हूं तो ये हमारे पास x और y आ चुका है अब डटा सेट के अंदर जाके क्या करेंगे ट्रेन और इसके अंदर स्प्लिटिंग करेंगे कैसे करेंगे यहां पे तो फ्रॉम साइकल एन के अंदर जाऊंगा डॉट उसके अंदर जाने के बाद में मैं जाऊंगा मॉडल सिलेक्शन के अंदर मॉडल सिलेक्शन के अंदर जाने के बाद मैं इंपोर्ट करूंगा किसे इंपोर्ट करने वाला हूं गाइ यहां पे ट्रेन टेस्ट स्लिटिंग को चलिए अब यहां पर x ट्रेन ना ट्रेन नाम से एक वेरिएबल बनाने वाले हैं यहां पर x टेस्ट नाम से एक वेरिएबल बनाएंगे उसके बाद में यहां पर x यहां पर ट्रेन नाम से फिर से एक वेरिएबल बनाने वाले हैं और x टेस्ट नाम से एक वेरिएबल बनाने वाले हैं और उसके बाद ट्रेन टेस्ट स्प्लिटिंग लेंगे जिसके अंदर x y मैं डाटा दूंगा यहां पे उसके बाद टेस्टिंग साइज देखने वाला हूं और टेस्टिंग साइज रखूंगा 0.22 और रैंडम स्टेट की वैल्यू लूंगा यहां पे 42 चलिए अब इसे रन कर देते हैं चलिए अब नेक्स्ट काम क्या होगा हमारा डिसीजन ट्री मॉडल बनाना डिसीजन ट्री मॉडल बनाने के लिए हम यहां पे फ्रॉम साइकिल एंड के अंदर चलेंगे डॉट यहां पर ट्री को कॉल करेंगे ट्री के अंदर जाने के बाद दैट मैं इंपोर्ट करने वाला हूं यहां पे किसे डिसीजन ट्री रिग्रेसर को क्योंकि हम रिग्रेशन एनालिसिस कर रहे हैं कैसे पता चला तो आप सैलरी को देखेंगे तो सैलरी आपके पास क्या है कंटीन्यूअस इन नेचर के अंदर दिख रहा है इसका मतलब मतलब रिग्रेशन एनालिसिस यहां पर होने वाली है अच्छा मुझे यहां पे डिसीजन ट्री का ग्राफ भी बनाना पड़ेगा तो प्लॉट डिसीजन ट्री करने वाला है तो मैं यहां पे प्लॉट ट्री को भी कॉल कर देता हूं अब देखिए dt3 नहीं होती है इसकी जगह मीन स्क्वायर एरर मीन एब्सलूट एरर इस तरह की एरर्स आपको देखने को मिलती है मतलब यहां पे जो क्राइटेरियम होगा यहां पे वो आपके पास मीन स्क्वायर एरर मीन स्क्वायर एरर मीन एब्सलूट एरर इस तरह के क्राइटेरिया आपको मिलेंगे ना कि जनर इंडेक्स और एंट्रोपय मिलेंगे यहां पे अब ये स्क्वायर एरर और यहां पे ये एब्सलूट एरर ये क्यों होती है क्योंकि देखिए जन इंडेक्स और एंट्रोपय पे वो कितने परसेंट अच्छे तरीके से एक्यूरेट काम कर रहा है उसके ऊपर वर्क करते थे मतलब आप जो कॉलम ले रहे हैं उनके अंदर एंट्रोपिक नहीं है मतलब आपके पास इंप्योरिटी कितनी है ये चीज निकाल देते सेम एज आपके पास यहां पे ये भी काम करते हैं अब बात करें यहां पे डिसीजन ट्री ले लिया डिसीजन ट्री लेने के बाद में मैं क्या कर रहा हूं डिसीजन ट्री डट मॉडल क्या करूंगा यहां पे फिट करूंगा बिट के अंदर मैं यहां पे x ट्रेन कमा y जो ट्रेन है यहां पे x ट्रेन और y ट्रेन है उसे लेंगे लेकिन एक छोटी सी मिस्टेक हो गई यहां पे मुझे x ट्रेन और y ट्रेन बनाना था मैंने दोनों जगह यहां पे सेम ले लिया यहां पे तो चलिए इसे थोड़ा रिकनेक्ट कर लेते हैं ठीक है और यहां पर हम वापस आ जाते हैं और x ट्रेन कमा y जो ट्रेन है इसे हम ले लेते हैं तो हमारा मॉडल जो है वो ट्रेन हो चुका है यहां पे ट्रेन होने के बाद में मैं डीटी डॉट यहां पर क्या कर रहा हूं स्कोर को चेक करता हूं यहां पे स्कोर के अंदर x टेस्ट कॉमा y मा एंडस को जो टेस्ट है यहां पे वो लेके मैं रन करता हूं तो देखिए मेरे पास 99 पर एक्यूरेसी यहां पे मेरी मॉडल की मुझे मिली है दैट इज अ वेरी गुड एक्यूरेसी जो कि हमें यहां पर देखने को मिली है तो इस तरह से आप अपना डिसीजन ट्री बना सकते हैं अब हम बात करते हैं प्लॉटिंग की कि मतलब इसका ग्राफ हमें कैसे देखने को मिलेगा तो ग्राफ बनाने के लिए प्लॉट ट्री है ही ये तो मैं क्या करूंगा यहां पे प्लॉट ट्री को कॉल करूंगा यहां पे प्लॉट ट्री को कॉल करने के बाद ये मुझसे क्या मांगेगा सें ट्री मांगेगा तो वो डिसीजन ट्री हम यहां पर दे देते हैं डिसीजन ट्री देता हूं मैं यहां पे तो कौन सा हमारा डिसीजन ट्री डीटी के नाम से है तो मैंने यहां पे लगा दिया dt1 लगाने के बाद में मैं यहां पे क्या करता हूं इस ग्राफ को शो करता हूं तो उसके लिए मैं पीएटी डॉट यहां पे क्या करूंगा शो फंक्शन को कॉल करूंगा और रन करूंगा तो ये मुझे डिसीज एट्र का जो ग्राफ है वो मुझे बना के दे देगा चलिए थोड़ा वेट करते हैं तो देखिए इस तरह से इसने क्या किया है अपना ग्राफ बना के दिया है और ये इस तरह से अपना क्या करता है डाटा को स्प्लिटिंग कर रहा है यहां पे चलिए अब एक बार देख लेते हैं कि क्या मेरा मॉडल यहां पे ओवर फिटेड तो नहीं हो चुका है इस ओवर फिटिंग के सिनेरियो को देखने के लिए क्या करूंगा यहां पे गाइज इसको दोबारा मैं यहां पे कॉपी कर लेता हूं और जो x टेस्ट है इसकी जगह x क्या लूंगा य यहां पे ट्रेन लूंगा और जो y टेस्ट है इसको भी हटा के करूंगा गाइज यहां पे y अ ट्रेन लेने वाला हूं चलिए रन करते हैं तो 100% है और 99 पर है ऑलमोस्ट आपके पास क्या दिख रही है सेम दिख रही है यहां पे इसका मतलब क्या हुआ गाइज यहां पे मेरा मॉडल ओवर फिटेड तो नहीं है और आज के इस वीडियो के जरिए हम यहां पर बात करेंगे के नियरेस्ट नेबर एल्गोरिथम के बारे में देखिए मशीन लर्निंग के अंदर बहुत सारी एल्गोरिथम्स आती है इसके अंदर कुछ आपके पास लीनियर एल्गोरिथम्स है और कुछ आपकी नॉन लीनियर एल्गोरिथम्स है मतलब ये भी आपका डाटा नॉन लीनियर एल्गोरिथम से सेपरेबल हो रहा है तो उसके लिए आप नॉन लीनियर एल्गोरिथम को इस्तेमाल करते हैं उसी के अंदर के नियरेस्ट नेबर आपके पास एल्गोरिथम्स यूज की जाती है नॉन लीनियर डाटा के अंदर किसी भी चीज को प्रेडिक्शन करने के लिए अब ये जो आपके पास के नियर्स एल्गोरिथम्स है ये क्लासिफिकेशन और रिग्रेशन दोनों तरीके के ऑपरेशन को फॉलो करती है मतलब आपके पास डाटा यदि रिग्रेशन का है तब भी आप इस एल्गोरिथम को इस्तेमाल कर सकते हैं और यदि आपके पास जो डाटा है वो क्लासिफिकेशन का है तब भी आप इस एल्गोरिथम को इस्तेमाल ल कर सकते हैं प्रेडिक्शन के लिए इसके साथ-साथ मैं बात करूं तो के नीरस एल्गोरिथम सबसे इजी एल्गोरिथम्स है यहां पे क्योंकि वो चीज अभी आपको पता चल जाएगा कि ये एल्गोरिथम क्यों इतनी इजी है इसके साथ-साथ यदि मैं बात करूं तो केनस एल्गोरिथम एक लेजी एल्गोरिथम है इसका जवाब भी अभी आपको 2 मिनट के अंदर आपको मिल जाएगा क्योंकि जब हम इसके प्रोसीजर को समझेंगे तब आपको ये चीज क्लियर हो जाएगी कि केनस एल्गोरिथम को इजी क्यों बोला जाता है और इसके साथ-साथ इसको लेजी लर्नर क्यों बोला जाता है तो बेसिकली केनिस एथम जो है है वो आपके पास डाटा को प्रिडिक्शन करने के लिए काम में ले जाती है ये आपके पास रिग्रेशन एंड क्लासिफिकेशन दोनों के अंदर इस्तेमाल होती है अब जरा समझते हैं कि केनस एल्गोरिथम वर्क कैसे करती है तो देखिए मेरे पास यहां पे एक डेटा सेट का ग्राफ बना हुआ है ये डेटा सेट आप कुछ इस तरह से मान सकते हैं कि आपके पास कोई x1 कॉलम है कोई x2 कॉलम है और इसके बेसिस पे y आपका प्रेडिक्शन हो रहा है अब ये जो y आउटपुट आ रहा है वो रेड कलर आपके पास आ रहा है ब्लू कलर आ रहा है रेड कलर आ रहा है ब्लू कलर आ रहा है जब आप इस डेटा सेट को प्लॉट करते हैं तो ये डेटा सेट कुछ इस तरह से नजर आता है जिसके अंदर आपका ये x1 कॉलम हो गया यहां पे x2 कॉलम हो गया और इसके बेसिस पे ये डटा आ रहा है अब यहां पे ये जो के नियरेस्ट नेबर जो कि आपके पास के एनएन जो इसका नाम है यहां पे ये कैसे वर्क करता है इसे जरा समझते हैं लेट्स ये आपका डाटा है ये डाटा आपके पास कैसा है सब कुछ आपका ट्रेनिंग डाटा है मतलब ये जितना भी आप डाटा दे रहे हैं ये आपके पास एक तरीके से मान लीजिए कि आपका ये क्या है ट्रेनिंग डाटा है अब जब आपने अपना ट्रेनिंग डाटा दिया है तो अब आपकी बारी है टेस्टिंग डाटा की टेस्टिंग डाटा के लिए लेट्स सपोज मान लीजिए कि आपके पास कोई एक नया डेटा पॉइंट आता है जो कि यहां कहीं आपके पास आता है अब यह जो नया डटा पॉइंट है यह कौन से कलर में जाएगा यह आंसर आपको के नियरेस्ट नेबर देने वाला है अब ये केनिस नेबर किस तरह से देगा तो ये इसके नेम के अंदर छुपा है देखिए जो हमारा ये जो के एनए है इसका पूरा नाम क्या है यहां पे के नियरेस्ट नेबर अब यहां पे एक वर्ड छुपा है नियरेस्ट नेबर नियरेस्ट नेबर का मतलब है नजदीक के पड़ोसी तो ये क्या करता है कि अपने नजदीक के पड़ोसियों को देखता है अब मेन पॉइंट आता है कि कितने पड़ोसियों को देखना है तो इसका जवाब है आपके k के अंदर तो यहां पे ये जो k आपके पास दिखा रहा है यहां पे ये k का मतलब होता है नंबर ऑफ नजदीक के पड़ोसी तो बेसिकली गाइज यहां पे आप क्या करते हैं कि जो आपका नया डाटा पॉइंट आया है ये क्या करता है कि आपकी अपने आसपास के जो नजदीक के पड़ोसी है उन्हें देखता है और फिर उनके हिसाब से अपना कलर चेंज कर देता है मतलब अपना आउटपुट डिसाइड कर लेता है जैसे कि मैं बोलता हूं ये अपने आपके नजदीक के पांच पड़ोसियों को देखें तो सबसे पहले क्या करता है ये अपने नजदीक के पांच पड़ोसी को ढूंढता है पांच पड़ोसी को कैसे ढूंढेगा तो ये आपके पास यहां पे इनके जितने भी नजदीक के जितने भी पड़ोसी है उन सब से क्या करेगा डिस्टेंस निकालेगा डिस्टेंस निकालने के बाद जो नजदीक के पड़ोसी से मिलेंगे उनके डाटा को कैप्चर कर लेगा तो बेसिकली गाइ यहां पे जितने भी नजदीकी के पड़ोसी है वो मुझे मिल चुके हैं यहां पे इसमें से मैंने क्या ऑब्जर्व किया है कि जो फाइव नजदीक के पड़ोसी है वो किस कलर के हैं ब्लू कलर के हैं और आपके पास दो नजदीक के पड़ोसी जो हैं वो आपके पास क्या है रेड कलर के हैं तो सबसे पहले इस केनिस नेबर का क्या वर्किंग होता है कि जो भी नया डाटा पॉइंट आता है है ये क्या करता है अपने नजदीक के पड़ोसियों को देखता है अब ये नजदीक के पड़ोसी कितने हैं तो दैट डिपेंड ऑन योर के वैल्यू मतलब आपके पास जो k वैल्यू है इसके ऊपर डिपेंड करता है कि नजदीक के कितने पड़ोसी आपको ढूंढने हैं अब जैसा कि मैंने यहां पे बोला कि k की वैल्यू जो है यहां पे लेट्स सपोज फाइव है तो ये क्या करता है अपने नजदीक के पांच पड़ोसियों को क्या करेगा ढूंढता है अब नजदीक के जो पांच पड़ोसी मिले हैं उनके डाटा पॉइंट को कैप्चर करता है कि वो किस नेचर के अंदर है जैसे ही वो नजदीक के पांच पड़ोसी को देख रहा है इसके अंदर उसे क्या ऑब्जर्वेशन मिल रही है कि जो तीन है आपके पास यहां पे वो ब्लू कलर के आ रहे हैं और जो दो है वो रेड कलर के आ रहे हैं अब यदि आप यहां पे क्लासिफिकेशन एल्गोरिथम को इस्तेमाल कर रहे हैं जैसा कि मैं अभी आपको क्लासिफिकेशन एल्गोरिथम के अंदर बात बता रहा हूं यहां पे तो जैसे ही अपने क्लासिफिकेशन एल्गोरिथम को इस्तेमाल करता है यहां पे तो क्लासि एल्गोरिथम के अकॉर्डिंग आपके पास जो सबसे ज्यादा मोस्ट रिवेनेंट आंसर आता है वही आपका फाइनल रिजल्ट होता है जैसे कि मैंने यहां पे देखा कि भाई मेरे पास तीन यहां पे ब्लू है और दो आपके पास पास क्या है रेड है तो बेसिकली इसका जो रिजल्ट आने वाला है गाइज यहां पे वो क्या आएगा यहां पे ब्लू कलर आएगा मतलब ये जो नया वाला जो डाटा पॉइंट आने वाला है यहां पे इसका जो कलर होगा गाइस वो आपके पास चेंज होके अब कलर बन जाएगा यहां पे ब्लू पॉइंट तो इस तरीके से के नियरेस्ट नेबर वर्क करता है तो आपके पास क्या है बहुत ही सिंपल एल्गोरिथम इसलिए इसको बोली जा रही है क्योंकि इसके अंदर आपके पास क्या करते हैं सिंपल सी आप क्या करते हैं डिस्टेंस को मेजर करते हैं डिस्टेंस को करने के बाद जो नियरेस्ट डिस्टेंस आपको दिखने को मिलती है उसका डाटा कैप्चर किया जाता है एंड देन उसके बाद जो डाटा उससे कैप्चर किया जा रहा है यहां पे उसके जो कलर्स है या फिर उसकी जो आइडेंटिटी है वो आइडेंटिटी उसको दे दी जाती है इस तरह से आपके पास क्या करता है के निरस नेबर वर्क करता है अब इसे लेजी लर्नर क्यों बोला जा रहा है इसको जरा समझते हैं तो देखिए गाइज यहां पे लेट्स सपोज ये मेरे पास कोई नया डेटा पॉइंट आ रहा है ये नया डेटा पॉइंट आ रहा है तो ये नया डेटा पॉइंट अपने नजदीकी की पड़ोसियों को ढूंढता है अब यह नजदीकी पड़ोसी को कैसे ढूंढता है तो यह डाटा पॉइंट क्या करता है अपने जितने भी डटा पॉइंट्स हैं मतलब इसके जो आसपास जितने भी डेटा पॉइंट्स हैं उन सब की डिस्टेंस को कैलकुलेट करता है क्योंकि देखो आपको नजदीक के पड़ोसी निकालने मतलब नियरेस्ट निकालना है तो इसके लिए आपको क्या करना पड़ेगा आपको सभी डाटा पॉइंट से आपको डिस्टेंस कैलकुलेट करनी पड़ेगी उन डिस्टेंस के अंदर आपको यहां पे फिल्टर आउट करना पड़ेगा कि उसमें से जो सबसे शॉर्टेस्ट डिस्टेंस है सॉर्टेड मतलब जो सबसे नजदीक की डिस्टेंस है वह निकालनी पड़ेगी देन उसमें से भी टॉप फाइव नजदीक की डिस्टेंस को फाइंड आउट करना पड़ेगा जैसे कि यदि मैं इस डेटा पॉइंट की मैं बात करूं यहां पे तो ये डटा पॉइंट क्या करेगा ये डिस्टेंस निकालेगा ये भी डिस्टेंस निकालेगा ये भी डिस्टेंस निकालेगा ये ऐसे करके जितने भी डाटा पॉइंट्स हैं उन सब की डिस्टेंस निकालेगा लेट्स आपके पास d1 है d2 है d3 है d4 है d5 है d6 है एंड d7 है एंड d8 है ऐसे करते करते ये क्या करेगा सारी डिस्टेंस को कैलकुलेट करेगा अब जब ये सारी डिस्टेंस कैलकुलेट हो जा आती है फिर उसके बाद में यह फिल्टर आउट करता है कि सबसे नियरेस्ट डिस्टेंस कौन सी है मतलब सबसे शॉर्टेड डिस्टेंस कौन सी है जो इसको शॉर्टेड डिस्टेंस मिलेगी उस डिस्टेंस के अकॉर्डिंग उस डेटा पॉइंट के नेचर को कैलकुलेट करेगा एंड देन उसमें जो सबसे ज्यादा आपके पास नेचर्स आए हैं उसका रिवर्ट आंसर आपके पास मिल जाएगा इस तरह से के नियरेस्ट नेबर आपके पास क्या करती है स्लो वर्क करती है क्योंकि ये सबके डिस्टेंस को निकालने के लिए थोड़ा सा टाइम यहां पर ले लेती है तो बेसिकली केनियस नेबर को लेजी लर्नर इसलिए बोला जा रहा है क्योंकि यह सभी की डिस्टेंस को मेजर करता है अब यहां पे एक पॉइंट आता है कि यह जो डिस्टेंस आपको दिख रही है यह डिस्टेंस कैसे कैलकुलेट की जाती है मतलब दो डटा पॉइंट की डिस्टेंस कैसे कैलकुलेट की जाती है तो k नियरेस्ट नेबर के अंदर आपकी जो डिस्टेंस कैलकुलेशन होती है वह दो तरीके से होती है पहला है आपके पास यहां पे यूक्लिड डिस्टेंस और दूसरी है मैनहैटन डिस्टेंस यस अब जरा समझते हैं कि यह दोनों कैसे वर्क करती है तो पहली कौन सी है मैनहैटन डिस्टेंस है और दूसरी यूक्लिड डिस्टेंस है कैसे वर्क करती है जरा समझते हैं यहां पे तो लेट्स सपोज आपका कोई डटा पॉइंट ये है और आपका दूसरा डेटा पॉइंट ये है अब इन दोनों डेटा पॉइंट तक पहुंचने के लिए आप दो तरीके के पाथ को फॉलो कर सकते हैं पहला पाथ क्या होगा कि इस डटा पॉइंट से आप क्या करें सीधे इस पॉइंट पे चले जाएं दूसरे क्या करें गाइज यहां पे कि इस डाटा पॉइंट से पहले इस तरफ जाएं एंड देन दूसरा आपके क्या करें इस तरफ जाएं इसके अंदर आपके पास ये जो डिस्टेंस पाथ आप चूज करें हैं इसी के अकॉर्डिंग आपके पास दो तरीके से डिस्टेंस आपके पास आती है चलिए पहले बात करता हूं मैं मैन हैट एंड डिस्टेंस के बारे में मैन हैट एंड डिस्टेंस क्या करती है गाइज यहां पे कि यह जो आपके पास लॉन्ग रूट पाथ है यहां पे इस लॉन्ग रूट पाथ को कैलकुलेट करती है दैट इज कॉल्ड ऑफ मैनहैटन डिस्टेंस अब मैनहैटन डिस्टेंस का फॉर्मूला क्या है यहां पे तो ये फार्मूला है मड ऑफ x2 - x1 फिर आपके पास मड लगाना है देन प्लस आपके पास y2 - y1 है यहां पे मतलब गाइज सिंपल सी बात करें ये जो दो पॉइंट आपको यहां पर दिख रहे हैं इन दोनों पॉइंट के अंदर जो x x2 और y1 y2 है आप क्या करेंगे इन दोनों का डिफरेंस निकालेंगे और मॉड निकाल के ऐड कर देंगे दैट इज कॉल्ड ऑफ मैन हैट एंड डिस्टेंस सेकंड बात करते हैं गाइज यहां पे यूक्लिड डिस्टेंस यूक्लिड डिस्टेंस जो आप देख रहे हैं यहां पे दैट इज अ पाइथागोरस फॉर्मूला मतलब ये पाइथागोरस फॉर्मूले की तरह ही है कैसे जरा समझे यहां पे देखो आपके पास यहां पे क्या है x1 पॉइंट है और आपके पास क्या है x2 पॉइंट है तो आप क्या करते हैं गाइज यहां पे x1 - x2 का होल स्क्वा + y2 - y1 काल स्क्वा निकाल के आप यहां पे क्या करते हैं ये वाली जो डिस्टेंस है ये डिस्टेंस आप कैलकुलेट करते हैं मतलब स्टेट डिस्टेंस कैलकुलेट करते हैं अब यहां पे एक मेजर क्वेश्चन आता है कि आप इन दोनों में से कौन सी डिस्टेंस यूज़ करेंगे तो गाइ दैट डिपेंड ऑन योर प्रोजेक्ट आपके पास जैसा आपके पास डाटा सेट होगा यहां पे जिस तरीके का आपके पास प्रोजेक्ट होगा उसके अंदर आपको ट्राई करना पड़ेगा कि मैन हैट एंड डिस्टेंस आपको अच्छा रिजल्ट देता है या फिर यूक्लिड डिस्टेंस आपको अच्छा रिजल्ट देता है तो वहां पे आपको यह डिसाइड करना पड़ेगा ट्राई करके कि कौन सा रिजल्ट आपको बेस्ट देता है बाकी मैन हैटन डिस्टेंस की बात करें फार्मूला आपके पास इस तरह से यूज होता है और यदि मैं बात करूं यूक्लिड डिस्टेंस के बारे में पाइथागोरस थ्योरम से मिलता-जुलता है तो वो आपके पास इस तरह से यूज होता है अब यहां पे एक और मोस्ट इंपॉर्टेंट पॉइंट आता है कि ये जो k की वैल्यू है ये कैसे डिसाइड करेंगे तो k जो होता है वो आपके लिए एक हाइपर पैरामीटर होता है इस हाइपर पैरामीटर को आपको ट्विन करके इस हाइपो पैरामीटर को आपको ट्विनिंग करके चेंजेज करना पड़ता है मतलब आप डेटा सेट को देख के पहले डिसाइड नहीं कर सकते कि k की वैल्यू क्या आएगी यह k की वैल्यू वैरी होती रहती है अकॉर्डिंग टू डेटा सेट यस आपके डटा सेट के अंदर आपको चेक करना पड़ेगा कि k इ टू आपके पास टू सही रहेगा थ्री सही रहेगा फोर सही रहेगा या फिर फाइव सेज रहने वाला है लेकिन एक आइडियल केसेस के अंदर बात करें तो आपके पा जो फाइव रहता है वो एक बेस्ट रहता है लेकिन दैट डिपेंड ऑन योर डाटा कि आपके पास कौन सी चीज बेस्ट रहने वाली है तो इस तरीके से आपके पास के नियर नेबर एल्गोरिथम काम करती है और इस तरह से आप रिग्रेशन के अंदर इस्तेमाल कर सकते हैं हे एवरीवन वंस अगेन वेलकम टू डब्लू कपटेक माय सेल्फ कर और आज के इस वीडियो के जरिए हम बात करने वाले हैं के नियरेस्ट नेबर एल्गोरिथम के बारे में के नियर्स नेबर किस तरह से वर्क करती है इसको हमने डिटेल के साथ देखा था लास्ट वाले वीडियो के लेक्चर के अंदर आज के इस वीडियो के अंदर हम केनिस नेबर एल्गोरिथम के प्रैक्टिकल को समझने वाले हैं कि कभी आपके पास कोई डाटा सेट आ जाए तो उसके अंदर आप केनस नेबर एल्गोरिथम किस तरह से अप्लाई कर सकते हैं और उसके रिजल्ट को निकाल सकते हैं तो चलिए जरा इसे डिटेल के साथ समझते हैं यदि आपको पाइथन मशीन लर्निंग डाटा साइंस एंड डेटा एनालिस जैसी फील्ड में अपने आपको को ग्रो करना है तो इसके लिए डब्लू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जवाइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं दैट इज माय डेटा सेट जो कि सोशल नेटवर्क्स को खरीदा या नहीं खरीदा है इसके बारे में आपको बताता है मतलब जैसे कि आपने सबसे पहले मैं क्या करूंगा यहां पे जो रिक्वायर्ड लाइब्रेरी है उन्हें मैं इंपोर्ट करने वाला हूं जस्ट लाइक पांडा को मैं इंपोर्ट करूंगा पांडा लिज ऑफ पीडी को उसके बाद में मैं यहां पे इंपोर्ट करने वाला हूं यहां पर मैट पल लिप को ताकि हम इसका ग्राफ बना सके तो मै पॉलिप डॉट यहां पर पवा प्लॉट पवा प्लॉट एलियाज ऑफ मैं यहां पे पीएटी देने वाला हूं इसके साथ-साथ मैं यहां पे इंपोर्ट करूंगा किसे यहां पे सी बन को तो सी बन एलियास ऑफ एसएनएस मैं यहां पे लूंगा चलिए अब हमारे जो डाटा सेट है उसे हम लोड करते हैं यहां पे पडी ड यहां पर री सीएवी की हेल्प से एंड यहां यहां पर मैं डेटा सेट को लोड करता हूं जो कि है सोशल मीडिया नेटवर्क के नाम से राइट उसके बाद में हम हमारे डेटा सेट को देखते हैं डॉट हैड लगाते हुए इसके तीन डाटा को तो चलिए इसे रन करते हैं तो हमारे पास तीन डटा आ चुका है अब इसके अंदर जो डेटा सेट है ये नल वैल्यू प्रेजेंट ये जो डेटा सेट है ये हमारा लोड हो चुका है इसके अंदर हमारे पास पहले नल वैल्यू को चेक करते हैं कि कोई नल वैल्यू प्रेजेंट है या नहीं है तो नल वैल्यू को चेक करने के लिए मैं करूंगा डेटा सेट के पास जाऊंगा डॉट मैं यहां पे इस नल को कॉल करने वाला हूं एंड डॉट में यहां पे सम को कॉल करने वाला हूं जैसे रन करूंगा तो देखिए मेरे पास कोई भी नल वैल्यू प्रेजेंट नहीं है यहां पे मुझे इंडिकेट हो रही है अब हम क्या करें हैं हमारे डाटा को इनपुट और आउटपुट में अलग-अलग करते हैं एंड यहां पे स्केलिंग करते हैं इनपुट आउटपुट का मतलब है डिपेंडेंट इंडिपेंडेंट वेरिएबल के अंदर अलग-अलग करते हैं एंड देन स्केलिंग करते हैं तो चलिए जरा यहां पे इसे इनपुट आउटपुट में अलग-अलग करें तो देखिए x नाम का एक वेरिएबल बनाता हूं जहां पे मैं अपना डेटा सेट लूंगा ड आलग लेके यहां पे सारी रोज को लेने वाला हूं एंड कॉलम के अंदर -1 को छोड़ दूंगा देन y = वेरिएबल लेके हम क्या करेंगे डेटा सेट को लेंगे और यहां जाके मैं परचेज को कॉल करने वाला हूं तो इस तरह से मेरा डेटा सेट अलग-अलग हो चुका है इनपुट आउटपुट के अंदर अच्छा इससे इनपुट आउटपुट में अलग-अलग करने से पहले पहले मैं इस डेटा सेट का डिस्ट्रीब्यूशन चेक करूंगा कि ये डेटा सेट किस तरह से डिस्ट्रीब्यूटर है इसके लिए मैं स्केटर प्लॉट बनाने वाला हूं तो एए डॉट मैं यहां पे स्केटर प्लॉट का इस्तेमाल करूंगा जिसके अंदर एक्स एक्सेस के अंदर मैं क्या करने वाला हूं यहां पे एज को लूंगा एंड वा एक्सेस के अंदर मैं यहां पे क्या करने वाला हूं एस्टीमेट सैलरी को यहां पे लेने वाला हूं देन उसके बाद में मैं डेटा की बात करूं यहां पे तो देखिए डटा इक्वल्स टू आपका क्या है गाइ यहां पे डेटा सेट है मेरे पास यहां पे एंड यहां पर मैं ह्यू पैरामीटर्स दूं यहां पे तो ह्यू पैरामीटर्स हमारा क्या रहेगा परचेस्ड रहने वाला है तो यदि मैं ह्यू पैरामीटर दूं परचेज तो परचेज हमें यहां पे दिखेगा ह्यू पैरामीटर मैं परचेज दूं तो मेरा जो ग्राफ है वो आपके पास परचेज के अकॉर्डिंग स्प्लिट हो जाएगा चलिए हम रन करते हैं तो देखिए मेरे डेटा सेट कुछ इस तरह से आपके पास स्पल टिक ओके हमें यहां पे दिखा रहा है अब हम क्या करने वाले हैं गाइज यहां पे हमारे डेटा सेट को हमने इनपुट आउटपुट में अलग-अलग किया था इसके अंदर हम क्या करेंगे इसकी स्केलिंग करेंगे चलिए अब इसकी स्केलिंग कर लेते हैं स्केलिंग करने के लिए यहां पे मैं फ्रॉम साइकन का इस्तेमाल करूंगा डॉट यहां पर मैं इस्तेमाल करूंगा प्री प्रोसेसिंग का स्केलिंग के लिए एंड दैट मैं यहां पे इंपोर्ट करने वाला हूं किसे आपके पास यहां पे स्टैंडर्ड स्केलर को जिसके थ्रू हम हमारी स्केलिंग करेंगे एससी के नाम से रिबल बना लेता हूं जिसके थ्रू मैं यहां पे जो स्टैंडर्ड स्केलर जो हमारे पास यहां पे क्लास है उसे मैं कॉल करूंगा उसके बाद में एससी ड मॉडल को मैं यहां पे क्या करूंगा फिट करूंगा फिट के अंदर मैं अपना जो एक्स एक्सेस का डाटा है वो मैं पास करूंगा उसके बाद मैं एसी डॉट यहां पर मैं क्या करने वाला हूं डेटा को ट्रांसफॉर्म करने वाला हूं ट्रांसफॉर्म के अंदर मैं एक्स एक्सेस का डाटा दूंगा एंड रन करूंगा तो देखिए मेरा जो डाटा है वो स्केलिंग होके आ चुका है इस डाटा को हम क्या करते हैं डटा सेट में वापस प्लेस कर देते हैं तो देखिए x नाम का वही दोबारा मैं वेरिएबल बनाने वाला हूं उसके बाद में पडी डॉट यहां पर मैं डटा फ्रेम का इस्तेमाल करूंगा और डटा फ्रेम के अंदर एड ट्रांसफॉर्म को डालूंगा और इसके बाद मैं कॉलम का नाम डालूंगा कॉलम के लिए मैं क्या करने वाला हूं कॉलम्स का लूंगा यहां पे x डॉट यहां पे कॉलम्स को कॉल करने वाला हूं राइट उसके बाद मैं इसे क्लोज कर देता हूं और यहां पे इसे रन कर देते हैं देखिए x एकस का यदि मैं डाटा देखूं तो यह मेरा डाटा जो है वह स्केलिंग होके मेरे सामने आ चुका है अब हम बात करते हैं हमारे मॉडल बनाने के लिए तो देखिए हमारे पास डटा सेट आ चुका है इस डटा सेट को हम क्या करेंगे ट्रेन और टैस के अंदर स्प्लिटिंग करेंगे ताकि हम यहां पे चेक कर सकें कि यह मॉडल कितने अच्छे से वेल परफॉर्म कर रहा है तो ट्रेन और टेस्ट के अंदर स्प्लिटिंग करने के लिए मैं साइकल लन को दोबारा कॉल करूंगा यहां पे एंड साइकल लन के अंदर जाके डॉट मॉडल सिलेक्शन को कॉल करने वाला हूं यहां पे एंड मॉडल सिलेक्शन के अंदर जाने के बाद मैं दैट मैं इंपोर्ट करूंगा किसे यहां पे ट्रेन टेस्टक को यहां पे स्प्लिटिंग को उसके बाद मैं क्या करने वाला हूं गाइज यहां पे x मैं यहां पे ट्रेन लूंगा एंड देन मैं यहां पे x अ टेस्ट को कॉल करने वाला हूं इसी तरह से आपके पास यहां पे y मैं यहां पे ट्रेन को लेने वाला हूं एंड y अस्को मैं यहां पे टेस्ट को लेने वाला हूं ये मेरे चार वेरिएबल तैयार हो चुके हैं और ट्रेन और टेक स्प्लिटिंग का फंक्शन मैंने कॉल कर दिया है उसके बाद में गाइज यहां पे x और y का जो डाटा है वो मुझे पास कराना है रैंडम स्टेट की वैल्यू पास करानी ट्स अ 42 उसके बाद में मुझे यहां पर टेस्टिंग साइज देनी है टेस्टिंग साइज 0.22 दिया है मैंने यहां पे मेरा जो डेटा सेट है वो यहां पे चार पार्ट के अंदर टूट चुका है ट्रेनिंग और टेस्टिंग के अंदर अब हम क्या काम करते हैं गाइस यहां पे अब हमारे जो डेटा सेट है इस डेटा सेट से मॉडल को ट्रेन करते हैं ट्रेन करने के लिए मैं यहां पे क्या करूंगा फ्रॉम साइकल एन के अंदर चलूंगा यहां पे साइकिल एन के अंदर जाने के बाद हम यहां पे इस्तेमाल कर रहे हैं के नियरेस्ट ने नेबर को तो मुझे यहां पे क्या करना पड़ेगा आपके पास नेबर को कॉल करना पड़ेगा क्योंकि नेबर के अंदर आपके पास क्या मिलेगी के नियरेस्ट नेबर एल्गोरिथम मिलेगी तो इसी के अंदर आपको क्या मिलेगा के नियरेस्ट नेबर क्लासिफाई क्लासिफाई माल कर रहे हैं क्योंकि जो मेरा डेटा सेट है यहां पे इसका जो आउटपुट है मतलब जो आपके पास यहां पे जो हम रिजल्ट निकालने वाले हैं वो आपके पास क्या है क्लासिफिकेशन इन नेचर के अंदर है मतलब आपका आंसर जीरो और वन के तौर पे आपको देखने को मिल रहा है इसी वजह से हम यहां पे क्या कर रहे हैं क्लासिफिकेशन को इस्तेमाल कर रहे हैं चलिए केनेस दे ब क्लासिफाई मैंने कॉल कर लिया यहां पे अब देखिए यहां पे मैं क्या करूंगा k ए ए के नाम से एक वेरिएबल बना लूंगा k ए ए के नाम से मैं वेरिएबल बना लूंगा जहां पे के नियरेस्ट नीवर जो क्लासिफाई कॉल करने वाला हूं अब इस केनर पर क्लासिफिका को हम देखें इसके अंदर जो सबसे पहला हाइपर पैरामीटर आता है देन n नंबर ऑफ नेबर्स n नंबर ऑफ नेबर्स का मतलब है कि आप कितने नेबर्स बनाना चाहते हैं देखिए डिफॉल्ट नेबर जो आपके पास है यहां पे दैट इज अ फाइव नेबर आप इस नेबर को चेंज कर सकते हैं अकॉर्डिंग टू योर डाटा सेट यस जैसा जैसा आपका डेटा सेट चेंज होता रहेगा वैसे-वैसे आप इस नेबर को चेंज कर सकते हैं ये चेक कर सकते हैं कि कौन सा नेबर आपके डाटा सेट के लिए बेस्ट रहेगा सेकंड चीज आती है कि यहां पे हमें कौन से डिस्टेंस का फार्मूला यूज करना है हमें मैनहैटन डिस्टेंस का फॉर्मूला यूज करना है या फिर यूक्लिड डिस्टेंस का फॉर्मूला यूज करना है तो चलिए जरा इसे समझते हैं कि मैनहैटन यूज करना है या यूक्लिडियन को यूज करना है तो देखिए जसे आप यहां पे थोड़ा सा नीचे आएंगे यहां पे यस थोड़ा सा आपको नीचे आना है तो देखिए आपके पास आपको मिलेगा p की वैल्यू यस यहां पे जब आप p की वैल्यू को इस्तेमाल करेंगे तो देखिए p की वैल्यू के अंदर p = 1 जब आप p = 1 के इस्तेमाल करेंगे तो आपके पास मैनहैटन डिस्टेंस काम करेगी लेकिन यदि आप यहां पर p की वैल्यू को टू इस्तेमाल करेंगे तो आपके पास यूक्लिड डिस्टेंस काम करेगी मतलब आपके पास जो डिफॉल्ट डिस्टेंस है वो यूक्लिड डिस्टेंस है लेकिन यदि आपने p = वन दे दिया यहां पे तो आपकी मैनहैटन डिस्टेंस यहां पे वर्क करने लग जाती है तो फिलहाल मैनहैटन डिस्टेंस की जगह हम यूक्लिड डिस्टेंस को इस्तेमाल कर रहे हैं आप चाहे तो अपने डेटा सेट के अकॉर्डिंग इसे यूक्लिड डिस्टेंस के अंदर की जगह आप मैन हैटन डिस्टेंस में कन्वर्ट कर सकते हैं e की वैल्यू को चेंज करके चलिए अभी मैं नेबर की वैल्यू क्या रख रहा हूं फाइव ही रख रहा हूं फिर मैंने यहां पे k एनड मॉडल को क्या कर रहा हूं फिट कर रहा हूं यस k ड मॉडल के फिट के अंदर के अंदर मैं x ट्र एंड y ट्रेन जो है वो यहां पे दूंगा और मॉडल को ट्रेन करूंगा देखिए हमारा मॉडल यहां पे ट्रेन हो चुका है अब मैं क्या कर रहा हूं यहां पे गाइज केन एंड डॉट यहां पे करूंगा आपके पास स्कोर को निकालूं कि स्कोर कितना आने वाला है स्कोर के अंदर मैं यहां पे x टेस्ट कॉमा y अंड जो टेस्ट है वो पास कराऊंगा एंड मल्टीप्लाई बाय 100 करा देते हैं ताकि इसकी एक्यूरेसी हमें परसेंटेज में देखने को मिले रन करते हैं तो देखिए 92 पर एक्यूरेसी के साथ हमें हमारा रिजल्ट दे रहा है यहां पे चलिए एक बार नेबर की वैल्यू को चेंज करके देखते हैं कि नेबर की वैल्यू से क्या फर्क देखने को मिलता है तो यदि मैं नेबर की वैल्यू फाइव की जगह मैं यहां पे 10 करके रन करूं और फिर मैं यहां पे रन करूं तो देखिए मेरी एक्यूरेसी में कुछ ज्यादा फर्क नहीं देखने को मिलाहा है यदि हम यहां पे और थोड़ा सा कम करके देखें यहां पे तो अराउंड सेवन करके मैं यहां पे चेक करूं और फिर रन करूं यस मेरी एक्यूरेसी के अंदर कुछ-कुछ फर्क देखने को मिला तो आप यहां पे नेबर की वैल्यू को जैसे-जैसे चेंज करेंगे आपकी मॉडल की एक्यूरेसी में उतना फर्क देखने को मिलेगा अब जरा यहां पर चेक कर लेते हैं कि क्या यह मे मेरा मॉडल जो है वो ओवर फिटिंग तो नहीं हो चुका है तो चलिए ओवरफिटिंग के सिनेरियो को चेक करने के लिए मैं टेस्टिंग के साथ-साथ मैं ट्रेनिंग की भी एक्यूरेसी चेक कर रहा हूं तो यहां पर मैं नीचे पेस्ट कर देता हूं x टेस्ट की जगह x अ क्या करूंगा ट्रेन का इस्तेमाल करूंगा y टेस्ट की जगह मैं यहां पे क्या करने वाला हूं y ट्रेन का इस्तेमाल करने वाला हूं एंड देन रन करूंगा गाइज यहां पे तो 91 पर आ रहा है और ये 93 आ रहा है मतलब हमारा जो डेटा सेट है ये अच्छी तरीके से ट्रेड नहीं हो रहा है तो इसको अच्छे तरीके अटन करने के लिए हमें क्या करना पड़ेगा नेबर की वैल्यू को चेंज करना पड़ेगा चलिए मैंने नेबर की वैल्यू चेंज की है यहां पे और यहां पर रन करें तो अभी भी हमारा जो मॉडल है वो अच्छी तरह से टेंड नहीं हो रहा है तो हमें कोई एक परफेक्ट नेबर की वैल्यू लानी पड़ेगी जिसकी वजह से हमारा जो मॉडल है वो अच्छी तरह से टेंड हो जाए तो अभी मैं यहां पे देखिए 13 नेबर्स लाके रखता हूं यहां पे फिर मैं रन करता हूं और फिर रन करता हूं या अभी भी कोई अच्छी खास नहीं आई है इसी तरह से हमें क्या करना पड़ेगा चेंज करना पड़ता रहेगा तो मैं यहां पे क्या करूंगा नेबर की वैल्यू को चेंज करूंगा इस बार फिर से यस अभी भी कोई अच्छी चीज नहीं आई है तो हम क्या करेंगे एक लूप लगाएंगे और और लूप लगाने के बाद में हम हमारे मॉडल को अच्छी तरीके से ट्रेन करेंगे अब ये कैसे करना है तो जरा इसको समझते हैं मुझे यहां पे क्या करना पड़ेगा नेबर की राइट वैल्यू लानी पड़ेगी जिसकी वजह से मेरे मॉडल की एक्यूरेसी है वो अच्छी आए और मेरा मॉडल ओवर फिटिंग के सिनेरियो पे ना चला जाए तो चलिए क्या करते हैं उसके लिए तो मैं एक फोर लूप लगाता हूं फर आ इन रेंज लगाता हूं जहां पे मैं अपने नेबर की वैल्यू को चेंज करूंगा नेबर की वैल्यू वन से लगाकर मैं यहां पे नेबर की वैल्यू 30 तक रखने वाला हूं यहां पे चलिए अब हम क्या करेंगे यहां पे k ए एव के नाम से एक वेरिएबल बना लेते हैं जिसके अंदर के नियरेस्ट नेबर क्लासि फायर को मैं यहां पे कॉल करने वाला हूं इसके साथ-साथ k nn1 कोड मॉडल डट क्या करूंगा यहां पे फिट करने वाला हूं फिट के अंदर मैं यहां पे x ट्रेन y जो ट्रेन है वो मैं देने वाला हूं इसके साथ-साथ मैं अपनी स्कोर देखूंगा स्कोर के से पहले मैं यहां पे आई की वैल्यू देखूंगा उसके बाद में मैं क्या करूंगा यहां पे केनन . 1 जो हमारे पास है इसका मैं स्कोर चेक करेंगे स्कोर के अंदर x टेस्ट एंड y टेस्ट जो है यहां पे वो दूंगा अच्छा टेस्ट से पहले मैं ट्रेनिंग की एक्यूरेसी दे देता हूं यस x स्कोर यहां पर ट्रेन कॉमा y जो ट्रेन है यहां पे दैट मैं वो लूंगा यहां पे मल्टीप्लाई बा 100 कर लेते हैं उसके बाद में यहां पे k.in वन है यहां पे इसका फिर से मैं क्या करूंगा यहां पे स्कोर चेक करूंगा स्कोर के अंदर x आपके पास टेस्ट कॉमा y जो टेस्ट है यहां पे वो भी दूंगा और मल्टीप्लाई बाय 100 कर लेता हूं ये दोनों की एक्यूरेसी मैं क्या करने वाला हूं यहां पे चेक करने वाले हैं चलिए अब मैं क्या करता हूं इसको प्रिंट कर देता हूं ताकि मैं प्रिंटिंग ऑप्शन के थ्रू यहां पे देख सकूं कि मेरा मॉडल किस तरह से ट्रेड हो रहा है इसके साथ-साथ मैं यहां पे जाऊंगा और यहां पर मेरे पास क्या है ने नेबर है तो मैं यहां पे n नेबर्स की वैल्यू चेंज करूंगा और नेबर की वैल्यू i के थ्रू रिप्लेस करूंगा चलिए इसे रन करते हैं तो देखिए हमारा मॉडल यहां पे ट्रेंड होना स्टार्ट हो चुका है अच्छा पहले डाटा को देखें तो दैट्ची है थर्ड मॉडल को देखें तो ये ऑलमोस्ट आपके सही है मतलब नेबर की वैल्यू जो थ्री है वो आपके लिए बेस्ट रहेगी उसके बाद देखिए फोर्थ को देखें तो हां फोर्थ की वैलू आपके पास क्या हो रही है आपके पास ओवर फिटिंग की जगह अंडरफिटिंग जा रही है क्योंकि देखिए ट्रेनिंग की एक्यूरेसी कम हो रही है और टेस्टिंग की एक्यूरेसी ज्यादा हो रही है दैट इज नॉट अ गुड पार्ट ओके इसके साथ-साथ देखिए यहां पे तो आपके देखिए ये भी आपके पास क्या है ये भी आपका अंडर फिटिंग है देन यहां पे ये क्या चल रहा है आपका ओवर फिटिंग चल देखिए यहां पे बात करेंगे तो ये आपके पास बेस्ट फिटिंग आ चुका है आपके पास यहां पे इसके साथ-साथ देखिए नीचे चलेंगे तो ये भी आपके पास कुछ अच्छा आंसर नहीं है थोड़ा सा और नीचे मूव करें तो कोई अच्छे आंसर्स हमें यहां पर अभी तक देखने को नहीं मिले हैं तो सही नेबर की वैल्यू की बात करें तो जो परफेक्ट नेबर निकल के आया हमारे सामने दैट इज़ अ थ्री यस के नेबर नेबर नियरेस्ट नेबर के अंदर जो हमारा जो नेबर सही तरीके से निकल के आ है दैट इज अ थ्री इसका मतलब यहां पे नंबर ऑफ नेबर की वैल्यू मुझे क्या करनी पड़ेगी थ्री करनी पड़ेगी चलिए थ्री करके रन करते हैं इसे फिर रन करते हैं और फिर रन करते हैं तो देखिए हमारे मॉडल की एक्यूरेसी काफी अच्छी आई है 91 पर आई है और यहां पे ट्रेनिंग की एक्यूरेसी की बात करें तो 92 पर आई है तो इसका मतलब हमारा जो मॉडल है वो परफेक्टली यहां पे वर्क करने वाला है ठीक है तो हमारा स्कोर निकल चुका है अब स्कोर निकलने के बाद में अब हम क्या करते हैं गाइज यहां पे इसके अंदर प्रेडिक्शन करके देख लेते हैं एक बार यहां पे तो k डॉट मैं यहां पे क्या करने वाला हूं पेडिक का इस्तेमाल करने वाला हूं पेडिक के अंदर चलने के बाद डबल स्क्वायर ब्रैकेट का इस्तेमाल करेंगे अब देखिए प्रिडिक्ट फंक्शन के अंदर जो हमें डाटा देना है वो स्केलिंग हुआ हुआ डटा देना है ना कि आपके पास ये वाला डाटा देना है आपको जो ओरिजिनल डेटा है वो नहीं देना है आपको स्केलिंग हुआ हुआ जो डटा है वो आपको देना है तो चलिए स्केलिंग हुआ हुआ जो डेटा है वो हम यहां पे देंगे तो उसके लिए मैं देखिए एक्स एक्सेस को कॉल करता हूं पहले तो तो ये रहा मेरा एक्स एक्सेस इसके ऊपर हमारा आंसर क्या आना चाहिए जीरो आना चाहिए तो मैं स्केलिंग हुआ हुआ जो डाटा है वो इधर पास कराऊंगा यहां पे राइट स्केलिंग हुआ हुआ जो डाटा है वो मैं पास करा रहा हूं पहला एंड रन करूंगा आंसर जरो आ रहा है दैट्ची और जो कि जीरो भी आया है चलिए इसके साथ-साथ देखिए मैं यहां पे क कर रहा हूं सबसे लास्ट वाला भी चेक कर लेता हूं यहां पे 399 पे आपके पास वन आना चाहिए तो चलिए जो सबसे लास्ट वाला डाटा है उसको भी एक बार चेक कर लेते हैं तो मैं जो सबसे लास्ट वाला डाटा है ना यहां पे इसको डालता हूं यहां पे और उसके बाद मैं इसको चेक करता हूं कि क्या इसका आंसर वन आ रहा है या फिर जीरो आ रहा है इसको लगा के रन करते हैं यस वन आ रहा है इसका मतलब आपके पास सही आंसर आ रहा है क्योंकि देखिए आपका ऐ और y को देखेंगे यहां पे तो आपका रिजल्ट वही आ रहा है देखिए यदि आप यहां पर नहीं समझ पा रहे तो मैं इसको रन करता हूं तो ये मेरा x एक्सेस का डाटा है और यदि मैं y एक्सिस के डाटा को देखूं तो ये मेरा y एक्सेस कर दे र है तो देखिए रो पे तो आपका रो आ रहा है एंड 399 पे आपका वन आ रहा है और मैंने यहां पे देखिए और ऑलमोस्ट 399 का जो डाटा है यहां पे उसी को उठा के यहां पे पेस्ट किया इसका मतलब मेरा जो डाटा है वो प्रेडिक्शन आपके पास सही हो रहा है 92 पर एक्यूरेसी है तो इसका मतलब प्रोडक्शन आपका काफी हद से अच्छा हो रहा है अब हमें क्या करना है गाइस यहां पे हमें चेक करना है कि इसका डिसीजन रीजन क्या होगा मतलब इसका डिसीजन बाउंड्रीज क्या बनी होगी ये चेक करना है तो देखिए डिसीजन बाउंड्रीज चेक करने के लिए मैं यहां पे क्या करूंगा फ्रॉम जाऊंगा यहां पे एमएल एक्संड मॉड्यूल के अंदर चलिए एमएल एक्संड मॉड्यूल के अंदर जाने के बाद डॉट मैं जाऊंगा यहां पे किसके ऊपर प्लॉटिंग के ऊपर तो प्लॉटिंग के ऊपर क्लिक करने से पहले मैं देखिए एल एक दो बार हो गया है तो मैं इसे एक बार के लिए हटा देता हूं यहां पे उसके बाद में मैं यहां पे क्या करूंगा इंपोर्ट करूंगा और इंपोर्ट किसे करने वाला हूं यहां पे गाइज प्लॉट डिसीजन रीज़न को तो मैं प्लॉट क्या करने वाला हूं यहां पे गाइज डिसीजन रीजन को कॉल करने वाला हूं चलिए अब इस डिसीजन रीजन को प्लॉट करते हैं डिसीजन रीजन को प्लॉट करने के लिए मैं करूंगा प्लॉट डिसीजन रीजन को कॉल करूंगा x एक् का डाटा दूंगा लेकिन नपाई के तौर पे तो यहां पे 2 अंडर मैं यहां पे क्या कर रहा हूं आपके पास नपाई का इस्तेमाल कर रहा हूं 2 मैं नपाई को कॉल करूंगा उसके बाद में मैं गाइज यहां पे वा एक्सेस का डाटा दूंगा जिसके अंदर इसको भी क्या करूंगा 2 मैं नं पा क्या कॉल कर देता हूं उसके बाद में यहां पे हमारे पास है सीएलएफ सीएलएफ के अंदर जाके हम क्या करेंगे हमारा जो k एन है यस उसे हम पास करा देंगे उसके बाद इस ग्राफ को देखने के लिए मैं पीएटी डॉट यहां पर शो फंक्शन को कॉल करूं और रन करूं तो इसका ग्राफ जो है वो रेडी हो जाएगा तो चलिए थोड़ा वेट करते हैं ग्राफ के लिए तो गाइज यहां पे हमारा जो ग्राफ है वो बन के आ चुका है और इस ग्राफ के अंदर हम ऑब्जर्वेशन करें इसकी तो आप एक ऑब्जर्वेशन कर पाएंगे देखिए काफी हद तक ये जो डाटा है काफी हद तक ये जो मॉडल है वो बहुत ही अच्छी तरीके से ट्रेंड हो रहा है देखिए यहां वाला जो रीजन है इसको तो यह सही तरीके से कैप्चर कर रहा है लेकिन यहां वाले रीजन के अंदर काफी अच्छे-अच्छे तरीके से कैप्चर करने की कोशिश कर रहा है लेकिन ये अच्छे तरीके से कैप्चर नहीं कर पाया तो इस तरह से आप यहां पर देख पाएंगे कि ये किस तरह से वर्किंग कर रहा है राइट और इसने किस तरह के अपनी डिसीजन रीजन को बनाया और आज के इस वीडियो के जरिए हम यहां पर बात करेंगे के नियरेस्ट नेबर एल्गोरिथम का इस्तेमाल रिग्रेशन एनालिसिस में कैसे किया जाता है तो चलिए जरा इसे समझते हैं तो देखिए मेरे पास यहां पे एक डेटा सेट का ग्राफ बना हुआ है यहां पे अब आप कुछ इसे इस तरह समझ सकते हैं कि लेट्स सपोज आपके पास कोई x1 है और आपके पास कोई x2 है राइट इसके बेसिस पे आप क्या कर रहे हैं आपका y जो है वो प्रेडिक्शन कर रहे हैं और ये जो y आपके पास दिख रहा है ये आपके पास कैसा है रिग्रेशन टाइप का है अब इसके अंदर यदि आपके पास कोई नया डाटा आता है तो उस y की वैल्यू क्या होगी ये हम प्रेडिक्शन करेंगे तो इसके अंदर कैसे प्रेडिक्शन किया जाता है तो देखिए ये जो ग्राफ आप देख पा रहे हैं इसके अंदर तो इसके अंदर मैंने क्या कर रखा है x1 और x2 के बीच में ये ग्राफ बना रखा है जिसके अंदर हमारे कुछ डेटा पॉइंट्स हैं अब लेट्स सपोज हमारे पास कोई नया पॉइंट आता है कि ये वाला नया पॉइंट है जैसे कि रेड पॉइंट है राइट इस रेड पॉइंट का क्या आंसर होगा मतलब क्या रिजल्ट निकलेगा क्या रिग्रेशन के आंसर निकलेगा ये हमें यहां पर देखना है तो अब इसे कैसे देखेंगे सबसे पहले ये क्या करता है कि नियर के जो फाइव पड़ोसी है उनको ढूंढता है जैसे कि देखिए इसके पांच पड़ोसी कौन-कौन से हैं तो पहला पड़ोसी ये है दूसरा ये है तीसरा ये पड़ोसी है एंड चौथा ये पड़ोसी है और पांचवा क्या है ये पड़ोसी है अब इनके देखिए पांच पड़ोसी से मिल चुके हैं अब जरूरी नहीं है कि यही पांच पड़ोसी हो ऐसा जरूरी नहीं है आप चाहे तो ये देखिए ये भी इसका पड़ोसी हो सकता है और ये भी इसका पड़ोसी हो सकता है तो ये डिस्टेंस के ऊपर डिपेंड रता है कि इसके पड़ोसी कौन-कौन से हैं तो लेट्स सपोज आपके नियर के जो इसके फाइव पड़ोसी है वो आपके पास इस तरह से दिख रहे हैं अब मान लीजिए ये नियर का पड़ोसी जो है आपका p1 पॉइंट है ये आपका p2 पॉइंट है ये आपका p3 पॉइंट है ये आपका p4 है एंड ये आपका p5 पॉइंट है तो ऐसे करके आपके पास क्या हुए ये ग से पांच पॉइंट मिल गए जो आपके पास क्या है सबसे इसके नियरेस्ट है अब के नियरेस्ट ने बार इसका आंसर कैसे निकालता है तो देखिए ये जो पांच पड़ोसी आपके पास मिल रहे हैं जो कि आपके पास क्या है p1 है एंड आपके पास p2 है एंड आपके पास यहां पे p3 है एंड p4 है आपके पास यहां पे एंड p5 है इन सभी का जो एवरेज आंसर आएगा वो आपके पास रिजल्ट होगा मतलब इन सभी के कुछ ना कुछ आपके पास y आउटपुट मिलेंगे जैसे कि इसका y1 मिलेगा इसका y2 मिलने वाला है इसका y3 आपको मिलेगा एंड इसका आपको y4 मिलेगा एंड देन इसका क्या मिलने वाला है y फा मिलने वाला है तो जो हम यहां पे फाइनल आंसर के ऊपर बात करें मतलब ये जो रेड पॉइंट का जो रिजल्ट आपके पास आने वाला है इसके फाइनल आंसर की बात करें तो आपके पास रिजल्ट क्या होने वाला है कि आपका पास ये y1 + y2 + y3 प्लस यहां पे y4 + y5 आपका पास आएगा एंड डिवाइड बाय आप क्या करेंगे फाइव करेंगे तो इससे आपका आंसर आपको देखने को मिलेगा अब यहां पे आता है कि ये डिस्टेंस कैसे मेजर करते हैं तो देखिए इसके अंदर डिस्टेंस मेजर करने के लिए यहां पे भी आपके क्या करते हैं मैनहैटन डिस्टेंस या फिर यूक्लिड डिस्टेंस को ही यूज़ करते हैं अब इन दोनों में से किसी एक डिस्टेंस को यूज़ कर सकते हैं आप चाहे तो मैन एस्टन डिस्टेंस को यूज़ कर सकते हैं और आप चाहे तो यूक्लिड डिस्टेंस को यूज़ कर सकते हैं मैन हैटन डिस्टेंस क्या करता है गाइज यहां पे कि इस पॉइंट से इस पॉइंट के बीच में कितनी डिस्टेंस है आपके पास एब्सलूट डिस्टेंस वो आपको निकाल के देता है और वहीं पे यदि मैं बात करूं आपके पास कि अ यूक्लिड डिस्टेंस क्या करता है तो यूक्लिड डिस्टेंस क्या करता है आपकी डायरेक्ट डिस्टेंस क्या है यहां पे ये आपको निकाल के देता है तो ये एक मेजर अ डिफरेंस होता है मैन एटन डिस्टेंस और यूक्लिड डिस्टेंस के अंदर तो बेसिकली गाइज केनियस नेबर के अंदर रिग्रेशन एनालिसिस में क्या करना है कि सिंपल से इसके नियरेस्ट के जो फाइव पड़ोसी है उनको ढूंढेगा यहां पे एंड जो भी इसके नीर फाइव पड़ोसी इसको मिलेंगे उसके क्या करेगा उनके जो डाटा पॉइंट के जो भी आउटपुट हैं उन आउटपुट को निकालेगा एंड देन फाइनली आपके पास क्या करेगा उनका आपके पास एवरेज करके आपको लके देने वाला है बस ये इसका सिंपल सा प्रोसेस होता है केस नेबर के अंदर अब जरा से थोड़ा प्रैक्टिकली समझ लेते हैं कि ये किस तरह से वर्क करता है तो इसके लिए मैं एक डेटा सेट को यूज़ करने जा रहा हूं यहां पे और पहले मैं आपको थोड़ा डेटा सेट दिखा देता हूं यहां पे तो मेरे पास जो डेटा सेट है यहां पे वो आपके पास क्या है मल्टी रिग्रेशन के नाम से एक डेटा सेट है जिसके अंदर आपके पास क्या कर रखा है कि किसी पर्टिकुलर की एज और उसके एक्सपीरियंस के बेसिस पे उसकी सैलरी डिसाइड की गई है यहां पे अब यहां पे एक्सपीरियंस 100 से ऊपर भी है यहां पे आप लोगों को दिख रहा है दैट इज अ नॉट 100 ये आपके पास यहां पे 10 10 के आसपास है मैंने पॉइंट को सिंपलीफाई कर रखा है यहां पे दैट इ 10.7 है 6.9 है 6.4 है इस तरीके आपके पास क्या है यहां पे एक्सपीरियंस आपको देखने को मिला है एक्सपीरियंस कभी भी आपके पास 107 ईयर का नहीं हो सकता दैट इज अ 10.7 ईयर यस ये आपके पास क्या है सारी की सारी डेसीमल वैल्यू है मैंने इनको नॉर्मल वैल्यू के अंदर पहले से ही कन्वर्ट करके रख रखा है यहां पे इनको मल्टीप्लाई बाय 10 करके यहां पे रख रखा है तो देखिए यहां पर मुझे इसके डिवाइड बाय 10 करना है आप लोगों को भी करना हो कभी तो आप इस तरह से कर सकते हैं कि आप पहले सेलेक्ट कर ले सभी डाटा को और इसे क्या करना एक टेबल बना लीजिए ताका जो आंसर है आपको सही तरीके से मिल जाए देन आप क्या करें इक्वल्स टू लिखें एंड उसके बाद ये जो डाटा है आप वो ले ले यहां पे डिवाइड बाय आप क्या कर 10 कर लीजिए एंड देन एंटर कर दीजिए तो आपका जो डाटा है वो आपके पास मिल जाएगा अब मैं एक काम करता हूं ये जो एक्सपीरियंस है इसको मैं यहां से कॉपी कर लेता हूं यहां पे यस मैं कॉपी कर लेता हूं और उसके बाद में देखिए यहां पे जो कॉलम का नाम है वो मैं कर रहा हूं एक्सपीरियंस रख देता हूं राइट अब मेरे को क्या करना है इसके डाटा को कॉलम को हटाना है तो मैं इसे कॉपी कर लेता हूं पहले तो एंड उसके बाद पेस्ट एज नंबर कर लेता हूं ओके एंड देन ओके कर लेते हैं यहां पे तो अभी क्या करना है गाइस यहां पे कि इस नंबर को यदि आप हटाना चाहते हैं मतलब यहां से आप एक्सपीरियंस ये जो एक्सपेंशन है यहां पे इसको आप हटाना चाहते हैं तो इसके लिए क्या करें सबसे पहले आप क्या करें आपका जो डाटा है उस डाटा को ले लें यहां पे और इस डाटा को यहां से यहां तक सेलेक्ट कर लें एंड देन कॉपी कर लें एंड पेस्ट एज अ नंबर आपको यहां पे कर देना है बस सिंपल सा उसके बाद क्या करना है ट्स इसको क्या करें आप डिलीट कर सकते हैं आराम से तो मैं डिलीट कर चुका हूं तो देखिए अब मेरा एक्सपीरियंस आ चुका है एक्सपीरियंस वर्सेस आपके सैलरी आ चुकी है और एज आ चुका है ठीक है अब इस एक्सपीरियंस को मैं एक्सपीरियंस बना देता हूं एक्सपीरियंस टू है तो एक्सपीरियंस बना लेते हैं इसे राइट चलिए इस तरह से आपके पास डेटा आ चुका है अब एज आ गया सैलरी आ गई और एक्सपीरियंस आ गया इसके बेसिस पे आपको क्या करना है प्रेडिक्शन करना है आपकी सैलरी को एज आ गया एक्सपीरियंस आ गया और सैलरी आ गई है यहां पे अब आपको क्या करना है एज वर्सेस आपको सैलरी का प्रेडिक्शन करना है ये जो कॉलम है अब रेडी है यहां पे प्रेडिक्शन के लिए तो चलिए अब इसका काम करते हैं यहां पे आगे चलके तो मैं ले चलता हूं आपको जुपिटर नोटबुक के ऊपर जहां पे हम केनिस नेबर को लगाएंगे एज अ रिग्रेशन पॉइंट ऑफ व्यू से राइट तो चलिए देखते हैं किस तरह से ये प्रेडिक्शन करता है तो पहले मैंने जुपिटर नोटबुक ओपन कर लिया उसके बाद मैं क्या कर रहा हूं इंपोर्ट कर रहा हूं किसे पांडा को क्योंकि मुझे इसकी रिक्वायर्ड पड़ेगी डटा सेट को लोड करने के लिए तो पांडा एलिस ऑफ हम क्या करने वाले हैं पीडी करने वाले हैं चलिए उसके बाद हम क्या करते हैं हमारे डटा सेट को लोड करते हैं तो डटा सेट के नाम से एक वेरिएबल बनाएंगे और पीडी डॉट यहां पे क्या करूंगा रीड सीएसवी के हेल्प से मेरे पास यहां पे क्या है आपके पास मल्टीलिनियर रिग्रेशन सीएवी है तो मैं उसे लेने वाला हूं यहां पे चलिए उसके बाद क्या करते हैं डेटा सेट को लेते हैं और डॉट हैड लगाते हुए इसके तीन डाटा को देखते हैं तो ये तीन डाटा आ गया जिसके अंदर एज आ गया सैलरी आ गया एक्सपीरियंस आ गया अब मेरा काम क्या है इसके अंदर पहले नल वैल्यू को फाइंड आउट करना है तो फिलहाल इसके अंदर कोई नल वैल्यू नहीं है मुझे पता है यहां पे आप चाहे तो इसे चेक कर सकते हैं टा से डॉट यहां पर इज नल का इस्तेमाल कीजिए यहां पे चेक करने के लिए और डॉट सम यहां पे रखिए है तो आपके पास नल वैल्यू मिल जाएगी आपको या इज नल का इस्तेमाल करना है मुझे यहां पे न इस नल का इस्तेमाल करूंगा डॉट सम करूंगा तो देखिए मेरे पास यहां पे कोई भी नल वैल्यू प्रेजेंट नहीं है अब मुझे क्या करना है मेरे डाटा के अंदर इनपुट और आउटपुट को अलग-अलग कर लेना है तो इनपुट क्या है गाइज यहां पे एज और एक्सपीरियंस हमारा इनपुट रहने वाला है और सल जो है वो हमारा आउटपुट रहने वाला है तो इनपुट आउटपुट को अलग-अलग करते हैं मतलब डिपेंडेंट और इंडिपेंडेंट को अलग-अलग करते हैं तो उसके लिए मैस नाम का एक वेरिएबल बनाऊंगा और डेटा सेट को लेने वाला हूं और यहां पर क्या करने वाला हूं गाइ यहां पे ड्रॉप करने वाला हूं यस ड्रॉप किया यहां पे मैंने मैंने और इसके लिए मैंने क्या कर रहा है यहां पे कॉलम का इस्तेमाल किया है और कॉलम के अंदर मैं बात करूं गाइज यहां पे तो मैं सैलरी को लेने वाला हूं राइट तो मैंने यहां पे सैलरी लगा दी है उसके बाद y नाम का एक वेरिएबल बनाते हैं और उसके अंदर क्या करते हैं हम यहां पे डेटा सेट लेते हैं और इसके अंदर हम क्या कर रहे हैं हमारी जो सैलरी है उसे हम ले लेते हैं तो देखिए एक्स एक्सेस का डाटा हमारा अलग हो चुका है और मेरे पास यहां पे वा एक्सेस का डेटा देखूं तो देखिए y एक्सेस का डटा भी अलग हो चुका है अब मेरा नेक्स्ट टारगेट क्या रहेगा मेरे डाटा को ट्रेन और टेस्ट के अंदर स्प्लिटिंग करना है तो चलिए इसे ट्रेन ऑ टेस्ट के अंदर स्प्लिटिंग कर लेते हैं तो फ्रॉम सेकंड न के अंदर चलेंगे डॉट उसके बाद में कहां चलने वाले हैं मॉडल सलेक्शन के ऊपर चलने वाले हैं तो मैं साइकल चलूंगा और मॉडल सलेक्शन को चूज करूंगा दैट मैं इंपोर्ट करने वाला हूं किसे अ ट्रेन ट स्लिटिंग को इंपोर्ट करने वाला हूं चलिए इंपोर्ट कर लेते हैं उसके बाद में हम क्या करते हैं गाइज यहां पे x मैं यहां पे क्या करूंगा ट्रेन नाम से एक वेरिएबल बनाऊंगा देन उसके बाद में x मैं टेस्ट नाम से एक वेरिएबल बनाने वाला हूं यहां पे उसके बाद मैं क्या करने वाला हूं y अ मैं यहां पे ट्रेन नाम से एक वेरिएबल बनाने वाला हूं और y मैं टेस्ट नाम से एक वेरिएबल बना रहा हूं और ट्रेन टेस्ट स्लिटिंग लेते हैं यहां पे जिसके अंदर x और y दोनों रखेंगे यहां पे और उसके बाद में यहां पे टेस्टिंग साइज दे देता है टेस्टिंग साइज 0.2 20 रखेंगे यहां पे और रैंडम स्टेट की जो वैल्यू है दैट मैं 42 रखने वाला हूं चलिए इसे रन कर लेते हैं उसके बाद हम क्या करें हमारा मॉडल बनाते हैं अब मॉडल किसका बनाना है गाइज यहां पे केनेस नेबर एल्गोरिथम का बनाना है तो चलिए केनेस नेबर एल्गोरिथम को लेके आते हैं तो कैसे फॉर्म सेकंड के अंदर चलेंगे डॉट कहां जाएंगे नेबर के अंदर जाना है हमको नेबर के अंदर जाना है नेबर के अंदर जाने के बाद दैट मैं यहां पे इंपोर्ट करने वाला हूं किसे इंपोर्ट करूंगा यहां पे केनन को मतलब केस्ट नेबर को इंपोर्ट करने वाला हूं राइट नेबर के अंदर जाना है और यहां जाने के बाद में मैं यहां पे क्या करूंगा अ के नियरेस्ट नेबर को कॉल करूंगा और के नियर नेबर के अंदर किसको रिग्रेशन को हम कॉल करेंगे क्योंकि हम रिग्रेशन एनालिसिस यहां पर इस्तेमाल करेंगे चलिए उसके बाद में गाइस देखिए k के नाम से एक वेरिएबल बनाते हैं और के नियर्स सेबर रिग्रेसर को हम यहां पे कॉल कर देते हैं उसके बाद में गाइ यहां पर देखिए ये ए डॉट मॉडल को क्या करेंगे यहां पे फिट करेंगे फिट के अंदर मैं यहां पे क्या करने वाला हूं x ट्रेन और मैं यहां पे y ट्रेन को लेने वाला हूं अच्छा ये रिग्रेसर को जब आप यहां से ओपन करेंगे तो इसके अंदर नंबर ऑफ नेबर्स आपसे पूछे जाएंगे कि कितने नंबर ऑफ नेबर्स यहां पर आप देना चाहेंगे तो फिलहाल देखिए यहां पे फाइव जो नेबर्स है वो आपके डिफॉल्ट है यहां पे आप इसे बढ़ा भी सकते हैं कम भी कर सकते हैं तो मैं ए नबर्स ऑफ की बात करूं यहां पे तो हम इसे क्या करेंगे अभी डिफॉल्ट के लिए फाइव ही रखेंगे राइट चलिए इसे रन करते हैं अब यहां पे चेक कर लेते हैं कि हमारा मॉडल जो है वो कितने परसेंट एक्यूरेसी के साथ काम कर रहा है ये हमारे लिए बहुत जाना जरूरी है यहां पे तो मैं k डॉट यहां पे क्या करूंगा स्कोर को चेक करूंगा स्कोर के अंदर क्या करने वाला हूं गाइज यहां पे x टेस्ट और मैं यहां पे y टेस्ट मैं यहां पे दूंगा और मल्टीप्लाई बा 100 कर लूंगा और रन करूंगा तो स्कोर मिला है 58 पर इट्स अ वेरी वेरी पुअर एक्यूरेसी बहुत ही बहुत ही ज्यादा पुअर एक्यूरेसी मिलेगी यहां पे इतनी ज्यादा कोई खास एक्यूरेसी नहीं मिली है और उसका रीजन भी यही है कि आपका जो डाटा है वो स्केलिंग करा हुआ नहीं है यहां पे और मे भी हो सकता है कि इसके अंदर आउटलायर प्रेजेंट हो तो हमें आउटलायर भी हटाने पड़ेंगे लेकिन हमारा यहां पे ये कांसेप्ट समझना नहीं है कि आउटलायर कैसे हटाते हैं और स्केलिंग कैसे करते हैं हमारा पॉइंट ये है कि केनस नेबर को एल्गोरिथम को इस्तेमाल कैसे करते हैं तो केनस नेबर कैसे इस्तेमाल की जाती है आई थिंक आपको क्लियर हो गया होगा राइट अब आप देखिए यहां पर ये जो नेबर है इस नेबर की वैल्यू को चेंज कर सकते हैं मैं एक काम करता हूं नेबर की वैल्यू को 10 करके देखता हूं और चेक करता हूं कि 10 के ऊपर हमारा पास क्या स्कोर रहता है यस 10 10 करने पर हमारी एक्यूरेसी काफी अच्छी इंप्रूव हुई है यहां पे और मैं चाहूं तो इसे 20 करके देखूं यहां पे और 20 करके देखेंगे एक बार तरीके से तो 20 करने से ज्यादा अच्छी इंप्रूव नहीं हो रही है यहां पे तो दैट 15 करके एक बार ट्राई कर लेते हैं यहां पे यस 15 करने से काफी हद तक अच्छी हो गई है यहां पे तो गाइस इस तरह से आप क्या कर सकते हैं पता लगा सकते हैं कि किस नेबर के ऊपर आपकी एक्यूरेसी ज्यादा अच्छी आ रही है यस तो इसके लिए आप एक काम करेंगे आप लूप चला लीजिए और लूप के अंदर आप क्या करें कि ये जो n की वैल्यू है इसे चेंज करते रहिए मतलब नेबर की वैल्यू चेंज करते रहिए और नेबर वैल्यू चेंज करने से आपके मॉडल की एक्यूरेसी काफी हद तक चेंज होगी इसके अलावा मॉडल की एक्यूरेसी बढ़ाने के लिए आप यहां पे क्या करें स्केलिंग करें और आप क्या करें यहां पे कि जो आपके डटा सेट के अंदर आउटलायर है उन आउटलायर को थोड़ा सा रिमूव करें राइट एंड देन सेकंड चीज बात करूं यहां पे कि आप रेंडम स्टेट की वैल्यू को भी चेंज करके आप अपनी एक्यूरेसी बढ़ा सकते हैं जैसे देखिए मैं रेंडम स्टेट की वैल्यू को यहां पे 10 करता हूं और उसके बाद मैं चेक करता हूं अपनी एक्यूरेसी को यस एक्यूरेसी में काफी अच्छा फर्क आया है यहां पे और ये आपको दिख पा रहा है यहां पे 63 पर एक्यूरेसी यहां पर मिल रही है मुझे राइट तो इस तरह से आप यहां पर इसे भी चेंज करके अपनी एक्यूरेसी को चेंज कर सकते हैं और आज की इस वीडियो के जरिए हम बात करने वाले हैं सपोर्ट वेक्टर मशीन के बारे में देखिए काफी लोग इसे शॉर्ट फॉर्म में एसवीएम भी बोलते हैं सपोर्ट वेक्टर मशीन एक ऐसी एल्गोरिथम है जिसकी हेल्प से आप लीनियर और नॉन लीनियर दोनों तरीके के जो डाटा है उन्हें आप क्या कर सकते हैं सॉल्व कर सकते हैं मतलब उनके प्रिडिक्शंस को निकाल सकते हैं यदि आपको पाइथन मशीन लर्निंग डाटा साइंस एंड डेटा एनालिसिस फील्ड में अपने आप को ग्रो करना है तो इसके लिए डब्लू कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपने स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं इसके साथ-साथ यदि मैं बात करूं सपोर्ट वेक्टर मशीन की तो सपोर्ट वेक्टर मशीन रिग्रेशन एंड क्लासिफिकेशन दोनों तरह की प्रॉब्लम्स को क्या करता है सॉल्व कर लेता है अब आज के इस वीडियो के अंदर डेडिकेट हम बात करेंगे क्लासिफिकेशन एनालिसिस के बारे में कि यदि आपका डाटा क्लासिफाई हो रहा है यहां पे मतलब आपका जो आउटपुट है वो क्लासिफिकेशन नेचर का है यहां पे तो उसके अंदर सपोर्ट वेक्टर मशीन किस तरह से वर्क करेगा एंड उसके ऊपर प्रेडिक्शन किस तरह से किया जाता है वो चीजें हम यहां पर देखने वाले हैं तो चलिए जरा इसे समझते हैं तो देखिए सपोर्ट वेक्टर मशीन जो है वो क्लासिफिकेशन एंड डिग्रेशन दोनों तरीके के एल्गोरिथम्स के अंदर वर्क करता है ये वर्क करता कैसे है जरा उसे समझते हैं यहां पे तो देखिए सपोर्ट वेक्टर मशीन क्या करता है कि जस्ट सपोज आपके पास ये डाटा है अब ये डाटा क्या है यहां पे तो देखिए आपका ये x1 फीचर है और ये आपका पास क्या है x2 फीचर है यहां पे जस्ट लाइक मैं बात करूं यहां पे तो मान लीजिए x1 एक डेटा सेट का पॉइंट है और x2 आपके पास दूसरा डेटा पॉइंट है मतलब ये आपके दो फीचर हैं इसके बेसस में आप वाई प्रेडिक्शन कर रहे हैं अब यहां पे आपके पास क्या रहा है कुछ ना कुछ नंबर्स आ रहे हैं जिसके बेसिस पे आप प्रेडिक्शन कर रहे हैं 0 1 0 1 0 1 एंड 01 के तौर पे अब यहां पे जो रो है आपके पास यहां पे उसको आप मान लीजिए कि आपका ब्लू कलर है एंड जो आपका वन रिप्रेजेंट कर रहा है दैट्ची आपके पास ग्रीन कलर है अब यहां पे सपोर्ट वेक्टर मशीन वर्क कैसे करता है सपोर्ट वेक्टर मशीन सबसे पहले क्या करता है अपने सपोर्ट वेक्टर को फाइंड आउट करता है अभ ये सपोर्ट वेक्टर क्या होता है तो सपोर्ट वेक्टर होता है गाइज यहां पे कि आपके पास ये जो डेटा सेट आप दिख रहे हैं इन डेटा सेट में से ऐसे दो पॉइंट निकालता है उसके हे से दो लाइन बनाए जाए और उसमें से एक प्रेडिक्शन लाइन निकाली जाए मतलब एक सेपरेबल लाइन निकाली जाए जिससे आपका डाटा आराम से स्प्लिट हो सके अब मैंने एक बहुत बड़ी लाइन बोली है इसको जरा थोड़ा डिटेल के साथ समझते हैं तो सपोर्ट वेक्टर मशीन क्या करता है कि आपके पास पहले क्या करता है दो पॉइंट फाइंड आउट करता है जस्ट लाइक ये दो मैंने फाइंड आउट किए दो पॉइंट यहां पे दैट इज कॉल्ड ऑफ सपोर्ट वेक्टर इनको हम क्या बोलते हैं सपोर्ट वेक्टर बोलते हैं क्यों सपोर्ट वेक्टर बोलते हैं क्योंकि इन सपोर्ट वेक्टर के बेसिस पे आपके पास क्या होता है एक मार्जिनल प्लेन पास आउट होता है मार्जिनल प्लेन का मतलब है गाइ यहां पे बेसिकली एक लाइन पास आउट होती है यहां पे कुछ इस तरीके से अब ये जो लाइन पास आउट हुई है इसके बीच की जो डिस्टेंस आपको देखने को मिल रही है इस डिस्टेंस का डिवाइड बाय टू मतलब एवरेज जो होता है इसका यहां पे इसके पास से होने वाली जो लाइन होती है दैट इज आई सेपरेबल लाइन यस ये क्या कहलाती है आपकी सेपरेबल लाइन कहलाती है यहां पे जिसके थ्रू आपका पास कोई भी नया डाटा आता है वो प्रेडिक्शन हो जाता है कि वो किस कैटेगरी में जाएगा तो बेसिकली गाइज यहां पे मैं बात करूं तो ये ये चीज आपने नोटिस भी की होगी जब आपने यहां पे सिंपल लॉजिस्टिक रिग्रेशन को पढ़ा था तो सिंपल लॉजिस्टिक रिग्रेशन भी आपका लगभग लगभग सेम ऐसे ही वर्क करता है क्या करता है कि आपके जो भी दो कैटेगरी है यहां पे उन दो कैटेगरी के बीच में से मतलब मिडल से एक लाइन पास आउट करने की कोशिश करता है जिसकी हेल्प से आपका जो डेटा है वो परफेक्टली स्प्लिटिंग हो जाए राइट ताकि यदि कोई नया डटा आता है लेट्स सपोज ये रेड कलर का एक नया डटा आता है तो ये कौन सी कैटेगरी में जाएगा इस लाइन के थ्रू हमें इंडिकेट हो जाता है जस्ट लाइक ये जो लाइन लाइन दिख रही है आपके पास यहां पे इस लाइन के इस तरफ है तो आपके पास यहां पे क्या आ जाएगा ग्रीन कलर का आ जाएगा यदि ये जो डेटा पॉइंट है ये डटा पॉइंट लाइन के इस तरफ आपके पास है तो आपके पास किस कलर का आ जाएगा ब्लू कलर का आपके पास देखने को मिल जाएगा तो बेसिकली सपोर्ट वेक्टर क्या करता है गाइज यहां पे सपोर्ट वेक्टर मशीन क्या करती है यहां पे कि आपके पास एक लाइन से परफेक्टली सेपरेबल करने की कोशिश करती है अब ये जो लाइन कैसे बनी है उसके बारे में मैं ही आपको ये इसके बारे में ही अभी समझा रहे थे हम यहां इसके बारे में ही अभी हम समझ रहे थे कि ये जो लाइन बनती है लाइन डायरेक्टली नहीं बनती सबसे पहले क्या करता है यहां पे आपके दो पॉइंट चूज किए जाते हैं जिसकी हेल्प से हम क्या कर सक सपोर्ट वेक्टर बना सके मतलब बेसिकली एक मार्जिनल प्लेन बना सके जिसके थ्रू आपका जो डाटा है वो परफेक्टली स्प्लिटिंग हो जाए राइट तो इसके लिए क्या करते हैं हम यहां पे दो डेटा पॉइंट ढूंढते हैं ऐसा नहीं है कि आपके पास हर कोई नहीं हो सकता कोई भी मतलब हर कोई नहीं हो सकता कोई भी आपका डटा पॉइंट हो सकता है लेकिन डिपेंड करता है एक पर्टिकुलर कंडीशन के ऊपर क्या कंडीशन के ऊपर वर्क करता है कि ये जो आप यहां पे सपोर्ट वेक्टर चूज कर रहे हैं जिनके थ्रू ये आपके मार्जिनल प्लेन चल रहे हैं यहां पे इनके बीच की जो डिस्टेंस आप d ले रहे हैं ये मैक्सिमम होनी चाहिए अब मैक्सिमम करने के अ चक्कर में यदि मैं बात करूं यहां पर मैक्सिमम करने के चक्कर में हम ऐसा नहीं कर सकते कि ये दो पॉइंट ले लें आपके पास ये दो सपोर्ट वेक्टर ऐसे चूज किए जाते हैं जिनके थ्रू आपके जो मार्जिनल पे निकल रहा है उस मार्जिनल प्लेन के अंदर जितना कम हो सके उतने कम डेटा पॉइंट्स आपके पास आए तो चलिए अब मैंने ये जो लाइन बोली है इसको जरा थोड़ा डिटेल के साथ समझते हैं तो बेसिकली गाइज आपके पास जो सपोर्ट वेक्टर मशीन होता है वो क्या करता है कुछ इस तरह से करता है काम यहां पे आपके पास क्या करते हैं दो डेटा पॉइंट आपके चूज किए जाते हैं जो कि हम क्या कहलाते हैं सपोर्ट वेक्टर्स कहलाते हैं इन सपोर्ट वेक्टर्स से आपके पास क्या करते हैं आपके पास मार्जिनल प्लेन जिसे आप हाइपर प्लेन भी बोलते हैं ये हाइपर प्लेन पास किया जाता है अब देखिए इस लाइन ये जो आपके पास बीच में से जो लाइन निकली है यहां पे दैट इज अ मार्जिनल लाइन या फिर आप इसे सेपरेबल लाइन भी बोल सकते हैं यहां पे यस जिसे आप क्या कर सकते हैं सेपरेबल लाइन कह सकते हैं इस सेपरेबल लाइन के यदि आपके पास राइट साइड में आपका ये जो प्लेन चल रहा है इसको हम पॉजिटिव हाइपर प्लेन बोलते हैं और इस लाइन के लेफ्ट साइड के अंदर आपके पास यहां पे जो लाइन चल रही होती है इसे हम नेगेटिव आइ पल प्लेन बोलते हैं और ये जो बीच में चल रहा है यहां पे दैट इज आपके पास यहां पे मैक्सिमम हाइपर प्लेन कहलाता है और ये जो डिस्टेंस डी दिख रही है आपके पास यहां पे ये डिस्टेंस डी आपके पास क्या होनी चाहिए मैक्सिमम टू मैक्सिमम होनी चाहिए यस जितनी ज्यादा मैक्सिमम हो सके उतनी ज्यादा मैक्सिमम होनी चाहिए ताकि हमारे जो डेटा पॉइंट है वो आराम से सेपरेबल हो सके सेकंड पॉइंट एक और चीज है यहां पे कि यदि कोई नया डाटा पॉइंट हमारे सामने आता है तो वो परफेक्टली प्रिडिक्ट हो सके कि दैट इज अ ब्लू कलर या दैट इज अ ग्रीन कलर यस वो कौन सी कलर में जाएगा इसके ऊपर डिपेंड कर सकता है राइट अब बात करते हैं कि सब सपोर्ट वेक्टर मशीन कैसे वर्क करती है ये तो हमें आईडिया लग गया यहां पे कि सबसे पहले क्या करना है हमें यहां पे सपोर्ट वेक्टर को फाइंड आउट करना है तो सबसे पहले हमने यहां पे ये सपोर्ट वेक्टर फाइंड आउट कर लिया यहां पे इसके बाद में से हमने क्या किया यहां से प्लेन निकाल दिया इसके बाद से हमने प्लेन निकाल लिया और प्लेन निकालने के बाद में यहां से हमने हमारा हाइपर प्लेन बना दिया जिसके थ्रू हमारा डिफरेंशिएबल किया है यह सपोर्ट वेक्टर क्या कोई भी हो सकता है क्या नहीं यह चीज़ मैंने आपको पहले ही बता दी डिस्टेंस d जो होती है वह मैक्सिमम होनी चाहिए क्योंकि देखिए यदि मैंने मान लिया यह दो पॉइंट लेके चला और इन दोनों पॉइंट से यदि मैंने हाइपर प्लेन बनाया तो आप डिस्टेंस देख लीजिए दोनों के बीच की d जो है वह बहुत ही कम है इसकी जगह पर यदि मैं यहां पे इस पॉइंट को लेके और इस पॉइंट को लेके चलता हूं यहां पे तो देख लीजिए आपका जो डिस्टेंस d है वो काफी अच्छी है यहां पे मतलब प्लेन की जो डिस्टेंस है वो काफी अच्छी हो चुकी है राइट तो ये आपके होती है अब इसी के अंदर हमारी जो सपोर्ट वेक्टर मशीन है ये दो तरीके से वर्क करती है अब ये दो तरीके से कैसे वर्क करती है तो ये दो तरीके से वर्क करती है आपकी हार्ड मार्जिन से और इसके साथ-साथ सॉफ्ट मार्जिन से मतलब सपोर्ट वेक्टर मशीन जो होती है टू तरीके से वर्क करती है दैट इज अ हार्ड मार्जिन एंड दैट इज अ सॉफ्ट मार्जिन अब ये हार्ड मार्जिन और सॉफ्ट मार्जिन का मतलब क्या है यहां पे जरा समझते हैं देखिए हार्ड मार्जिन का मतलब ये हो गया कि जो आप यहां पर जो हाइपर प्लेन बना रहे हैं मतलब जो पॉजिटिव नेगेटिव हाइपर प्लेन बना रहे हैं इस हाइपर प्लेन के थ्रू आप ये जो क्लासिफाई कर रहे हैं यहां पे मतलब दोनों को डिफरेंशिएबल बेसिकली गाइज यहां पे कि जैसे मैंने ये दो हाइपर प्लेन बनाए अब ये दो हाइपर प्लेन बनाए यहां पे तो इसके अंदर कोई भी आपका दूसरा जो डाटा है वो नहीं आना चाहिए जस्ट लाइक आपके पास ये जो ग्रीन कलर है ये ग्रीन कलर यहां पे नहीं आना चाहिए यस ये ग्रीन कलर आपका यहां नहीं आना चाहिए राइट अब मैं बात करूं थोड़ा सा डार्क ग्रीन कलर कर ले देता हूं ताकि आप लोगों को दिखे यहां पे तो बेसिकली गाइज यहां पे कि आपके पास इस तरह से ये ग्रीन कलर्स नहीं आने चाहिए ओके यदि आप बात करें ब्लू कलर के बारे में तो मैं बेसिकली गाइज बात करूं यहां पे तो ये ब्लू कलर भी आपके पास इस तरह से क्लासिफाई नहीं होना चाहिए हार्ड मार्जिन का मतलब क्या हुआ कि आप अपने डाटा को कुछ इस तरह से सेपरेबल कर रहे हो ताकि ये जो डिस्टेंस d जो आप देख रहे हो यहां पे ये d जो है आपका मैक्सिमम तो होना ही होना चाहिए इसके साथ-साथ इसके अंदर आपके पास कोई भी डाटा पॉइंट्स नहीं होने चाहिए मतलब इसके अंदर आपके पास यहां पे कोई भी डेटा पॉइंट मतलब मिस क्लासिफिकेशन नहीं होना चाहिए यदि ये मिसक्लासिफिकेशन होता है तो इससे हमें रॉन्ग प्रेडिक्शन देखने को मिलता है राइट तो पहला पॉइंट होता है हार्ड मार्जिन अब इसी में आता है आपका सॉफ्ट मार्जिन सॉफ्ट मार्जिन में क्या होता है गाइज यहां पे सॉफ्ट मार्जिन में होता है कि अब आपके पास ऐसी काफी सिचुएशन आ जाती है जैसे कि ये तो आपके पास क्या है परफेक्टली सेपरेबल है लेकिन यदि मान लीजिए आपके पास कुछ डेटा पॉइंट इस तरह से आता है जैसे मैं अभी आपको बना के दिखाता हूं ठीक है आपके पास डेटा पॉइंट आपके पास कुछ इस फॉर्मेशन में आ जाए जैसे इस तरह के सेपरेबल में तो आप क्या क्या चल रहा है आपका हार्ड मार्जिन चल रहा है आप इसमें आराम से काम कर सकते हैं लेकिन लेट्स सपोज आपके पास जो डेटा सेट है वो कुछ इस तरह से है तो उस वक्त आपके पास आपको सॉफ्ट मार्जिन की जरूरत पड़ेगी क्योंकि वहां पे आप डेटा पॉइंट को परफेक्टली सेपरेबल नहीं कर पाएंगे जैसे मान लीजिए ये कुछ मेरे रेड पॉइंट्स हैं यहां पे राइट मेरे ये क्या है कुछ रेड पॉइंट्स हैं जिसके थ्रू आपके पास यहां पे चीजें सेपरेबल हो रही है एंड आपके पा जिसके थ्रू आपके डेटा पॉइंट आ र है एंड देन मैं ब्लू कलर से कर रहा हूं यहां पे तो ये मेरे कुछ ब्लू कलर के डेटा पॉइंट्स हैं जिसके थ्रू हम यहां पे ये कुछ मेरे ब्लू पॉइंट्स है यहां पे राइट तो आप यहां पर देख पाएंगे कि अब यहां पे हम यदि सेपरेबल करने चले मतलब मैं यदि हाइपर प्लेन बनाने चलू इन केस ठीक है तो हाइपर प्लेन के अंदर बात करें तो हाइपर प्लेन मेरे परफेक्टली परफेक्टली आपके पास सेपरेबल नहीं हो पाएंगे क्यों नहीं सेपरेबल हो नहीं पाएंगे तो क्योंकि कुछ जो रेड डाटा है वो ब्लू के साथ मिक्स अप है और कुछ जो ब्लू डाटा है वो क्या है रेड के साथ मिक्स अप है तो इन केस यदि मैं यहां से अपने हाइपर प्लेन को ड्रॉ करूं पॉजिटिव नेगेटिव हाइपर प्लेन को ड्रॉ करूं और यहां पर मैं अपने लाइन को सेपरेबल बनाऊं तो आप देखिए ये डिस्टेंस d तो आपके पास काफी मैक्सिमम है लेकिन इसके बीच में काफी मिस क्लास यूसर है तो बेसिकली गाइज यहां पे क्या हो रहा है कि सपोर्ट वेक्टर मशीन जो आपके पास यहां पे है ये दो तरीके से वर्क करती है यदि आपका डाटा परफेक्टली सेपरेबल है तो वो किसम आएगा आपका हार्ड मार्जिन में आएगा और यदि आपका डाटा परफेक्टली सेपरेबल नहीं हो पाता है कुछ आपका मिस क्लासिफिकेशन करट जाता है तो वो आपका ऑफ मार्जिन के अंदर आने वाला है तो आपके सपोर्ट वेक्टर मशीन कुछ इस दो तरीके से वर्क करती है अब यहां पे बात करते हैं कि जो सपोर्ट वेक्टर मशीन है जो हमने यहां पे देख रहे हैं ये सपोर्ट वेक्टर मशीन तो आपके पास लीनियर सेपरेबल करती है और लीनियर सेपरेबल क्या लीनियर सेपरेबल करने के लिए हमारे पास क्या है कैपेबल लीनियर सेपरेबल करने के लिए हमारे पास क्या है लॉजिस्टिक रिग्रेशन है तो हम लॉजिस्टिक रिग्रेशन से भी कर सकते हैं सपोर्ट वेक्टर मशीन में ऐसी क्या टेक्निक है जिसकी वजह से ये नॉन लीनियर डेटा सेट को भी परफेक्टली सेपरेबल कर सकती है तो उसको जरा अ यहां पर देखते हैं तो गाइ देखिए आपके पास डाटा यदि लीनियर सेपरेबल है कुछ इस तरह का डाटा है तब तो सपोर्ट वेक्टर मशीन आपके पास लाइन से काम लाइन से सेपरेबल कर लेती है लेकिन यदि आपका डाटा लीनियर सेपरेबल नहीं है जप थिंग मान लीजिए आपका जो डाटा है वो कुछ इस तरीके से आ रहा है यहां पे यस आपके पास जो डाटा है जैसे मैं मान लू यहां पे ये मेरा x1 है और ये मेरा क्या है x2 है और डाटा कुछ इस तरह से आ रहा है तो दैट इज अ नॉन लीनियर यस ये क्या कहला रहा है नॉन लीनियर कहला रहा है अब जब हमारे पास डेटा नॉन लीनियर फॉर्मेशन में आ जाता है तो अब हम यहां पे इसे लीनियर सेपरेबल नहीं कर सकते मतलब अब हम इसे लीनियर सेपरेबल नहीं कर पाएंगे इतनी इसकी पॉसिबिलिटीज नहीं हो पाती है तो हमें कहां जाना पड़ता है नॉन लीनियर सेपरेबल में जाना पड़ता है राइट तो बेसिकली एसवीएम का जो रोल है वो दो तरीके से काम करता है पहला तो आपके पास एसवीएम का काम करता है लीनियर सेपरेबल के लिए काम करता है दूसरा नॉन लिनियली डटा सेपरेबल यदि आपके पास है तब भी एसवीएम आपके पास परफेक्टली वर्क करता है और ये परफेक्टली वर्क करता है किसकी हेल्प से आपके पास कर्नल की हेल्प से अब ये कर्नल क्या चीज होती है जरा समझते हैं यहां पे तो देखिए एसवीएम जो होता है गाइस यहां पे ये आपके क्या करता है एक फार्मूला अप्लाई करता है अब ये फॉर्मूला क्या अप्लाई करता है जरा अ इसे समझते हैं तो देखिए एसवीएम क्या करता है गाइज यहां पे कि ये जो लाइन आप जो ले रहे हैं यहां पे यस ये जो लाइन आप बना रहे हैं यहां पे इस लाइन का एक फार्मूला अप्लाई करता है अब आपको पता है लाइन का फार्मूला आप सब लोगों ने पढ़ा भी होगा और नहीं पढ़ा है तो इसके लिए मैं चाहूंगा आप मेरी पुरानी वाली जो वीडियो है देखें कौन सी लीनियर रेशन वाली वीडियो देखें उसके अंदर मैंने आपको बता रखा है कि लाइन का फार्मूला क्या होता है तो चलिए जिनको पता है दैट हम आगे वर्क करते हैं और जिनको नहीं पता है तो बस इस वीडियो के एंड होने पर आपको क्या करना है आपको मेरा वो वाला जो वीडियो है लीनियर रिग्रेशन वाला वो आपको देखना है राइट चलिए तो अब मैं बात करता हूं यहां पे कि दैट्ची = m + c आपके पास लाइन होती है यस और यहां पे जो हम हाइपर प्लेन बना रहे हैं राइट ये जो हम हाइपर प्लेन बना रहे हैं इन हाइपर प्लेन की जो लाइन की इक्वेशन होती है वो कुछ इस तरह से जाती है y = mx-p प्लस आपके पास यहां पे जैसे ये इक्वेशन है इससे आपके पास क्या आएगा आपके पास यहां पे माइनस आ जाएगा कितना लडा या डेल्टा मान सकते हैं और यदि इसकी मैं बात करूं आपके पास यहां पे तो ये क्या हो जाएगी y = mx3 प्स आपके पास क्या होगी डेल्टा लाइन हो जाएगी तो गाइज यहां पे ये जो लाइन बन रही है इस लाइन के थ्रू आपके पास क्या होता है प्रेडिक्शन होता है यस तो इसको हम क्या बोलते हैं इसको हम बोलते हैं सिंपल एसवीएम सिंपल एसवीएम मतलब यहां पे आपका लीनियर रिग्रेशन एंड क्लासिफिकेशन प्रॉब्लम सॉल्व हो रही है मतलब बेसिकली लीनियर सेपरेबल जो लाइन आ रही वो आपकी सॉल्व हो रही है अब यहां पे ये कर्नल वाला माजरा क्या है तो बेसिकली ये जो कर्नल है गाइज यहां पे ये कर्नल क्या करता है कि आपके डाटा का मॉडिफिकेशन करता है अब मॉडिफिकेशन करने का मतलब क्या हुआ गाइ यहां पे बेसिकली गाइज यहां पे बात करें कि एसवीएम जो है यहां पे सपोर्ट वेक्टर मशीन है वह y = mx3 को फॉलो कर रहा है मतलब बेसिकली लाइन को फॉलो कर रहा है लेकिन यदि हमारा जो डाटा है यहां पे यह डाटा आपके पास लीनियर सेपरेबल नहीं है तो उस केसेस में हम क्या करेंगे तो हम क्या करेंगे कि जो हमारा यहां पे जो फॉर्मूला है उसे हम क्या करेंगे मॉडिफिकेशन करेंगे क्या करेंगे हमारा जो फॉर्मूला है इसे हम क्या करेंगे मॉडिफिकेशन करेंगे मतलब इसके अ जो जो डाटा आपके पास आ रहा है यहां पे उस डाटा को हम मॉडिफिकेशन करके हम अप्लाई करेंगे जैसा यदि मैं आप लोगों को थोड़ा सा आईडिया दूं यहां पे तो हमने पढ़ा था पॉलिनो मियल डिग्रेशन राइट पॉलिनो मियल डिग्रेशन के अंदर हमारा डाटा तो था लीनियर डिग्रेशन का और हमने फार्मूला भी लीनियर डिग्रेशन का अप्लाई किया था लेकिन जब हमारा डाटा लीनियर आपके पास परफेक्टली डिग्रेशन को फॉलो नहीं कर रहा था तो हमने हमारे डटा को क्या किया था हमने हमारे डाटा को पॉलिनॉमियल डाटा के अंदर कन्वर्ट किया था ताकि आप क्या कर सके आपका जो भी डाटा है यहां पे उस डाटा को आप लीनियर रिग्रेशन के अंदर अप्लाई कर सके और एक प्रेडिक्शन लाइन बना सके राइट ये चीज हमने पॉलिनो मियल रिग्रेशन के अंदर की थी सेम एज हमारे पास यहां पे भी है कि जब हमारा डाटा लीनियर सेपरेबल नहीं हो रहा है तब हमें क्या करनी पड़ती है हमें हमारे डाटा को देना पड़ता है कर्नल कर्नल क्या करता है गाइज यहां पे कि हमारे डाटा का मॉडिफिकेशन करता है यस कर्नल क्या करता है हमारे डाटा को मॉडिफिकेशन करता है और मॉडिफिकेशन करने के बाद में पस एसपीएम को देता है जिसके थ्रू प्रिडिक्शन होता है मतलब जिसके थ्रू आपके चीजें सेपरेबल होती है अब ये कर्नल करता कैसे है इस चीज को समझने के लिए हम इस तरह से कंसीडर कर सकते हैं लेट्स सपोज आपका एक डाटा है राइट आपका एक एक्सिस और y एक्सिस का आपका डेटा यहां पे यदि मैं मान लू केवल एक्स एक्सिस का डाटा है यहां पे जिसके थ्रू आप यहां पे क्लासिफिकेशन कर रहे हैं तो मान लीजिए आपका डाटा कुछ इस तरह से है यस आपका जो डाटा है यहां पे कुछ इस तरह से है कि आपके पास कुछ रेड पॉइंट है यहां पे कुछ आपके पास कुछ देख है रेड पॉइंट दे रखे है और आपके पास मान लीजिए कि आपके पास कुछ ग्रीन पॉइंट्स है राइट आपके पास क्या कर रहा है कुछ ग्रीन पॉइंट्स है ये आपके पास एक वन डायमेंशन डेटा सेट है ठीक है तो हम क्या करते हैं कुछ अनल एसएम लगाते हैं क्या करते हैं हम यहां पे कर्नल एसपीएम लगाते हैं कर्नल एसपीएम क्या करता है इस डेटा पॉइंट की सिचुए को चेंज कर देता है कर्नल एसपीएम क्या करता है इस डेटा पॉइंट की सिचुएशन को कम चेंज कर देता है जैसे कि ये वन डायमेंशन डेटा सेट है ना तो कर्नल एसपीएम क्या करेगा कुछ फॉर्मूलेशन लगाएगा और फॉर्मूलेशन की हेल्प से ये जो वन डायमेंशन डटा है ये टू डायमेंशन में कन्वर्ट हो जाएगा मतलब टू डायमेंशन के अंदर स्पेस के अंदर कन्वर्ट हो जाएगा अब लेट्स सपोज यदि मैं इसे टू डायमेंशन स्पेस के अंदर कन्वर्ट कर लूं यस लेट्स सपोज यदि मैं इसे क्या करूं टू डायमेंशन के अंदर यदि मैं इसे कन्वर्ट कर लूं तो आपके जो आपके पास केवल x एक्सिस था वो अब दो पॉइंट में बदल चुका है x1 और x2 में बदल चुका है तो आपके जो पॉइंट्स हैं यहां पे तो ये पॉइंट्स जो है आपके पास यहां पे कुछ इस तरह से आ जाएंगे कि कुछ ग्रीन पॉइंट्स यहां पे आ गए एंड कुछ ग्रीन पॉइंट्स यहां पे भी आ गए आपके पास यहां पे और रेड पॉइंट की बात करें गाइज यहां पे तो कुछ रेड पॉइंट आपके पास इस तरह से भी आ गए तो आपका जो डाटा है वो कुछ इस तरह से सेपरेबल हो जाएगा अब जब आपके पास इस तरह से आ जाएगा ना तो हम क्या कर सकते हैं यहां पर आपके पास सपोर्ट वेक्टर मशीन को लगा सकते हैं कैसे लगाएंगे यहां पे तो मैं सपोर्ट वेक्टर मशीन कुछ इस तरह से लगा के इसे सेपरेबल कर दूंगा जैसे ये लाइन बनाई ना मैंने यहां पे सेपरेबल लाइन बनाई है तो मैं कुछ इस तरह से सेपरेबल कर दूंगा जैसे कि इस तरह के इस वाले डेटा सेट के ऊपर बात करते हैं यदि ये डेटा सेट है हमारा टू डायमेंशन के अंदर अब मुझे यहां पे ये सेपरेबल नहीं हो रहा है तो मैंने क्या लगाया कर्नल एचपीएम लगाया कर्नल एचपीएम लगाने के बाद में क्या होगा कि ये टू डायमेंशन है इसको हम करेंगे 3d में कन्वर्ट यदि मैं इसे 3d में कन्वर्ट करूं तो आप कुछ इस तरह से ऑब्जर्वेशन ले सकते हैं जैसे कि मैं आपको बात करूं तो आप कुछ इस तरह से ऑब्जर्वेशन ले सकते हैं कि आपका जो डेटा पॉइंट है वो इस तरह से चेंजेज हो जाएगा जैसे ये आपका x एक्सिस हो गया ये आपका y एक्सिस हो गया और ये आपका z एक्सिस हो गया तो ये x हो गया ये y हो गया और आप य जड हो गया अब इसके अंदर जो आपके पास ग्रीन पॉइंट है यस इसके जो ग्रीन पॉइंट है वो ग्रीन पॉइंट आपके पास यहां पर आ जाएंगे ये ग्रीन पॉइंट क्या करेंगे आपके पास यहां पे आ जाएंगे एंड जो आपके ब्लू पॉइंट है गाइस यहां पे वो ब्लू पॉइंट आपके पास कुछ यहां पे भी आ सकते हैं राइट कुछ ब्लू पॉइंट आपके पास यहां पे भी आ जाएंगे अब हम क्या करेंगे यहां पे यदि मुझे इसको सेपरेबल करना है तो मुझे यहां पर क्या करना पड़ेगा बस एक हाइपर प्लेन बनाने की जरूरत है और ये हाइपर प्लेन आपके डाटा को स्प्लिटिंग कर देगा तो बेसिकली कर्नल एसपीएम क्या करता है गाइज यहां पे कि जब भी आपके पास नॉन लीनियर डाटा है यहां पे और नॉन लीनियर डेटा को आपको सेपरेबल करना है यस नॉन लीनियर डेटा को यदि आपको लगता है कि सेपरेबल करना है तो आप यहां पे डायरेक्टली एसवीएम से नहीं कर पाते हैं तो आप क्या करेंगे यहां पे कर्नल देंगे अब बेसिकली गाइज यहां पे कर्नल के अंदर कौन-कौन से कर्नल्स आते हैं उनको जरा आप देखते हैं तो गाइज कर्नल्स क्या आता है आपके पास यहां पे कि आपके पास जो वन डायमेंशन डटा है उसको हायर डायमेंशन स्पेस के अंदर कन्वर्ट करते हैं ताकि हम यहां पे उसे आराम से स्प्लिटिंग कर सके ओके चलिए तो इसके अंदर हमारे पास कुछ ये कर्नल्स आते हैं कौन-कौन से कर्नल है आप लीनियर कर्नल को इस्तेमाल कर सकते हैं पॉलिनो मियल कर्नल को इस्तेमाल कर सकते हैं गौशियन आरबीएफ को इस्तेमाल कर सकते हैं और सिगमॉड को इस्तेमाल कर सकते हैं अब ये क्या है यहां पे तो देखिए लीनियर वाला तो डायरेक्टली आपके पास चलता ही है यस लीनियर वाला डायरेक्टली चलता है अब आप बोलेंगे सर ये लीनियर वाला फॉर्मूला ऐसे कैसे चेंज हो गया तो बेसिकली ये फॉर्मूला वही है आपका यहां पे y = आपका जो mx3 जो फॉर्मूला था यहां पे ये वही वाला फॉर्मूला है यहां पे बस हमने यहां पे क्या किया कि जो आपका m है उसको m को रिप्लेस कर दिया w से और जो c है इसे रिप्लेस कर दिया b से बस इतना ही आपका चेंजेज है बाकी फॉर्मूला सेम टू सेम है और यहां पे ये जो t है ये t क्या है ट्रांसपोजर अब t ट्रांसपोजर का मतलब क्या है गाइज यहां पे आपके पास जो डाटा है यहां पे वो कुछ इस तरह से मिलने वाला है कि मतलब इस तरफ तो आपके पास सारे w मिलने वाले हैं यहां पे मतलब w मतलब m वाले पोजिशन मिलने वाला है और इस वक्त आपके पास x वाले पोजिशन मिलने वाले है अब जब आप इन दोनों का मल्टीप्लाई करते हैं तब आपके पास एक परफेक्टली टर्म बनती है देन उसके साथ आप क्या करते हैं बा स्को ऐड करते हैं तो अब ये जो w इसके साथ मल्टीप्लाई होगा तो इसी को लिखने का फॉर्मेशन हमने चेंज किया है और इसको ट्रांसपोजर है राइट बस और कुछ नहीं किया यहां पे तो बेसिकली लीनियर एसपीएम तो आपका डायरेक्टली काम करता है जो कि लीनियर सेपरेबल के लिए काम करता है उसके बाद आता है पॉलिनो एसपीएम अब पॉलिनो एसपीएम आपके पास यहां पे हमने पढ़ा था पॉलिनो रिग्रेशन के अंदर कौन सा हमने ये पढ़ा था y = टू आपके पास क्या पढ़ा था यहां पे m1 x1 प्लस यहां पे m2 आपके पास क्या होता है x2 का स् + m3 x3 का स् इस तरह से बन जाता है यहां पे तो वही चीज आपके पास यहां पे लिखी हुई है यस वही चीज आपके पास यहां पे लिखी है उसी तरह का फॉर्मेशन लिखा हुआ है अब इसी के अंदर आपके पास क्या आता है गौशियन आरपीएफ फॉर्मूला आता है जिसके थ्रू आपके पास क्या होता है गौशियन क बनता है यहां यहां पे एंड लास्ट में आपके पास आता है सिगमॉड यस जिसके अंदर आप सिगमॉड वाला कर्वेचर लगाकर आप डिफरेंशिएबल अलग कर्नल को अप्लाई करें अलग-अलग कर्नल अप्लाई करने के बाद में आप क्या करें चेक करें कि कौन सा आपके पास कर्नल आपके डेटा सेट के लिए बेस्ट रहता है देखिए जब आप यहां पे टू डायमेंशन डेटा सेट के ऊपर काम कर रहे हैं मतलब आपके पास दो इनपुट है और एक आउटपुट है यहां पे तब आप यहां पे उसका परफेक्टली ग्राफ बना सकते हैं क्योंकि हमारा टू डायमेंशन ग्राफ बनता है राइट यदि आप थ डायमेंशन के ऊपर जाएंगे तो हां कैसे भी करके हम थ्री डायमेंशन ग्राफ भी बना लेंगे लेकिन जब आप हायर डायमेंशन के ऊपर जाते हैं यहां पे तो हायर डायमेंशन के ऊपर हम ग्राफिकली विजुलाइजेशंस नहीं कर पाते हैं तो उस वक्त हमें क्या करना पड़ता है हमें ये कर्नल जो है कैसे अप्लाई कर पाएंगे तो वहां पे आपको अलग-अलग कर्नल आपको अप्लाई करने हैं और चेक करना है कि आपके डेटा सेट के लिए कौन से कर्नल बेस्ट रहने वाले हैं आपके जो कर्नल बेस्ट रहेंगे दैट उसको आपको परफे करना है कनल का बेसिक मीनिंग यहां पे बोलूं तो बस आप कुछ नहीं कर रहे हैं कि जो आपका x1 और और x2 पॉइंट जो आपके डेटा पॉइंट ले रहे थे इन दोनों को हम क्या कर रहे हैं कन्वर्जन कर रहे हैं कन्वर्जन कैसे कर रहे हैं इन फार्मूला की जरह से तो हम क्या कर रहे हैं दो नए फीचर बना रहे हैं आप इस तरह से मान लीजिए या तीन नए फीचर बना रहे हैं जैसे x1 * x2 का एक फीचर बना लिया x1 का होल स्क्वायर का एक फीचर बना लिया राइट एक नए फीचर बना रहे हैं ताकि आपके जो डाटा है वो पॉलिनो मियल को भी फॉलो कर सके हे एवरीवन वंस अगेन वेलकम टू ड कपटेक माय सेल्फ कर और आज के इस वीडियो के जरिए हम यहां पर बात करने वाले हैं सपोर्ट वेक्टर मशीन मशीन के बारे में कि इसके प्रैक्टिकल को किस तरह से किया जाता है राइट मतलब हमारे पास डाटा सेट आता है तो उसके ऊपर हम सपोर्ट वेक्टर मशीन कैसे लगा सकते हैं इसके अंदर हम कर्नल कैसे-कैसे लगा सकते हैं उनके बारे में डिटेल के साथ समझने वाले हैं तो चलिए जरा अब इसे देखते हैं मेरे पास यहां पे क्या करा है एक प्लेसमेंट डेटा सेट पड़ा है यहां पे अब ये प्लेसमेंट डेटा सेट क्या है तो आप लोग यूज थ्रू होंगे यदि आप मेरी रेगुलर वीडियो देख रहे हैं यहां पे तो उसके अंदर आपको मैंने बता रखा है कि दैट अ प्लेसमेंट डाटा जिसके अंदर आपके पास क्या है किसी पर्सन का प्लेसमेंट हुआ या नहीं हुआ उसके रिकॉर्डिंग आपके पास डेटा सेट है मतलब एक आपके पास मान सकते हैं कि कॉलेज का डेटा सेट है इस कॉलेज के डेटा सेट के अंदर देखें तो आपका पा क्या दे रखा है सीजीपीए दे रखा है मतलब किसी पर्सन का सीजीपीए दे रखा है और उसी पर्सन का आपके पास क्या दे रखा है स्कोर दे रखा है मतलब स्कोर मतलब कोई टेस्ट हुआ है यहां पे उसका स्कोर दे रखा है और उसके बेसिस पे उस पर्सन का प्लेसमेंट हुआ या नहीं हुआ इसके रिकॉर्डिंग हमें डटा दे रखा है राइट तो हम क्या करेंगे इस डेटा सेट के ऊपर क्या करेंगे हम हमारा एसवीएम अप्लाई करेंगे और एसवीएम के थ्रू हम इसके प्रोडक्शन करने की कोशिश करेंगे राइट कि मतलब कोई भी नया बंदा आता है वो अपना सीजीपी देता है अपना स्कोर देता है तो उसके बेसिस पे उसका प्लेसमेंट होता है या नहीं होता है ट्स वो चेक करते हैं ठीक है तो चलिए ले चलता हूं मैं आपको जुपिटर नोटबुक परर वहां पे हम क्या करें एक नई नोटबुक बना लेते हैं ठीक है अभी हम फिलहाल कर्नल को इस्तेमाल नहीं करेंगे हम सिंपल एसवीएम को अप्लाई करेंगे देन फिर हम क्या करेंगे इसके अंदर कर्नर को इस्तेमाल करेंगे और इसके लिए हम एक नया डाटा सेट लेंगे जो कि पॉलिनो फीचर को फॉलो करता होगा ठीक है तो उसके ऊपर भी हम ट्राई करके देखेंगे चलिए तो इसके लिए मुझे सबसे पहले जो रिक्वायर्ड लाइब्रेरी है उससे मैं इंपोर्ट कर लेता हूं दैट इज माय सबसे पहले फर्स्ट रिक्वायर्ड लाइब्रेरी पांडा पांडा अज ऑफ मैं यहां पे पीडी लूंगा देन द सेकंड रिक्वायर्ड लाइब्रेरी इज द मैट प्लॉट लिप तो मैं यहां पे मैट पल लिप डॉट यहां पर पवा प्लॉट को मैं यहां पे लेने वाला हूं राइट मेट्रो पीवा प्लॉट एलियाज ऑफ मैं पीएटी लेने वाला हूं एंड देन मैं यहां पे इंपोर्ट करने वाला हूं किसे सीवन को राइट सीवन एलियास ऑफ एसएनएस राइट और इसके अलावा मुझे यहां पे और ग्राफ बनाना पड़ेगा मतलब डिसीजन बाउंड्रीज बनानी पड़ेगी तो इसके लिए मैं क्या कर रहा हूं यहां पे आपके पास फ्रॉम चल रहा हूं यहां पे एमएल एक्सटेंट के अंदर राइट एमएल एक्सटें के अंदर जाने के बाद डॉट यहां पर आपके पास आता है प्लॉटिंग राइट तो मैं प्लॉटिंग लूंगा अब दो बार एमएल एक्सीडेंट आ चुका है तो एक बार के लिए हम इसे हटा देते हैं यहां पे राइट तो चलिए हमने प्लॉटिंग ले ली प्लॉटिंग लेने के बाद ट मैं इंपोर्ट करने वाला हूं यहां पे किसे इंपोर्ट करना है प्लॉट डिसीजन रीजन को ताकि हम हमारा ग्राफ बना सके राइट तो मैं यहां पे प्लॉट डिसीजन रीजन ले लेता हूं फिलहाल ये नहीं आ रहा है एक बार फिर से ट्राई करते हैं ओके तो प्लॉट डिसीजन रीजन को ले लेता हूं तो प्लॉट डिसीजन रीजन हमारा आ चुका है चलिए हमारा सारा जो है यहां पे मॉड्यूल इंपोर्ट हो चुका है अब मैं क्या कर रहा हूं डेटा सेट लोड करता हूं यहां पे पडी सीएवी के हेल्प से और यहां पे जो मेरी सीएसवी फाइल है वो सीएसवी फाइल का नाम है प्लेमें सवी तो मैं यहां पे प्लेमें सीएवी को ले रहा हूं यहां पे ओके एंड उसके बाद हम इसे रन करते हैं एंड डेटा सेट के ऊपर चलते हैं और डॉट हैड लगाते हुए इसके स्टार्टिंग के तीन डाटा को देख लेते हैं कि डाटा का फॉर्मेशन क्या है नाम क्या है कॉलम का वगैरह का ठीक है अब हम क्या करें इस डाटा सेट में पहले नल वैल्यू को फाइंड आउट कर लेते हैं नल वैल्यू है या नहीं है बाकी मुझे दिख रहा है यहां पे इनकोडिंग करने की जरूरत नहीं है स्केलिंग करने की भी जरूरत नहीं है सिर्फ हमें नल वैल्यू को देखना है नल वैल्यू है या नहीं है बस सिंपल सा तो उसके लिए मैं करूंगा यहां पे डेटा सेट के पास जाऊंगा डॉट मैं यहां पे क्या करूंगा इस नल को मैं कॉल करूंगा यहां पे और डॉट मैं यहां पे सम को कॉल करूंगा रन करता हूं तो मुझे फिलहाल यहां पे कोई नल वैल्यू प्रेजेंट देखने को नहीं मिलती है इसका मतलब हम आगे बढ़ सकते हैं तो फिलहाल मैं इसे कट कर लेता हूं अब यहां पे ग्राफ बना के देखते हैं कि क्या ये लीनियर सेपरेबल डाटा है या नॉन ली सेपरेबल डाटा है चलिए देख लेते हैं तो उसके लिए एए डॉट मैं क्या करूंगा यहां पे स्केटर प्लॉट बनाऊंगा अब देखिए हमारा जो डेटा सेट है यहां पे वो बहुत छोटा है राइट दो ही कॉलम है और एक आउटपुट है यहां पे तो बेसिकली इसका ग्राफ बन जाएगा लेकिन यदि आपके पास ज्यादा डाटा हुआ तो हम ग्राफ नहीं बना पाएंगे तो फिर उस केसेस में हमारा काम क्या होगा उस केसेस में हमें हेट एंड ट्रायल मेथड्स प जाना पड़ेगा हमें हमारे डेटा सेट के ऊपर ट्राई करना पड़ेगा कि लीनियर अप्लाई होगा या नॉन लिनियली एसपीएम अप्लाई होगा राइट चलिए तो मैं y = टू में चलता हूं यहां पे और स्कोरिंग में चलता हूं एंड स्कोर में चलने के बाद में देन यहां पर मैं अपना डेटा देता हूं और डाटा इज इक्वल टू मैं क्या कर रहा हूं डेटा सेट दे देता हूं उसके बाद में मैं अपना ह्यू पैरामीटर देता हूं और ह्यू पैरामीटर्स के अंदर मैं अपना प्लेसमेंट जो है प्लेस जो है वो दे देता हूं और ग्राफ को देखने के लिए मैं पीएटी डॉट क्या करूंगा यहां पे शो फंक्शन को कॉल करूंगा एंड देन रन करता हूं तो यस मेरा डाटा लीनियर सेपरेबल मुझे दिख रहा है यहां से एक परफेक्ट लाइन पास आउट हो सकती है जो कि आपका प्लेस ऑन अन पलेस को अलग-अलग कर सकती है तो बेसिकली ये परफेक्ट है यहां पे चलिए अब हम क्या करते हैं गाइ यहां पे अ इसको मैं ग्राफ को छोटा कर देता हूं पहले तो राइट ताकि हमारे लिए प्रॉब्लम ना करे आगे चलते हुए तो पीएटी डॉट हम क्या करेंगे इसके लिए फिगर का इस्तेमाल करेंगे यस पीडी डॉट मैं करने वाला हूं फिगर का इस्तेमाल कर रहा हूं और फिगर के अंदर मुझे क्या करना है यहां पे फिक्स साइज लेना है और फिक्स साइज के अंदर 43 का ग्राफ बना लेते हैं राइट एक छोटा सा ग्राफ बना लेते हैं ताकि थोड़ा सा हमें आराम से पता चल सके डटा सेट के बारे में चलिए अब हम क्या कर कर रहे हैं हमारे डेटा सेट को इनपुट आउटपुट के अंदर अलग अलग करते हैं मतलब डिफरेंशिएबल हमारे जो डेटा सेट है इसमें डिपेंडेंट और इंडिपेंडेंट वेरिएबल को अलग-अलग कर लेते हैं चलिए इसके लिए डेटा सेट के पास चलते हैं डॉट यहां पर मैं आलग का इस्तेमाल करूंगा ओके सारी नंबर ऑफ रो लूंगा और सारे नंबर ऑफ कॉलम लूंगा लेकिन -1 को छोड़ दूंगा मतलब आपका जो सबसे पीछे है उसको छोड़ दूंगा तो देखिए मेरा x एक्सेस का जो डाटा है वो बाहर आ गया एंड y एक्सिस के बारे में बात करें यहां पे तो डे सर के पास चलते हैं एंड देन मैं यहां पे प्लेस जो है यहां पे राइट जो प्लेस हुआ है यहां पे उनको अलग कर लेता हूं तो x एक्सिस और y एक्सिस का मेरे पास यहां पे अलग-अलग हो चुका है अब हमें क्या करना है यहां पे गाइ फ्रॉम साइकल के अंदर चलता है डॉट यहां पे क्या करना है मॉडल सिलेक्शन को लेना है एंड ये क्यों कर रहे हैं क्योंकि हमारे डटा सेट को ट्रेन और टेस्ट के अंदर स्प्लिटिंग कर रहे हैं राइट चलिए इंपोर्ट करते हैं यहां पे इंपोर्ट करते हैं यहां पे और इंपोर्ट करते हैं किसे ट्रेन और टेस्टक के अंदर स्प्लिटिंग करते हैं राइट ओके चलिए डटा सेट को स्प्लिटिंग कर लेते हैं तो मैं x यहां पे क्या कर रहा हूं ट्रेन नाम से एक वेरिएबल बना रहा हूं यहां पे एंड उसके बाद मैं x अंड टेस्ट के नाम से एक वेरिएबल बना रहा हूं y अंडरस्कोर मैं यहां पे ट्रेन के नाम से एक रिबल बना रहा हूं और y अंडरस्कोर मैं टेस्ट के नाम से एक रिबल बना रहा हूं और ट्रेन टेस्ट स्प्लिटिंग मॉडल को ले रहा हूं यहां पे मतलब आपके पास यहां टेस्ट क्लास को ले रहा हूं यहां पे जिसके अंदर x और y का डाटा दूंगा यहां पे और उसके बाद में मेरे पास क्या आएगा टेस्ट साइज आएगी तो टेस्ट साइज कर देता हूं 0.22 एंड रैंडम स्टेट ले लेता हूं दैट अ 42 राइट दैट इज अ 42 ओके चलिए रन करते हैं तो हमारा डाटा यहां पे स्प्लिट हो चुका है अब हमारा जो डाटा है वो स्प्लिटिंग हो चुका है एंड नेक्स्ट अब हम बात करते हैं यहां पे कि एसवीएम कैसे अप्लाई होगा तो इसके लिए मैं क्या कर रहा हूं यहां पे फ्रॉम मैं साइकल एन के अंदर चलने वाला हूं डॉट यहां पे मैं क्या कर रहा हूं एसवीएम को कॉल कर रहा हूं तो मेरा एसपीएम आ चुका है एसपीएम को कॉल करने के बाद डॉट अब हमारा जो डाटा है वो किस तरह का है क्लासिफिकेशन का है या रिग्रेशन का है तो हमारा जो डाटा है वो क्लासिफिकेशन का है क्योंकि मुझे पता चल रहा है जीरो और वन है यहां पे तो इसके लिए आपके पास क्या होता है एसवीसी होता है राइट इसके लिए आपके पास क्या होता है एसवीसी सपोर्ट वेक्टर क्लासिफाइज करना पड़ेगा चलिए सपोर्ट वेक्टर क्लासिफाई माल है एंड देन अब मैं क्या कर रहा हूं यहां पे एसवी के नाम से एक ऑब्जेक्ट बना रहा हूं यहां पे ताकि मैं एसवीसी को कॉल कर सकूं एंड इसका इस्तेमाल कर सकूं अब देखिए एवी डॉट हमें क्या करना है मॉडल को फिट करना है राइट एवी डॉट हमें क्या करना है मॉडल को फिट करना है फिट करने के लिए मै अ ट्रेन एंड y ट्रेन का इस्तेमाल करूंगा अब देखिए ये जो एसवीसी है इस एसवीसी को जब हम ओपन करते हैं तो इसके अंदर बहुत सारी चीजें देखने को मिलती है जैसे कि आपके पास यहां पे कर्नल देखने को मिलता है राइट जिसके बारे में हम बात कर रहे थे अभी कर्नल जो चलता है वो आरबीएफ चल रहा है यहां पे इस आरबीएफ को आप चेंज कर सकते हैं फिलहाल देखिए यहां पे थोड़ा सा नीचे चलेंगे आप यहां पे तो कर्नल के अंदर आपके पास बहुत सारे कर्नल्स हैं देखिए आरबीएफ है लीनियर है पॉलिनो मियल है सिग्मो इड है पंक्चुएट है राइट तो बेसिकली अभी इस चीज के लिए मतलब इस डेटा सेट के लिए मुझे लगता है लीनियर एसवीएम सबसे बेस्ट रहेगा लीनियर लाइन मेरे लिए बेस्ट रहेगी तो मैं यहां पे क्या करने वाला हूं गाइज यहां पे कर्नल का इस्तेमाल करूंगा और कर्नल के अंदर मैं लीनियर को इस्तेमाल करने वाला हूं राइट एंड रन करते हैं तो हमारे पास क्या हुआ कर्नल लीनियर अप्लाई हो चुका है यहां पे इस डेटा टा साइट के ऊपर और ये परफेक्टली आपका डिवाइड कर चुका होगा चलिए अब मैं यहां पे चेक कर लेता हूं कि इस मॉडल का स्कोर क्या रहा होगा तो एवी डॉट मैं यहां पे स्कोर की बात करूं इसके अंदर मैं x टेस्ट एंड y टेस्ट को अप्लाई करता हूं और मल्टीप्लाई बाय 100 कर देता हूं और रन करता हूं बिल्कुल 100% डाटा जो है वो सेपरेबल हो चुका है अच्छा चेक कर लेते हैं कि क्या मेरा डाटा सही तरीके से सेपरेबल हुआ है या नहीं हुआ तो या फिर ओवरफिटिंग तो नहीं चला गया तो इसके लिए मैं एड स्कोर का चेक करूंगा यहां पे इसके लिए x ट्र एंड y ट्रेन का इस्तेमाल करूंगा और मल्टीप्लाई बा 100 कर दूंगा ओके 97 पर आपका ट्रेनिंग का आ रहा है और 100% स्कोर आ रहा है आपके टेस्टिंग का इसका मतलब कहीं ना कहीं कुछ ना कुछ मिस्टेक्स हुई है क्योंकि ट्रेनिंग और टेस्टिंग की एक्यूरेसी लगभग बराबर आनी चाहिए और टेस्टिंग की एक्यूरेसी ज्यादा नहीं आनी चाहिए राइट तो बेसिकली हमारा रैंडम स्टेट के अंदर कहीं ना कहीं मिस्टेक हुई है इसको जरा चेक कर लेते हैं तो रैंडम स्टेट के अंदर जो वैल्यू है इसको थोड़ा चेंज करें 10 करें और इसे दोबारा मैं ट्रेन करूं या अभी तक कोई फर्क नहीं पड़ा रैंडम स्टेट की वैल्यू से तो मैं काम करता हूं इसके अंदर मैं 20 करके चेक कर लेता हूं य एक बार यस 20 करके चेक किया इसके अंदर भी कुछ फर्क नहीं पड़ा है यहां पे एंड फाइव करके एक बार रन करके चेक कर लेते हैं यस फाइव से भी कोई ज्यादा फर्क नहीं पड़ रहा है यहां पे एंड मैं यहां पे 15 करके चेक करूं यहां पे राइट तो 15 से फर्क पड़ा है और 15 से हमारा मॉडल थोड़ा सा ओवर फिटिंग जरूर हो गया यहां पे लेकिन हां परफेक्टली काम जरूर हुआ है ये आपके पास यहां पे अंडर फिटिंग पे भी नहीं गया एंड देन आपके पास सही काम कर रहा है राइट तो बेसिकली हमारा मॉडल जो है वो सही काम कर रहा है अब यहां पे देख लेते हैं कि ये सेपरेबल हुआ कैसे होगा मतलब लीनियर सेपरेबल किया है तो लाइन कैसे बनी होगी किस तरह सेपरेबल हुआ होगा उसको जरा देख लेते हैं यहां पे उसके लिए हमने यहां पे देखिए क्या कर रखा है प्लॉट डिसीजन रीजन को बुला रखा है यहां पे राइट जो हमारा एमएल एक्स मॉड्यूल है इसके अंदर हमने प्लॉट डिसीजन डिजन लिया है यहां पे जिसके थ्रू ये आपके पास क्या करर है डिफरेंशिएबल क्या मांग रहा है आपके पास यहां पे एक्स एक्सस का डाटा वा एक्सिस का डाटा एंड सीएलएफ सीएलएफ का मतलब आपका मॉडल चलिए तीनों चीजें पास ऑन कर देते हैं सबसे पहले एक्स एक्सस का डाटा एक्स का टा x के अंदर ही है लेकिन ये आपके पास एरे की फॉर्मेट में जाता है तो मैं 2 अंडर नपाई का इस्तेमाल करूंगा इसके लिए एंड वा एक्सिस के डटा के लिए बात करूं तो y एक्सिस के लिए मैं क्या करूंगा यहां पे टू नपाई का इस्तेमाल करूंगा यहां पे और सीएलएफ की बात करूं यहां पे तो सीएलएफ के अंदर मैं एस भी डाल रहा हूं यहां पे राइट इस ग्राफ को देखने के लिए मैं पीएटी डॉट क्या करूंगा यहां पे शो फंक्शन को कॉल करूंगा और रन करूंगा चलिए देखते हैं ओके इसने बहुत ही परफेक्टली लाइन को सेपरेबल किया है यहां पे लेकिन इसके अंदर आप देखेंगे तो कुछ मिस क्लासिफिकेशन हुई है यहां पे जैसे कि आप देखिए यहां पे ये जो ब्लू कलर के डेट पॉइंट्स आप देख रहे हैं ये कुछ इधर चले जा चुके हैं और कुछ पॉइंट्स आपके पास इधर भी आ चुके हैं राइट तो बेसिकली ये परफेक्टली सेपरेबल नहीं हो पाया लीनियर की वजह से इसी वजह से हमें हमारी जो एक्यूरेसी है वो भी हमें कम देखने को मिली है हमारी जो एक्यूरेसी है वो भी हमें क्या देखने को मिली है कम देखने को मिली है तो दैट इज व्हाई आपने कलन कौन सा लिया है लीनियर लिया है इस लीनियर की वजह से ये जो लाइन है वो आपका लीनियर सेपरेबल हुई है यदि मैं अपने कर्नल को चेंज करूं यस यदि मैं अपने कनर को चेंज करूं तो कर्नर को चेंज करने से मेरी ये जो लाइन है वो आपकी डिफरेंशिएबल आपकी अलग-अलग चलेगी चलिए देखते हैं कैसे तो मैं सबसे पहले कर्नल में जाऊंगा कर्नल के अंदर हमारे पास बहुत सारे कर्नल्स पड़े हैं यहां पे तो मैं एक-एक करके कर्नल सारे अप्लाई करके देखूंगा कि इसमें सबसे बेस्ट कौन रह रहा है तो लीनियर हमारा इतना बेस्ट नहीं है यहां पे ठीक है तो मैं पॉलिनो देखता हूं यहां पे पॉलिनो मिल क्या इफेक्ट करता है यहां पे पॉलिनो मियल से एक्यूरेसी में आपके पास फर्क आया यहां पे ओके और यदि मैं अपने डेटा सेट के अंदर देखूं तो यस देखिए इसने अपना कर्वेचर जो है वो मोड़ लिया यहां पे लेकिन इतना परफेक्टली इसे सेपरेबल अभी भी इसने नहीं किया तो पॉलिनो मियल हमारा बेस्ट नहीं है यहां पे आरबीएफ के लिए ट्राई करें यहां पे तो मैं आरबीएफ लगा लेता हूं यहां पे आरबीएफ से हमारी मॉडल की एक्यूरेसी वापस वहीं यहां पे आ गई है और आरबीएफ के अंदर देखें तो यस आरबीएफ ने देखिए अपना एक एरिया बनाने की कोशिश की है यहां पे परफेक्टली लेकिन वो परफेक्टली अभी भी एरिया नहीं बन पाया है तो आरबीएफ में ने भी कुछ अच्छा काम नहीं किया यहां पे हम चेक कर लेते हैं सिगमॉड के बारे में ठीक है तो सिगमॉड के यदि मैं रन करूं यहां पे और सिगमॉड वाला ग्राफ्ट देखूं मैं यहां पे तो देखिए सिगमॉड ने तो बिल्कुल ही परफेक्टली सेपरेबल नहीं कर पाए यहां पे ओके एक्यूरेसी बहुत देखिए बहुत ही लो आ चुकी है 40 और 52 इट्स अ वेरी वेरी लो एक्यूरेसी इसी तरह से यदि मैं यहां पे बात करूं तो प्रीक स् से भी आप ट्राई कर सकते हैं लेकिन आप देख सकते हैं कि आपके मॉडल की एक्यूरेसी किससे अच्छी आ रही है आप उस तरह से ले सकते हैं जैसे कि मुझे जो लग रहा है यहां पे तो लीनियर के कंपेरटिवली पॉलिनो मियल अच्छा काम कर रहा है या मुझे यहां पे लीनियर ही बेस्ट लग रहा है तो मैं बेसिकली लीनियर लेके यहां पे ट्राई करूंगा और लीनियर से अच्छा काम कर रहे हैं यहां पे तो ये तो था डाटा हमारा लीनियर सेपरेबल जिसके अंदर हमने लीनियर सेपरेबल किया और काफी अच्छी एकस मिली है लेकिन इन केस यदि हमारा डाटा लीनियर सेपरेबल ना हो परफेक्टली तो हमारे पास क्या होगा जस्ट लाइक हमारे पास ये पॉलीनोट क्लासिफिकेशन नाम का एक डेटा सेट है राइट इसके अंदर जो डेटा देख रहे हैं आप यहां पे इसके अंदर डेटा वन और डटा टू के नाम से डेटा सेट पढ़ा है और एक आउटपुट पड़ा है यहां पे और इस डटा का इस डाटा सेट का जो फॉर्मेशन है यदि आप देखेंगे तो ये आपका लीनियर सेपरेबल नहीं है ये ट्स अ पॉलिनो सेपरेबल यहां पर है तो फिर ऐसे केसेस में हम क्या करेंगे तो चलिए इसको भी देख लेते हैं यहां पे तो मैं बस इसे प्लेसमेंट ड सीएसवी को हटा दूंगा यहां पे और मैं यहां पे क्या करूंगा जो पॉलिनो वाला है ना यहां पे उसको ले आऊंगा तो मैं पॉलिनो जो टा क्लासिफिकेशन है उसको लि आऊंगा यहां पे सेम पेसस पे और हमारा जो डटा वन है डेटा टू आपके से आ गया अब सेम पसेस पे मैं क रहा हूं यहां पे सी को हटा रहा हूं और डेटा वन और डेटा टू को यहां पे रिप्लेस कर रहा हूं ओके एंड देन आउटपुट को यहां पे लगा रहा हूं मतलब सेम चीज पे सेम काम कर रहा हूं ताकि आपको डेटा सेट डिफरेंट डेटा सेट के ऊपर कैसे काम करना है वो भी समझ में आ जाए रन करते हैं अब आप इस डटा को देखिए यहां पे आपका डाटा लीनियर सेपरेबल नहीं करा जा सकता क्यों नहीं करा जा सकता आप खुद देख लीजिए यहां पे कि ये जो शेप है वो ला लाइक अ मून शेप है यहां पे इस तरह से कर्वेचर बन रहा है तो बेसिकली यहां पे मुझे इस तरह से पॉलिनो कर्वेचर ही वर्क करेगा यहां पे सही तरीके से तो बेसिकली हम यहां पे वो काम तो नहीं कर सकते अब मैं एक काम करता हूं यहां पे आपके पास इस डाटा सेट के ऊपर काम करते हैं चेक करते हैं कि कैसे हमारा डाटा स्प्लिटिंग होगा राइट तो कैसे हमारा डाटा स्प्लिटिंग होने वाला है तो देखिए एक्स एक्सिस का डाटा हमारे पास आ गया है और हमारा y एक्सिस का भी डाटा सेट आ गया है यहां पे ट्रेन टेस्ट के अंदर स्प्लिटिंग कर लेते हैं लीनियर रिग्रेशन लगा रखा है यहां पे एसपीसी कर रखा है लीनियर टी के थ्रू हमने यहां पे सेपरेबल कर रखा है स्कोर चेक कर लेते हैं 80 पर स्कोर है और 86 पर आपका टेस्टिंग का स्कोर है ट्रेनिंग का स्कोर है चलिए उसके बाद में अब यहां पे प्लॉट डिसीजन डिजन को करते हैं प्लॉट डिसीजन रीजन ने एक लाइन बना के दी है और जो कि मिस क्लासिफिकेशन बहुत ज्यादा कर रही है राइट अब यहां पे दूसरा ट्राई करते हैं जस्ट लाइक हम यहां पे ट्राई करते हैं किसका पॉलिनो मियल का पॉलिनो मियल के थ्रू हम क्या करते हैं इससे वर्क करते हैं 70 पर एक्यूरेसी आई है पॉलिनो मियल के थ्रू इतनी ज्यादा अच्छी नहीं आई एक्यूरेसी यहां पे एंड रन करें तो बिल्कुल इसने पॉलिनो ने तो बिल्कुल भी मतलब अच्छी तरीके से यहां पे स्प्लिटिंग नहीं करी है राइट आरवीएफ के थ्रू एक बार ट्राई करके देख लेते हैं यस आरबीएफ के थ्रू एक बार ट्राई करें यहां पे तो आरबीएफ के अंदर 85 एक्यूरेसी आई है 95 एक्यूरेसी आई है ओके बहुत अच्छी एक्यूरेसी आई है तो आरबीएफ मुझे लगता है सही तरीके से क्लासिफाई करखा और बिल्कुल आरबीएफ ने काफी अच्छा क्लासिफाई कर रखा है लीनियर के कंपेरटिवली यस लीनियर के कंपली काफी अच्छे तरीके से क्लासिफाई करर है हां इसमें हालांकि कुछ मैथस क्लासिफिकेशन है यहां पे जो कि इसके हाइपर पैरामीटर ट्यूनिंग करके इसे और अच्छा बनाया जा सकता है लेकिन काफी अच्छा तरीके से वर्क करता है अच्छा एक बार सिगमॉड को भी ट्राई कर लेते हैं राइट तो मैं सिगम के अंदर देखूं सिगम अच्छी एक्यूरेसी नहीं दे रहा है कुछ ज्यादा राइट लेकिन इस बार एक बार इसका आउटपुट देख लेते हैं या सिम अच्छी एक्यूरेसी नहीं दे रहा है और ये अच्छी तरीके से क्लासिफाई भी नहीं करा है देखिए पच कमिट को मैं इसलिए अप्लाई नहीं कर रहा हूं क्योंकि मेरा जो डाटा है यहां पे वो आपका स्पर्स मैट्रिक्स नहीं है अब स्पार्क्स मैट्रिक्स का मतलब बेसिकली गाइ बात करें यहां पे तो आपका जो डाटा है यहां पे इसमें जीरो व नहीं है क्योंकि देखिए जब आप पंच कस को यहां पे इस्तेमाल करेंगे देखिए मैं यहां पे पंच कमिटेड को इस्तेमाल करूं यहां पे तो ये आपको बोलता है कि पंच कमेट मैट्रिक्स मस्ट बी स्पर्स मैट्रिक्स स्पर्ट्स मैट्रिक्स का बेसिक मतलब यहां पे ये है सिंपल सा गाइस यहां पे कि आपके पास जो डेटा सेट है यहां पे उसके अंदर ज्यादातर जो कॉलम है आपके पास जीरो और वन से ही होना चाहिए था यस जितने हो सके कॉलम आपका 0 व से फिल हो तभी आप इस्तेमाल कर सकते हैं मतलब आपने क्या किया आपने एक डेटा सेट लिया जिसके अंदर आपने वन हट एन कोडिंग लगा रखी है सब जगह पे तो वन हट एन कोडिंग क्या करता है 01 01 क्या फॉर्मेट में चेंजेज करता है तो वहां पे आप यहां पे प्री कमिटेड का इस्तेमाल कर सकते हैं अदर वाइज आपके पास यहां पे और भी कर्नल्स है आप उनका इस्तेमाल कीजिए और डटा सेट को स्प्लेश कीजिए फिलहाल इस डाटा सेट के लिए बात करें यहां पे तो आरबीएफ कर्नल जो है वो सबसे बेस्ट है और सही तरीके से क्लासिफाई इसे कर रहा है और आज के इस वीडियो के जरिए हम बात करेंगे सपोर्ट वेक्टर मशीन के बारे में इन अ रिग्रेशन एनालिसिस अब देखिए सपोर्ट वेक्टर मशीन का इस्तेमाल रिग्रेशन क्लासि दोनों के अंदर करते हैं हमने ये जाना एंड सपोर्ट वेक्टर मशीन किस तरह से आपके पास यहां पे काम करती है यह भी हमने डिस्कस किया था यदि आपको python-tk के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं लेकिन इन द फॉर्म ऑफ रिग्रेशन एनालिसिस ये कैसे वर्क करती है दैट इज अ वेरी वेरी इंपोर्टेंट चीज देखिए सपोर्ट वेक्टर मशीन यदि आप रिग्रेशन के अंदर इस्तेमाल करने जा रहे हैं तो इस वक्त क्या करते हैं गाइज यहां पे कि आपके पास ये जो डेटा पॉइंट्स आप देख रहे हैं जस लाइक आप रिग्रेशन डेटा पॉइंट देख रहे हैं यहां पे तो इसके अंदर क्या करते हैं कि ये आप क्या करते हैं डिसीजन बाउंड्रीज आपकी डिसाइड की जाती है लेट्स सपोज मान लीजिए ये आपका x एक्सिस है और इस तरफ आपका y एक्सिस है यहां पे तो ये क्या करता है यहां पे सिंपल लीनियर लाइन को यहां पे बनाता है जिसके थ्रू आप क्या क्या कर सकते हैं आप प्रेडिक्शन कर सकते हैं यहां पे राइट तो ये क्या करते हैं बाहर के जो सबसे बाहर के जो पॉइंट है यहां पे देखिए जब हमने क्लासि एनालिसिस को देखा था तो क्लासि एनालिसिस के अंदर हम क्या करते थे कि जो हमारे डेटा पॉइंट है यहां पे उन डेटा पॉइंट्स के अंदर यदि आपका सेपरेबल है यस आप क्या कर रहे थे सेपरेबल करने जा रहे थे तो सेपरेबल करते वक्त आपने क्या करा था कि भई आप इन दो डेटा पॉइंट को सेपरेबल कर रहे हैं लीनियर सेपरेबल कर रहे हैं तो आप क्या करते हैं दो डेटा पॉइंट को ढूंढते हैं कौन से वाले डेटा पॉइंट को ढूंढते हैं आप यहां पे दो आपके पास यहां पे कौन से अंदर वाले डेटा पॉइंट को मतलब जो आपके पास इनसाइड है आपके पास यहां पे इन डेटा पॉइंट को ढूंढते हैं और इनके बीच की जो डिस्टेंस आप देख पा रहे हैं यहां पे ये डिस्टेंस आपके क्या करता है मैक्सिमम सर्च करने की कोशिश करते हैं ताकि ये दोनों सेपरेबल हो जाए आपके पास डाटा और आप आराम से क्लासिफाई कर सके राइट जबकि रिग्रेशन के अंदर आपके पास यहां पे रिवर्स हो जाता है रिग्रेशन एनालिसिस के अंदर आप क्या करते हैं कि आप क्या करते हैं कि आपका जो डेटा पॉइंट है लेट्स सपोज आपके पास मैं बात करूं यहां पे तो आपके डेटा पॉइंट कुछ इस तरह के फॉर्मेशन के अंदर चल रहे हैं यहां पे राइट इस तरह के फॉर्मेशन के अंदर आपके डेटा पॉइंट चल रहे हैं तो ये क्या करते हैं गाइज यहां पे कि आप अपने जो मैक्सिमम बाहर वाले जो पॉइंट है ना इनको आप ढूंढते हैं यस इन दो पॉइंट को ढूंढते हैं यहां पे और इनके ऊपर क्या करते हैं आप यहां पे आप अपने हाइपो प्लेंस को बनाते हैं मतलब आप अपने डिसीजन बाउंड्रीज बनाते हैं यहां पे राइट और ये जो डिस्टेंस d आपके ता है इस d का डिवाइड बाटू मतलब आपके जो डिस्टेंस d है इसका एकदम मिडल से आप क्या करते हैं एक लाइन पास आउट करते हैं जो कि होती है आपकी प्रेडिक्शन लाइन अब मैं यहां पे बात करना चाहूं यहां पे कि ये जो प्रेडिक्शन लाइन बन रही है इसके लिए जो हमने ये दो डेटा पॉइंट चूज किए हैं ये दो टा पॉइंट इस तरह से यूज़ किया जाता है कि ये जो डी होता है ये डी ये आपका क्या होना चाहिए मिनिमम होना चाहिए जितना मिनिमम होना है चा जितना मिनिमम हो उतना मिनिमम होना चाहिए अब इसके अंदर एक प्रॉब्लम ये आती है यहां पे कि जब आप इसे मिनिमम लेने की कोशिश करते हैं तो कुछ डेटा पॉइंट आपके पास होते हैं वो इसके बाहर चले जाता है मतलब फार चले जाते हैं तो बेसिकली ये उसे आउटलायर कंसीडर करता है और यहां पे जो प्रोडक्शन लाइन बनती है वो प्रोडक्शन लाइन आपके पास कुछ इस तरह से यहां पे बनती है अब ये प्रोडक्शन लाइन आप सिंपल लीनियर डिग्रेशन की हेल्प से भी निकाल सकते हैं लेकिन सपोर्ट वेक्टर मशीन के अंदर आप क्या कर सकते हैं कि यदि आपका डेटा सेट नॉन लीनियर टी के फॉर्मेट के अंदर है तब भी आप इसका इस्तेमाल करके काम में ले सकते हैं मतलब आपका डाटा यदि पॉलीनोट फीचर के अंदर है तब भी आप सपोर्ट वेक्टर मशीन का इस्तेमाल करते हुए आप अपने डेटा सेट के अंदर प्रेडिक्शन कर सकते हैं अब जरा यहां पे देखते हैं कि ये प्रोडक्शन करता कैसे है तो देखिए मेरे पास यहां पे क्या है एक प्लेसमेंट ड सीएसवी के नाम से एक डेटा सेट है जो कि आपके पास क्या करता है कि किसी भी पर्टिकुलर सीजीए पे किसी भी पर्टिकुलर पर्सन का कितना पैकेज लगा है यहां पे उस चीज को ये प्रेडिक्शन करके देता है मतलब आपका सीजी पे दे रखा है उसके बाद आपका पैकेज क्या लगने वाला है दैट्ची रिक्वायर पड़ेगी तो मैं इंपोर्ट करूंगा यहां पे पांडा की अ पांडा लेस ऑफ पीडी की एंड देन नेक्स्ट मुझे यहां पे ग्राफ बनाना है तो मैं यहां पे इंपोर्ट करूंगा किसे मैट प्लॉट लिप को एंड ट प्लॉट लिप डॉट यहां पर मैं क्या करूंगा पीवा प्लॉट का इस्तेमाल करूंगा एलियास ऑफ क्या करने वाला हूं पीएटी का इस्तेमाल करने वाला हूं इसके साथ-साथ मैं इंपोर्ट करूंगा किसे यहां पे सी बन को ताकि हम यहां पे स्केटर प्लॉट्स वगैरह बना सके एडवांस ग्र बना सके तो सीब एलेस ऑफ एनएस का इस्तेमाल करने वाला हूं राइट चलिए अब हम क्या करते हैं गाइज यहां पे हम हमारे डेटा सेट को लोड करते हैं तो डटा सेट के नाम से वेरिएबल बनाया पीडी डॉट यहां पर मैं बात करूंगा ड सीएवी का और इसके अंदर मुझे मेरे डेटा सेट की जरूरत पड़ेगी तो ये रहा मेरा प्लेसमेंट सवी डटा सेट इसके ऊपर मैं क्लिक करूंगा एंड क्लिक करने के बाद देखिए कॉपी एज अ पाथ मुझे यहां पे दिख रहा है मैं इसे सेलेक्ट कर लूंगा एंड देन मैं यहां पे क्या करूंगा पेस्ट कर दूंगा इसके बाद मैं यहां पे आर लगा दूंगा रिलेटिव पाथ बनाने के लिए एंड देन रन करेंगे तो हमारा डेटा सेट लोड हो चुका है अब देखिए यदि मैं अपने डेटा सेट को देखूं डॉट हैड लगाते हुए तीन डाटा को तो ये डाटा कुछ इस तरह से दिखता है चलिए इसका ग्राफ बना लेते हैं यहां पे अब पहले ग्राफ बनाने से पहले मिसिंग वैल्यू को चेक कर लेते हैं कि मिसिंग वैल्यू तो प्रेजेंट नहीं है या मिसिंग वैल्यू तो प्रेजेंट नहीं है तो देख लेते हैं डिजर सेट डॉट यहां पे मैं क्या करूंगा इज नल का मैं इस्तेमाल करूंगा और डॉट सम लगाते हुए मैं इसके अंदर मिसिंग कंटेंट को देखूंगा तो फिलहाल इसके अंदर कोई मिसिंग कंटेंट हमें नहीं देखने को मिला है चलिए अब हम क्या करते हैं इसका स्कडर प्लॉट बनाते हैं तो ए डॉट मैं क्या कर रहा हूं यहां पे स्केटर प्लॉट पे जाऊंगा स्केटर प्लॉट के अंदर एक्स एक्सेस के अंदर बात करूं यहां पे तो एक्स एक्सेस के अंदर मैं सीजी पे लूंगा एक् एक्सेस के अंदर मैं सीजी ब लूंगा और y एक्सेस के अंदर बात करें तो y एक्सेस के अंदर मैं क्या लेने वाला हूं पैकेज को लेने वाला हूं राइट और उसके बाद में हम हमारे डेटा को लेने वाले हैं और डटा इक्वल्स टू मैं करने वाला हूं गाइ यहां पे डेटा सेट को लेने वाला हूं उसके बाद मैं पीएटी डॉट यहां पर क्या करूंगा शो फंक्शन को कॉल करूंगा एंड रन करूंगा तो देखिए हमारा डाटा हमें कैसा दिखाई दे रहा है यहां पे लीनियर टी के फॉर्मेट में दिखाई दे रहा है बस हम इसी के ऊपर हमारा सपोर्ट वेक्टर मशीन लगाएंगे और देखेंगे कि किस तरह से ये प्रोडक्शन लाइन हमें बनाता है अब ये ग्राफ काफी बड़ा है यहां पे तो इसके लिए मैं क्या कर रहा हूं यहां पे पीएटी डॉट यहां पे फिगर के अंदर जाके मैं इसकी साइज जो है वो थोड़ी कम कर देता हूं तो पीएटी डॉट फिगर के अंदर चलता हूं फिगर के अंदर मैं फिक्स साइज के अंदर जाऊंगा जहां पे मैं इसकी साइज 4थ कर देता हूं मतलब एक स्मॉल साइज में कन्वर्जन कर लेता हूं चलिए उसके बाद हम क्या करते हैं हमारे डाटा को दो पार्ट के अंदर स्प्लिटिंग करते हैं ट्रेनिंग और टेस्टिंग के अंदर चलिए तो उसके लिए हम क्या करें यहां पे फ्रॉम साइकल के अंदर चलेंगे डॉट मैं यहां पे जाऊंगा मॉडल सिलेक्शन के अंदर मॉडल सिलेक्शन के अंदर जाने के बाद दैट मैं इंपोर्ट करूंगा किसे ट्रेन टस्ट स्प्लिटिंग को और इसके अंदर मैं इस्तेमाल करूंगा x मैं यहां पे इस्तेमाल करूंगा ट्रेन का मलब मुझे चार वेरिएबल बनाने पड़ेंगे x ट्रेन x टेस्ट y मैं यहां पे लूंगा ट्रेन एंड y अंडर मैं यहां पे लूंगा टेस्ट राइट और मैं लेने वाला हूं ट्रेन टेस्ट स्प्लिटिंग जिसके अंदर अब मुझे x एक्सेस और y एक्सेस का डटा पहले स्प्लिटिंग करना था जो कि मैंने नहीं किया था मतलब मैंने डिपेंडेंट और इंडिपेंडेंट फीचर कॉलर कल करना था जो कि मैंने नहीं किया लेकिन अब कर लेते हैं एक्स एक् का ड लेता हैं यहां पे और मैं यहां पे क्या करता हूं गाइ यहां पे सीजीपी को लेलेता हूं राइट किसको ले रहे हैं हम यहां पे सीजीपी को ले रहे हैं अब एक चीज का ध्यान रखिएगा कि जो भी आप डेटा सेट ले रहे हैं यहां पे वो आपका टू डायमेंशन होना चाहिए क्योंकि मशीन लर्निंग जो एल्गोरिथम होती है वो टू डायमेंशन डेटा सेट के ऊपर काम करती है तो बेसिकली टू डायमेंशन डेटा सेट की जरूरत पड़ेगी हमें यहां पे चलिए और मैं वा एक्सेस की बात करूं यहां पे तो मैं डेटा सेट के पास जाऊंगा एंड देन मैं यहां पे क्या करूंगा पैकेज को कॉल कर दूंगा तो ये मेरा x और y का डटा आ चुका है अब मैं यहां पे जो स्प्लिट है इस स्प्लिट के अंदर x और y दूंगा यहां पे इसके साथ-साथ मैं क्या करूंगा यहां पे टेस्ट साइज दूंगा टेस्ट साइज 0.2 20 दूंगा एंड रैंडम स्टेट की बात करें तो रैंडम स्टेट 42 देने वाला हूं रन करते हैं ट्रेन और टेस्ट के अंदर हमारा डाटा जो है वो स्प्लिटिंग हो चुका है अब मुझे यहां पे लगाना है एसवीएम एसवीएम लगाने के लिए हम क्या करते हैं फ्रॉम साइकल एन के अंदर चलते हैं यहां पे यस फ्रॉम क्या करने वाला है साइकल एन के अंदर चलते हैं डॉट साइकल एन के अंदर चलने के बाद मैं यहां पे कॉल कर रहा हूं एसवीएम को तो मैंने एसवीएम कॉल कर दिया उसके बाद यहां पर हमें कॉल करना है किसे एसवीआर को दैट इज अ सपोर्ट वेक्टर क्लासिफाई वो कैसा है आपके पास रिग्रेशन एनालिसिस का है आप जरा देखिए यहां पे आउटपुट कैसा है रिग्रेशन नेचर के अंदर है तो रिग्रेशन एनालिसिस का है इसलिए हम क्या कर रहे हैं एसवीआर को कॉल कर रहे हैं अब देखिए एसवी के नाम से मैं वेबल बना रहा हूं और एसवीआर के नाम से इसे कॉल कर रहा हूं यहां पे और उसके बाद में देखिए एवी डॉट मैं क्या कर रहा हूं मॉडल को क्या कर रहा हूं फिट कर रहा हूं फिट के अंदर मैं बात करूं यहां पे तो मैं x ट्रेन एंड y जो ट्रेन है यहां पे दैट वो पास कर रहा हूं अब इसे पास करने से पहले मैं एसवीआर जो हमारे पास है यहां पे इसे मैं ओपन करूंगा और इसमें कर्नल को देखूंगा तो कर्नल देखिए यहां पे कौन सा चल रहा है आरबीएफ चल रहा है यस कर्नल कौन सा चल रहा है आरबीएफ चल रहा है यदि मैं कर्नल की बात करूं तो मुझे लीनियर भी मिलेगा पॉलिनो मियल भी मिलेगा आरबीएफ भी मिलेगा और भी बहुत सारे कर्नल्स मिलेंगे तो मैं यहां पे ये सारे कर्नल्स को एक बार के लिए ले लेता हूं राइट एंड इसे रन कर लेते हैं अभी मैं बात करूं यहां पे कर्नल के बारे में तो मैं कर्नल कौन सा लेने वाला हूं गाइ यहां पे कर्नल मैं लीनियर लूंगा य अभी स्टार्टिंग में अभी क्या कर रहा हूं कलर मैं लीनियर ले रहा हूं और उसके बाद देखते हैं कि किस तरह से प्रोडक्शन होता है तो देखिए लीनियर कलर मैंने ले लिया यहां पे अब ए डॉट क्या कर रहा हूं यहां पे मॉडल के अंदर क्या कर रहा हूं यहां पे स्कोर चेक करूंगा तो स्कोर चेक करने के लिए मैं x अंड यहां पर टेस्ट एंड y अ टेस्ट को पास ऑन करूंगा और मल्टीप्लाई बाय क्या करने वाला हूं गाइज यहां पे 100 करने वाला हूं तो 77 पर स्कोर आया कोई अच्छा स्कोर नहीं है यहां पे फिलहाल ठीक है हमारे लिए ओके और स्कोर के अंदर चलते हैं और x ट्र और y ट्रीन का भी स्कोर चेक कर लेते हैं ताकि यह देख लेते हैं कि हमारा मॉडल जो है ओवर फिटिंग तो नहीं हुआ है इसे रन करते हैं तो बिल्कुल यह ओवर फिटिंग नहीं हुआ है सही तरीके से काम कर रहा है यहां पे अब एक काम करते हैं देखते हैं यहां पे ये प्रोडक्शन लाइन कैसे बनाता है राइट तो इसके लिए मुझे क्या करना पड़ेगा गाइज यहां पे तो ये स्केटर प्लॉट तो मुझे जरूरत पड़ेगी ही पड़ेगी यस तो मैं इस स्केटर प्लॉट को नीचे ले लेता हूं अब मुझे बड़ा स्केटर प्लॉट बनाना है तो बेसिकली मुझे यहां पे इस फिगर को हटाना पड़ेगा नेक्स्ट चीज मुझे प्रेडिक्शन लाइन बनानी है अब प्रेडिक्शन लाइन बनाने के लिए मैं क्या करूंगा यहां पे पीएटी डॉट यहां पे प्लॉट फंक्शन को कॉ पीएटी डॉट मैं करूंगा प्लॉट फंक्शन को कॉल करूंगा जो कि मेरे पास क्या करेगा मुझे लाइन बना के देगा एक्स एक्सेस के अंदर मैं बात करूं यहां पे तो मैं डेटा सेट के अंदर जाऊंगा यहां पे यस मैं क्या करूंगा यहां पे डाटा सेट के अंदर जाऊंगा और डाटा सेट के अंदर जाने के बाद इसके अंदर क्या करूंगा मैं सीजी पे कॉल कर लूंगा और रही बात y एक्सिस की तो y एक्सिस के लिए हमें क्या करना पड़ेगा कि जो एवी है एवी डॉट यहां पर आपके पास क्या मिलेगा आपको प्रिडिक्ट फंक्शन मिलेगा इस प्रिडिक्ट फंक्शन के अंदर जाके मुझे क्या करना पड़ेगा मुझे मेरा x पास करना पड़ेगा मतलब मेरा जो x एक्सिस मैंने जो डिफरेंशिएबल लाइन बना के देगा राइट एंड इसके साथ-साथ यदि मैं बात करूं यहां पे तो मुझे क्या चाहिए यहां पे कलर डालना पड़ेगा इसके अंदर तो मैं यहां पे करूंगा कलर डालूंगा और कलर इक्वल्स टू क्या कर देता हूं रेड कर देता हूं एंड रन करते हैं तो देखिए इसने इस इस तरह से मुझे एक प्रोडक्शन लाइन बना के दी है और ये काफी सही प्रोडक्शन लाइन बना के भी दी है मुझे यहां पे देखने को मिल रहा है तो इसका मतलब क्या है ये सही प्रोडक्शन तो कर रहा है यहां पे अब नेक्स्ट टारगेट यहां पे ये आता है गाइ यहां पे यदि य मेरा डाटा यहां पे पॉलीनोट होता तो क्या होता और यदि मैं यहां पे लीनियर टी की जगह पॉलिनो मियल लगा देता तो क्या फर्क पड़ता तो देखिए मैं पॉलिनो लगाता हूं और एक बार ट्राई करता हूं पॉलीनोट के बेसिस पे ओके पॉलिनो के बेसिस पे प्रोडक्शन करने की कोशिश करता हूं तो मेरी एक्यूरेसी जो है वो आपके पास काफी डाउनग्रेड हो गई है और मैं यहां पे देखूं तो यस मेरी एक्यूरेसी काफी डाउनग्रेड हो गई है 77 से 73 आ गई है और मैं लाइन को ग्राफ बनाऊं तो देखिए लाइन कुछ इस तरह से बनती है ये लाइन देख पा रहे हैं आपके पास यहां पे एक पॉलीनोट बनने के लिए हो रही है यहां पे राइट तो ये क्या कर रहा है पॉलीमर लाइन बन रहा है इसको एक सही तरीके से बनाने के लिए मैं एक काम करता हूं यहां पे इसका स्केटर प्लॉट बना देता हूं राइट क्या करता है स्केटर प्लॉट बना देता है ताकि एक प्रोडक्शन पॉइंट मिल यहां पे तो देखिए प्रोडक्शन पॉइंट क्या कर रहा है एक पॉलिनो लाइन बनाने के लिए कर रहा है यहां पे अच्छा इस पॉलिनो के अंदर आपके पास क्या मिलती है आपको डिग्री मिलती है देन डिग्री इज इक्वल टू क्या है आपके पास थ है इस डिग्री को आप चेंज कर सकते हैं जैसे डिग्री = 3 को डिग्री इल टू मैं यहां पे सेवन करूं और फिर रन करूं तो डिग्री चेंज करने से आपके पास क्या होता है गाइज यहां पे ये पॉलिनॉमियल जो लाइन है वो आपकी चेंज होती रहती है राइट उसके थ्रू आपका प्रेडिक्शन काफी हद तक यदि आपका डाटा जो पॉलिनो मियल नेचर के अंदर है या फिर किसी और नेचर के अंदर है तो वहां पे भी वो क्या करेगा सही तरंग से प्रेडिक्शन करेगा तो इस तरह से ये आपका क्या करता है पॉलीनोट काम करता है इसी तरह से हम यहां पे आरबीएफ का भी इस्तेमाल कर सकते हैं तो मैं यहां पे देखिए आरबीएफ डालता हूं यहां पे और आरबीएफ डाल के मैं यहां पे रन करूं तो आरबीएफ से कुछ ज्यादा अच्छी एक्यूरेसी आई नहीं है यहां पे 75 और 78 एक्यूरेसी आई है और ओवर फिटिंग भी हो चुका है हमा मॉडल हमारा और एक बार डाटा को देखें तो देखिए कुछ इस तरह से प्रेडिक्शन कर रहा है और जो कि काफी रॉन्ग प्रेडिक्शन भी है यहां पे राइट अच्छा सिगम के लिए भी ट्राई कर लेते हैं एक बार यहां पे तो आप आरबीएफ की जगह आप अपना सिगम डाल सकते हैं और सिगम में तो ऑलरेडी आपका माइनस में जा चुकी है लाइन यहां पे बहुत ही गलत लाइन आई है तो इस तरह से आप यहां पर देख सकते हैं राइट चलिए ये तो हमारा था डाटा लीनियर सेपरेबल डटा मतलब ली ये था हमारा डाटा यहां पे लीनियर रिग्रेशन वाला डाटा यदि मेरा डाटा लीनियर रिग्रेशन ना हो तो क्या होगा तो देखिए मेरे पास एक डाटा सेट है जो कि पॉलिनो मियल फीचर को फॉलो करता है देर इज अ पॉलिनॉमियल ड सीएसपी यस इस डेटा सेट के अंदर यदि हम देखें यहां पे तो ये जो डेटा सेट है यहां पे ये पॉलीनोट नेचर को रखता है यहां पे अब जरा देख लेते हैं ये पॉलिनो नेचर को कैसे रखता है तो गाइ मैं इसी के अंदर आपका पॉलिनॉमियल नेचर वाला जो डेटा सेट है वो अप्लाई करूंगा यहां पे और सेम बेसिस पे हम काम करेंगे कि यदि हमारा डाटा पॉलिनॉमियल नेचर का है तो फिर उस वक्त हमारे पास क्या होगा उस वक्त हम कौन सा मॉडल यहां पे अप्लाई कर सकते हैं तो फिलहाल मैं एक काम करता हूं इस एड्रेस को मैं क्या करता हूं यहां से रिमूव कर लेता हूं और सेम बेज पे मैं वापस दूसरा एड्रेस डाल देता हूं जो कि ल डेटा सेट का है राइट एंड रन करें तो देखिए लेवल वर्सेस सैलरी है यहां पे अब मैं एक काम करता हूं यहां पे सीजीपी की जगह लेवल पास कर देता हूं और सैलरी की जगह पैकेज की जगह मैं सैलरी पास कर देता हूं राइट एंड रन करते हैं यहां पे दैट माय पॉलीमेल नेचर डाटा ओके अब मैं बात करूं यहां पे तो बेसिकली मुझे यहां पे क्या डालना पड़ेगा हां बेसिकली मुझे यहां पे आपके पास क्या करना पड़ेगा सैलरी डालनी पड़ेगी और इस जगह पे मुझे सीजीपी को हटा के क्या करना पड़ेगा लेवल डालना पड़ेगा तो मैं यहां पे क्या करता हूं लेवल डाल देता हूं और फिर हम इसे रन करते हैं x एक्सेस और एक्स के अंदर स्प्लिटिंग करते हैं यहां पे अ जस्ट अ मिस्टेक हो गई है यहां पे लेवल ओके तो लेवल ड देते हैं x एकस y एक्सेस के अंदर स्प्लिटिंग कर लेते हैं और इसे रन करते हैं और फिर से रन करते हैं और फिर से रन करते हैं और रन करते हैं ठीक है सिगम के लिए अप्लाई किया है और सिगम में तो ऑलरेडी नेगेटिव जा रहा है यहां पे अब इसके अंदर ग्राफ को चेंजेज करते हैं ग्राफ को चेंजेज करने के लिए मुझे क्या करना पड़ेगा लेवल ऑफ सैलरी डालनी पड़ेगी तो मैं एक काम करता हूं कि मेरे जो डेटा सेट है यहां पे उसके कॉलम्स को गेट कर लेता हूं टा सेटड कॉलम्स को लगाता हूं ताकि मुझे यहां पे कॉलम्स एक बार में मिल जाए यहां पे राइट तो कॉलम मुझे मिल गए यहां पे कौन-कौन से है लेवल और सैलरी है तो यहां पे भी लेवल और यहां पर मैं सैलरी डाल देता हूं और इस जगह पे भी मैं क्या करता हूं यहां पे गाइज लेवल डाल देता हूं और फिर रन करता हूं तो देखिए इसके अंदर ये स्ट्रेट लाइन बना रहा है यहां पे जो कि एक रॉन्ग प्रेडिक्शन है यहां पे ओके अब हम काम करते हैं यहां पे मुझे लगता है यहां पे पॉलीनोट बेस्ट आएगा तो मैं पॉलिनो मियल डालता हूं यहां पे और पॉलिनो एसपीएम को ट्राई करते हैं तो पॉलिनो ने भी नेगेटिव आंसर दिया है कुछ ज्यादा अच्छा आंसर नहीं दिया है यहां पे यस मैं एसआर में चलू और पॉलीमेल डालूं यहां पे कुछ अच्छा आंसर नहीं दे रहा है और ये भी हमें क्या कर रहा है रॉन्ग प्रेडिक्शन कर रहा है अच्छा इसके साथ-साथ यदि मैं लीनियर को डालूं यहां पे एक बार के लिए यस लीनियर टी को डालें तो लीनियर मुझे कुछ-कुछ ठीक-ठीक आंसर दे रहा है यहां पे और लीनियर ने कुछ-कुछ लाइन सही बनाई है इसकी जगह यदि मैं आरबीएफ डालूं यहां पे तो मैं आरबीएफ डालकर ट्राई कर सकता हूं यहां पे आरबीएफ भी नेगेटिव में चल रहा है यहां पे आरबीएफ भी कोई अच्छी सी लाइन यहां पर बना के नहीं दे रहा तो बेसिकली हमारा ये जो पॉलिनो मियल डाटा है इसके साथ तो ये परफेक्टली वर्क नहीं कर रहा है तो ऐसा नहीं है कि हर वक्त आपका सपोर्ट वेक्टर मशीन आपका वर्क करेगा हर किसी डटा सेट के ऊपर ठीक है ठीक है दैट्ची पेंड करेगा यदि आपके पास यहां पे ये वर्क करता है दैट्ची चर के अंदर कैसे कन्वर्ट करा जा सकता है और उसके बाद आप अपने प्रोडक्शन लाइन कैसे बना सकते हैं यूजिंग अ पॉलिनो फीचर ये भी समझाया हमने कब हमारे जो पुराने वाले वीडियो हैं जहां हमने लीनियर डिग्रेशन को समझा था वहीं पे हमने पॉलिनो मियल डिग्रेशन को भी समझा था तो वहां पे आप जाके इस चीज को समझ सकते हैं और इस चीज को कन्वर्जन कर सकते हैं तो आई थिंक आई होप सो समझ में आ चुका होगा कि ये किस तरह से वर्क करता है तो फिलहाल आज की वी के लिए बस हम इतना ही रखेंगे और बेसिकली गाइस बात करें तो इसके अंदर भी सेम कर्नल है हमने सेम कर्नल देखे लीनियर पॉलिनॉमियल आरबीएफ सिगमॉड सेम आज के इस वीडियो के जरिए हम बात करेंगे हाइपर पैरामीटर ट्यूनिंग के बारे में देखिए हाइपर पैरामीटर टनिंग पढ़ने से पहले हमें ये समझना पड़ेगा हाइपर पैरामीटर्स क्या होते हैं और हाइपर पैरामीटर्स पढ़ने से पहले हमें ये समझना पड़ेगा कि पैरामीटर्स क्या होते हैं बेसिकली आज हम तीन टर्म्स को क्लियर करने वाले हैं पहले हम बात करेंगे पैरामीटर्स के बारे में फिर हम बात हाइपर पैरामीटर्स के बारे में फिर हम बात करेंगे यहां पर ट्यूनिंग के बारे में कि हम इसे ट्यूनिंग कैसे कर सकते हैं राइट तो चलिए अब जरा यहां समझते हैं सबसे पहले हम बात करते हैं यहां पर पैरामीटर्स के बारे में देखिए मॉडल पैरामीटर्स क्या होते हैं इसको जरा समझने के लिए मैं एक छोटा सा एग्जांपल ले रहा हूं राइट आपने बहुत सारे एल्गोरिथम्स पढ़ी होगी और यदि नहीं पढ़ी है तो आप मेरे पुराने वाली जो वीडियो है उनको देख सकते हैं वहां पर मैंने मशीन लर्निंग की बहुत सारी एल्गोरिथम्स आपको स्टडी कराई है यहां से कोई भी एक एल्गोरिथम लेते हैं यहां पर जस्ट सपोज हम यहां पर लीनियर रिग्रेशन लेते हैं यस अब हम लीनियर रिग्रेशन को कंसीडर करें यहां पर तो लीनियर रिग्रेशन की एल्गोरिथम्स क्या होती है मतलब बेसिकली फार्मूला क्या होता है यहां पर तो लीनियर रिग्रेशन की एल्गोरिथम का फॉर्मूला यहां पर ये होता है y हैट = m एक + c मतलब बेसिकली गाइस हमारे पास इनपुट होता है हमारे पास हमारा आउटपुट होता है हम इस इनपुट और आउटपुट के बेसिस पे हम यहां पे क्या करते हैं m और c की बेस्ट वैल्यू फाइंड आउट करने की कोशिश करते हैं जिसकी हेल्प से हम क्या बनाते हैं एक प्रोडक्शन लाइन यहां पे डिजाइन करते हैं तो बेसिकली गाइज यहां पे मैं बात करूं कि ये जो लीनियर रिग्रेशन आपको दिख रहा है ये लीनियर रिग्रेशन की जो एल्गोरिथम दिख रही है इस एल्गोरिथम के अंदर हम क्या करते हैं m और c की वैल्यू फाइंड आउट करते हैं बेसिकली आप इसे क्या बोलते हैं कांस्टेंट या कफिट बोलते हैं अब ये जो एमओ स जो आप देख रहे हैं दैट इज़ कॉल्ड ऑफ़ मॉडल पैरामीटर ये क्या होता है आपके पास यहां पे मॉडल पैरामीटर कहते हैं ऐसे हर किसी एल्गोरिथम के अंदर अलग-अलग तरीके के क्या होते हैं मॉडल्स पैरामीटर होते हैं जो कि जब आप इनपुट और आउटपुट डाटा देते हैं यहां पर उसके बेसिस पे क्या होता हैं ये ट्रेंड्स होते हैं और जब भी आप प्रेडिक्शन करने के लिए जाएं तो इन्हीं मॉडल पैरामीटर की हेल्प से आपके पास आपका कोई भी डाटा प्रिडिक्ट किया जाता है तो बेसिकली गाइज बात करें कि आपका जो लीनियर रिग्रेशन एल्गोरिथम है इसके अंदर हमारे पास क्या है m और c क्या है हमारे पास क्या कहलाते हैं मॉडल्स के पैरामीटर्स कहलाते हैं यह हमारे मॉडल के पैरामीटर होते हैं जिनको हम क्या करते हैं यूज़ करते हैं प्रेडिक्शन के लिए तो यह होते हैं हमारे मॉडल के पैरामीटर्स अब आते हैं मॉडल के हाइपर पैरामीटर्स के बारे में अब देखिए जब कभी भी आपने अपने मॉडल को ट्रेन किया होगा यस मॉडल को फिट किया होगा या फिर जब भी आपने किसी मॉडल को कॉल किया होगा राइट तो कॉल करते वक्त आपने क्या देखा होगा कि उसके अंदर बहुत सारे पैरामीटर्स और भी होते हैं राइट जैसे मैं सिंपल से एग्जांपल की बात करूं तो दैट इज माय डिसीजन ट्री यस डिसीजन ट्री एल्गोरिथम को मैंने इस्तेमाल किया यहां पर तो डिसीजन ट्री एल्गोरिथम को जब मैं ओपन करूं ना यहां पर तो मुझे इतने सारे और भी डिफरेंट डिफरेंट टाइप के पैरामीटर्स देखने को मिलते हैं ये आपके पास क्या करते हैं मॉडल के हाइपर पैरामीटर्स होते हैं अब हम हाइपर पैरामीटर की ट्यूनिंग क्यों करते हैं जब भी आप अपने मॉडल को लगा रहे होते हैं यहां पर डिफॉल्ट तौर पे तो यहां पर कुछ वैल्यू डिफॉल्ट्स रखी होती है जैसे देखिए नन होती है एंट्रोपय कुछ यहां पर रखी हुई है दैट कॉल्ड डिफॉल्ट वैल्यू और ये सारी जो डिफॉल्ट वैल्यू आप यहां पर देख रहे हैं ये जितनी भी वैल्यू दिख र है जैसे क्लास वेट हो गया क्राइटेरियम हो गया मैक्स स्टप हो गया मैक्स फीचर हो गया मैफ हो गया यहां पर ठीक है मिनिमम इंप्योरिटी डिक्रीजिंग हो गया यहां पर ये सारे के सारे क्या है यहां पर ये आपके सारे के सारे मॉडल के हाइपर पैरामीटर्स हैं यहां पे अब हम इन हाइपर पैरामीटर को ट्यून करते हैं अब ट्यून करने का रीजन जानते हैं यहां पर लेट्स सपोज आपके पास कोई डेटा सेट है अब उस डेटा सेट के ऊपर आप ये मॉडल अप्लाई कर रहे हैं तो जरूरी नहीं है कि इस डेटा सेट के ऊपर जो भी आपने डेटा सेट लिया है उसके ऊपर जब आप मॉडल बनाते हैं हर मॉडल का जो पैटर्न होता है वो आपके पास क्या होता है अलग-अलग देखने को मिलता है हर मॉडल का नेचर भी अलग-अलग होता है तो बेसिकली ये जो आपके पास पैरामीटर्स होते हैं ये फ करके जाते हैं और इन पे जरूरी नहीं है कि आपको हर बार मॉडल की एक्यूरेसी बहुत ही ज्यादा हाई देखने को मिल जाए तो गाइस यहां पे क्या है कि ये कुछ पैरामीटर्स है जो कि डिफॉल्ट रखे हुए होते हैं हमें इसे क्या करना पड़ता है चेंज करना पड़ता है बेसिकली हम इसे क्या करते हैं ट्यून करते हैं जैसे कि स्टार्टिंग में मैं आपको एग्जांपल बता रहा था कि आप क्या करते हैं जब आप पुराने जमाने की टीवी को प्लग इन करते हैं तो जरूरी नहीं है कि आपके पास उसी वक्त हाथों हाथ ही आपके पास यहां पे अच्छी स्क्रीन देखने को मिल जाए नहीं आपके पास अच्छी स्किन देखने के लिए आप क्या करते हैं यहां पे उस रेगुलेटर को मूव करते हैं और ये ऐसा क्यों होता है क्योंकि डिपेंड करता है एरिया वा वाइज कि आपके एरिया के अंदर क्या फ्रीक्वेंसी आ रही है उस फ्रीक्वेंसी के ऊपर कौन सा चैनल है और वो चैनल किस तरह से दिखाई दे रहा है उसके ऊपर आपका डिपेंड करता है राइट सेम एज हमारे पास हमारे मॉडल के अंदर भी यही है कि जब आप यहां पे मॉडल को अप्लाई करते हैं यहां पर मतलब मॉडल बिल्ड करते हैं यहां पर तो कुछ डिफॉल्ट पैरामीटर्स होते हैं और उन डिफॉल्ट पैरामीटर्स पे हमारा मॉडल जो है वो ट्रेंड होता है अब जरूरी नहीं है कि ये जो डिफॉल्ट पैरामीटर्स पे हमारा मॉडल ट्रेंड हुआ है इस पे हमें अच्छी एक्यूरेसी दे नहीं ये अच्छी एक्यूरेसी नहीं दे सकता है तो बेसिकली ये जो हाइपर पैरामीटर्स आपको दिख रहे हैं यहां पे इनको हम क्या करते हैं चेंज करते हैं और जैसे-जैसे हम इनको चेंज करते हैं वैसे-वैसे हमारे मॉडल की एक्यूरेसी बढ़ सकती है अब मैं ऐसा नहीं कहूंगा कि गारंटी आपकी बढ़ेगी ही बढ़ेगी नहीं बढ़ भी सकती है और आपके पास कम भी हो सकती है मैं भी आपके पास उस समय मॉडल अच्छा काम कर रहा हूं और बाद में अच्छा काम नहीं कर रहा हूं ठीक है तो आपके पास ज्यादातर केसेस में ये देखने को मिला है कि जब आप इन हाइपर पैरामीटर को यहां पर मूव करते हैं तो आपकी मॉडल की एक्यूरेसी बढ़ जाती है एंड इसके साथ-साथ कभी मॉडल की एक्यूरेसी नहीं बढ़ती है तो उस समय आपके पास क्या करता है ये हाइपर पैरामीटर आपके पास क्या करते हैं मॉडल के अंदर जो ओवर फिटिंग आ जाता है उस ओवरफिटिंग को कम कर देते हैं तो बेसिकली इसके अंदर दो सिनेरियो है आपके पास क्या है पहला तो आपके पास क्या है इन हाइपर पैरामीटर की ट्यूनिंग से आपके पास मॉडल की एक्यूरेसी बढ़ जाती है दूसरा या तो फिर आपके पास ओवरफिटिंग कम हो जाता है और ये हाइपर पैरामीटर क्या होता है तो जब भी आप किसी एल्गोरिथम को इस्तेमाल करेंगे तो इसके अंदर ये इतने सारे हाइपर पैरामीटर्स होते हैं जिनको आप चेंज करके आप अपनी एक्यूरेसी को इंप्रूव कर सकते हैं अब ऐसा नहीं है कि हाइपर पैरामीटर हमें खुद मैनुअली चेंज करने पड़ेंगे नहीं आज के टाइम के अंदर मशीन लर्निंग के अंदर बहुत इन्वेंशन हो चुका है तो बेसिकली गाइज बात करें तो आप क्या जो साइकल एंड की लाइब्रेरी है इनके अंदर हमें दो ऐसे मेथड्स देखने को मिल जाते हैं जिनके थ्रू ये हाइपर पैरामीटर की ट्यूनिंग अपने आप हो जाती है जैसे सिंपल सी बात करें तो पहले के जमाने में हम क्या करते थे रेगुलेटर खुद मूव करते थे और उन रेगुलेटर को मूव करके हम एक परफेक्ट चैनल को फाइंड आउट करते थे कि यस ये परफेक्ट चैनल है और यहां पे क्लियर स्क्रीन आ रही है यहां पे लेकिन आज के जमाने की टीवी को यदि हम ऑब्जर्व करें तो वहां पे हमारे पास क्या आता है केवल और केवल रिमोट आता है हम केवल बटन दबाते हैं जो नंबर दबाते हैं उस नंबर पे वो स्क्रीन हमें डायरेक्टली क्लियर दिखने को मिल जाती है हमें यहां पे टवीन करने की जरूरत नहीं पड़ती है वैसे का वैसे साइकेड लन के अंदर बात करें तो साइकेड लन के अंदर भी इस हाइपर पैरामीटर को ट्यून करने के लिए मतलब इन हाइपर पैरामीटर की वैल्यू को चेंज करने के लिए जस्ट लाइक मुझे क्राइटेरिया चेंज करना है क्राइटेरियम के अंदर आप लोगों को पता होगा काटेरिन के अंदर बात करें तो काटेरिन के अंदर बहुत सारे आप पास क्राइटेरिया होता है जैसे एंट्रिप हो गया जीन इंडेक्स हो गया राइट ऐसे क्राइटेरिया आपको देखने को मिलते हैं तो आप इन काटेरिन को बैठ के मैनुअली खुद नहीं मूव करते हैं यहां पे राइट इनके लिए हम इस्तेमाल करते हैं हाइपर पैरामीटर ट्यूनिंग का अब ये हाइपर पैरामीटर ट्यूनिंग करने के लिए हमारे पास क्या होता है दो मेथड्स होते हैं अब वो दो मेथड कौन-कौन से हैं तो पहला मेथड है आपका ग्रेड स और दूसरा है रेंडमाइज सर्च सीवी इन दोनों में से किसी एक ही हेल्प से आप क्या कर सकते हैं आपके हाइपर मैने मट की ट्यूनिंग कर सकते हैं अब यह दोनों कैसे वर्क करते हैं इसको अब जरा थोड़ा डिटेल के साथ समझते हैं यहां पे लेट्स सबसे पहले हम बात करेंगे यहां पे ग्रेड सर्च सीवी के बारे में अभी ग्रेड सर्च सीवी कैसे काम करता है बेसिकली गाइज यहां पे ये क्या करता है ग्रिड बनाता है अब ये ग्रिड कैसे बनाता है इसे जरा ऑब्जर्व करते हैं यहां पे लेट्स सपोज मैं डिसीजन ट्री का ही इस्तेमाल कर रहा हूं यस मैं डीटी का इस्तेमाल कर रहा हूं और डीटी जो है आपके पास यहां पर बहुत सारे हाइपर पैरामीटर्स लेती है यहां पे राइट इसमें मैं बात कर लेता हूं कोई a नाम का एक हाइपर पैरामीटर लेती है और कोई b नाम का एक हाइपर पैरामीटर लेती है अब a के अंदर भी क्या हो सकता है गाइज यहां पर और भी बहुत सारे पैरामीटर्स हो सकते हैं जैसे मैं काइन की बात करूं तो काइट के अंदर क्या है हमारे दो काइन है यहां पे एक जन इंडेक्स है एक एंट्रोपय उस तरह से बात कर लेते हैं यहां पे भी तो मान लीजिए a और b आपका क्या है इसके हाइप पैरामीटर्स हैं b के अंदर मान लो मैक्स स्टेप की बात कर रहे हैं यहां पर तो मैक्स स्टेप वन मैक्स स्टेप टू मैक्स स्टेप थ्री इस तरह से मैक्स स्टेप हो सकती है तो मैं मान लेता हूं मैक्स स्टेप वन पे है टू है और थ्री है तो ये हमके पास क्या है ये दो हाइपर पैरामीटर है इनको हम ट्यून कर रहे हैं अब इन दोनों की हेल्प से हम ये समझेंगे कि ये ग्रिड स स भी कैसे काम करता है तो अब जरा यहां पर इसे देखते हैं डिटेल के साथ देखिए ग्रेड स सवी क्या करता है कि आपके जो भी हाइपर पैरामीटर्स हैं इनका क्या करता है ग्रिड्स बनाता है अब ये ग्रिड्स कैसे बनते हैं जरा देखें यहां पर तो ग्रिड्स कुछ इस तरह से बनते हैं जैसे मैंने क्या किया यहां पर आपके जो कॉलम एक्सेस है आपके दिख रहे हैं यहां पे इस कॉलम एक्सेस के अंदर मैंने क्या किया यहां पर ये जो मैक्स डप है इनकी वैल्यू रख दी जैसे मैक्स टप वन हो गया मैक्स डप टू हो गया मैक्स डप थ्री हो गया राइट इसी तरह से बात करें यहां पर तो आपके पास क्या है ये काटेरिन मान लीजिए a एक काटेरिन है ना तो इसके अंदर दो काटेरिन आ गए यहां पे a और b आ गया इस तरह से एक ग्रिड तैयार करता है यहां पर अब ये जो ग्रिड तैयार किया है इन ग्रिड के अंदर क्या करता है इनकी एक्यूरेसी निकालता है मतलब गाइज क्या है यहां पर देखिए ये जो dt50 पर dt2 क्या करता है ग्रेड स सवी एक-एक करके वैल्यू रखता है क्या रखता है यहां पर एक-एक करके वैल्यू जैसे a की वैल्यू इन्होंने a डिसाइड की और b की वैल्यू इन्होंने डिसाइड की वन राइट और इसके बेसिस पे यस इसके बेसिस पे एक्यूरेसी फाइंड आउट की जाती है लेट्स सपोज इसके बेसिस पे इसने जो एक्यूरेसी फाइंड आउट की है यहां पर वो मान लेते हैं यहां पर आपके पास 52 आई है राइट 52 पर आई है हो सकता है 52 पर आ सकती है यहां पर जै अब बात करते हैं यहां पर कि एक बार क्या करेगा यह a और रखा यहां पे वन रखा इस वन को हटा के यहां पे टू रखेगा लेट्स सपोज इस पे 72 पर आपके पास एक्यूरेसी आई है अब बात करते हैं a के बाद यहां पर थ्री रख सकता है यहां पर तो थ्री रखने पर आपके पास लेट्स सपोज मान लीजिए कि 42 आंसर आया यहां पर राइट हो सकता है कुछ भी आ सकता है यहां पर अब वापस बारी आ जाती है वन की और यहां से a चेंज होके क्या बन जाता है b बन जाता है अच्छा b1 पे बात करें तो b1 पे आपका पास लेट्स सपोज 62 पर आ सकता है अब बात करें हैं b2 के ऊपर यस मैं बात करूं b2 के ऊपर तो b2 के ऊपर आपके पास 92 आपके पास हो सकता है अब बात करते हैं b3 के ऊपर तो मैं b3 के ऊपर बात करूं तो दैट 85 पर आपके पास एक्यूरेसी आ सकती है तो ग्रिड स से भी क्या करता है एक-एक करके ट्राई करता है मतलब मैं बात करूं यहां पर तो ये a और b हो गया यहां पे व 2 और थ्री हो गया तो a का वन के साथ भी a का टू के साथ भी a का थ्री के साथ भी एक्यूरेसी निकालनी है b का वन के साथ b का टू के साथ और b का थ्री के साथ इन तीनों के साथ एक्यूरेसी निकालनी है अब आपके पास टोटल एक्यूरेसी बहुत सारी हो गई है यहां पे इन एक्यूरेसी के अंदर सबसे मैक्स एक्यूरेसी कौन सी है वो फाइंड आउट कर ली जाती है तो सबसे मैक्स एक्यूरेसी कौन सी दिख रही है यहां पर 92 देखने को मिल रही है और ये जो 92 पर आई है ये किस पे आई है गाइज यहां पर ये 92 आई है कि जब आप a की जो वैल्यू है वो b इस्तेमाल कर रहे हैं और जो b की वैल्यू है वो आपके पास टू इस्तेमाल करें हैं तब आपके पास यहां पे हाईएस्ट एक्यूरेसी मिली है तो ये जो पैरामीटर्स यहां पे इसने सर्च करके निकाले हैं यहां पे ये आपको दे दिए जाते हैं जिसकी हेल्प से आप अपने मॉडल को बेस्ट तरीके से ट्रेन कर सकते हैं आगे चलते हुए आप इन हाइपर पैरामीटर्स को यूज कर सकते हैं अपने मॉडल को बनाने के लिए और आप अपने मॉडल की जो एक्यूरेसी है वो यहां पर बढ़ा सकते हैं तो गाइ यह है आपके पास ग्रिड स सीवी का वर्किंग प्रोसेसर जहां पे आपने जो भी मॉडल के प्रोसेस दिए हैं वो प्रोसेस लेके आपके पास क्या करता है एक्यूरेसी फाइंड आउट करता है यहां पे और उनके अंदर जो सबसे मैक्स एक्यूरेसी होती है उस मैक्स एक्यूरेसी के ऊपर जो पैरामीटर्स यूज किए हैं यहां पे उन पैरामीटर्स की वैल्यू आपको यहां पर इंडिकेट कर देता है तो इस तरह से आपके पास क्या करता है ग्रेड सर सीवी वर्क करता है लेकिन ग्रेड स सीवी की एक आपके पास यहां पे लैक भी है यहां पर क्या लैक है यहां पर बेसिकली देखिए ग्रिड स सीवी के अंदर क्या है यदि आप यहां पर बहुत सारे हाइपर पैरामीटर्स एक साथ दे दें और यदि आपका डेटा साइज बहुत ज ज्यादा लार्ज है यहां पर तो उस वक्त आपके पास जो ग्रेड सीवी है वो बहुत ज्यादा स्लो वर्क करता है ये डेफिनेटली बात है यहां पर कि जितने ज्यादा आपके हाइपर पैरामीटर्स होंगे और जितना ज्यादा डाटा होगा आपका मॉडल उतना ही स्लो ट्रेंड होगा और उसमें एक्यूरेसी फाइंड आउट करने में उतना ही ज्यादा टाइम लगेगा क्योंकि जब भी आप यहां पे कोई भी हाइपर पैरामीटर का इस्तेमाल कर रहे हैं जैसे कि मैं यहां पे a1 का इस्तेमाल कर रहा हूं राइट तो a1 के ऊपर क्या हो रहा है मेरा पूरा का पूरा जो डेटा है यहां पर वो ट्रेंड हो रहा है राइट और उसके बाद में जब मैं a2 का इस्तेमाल कर रहा हूं यस मैं क्या कर रहा हूं यहां पर a2 का इस्तेमाल कर रहा हूं तो फिर से मेरा पूरा का पूरा डाटा यहां पर फिर से ट्रेंड हो रहा है तो मतलब गाइ यहां पर जब भी आप नया हाइपर पैरामीटर ये लेता है तो ये दोबारा पूरा मॉडल ट्रेन करता है पूरे डेटा सेट के ऊपर फिर से दोबारा ट्रेन करता है ऐसे करने से क्या होता है आपके मॉडल की जो स्पीड्स है वो थोड़ी कम हो जाती है मतलब बेसिकली गाइस बात करें आपके ट्रेनिंग की स्पीड बहुत ज्यादा लार्ज हो जाती है राइट तो ये ग्रिड से सीवी की बहुत बड़ी प्रॉब्लम है जब आप लार्ज टा इस्तेमाल कर ें हैं तब आप ग्रेड से सीवी को इस्तेमाल ना करें राइट अब इसके बाद में बात करें यहां पर तो अगला आता है यहां पर रेंडमाइज सर सीवी के बारे में तो ये रेंडमाइज सर सीवी कैसे काम करता है तो देखिए ग्रेड सर सीवी की तरह ही काम करता है लेकिन ये थोड़ा सा अलग हट के काम करता है कैसे जैसे देखिए अभी हमने क्या कया था कि भाई हमारे पास a और b दो पैरामीटर्स हैं a के अंदर आपके पास क्या है a है और b है अब बात करें b के अंदर बात करें तो वन टू और थ्री है टोटल आपके पास यहां पे कितने पेयर बनने चाहिए थे टोटल आपके पास यहां पे बहुत छह पेयर बनने चाहिए थे यहां पर जैसे a1 आपके पास पेयर बनना चाहिए था दूसरा मैं बात करूं a2 एक पेयर बनना चाहिए था उसके बाद यहां पर a3 एक पेयर बनना चाहिए था सेम एज मैं बात करूं यहां पर b1 एक पेयर बनना चाहिए था b2 एक पेयर बनना चाहिए था और b3 एक पेयर बनना चाहिए था तो ये टोटल सिक्स पेयर्स आपके पास बने चाहिए थे लेकिन रेंडमाइज सर सीवी ऐसा नहीं करता है रेंडमाइज सर्स सीवी के अंदर आप यहां पर अपनी नंबर ऑफ पेयर्स दे सकते हैं मतलब यहां पर आप सारे पेयर्स के ऊपर ट्रेन ना कराते हुए आप रैंडम किसी पेयर्स के ऊपर ट्रेन करवा सकते हैं अब इसके अंदर आपको सिंपल सा क्या करना है आपको बताना है कि कितने नंबर ऑफ पेयर्स के ऊपर ट्रेन करना है लेट्स सपोज मैं यहां पर डिसाइड कर रहा हूं कि मेरे पास यहां पर तीन पेयर्स के ऊपर काम होना चाहिए तो ये रेंडमाइज सर्स भी क्या करेगा यहां पर आपके पास इसमें से रेंडमल तीन पेयर्स निकालेगा जैसे कि एक पेयर ये निकाल लिया एक पेयर ये निकाल लिया और एक पे ये निकाल लिया अब यहां पर a2 b1 और b2 ये तीन रैंडम पेयर्स आपने यहां पे निकाले हैं इन तीनों की अलग-अलग तरीके से एक्यूरेसी फाइंड आउट की जाएगी जैसे कि मान लो इसकी 72 पर आई है यहां पर इसकी मान लो 75 पर आई है यहां पर इसकी मान लो यहां पर 80 पर आई है यहां पर अब इनमें से जो सबसे मैक्स एक्यूरेसी होगी जो कि आपके पास यहां पे मुझे दिख रही है b2 की है तो ये b2 आपको फाइंड आउट करके लाके दे देगा तो इस तरह से आपके क्या करता है यहां पर रैंडम सर्सी भी वर्क करता है तो ये ग्रिड सीवी से बड़ा हट के है यहां पर थोड़ा सा हट के हैं ग्रेट स सीवी की तरह आपके पास पूरे हाइपर पैरामीटर के ऊपर ट्रेन नहीं होता है यहां पर आपके पास यहां पर आप जितने हाइपर पैरामीटर्स बोलेंगे यहां पर यस जितने नंबर ऑफ हाइपर पैरामीटर देंगे उतने ही हाइपर पैरामीटर्स के ऊपर आपका ट्रेड होता है और मॉडल की एक्यूरेसी दी जाती है तो ये थोड़ा सा हट के है और बेसिकली ये ग्रिड स सीवी से थोड़ा सा फास्ट वर्किंग करता है क्योंकि यहां पर उतने नंबर ऑफ हाइपर पैरामीटर पे ट्रेन नहीं होती है आपके पास मिनिमम हाइपर पैरामीटर्स के ऊप ट्रेंड होती है अब इसकी एक लैक है यहां पर इसका क्या लैक है यहां पर जब आप यहां पे परफेक्ट सारे हाइपर पैरामीटर के ऊपर ट्रेन नहीं कर पा रहे हैं यहां पर कुछ पैरामीटर्स के ऊपर ट्रेन करा रहे हैं तो मे बी आपके पास कोई ऐसा हाइपर पैरामीटर हो जहां पे बहुत अच्छे एक्यूरेसी हो और ये उसे मिस कर सकता है तो इससे कभी-कभी आपके पास क्या होता है कि आपको वो बेस्ट हाइपर पैरामीटर नहीं मिलने के चांसेस भी होते हैं तो बेसिकली कुछ इसके अंदर भी लैक है और कुछ उसके अंदर भी लैक है ये बल्कि फास्ट है आपका सा ग्रेड्स सवी से रीजन उसका सिंपल सा है यहां पे ये है कि ये कम हाइपर पैरामीटर पे ट्रेंड होता है और रैंडम हाइपर पैरामीटर पे ट्रेंड होता है यहां पर तो बेसिकली ये थोड़ा उसके कंपैरेटिव फास्ट वर्किंग करता है यहां पर जबकि ग्रेड स सीवी आपका स्लो वर्किंग करता है लेकिन ग्रेड स सीवी में क्या फायदा है यहां पर ग्रेड स सीवी में हमें परफेक्ट एग्जैक्ट आंसर हमें देखने को मिलता है क्योंकि सारे हाइपर पैरामीटर ट्रेंस होते हैं यहां पर लेकिन रेंडमाइज सर्च सीवी के अंदर सारे हाइपर पैरामीटर ट्रेन नहीं होने की वजह से आपके पास क्या होता है यहां पर आपके पास जो हाईएस्ट एक्यूरेसी किसी एक दूसरे हाइपर पैरामीटर प आनी चाहिए थी वो हमें नहीं देखने को मिलती है तो ये दोनों में कुछ ना कुछ आपके पास लैक है हे एवरीवन वंस अगेन वेलकम टू स्कप टेक माय सल्फ गौरव और आज के इस वीडियो के जरिए हम बात करने वाले हैं हाइपर पैरामीटर ट्यूनिंग के बारे में देखिए लास्ट वाले वीडियो लेक्चर के अंदर हमने यह समझा था हाइपर पैरामीटर ट्यूनिंग किस तरह से वर्क करती है आज के इस वीडियो के जरिए हम एक डाटा सेट लेंगे और उसके ऊपर हाइपर पैरामीटर ट्यूनिंग अप्लाई करके देखेंगे कि ये कैसे वर्क करता है तो चलिए अभी ज जरा से समझते हैं यदि आपको पाइथन मशीन लर्निंग डेटा साइंस एंड डेटा एनालिसिस की फीड में अपने आपको को ग्रो करना है तो इसके लिए डब्लू कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं मैं आपको ले चलता हूं डेटा सेट के पास तो देखिए मेरे पास यहां पर क्या है पॉलिनॉमियल . सीएवी के नाम से एक डेटा सेट है जो कि आपके पास यहां पे कुछ इस तरह से दिखाई दे रहा है जिसके अंदर लेवल और सैलरी रखी गई है कि हर लेवल के ऊपर कितनी सैलरी होनी चाहिए वो कुछ यहां पर डिसाइड कर रखी है अब मुझे बेसिकली क्या करना है इस मॉडल को ट्रेन करना है और इस मॉडल को बनाना है बेसिकली तो इसके लिए मैं पहले क्या करूंगा मैं एक नॉर्मल मॉडल बनाऊंगा दैट अ डिसीजन ट्री नॉर्मल मॉडल बनाऊंगा उसके बाद में मैं इसको हाइपर पैरामीटर ट्यूनिंग से इसके क्या करूंगा अपग्रेड करूंगा मतलब बेसिकली इसकी एक्यूरेसी को इंप्रूव करने की कोशिश करूंगा तो चलिए अब जरा इसे परफॉर्म करते हैं तो इसके लिए मैं ले चलता हूं आपको जुपिटर नोटबुक के ऊपर जहां पे हम ये काम करने वाले हैं तो सबसे पहले मैं यहां पे जो रिक्वायर्ड लाइब्रेरी है उसे इंपोर्ट कर लेता हूं जब पांडा को इंपोर्ट कर लेता हूं पांडा ए ऑफ पीडी को उसके बाद हमारा जो डाटा सेट है उसे लोड कर लेते हैं यहां पर पड यहां पर _ सीएवी के हेल्प से एंड इसके बाद में मेरे पास जो डेटा सेट का नाम है ट्स अ पोमल सवी इसका मैं इस्तेमाल करने वाला हूं राइट तो मैंने पॉमल सीएवी को लोड कर लिया है और अपने डटा सेट को देखने के लिए टा सेटड हैड के अंदर तीन तीन डाटा का इस्तेमाल किया राइट अब देखिए यहां पर लेवल वर्सेस सैलरी हमें देखने को मिल र है अब हम क्या कर रहे हैं लेवल और सैलरी को अलग-अलग कर रहे हैं और ट्रेनिंग और टेस्टिंग को भी अलग-अलग करेंगे तो इसके लिए मैं क्या कर रहा हूं यहां पर बेसिकली हमारे इनपुट और आउटपुट पार्ट को अलग-अलग कर रहे हैं तो इसके लिए मैं क्या कर रहा हूं हमारे जो डेटा सेट है इसके पास जाऊंगा डॉट यहां पर मैं आलग का इस्तेमाल करूंगा सारी रो गेट करूंगा लेकिन मेरा जो लास्ट वाला कॉलम है उसे मैं छोड़ दूंगा एंड इसी तरह से मैं अपने डाटा सेट के पास दोबारा जाऊंगा एंड उसके बाद में मेरी जो सैलरी है उसे मैं यहां पर गेट कर लूंगा तो ये मेरा एक्स एक्सेस और वा एक्सेस का डाटा अलग-अलग हो चुका है अब मुझे क्या कर करना है मुझे मेरे डाटा को ट्रेन और टेस्ट के अंदर स्प्लिटिंग करना है तो इसके लिए मैं क्या करूंगा फ्रॉम साइकल के अंदर चलूंगा डॉट यहां जाने के बाद मैं दैट कहां जाने वाला हूं मैं गाइस यहां पर मॉडल सिलेक्शन के पास जाने वाला हूं क्योंकि मॉडल सिलेक्शन के अंदर हमें मिलने वाला है ट्रेन टेस्ट स्लिटिंग तो मैं क्या करने वाला हूं गाइ यहां पर ट्रेन टेस्ट स्प्लिटिंग को कॉल करूंगा जिसके थ्रू मेरा जो डाटा है वो चार पार्ट के अंदर टूटेगा ट्रेनिंग एंड टेस्टिंग के अंदर चलिए अब जरा इसे स्प्लिटिंग करते हैं तो इसके लिए मैं x अंडर यहां पर ट्रेन का इस्तेमाल करने वाला हूं एंड इसी तरह मैं x अ टेस्ट बनाऊंगा एंड इसी तरह से मैं y स्कोर मैं यहां पे ट्रेन का इस्तेमाल करूंगा एंड y अस् मैं टेस्ट बनाने वाला हूं एंड ट्रेन टेस्ट फ्लेटिंग नाम के जो क्लास है उसे मैं कॉल करूंगा यहां पर x को y का डाटा दूंगा उसके बाद में मैं यहां पर रैंडम स्टेट दूंगा दैट अ 42 एंड अब मैं यहां पे दूंगा हमारे पास टेस्टिंग साइज एंड टेस्टिंग साइज दे दूंगा 0.22 पर चलिए अब इसे रन कर देते हैं अब नेक्स्ट टारगेट क्या होगा गाइज यहां पे हमें हमारा मॉडल बनाना है देखिए इसके लिए कोई भी आप बेस मॉडल चूज कर सकते हैं जस्ट लाइक मैं बेस मॉडल ले रहा हूं यहां पर अ डिसीजन ट्री तो मैं यहां पर साइकन के अंदर जाके दैट ट्री को इंपोर्ट करूंगा एंड इंपोर्ट करने वाला हूं किसे यहां पर गाइज डिसीजन ट्री को तो मैं यहां पे डिसीजन ट्री को ले रहा हूं और रिग्रेस ले रहा हूं क्योंकि मेरी जो एनालिसिस है वो रिग्रेशन एनालिसिस यहां पर देखने को मिल रही है चलिए अब मैं क्या कर रहा हूं इसके ऊपर डीटी मॉडल बनाता हूं मतलब डिसीजन ट्री मॉडल बनाता हूं और देखता हूं क्या एक्यूरेसी आती है तो देखिए डिसीजन रिग्रेसर को कॉल कर रहे हैं टी डॉट यहां पे क्या कर रहे हैं मॉडल को फिटिंग कर रहे हैं यहां पर फिटिंग के अंदर x ट्रेन एंड y अ ट्रेन से इसे फिट कर रहे हैं एंड इसे रन करते हैं चलिए अब देखिए टी डॉट मैं क्या कर रहा हूं स्कोर देखता हूं यहां पर कि इस मॉडल का एक्यूरेसी कितनी निकल के आई है क्योंकि वहीं से पता चलेगा कि हमें हमारे मॉडल को इंप्रूव करना है या नहीं करना है तो देखिए यहां पर मैं ट्रेनिंग और टेस्टिंग दोनों की एक्यूरेसी चेक करूंगा वन बाय वन क्योंकि मुझे ये भी देखना है कि मेरा डाटा मेरा जो मॉडल है वो ओवरफिटिंग तो नहीं हो गया यदि एक्यूरेसी अच्छी मिल रही है लेकिन ओवर फिटिंग हो गया तब भी हमारे लिए प्रॉब्लम है तो इसके लिए x टेस्ट एंड y जो टेस्ट है मैं इसे लेने वाला हूं एंड मल्टीप्लाई बाय 100 करके इसके एक्यूरेसी खूंगा तो देखिए यहां पर मे एक्यूरेसी जो मिल रही है 100% मिल रही है और एक्यूरेसी 99 पर मिल रही है मतलब ओवर फिटिंग तो नहीं है हमारे बेस्ट फीड चल रहा है मॉडल यहां पर और अच्छी एक्यूरेसी भी आई है यहां पर अब मुझे नहीं लगता कि इसके अंदर हाइपर पैरामीटर ट्यूनिंग करने की जरूरत है लेकिन यदि आप चाहते हैं कि आपका ये जो मॉडल है वो ओवरफिटिंग से बिल्कुल म डिजाइन क्योंकि देखिए अभी भी देखेंगे तो आप यहां पर 1 पर की ओवरफिटिंग आप यहां पर आराम से देख पाएंगे यदि आप इसे हटाना चाहते हैं तो इसके लिए आप इस्तेमाल कर सकते हैं ग्रेड सर सवी का और रेंडमाइज सर सी का जिसके हेल्प से आप हाइपर पैरामीटर की ट्यूनिंग कर सकते हैं अब देखिए हाइपर पैरामीटर की ट्यूनिंग करने से पहले हाइपर पैरामीटर को समझते हैं तो देखिए डिसीजन टी रिग्रेसर है इसे जब आप ओपन करेंगे तो इसके अंदर बहुत सारे हाइपर पैरामीटर मिलेंगे जैसे देखिए सबसे पहले का इटेरियन मिला है उसके बाद स्प्लिटर मिला है उसके बाद आपको देखिए मैक्स मिला है तो ये सारे के सारे क्या है हमारे हाइपर पैरामीटर हैं जिनकी वैल्यू को आप चेंज करके अपने बेस्ट मॉडल को गेट कर सकते हैं अब ये हाइपर पैरामीटर कैसे वर्क करते हैं और किस तरह से हम इसका यूज़ करेंगे तो इसके लिए मैं ले चता हूं आपको साइकल लन के अंदर सबसे पहले और साइकल एन के अंदर आपको जाना है किसके अंदर मॉडल सिलेक्शन के अंदर मॉडल सिलेक्शन के अंदर आने के बाद दैट मैं इंपोर्ट करूंगा यहां पर किसे इंपोर्ट करना है तो आपको इंपोर्ट करना है ग्रेड सर्च सीवी एंड आप यहां पर इंपोर्ट भी कर सकते हैं रेंडमाइज सर्च सीवी का दोनों में से कोई भी आप ले सकते हैं जिसकी हेल्प से आपकी एक्यूरेसी इंप्रूव हो जाएगी या ओवरफिटिंग जो है वो कम हो जाएगा अब कैसे इस्तेमाल करेंगे तो देखिए जीडी के नाम से एक वेरिएबल बना लेता हूं और ग्रेड स सीवी जो है हमारा यहां पे इसे कॉल कर देता हूं अब देखिए ग्रेड स सीवी जब आप ओपन करते हैं तो सबसे पहले आपका मांगता है एस्टिमेटर मतलब आप अपना एस्टिमेटर दीजिए फिर मांगता है आपका पैरामीटर गिट्स अब ये पैरामीटर गिट्स का मतलब क्या है पैरामीटर गिट्स का मतलब है कि आप अपने पैरामीटर कौन-कौन से सेट करवाना चाहते हैं वो दीजिए आप यहां पर अब ये कैसे देना है तो डिक्शनरी और लिस्ट ऑफ डिक्शनरी या तो आप डिक्शनरी दे सकते हैं या लिस्ट ऑफ डिक्शनरी दे सकते हैं यहां पर यस इसके थ्रू आप अपने पैरामीटर्स देंगे तो चलिए पहले मैं पैरामीटर्स दे देता हूं यहां पर अब देखिए मैं क्या कर रहा हूं यहां पर d f के नाम से एक वेरिएबल बना रहा हूं यहां पर और एक डिक्शनरी तैयार कर रहा हूं इस डिक्शनरी के अंदर हम क्या करेंगे कि ये जो डिसीजन ट्री हम इस्तेमाल कर रहे हैं यहां पर इसके अंदर के जो पैरामीटर्स है वो यहां पर सेट करेंगे यस तो मैं यहां पे तीन पैरामीटर ले रहा हूं जैसे काटेरिन हो गया स्प्लिटर हो गया मैक्स डप हो गया इन तीन को जाके मैं सेट करने वाला हूं यहां पर चलिए तो मैं सबसे पहले चलता हूं यहां पर काटेरिन मैक्स डेप एंड आपके पास कौन सा है स्प्लिटर के ऊपर और य यहां पर अभी तक हमने पैरामीटर दिए नहीं है लेकिन उससे पहले मैं एक काम करता हूं कि जो हमारा डिसीजन ट्री है यस ये जो डिसीजन ट्री हमने यहां पे कॉल किया है यहां पर यस ये डिसीजन ट्री एज ए एस्टिमेटर पहले दे देते हैं ताकि हम यहां पर हमारे हाइपर पैरामीटर को चूज कर सके अब यहां पर देखेंगे तो आपके पास काटेरिन के अंदर देखेंगे तो काटेरिन के अंदर बहुत सारे आ पैरामीटर्स आ गए जैसे देखिए आपके पास यहां पे क्या है स्क्वायर एरर है f एमसी है एब्सलूट एरर है पॉइजन है यहां पर तो आप इनमें से कोई भी चूज कर सकते हैं तो मैं क्या कर रहा हूं इन सभी को चूज कर रहा हूं यहां पर और ये जितने भी मैंने चूज किए यहां पर इन सब को क्या कर रहा हूं एक लिस्ट के अंदर क्लोज कर देता हूं क्योंकि अभी हमने देखा था कि लिस्ट ऑफ डिक्शनरी की जरूरत हमें पड़ती है तो वो चीज मैं यहां पर दे देता हूं उसके बाद क्या है स्प्लिटर अब देखिए स्प्लिटर के अंदर मैंने बेस्ट स्प्लिटर चूज किया है स्प्लिटर और भी टाइप के होते हैं यहां पर देखिए बेस्ट होता है यहां पर रैंडम स्प्लिटर होता है तो आप दोनों को ले सकते हैं तो मैं यहां पे क्या कर रहा हूं इन दोनों स्प्लिटर को चूज करके रख रहा हूं यहां पर अब नेक्स्ट चीज है मैक्स डप मैक्स टैप की वैल्यू आप अपने अकॉर्डिंग चूज कर सकते हैं जितनी आप मैक्स टैप लेना चाहे उतनी ले सकते हैं यहां पर एक लिस्ट बना रहा हूं और लिस्ट के अंदर मैं इस्तेमाल करूंगा यहां लिस्ट कंप्रेंशन का तो फॉर आ इन क्या करने वाला हूं यहां पर रेंज लेने वाला हूं और रेंज के अंदर मैं क्या कर रहा हूं टू कॉमा आपके पास 20 स्टेप्स तक लूंगा अब ये जितना भी है ये डिक्शनरी के तौर पे जाएगा डाटा हमारे पास तो इसकी जगह इक्वल्स टू की जगह हम क्या लगाएंगे हमारे कॉलम्स को लगाते रहेंगे ताकि ये डिक्शनरी तैयार हो जाए चलिए ये डिक्शनरी तैयार हो गई है एक छोटी सी है काइन को एज ए स्ट्रिंग देना पड़ेगा स्प्लिटर भी एज ए स्ट्रिंग देना पड़ेगा और मैक्स टेप भी एज अ स्ट्रिंग देना पड़ेगा चलिए रन करते हैं तो ये हमारी डिक्शनरी तैयार हो चुकी है अब हमें क्या देना है पहले तो डिसीजन ट्री देना है उसके बाद में हमारे पास क्या है यहां पर पैरामीटर गेड्स है पैरामीटर गेड्स के अंदर जाके आप अपनी जो डिक्शनरी है वो पास करा दीजिए यहां पे एक और पैरामीटर है यहां पे सीवी सवी = टू क्रॉस वैलिडेशन क्रॉस वैलिडेशन का मतलब है कि इस ग्रेड स सीवी को आप कितने नंबर ऑफ़ टाइम तक रन करवाना चाहते हैं मतलब आपके देखिए ग्रेड स सीवी एक बार ही रन होगा लेकिन आप चाहते हैं कि नहीं ग्रेड स सीवी पांच बार ट्रेन होना चाहिए अलग-अलग तरीके से तो आप सीवी की वैल्यू रख सकते हैं अदर वाइज आप सीवी की वैल्यू हटा सकते हैं तो फिलहाल मैं अभी सवी की वैल्यू हटाऊ आ क्योंकि मुझे एक बार ही ट्रेन करना है इसलिए तो मैंने देखिए जीडी को ट्रेन कर दिया अब जीडी को अ जीडी को दे दिया यहां पर अब जीडी को क्या कर रहे हैं हम यहां पर ट्रेन कर रहे हैं तो जीडी को ट्रेन करने के लिए जीडी डॉट मैं करूंगा फिट का इस्तेमाल जहां पर मैं x ट्रेन एंड y ट्रेन मैं यहां पे देने वाला हूं रन करते हैं और यह हमारा मॉडल जो है वो ट्रेड हो रहा है यहां पर और इसका वेट करते हैं चलिए हमारा मॉडल ट्रेड हो गया है अलग-अलग आपके पास यहां पे क्राइटेरियम पे ट्रें हुआ है यहां पर देखिए इसके अंदर जो भी क्राइटेरियम है वो मुझे यहां पर दिखाई दे रहे हैं अब मैं चेक करता हूं कि जीडी हमें बेस्ट पैरामीटर कौन सा दे रहा है तो जीडी डॉट यहां पर मैं क्या करूं बेस्ट पैरामीटर्स की सर्च करूं यहां पर तो देखिए बेस्ट पैरामीटर्स आपको मिल जाएगा यहां पर और जैसे ही आप रन करेंगे तो यह बोर है स्क्वायर एरर लगानी है मैक्स स्टेप 10 लगाना है और स्प्लिटर आपको बेस्ट लगाना है इसके ऊपर आपकी एक्यूरेसी सबसे अच्छी मिलने वाली है या फिर आपका मॉडल ओवरफिटिंग से बच जाएगा तो चलिए एक-एक करके लगा के देखते हैं कि कैसे एक्यूरेसी आती है यहां पर तो सबसे पहले मैं स्क्वायर एर दूंगा चलिए ऊपर ही चलते हैं यहां पर अब डिसीजन ट्री हमारा ये रहा इस डिसीजन ट्री के अंदर हम क्या करें हैं सबसे पहले क्राइटेरियम डिसाइड करते हैं तो क्राइटेरियम के अंदर हमने क्या दिया यहां पर स्क्वायर एरर दे दिया उसके बाद नेक्स्ट क्या है गाइज यहां पर स्प्लिटर है स्प्लिटर हमारा कौन सा है बेस्ट स्प्लिटर की बात की गई है यहां पर तो देखिए मैं यहां पे क्या कर रहा हूं स्प्लिटर को कॉल कर रहा हूं और स्प्लिटर के अंदर मैं बेस्ट को इस्तेमाल कर रहा हूं उसके बाद है हमारी मैक्स टप मैक्स टप हमारे पास कितनी रि अ यहां पर सजेस्ट होका है ये मैक्स टप हमारी 10 सजेस्ट होगा ये चलिए एक बार इसे रन करते हैं और ये मैक्प 10 और इन सब पे ट्रेड हो चुका है और रन करेंगे तो देखिए एक्यूरेसी अभी भी वही आ रही है कोई ज्यादा फर्क नहीं मि को मिला है लेकिन हां यदि ये एक्यूरेसी कम होती इस पर्टिकुलर डेटा सेट के ऊपर एक्यूरेसी कम होती तो ये हमें क्या करता बेस्ट एक्यूरेसी निकाल के देता जैसे कि एक काम करते हैं यहां पर इस डिसीजन ट्रिक की जगह आप लीनियर रिग्रेशन का इस्तेमाल कर सकते हैं वहां पे एक्यूरेसी आपको कम देखने को मिल सकती है राइट तो बेसिकली गाइज यहां पर यदि आपको एक्यूरेसी कम मिले तो आप इस तरह से एक्यूरेसी बेस्ट गेट कर सकते हैं चलिए ये गेस्ट बेस्ट पैरामीटर्स आया इसी तरह से देखते हैं कि बेस्ट एक्यूरेसी कितनी आ रही है इस जीडी की तो मैं जीडी डॉट यहां पर क्या कर रहा हूं बेस्ट स्कोर को सर्च कर रहा हूं तो यदि मैं बेस्ट स्कोर को देखूं यहां पर तो बेस्ट स्कोर आ रहा है 99.99 3 ये आपको एक्यूरेसी देखने को मिलेगी यस ये किसकी आपकी यहां पर ट्रेनिंग और टेस्टिंग एक्यूरेसी 99.99 आपको देखने को मिलेगी अच्छा ऊपर देखें तो आपके पास ऑलमोस्ट उसके आसपास ही एक्यूरेसी हमें देखने को मिली है एक बार मैं फिर से क्या करता हूं रन कर लेता हूं दोनों को ऑलमोस्ट वही एक्यूरेसी मुझे दोबारा देखने को मिली है कोई ज्यादा फर्क देखने को नहीं मिला है लेकिन ग्रेड स सीवी कैसे काम करता है आई थिंक आई होप सो क्लियर समझ में आ गया होगा कि सबसे पहले आपको मॉडल सिलेक्शन करना है मॉडल सिलेक्शन में जाके ग्रेड स सवी को कॉल करना है और फिर अपना क्राइटेरियम यहां पर सेट कर लेना है फिर उसके बाद ग्रेड सर सवी को कॉल करना है और उसके बाद आप अपना बेस्ट पैरामीटर निकाल सकते हैं अब जान लेते हैं यहां पर कि ये रैंडम सर्च सीवी कैसे काम करता है तो इसके लिए मैं कर रहा हूं यहां पर रेंडमाइज सर सीवी को कॉल करता हूं इसके लिए क्या करता हूं गाइ यहां पर आरडी के नाम से एक वेरिएबल बना लेता हूं और ये जो रैंडम सर सीवी है इसे मैं कॉल कर कर देता हूं रेंडमाइज सर्च सीवी के अंदर भी आपके पास देखो सबसे पहले इसका एस्टिमेटर मांगा जाएगा फिर उसके बाद आपके पास है पैरामीटर्स और यहां पर एक नया फीचर देखने को मिलेगा ट्स एन हीटर एन हीटर का मतलब यहां पर बेसिकली गाइज ये है आप जो अपना डटा सेट ट्रेन करने जा रहे हैं इसके अंदर आप जो पैरामीटर्स यूज़ कर रहे हैं यस जो पैरामीटर यूज़ करें इनके बहुत सारे कॉमिनेशन बनने वाले हैं उन कॉमिनेशन में से आप कितने कॉमिनेशन को चूज करना चाहते हैं मतलब रैंडम कितने कॉमिनेशन को चूज करके आप अपना मॉडल बनाना चाहते हैं ये चीज आप डिसाइड कर सकते हैं तो बेसिकली एटर का इस्तेमाल आप यहां से इस तरह से कर सकते हैं तो चलिए करके देख हैं यहां पर तो सबसे पहले मैं क्या करता हूं डिसीजन टी रिग्रेसर को कॉल कर लेता हूं यहां पर अब देखिए इसमें भी है आपके पास क्या है पैरामीटर डिस्ट्रीब्यूशन पैरामीटर गेट पैरामीटर डिस्ट्रीब्यूशन सेम है यहां पर मैं डीएफ को लगा रहा हूं यहां पर और इसके अंदर एक पैरामीटर है आपके पास n नंबर ऑफ ईटर यस n नंबर ऑफ ईटर को लगा रहा हूं यहां पर और मैं बोलूंगा यहां पर ब ट्रेशन होने चाहिए यहां पर ये चीज लगा रहा हूं अब मैं क्या कर रहा हूं आडी डॉट मॉडल को क्या करेंगे हम यहां पर फिट करेंगे फिट के अंदर x ट्रेन एंड y अको ट्रेन मैं यहां पर देने वाला हूं और हम इसे रन करते हैं तो देखिए ये हमारा मॉडल जो है वो ट्रेन हो गया है यहां पर अब मैं रैंडम सर सीवी को देखूं तो दैट्ची है और क्राइटेरिया इने पॉइजन बताया अब ये आपके पास ग्रेड स सीवी से इतना डिफरेंट आंसर क्यों आया है क्योंकि यह रैंडम पिक अप कर रहा है आपके मॉडल को और वो भी कितने मॉडल को पिक अप कर रहा है गाइ यहां पर ओनली एंड ओनली 20 मॉडल्स को पिक अप कर रहा है यहां पे हालांकि बहुत ज्यादा मॉडल बनने वाला है देखिए नंबर ऑफ मॉडल कितने बनेंगे मैं आपको थोड़ा सा क्लियर कर दूं यहां पर तो देखिए ऊपर जो काइट यन है ये कितने आपके पास डटा है यहां पर 1 2 3 4 है आपके पास यहां पर तो फोर आपको ऊपर वाला देने वाला है देन आपके पास यहां पर स्प्लिटर के अंदर दो है तो मैं दो देने वाला हूं यहां पर एंड उसके बाद में आपका रेंज फंक्शन है रेंज फंक्शन में देखिए टू से लेके 20 तक है तो बेसिकली ये आपको 18 पैरामीटर्स देगा देखिए 19 तक तो आपका लूप चलेगा और आपका टू से स्टार्ट हुआ है तो टोटल आपके 18 आपके पास टोटल आपके पास क्या है यहां पे 18 आपको आंसर देने वाला है तो यदि मैं टोटल नंबर ऑफ मॉडल की बात करूं तो 144 मॉडल बनने वाले है इन 144 में से ये क्या करेगा केवल और केवल 20 रैंडम सैंपल को सेलेक्ट करके लाएगा और आपको यहां पर लाके देगा बस ये इसका इतना काम है राइट और उसमें से इसने लाके दिया है कि मैक्स्ट स्टेप जो है वो 17 बेस्ट आंसर है यदि देख आप यहां पे गस सवी को फिर से रन करते हैं एक बार और बेस्ट पैरामीटर सर्च करते हैं तो देखिए ये बेस्ट पैरामीटर अपना चेंज कर देता है यहां पर क्योंकि ये जितनी बार आप इसे रन करेंगे ये आपके पास क्या करेगा रैंडम सर्च करेगा और रैंडम सर्च करके आपको रैंडम आंसर निकाल के देगा हां हालांकि इसका जो आंसर होता है वह काफी हद तक सही होता है मतलब 99 पर जो होता है वह काफी हद तक अच्छे आंसर निकाल के देता है लेकिन आपके पास 5 पर आपके पास यहां पर थोड़े से यहां पर अलग आंसर्स देखने को मिल सकते हैं तो गाइ इस तरह से आपके पास रैंडम सर्च सीवी काम करता है चलिए इस आरडी की एक्यूरेसी भी चेक कर लेते हैं कि आरडी कितनी एक्यूरेसी दे रहा है यहां पर तो मैं बेस्ट स्कोर को देखूं यहां पर तो बेस्ट स्कोर मिल रहा है 99.9 सस यह भी आपको सेम ही आंसर दे रहा है यहां पर तो इस तरह से आप क्या कर सकते हैं गाइज यहां पर रमा सर सवी को भी इस्तेमाल कर सकते हैं और आज के इस वीडियो के जरिए हम बात करेंगे यहां पर क्रॉस वैलिडेशन के बारे में और यहीं पे हम समझेंगे कि डाटा को स्प्लिटिंग करने के और क्या-क्या मेथड हो सकते हैं वैसे तो डाटा स्प्लिटिंग करने के ट्रेनिंग और टेस्टिंग मेथड्स है ही यहां लेकिन इसके अलावा भी बहुत सारे मेथड्स होते हैं जिसके थ्रू आप डाटा को स्प्लिटिंग कर सकते हैं अब ये क्रॉस वैलिडेशन होता क्या है इसको जरा समझते हैं यहां पर बेसिक तरीके से लेट्स सपोज मेरे पास कोई एक डाटा सेट है यस आप ये मान लीजिए क्या है यहां पर मे मे पास कोई एक डेटा सेट है और इस डेटा सेट पे मैं क्या कर रहा हूं अपना डिसीजन ट्री मॉडल ट्रेन कर रहा हूं अब डिसीजन ट्री की मॉडल की जो एक्यूरेसी है वो आपके पास यहां पर 67 पर आ रही है अब आप क्या कर रहे हैं पीछे जा रहे हैं डाटा की प्री प्रोसेसिंग कर रहे हैं आप डाटा के अंदर और भी चीजें चेंजेज कर रहे हैं हाइपर पैरामीटर ट्यूनिंग कर रहे हैं और कैसे करके इसकी एक्यूरेसी को बढ़ाने की कोशिश कर रहे हैं लेकिन आपको ये एक्यूरेसी ज्यादा बढ़ती हुई नजर नहीं आ रही है तो अब आप क्या करेंगे आपके इस डाटा के ऊपर मॉडल बनाने से पहले आपको क्या करना चाहिए चेक करना चाहिए कि इस डाटा के ऊपर ये पर्टिकुलर मॉडल कित इतनी एक्यूरेसी दे सकता है मतलब आपको क्या निकालना है एक रेंज निकालनी पड़ेगी उस रेंज से आपको एक आईडिया लग जाएगा कि आपके मॉडल की एक्यूरेसी हाईएस्ट कितनी जा सकती है देन उसके बाद में यदि आपके हाईएस्ट से आप हाइपर पैरामीटर ट्यूनिंग करके या मॉडल की प्री प्रोसेसिंग करके थोड़ी बहुत एक्यूरेसी बढ़ा देते हैं दैट्ची अच्छी नहीं देखने को मिलती है तो आप यहां पर पीछे जाके बहुत सारी मेहनत करते हैं लेकिन उससे भी एक्यूरेसी कुछ कुछ ही परसेंट बढ़ पाती है इतनी हाई एक्यूरेसी पर पहुंच नहीं पाती है तो उससे पहले हमें क्या करना है पता लगाना पड़ेगा कि पर्टिकुलर डाटा के ऊपर हमारे पास मॉडल की एक्यूरेसी कितनी आने वाली है इस चीज को पता लगाने के लिए हम इस्तेमाल करते हैं किसका क्रॉस वैलिडेशन का क्योंकि क्रॉस वैलिडेशन एक ऐसी टेक्निक है जिसके थ्रू आपको अपने मॉडल की एक्यूरेसी के बारे में पता लग जाता है कि कितनी एक्यूरेसी जाने वाली है ये जो क्रॉस वैलिडेशन है ये होता कैसे है और किस तरह से काम करता है इसको जरा समझते हैं यहां पर तो देखिए क्रॉस वैलिडेशन क्या है एक टेक्निक है वैलिडेशन की जो क्योंकि आपकी एफिशिएंसी बताती है आपके मॉडल की कि कितनी एफिशिएंसी तक वर्क कर सकता है यहां पर अब इसके अंदर होता क्या है कि आप अपने डेटा सेट को क्या करते हैं दो पार्ट के अंदर तोड़ते हैं पहला पार्ट होगा आपका ट्रेनिंग पार्ट दूसरा पार्ट होता है आपका टेस्टिंग पार्ट अब जो आपका ट्रेनिंग पार्ट हो गया है इस ट्रेनिंग पार्ट को आप क्या करते हैं दो पार्ट के अंदर तोड़ते हैं पहला पार्ट आपका क्या होगा ट्रेनिंग के अंदर क्रॉस वैलिडेशन के अंदर जाएगा और दूसरा पार्ट जाएगा आपके पास यहां पर रिटेन मॉडल के ऊपर मतलब आपका जो भी मॉडल होगा यहां पर उसके अंदर कोई भी प्रॉब्लम होगी तो उसके अंदर रिटेन के ऊपर चला जाएगा अब ये जो क्रॉस वैलिडेशन तरीका है यहां पर ये कॉ वैलिडेशन तरीका क्या करता है कि आपके जो डेटा सेट है उस डेटा सेट के अंदर बहुत सारे स्प्लिट्स करता है मतलब मैं बेसिक गाइस बात करूं यहां पर तो लेट्स सपोज मैं मान लेता हूं कि मेरे पास कोई डेटा सेट है जैसे कि एक् आपका पास कॉलम है यहां पर एक्सटेस मान लेता हूं जहां पे बहुत सारे आपके पास इनपुट पैरामीटर्स हो सकते हैं अब यहां पर क्या है आपके पास कुछ कॉलम है जैसे 1 2 3 4 5 6 7 8 ये कुछ कॉलम्स है यहां पर तो क्रॉस वैलिडेशन क्या करता है कि आपने जो भी अपना मॉडल लिया है यहां पर यस जो भी आपने अपना मॉडल लिया है इस मॉडल के अंदर आप अपने मॉडल को बताएंगे कि कितने तरीके से वैलिडेट करना है मतलब इस डेटा सेट के ऊपर कितने तरीके से वैलिडेट करना है और यहां पे जो मॉडल लिया है आपने लेट्स सपोज dt3 का आपने यहां पर एल्गोरिथम इस्तेमाल किए यहां पर यस तो आप यहां पर वैलिडेट बताएंगे कि कितने तरीके से इसे वैलिडेट करना है तो आपने बोल दिया कि भाई सीवी की वैल्यू मतलब क्रॉस वैलिडेशन की वैल्यू फाइव है तो इसका मतलब क्या होगा कि ये जो पूरा डेटा सेट है ये पांच तरीके से स्प्लिट होगा अलग-अलग तरीके से और उसके पांच तरीके से इस मॉडल को ट्रेन किया जाएगा जिससे पांच डिफरेंट डिफरेंट एक्यूरेसी हमें देखने को मिलेगी जटस सपोज मैं मान लेता हूं यहां पर कि पहले पार्ट के अंदर आपने क्या किया ये फर्स्ट वाइव को लिया और अपने मॉडल को दिया मॉडल को ट्रेन करके आपने पास क्या की कुछ ना कुछ एक्यूरेसी आपको देखने को मिली राइट देन आपके पास क्या हुआ दूसरे पार्ट के अंदर क्या हुआ कि आपके पास रैंडम किसी पांच को चूज किया जस्ट लाइक मैं ये पांच को चूज कर लेता हूं यहां पर एंड देन फिर से मैं क्या कर रहा हूं अपने मॉडल को ट्रेंड कर रहा हूं और फिर से मुझे क्या मिलेगी मेरी एक्यूरेसी मिलेगी तो एक्यूरेसी वन मिलेगी एक्यूरेसी टू मिलेगी इसी तरह से आपके पास क्या मिलेगा गाइज यहां पर मैं पीछ में से कोई और चूज कर लेता हूं तो यहां पे भी मिल गया तो आप क्या करते हैं आप इस तरह से पांच एक्यूरेसी आपको मिल जाती है अब आपने यहां पे क्रॉस वैलिडेशन की वैल्यू फाइव दी है इसके बेस पे ही आपके पास क्या होता है यहां पर काम होता है कि जितनी आपने यहां पर वैलिडेशन की वैल्यू दी है उसी तरीके से आपका जो डाटा है वो आपके पास स्प्लिट होता है और स्प्लिट होके आपके पास क्या करता है उतनी ही आपको एक्यूरेसी मिलती है जैसे कि एक्यूरेसी थ्री मिल गई आपके पास एक्यूरेसी फोर मिल गई यहां पर एक्यूरेसी आपको फाइव मिल गई यस इस तरह से पांच एक्यूरेसी मिल गई अब ये एक्यूरेसी जितनी भी आपको मिलती है गाइ यहां पर ये एक गिवन रेंज के अंदर मिलती है अब ये आपके पास यहां पर गिवन रेंज के अंदर आप इसे अपने हिसाब से अरेंजमेंट कर सकते हैं जिसके अंदर आपको अपनी एक मिनिमम वैल्यू मिल जाएगी और आपको एक मैक्सिमम वैल्यू मिल जाएगी जो कि हमें ये इंडिकेट करती है कि आपका जो डेटा सेट है वो डेटा सेट मिनिमम कितनी एक्यूरेसी पर जा सकता है और मैक्सिमम टू मैक्सिमम कितनी एक्यूरेसी पे जा सकता है अब जो मैक्सिमम एक्यूरेसी आपको बताई गई है आप उससे मैक्सिमम एक्यूरेसी को अडॉप्ट करें यस आप ट्रेन टस्ट स्लेडिंग को चेंज करें मॉडल को रिटेन करें जैसे भी करके आप अपने क्या करें अपने मॉडल की एक्यूरेसी को इंप्रूव करें एंड इंप्रूव करने के बाद मैं आपको जो मैक्सिमम एक्यूरेसी है लेट्स सपोज आपको मैक्सिमम एक्यूरेसी 85 पर मिली है यहां पर तो अब आप हाइपर पैरामीटर की ट्यूनिंग करके आप इसकी एक्यूरेसी को थोड़ी बहुत बढ़ा सकते हैं ऐसा नहीं है 85 से आपके पास यहां पे 95 चली जाए नहीं आपके पास 855 से थोड़ी बहुत आपकी मॉडल की एक्यूरेसी बढ़ जाती है तो बेसिकली क्लॉस वैलिडेशन क्या है एक टेक्नीक है जिसके थ्रू आप डाटा को ट्रेड करने से पहले आप क्या करते हैं गाइज यहां पर उसके अंदर के जो आपके पास पैरामीटर्स हैं जितने भी आपके पास उसके पैरामीटर्स हैं उन्हें आप ट्रेन कर रहे हैं अपने डेटा सेट से मतलब आपके फीचर से ट्रेन कर रहे हैं और फीचर से ट्रेन करने के बाद में आप यहां पर पता लगा रहे हैं कि कि आपके पास एक्यूरेसी की क्या रेंज आपको देखने को मिलेगी तो दैट इज कॉल ऑफ क्रॉस वैलिडेशन टेक्निक अब ये जो क्रॉस वैलिडेशन टेक्निक है इसके अंदर हम क्या करते हैं डेटा को स्प्लिटिंग करते हैं मतलब बेसिकली गाइज मैं बात करूं यहां पर तो आप क्या करते हैं आप अपना इनपुट डाटा और आपका अपना आउटपुट डाटा वो पूरा का पूरा कंपलीटली इसे दे देता है काफी बार आप इसे ट्रेन और टेस्ट के अंदर स्प्लिटिंग करके भी देते हैं यहां पर तो लेट्स सपोज आपने अपना डाटा दिया है यहां पर अब ये जो आपने डाटा दिया है इसके अंदर आपने क्या किया स्प्लिटिंग कि है स्प्लिटिंग करने का मतलब क्या है गाइ यहां पर आपने इस डाटा को तोड़ा है जैसे कि मैं पांच इसको तोड़ लेता हूं पांच ऐसे तोड़ता हूं तो ये पांच पांच जो तोड़ने का तरीका मतलब हमारे डाटा को स्प्लिटिंग करने का जो तरीका है इसको हम डिटेल के साथ समझते हैं अब ये जो स्प्लिटिंग कि है स्प्लिटिंग करने का मतलब क्या हुआ गाइज यहां पर स्प्लिटिंग करने का मतलब सिंपल सा ये हुआ कि जितना भी आप डाटा दे रहे हैं जस्ट सपोज मैं इतना डाटा यहां पे स्प्लिटिंग कर रहा हूं तो ये वाला जो डाटा होगा गाइज ये किसमें चलाएगा हमारा ये हमारा ट्रेनिंग में चला जाएगा यहां पर और पीछे जो बचा हुआ है यहां पर ये किस में चला जाएगा आपका टेस्टिंग में चला जाएगा तो बेसिकली आप यहां पर ट्रंट स्प्रेडिंग के अंदर डाटा जो तोड़ते हैं यहां पर उसके लिए आप रैंडम स्टेट का इस्तेमाल करते हैं आप इसके अंदर ट्रेंटे स्लेडिंग का इस्तेमाल करते हैं लेकिन क्रॉस वैलिडेशन जब आप करते हैं यहां पर तो क्रॉस वैलिडेशन के अंदर डाटा को तोड़ने के डिफरेंट डिफरेंट तरीके होते हैं मतलब क्रॉस वैलिडेशन को करने के डिफरेंट डिफरेंट तरीके होते हैं और अब हम समझते हैं वो डिफरेंट डिफरेंट तरीके क्या है यहां पर तो बेसिकली इन डिफरेंट डिफरेंट तरीके के अंदर बहुत सारे मेथड्स आते हैं जो कि डाटा को तोड़ने के लिए काम आते हैं यहां पर यस जैसे कि मैं मैंने बोला कि यहां पर मेरा वन से लगाकर नाइन तक डाटा है यस 1 2 3 एंड देन फर फ सिक्स ओके सिक्स के बाद सेन 8 और नाइन ये नाइन तक हमारा डाटा है तो अब हमें इसमें क्या करना है डेटा को तोड़ना है किसके अंदर तोड़ना है ट्रेनिंग और टेस्टिंग के अंदर तोड़ना है तो वो ट्रेनिंग और टेस्टिंग के अंदर किस तरह से स्प्लिटिंग होगा यस उसके कुछ आपके पास मेथड्स यहां पे बताए गए हैं यहां पर या फिर आप बोल सकते हैं ट्रेनिंग और वैलिडेशन के अंदर किस तरह से टूटेगा डेटा यहां पर यदि आप ट्रेन ट स्लिटिंग पहले से तोड़ के लाए हैं देखिए काफी लोग क्या करते हैं मैं आपको बता देता हूं लेट्स सपोज आपका ये डेटा सेट है राइट लेट्स सपोज आपके पास ये डेटा सेट है इस डटा सेट को काफी लोग पहले से क्या करते हैं दो पार्ट के अंदर तोड़ देते हैं देर इज अ फर्स्ट पार्ट इज योर ट्रेनिंग पार्ट एंड सेकंड पार्ट योर इज ट्रस्टिंग पार्ट अब यहां पे जो ट्रेनिंग पार्ट टूटा है यहां पर इस ट्रेनिंग पार्ट को भी काफी लोग क्या करते हैं दो पार्ट के अंदर तोड़ देते हैं और वो दो पार्ट कौन से होते हैं है गाइज यहां पर वो दो पार्ट आपके पास होता है यहां पर ट्रेनिंग पार्ट एंड देन इज वैलिडेशन पार्ट यस वैलिडेशन पार्ट होता है यहां पर ये वैलिडेशन पार्ट यहां पर एज अ टेस्टिंग पार्ट की तरह ही वर्किंग करता है और आपको आंसर भी उसी तरीके से यहां पर लाके देता है राइट तो हम बेसिकली क्या कर रहे हैं डेटा को स्प्लिटिंग करने के तरीके को समझें यहां पर और डेटा को स्प्लिटिंग करने के बहुत सारे तरीके हैं जैसे देखिए लीव पी आउट मेथड है लीव वन आउट मेथड है होल्डिंग क्रॉस वैलिडेशन मेथड है रिपीटेड रैंडम मेथड है यहां पर k4 क्लॉस वैलिडेशन मेथड है सर्टिफाई k4 क्लॉस वैलिडेशन है टाइम सीरीज है नेस्टेट क्रॉस वैलिडेशन है ऐसे बहुत से तरीके हैं और अब जो हम यहां पर कवर अप करने वाले हैं इनके अंदर हम कुछ स्पेशल मेथड को कवर अप करेंगे और वो स्पेशल मेथड्स कौन-कौन से हैं यहां पर जैसे फर्स्ट वन मैं यहां पे कवर अप करने वाला हूं लीव पी आउट को देन सेकंड आपके पास लीव वन आउट को थर्ड वन आपके पास के फोल्ड क्रॉस डिशन को और फिफ्थ वन आपके पास क्या होगा सेटिस्फाई k4 क्रॉस डेशन को हम यहां पर कवर अप करेंगे अब ये कैसे काम करते है जरा समझते हैं तो इसके अंदर सबसे पहले मैं बात करूंगा k4 क्रॉस वैलिडेशन के बारे में अब ये k4 क्रॉस वैलिडेशन है क्या यहां पर तो k4 क्रॉस वैलिडेशन क्या करता है आपके डाटा को यहां पर नंबर ऑफ पार्ट्स के अंदर स्प्लिटिंग करता है अब ये नंबर ऑफ प्लाट्स कितने हो सकते हैं जरा उसको समझते हैं यहां पर देखिए लेट्स सपोज आपके पास कोई डेटा सेट है यस लेट्स सपोज आपके पास क्या है कोई एक डेटा सेट है और उस डेटा सेट के अंदर आपने बोल दिया कि मेरे पास 10 डटा है यहां पर तो अब आप क्या करते हैं यहां पर आप के फोल्ड के अंदर बताते हैं कि इसको कितने पार्ट के अंदर स्प्लिटिंग करना है कितने पार्ट के अंदर स्प्लिटिंग करने का मतलब क्या हुआ गाइस यहां पर जैसे कि मैंने बोला कि यहां पर इसके तीन टुकड़े करने हैं जैसे मैंने बोला यहां पर इसके अंदर क्या करना है यहां पर दो डिवाइड करना है यस दो पार्ट्स के अंदर तोड़ना है इसे यहां पर तो बेसिकली आप क्या करेंगे टू पार्ट्स के अंदर डिवाइड कर देंगे तो फाइव आपके पास बच जाएगा यहां पर बीचे कितना बच जाएगा फाइव बच जाएगा इसका मतलब क्या हुआ गाइज यहां पर मैं सिंपल सी बात करूं यहां पर कि आपका जो डाटा है यस आपका जो डाटा है यहां पर इसके अंदर आपके पास क्या होगा पहले में क्या होगा पांच पार्ट जो होगा वो कहां चला जाएगा आपके पास ट्रेनिंग में चला जाएगा और रिमेनिंग जो फाइव पार्ट है वो किसमें चला जाएगा वैलिडेशन डाटा में चला जाएगा इसी तरह से मैं बात करूं यहां पर नेक्स्ट वाले पार्ट के अंदर तो नेक्स्ट वाले पार्ट के कोई भी रैंडम यस कोई भी रैंडम की बात करूं यहां पर यस कोई भी रैंडम की बात करूं यहां पर तो रैंडम क्या करेंगे हम यहां पर यस रेंडम क्या करेंगे हम यहां पर फाइव पार्ट क्या करेंगे वापस उसको क्या करेंगे वैलिडेशन डाटा में डाल देंगे और रैंडम कोई भी फाइव जो है यहां पर वो किसमें चला जाएगा आपका ट्रेनिंग के अंदर आपका चला जाएगा राइट तो गाइ बेसिकली गाइ मैं यहां पे बात करूं तो इसमें होता क्या है यहां पर कि जितने नंबर ऑफ स्प्लिट बोलेंगे आप यहां पर यस जितने नंबर ऑफ स्प्लिट बोलेंगे उतने नंबर पार्ट के अंदर ये आपको तोड़ देगा जैसे कि मैंने बोला यहां पर कि आप यहां पर क्या करें कि दो पार्ट आप ट्रेनिंग में रखें और टेस्टिंग के अंदर आप क्या करें गाइ यहां पर आपके पास रिमेनिंग जो एट पार्ट है वो रख लें तो इसमें होगा क्या लेट्स आपके पास 10 डाटा है यहां पर यस 10 डाटा है तो 10 डाटा के अंदर क्या होगा गाइज यहां पर कि ये फर्स्ट टू को क्या करेगा यहां पर ये आपको कहां डालेगा वैलिडेशन डाटा में डाल देगा यहां पर और सेकंड जो बचे हुए एट जो है ये आपका कहां डालेगा ट्रेनिंग में डाल देगा फिर क्या करेगा गाइज यहां पर रिमेनिंग फिर से देखिए ये टू यहां पर लेगा ये वैलिडेशन डेटा में चला जाएगा और बाकी सारा टेस्ट ट्रेनिंग में चला जाएगा यस बाकी सारा कहां चला जाएगा ट्रेनिंग में चला जाएगा फिर से क्या करेगा गाइज यहां पर ये दो डाटा जो होगा वो वैलिडेशन डाटा में चला जाएगा बाकी सारा डाटा यहां पर क्या चला जाएगा ट्रेनिंग में अंदर चला जाएगा फिर से आपके पास क्या होगा गाइज यहां पर ये आपका पास वैलिडेशन डाटा में चला जाएगा बाकी सारा किसमें चला जाएगा ट्रेनिंग में चला जाएगा ऐसे करते-करते टोटल 10 स्प्लिट्स इसके अंदर आ जाएंगे और ये 10 पार्ट के अंदर वर्किंग कर लेगा राइट गाइज तो इस तरह से k4 क्रॉस वैलिडेशन यहां पर वर्किंग करता है आपके डाटा को ट्रेनिंग और वैलिडेशन डेटा के अंदर स्प्लिटिंग करता है और ये जो ट्रेनिंग ऑफ वैलिडेशन डेटा के अंदर स्प्लिटिंग हुआ हुआ जो डेटा है आपके पास यहां पर ये हम किसके देते हैं ये हम क्रॉस वैलिडेशन को देते हैं और क्रॉस वैलिडेशन इससे हमें क्या करता है एक रेंज लाके देता है अपने डाटा के एक्यूरेसी की जिसके थ्रू हमें ये पता लगता है कि हमारा डाटा मैक्सिमम कितना अचीव कर सकता है और मिनिमम कितना अचीव कर सकता है राइट तो दैट इज अ k4 क्रॉस वैलिडेशन अब इसी के बाद में आता है यहां पे गाइज सर्टिफाइड के फर क्लॉस वैलिडेशन ये सर्टिफाइड के फॉर क्लॉस वैलिडेशन उस वक्त काम करता है जब आपके पास डाटा क्लासिफिकेशन इन नेचर का हो अब देखिए क्लासिफिकेशन इन नेचर के अंदर ऐसा क्यों है कि इसका इस्तेमाल वहीं पे किया जा रहा है बाकी मैं नहीं किया जा रहा रीजन बहुत ही क्लियर है यहां पर देखिए गाइज यहां पर ये जो सर्टिफाई के फर क्रॉस डेशन जब आप देखते हैं यहां पर ज सर्टिफाई के फर क्रॉस डेशन अप्लाई करते हैं यहां पर तो बेसिकली ये काम करता है आपके पास अनबैलेंस डाटा के ऊपर यस किसके ऊपर काम करता है गाइज यहां पर ये काम करता है अनबैलेंसड डेटा के ऊपर काम करता है अब अनबैलेंस डेटा का मतलब क्या हुआ अनबैलेंस डेटा देखिए रिग्रेशन एनालिसिस के अंदर आपको कभी नहीं देखने को मिलेगा राइट ये देखने को मिलेगा आपको केवल केवल क्लासिफिकेशन एनालिसिस के अंदर क्योंकि क्लासिफिकेशन एनालिसिस के अंदर आपके पास क्या होती है क्लासेस होती है जैसे कि मैं बात करूं मेरे पास क्लास है यहां पर जस्ट लाइक जीरो की क्लास है मेरे पास वन की क्लास है मेरे पास टू की क्लास है ये तीन क्लास के अंदर चल रहा है तो अब इन तीन क्लासेस में चलूं तो यहां पर पहला वाला मान लो जैसे 500 डाटा है यहां पर दूसरे वाले में आपके पास क्या है 100 डाटा है यहां पर तीसरे वाले में आपके पास क्या है यहां पर 400 डाटा है यहां पर तो आप खुद देखो यहां पर डटा क्या हो रहा है अनबैलेंस हो रहा है अब जब डाटा अनबैलेंस होता है और यहां पर आप k4 क्रॉस वैलिडेशन लगा देते हैं यहां पर तो k4 क्रॉस डेशन ये देखकर आपके पास डेटा को स्प्लिटिंग नहीं करता है कि आपके पास टेस्टिंग के अंदर मतलब आप जिसे वैलिडेशन डाटा बोलते हैं यहां पर वैलिडेशन डाटा के अंदर आपके पास तीनों के तीनों कैटेगरी के कुछ ना कुछ एग्जांपल होने चाहिए मतलब गाइज यदि मैं के फोल्ड को अप्लाई करूं यहीं पे क्या करूं यहां पर के फोल्ड को मैं अप्लाई करूं तो के फोल्ड डाटा यहां पर क्या करेगा स्प्लिटिंग करेगा किसके अंदर आपके पास यहां पर वैलिडेशन डाटा के अंदर और किसके अंदर आपके पास करेगा टेस्टिंग के अंदर तो अब ये वैलिडेशन डाटा के अंदर ये नहीं देखेगा कि आपके जीरो के एलिमेंट्स आए या नहीं आए वन के एलिमेंट्स आए या नहीं आए या टू के एलिमेंट्स आए या नहीं आए ये बस सिंपल सा स्प्लिटिंग करनी है हमें ध्यान रखिएगा अपना राइट जबकि k4 क्रॉस वैलिडेशन की जगह हम यदि सर्टिफाई k4 क्रॉस वैलिडेशन को अप्लाई करते हैं यस किसको अप्लाई करते हैं इस सर्टिफाई k4 क्रॉस वैलिडेशन को इस्तेमाल करते हैं यहां पर तो ये क्या करता है कि जब हमारा डाटा यहां पर स्प्लिट होता है जब हमारा डटा यहां पर स्प्लिट होता है तो उस वक्त ये ध्यान रखता है कि जो वैलिडेशन डाटा है उस वैलिडेशन डाटा के अंदर सभी तरीके के क्लासिफिकेशन होने चाहिए मतलब ये आपके पास यहां पर रो को भी डालता है वन को भी डालता है और टू को भी डालता है ये कुछ उस तरीके से आपके पास क्या करता है डाटा को स्प्लिटिंग करता है इस तरह से ये सेटिस्फाई k4 क् वैलिडेशन वर्क करता है राइट तो बेसिकली यहां पर आपका डेटा ट्रेनिंग और टेस्टिंग के अंदर या ट्रेनिंग एंड वैलिडेशन के अंदर स्प्लिटिंग तो होता है यहां पर लेकिन एक चीज का स्पेशली ध्यान रखा जाता है और वो चीज क्या है गाइज यहां पर वो चीज बहुत ही सिंपल चीज है कि यदि आपका डाटा क्लासिफिकेशन इन नेचर के अंदर है यस क्लासिफिकेशन नेचर के अंदर है तो उसके अंदर जितने भी नंबर ऑफ क्लासेस हैं यस नंबर ऑफ आपके जितने भी क्लासेस हैं उन क्लासेस के अंदर जितने भी आपके डेटा पॉइंट्स हैं वो आपके पास सभी तरीके से उस वैलिडेशन डाटा के अंदर आए ताकि जब आपकी टेस्टिंग हो रही हो यहां पर तब आपके सही तरीके से टेस्टिंग हो सके राइट तो इस चीज का आपके से यहां पर सर्टिफाई k4 क्रॉस वैलिडेशन के अंदर ध्यान रखा जाता है ओके चलिए अब हम बढ़ते हैं हमारे अगले वैलिडेशन डटा के ऊपर मतलब हमने अगले यहां पर स्प्लिटिंग के ऊपर चलते हैं दैट इज कॉल्ड ऑफ लीव वन आउट मेथड अब देखिए लीव वन आउट मेथड बेसिकली आज के टाइम के अंदर बहुत कम इस्तेमाल होने लग गया है लेकिन दैट इज वन ऑफ द वेरी गुड मेथड क्योंकि ये आपके पास आपके जितने भी डाटा है उस पूरे डाटा के ऊपर ओवरऑल ट्रेंड होता है इसका रीजन क्या है यहां पर जरा आप अब दो मिनट में समझाएंगे देखिए लीव वन आउट मेथड क्या करता है कि आपके पास जितने भी नंबर ऑफ डाटा है यहां पर य जितने भी नंबर ऑफ डेटा है उस नंबर ऑफ डेटा में क्या करता है एक-एक करके डाटा निकालता है जैसे कि मैं मान लू देखो 1 2 3 4 5 6 7 8 9 और 10 ये मेरे पास डाटा है तो लीवन आउट क्या करेगा पहले वन नंबर डेटा को क्या करेगा आपके पास यहां पर वैलिडेशन डाटा में डालेगा वैलिडेशन डाटा या फिर आप बोल सकते हो टेस्टिंग डाटा में डालेगा और बाकी सबको किसमें डालेगा आपके पास ट्रेनिंग में डालेगा राइट टस द फर्स्ट पार्ट यहां पर अब उसके बाद में क्या करेगा सेकंड टाइम में क्या करेगा ये टू को क्या करेगा ट्रेनिंग में डाल टेस्टिंग में डाल देगा और बाकी सबको ट्रेनिंग में डा देगा फिर क्या करेगा यहां पे गाइज थ्री को डालेगा थ्री को ट्रेनिंग में बाकी सबको टेस्टिंग सभी डाटा को एक-एक करके आपके पास क्या करेगा टेस्टिंग के अंदर डालता रहेगा और रिमेनिंग जितना भी डाटा है वो ट्रेनिंग के अंदर डालता रहेगा तो ऐसे आपके पास क्या होता है पूरे डाटा के ऊपर आपके पास अच्छे तरीके से ट्रेनिंग हो जाती है लेकिन बट एक ड्रॉबैक इसके अंदर सबसे बड़ा ये है कि यदि आपका डाटा बहुत ही लार्ज अमाउंट में हुआ यस यदि आपका डटा बहुत ही ज्यादा लार्ज अमाउंट में हुआ तो ये आपके पास आपके मॉडल को ट्रेनिंग होने में बहुत ज्यादा टाइम लगा देगा क्यों क्योंकि एक-एक एक-एक डाटा आपका टेस्टिंग के अंदर जाएगा तो बेसिकली बहुत बहुत ज्यादा टाइम आपके पास लगने वाला है राइट और रिमेनिंग सारा डाटा ट्रेनिंग के अंदर जाने वाला है तो बेसिकली आपके पास बहुत ज्यादा टाइम लगने वाला है जैसे आपके पास 1000 हो गया राइट 1000 डेटा आपके पास है यहां पर 1000 आपके पास डेटा है यहां पर तो उसमें क्या होगा गाइज यहां पर सिंपल सी बात करें तो 1 1000 टाइम आपके पास क्या होगा यहां पर उसकी टेस्टिंग होगी और 1000 टाइम उसकी क्या होगी ट्रेनिंग होगी तो गाइज यहां पे आपके पास क्या होगा मॉडल को ट्रेन होने में बहुत ज्यादा टाइम लगेगा लेकिन इसके अंदर जो मॉडल ट्रेंड होगा यहां पे गाइज दैट इज अ वेरी वेरी एक्यूरेट मॉडल यस ये बहुत ज्यादा एक्यूरेसी के साथ काम करने वाला है राइट लेकिन इसका इस्तेमाल अब थोड़ा सा कम हो गया है क्योंकि आपके डेटा जो है वो बिग डाटा के अंदर कन्वर्ट हो चुका है तो इस वजह से हम लीव वन आउट का इस्तेमाल थोड़ा कम करते हैं राइट चलिए अगले मेथड के ऊपर बढ़ते हैं यहां पर दैट इज अ लीव पी आउट मेथड और लीव पी आउट मेथड क्या करता है गाइ यहां पर ये लीव वन आउट मेथड से थोड़ा सा हट के यहां पर लीव वन आउट मेथड में क्या हो रहा था गाइ यहां पर कि आपके पास जितना भी डाटा आपका स्प्लिटिंग हो रहा था राइट वो क्या हो रहा था वन बाय वन हो रहा था यहां पे क्या करते हैं आप यहां पर एक साथ दो दो से ज्यादा डाटा यहां पर आप ले सकते हो जैसे कि मैं सिंपल सी बात करूं तो मान लीजिए 1 2 3 4 और फव ये आपके पास डटा पड़ा है यहां पर ठीक है और मैंने कहा दो-दो के ग्रुप बना दो तो ये क्या करेगा वन और टू को किसके अंदर डालेगा गाइज यहां पर यस मैं यहां पे लिख देता हूं वैलिडेशन डाटा और यहां पे लिख देता हूं आपका ट्रेनिंग डाटा राइट क्या रखता हूं ट्रेनिंग डाटा तो वन और टू को डाल दिया यहां पर और बाकी सारा क्या डाल दिया ट्रेनिंग के अंदर फिर क्या किया वन और थ्री को डाला फिर वन और फोर को डाला फिर वन और फाइव को डाला अब बारी आ गई टू अब देखो टू और थ्री क्या आ गई टू और फोर क्या आ गई टू और फाइव हो गई ऐसे करते-करते सारी ट्रेनिंग करेगा अब बारी है किसकी थ्री की तो देखिए थ्री और फोर की आ गई यहां पर और थ्री और फाइव की हो गई उसी तरह से गाइज यहां पर बात करूं तो आप क्या क्या फोर और फाइव की आ गई तो ऐसे करते-करते ये सारा डाटा क्या आ जाएगा वैलिडेशन डटा में जाएगा और रिमेनिंग जितना बचा है गाइज यहां पर वो कहां जाने वाला है ट्रेनिंग के अंदर जाने वाला है इस तरह से आपके पास क्या होगा लीव पी आउट मेथड आपके पास वर्क करता है और आपके मॉडल की ट्रेनिंग की एक्यूरेसी बहुत ज्यादा हाई कर देता है बस इसमें भी एक वही प्रॉब्लम है कि गाइज यहां पर नंबर ऑफ कॉमिनेशन जो होते हैं वो बहुत ज्यादा बन जाते हैं जिस वजह से ट्रेनिंग के अंदर टाइमिंग बहुत ज्यादा लग जाता है तो बेसिकली आज के टाइम के अंदर इसको भी बहुत ही कम यूज किया जाता है हे एवरीवन वंस अगेन वेलकम टू डलस कपटेक माय सेल्फ गरा और आज की इस वीडियो के जरिए हम बात करेंगे क्रॉस वैलिडेशन के बारे में देखिए लास्ट वाले लेक्चर के अंदर आपने क्रॉस वैलिडेशन को समझा होगा और टाइप्स ऑफ क्रॉस वैलिडेशन के बारे में भी डिस्कस किया होगा आज के इस वीडियो के जरिए हम एक डाटा सेट के ऊपर क्रॉस वैलिडेशन अप्लाई करके देखेंगे और उसकी बेस्ट एक्यूरेसी फाइंड आउट करने की कोशिश करेंगे तो चलिए जरा समझते हैं यहां पर कि क्रॉस वैलिडेशन कैसे वर्क करता है डटा सेट के ऊपर यदि आपको पाइथन मशीन लर्निंग डाटा साइंस एंड डेटा एनालिस जैसी फील्ड में अपने आपको को ग्रो करना है तो इसके लिए डब्ल्यू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो मैं इसको ले चलता हूं आपको एक डेटा सेट दिखाता हूं यहां पर तो देखिए मेरे पास एक डेटा सेट है जो कि लीनियर रिग्रेशन के नाम से एक डेटा सेट है यस आप यहां पर देख पाएंगे इस डेटा सेट के बारे में दैट इ अ प्लेसमेंट ड सीएवी नाम से एक डेटा सेट है हम बेसिकली इसके ऊपर बात करने वाले हैं और इसके ऊपर क्रॉस वैलिडेशन लगाने वाले हैं अब यहां पे क्या है सीजीपीए के बेसिस पे आपको पैकेज दे रखा है और हम क्या करेंगे इसके अंदर पता करेंगे कि इसकी बेस्ट एक्यूरेसी कितनी है मतलब आपका मिनिमम एक्यूरेसी कितनी है और मैक्सिमम एक्यूरेसी कितनी है ये भी देखेंगे और इसके साथ-साथ हम यहां पे ये भी पता करेंगे कि यदि मैं k4 क्रॉस टेशन लगाऊं पी होल्ड आउट क्रॉस लेशन लगाऊं या अदर कोई भी क्रॉस लेशन लगाऊं तो वो किस तरह से वर्क करता है वो भी हम डिस्कस करने वा अच्छा यदि मैं टोटल नंबर ऑफ डेटा की बात करूं यहां पर तो देखिए टोटल नंबर ऑफ डेटा मेरे पास कितने हैं 200 डेटा यहां पर प्रेजेंट है जिसके ऊपर हम यहां पर ये काम करने वाले हैं लेकिन के फोल्ड एंड बाकी जो आपके पास कॉस्ट लशन के मेथड्स हैं वो समझाऊं तब मैं आपके पास केवल और केवल 10 डेटा लेके ही उसके ऊपर वर्किंग करके दिखाऊंगा कि ये कैसे वर्क करते हैं और ये किस तरह से फाइंड आउट कर जाते हैं चलिए अब जरा इसे समझते हैं यहां पर तो इसके लिए मैं ले चलता हूं आपको जुपिटर नोटबुक के अंदर अब सबसे पहले क्या कर रहा हूं हमारी जो रिक्वायर्ड लाइब्रेरी है उसे हम इंपोर्ट करते हैं जट से इंपोर्ट पांडा एलियाज ऑफ पीडी का मैं इस्तेमाल करूंगा यहां पर अब मैं क्या कर यहां पर डटा सेट को लोड करूंगा और डाटा सेट को लोड करने के लिए मैं पीडी डॉट यहां पर रिनेट को सीएसवी का इस्तेमाल करूंगा जिसके अंदर मैं क्या करूंगा यहां पर जो प्लेसमेंट ड सीएवी है उसे मैं लोड करने वाला हूं यहां पर और ये रहा प्लेसमेंट सीएवी को लोड कर चुके हैं और डटा सेट को देख लेते हैं डटा सेट डॉट यहां पर हैड लगा के मैं इसके तीन डाटा को देखना चाहूंगा तो देखिए हमारे पास सीजीपी और पैकेज आपके पास आ चुका है अब इस सीजी पैकेज को हम क्या करते हैं इनपुट और आउटपुट को अलग-अलग कर लेते हैं तो देखिए मैं एक्सेस का डटा अलग कर रहा हूं उसके लिए मैं डेटा सेट के पास जाऊंगा डॉट यहां पर आलग का इस्तेमाल करूंगा सारी नंबर ऑफ उसका इस्तेमाल करूंगा और यहां पर सारे नंबर ऑफ कॉलम का इस्तेमाल करूंगा -1 करके पैकेज को छोड़ दूंगा एंड y के अंदर बात करें तो मैं देखिए डेटा सेट के पास जाऊंगा एंड उसके बाद में मैं पैकेज को लेके यहां पे इसका वा आउटपुट तैयार कर लूंगा अब देखिए सबसे पहले हम इस डेटा सेट के ऊपर ये समझते हैं जो भी हमने यहां पे क्रॉस वैलिडेशन के मेथड जो समझे थे वो किस तरह से परफॉर्म करते हैं यहां पर चलिए जरा अब इसे देख लेते हैं यहां पर तो इसके लिए मैं क्या कर रहा हूं गाइज यहां पर कि ये मेरा डेटा सेट है इस डेटा सेट में से केवल 10 डाटास निकालूं ताकि आप लोगों को थोड़ा आईडिया लग जाए कि किस तरह से ये परफॉर्म करते हैं तो मैं क्या कर रहा हूं गाइ यहां पर एक न्यू डाटा नाम से एक वेरिएबल बना लेता हूं यहां पर यस न्यू अंडर डटा के नाम से एक वेरिएबल बना देता हूं यहां पर और उसके बाद मैं मेरा जो डेटा सेट है यहां पर वो लेता हूं और डॉट हैड लेके आगे के जो 10 डाटा है वो मैं यहां पे कंसीडरेशन कर लेता हूं अब इस न्यू डाटा के ऊपर हम क्या कर रहे हैं अलग-अलग वैलिडेशन जो मेथड्स हैं वो अप्लाई करके देखेंगे कि वो किस तरह से आपके पास डाटा को स्प्लिटिंग करते हैं चलिए तो मैं चलता हूं यहां पर फ्रॉम साइकन के पास यहां पर डॉट उसके बाद में मैं जाऊंगा किसके पास मॉडल सिलेक्शन के पास मॉडल सिलेक्शन के अंदर जाने के बाद में दैट मैं इंपोर्ट करने वाला हूं यहां पर किसे इपोर्ट करूंगा सबसे पहले मैं इंपोर्ट करूंगा यहां पर लीव वन आउट को यस यहां पर हमको क्या करना है लीव वन आउट को यहां पे इंपोर्ट करना है ट्स मैं लीव वन आउट को इंपोर्ट करूंगा उसके बाद मैं इंपोर्ट करने वाला हूं लीव पी आउट को यहां पर इंपोर्ट करूंगा दैट उसके बाद में मैं यहां पर के फोल्ड को इंपोर्ट करने वाला हूं और उसके बाद मैं सर्टिफाई के फोल्ड को इंपोर्ट करने वाला हूं तो ये मैंने सर्टिफाई के फोल्ड को ले लिया है इस तरह से मैंने चारों मॉडल ले लिए हैं और चारों मॉडल किस तरह से वर्क करते हैं अब जरा वन बाय वन समझते हैं यहां पे आ जाइए देखिए सबसे पहले मैं इस्तेमाल करूंगा लीव वन आउट का देखिए लीव वन आउट मेथड क्या कहता है य यहां पर कि आपके पास जो ट्रेनिंग और टेस्टिंग का डाटा जो स्प्लिटिंग होता है इसमें टेस्टिंग का जो डाटा होगा वो वन वन करके अलग होगा यहां पर और ट्रेनिंग का डाटा बाकी रिमेनिंग बच गया है डाटा वो आपके पास यहां पर दिखेगा वही चीज अब हम यहां पर देख रहे हैं ये कैसे वर्क करती है तो इसके लिए मैं क्या कर रहा हूं गाइज यहां पर लीव वन आउट के लिए तो मैं एलो के नाम से एक वेरिएबल बना लेता हूं और यहां पर ये जो लीव वन आउट है इसे मैं कॉल कर देता हूं अब लीव वन आउट को जैसे ही आप ओपन करेंगे यहां पर तो ये आपके पास क्या करेगा आपके डेटा सेट को लेगा लेकिन अभी डेटा सेट को नहीं लेगा डेटा सेट को लेने के लिए हम क्या करेंगे यहां पर स्प्लिट मेथड का इस्तेमाल करेंगे वो डेटा सेट को यहां पे कंसीडरेशन करेंगे यहां पे जो डाटा आने वाला है इसको मैं लूप के थ्रू यहां पे ट्रेड करने वाला हूं तो मैं देखिए फॉर आपके पास यहां पे बना लेता हूं ट्रेन नाम से एक डाटा दूसरा मैं यहां पर बना लेता हूं टेस्ट नाम से डाटा एंड इन करके मैं एलो डॉट क्या करने वाला हूं यहां पर स्प्लिट का यूज़ करूंगा जिसके थ्रू मेरा जो डटा है वो स्प्लिट होने वाला है इसके अंदर आप x एक्सेस का डाटा एंड y एक्सेस का डाटा यहां पर पास कराते हैं देन x y मैं इसके अंदर पास करा रहा हूं यहां पर देन कॉलन करके हम यहां पर प्रिंट करके देखेंगे कि ट्रेनिंग और टेस्टिंग का डाटा किस तरह से अलग-अलग होता है तो मैंने ट्रेन कॉमा टेस्ट का जो डाटा है वह अलग-अलग कर लिया देन जैसे ही रन करेंगे तो देखिए आपके पास लीव वन आउट और लीव p आउट कैसे वर्क कर रहा है आई थिंक आपको क्लियर समझ में आ गया होगा अब देखिए यह x और y जो हमने अलग-अलग किया है यह हमने क्या किया ओरिजिनल में से किया है लेकिन हमें न्यू डाटा में से करना था यहां पर तो मैं यहां पर एक न्यू x y बनाता हूं यहां पर तो x मैं न्यू का इस्तेमाल करूंगा यहां पर और यह कहां से लग होगा मेरा जो न्यू डाटा है यहां पर डॉट मैं आलग का इस्तेमाल करूंगा सारी नंबर ऑफ़ रो ले लूंगा सारे नंबर ऑफ़ कॉलम लूंगा -1 को छोड़ दूंगा इसी तरह से मैं y मैं न्यू का इस्तेमाल करने वाला हूं यहां पर ये कहां से आएगा ये हमारे न्यू डाटा में से आएगा और न्यू डाटा में से आने के बाद में इसके अंदर जाके मैं पैकेज के थ्रू इसका डाटा को कंसीडर कर लूंगा अब ये जो x और y है इसकी जगह x अंडर न्यू कर देते हैं और ये जो y है इसको y अंडर न्यू कर लेते हैं तो अब देखिए आप यहां पर मेरे पास टोटल 10 डटा था उसमें से आगे वाले जो नाइन डटा है वो हमारे पास किसके आ जाएंगे ट्रेनिंग के रिमेनिंग जो वन बच गए यहां पर वो टेस्टिंग में फिर देखिए आगे वाले नाइन डटा आपके पास ट्रेनिंग में आ गया वन आपका टेस्टिंग में तो इस तरह से लीव वन आउट काम करता है आपका यहां पे मतलब आपके पास जो आपके इंडेक्स नंबर चल रहे हैं अब आप देख सकते हैं यहां पर न्यू डाटा के इंडेक्स नंबर क्या है देखिए न्यू डाटा का इंडेक्स नंबर आपके पास देखिए 0 1 2 3 4 5 6 7 8 9 दे रखा है यहां पर तो बस उसी तरह से आपके पास यहां पे वर्क कर रहा है कि पहला डाटा आपके पास यहां पे आ चुका है दूसरा डाटा आपके पास यहां अलग हो गया फिर इसमें से एक अलग और हो गया इसमें से एक और अलग हो गया तो ये जो आपके पास है ये स्प्लिटिंग के मेथड है म आप अपने डाटा को ट्रेन टेस्ट के अंदर स्प्लिटिंग करते हैं वो स्प्लिटिंग के मेथड्स हैं आप इन इन तरीके से भी स्प्लिटिंग कर सकते हैं दैट इज अ लीव वन आउट अब मैं बात करता हूं लीव प आउट में क्या होगा देखिए लीव प आउट के अंदर कोई भी आप अपनी प वैल्यू दे सकते हैं उस प वैल्यू के बेसिस पे आपका आउट होने वाला है मतलब आप अपने टेस्टिंग के अंदर कितने नंबर अलग करना चाहते हैं वो यहां पर आप दे सकते हैं तो देखिए p की वैल्यू मैं डिसाइड कर लेता हूं जस्ट लाइक अ टू यस मैं टू डिसाइड करता हूं और रन करता हूं तो देखिए इसने मेरे डाटा के अंदर बहुत सारे स्प्लिटिंग कर ली है जैसे कि देखिए टू मैंने यहां पर दिया है तो बेसिकली टू आपके पास किस में आ गए टेस्टिंग के लिए आ गए बाकी सारा डाटा देखिए ट्रेनिंग में आ चुका है जैसे देखिए 01 आ गया 02 आ गया 03 आ गया 04 आ गया 05 आ गया ऑल पॉसिबल कॉम्बिन शंस इसने डिजाइन कर लिया यस ऑल पॉसिबल कॉमिनेशन इसने डिजाइन करके आपको दे दिए हैं इस तरह से आपके अपने जो डेटा सेट है इसके अंदर आप इसे ट्रेनिंग और टेस्टिंग के अंदर स्लिटिंग कर सकते हैं तो ये था आपका लीव पी आउट मत तो अब य हम यूज़ करते हैं के फोल्ड क् के फोल्ड का इस्तेमाल करते हैं तो देखिए मैं के फोल्ड का इस्तेमाल कर रहा हूं और के फोल्ड के अंदर आपसे क्या पूछा जाता है नंबर ऑफ फ्ल्ड नंबर ऑफ फोल्ड का मतलब नंबर ऑफ स्प्लिट आप कितने नंबर ऑफ स्प्लिट लगाना चाहते हैं मतलब आपके अपने डाटा को कितने पार्ट के अंदर तोड़ना चाहते हैं मतलब आपका जो डाटा है उस डाटा के अंदर कितने टुकड़े बनाना चाहते हैं तो मैंने कहा पांच टुकड़े बनाने हैं 10 टुकड़े बनाने हैं वो आप यहां पे डिसाइड कर सकते हैं तो मैंने यहां पे फाइव टुकड़ लिए है यहां पर मतलब फाइव फोल्ड लिया है यहां पर बेसिकली एंड जैसे ही रन करूंगा तो देखिए इसने फाइव फोल्ड बना दिया है फाइव फोल्ड के अंदर देखिए क्या किया है 01 यहां लिया है 02 0 4 4 5 6 7 8 9 यहां पे ले लिया है और देखिए टोटल नंबर ऑफ फोल्ड्स की काउंटिंग करेंगे तो आपका पास टोटल नंबर ऑफ फोल्ड यहां पे कितने है फाइव है देखिए 1 फोल्ड आ गया देन इसी तरह से टू फोल्ड आ गया फिर देखिए आपका थ्री फोल्ड आ गया फिर फोर फोल्ड आ गया इसी तरह से फाइव फोल्ड आ गया तो यहां पर आप जितने भी स्प्लिट करना चाहते हैं अपने डटा सेट को उतने स्प्लिट्स यहां पर इस्तेमाल कर सकते हैं अब बात करते हैं ये सेटिस्फाई के फोल्ड कैशन कैसे काम करेगा तो यहां पर ये बेसिकली आपके पास क्लासि में बहुत अच्छा काम करेगा लेकिन अभी मैं यहां पर फिर भी अप्लाई करके बताऊंगा आप लोगों को कैसे ये सर्टिफाई k4 क्लेशन कैसे काम करता है इसके अंदर भी आपके पास क्या होता है नंबर ऑफ स्प्लिट होता है इसके अंदर मैं पांच स्प्लिट देना चाहूंगा बट ये यहां पर वर्क नहीं करेगा क्योंकि ये जो सेटिस्फाई k4 क्लास डिशन है ये आपके पास ओनली एंड ओनली फॉर क्लासिफिकेशन एनालिसिस के अंदर ही वर्क करता है आपके पास रिग्रेशन एनालिसिस के अंदर वर्क नहीं करता है तो बेसिकली जब भी आप क्लासि एनालिसिस का इस्तेमाल करें तब यहां पर सर्टिफाई के फ क्शन का इस्तेमाल कर सकते हैं तो बेसिकली गाइज सर्टिफाई के फल क्लस डिशन सेम एज ऐसे ही वर्क करता है लेकिन ये केवल और केवल किसमें वर्क करता है क्लासि एनालिसिस में ही वर्क करता है चलिए ये तो हो गया हमारे पास क्रॉस वैलिडेशन का तरीका लेकिन अभी हम हमारे डटा सेट के ऊपर चेक करना चाहते हैं जैसे ये हमारा डेटा सेट है इसके ऊपर चेक करना चाहते हैं कि ये हमें कितनी एक्यूरेसी दे सकता है तो इसकी एक्यूरेसी चेक करने के लिए हम क्रॉस वैलिडेशन का इस्तेमाल करेंगे अब ये क्रॉस वैलिडेशन कैसे बनाया जाएगा तो देखिए सबसे पहले मैं चलूंगा साइकल न के पास साइकल न के पास जाने के बाद में दैट मैं इस्तेमाल करूंगा मॉडल सिलेक्शन का मॉडल सिलेक्शन के अंदर मैं जाके इंपोर्ट करने वाला हूं किसे क्रॉस वैलिडेशन को तो आप यहां पे इंपोर्ट कर सकते हैं क्रॉस वेल स्कोर को तो मैं क्रॉस वेल स्कोर को इंपोर्ट कर रहा हूं अब देखिए क्रॉस वेल स्कोर इंपोर्ट करने से पहले ये आपसे पूछेगा आपका एस्टिमेटर एस्टिमेटर का मतलब है आपका मॉडल आप कौन से मॉडल के ऊप ट्रेन करना चाहते हैं पहले आपको बताना पड़ेगा तो मैं यहां पे फ्रॉम साइकल एंड लेके लीनियर मॉडल को इस्तेमाल करूंगा एंड लीनियर मॉडल के अंदर मैं यहां पे इंपोर्ट करने वाला हूं किसे आपके पास लीनियर रिग्रेसर को यस मैं लीनियर रिग्रेसर का इस्तेमाल करने वाला हूं चलिए लीनियर रिग्रेसर का इस्तेमाल यहां पे कैसे होगा ज समझते हैं यहां पे तो बेसिकली मैं सबसे पहले क्रॉस वल स्कोर को कॉल कर देता हूं यहां पर क्रॉस वल स्कोर के अंदर सबसे पहले आपसे मांगा जाएगा एस्टिमेटर एस्टिमेटर का मतलब आप किस मॉडल के ऊपर बनाना चाहते हैं वो बताइए आपका एक एक्सिस का डाटा y एक्सिस का डाटा यहां पर एंड सीवी सीवी मतलब आपके पास यहां पे क्रॉस वैलिडेशन कौन सी लगानी है देखिए इस सीवी का इस्तेमाल आप दो तरीके से कर सकते हैं कैसे अभी हम यहां बात करते हैं सबसे पहले हम यहां पर एस्टिमेटर दे देते हैं तो मैं यहां पे पहले तो पहले लीनियर रिग्रेशन को यहां पर दे देता हूं उसके बाद है मेरे पास यहां पर आपके पास x एक्स का डाटा तो x और y हमने ओरिजनली बना रखे हैं यहां पर उसके बाद क्या है गाइज यहां पर सीवी है हमारा अब ये सीवी कैसे काम करता है देखिए सीवी के अंदर आप डायरेक्ट नंबर दे सकते हैं जैसे कि 5 10 15 दे सकते हैं यहां पर ये 5 10 15 कैसे काम करते हैं बेसिकली यदि आपने फाइव दिया है तो ये क्या करेगा आपके इस डाटा को फाइव बार ट्रेन करेगा अलग-अलग तरीके से देन आपने यहां पे सिक्स दिया है तो सिक्स टाइम आपके पास यहां पे क्या करेगा अलग-अलग तरीके से ट्रेन करेगा अपने डाटा को राइट एंड यदि आपने सीवी की जगह नंबर नहीं सीवी के अंदर नंबर नहीं देके ए फॉर क्रॉस टेशन या फिर आपके पास प लीव वन आउट लीव p आउट यदि आप ये देते हैं तो ये उसके बेसिस पे काम करता है चलिए अभी हम क्या कर रहे हैं पहले बेसिक तौर पे इसे ट्रेन करते हैं जस्ट लाइक मैं फाइ दे रहा हूं यहां पर और मैं रन कर देता हूं देखिए रन करने पर क्या हुआ मुझे एक्यूरेसी मिली और एक्यूरेसी देखिए लीनियर रिग्रेशन की कितनी जा रही है देखिए 75 आ रही है 79 भी है 75 है 78 भी है और आपके पास कितनी है 70 भी है तो इस तरह से आपको एक्यूरेसी देखने को मिल रही है अभी मैं क्या करता हूं गाइस यहां पर इसको एक वेरिएबल के अंदर सेव कर लेता हूं और सॉर्टेड कर देता है कि आपके पास मिनिमम एक्यूरेसी कितनी है और मैक्सिमम एक्यूरेसी कितनी है एक रे हमें मिल जाएगी तो मैं इसे p नामम के एक वेरिएबल में सेव कर लेता हूं अच्छा यदि मैं p को रन करूं तो ये देखिए p मिल गया और वो भी कैसा एरे मिला यहां पर तो डॉट मैं यहां पर क्या करूंगा शॉर्ट का इस्तेमाल करूंगा यहां पर और p को मैं यहां पर दोबारा रन कर दूंगा तो देखिए मेरा डाटा सॉर्टेड हो चुका है और इसकी एक्यूरेसी देखिए कहां तक जा सकती है 70 से लगाकर 79 तक जा सकती है यदि आप परसेंटेज के तौर पर दिखाना चाहते हैं तो मल्टीप्लाई बा 100 कर दीजिए तो परसेंटेज पे आपके बेसिस प आ जाएगी देखिए 70 पर एक्यूरेसी से 79 पर एक्यूरेसी तक पहुंच सकती है बस ये इसकी एक्यूसी है यहां पर ट्स अ क्रॉस वैलिडेशन फाइव दिया आपने तब अब बात करते हैं कि यदि मैं यहां पर k4 क्रॉस डेशन इस्तेमाल करूं तो क्या होगा कुछ नहीं आप k4 क्रॉस डेशन इस्तेमाल आराम से कर सकते हैं यहां पर बस आपको नंबर ऑफ स्प्लिट देना है और जैसे कि नंबर ऑफ स्प्लिट दे देता हूं मैं यहां पर टोटल 10 स्प्लिट्स एंड रन करते हैं और यहां पर न करते हैं तो देखिए 10 स्प्लिट देने पर हमारे पास 10 तरीके से आपका डाटा ट्रेड हो रहा है अलग-अलग तरीके से देखिए आपके पास मिनिमम एक्यूरेसी कितनी है 60 है यहां पर मैक्सिमम एकसी कितनी है 83 पर तक आपकी जा सकती है इस डाटा सेट के ऊपर तो बेसिकली इसका अलग-अलग तरीके से टेंड करें और आज के इस वीडियो के जरिए हम बात करेंगे अनसुपरवाइज्ड मशीन लर्निंग के बारे में और हम ये भी जानेंगे कि इसके अंदर हमें कौन-कौन से एल्गोरिथम स्टडी करनी है तो बेसिकली गाइज अन सुपरवाइज मशीन लर्निंग की मैं बात करूं तो अनसुपरवाइज्ड मशीन लर्निंग मशीन लर्निंग का पार्ट है मशीन लर्निंग को हमने टोटल तीन टाइप से कैटेगरी इज किया था दैट इज अ सुपरवाइज देन अन सुपरवाइज एंड रिइंफोर्समेंट तो अब हम बात कर रहे हैं अनसुपरवाइज्ड मशीन लर्निंग के बारे में देखिए अनसुपरवाइज्ड मशीन लर्निंग जो होती है वो अन लेबल डाटा के ऊपर काम करती है तो पहला तो पॉइंट यहां पे आता है कि ये लेबल डाटा का मतलब क्या होता है और अनलेबल्ड डेटा का मतलब क्या होता है देखिए लेबल डाटा का मतलब मैं सिंपल सेंटेंस में बोलूं तो ऐसा डटा सेट जहां पे आपको इनपुट भी पता है और उसका जो डिजायर्ड आउटपुट है वो भी आपके पास यहां पे डिस्कस कर रखा है कि आप ये इनपुट के बेसिस पे ये आउटपुट आप निकालना चाहते हैं अन सुपरवाइज मशीन लर्निंग में क्या होता है गाइ यहां पे कि आपको जस्ट सिंपल कॉलम दे रखे होता हैं आपका कोई भी आउटपुट डिजायर नहीं होता है तो बेसिकली फिर हम यहां पे अनसुपरवाइज्ड डेटा के अंदर करते क्या है तो अनसुपरवाइज्ड के अंदर हम यहां पे करते हैं कैटेगरी इज यस हम यहां पे करते हैं क्लस्टरिंग क्लस्टरिंग को एक सिंपल सेंटेंस में बोले तो कैटेगरी इज होता है आपके पास यहां पे मतलब आप बेसिकली कैटेगरी इज करते हैं अब ये कैटेगरी इज किसके बेसिस पे करते हैं तो दैट डिपेंड आता है कि आपके पास यहां पे जो मोस्ट फ्रीक्वेंसी जें जो फीचर्स दिख रहे हैं उसके बेसिस पे करना है तो यह आपके डिपेंड रहता है कि आप यहां पे जो क्लस्टरिंग है मतलब बेसिकली कैटेगरी इज है वो किस बेसिस पे कर रहे हैं तो अन सुपरवाइज मशीन लर्निंग की बात करें तो ये अनलेबल्ड डेटा के ऊपर बात काम करती है और इसका काम क्या है गाइस यहां पे कि आपके जो भी डाटा है उसे कैटेगरी करना जस्ट लाइक देखिए मेरे पास यहां पे क्या है बहुत सारे इमेजेस पड़ी है जिसके अंदर बहुत सारी कैट है बहुत सारे डॉग है तो अब मेरा मेन फोकस क्या होगा यहां पे अन सुपर मशीन लर्निंग के अंदर कि जितने भी तरह की कैट दिख रही है यहां पे इनको एक अलग ग्रुप दे दूं और जितने भी तरह के डॉग दिख रहे हैं यहां पे इनको एक अलग ग्रुप के अंदर कर दिया जाए ताकि आपका डाटा क्या हो सके यहां पे कैटेगरी इज हो सके तो बेसिकली अनसु मशीन लर्निंग का काम क्या होता है गाइ यहां पे डाटा को कैटेगरी करना मतलब ग्रुप्स के अंदर डिवाइड कर ने का काम होता है अब ये ग्रुप्स के अंदर कैसे डिवाइड करता है तो सबसे पहले आप क्या करते हो आप अपना रॉ डाटा देते हो अब ये रॉ डाटा कैसा हो सकता है गाइज यहां पे मतलब अनलेबल्ड डाटा जो है वो किस तरह से दिख सकता है तो इसको जरा मैं आप लोगों को दिखाता हूं अनलेबल्ड डाटा कैसे दिखता है तो देखिए मैं आपको ले चलता हूं अपने डेटा सेट के अंदर राइट और डाटा सेट के अंदर देखिए मेरे पास यहां पे देखिए एक आड सीएवी और आय r सवी के अंदर डेटा सेट है यदि मैं iris.csv को ओपन करूं तो इसके अंदर आप देखिए मेरे पास केवल और केवल डेटा सेट है इसके आपके देखिए किसी भी फ्लावर की पैटल लेंथ सपल लेंथ पैटल विड्थ और सपल विड्थ के बारे में यहां पे मुझे बताया गया है लेकिन मुझे यहां पे ये नहीं बताया गया ये कौन सा फ्लावर है तो बेसिकली यहां पे आप इस डाटा को देखेंगे तो ये डाटा आपके पास एक नॉर्मल डाटा है यहां पे कोई आपका आउटपुट नजर नहीं आ रहा है कि आप यहां से क्या प्रेडिक्शन करना चाहते हैं आप फ्लावर का नेम प्रिडिक्ट करना चाहते हैं या फिर आप फ्लवर की कैटेगरी प्रिडिक्ट करना चाहते हैं तो ऐसा बिल्कुल यहां पे कुछ भी आइडेंटिफिकेशन नहीं है बस आपके पास आपका डाटा सेट यहां पे दे रखा है इस तरह के डाटा को बोलते हैं हम यहां पे अन लेबल डाटा एंड यहां पे आप क्या कर सकते हैं आप इसके अंदर जो नंबर्स आपके पास दे रखे हैं इनके अंदर आप पैटर्न को सर्च करते हुए मतलब पैटर्न को रिकॉग्नाइज करते हुए आप यहां पे क्या कर सकते हैं बेसिकली आप ग्रुप्स बना सकते हैं कि ये वाला जो पैटर्न है ये इस पर्टिकुलर ग्रुप्स कागा ये वाला जो पैटर्न है ये पर्टिकुलर इस ग्रुप्स का होने वाला है तो बेसिकली हम क्या करते हैं इस तरह के पैटर्स को पता करते हैं और यदि मैं लेबल डाटा की बात करूं यहां पे तो लेबल डाटा के अंदर जस्ट मैं इसी का लेबल डाटा बता रहा हूं आप लोगों को तो लेबल डाटा के अंदर आप नोटिस करेंगे तो आप क्या क्या है आपके इनपुट्स हैं कौन से सपल एंड पैडल लेंथ सपल विड्थ एंड पैडल विड्थ और आपका आउटपुट क्या है स्पीशीज है मतलब इसकी कौन सी स्पेसस होने वाली है दैट इज योर आउटपुट तो बेसिकली इसको हम क्या बोलते हैं लेबल डाटा बोलते हैं तो लेबल डाटा औरन लेबल डाटा में क्या डिफरेंस है यहां पे लेबल डाटा के अंदर आपके पास क्या होगा आपका इनपुट आउटपुट होगा और अनलेबल्ड डाटा के अंदर क्या होगा गाइज यहां पे आपके पास केवल और केवल इनपुट होने वाला है तो बस इसी अनलेबल्ड डाटा के ऊपर आपके पास क्या करता है अनसुपरवाइज्ड मशीन लर्निंग वर्क करता है अब ये अनसुपरवाइज्ड मशीन लर्निंग क्या करता है यहां पे आपका जो भी आपका रॉ डाटा होता है उससे लेता है एंड इंटरप्रिटेशन करता है इंटरप्शन करता है मतलब डाटा के पैटर्न को रिकॉग्नाइज करता है कि ये पैटर्न मिलते-जुलते किस पैटर्न के साथ है देन उसके बाद में आपके क्या करते हैं आपकी एल्गोरिथम अप्लाई करती है जो आप एल्गोरिथम अप्लाई करना चाहे वो एल्गोरिथम आप लगा सकते हैं देन प्रोसेस करने के बाद में आपका जो डाटा होता है अकॉर्डिंग टू आवर डेटा सेट के ऊपर मतलब आपका जो डेटा सेट है उसके अकॉर्डिंग आपका जो डाटा है वो आपका डिवाइड हो जाता है जैसे डॉग अलग हो गए और कैट अलग होए इस तरह से आपका वर्क करता है तो बेसिकली इसको हम बोलते हैं अनसुपरवाइज्ड मशीन लर्निंग अब देखिए अनसुपरवाइज्ड मशीन लर्निंग को हम दो टाट के अंदर डिवाइड करते हैं पहला होता है आपका क्लस्ट्रम दूसरा होता है एसोसिएशन दोनों के अंदर बहुत ही बड़ा मेजर डिफरेंस है यहां पे अब दोनों के अंदर क्या मेजर डिफरेंस है जरा इसको समझते हैं देखिए क्लस्टरिंग क्या करता है गाइस यहां पे क्लस्टरिंग आपका जितना भी आपका रॉ डाटा होता है उस रॉ डाटा के बेसिस पे आपके डाटा को डिवाइड करता है आपके पास अलग-अलग छोटे-छोटे क्लस्टर के अंदर जैसे देखिए मेरे पास बहुत सारा आपके पास क्या डाटा पड़ा है फ्रूट्स का जिसके अंदर बहुत सारे अलग-अलग तरीके के फ्रूट्स हैं तो इसने क्या रखा है कि आपके पास एल्गोरिथम के अंदर जाने के बाद अपने आप ही क्या करते हैं ये सारे फूड्स को अलग-अलग कैटेगरी कर देते हैं इस पार्ट को बोलते हैं हम क्ल स्ट्रिंग एंड अब आता है एसोसिएशन एसोसिएशन का मतलब होता है अरेंजमेंट अरेंजमेंट का मतलब बेसिकली गाइज मैं बात करूं यहां पे कि पहला डाटा के बाद दूसरा डाटा कौन सा आने वाला है दूसरा डाटा के बाद में तीसरा डाटा कौन सा आने वाला है दैट इज कॉल ऑफ एसोसिएशन जैसे कि मैं सिंपल सा बात करूं कि जब भी आप मॉल के अंदर विजिट करते हैं तो मॉल के अंदर विजिट करते वक्त आपने एक चीज नोटिस की होगी कि जैसे ही आपने मॉल के अंदर एंटर्स किया एंटर्स करने पर आपको क्या मिलता है सबसे पहले वो चीजें मिलती है जो सबसे ज्यादा पॉपुलर है उस मॉल के अंदर या फिर सबसे ज्यादा वो चीजें मिलती है जो सबसे ज्यादा बाय की जाती है उस मॉल के अंदर तो गाइज सबसे पहले आपका स्मॉल के अंदर वो चीजें मिलती है सेकंड उसी से रेवलेट चीजें मिलती है थर्ड उससे भी रेवलेट चीजें मिलती है तो बेसिकली यहां पे आप जो डटा देख रहे हैं वो आपके पास क्या कर रखा है कि पहले डटा के पास दूसरा डाटा मतलब पहला आपके पास यहां पे आइटम है उसके बाद जो दूसरा आइटम दूसरा आइटम के बाद में तीसरा आइटम इस तरह से क्या कर रखा है एक अरेंज कर रखा है सिस्टमैटिक वे के अंदर क्या कर रखा है रेंज कर रखा है तो दैट इज कॉल ऑफ एसोसिएशन मतलब आपके पास क्या कर रहा है आपने डेटा क्या-क्या एसोसिएट कर रखा है कि इस डेटा के बाद ये डाटा आना चाहिए इस डटा के बाद ये डाटा आना चाहिए दैट इज कॉल ऑफ असोसिएशन तो गाइज अनसुपरवाइज्ड मशीन नि को हमने दो पार्ट के अंदर कैटेगरी इज कर रखा है कौन-कौन सा पहला है क्लस्टरिंग दूसरा है एसोसिएशन जहां पे आप उसे बोल सकते हैं अरेंजमेंट मतलब आपकी चीजें यहां पे पड़ी है बिकरी तरीके से पड़ी है और आप उनको क्या कर रहे हैं अरेंज कर रहे हैं कि पहला ये होगा दूसरा ये होगा तीसरा ये होगा चौथा ये होगा इसको बोलते हैं हम असोसिएशन तो बेसिकली गाइज यहां पे अन सुपरवाइज मशीन लर्निंग को हमने दो पार्ट के अंदर कैटेगरी कर रखा है अब इसके अंदर हमारे पास कौन-कौन सी एल्गोरिथम आती है तो इसके अंदर कुछ ये एल्गोरिथम्स आती हैं जैसे कि केमन क्लस्टरिंग हो गई हेर क्लस्टरिंग हो गई डीबी स्कन क्लस्टरिंग हो गई आप हो गई आप पयो के साथ यहां पे आप एफपी ग्रोथ भी देख सकते हैं यहां पे यस एफपी ग्रोथ भी आप यहां पे एल्गोरिथम का इस्तेमाल कर सकते हैं फिर आपके पास हो गई पीसीए प्रिंसिपल ऑफ कंपोनेंट एनालिसिस जो कि आपके डायमेंशन रिडक्शन के लिए काम आती है राइट तो बेसिकली ये कुछ पॉपुलर एल्गोरिथम्स हैं जो कि आपके पास क्या करती है अनसुपरवाइज्ड मशीन लर्निंग के अंदर आती है और आज के इस वीडियो के जरिए हम बात करने वाले हैं के मीन क्लस्टरिंग के बारे में देखिए के मन क्लस्टरिंग को स्टार्ट करने से पहले क्लस्टर के बारे में बात करें तो क्लस्टर होता क्या है यदि आपको पाइथन मशीन लर्निंग डेटा साइंस एंड डेटा एनालिस जैसी फीड में अपने आपको को ग्रो करना है तो इसके लिए डब्लू कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो क्लस्टर आपके पास क्या होता है सिंपल सा आपके पास क्लस्टर का मतलब होता है ग्रुपिंग करना अब ग्रुपिंग का मतलब क्या होता है गाइज यहां पे लेट्स सपोज आपके पास क्या है इस तरह से आपका डाटा दे रखा है जैसे आपका एक् एक्सेस डाटा दे रखा है x1 x2 एकटा दे रखा है और ये x1 x2 डेटा देने के बाद में ये डेटा पॉइंट्स कुछ इस तरह से आपके पास आ रहे हैं राइट ये डटा पॉइंट आपके पास इस तरह से आ रहे हैं और आपको बोला जा रहा है कि इसके अंदर कितने नंबर ऑफ ग्रुप्स बनने वाले हैं तो आप क्या करते हैं क्लस्टरिंग का इस्तेमाल करते हैं और क्लस्टरिंग की हेल्प से क्या करते हैं गाइस यहां पे कि आप पहले एक ग्रुप ये बनाते हैं और आप यहां पर दूसरा ग्रुप कुछ इस तरीके से डिजाइन करते हैं तो दैट्ची डीवी स्कन क्लस्टरिंग का इस्तेमाल करते हैं अकॉर्डिंग टू योर डेटा सेट यस डेटा सेट के अकॉर्डिंग आप क्या करते हैं क्लस्टरिंग का इस्तेमाल करते हैं अब हम यहां पे ये समझने वाले हैं कि ये जो केमन क्लस्टरिंग है ये कैसे इस्तेमाल की जाती है इससे पहले मैं आपको क्लस्टरिंग का एक लाइव एग्जांपल बताने वाला हूं यहां पे कि क्लस्टरिंग कहां पे इस्तेमाल होती है तो इसके लिए हम चलते हैं हमारे google's का भी इस्तेमाल करते होंगे जहां पे अपनी फोटोज अपलोड करते हैं राइट आप डिफरेंट डिफरेंट फोटोज को अपलोड करते हैं यहां पे लेकिन कभी आपने एक चीज नोटिस की है कि जब आप फोटो वाले सेशन में जाते हैं मतलब आप google's में वापस दोबारा जाते हैं तो google's के अंदर जो भी आपने फोटोज अपलोड किए जैसे मैंने यहां पे बहुत सारी फोटोज अपलोड किए है यहां पे इसके अंदर एक एक्सप्लोर बटन होता है अब आपके फोन में भी एक एक्सप्लोर बटन आएगा उस एक्सप्लोर बटन के ऊपर जैसे ही आप क्लिक करेंगे तो आपके पास क्लस्टरिंग का बहुत ही अच्छा एग्जांपल देखने को मिलेगा कैसे देखिए ऊपर उन पीपल्स की फोटोज आपके पास आ जाएगी जो कि सिमिलर फोटो कंसीडर करते हैं मतलब इस फोटोस के अंदर आप देखेंगे तो इस फोटोस के अंदर जो भी सिमिलर फोटोज आपको दिख रही है यहां पे उन लोगों के फेसेस ऊपर आ चुके हैं और जैसे ही आप उस फेस के ऊपर क्लिक करेंगे आपके पास उस फेसेस से रिलेटेड उनकी जितनी भी फोटोज हमारे google's के अंदर है वो आपको देखने को मिल जाएगी जैसे मैंने आमिर खान की फोटो पे क्लिक किया मुझे आमिर खान की सारी फोटोज मिल गई यदि मैं सलमान खान की फोटो पे क्लिक करता हूं तो देखिए मुझे सलमान खान की जितनी भी फोटोस हैं इसके अंदर वो सारी की सारी देखने को मिल गई राइट तो ये आपके पास किस तरह से पॉसिबल हो पाया है ये आपका पॉसिबल हो पाया है क्लस्टरिंग की हेल्प से यस दैट इज अ पॉसिबल इन क्लस्टरिंग यदि क्लस्टरिंग नहीं होता तो ये आपके पास ग्रुप्स जो है नहीं बन पाते तो ये ग्रुप बनने के पीछे रीजन आपके पास क्या है क्लस्टरिंग का है तो बस आज की इस वीडियो के जरिए हम यही समझ रहे हैं कि ये क्लस्टरिंग एक्चुअल में परफॉर्म कैसे होती है मतलब हमारे पास यदि डाटा है तो डेटा के साथ ये क्लस्टर कैसे परफॉर्म किया जाता है जरा उसको समझते हैं तो देखिए हम इस्तेमाल कर रहे हैं यहां पे केमिन क्रस्टिंग का तो केमिन क्रस्टिंग किस तरह से वर्क करती है जरा इसको समझते हैं यहां पे तो देखिए केमिन कस्टिंग आपके पास एक अनसुपरवाइज्ड का एग्जांपल है और इसके अंदर जो आपका डटा आता है वो एक अनलेबल्ड डाटा होता है अब अनलेबल्ड डेटा क्या होता है तो इसके बारे में हम पह पले भी डिस्कस कर चुके हैं एक मैं छोटा सा इंट्रोडक्शन देना चाहूंगा कि एक ऐसा हमारे पास डटा सेट की बात कर रहा हूं जिसके अंदर आपके पास कोई आउटपुट ही नहीं होता मतलब विदाउट आउटपुट आप यहां पे काम करते हैं यस आप यहां पे बल्कि आउटपुट निकाल रहे होते हैं कि बेसिकली इसके अंदर कितने नंबर ऑफ ग्रुप्स बनने वाले हैं ये आप डिसाइड कर रहे होते हैं तो बेसिकली आपके पास कोई आउटपुट नहीं होता केवल और केवल इनपुट्स ही दिए जाते हैं यहां पे दैट इस तरह के डेटा सेट को हम बोलते हैं आपके पास अनलेबल्ड डेटा सेट यस तो यहां पर क्या होता है गाइज यहां पे अनलेबल्ड डेटा सेट के ऊपर काम किया जाता है यहां पे अब ये अनलेबल्ड डेटा सेट के ऊपर आपके पास केमन क्लस्टरिंग कैसे वर्क करती है तो केमन से आपको क्या पता चल रहा है मतलब के मींस का मतलब क्या हो रहा है यहां पे थोड़ा सा आईडिया लग रहा होगा यहां पे अनलेबल्ड डेटा सेट के ऊपर किया जाता है अब जरा देखिए यहां पे कि ये के मींस का मतलब क्या है यस थोड़ा सा यहां पे इस नाम के ऊपर थोड़ा सा गौर करें यहां पे तो के मींस का मतलब होता है k कोई नंबर आपके पास होगा यहां पे मींस का मतलब है मीन यस मींस का मतलब क्या है मीन बेसिकली के मीन क्लस्टरिंग जो एल्गोरिथम्स है आपके पास यहां पे वो मीन के बेसिस पे क्या करती है क्लस्टर करती है अब ये मीन के बेसिस प कैसे क्लस्टर करती है जरा समझते हैं तो देखिए यदि हमारे पास इस तरह का कोई डेटा सेट है यहां पे तो केमन क्लस्टरिंग क्या करती है गाइस यहां पे कि आपके पास इस तरह से छोटे-छोटे ग्रुप्स बना देती है जैसे कि पहला ग्रुप्स ये बनाया दूसरा ग्रुप से ये बनाया तीसरा ग्रुप से आपके पास ये बनाया इस तरह से छोटे-छोटे ग्रुप्स बना लेती है और आपको क्या करती है क्लस्टर के तौर पे आपको दे देती है राइट आपको क्लस्टर के तौर पर देती है कि इसके अंदर तीन नंबर ऑफ क्लस्टर आपके पास बन र है राइट लेकिन इसके बनने के पीछे प्रोसीजर होता है उस प्रोसीजर को समझते हैं तो जरा देखिए प्रोसीजर क्या है यहां पे तो देखिए मैंने वही डटा सेट वापस लिया है यहां पे अब देखिए केमन क्लंग करती क्या है सबसे पहले केविन कस्टिंग क्या करती है अपने सेंट्रोइड्स पॉइंट्स होते हैं जो कि आपका एक सेंटर पॉइंट कहलाता है राइट तो बेसिकली गाइज यहां पे क्या करेगी केम इन कस्टिंग आपके पास एक सेंटर पॉइंट को डिसाइड करेगी जैसे कि मैंने ये दो सेंटर पॉइंट को यहां पे डिसाइड कर रखा है यहां पे अब दो सेंटर पॉइंट को डिसाइड कर रखा है अब एक सेंटर पॉइंट को मैं रेड कलर से बना रहा हूं और दूसरे सेंटर पॉइंट को मैं यहां पे क्या कर रहा हूं आपके पास ब्लू कलर से बना रहा हूं ये दो सेंटर पॉइंट इसने डिसाइड किया अब दो सेंटर पॉइंट डिसाइड करने के बाद में केमन क्लस्टरिंग क्या करती है आपके पास कि केमन क्लस्टरिंग आपके पास इन दोनों से मिलने वाली एक लाइन बनाती है यहां पे सिंपल सी एक लाइन बनाती है लाइन बनाने के बाद में क्या करती है इसकी जो मिडल वाली लाइन है उस मिडल वाली लाइन से एक लाइन को पास कर देती है अब ये पास करने के पीछे रीजन क्या हुआ गाइ देखिए यदि आप इस पास को नहीं समझना चाहते तो आप ये समझ सकते हैं कि ये जो सेंट्रोइड्स सेंट्रोइड्स दिख रहे हैं यहां पे इन सेंट्रोइड्स जो नियरेस्ट जो डिस्टेंस पे जो भी एलिमेंट्स आ रहे हैं जो नियरेस्ट डिस्टेंस पे जो भी एलिमेंट आ रहे हैं उनको अपने टर्म्स में मतलब अपने एरिया में कंसीडर कर लेती है अपने एरिया में कंसीडर करने का मतलब क्या है गाइज यहां पे सिंपल सा ये है कि उनको भी क्या करती है ये रेड कलर की मार्किंग के अंदर ला लेती है ताकि ये एक क्लस्टर बन जाए राइट अब ये भी क्या करेगा अपने जो नियरेस्ट पॉइंट है उनको ढूंढेगा और नियरेस्ट पॉइंट को ढूंढने के बाद में ये उनके ऊपर क्या करेगा एक इस तरह से क्लस्टर बना लेगा दैट्ची है इस तरह से क्लस्टर बना लेगा इसको सिंपल टर्म्स के अंदर समझे तो इसको सिंपल टर्म्स में कुछ इस तरह से करती है कि आपके पास ये दो पॉइंट है इन दो पॉइंट से निकलने वाली एक सीधी डिस्टेंस लाइन ली जाती है फिर क्या करते हैं इनके मिडल से एक लाइन को पास आउट किया जाता है जैसे ही आप इस मिडल को लाइन को पास आउट करेंगे तो आपके पास क्या बनेंगे यहां पे कुछ डेटा पॉइंट्स बनेंगे जो कि लाइन के उस तरफ होंगे और जो कि लाइन के इस तरफ है अब जो लाइन के इस तरफ है यहां पे उनके ऊपर एक क्लस्टर डिजाइन कर लिया जाता है मतलब एक ब्लू कलर की लाइन डिजाइन कर ली जाती है दैट अ ब्लू कलर कस्टर और जो ऊपर वाली लाइन रह गई हमारे पास यहां पे उसके ऊपर भी क्या करते हैं एक क्लस्टर डिज़ाइन कर लेते हैं दैट अ रेड कलर क्लस्टर अब जैसा कि हमें पता है कि ये क्लस्टर सही डिज़ाइन नहीं हुए हैं यहां पे तो अब क्या करते हैं गाइज यहां पे अब ये मीन निकालती है क्या निकालती है मींस निकालती है मींस कैसे मतलब यहां पे गाइज देखिए ये क्या करती है डेटा पॉइंट्स इन सबसे मीन को कंसीडर करती है मतलब मीन को निकालती है यहां पे अब ये क्या करती है गाइज यहां पे कि ये जो पॉइंट्स है यहां पे ये पॉइंट्स आपको पता है कि ये सही कलस्टर नहीं बना है क्योंकि ये नॉट अ राइट क्लस्टर यस इसका राइट क्लस्टर क्या होना चाहिए था गाइज यहां पे इस राइट पॉइंट का मतलब इसका सेंटर पॉइंट यहां पे आना चाहिए था जिसका सेंटर पॉइंट यहां कहीं आना चाहिए था दैट द राइट क्लस्टर लेकिन अब आप यहां पे क्या करेगी यहां पे यस ये केमन क्लस्टरिंग क्या करती है गाइज यहां पे केमन क्लस्टरिंग जो आपके डेटा पॉइंट के ऊपर आपने जो सेंटर पॉइंट बनाया यस जो आपने ये सेंटर पॉइंट बनाया यहां पे इन सेंटर पॉइंट से आपने पहले ये लाइन गुजारी फिर आपने ये लाइन कट बनाई तो गाइ अब यहां पे जो अगला पॉइंट आएगा कि ये जो पॉइंट्स आपके पास दिख रहे हैं यहां पे ये पॉइंट आपका सही तरीके से क्लस्टर नहीं हो पा रहे हैं मतलब ये सेंटर पॉइंट नहीं है इन सब डेटा पॉइंट का क्या करते हैं गाइज यहां पे मीन निकल आ जाता है मतलब यहां पे फर्स्ट ऑफ ऑल आप क्या करेंगे यहां पे अब इनका क्या करेंगे मीन निकालेंगे ये भी जो डेटा पॉइंट आपके पास आ गए हैं इन सब का मीन निकालेंगे अब ये जो मीन निकालते हैं तो मीन आपको पता है कि इन सब डेटा पॉइंट का मीन कहां आएगा यहां कहीं आपके पास आएगा इन सभी डेटा पॉइंट का मीन कहां आएगा यहां कहीं आपके पास आएगा तो बेसिकली ये जो आपने सेंटर पॉइंट देखा है ये सेंटर पॉइंट क्या करते हैं इस जगह पर मूव करते हैं यस ये जो सेंटर पॉइंट देख आपके पास यहां पे ये क्या करते हैं इस जगह पर आपके पास मूव करने लग जाते हैं और ये जो पॉइंट आप देख रहे हैं ये पॉइंट क्या करते हैं गाइ यहां पे इस जगह पर मूव करने लग जाते हैं तो जैसे ही आप यहां पे इस जगह पे मूव करेंगे ये यस जैसे ही आप यहां पे देखेंगे कि इस जगह पे मूव करेंगे तो आपके न्यू सेंटर पॉइंट आपको देखने को मिल जाएंगे दैट अ फर्स्ट सेंटर पॉइंट एंड दैट इज अ सेकंड सेंटर पॉइंट और सेकंड सेंटर पॉइंट ले आने के बाद में आप क्या करते हैं इन दोनों के लाइन को मिक्स करते हैं और इसके बाद यहां पे रखते हैं तो अब आप देख पाएंगे कि ये एक आपके पास क्या कर रहे हैं परफेक्ट क्लस्टर आपके पास डिज़ाइन हो रहा है राइट तो गाइज इस तरह से आपके पास क्या करता है केमिंग लस्टिंग काम करता है देखिए क्या स्टेप्स है मैं आपको बता देता हूं यहां पे स्टेप नंबर फर्स्ट के अंदर आपके पास क्या करते हैं एक रैंडम सेंटर पॉइंट यहां पे लिया जाता है यस आपके पास क्या करते हैं रैंडम आपके पास क्या करते हैं यहां पे आप क्या करते हैं यहां पे सेंटर पॉइंट को लेते हैं यहां पे मतलब बेसिकली रैंडम सेंटर पॉइंट लिया जाता है ओके तो मैं यहां पे लिख देता हूं सेंटर आपके पास क्या कर जाता है रैंडम लिया जाता है स्टेप टू के अंदर आपके पास क्या करता है यहां पे स्टेप टू के पास आपके पास क्या करते हैं ग्रुप्स बनाने स्टार्ट हो जाते हैं राइट ग्रुप्स बन जाते हैं कि भाई पहला सेंटर पॉइंट ये लिया सेंटर पॉइंट ये लिया अब उसके बाद क्या हो रहा है नियरेस्ट पॉइंट को यहां पे सर्च किया या फिर आप इस तरह से ले सकते हैं कि जैसे इस लाइन को कट किया एंड देन यहां पे क किया कट किया तो आपके पास क्या हुआ एक ग्रुप आपके पास ये बना और दूसरा ग्रुप आपके पास क्या बना ये बना राइट अब इस चीज को परफेक्ट बनाने के लिए ये क्या करते हैं गाइज यहां पे स्टेप थ्री का इस्तेमाल करते हैं और स्टेप थ्री के अंदर क्या करते हैं गाइ यहां पे कि ये जो सेंटर पॉइंट मिले हैं ये सेंटर पॉइंट परफेक्ट नहीं है तो जो आपके पास डटा पॉइंट आए हैं उस डेटा पॉइंट के अकॉर्डिंग ये अपने आप को मूवमेंट करने लग जाते हैं राइट इनको क्या करते हैं मूव कर करते हैं मतलब ये वाला जो पॉइंट आपके पास दिख रहा है ये वाला पॉइंट उधर मूव हो जाता है और ये वाला पॉइंट जो है वो इस तरफ मूवमेंट हो जाता है मतलब बेसिकली गाइज यहां पे अब निकाला जा रहा है आपका मीन और मीन के हिसाब से आप क्या कर रहे हैं यहां पे मूव कर रहे हैं यस जैसे आपका मी निकला है उसके हिसाब से आपके मूव निकल मूव होते हैं और मूव होके आपके पास परफेक्ट क्लस्टर बनते हैं तो केमिन क्लस्टरिंग जो आपके पास है इन तीन पॉइंट से होते हुए अपने आप को एक परफेक्ट क्लस्टर एल्गोरिथम बनाता है मतलब पहले आपका सेंटर पॉइंट ढूंढा फिर उसके बाद आपके पास यहां पे ग्रुप्स बनाए ग्रुप्स बनाने के बाद में उनके अंदर चेक किया कि कि इनका मीन जो है और जो सेंटर पॉइंट है वो क्या सेम ला कर रहा है या नहीं कर रहा है यदि ये सेम लाइ नहीं कर रहा है देन क्या करेंगे यहां पे ये मूवमेंट करना लग जाएंगे और मूव करते हुए कहां पहुंच जाएंगे आपके पास गाइ यहां पे आपके मूव करते हुए आपके पास ओरिजिनल डेटा पॉइंट के पास पहुंच जाएंगे ओरिजिनल मतलब ओरिजिनल क्लस्टर ग्रुप्स के पास पहुंच जाएंगे ताकि आपको एक बेस्ट सेंटर्ड आपको मिले तो गाइ इस तरह से आपके पास क्या करता है केमन क्लस्टरिंग यहां पे वर्क करता है अभी भी हमारे पास यहां पे एक बहुत बड़ा चैलेंज है यहां पे कि केमन क्लस्टरिंग के एल्गोरिथम हमें वर्किंग तो समझ में आ गई लेकिन इसके अंदर नंबर ऑफ ग्रुप्स कितने होने चाहिए मतलब बेसिकली गाइज यहां पे बात करें कि क्या इसके अंदर ऑलवेज एंड ऑलवेज दो नंबर ऑफ ग्रुप ही बनेंगे नहीं ऐसा नहीं है कि हमेशा और हमेशा इसके अंदर दो नंबर ग्रुप बनेंगे इसके अंदर आपके पास नंबर ऑफ ग्रुप्स बन सकते हैं जैसे इस पर्टिकुलर एल्गोरिथम के अंदर बात इस पर्टिकुलर डेटा सेट के ऊपर बात करूं यहां पे तो एक ग्रुप्स आपका पास ये बन सकता है दूसरा ग्रुप आपके पास ये बन सकता है तीसरा ग्रुप आपके पास ये बन सकता है मतलब यहां पे नंबर ऑफ ग्रुप्स बन सकते हैं अब ये जो नंबर ऑफ ग्रुप्स होता है इन्हीं को हम क्या बोलते हैं k बोलते हैं और ये जो आपके पास मीन के थ्रू आपके पास मूवमेंट होके जो परफेक्ट ग्रुप्स बनाते हैं इसी वजह से इसे हम यहां पर के मींस एल्गोरिथम बोलते हैं यहां पर अब सबसे बड़ी एक पॉइंट आती है कि हमें कैसे पता चलेगा कि इसके अंदर कितने नंबर ऑफ क्लस्टर होने चाहिए मतलब यदि हम डेटा सेट की बात करें तो इसका जो डेटा सेट हमें दिखता है वो कुछ इस तरह से दिखता है जैसे कि मैं आपको एक थोड़ा सा डेटा सेट दिखाना चाहूंगा तो ये मेरे पास एक डेटा सेट है अब इस डेटा सेट को यदि गौर से देखें तो इसके अंदर आपके पा देखेंगे तो इसके अंदर कोई आपके पास आउटपुट नजर नहीं आ रहा मतलब क्या आपके पास आउटपुट होना चाहिए कितने नंबर ऑफ ग्रुप्स होने चाहिए यहां पे कोई नजर नहीं आ रहा तो बेसिकली हमारे पास क्या होता है कि इस तरह का डाटा हमें देखने को मिलता है अब जब हमें इस तरह का डाटा देखने को मिला तो इसके अंदर कोई भी नंबर ऑफ ग्रुप्स हमें पता नहीं है तो हमें क्या करना पड़ता है हमें बेस्ट ग्रुप को फाइंड आउट करना पड़ता है अब ये बेस्ट ग्रुप कैसे फाइंड आउट किया जाता है यस इस बेस्ट ग्रुप को कैसे फाइंड आउट कर सकते हैं तो इसके लिए हम इस्तेमाल करते हैं यहां पे एल्बो मेथड का मतलब बेसिकली गाइज यहां पे हम इस्तेमाल करते हैं डबल सीएसएस का मेथड का ये जो डब्ल्यू सीएसएस है इसकी हेल्प से हम क्या करते हैं बेस्ट नंबर ऑफ ग्रुप्स को फाइंड आउट करते हैं मतलब हमारे पास कोई भी डटा सेट है यहां पे उसके अंदर कितने नंबर ऑफ क्लस्टर बनेंगे यह हमें कौन बताता है डब्ल्यू सीएसएस बताता है और इस डब्ल्यू सीएसएस का नाम क्या है यहां पे विद इन अ क्लस्टर सम ऑफ स्क्वायर यस विद इन अ क्लस्टर सम ऑफ स्क्वायर आप क सकते है इसको आप इस तरह से बोल सकते हैं ट्स एरर दैट से क्या बोल सकते हैं आप यहां पे एरर बोल सकते हैं अब ये एरर कैसे फाइंड आउट की जाती है जरा इसको बात करते हैं यहां पे तो लेट्स सपोज हमारे पास यही हमारा एक डाटा है राइट लेट्स सपोज हमारे पास क्या है यही हमारा डाटा है यहां पे तो हम क्या करते हैं गाइज यहां पे सबसे पहले नंबर ऑफ क्लस्टर देते हैं यहां पे टू यस सबसे पहले नंबर ऑफ बेसिक क्लस्टर की बात करूं तो दो नंबर ऑफ क्लस्टर इसमें बन सकते हैं तो दो नंबर ऑफ क्लस्टर मतलब मैंने जैसे यहां बनाया और यहां बनाया राइट ये बनाने के बाद में हम क्या करते हैं इन सभी डेटा पॉइंट के बीच की जो डिस्टेंस है यहां पे इन डिस्टेंस को हम कैलकुलेट करते हैं यस इन डिस्टेंस को हम क्या करते हैं कैलकुलेट कर लेते हैं सभी डटा पॉइंट्स के फिर हम क्या करते हैं फिर इन्हीं डिस्टेंस की हम क्या करते हैं फिर से कैलकुलेट कर लेते हैं यहां पे अब ये जो डिस्टेंस आई है यस यहां की जो डिस्टेंस आई है और यहां की जो डिस्टेंस आई है यहां पे हम क्या करेंगे गाइज यहां पे कि ये जो डिस्टेंस डी आई है यहां पे हम उसन डिस्टेंस का क्या करेंगे स्क्वायरिंग करेंगे एंड स्क्वायरिंग करने के बाद में हम उन डिस्टेंस को एरिया उन डिस्टेंस को सम कर देंगे राइट तो आप क्या करेंगे कि भाई आपका जो भी क्लस्टर बना है लेट्स आपके पास यहां पे एक क्लस्टर ये बना है तो यहां पे ये जो क्लस्टर बना है इसके अंदर आप क्या करोगे इनकी डिस्टेंस को कैलकुलेट करोगे डिस्टेंस की कैलकुलेट मतलब सेंट्रड से डिस्टेंस की कैलकुलेट करनी है यहां पे तो सेंट्रोइड्स की जैसे ही आपने कैलकुलेशन की तो डिस्टेंस की कैलकुलेशन करने के बाद में जो आपकी डिस्टेंस आई है उसको आपने क्या किया स्क्वायरिंग किया स्क्वायरिंग करके आपने क्या किया यहां पे सम कर दिया तो आपके पास ये एक पहली वैल्यू आ गई है किस पे दो नंबर ऑफ क्लस्टर पे अब बात आ गई आपके तीन नंबर ऑफ क्लस्टर पे तीन नंबर क्लस्टर पे एक ये आएगा एक ये आएगा और एक ये आएगा अब क्या करेंगे इसी सेंटर पॉइंट से आप क्या करेंगे करेंगे इन सब की डिस्टेंस को आप फिर से कैलकुलेट करेंगे यस इसी सब पॉइंट से आप क्या करेंगे इन सभी पॉइंट को डिस्टेंस को फिर से कैलकुलेट करेंगे एंड कैलकुलेट करने के बाद आप क्या करेंगे यहां पे वही आपको स्क्वायर करना है और सम करना है अब यहां से आपके पास क्या आएगी इस तरह से आपकी डब्लू सीएसएस की वैल्यू आएगी और जब आप डब्लू सीएसएस की वैल्यू को और नंबर ऑफ क्लस्टर के बीच में जब आप ग्राफ बनाते हैं तो यह ग्राफ आपके पास कुछ इस तरह से दिखता है और ये जो ग्राफ आपके पास दिखता है ये लुक लाइक आपको किससे दिखता है एल्बो की तरह दिखता है मतलब आपकी जो हैंड शेप होती है यहां पे उस हैंड शेप की तरह आपके पास दिखता है तो देखिए जब आपके पास नंबर ऑफ क्लस्टर्स बढ़ते रहते हैं तो डब्ल्यू सीएसएस की जो वैल्यू है यहां पे वो लगभग लगभग कांस्टेंट होती चली जाती है मतलब आप डब्ल्यू सए की वैल्यू को देखेंगे तो एकदम कांस्टेंट होती रहती है अब इस कांस्टेंट वैल्यू के अंदर आपके पास जो आपका एल्बो पॉइंट होता है मतलब आपके पास आपके जो हैंड है ये इस हैंड के अंदर ये क्या आपका एल्बो पॉइंट है यहां पे तो बस इसी ग्राफ के अंदर आप देखेंगे तो इस ग्राफ के अंदर क्या है आपके पास यहां पे ये एल्बो पॉइंट्स आपको देखने को मिलता है यस इस ग्राफ के अंदर क्या है आपके पास यहां पे ये एल्बो पॉइंट देखने को मिलता है और ये एल्बो पॉइंट जिस नंबर ऑफ क्लस्टर पे जाके आपके पास आता है यहां पे उतने ही नंबर ऑफ क्लस्टर आपके पास बनते है मतलब उतने ही आपके पास क्या आता है बेस्ट नंबर ऑफ क्लस्टर उसके अंदर बनते है तो बेसिकली गाइज आपके पास क्या होता है कि जो आप डेटा सेट इस्तेमाल कर रहे हैं उस डेटा सेट के अंदर आप क्या करेंगे सबसे पहले डब्ल्यू सीएसएस की वैल्यू फाइंड आउट करेंगे डब्ल्यू सीएस की वैल्यू फाइंड आउट करने के बाद में वो आपको क्या बताएगा बेस्ट नंबर नंबर ऑफ क्लस्टर बनाएगा बेस्ट नंबर ऑफ क्लस्टर की आपके पास वैल्यू देगा यहां पे कि इसके अंदर दो बनने चाहिए तीन बनने चाहिए चार बनने चाहिए वो बेस्ट नंबर ऑफ वैल्यू आपको देगा और उस बेस्ट नंबर ऑफ वैल्यू से आप क्या करेंगे नंबर ऑफ क्लस्टर डिजाइन करके आप अपने डेटा सेट को ग्रुप्स के अंदर कन्वर्ट कर सकते हैं तो आई थिंक आपको आईडिया हो गया होगा कि नंबर ऑफ क्लस्टर कैसे फाइंड आउट करना है तो नंबर ऑफ क्लस्टर फाइंड आउट करने के लिए हम इस्तेमाल करते हैं एल्बो मेथड का और ये एल्बो मेथड क्या करता है हमें बेस्ट नंबर ऑफ क्लस्टर फाइंड आउट करके देता है अब इसके अंदर एक छोटा सा पॉइंट आता है यहां पे कि लेट्स सपोज आपके पास क्या होता है यहां पे गाइ कि इसके अंदर आपके पास यहां पे नंबर ऑफ क्लस्टर बनाने के लिए बोला जाए अब नंबर ऑफ क्लस्टर बनाने के लिए बोला जाए तो इसके अंदर आपके पास नंबर ऑफ क्लस्टर कितने बनने चाहिए तीन क्लस्टर बनने चाहिए थे यहां पे अब वो तीन क्लस्टर कैसे बनने चाहिए गाइज यहां पे कि पहला क्लस्टर ये बनना चाहिए था दूसरा क्लस्टर आपके पास ये बनना चाहिए था तीसरा क्लस्टर आपके पास ये बनना चाहिए था लेकिन यदि ये तीन नंबर ऑफ क्लस्टर ऐसे नहीं बना के क्या होता है कभी कभी आपके पास यहां पे ये तीन नंबर ऑफ क्लस्टर ऐसे भी डिजाइन हो सकते हैं जैसे कि मैं अभी ये बात करना चाहूं यहां पे तो ये आपके पास तीन नंबर ऑफ क्लस्टर इस तरह से भी डिजाइन हो सकते हैं और हमें पता है कि ये तीन नंबर ऑफ क्लस्टर डिजाइन सही नहीं है क्यों सही नहीं है यहां पे गाइ क्या होता है कि कभी-कभी आपका जो डेटा सेट होता है इस डेटा सेट के अंदर जो आपके सेंटर पॉइंट होते हैं यहां पे वो सेंटर पॉइंट आपके पास क्या होता है बहुत नजदीक नजदीक आ जाते हैं यस बहुत नजदीक नजदीक आ जाते हैं और इस नजदीक नजदीक के पॉइंट ऑफ व्यू से क्या होता है गाइज यहां पे कि ये जो तीन क्लस्टर ऐसे बनने चाहिए थे मतलब ये तीन सेंटर पॉइंट हो गए आपके पास यहां पे तो बेसिकली पहला दूसरा और तीसरा ये बनना चाहिए था तो आपके पास जो क्लस्टर पॉइंट है वो कुछ इस तरह से डिजाइन हो जाते है तो ये दोनों क्या होता है बहुत पासपास हो जाता है जिसकी वजह से आपको बेस्ट क्लस्टरिंग नहीं मिल पाती है अब इस बेस्ट लस्टिंग को लाने के लिए हम क्या इस्तेमाल करते हैं के मीन यस के मीन प्लस प्लस का इस्तेमाल करते हैं ये के मन प्लंग के मन प्लस प्लस क्या करता है गाइज यहां पे कि आपके जो सेंटर पॉइंट है इन सेंटर पॉइंट को आपके पास नियरेस्ट लाने की जगह मतलब आपके पास यहां पे पासपास लाने की जगह दूर दूर लेके चला जाता है मतलब आपके पास यहां पे ये जो सेंटर पॉइंट आपके पास आ रहे है ये सेंट्रोइड्स के पास आ रहे हैं इन सेंट्रड पॉइंट को वो दूर दूर लेके चला जाता है ताकि आपके पास जो कस्टर है गाइज यहां पे वो क्लस्टर आपके पास परफेक्ट इस तरह से तीन क्लस्टर बन जाए कभी-कभी क्या होता है कि नंबर ऑफ क्लस्टर्स बनाने में प्रॉब्लम आ जाती है और वो परफेक्टली क्लस्टर नहीं बना पाता है तो उसको परफेक्टली क्लस्टर बनाने के लिए मतलब उसके सेंटर पॉइंट को थोड़ा सा दूर दूर करने के लिए क्योंकि काफी बार सेंटर पॉइंट नजदीक नजदीक हमें देखने को मिल जाते हैं तो उनको दूर करने के लिए हम क्या इस्तेमाल करते हैं के मीन प्लस प्लस का इस्तेमाल करते हैं और यह केमन प्लस क्या करता है आपके बेस्ट क्लस्टरिंग में आपकी हेल्प करता है तो गाइज इस तरह से आपके पास क्या होता है केमन क्लस्टरिंग यहां पे वर्क करता है और एल्बो टेक्निक की हेल्प से आप क्या करते हैं नंबर ऑफ क्लस्टर फाइंड आउट करते हैं और आज की इस वीडियो के जरिए हम बात करने वाले हैं केमन क्लस्टरिंग के बारे में तो गाइ तो स्टार्ट करते हैं केमन क्लस्टरिंग को तो देखिए यहां पर इस डाटा सेट के अंदर जैसा कि आप देख पा रहे हैं जैसे कि इस वीडियो के अंदर देख पा रहे हैं कि सबसे पहले आपके पास कोई नंबर ऑफ़ क्लस्ट नहीं है लेकिन सबसे पहले आपके पास क्या करया जा रहा है सेंटर पॉइंट को ढूंढा जा रहा है और जैसे-जैसे सेंटर पॉइंट मूव कर रहे हैं वैसे-वैसे आपके पास नंबर ऑफ क्लस्टर डिज़ाइन हो रहे हैं यहां पे और परफेक्ट नंबर ऑफ क्लस्टर यहां पर बनने जा रहे हैं तो बस हम भी कुछ इस तरह से ही डिजइन करेंगे और परफेक्ट नंबर ऑफ क्लस्टर्स निकालेंगे इसके लिए हमें डेटा सेट की जरूरत पड़ेगी तो एक हमारे पास डेटा सेट पड़ा है यहां पे दैट अ आयस raw.com सेटो सा वर्जिनिका वर्स कला ये तीन तरह के आउटपुट्स आपको देखने को मिलते हैं तो फिलहाल मैंने क्या कर रखा है उस आउटपुट को हटा रखा है और मैं इसमें यहां पे फाइंड आउट करूंगा कि कितने नंबर ऑफ बेस्ट क्लस्टर्स बन सकते हैं मतलब तीन क्लस्टर बनेंगे चार क्लस्टर बनेंगे हम केमन कस्टिंग से पूछेंगे कि बेस्ट नंबर ऑफ क्लस्टर्स आप हमें यहां पे बताइए राइट तो बेसिकली हम ये काम करने वाले हैं अब ऐसा नहीं है कि मेरे पास यही एक डाटा है हमने इसका रॉ डाटा भी लिया है यहां पे और इसके साथ इसका ओरिजिनल डेटा सेट भी पड़ा है और हम ओरिजिनल डेटा सेट से साइड बाय साइड कंपेयर करेंगे कि कि क्या केमन क्लस्टरिंग इतना परफेक्ट वर्क कर पाती है कि इसके अंदर तीन नंबर ऑफ क्लस्टर बन रहे हैं और उसमें भी तीन नंबर ऑफ क्लस्टर बन पाएंगे या नहीं बन पाएंगे तो साइड बाय साइड हमारा कंपैरिजन भी होने वाला है तो इस वीडियो को हमने दो पार्ट में रखा है पहले हम के मन कस्टिंग के थ्रू इसके अंदर नंबर ऑफ क्लस्टर निकालेंगे सेकंड हमारे पास जो ओरिजिनल डेटा सेट है उसके थ्रू हम चेक करेंगे कि केमन क्रस्टिंग कितना परफेक्ट रिजल्ट हमें देता है राइट तो ये हमारा दो प्रोसेसर के अंदर काम चलने वाला है तो चलिए इस वर्किंग को करते हैं इसके लिए मैं ले चलता हूं आपको जुपिटर नोटबुक के अंदर और मैं आ चुका हूं जुपिटर नोटबुक के अंदर और सबसे पहले मैं क्या करता हूं एक न्यू नोटबुक क्रिएट कर लेता हूं और वहां पे जाके हमारे डेटा सेट को लोड कर लेते हैं चलिए तो मैं इसके लिए क्या करहा हूं यहां पे इंपोर्ट कर रहा हूं और इंपोर्ट क्या करूंगा यहां पे पांडा एलियास ऑफ पीडी क्योंकि मुझे डटा सेट को लोड करना है यस इंपोर्ट करने वाला हूं यहां पे इंपोर्ट कैसे कर रहे हैं यहां पे मैट पलि को क्योंकि मुझे ग्राफ बनाने पड़ेंगे यहां पे तो मै पलि पवा प्लॉट एंड एलियास ऑफ पीएटी ले लेते हैं यहां पे उसके बाद हम यहां पे इंपोर्ट करेंगे कसे यहां पे सी बन को क्योंकि मुझे कुछ एडवांस ग्राम बनाने की जरूरत पड़ेगी तो एलियाज ऑफ एसएनएस राइट अब हम क्या करते हैं हमारे डेटा सेट को लोड कर लेते हैं और डेटा सेट को लोड करने के लिए पीडी डॉट यहां पर क्या करूंगा रीड अंडर स्को सीएसवी का इस्तेमाल करूंगा और यहां पर जाके पहले हम डेटा सेट का एक एड्रेस ले आते हैं तो आईस र के अंदर हमारा डेटा सेट है यहां पे राइट तो इसका मैं करता हूं कॉपी एज अ पाथ के तौर पे और ये जो आपके पास डबल कोड है इसे हटाकर पेस्ट कर लेते हैं उसके बाद यहां पे आगे रॉ स्ट्रिंग लगा देते हैं मतलब इसको स् रॉ स्ट्रिंग के अंदर कन्वर्ट कर लेते हैं और इसे रन कर लेते हैं चलिए डटा सेट को देखते हैं डेटा सेट डॉट यहां पर मैं हैड लगाऊंगा हैड लगा के तीन डटा खूंगा तो ये हमें डेटा सेट मिल चुका है अब यहां पे देखिए सपल लें सपल विड्थ पैटल लेंथ एंड पैटल विड्थ हमें मिल चुका है लेकिन हमें आउटपुट के तौर पे कुछ भी नहीं मिला है मतलब आउटपुट के तौर पे हमें कोई भी नाम नहीं दिए गया है कि ये सेटो सा है वर्जिन कलर है या वर्ज कलर है जो भी है नाम हमें नहीं दिया रखा है हमें बस बोला गया है कि इसका क्लस्टर बना के दे दीजिए तो अब हम इसके क्या करेंगे क्लस्टर तैयार करेंगे लेकिन क्लस्टर बनाने से पहले मैं इसके ग्राफ के अंदर एनालिसिस करना चाहूंगा यहां पे कि किस-किस तरह के ग्राफ्स हमें दिख रहे हैं मतलब उनके बीच में क्या रिलेशनशिप दिख रहा है यहां पे ताकि हम यहां पे काम ले सके क्योंकि के मन क्लस्टरिंग का जो इस्तेमाल है गाइज यहां पे वो इस्तेमाल केवल और केवल लीनियर सेपरेबल के लिए किया जाता है जब भी आपका डाटा यहां पर लीनियर सेपरेबल आपको देखने को मिल जाए तभी आप केमन क्लस्टरिंग का इस्तेमाल कीजिएगा यदि आपके पास डाटा नॉन लीनियर सेपरेबल मिले तो आपको केमन क्लेशिंग का इस्तेमाल नहीं करना है उसके लिए और भी एल्गोरिथम्स है हमारे पास यहां पे जो कि क्लस्टर बनाने के लिए कैपेबल है राइट तो बेसिकली हम यहां पे चेक करेंगे कि हमारा जो डेटा सेट है वो लीनियर सेपरेबल है या नहीं है तो इसको चेक करने के लिए हम क्या करेंगे गाइज यहां पे एसए डॉट यहां पे क्या करने वाला हूं मैं यहां पे पेयर प्लॉट बनाने वाला हूं और पेयर प्लॉट के अंदर मैं डेटा के अंदर क्या दूंगा यहां पे हमारा जो डटा सेट है वो मैं पास कराने वाला हूं राइट अब इस ग्राफ को देखना है तो मैं पीएटी डॉट क्या करने वाला हूं गाइज यहां पे शो फंक्शन को कॉल करने वाला हूं और रन करने वाला हूं चलिए अब इस ग्राफ को थोड़ा सा वेट करते हैं ग्राफ आने का वेट करते हैं ओके हमारा ग्राफ आ चुका है और ग्राफ बनाने के बाद में आप जरा थोड़े ऑब्जर्व करते हैं यहां पे देखिए पैटल विड्थ और सपल लेंथ के अंदर यदि हम ऑब्जर्वेशन करें तो आपका जो डाटा है देखिए आपके पास यहां पे दो पार्टीशन के अंदर टूट रहा है यहां पे भी देखेंगे तो सेपर विड्थ एंड पैटल विड्थ के देखेंगे तो यहां पे भी दो पार्टीशन के अ हमारा डेटा टूट रहा है पैटल विड्थ और पैटर्न लेंथ को देखेंगे तो यहां पे भी हमारा डाटा जो है दो पार्टी संगल टूट है मतलब बेसिकली गाइज यहां पे मैं थोड़ी सी एनालिसिस करूं तो एनालिसिस करने पर मुझे क्या पता चल रहा है कि इसके अंदर नंबर ऑफ क्लस्टर दो ही बनने चाहिए जबकि हमें पता है आयस डेटा सेट के अंदर तीन नंबर ऑफ क्लस्टर है यस इस डेटा सेट के अंदर तीन नंबर ऑफ क्लस्टर है और वो कौन-कौन से हैं सेटो सा है वर्ज कलर है और वर्जिनिका है यस आपके पास सेटो सा वर्स कलर एंड वर्जिनिका आपके पास तीन नंबर ऑफ क्लस्टर आपके आस है यहां पे ये तीन नंबर ऑफ क्लस्टर हमें ढूंढने पड़ेंगे और ये तीन नंबर क्लस्टर ढूंढने में हमारी कौन हेल्प करने वाला है ये हमारी हेल्प करेगा केमन क्लस्टर तो चलिए इन केमन क्लस्टर की हेल्प से इन तीन नंबर ऑफ क्लस्टर को ढूंढते हैं अब केमन क्लस्टर के अंदर सबसे पहला काम जो हमारे पास ये पे होता है कि नंबर ऑफ क्लस्टर कितने हैं लेकिन यहां पे काफी लोगों को डाउट्स होगा कि हम यहां पे ट्रेनिंग और टेस्टिंग अंदर स्प्लिटिंग क्यों नहीं कर रहे देखिए ट्रेनिंग और टेस्टिंग अंदर स्प्लिटिंग इसलिए नहीं किया जा रहा है क्योंकि आपके पास जो डेटा है वो अनलेबल्ड डेटा है और अनलेबल्ड डेटा को आप स्प्लिटिंग करके करेंगे भी क्या मतलब बेसिकली देखिए ट्रेनिंग और टेस्टिंग उस वक्त इस्तेमाल किया जाता है जब आप सुपरवाइज मशीन लर्निंग के इस्तेमाल अंदर काम कर रहेते हैं सुपरवाइज मशीन लर्निंग के अंदर आप क्या करते हैं पहले मॉडल को ट्रेन करते हैं और ट्रेन करने के बाद में आप उसको क्या करते हैं टेस्ट करके देखते हैं कि ये राइट वर्क कर रहा है या नहीं कर रहा लेकिन जब हम बात करते हैं अन सुपरवाइज मशीन लर्निंग की तो यहां पे अन लेबल डाटा है तो बेसिकली यहां पे ट्रेनिंग नहीं होती है मतलब ट्रेनिंग और टेस्टिंग नहीं होती है यहां पे बेसिकली पैटर्न के हिसाब से ग्रुप्स के अंदर डिवाइड किया जाता है तो बस हम वही करने वाले हैं तो बेसिकली ट्रेनिंग और टेस्टिंग के अंदर यहां पे स्लेडिंग नहीं होगा हम यहां पे क्या करेंगे गाइज यहां पे नंबर ऑफ क्लस्टर्स फाइंड आउट करेंगे कि बेस्ट नंबर ऑफ क्लस्टर कितने होने वा रहे हैं चलिए बेस्ट नंबर ऑफ क्लस्टर यहां पे निकालते हैं उसके लिए मैं क्या करने वाला हूं गाइज यहां पे आपके साइकल लन की लाइब्रेरी का इस्तेमाल करूंगा क्योंकि मुझे यहां जरूरत पड़ेगी डब्ल्यू सीएसएस की यस आपके पास यहां पे विद इन अ क्लस्टर्स आपके पास सम स्क्वायर आपको निकालना है यहां पे तो डब्ल्यू सीएसएस की जरूरत पड़ेगी यहां पे और उसकी हेल्प से ही हम क्या करेंगे बेस्ट नंबर ऑफ़ क्लस्टर निकाल के मतलब एल्बो मेथड के हेल्प से निकालने वाले हैं तो चलिए कैसे निकालते हैं तो उसके लिए मैं फ्रॉम साइकल डन के अंदर चलूंगा साइकल डन के अंदर जाने के बाद मैं जाऊंगा यहां पे क्लस्टर के अंदर क्लस्टर के अंदर जाने के बाद दैट मैं इंपोर्ट करने वाला हूं यहां पे किसको इंपोर्ट करने वाला हूं गाइ यहां पे के मींस को इंपोर्ट करने वाला हूं दैट अ के मीन क्लस्टर अब इस के मीन क्लस्टर के अंदर हमें क्या करना है डब्ल्यू सीएसएस की वैल्यू निकालनी है तो मैं काम करता हूं डल स एसएस के नाम से एक वेरिएबल बना लेता हूं और एक लिस्ट बना लेता हूं राइट जिसके थ्रू हम यहां पे ग्राफ बना पाएंगे ओके अभी यहां पे कितने नंबर ऑफ क्लस्टर बन सकते हैं मुझे कोई आईडिया नहीं है और ना ही आप लोगों को भी आईडिया होगा यहां पे तो एक काम करते हैं एक लूप चलाते हैं यस यहां पे एक लूप चलाते हैं उसके अंदर हम क्या करेंगे टू क्लस्टर से लगा के 20 क्लस्टर्स तक बनाएंगे मतलब हम क्या करेंगे टू से लेके 20 क्लस्टर डिजाइन करेंगे यहां पे उसके अंदर हमें हमारा बेस्ट नंबर ऑफ क्लस्टर देखने को मिल जाएगा चलिए कैसे मिलेंगे यहां पे तो मैं क्या करने वाला हूं गाइ यहां पे उसके लिए हम क्या करेंगे एक लूप चलाएंगे तो फॉर आई इन मैं क्या करने वाला हूं यहां पे रेंज लगाने वाला हूं और रेंज के अंदर टू कॉमा यहां पे 21 लेने वाला हूं मतलब यहां पे 20 तक हम क्लस्टर को इस्तेमाल करेंगे लेकिन अभी तक हमें डब्लू सीएसएस की वैल्यू नहीं मिली है तो डब्ल्यू सीएस की वैल्यू भी निकालेंगे तो देखिए के मन क्लस्टर है तो यहां पे केएम के नाम से एक वेलेबल बना लेते हैं यहां पे उसके बाद के मींस को कॉल कर लेते हैं इस के मंस को जब भी आप ओपन करेंगे तो इसके अंदर कुछ हाइपर पैरामीटर्स निकलेंगे इन हाइपर पैरामीटर्स के अंदर जो सबसे पहला हाइपर पैरामीटर्स है ट्स अ नंबर ऑफ क्लस्टर कितने नंबर ऑफ क्लस्टर्स आप डिजाइन करना चाहते हैं वो है फिर है यहां पे इनिशिएटिव के मीन प्लस प्लस आपके पास क्या करता है बेस्ट क्लस्टर फाइंड आउट करने में आपकी हेल्प करता है तो इसलिए आपको क्या करना है के मन प्लस प्लस आपको देना है चलिए इनको मैं कॉपी कर लेता हूं यहां पे एंड देन पेस्ट कर देता हूं अच्छा यहां पर मुझे क्या करना है नंबर ऑफ क्लस्टर की वैल्यू को जो चेंज है नंबर ऑफ क्लस्टर की जो वैल्यू है यहां पे मुझे चेंज करनी पड़ेगी नंबर ऑफ क्लस्टर की वैल्यू मैं क्या करने वाला हूं गाइ यहां पे i देने वाला हूं क्यों क्योंकि जितने नंबर ऑफ क्लस्टर आएंगे के मन क्लस्टर उस हिसाब से काम करेगा तो के मन प्लस प्लस लगाना है यहां पे अब के मन प्लस प्स लगाने के बाद में आपको क्या करना है मॉडल को क्या करना है फिट करना है फिट करना मतलब अपना जो डाटा है वो डेटा ट्रांसफर करना है तो डेटा हमारे पास किस फॉर्मेट में है डटा सेट की फॉर्मेट में है पहले मैं वो दूंगा यहां पे उसके बाद के मीन डॉट यहां पर मैं लगाऊंगा इनर्टिया यस ये जो इनर्टिया होता है यही आपके पास क्या होता है डब्ल्यू सीएसएस की वैल्यू होता है यस ये आपकी डब्ल्यू सीएसएस की वैल्यू आपको निकाल के देता है जिसके थ्रू आप एल्बो वाला जो ग्राफ है वो डिजाइन करेंगे तो यहां से आपको मिलने ला है डब्ल्यू सीएसएस की वैल्यू यहां पे अब ये जो डब्ल्यू सीएसएस की वैल्यू आई है इसको हम क्या करेंगे इसके अंदर अपेंड करा देंगे इसके काम करूंगा यहां पे डब्ल्यू सीएसएस के अंदर डॉट क्या करूंगा यहां पे मैं अपें कर दूंगा और अप एंड के अंदर k km.in शिया को मैं यहां पे अप एंड कर दूंगा राइट ये मेरा यहां पे काम करने वाला है चलिए इसे रन करते हैं तो ये हमारे पास क्या कर रहा है वैल्यू को ट्रेन कर चुका है ये हमारे पास क्या करेगा आपका वैल्यू को ट्रेन करेगा और डब्लू सीएसएस की वैल्यू निकालेगा अब यहां पे कुछ वॉर्निंग मिली है अब इस वार्निंग को आप इग्नोर कर सकते हैं ये सिंपल सी वार्निंग है यहां पे काफी बार आपके पास क्या होता है कि आपका सिस्टम जो होता है आपका जो यहां पे आप जो वर्जन इस्तेमाल कर रहे हैं और हमारे पास जो दूसरी वैल्यू है कितनी नंबर ऑफ क्लस्टर के बीच में हम क्या करेंगे ग्राफ डिजाइन करेंगे और ये कौन सा डिजाइन करना है ग्राफ यहां पे दर्स हमें डिजाइन करना है लाइन प्लॉट चलिए तो लाइन प्लॉट बनाते हैं यहां पे तो पीएटी डॉट मैं क्या करने वाला हूं यहां पे गाइज प्लॉट फंक्शन का इस्तेमाल करूंगा यहां पे प्लॉट फंक्शन के अंदर एक्स एक्सेस की वैल्यू देनी है एक्स एक्सेस के अंदर हमारे पास क्या है नंबर ऑफ क्लस्टर्स है तो सबसे पहले क्या करेंगे नंबर ऑफ क्लस्टर लगाएंगे अब नंबर ऑफ क्लस्टर को मैं क्या कर रहा हूं एज अ लिस्ट के तौर पे दे रहा हूं यहां पे और यहां पे एक आपके क्या करता हूं लिस्ट कंप्रेशन का इस्तेमाल कर लेता हूं यहां पे ताकि हमारी लिस्ट बन जाए तो फॉर आई इन क्या करेंगे यहां पे यस फॉर आई इन यहां पे क्या करेंगे रेंज लेंगे और रेंज के अंदर क्या करने वाले हैं गाइज यहां पे 2 21 लेने वाले हैं दैट्ची वैल्यू आ चुकी है यहां पे अब सेकंड क्या है यहां पे डब्लू सीएसएस की वैल्यू लेनी है तो मैंने डब्ल्यू सीएसएस की वैल्यू ले ली है यहां पे अब इस ग्राफ को थोड़ा सा अच्छे से करने के लिए पीएटी डॉट मैं क्या करने वाला हूं यहां पे x लेबल लेने वाला हूं और x लेबल के अंदर क्या है गाइज यहां पे नंबर ऑफ क्या है गाइज यहां पे क्लस्टर है यहां पे और यहां पे पीएटी डॉट क्या करने वाला है यहां पे y लेबल लेने वाले हैं और y लेबल के अंदर क्या है यहां पे डब्लू स एसएस की वैल्यू आपके पास दे रखी है अब इस ग्राफ को देखना है तो उसके लिए मैं कर रहा हूं यहां पे पीएटी ड शो फंक्शन को इस्तेमाल करूंगा और इसे रन करता हूं तो देखिए ये हमारे पास एक परफेक्ट ग्राफ बन के आ चुका है यहां पे जो कि हर पर्टिकुलर क्लस्टर पे बन चुका है लेकिन आप नंबर ऑफ क्लस्टर की वैल्यू देखेंगे तो ये परफेक्ट नहीं आई है 2.5 3 5.5 इस तरह से आपके पास बनके आ रही है तो मुझे क्या करना पड़ेगा इस ग्राफ को थोड़ा सा सही करना पड़ेगा मतलब जो x एक्सिस की जो लेबल है इनको थोड़ा सा सही करना पड़ेगा मतलब एक्सस के ट्रिक्स को सही जन करना पड़ेगा तो मैं उसके लिए क्या कर रहा हूं पीएटी डॉट यहां पे इस्तेमाल करूंगा एक्स ट्रिक्स का यस इस एक्स ट्रिक्स के अंदर क्या करेंगे गाइस यहां पे कि जो हमने यहां पे ये जो डेटा पॉइंट दिए है यहां पे मतलब जो हमने यहां पे हमारे क्लस्टर डाले हैं यहां पे इसी को हम यहां पे डालेंगे और रन करेंगे तो देखिए हमारे पास परफेक्ट नंबर ऑफ क्लस्टर बन चुके है अब ये ग्राफ भी काफी सही नहीं नजर आ रहा है तो मैं इसको थोड़ा सा बड़ा करूंगा और हर डेटा पॉइंट मतलब हर कट पॉइंट के ऊपर मैं करने वाला हूं डॉट लगाने वाला हूं और उसके बाद मैं ग्रिड भी लगाऊंगा ताकि हमें परफेक्ट नंबर ऑफ क्लस्टर्स यहां पर मिल चुके हैं तो फर्स्ट ऑफ ऑल हम क्या करेंगे थोड़ा सा ग्राफ को स्ट्रेच करेंगे तो उसके लिए मैं क्या करना वाला ह पीएटी डॉट यहां पे क्या करने वाला हूं फिगर का इस्तेमाल करूंगा और फिगर के अंदर क्या करने वाले है गाइ यहां पे फिक्स साइज का इस्तेमाल करेंगे और फिक्स साइज के अंदर हम क्या करेंगे 5 10 का ग्राफ बना लेंगे चलिए अ थोड़ा सा मिस्टेक हो गया है 10 5 का ग्राफ बना ना है हम यहां पे तो 10 मैं यहां पे फाइव का ग्राफ बना लूंगा तो एक परफेक्ट बड़ा ग्राफ मुझे मिल जाएगा यहां पे इसके साथ-साथ मुझे क्या करना है यहां पे आपको मार्कर भी लगाना है मैं यहां पे मार्कर देने वाला हूं और मार्कर के अंदर गाइज मैं यहां पे क्या करने वाला हूं ओ मार्कर देने वाला हूं और रन करते हैं तो देखिए मेरे मार्कर्स पॉइंट लग गए हैं यहां पे और उसके बाद में हम क्या करते हैं ग्रिड भी लगा लेते हैं तो पीएटी डॉट मैं यहां पे क्या करूंगा ग्रिड का इस्तेमाल करूंगा यस पीएटी डॉट मैं यहां पे क्या करने वाला हूं ग्रिड का इस्तेमाल कर रहा हूं और ग्रिड के अंदर देखिए आपके पास यहां पे एक्सेस के अकॉर्डिंग आप ग्रेड लगा सकते हैं तो मुझे x एक्सेस या y एक्सेस में लगानी है जो जो भी एक्सेस में लगानी है दस मैं यहां पे चूज कर सकता हूं तो मैं यहां पे एक्सेस का इस्तेमाल करूंगा और एक्सेस के अंदर मैं एकस एक्सेस की ग्रेड लगा दूंगा यहां पे तो देखिए हमारे पास ये ग्रेड स्पील आ चुकी है अब यहां पे आप उस एल्बो पॉइंट को ढूंढिए जहां पे ये डाटा जो है सेटल होने जा रहा है तो यहां पर हम सेटल पॉइंट को ढूंढे तो सेटल पॉइंट हमारे पास क्या आ रहा है थ्री आ रहा है थ्री थ्री के बाद में आप देखेंगे तो आपका जो ग्राफ है वो डाउन वर्ड में चला जा रहा है तो एक एल्बो पॉइंट को य हम पकड़े तो एल्बो पॉइंट हमारे पास क्या दिख रहा है यहां पे थ्री एल्बो पॉइंट्स दिख रहा है राइट इसका मतलब क्या होने वाला है गाइ यहां पे तीन नंबर ऑफ क्लस्टर्स यहां पर हमारे पास डिजाइन होने वाले हैं जैसे कि आप देख पा रहे हैं कि ये तीन क्लस्टर है दैट इज माय एल्बो पॉइंट यस यहां से पहला पॉइंट आपके पास एल्बो पॉइंट मिल रहा है और एल्बो पॉइंट के बाद में हमारा जो हैंड है वो सीधा हो जाता है ट्स यहां पे भी आप इस चीज को ऑब्जर्व कर पाएंगे कि ये आपका पहला पॉइंट है उसके बाद ये आपका दूसरा पॉइंट है दूसरे पॉइंट के बाद में जो आपका पॉइंट है वो सीधा सी सीधा यहां पर जा रहा है और ये दूसरा पॉइंट जो आपके पास मिल रहा है वो कहां पे मिल रहा है नंबर ऑफ क्लस्टर कितने आ रहे हैं ये नंबर ऑफ क्लस्टर हमें तीन डिजाइन दे रहा है मतलब थ्री नंबर ऑफ क्लस्टर्स यहां पे आ रहे हैं तो बेस्ट क्लस्टर पॉइंट कितना आ गया गाइ यहां पे थ्री नंबर ऑफ क्लस्टर्स आ गया हां हालांकि आप देखेंगे थ्री और फोर में कंफ्यूजन रहेगा तो आप यहां पे थ्री या फोर में से जो भी आप लेना चाहे ट्स वो पॉइंट ले सकते हैं तो थ्री भी है और फोर भी है लेकिन हमारे अकॉर्डिंग डेटा सेट के अकॉर्डिंग यहां पे तीन नंबर ऑफ क्लस्टर बनने चाहिए तो हम यहां पे तीन नंबर ऑफ क्लस्टर्स डिजाइन करने वाले हैं ओके चलिए अब हम क्या करेंगे गाइज यहां पे अब हम यहां पे आपका परफेक्ट प्रेडिक्शन करने वाले हैं कि ये तीन नंबर ऑफ क्लस्टर कैसे हैं और किस तरह से दिखते हैं यहां पे और फिर हमारे ओरिजिनल डेटा सेट के साथ में हमें इसे कंपैरिजन भी कराना है तो चलिए इन तीन नंबर ऑफ क्लस्टर को बनाते हैं तो मैं के म ए का इस्तेमाल करूंगा एक नए वेरिएबल का इस्तेमाल करूंगा और यहां पर के मन क्लस्टरिंग का इस्तेमाल करेंगे मतलब केमी कस्टिंग एल्गोरिथम का इस्तेमाल करेंगे और यहां पर नंबर ऑफ क्लस्टर्स हमें मिलेगा इस नंबर ऑफ क्लस्टर के अंदर मैं थ्री क्लस्टर्स डालूंगा उसके बाद केमी एंड डॉट का इस्तेमाल करूंगा डॉट यहां पर अब हमारे पास क्या है फिट प्रिडिक्ट फिट प्रिडिक्ट का मतलब क्या है गाइज यहां पे अब हम यहां पे फाइनली प्रेडिक्शन करने जा रहे हैं हमारे डेटा सेट के अकॉर्डिंग कितने नंबर ऑफ क्लस्टर बन रहे है इसके लिए मैं क्या करने वाला हूं गाइ यहां पे अपना डटा सेट पास कराने वाला हूं और मैं रन करूंगा यहां पे तो देखिए मेरे पास नंबर ऑफ क्लस्टर्स डिजाइन होके आ गए कि किसमें कितने नंबर ऑफ क्लस्टर बनने है अब इस क्लस्टर को हम क्या कर रहे हैं हमारे ओरिजिनल डेटा सेट के अंदर डाल देते हैं तो मैं एक काम करता हूं एक डेटा सेट लेता हूं और हमारा जो डेटा सेट है उसमें लेता हूं और उसके बाद में हम क्या करते हैं गाइस यहां पे आपका जो प्रिडिक्ट है यहां पे यस आपका जो प्रिडिक्ट आउटपुट निकला है यहां पे उस नाम से कॉलम बनाते हुए हम इसे प्लेस कर देंगे चलिए तो मैंने यहां पे क्या किया पेडिक के नाम से इसे सेव कर लिया अब हमारे डेटा सेट को देखते हैं तो ये रहा हमारा डेटा सेट जहां पे हमारा ओरिजिनल डाटा जहां पे हमारा डाटा भी है और प्रिडिक्टेड वैल्यू भी है अब क्या करर है गाइस यहां पे कंपेयर करते हैं यहां पे और पहले तो हम इसका ग्राफ बनाते हैं कि कैसा दिखाई दे रहा है यहां पे तो उसके लिए मैं क्या करूंगा फिर से एसए डॉट यहां पे क्या करूंगा आपके पास पेयर प्लॉट का इस्तेमाल करूंगा पेयर प्लॉट के अंदर मैं डेटा के अंदर क्या करने वाला हूं गाइस यहां पे डाटा सेट देने वाला हूं यहां पे और यहां पे ह्यू पैरामीटर होता है और इस य पैरामीटर के अंदर मैं क्या करने वाला हूं अपना जो ये प्रिडिक्ट हमने लिखा है यहां पे यस ये जो प्रिडिक्ट बनाया है इस प्रिडिक्ट को हम प्लेसमेंट देने वाले हैं और इसके ग्राफ को देखने के लिए मैं पीएटी डॉट क्या करने वाला हूं गाइस यहां पे शो फंक्शन का इस्तेमाल करूंगा और रन करूंगा तो मेरे पास यहां पे प्रेडिक्शन होके आ जाएगा मतलब बेसिकली नंबर ऑफ क्लस्टर कैसे बने किस तरह से बने सब दिख जाएगा तो आप देख पा रहे हैं इस तरह से क्लस्टर डिजाइन हो चुके है कि पहला ये है दूसरा ये है और तीसरा ये है पहला ये दूसरा ये तीसरा ये है तो मतलब काफी सही प्रोडक्शन दिया है यहां पे अब एक काम करते हैं जो हमारा ओरिजिनल डाटा है जो हमारे पास ओरिजिनल डाटा भी आपको पता है कि हमारे पास पड़ा है यहां पे उसको चेक करते हैं कि वो किस किस तरह से क्लस्टर डिजाइन कर रहा है मतलब उसके अंदर किस तरह से डिवीजन आपका पास हो रखा है तो चलिए मैं यहां पे क्या करता हूं ओरिजिनल डाटा मतलब ओज डटा सेट के नाम से एक वेरिएबल बना लेता हूं और pd3 बनाने के बाद में गाइज यहां पे क्या करेंगे हमारा डाटा देंगे डटा इक्वल्स टू क्या देने वाले हैं गाइ यहां पे ओरिजिनल डाटा देने वाले हैं यहां पे और ओरिजिनल डेटा देने के बाद में मैं यहां पे ह्यू पैरामीटर का इस्तेमाल करूंगा और ह्यू के अंदर आप लोगों को पता होगा कि इस वाले चार्ट के अंदर यस ये इस वाले डाटा सेट के अंदर हमारे पास जो ह्यू बनेगा वो क्या बनेगा स्पेसस बनेगा यस एक ब देखिए मैं आपको दिखाता हूं तो इसके अंदर आपका ह्यू क्या क्या होने वाला है आपका स्पेसस बनने वाला है तो मैं क्या करने वाला हूं गाइ यहां पे ह्यू के अंदर हमारा स्पेसेस डालूंगा एंड उसके बाद में पी डॉट मैं करने वाला हूं गाइ यहां पे इसको शो करूंगा और शो करने के बाद रन करेंगे इसे तो ये हमें ओरिजिनल ग्राफ बना के देगा कि किस तरह से क्लस्टर्स इसने डिजाइन किए है चलिए देखिए ये क्लस्टर डिजाइन होके आ गए अब हम क्या करते हैं इन दोनों ग्राफ को पहले एक बार सेव कर लेते हैं और साइड बाय साइड कंपेयर करते हैं कि दोनों के अंदर क्या डिफरेंस है मतलब दोनों के अंदर कितना आपके पा परफेक्टली काम किया है या नहीं किया है उसको देख लेते हैं यहां पे तो मैं क्या करता हूं दोनों ग्राफ को सेव कर लेता हूं और सेव करने के लिए क्या क्या करेंगे यहां पे पीएटी डॉट आप क्या करेंगे यहां पे सेव फिगर का इस्तेमाल करेंगे सेव फिगर के अंदर हम क्या करेंगे गाइज यहां पे दैट इ अ प्रेडिक्शन फिगर यस तो मैं यहां पे क्या करूंगा प्रिडिक्ट आपके पास क्या करूंगा डॉट जेपीजी के अंदर सेव कर लूंगा इसे यहां पे और नीचे जाके यहां पे क्या करूंगा ओरिजिनल मतलब रजी आपके पास जेपीजी के अंदर सेव कर लूंगा राइट तो ये रहा हमारा डेटा सेट एक ये रहा हमारा यहां पे ग्राफ चलिए यहां पे देखें तो पीएटी डॉट क्या करने वाले है गाइस यहां पे सेव फिगर का इस्तेमाल करेंगे और इसके अंदर क्या नाम रखेंगे ओ आरजी यस रजी मतलब ओरिजिनल आपके पास है और किसम अंदर है जेपीजी के अंदर है तो हम इसे भी सेव कर लेते हैं तो देख देखिए हमारा ओरिजिनल ग्राफ और हमारा प्रेडिक्शन ग्राफ दोनों यहां पर सेव हो जाएगा और ये देखिए यहां जाके सेव हो चुका है अब मैं क्या कर रहा हूं दोनों को साइड बाय साइड ओपन कर रहा हूं ताकि आप कंपैरिजन देख पाए अच्छे से राइट और ये रहा हमारा दूसरा जिसके अंदर हम क्या करेंगे दूसरे वाले को भी ओपन कर लेते हैं अच्छा आप देख रहे हैं न को दोनों को साइड बाय साइड ओके एक तरफ मेरे पास क्या है यहां पे गाइस प्रोडक्शन ग्राफ है यस तो दोनों को एक बार कर लेते साइड बाय साइड ले लेते हैं और इसको भी यहां पर डाल देते हैं ओके अब देखिए दोनों को मैंने साइड बाय साइड बना रखा है अब साइड बाय साइड में थोड़ा कंपैरिजन करते हैं ये दोनों किस तरह से कंपैरिजन हुआ है ओके तो आप यहां पे ऑब्जर्व करेंगे पहले स्पेस देख लेते हैं यहां पे दैट इज अ सेपल एन गदर सेपल एन के अंदर आप यहां पे ऑब्जर्व करेंगे तो इन्होंने देखिए परफेक्ट क्लस्टर बनाया यहां पे लेकिन यहां पे थोड़ी सी मिस्टेक कर दी है क्योंकि देखिए इसकी जो पीक है वो काफी ऊपर है और इसकी पीक जो है वो काफी नीचे है तो मतलब यहां पे थोड़ी सी मिस्टेक की है लेकिन हां हालांकि काफी अच्छा क्लस्टरिंग किया यहां पे इसके अंदर देखेंगे तो आपके देखिए ब्लू डेटा पॉइंट जैसे क्लस्टर हुआ है वैसे ही आपका पिंक डाटा सेट कर हुआ है उसी के अंदर आपके आपका देखिए ऑरेंज टाइप का डाटा दिख रहा है यहां पे वो आपके पास क्या कर रखा है इन्होंने लाइट आपके पास क्रीम कलर कर रखा है यहां पे एंड यहां पे देखेंगे तो आपके पास ग्रीन कलर दिख रहा है वो यहां पे कैसे दिख रहा है गाइ यहां पे आपके पास डार्क ब्लू कलर दिख रहा है यहां पे राइट तो देखिए आपके पास परफेक्टली क्लस्टर है हां हालांकि यहां पे थोड़ा सा मिस क्लासिफिकेशन इन्होंने किया है लेकिन काफी अच्छा क्लस्टर किया है इधर वाली बात में करें यहां पे तो देखिए काफी अच्छे से क्लस्टर हो चुका है यहां पे ये जो पॉइंट है काफी लंबा चल रहा है लेकिन यहां पे ये पॉइंट जो है काफी लंबा नहीं चल पाया तो कुछ-कुछ मिस क्लासिफिकेशन है और कुछ-कुछ अच्छी तरीके से क्लासिफाई भी कर चुका है यहां पे तो देखिए इसको भी आप कंपेयर कर सकते हैं इसके अंदर भी आप कंपेयर कर सकते हैं इसके अंदर भी आप कंपेयर कर सकते हैं तो देखिए सभी के अंदर कंपेयर करें तो ऑलमोस्ट यदि मैं यहां पे बोलूं तो 90 पर इन्होंने वर्किंग क्या कर रखी है सही कर रखी है यस 90 पर यहां पे आप वर्किंग देखेंगे तो काफी अच्छी वर्किंग कर रखी है और काफी अच्छी तरीके से क्लस्टरिंग कर रखा है 90 पर तक हां हालांकि कुछ परसेंट में इन्होंने गड़बड़ कर रखा है लेकिन काफी अच्छी यहां पे क्लस्टरिंग कर रखी है तो गाइस आप यहां पर क्या कर सकते हैं आपके पास एक अनलेबल्ड डाटा यदि आपके पास हो और वो लीनियर सेपरेबल आपको दिख रहा हो तो उस वक्त आप क्या कर सकते हैं के बीन क्लस्टरिंग का इस्तेमाल करते हुए नंबर ऑफ क्लस्टर्स निकाल सकते हैं और ये है उसका मेथड और यहां से आप एल्बो मेथड के थ्रू इसे क्लचिंग भी कर सकते हैं और आज की इस वीडियो के जरिए हम बात करेंगे रिकल क्रस्टिंग के बारे में कि ये किस तरीके से वर्क करती है और नंबर ऑफ क्लस्टर को कैसे फाइंड आउट की जाती है देखिए हेलक क्रस्टिंग को स्टार्ट करने से पहले मैं आपको ये बताना चाहूंगा कि यदि आपके पास डाटा लीनियर सेपरेबल है तो आप यहां पर हालिक कस्टिंग को इस्तेमाल करते हैं अदर वाइज आगने वाले वीडियो के अंदर और भी ऐसी क्लस्टरिंग आपके पा सामने आएगी जिसके अंदर हम नॉन लीनियर सेपरेबल डाटा यस उनको भी हम क्लस्टर कर पाएंगे विद द यूजिंग ऑफ हमारे पास अदर जितनी भी क्लस्टरिंग है उसके हेल्प से तो जब भी आपके पास यहां पे लीनियर सेपरेबल डेटा आपके पास आता है तो आप क्या करते हैं रकल कस्टिंग का इस्तेमाल करते हैं यदि आपको पाइथन मशीन लर्निंग डाटा साइंस एंड डेटा एनालिस जैसी फील्ड में अपने आपको ग्रो करना है तो इसके लिए डब्ल्यू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपने स्किल को को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो गाइस यहां पे अन लेबल डाटा आपके पास होता है तो उस लर्न लेबल डाटा को यदि आपको क्लस्टर बनना है तो आप यहां पे क्या इस्तेमाल करेंगे रिकल क्रस्टिंग का इस्तेमाल करेंगे और इसको एच ए सी भी बोला जाता है रिकल क्स्ट एनालिसिस भी बोला जाता है यहां पे अब ये जो रिकल कस्टिंग यहां पर की जाती है बेसिकली ये क्लस्टरिंग की जाती है आपके पास ट्री लाइक शेप के जरिए मतलब आपके पास ये जो क्लस्टरिंग आपके पास होती है कि इसके अंदर नंबर ऑफ क्लस्टर कितने मन अवेलेबल मतलब यहां पे ये जो डेटा सेट है इस डेटा सेट के अंदर हमारे पास क्या कर र है तीन नंबर ऑफ क्लस्टर्स यहां पे डिजाइन हो रहे हैं तो ये तीन नंबर ऑफ क्लस्टर किस बेसिस पे डिजाइन होंगे इसके लिए हम क्या इस्तेमाल करते हैं गाइज यहां पे हम इस्तेमाल करते हैं डेंडो ग्राम का मतलब टी ट्री लाइक शेप स्ट्रक्चर का इस्तेमाल करते हैं जिसकी हेल्प से हम यहां पे क्या करते हैं बेस्ट नंबर ऑफ क्लस्टर्स को निकालते हैं जिसकी हेल्प से हमारे जो बी डेटा सेट है हम उसे क्या करते हैं फर्द क्लस्टरिंग करते हैं अब ये डेंग्रेस क्या है इसको हम थोड़ा अब डिटेल के साथ समझते हैं यहां पे गाइस तो गाइस डंडो ग ग्राम का मतलब बेसिकली गाइज मैं बात करूं यहां पे तो ये एक ट्री लाइक शेप होता है म एक ट्री लाइक पैटर्न होता है जो कि हेकल क्रस्टिंग के थ्रू बना जाता है यहां पे अब इस ट्री लक शेप के अंदर आपके पास कहां पे क्या चीज मिलती है तो गाइ यहां पे आपके पास जो एक्स एक्सेस होता है मतलब डेंटो ग्राम का जो एक्स एक्सेस आप यहां पर देख पा रहे हैं इस एक्स एक्सिस के अंदर आपके पास क्या मिलेगा आपकी जो नंबर ऑफ पॉइंट्स है मतलब आपके पास यहां पे नंबर ऑफ पॉइंट्स आपके डेटा पॉइंट्स है यहां पे वो मिलने वाला है तो एक्स एक्सेस के अंदर क्या मिलेंगे नंबर ऑफ आपके पास यहां पे पॉइंट्स मिलेंगे यहां पे पॉइंट्स मतलब आपके पास यहां पे आप बोल सकते हैं कि आप आपका डेटा सेट्स आपको मिलने वाला है यहां पे एंड यदि मैं वा एक्सिस की बात करूं तो वा एक्सिस के अंदर आपके पास मिलेगी आपकी क्लस्टर की डिस्टेंस यस आपकी क्लस्टर की डिस्टेंस मिल र है क्लस्टर की डिस्टेंस का मतलब यहां पे बेसिक बात बात करें यहां पे जैसे आपका पास ये पॉइंट है और आपका ये पॉइंट है इन दोनों पॉइंट के बीच की क्या डिस्टेंस है यहां पे दैट इज अ डिस्टेंस आपको मिलती है और ये जो डिस्टेंस कैलकुलेट की जाती है गाइज यहां पे ये डिस्टेंस आपकी यूक्लिड डिस्टेंस कहलाती है अब यूक्लिड डिस्टेंस क्या होता है तो आई थिंक आपको बहुत अच्छी तरीके से पता होगा यूक्लिड डिस्टेंस क्या होता है क्योंकि हमने यहां पे k ए ए एल्गोरिथम जब हमने डिस्कस की थी सुपरवाइज मशीन डिंग में वहां पे यूक्लिड डिस्टेंस को समझा था यदि नहीं पता है तो कोई बात नहीं एक छोटा सा कप रीकैप ले लेते हैं यहां पे गाइज कि आपके पास यूक्लिड डिस्टेंस क्या होता है तो देखिए आपके पास यहां पे कोई भी दो डेटा पॉइंट होता है दैट दो डेटा पॉइंट है यहां पे इस डेटा पॉइंट के कोऑर्डिनेट x y है और इसके कोऑर्डिनेट यहां पे x2 y2 है यहां पे x1 y1 x2 y2 है तो इन दोनों के बीच की जो स्टेट डिस्टेंस है यहां पे ये डिस्टेंस जो d है यहां पे ये कैलकुलेट की जाती है यहां पे स्क्वायर रूट ऑफ यहां पे x2 - x1 का होल स्क्वायर से प्लस यहां पे y2 - y1 के स्क्वा से मतलब इस तरह से आपके पास क्या की जाती है इन दोनों डेटा पॉइंट की डिस्टेंस को कैलकुलेट किया जाती है दैट इज़ कॉल्ड ऑफ यूक्लिड डिस्टेंस यस ये क्या कहलाती है गाइज यहां पे यूक्लिड डिस्टेंस आपके पास यहां पे कहलाती है अब इस यूक्लिड डिस्टेंस की हेल्प से हम क्या करते हैं हम हमारे जो ये ग्राफ है यस ये जो डेंडो ग्राम ग्राफ है वो डेंडो ग्राम ग्राफ बनाते हैं और फिर वहां से हम यहां पे क्या करते हैं बेस्ट नंबर ऑफ क्लस्टर्स यहां पे फाइंड आउट करते हैं अब यहां पे ये डेंडो ग्राम बनाने का जो तरीका होता है ये दो तरीके के होता है यहां पे और वो दो तरीके कौन-कौन से हैं तो फर्स्ट वन इज एलोमेटिक क्लस्टरिंग एंड सेकंड वन इज डाइवर्सिटी क्लस्टरिंग यस ये दो तरीके के टेक्निक्स होती है जिनकी हेल्प से आप क्या करते हैं गाइज यहां पे ये आपका डेंडो ग्राम बनाते हैं और जो इसके अंदर सबसे ज्यादा पॉपुलर और जो सबसे ज्यादा यूज केस में आने वाली एल्गोरिथम है यहां पे ब जो सबसे ज्यादा यूज़ केस आने वाली अप्रोच है यहां पे दैट इज कॉल्ड ऑफ एलमेट क्लस्टरिंग अब इन दोनों क्लस्टरिंग के अंदर क्या डिफरेंस है जरा इनको समझते हैं फिर हम क्या करेंगे एक डेटा सेट को लेंगे और वहां पे डेंडो ग्राम बनाएंगे और सबसे इंपॉर्टेंट चीज यहां पे ये आती है कि इस डेंडो ग्राम की हेल्प से हम कैसे फाइंड आउट करेंगे कि बेस्ट नंबर ऑफ क्लस्टर कौन सा है यहां पे चलिए उसको निकालते हैं यहां पे तो सबसे पहले हम बात करते हैं यहां पे अग्लोमेरेटिव क्लस्टरिंग के बारे में देखिए अग्लोमेरेटिव जो क्लस्टरिंग है आपके पास गाइ यहां पे वो आपके पास क्या है बॉटम टू अप अप्रोच है यस बॉटम टू अप अप्रोच है यहां पे बॉटम टू अप अप्रोच का मतलब क्या हुआ यहां पे जस्ट लाइक आपके पास मान लीजिए ये आपका एक डेटा सेट है यहां पे यस ये आपका डेटा सेट है यहां पे इस डेटा सेट में मतलब आपका ये x1 है और ये x2 कॉलम है जिसके ऊपर ये डेटा सेट है इस डेटा सेट में मान लीजिए ये पॉइंट है आपका पास कुछ यहां पे a है देन b है स है फिर डी फिर e आ गया एंड देन एफ पॉट आ गया अब यहां पे एलोमेटिक क्लस्टरिंग के अंदर आपके पास क्या किया जाता है गाइ यहां पे कि जो आपके पास सबसे नियरेस्ट पॉइंट होते हैं यहां पे यस जो भी आपके सबसे नियरेस्ट पॉइंट होते हैं इन दोनों नियरेस्ट पॉइंट के ऊपर आप क्या करते हैं यहां पे अपना एक क्लस्टर डिजाइन करते हैं अब मैंने यहां पे एक पॉइंट बोला है नियरेस्ट पॉइंट के ऊपर तो जो सबसे नियरेस्ट आपके पास डिस्टेंस वाला पॉइंट होगा आपके पास यहां पे उनके ऊपर आप क्या करते हैं क्लस्टर डिजाइन करते हैं तो आपने यहां पे ये क्लस्टर डिजाइन किया और आपने ये क्लस्टर न गया अब नेक्स्ट पॉइंट आता है यहां पर लिंकेज लिंकेज का मतलब गाइज क्या है यहां पे कि देखिए यहां पे दो क्लस्टर्स तो आपके पास बन गए लेकिन इन दो पॉइंट के ऊपर आपके पास ये पॉइंट कैसे लिंक करेगा मतलब किस पॉइंट के ऊपर लिंक करेगा तो इसके लिए आते हैं लिंकेज अभी मैं आने वाले पॉइंट के अंदर मैं बात करूंगा लिंकेज कितने टाइप्स के होता है कैसे-कैसे काम करता है तो बेसिकली इन पॉइंट के ऊपर आपका क्या करेगा लिंकेज वर्क करेगा अब लिंकेज क्या करता है गाइज यहां पे इनके ऊपर क्लस्टर डिजाइन करता है और यहां पे जैसे कि मैंने क्या किया यहां पे इन दोनों को और क्लस्टर बनाया फिर मैंने क्या किया गाइज यहां पे इन दोनों को और क्लस्टर बनाया फिर देन फाइनली मैंने क्या किया गाइज यहां पे इन सब को एक क्लस्टर बनाया तो मतलब यहां पे एलमेट क्लस्टरिंग के अंदर आपका क्या होता है बॉटम टू अप अप्रोच है बॉटम टू अप्रपोज का मतलब क्या है गाइज यहां पे कि सबसे पहले जो आपके छोटे-छोटे पॉइंट्स होते हैं वो छोटे छोटे पॉइंट जो हैं वो आपस में क्या करते हैं क्लस्टर बनाते हैं मतलब ग्रुप्स बनाते हैं जैसे ये दो पॉइंट मिलके एक ग्रुप बनाया इन दोनों पॉइंट को मिलके एक ग्रुप बनाया फिर क्या करते हैं गाइज यहां पे इनके ऊपर और ग्रुप्स बनाते हैं इनके ऊपर क्या करते हैं और ग्रुप्स बनाते हैं इस पॉइंट के साथ ये ग्रुप्स बना फिर ये ग्रुप बनके आपका फाइनली ये ग्रुप बन गया तो इस तरह से आपके पास क्या होगा गाइज यहां पे बॉटम टू अप अप्रोच के थ्रू अग्लोमेरेटिव क्लस्टरिंग आपका क्लस्टर करता राइट अभी हम यहां पे बेस्ट नंबर ऑफ़ क्लस्टर नहीं बना रहे अभी हम यहां पे क्लस्टर करने का तरीका देख रहे हैं कि अग्लोमेरेटिव क्लस्टरिंग किस तरह से वर्किंग करती है अब इसी सीरीज के अंदर आपके पास आता है डाइवर्सिटी क्लस्टरिंग डाइवर्सिटी क्लस्टरिंग क्या होती है गाइज यहां पे आपके पास टॉप टू बॉटम अप्रोच है टॉप टू बॉटम अप्रोच में अंदर क्या होता है कि सबसे पहले क्या करेंगे हम यहां पे सबसे पहला सबसे बड़ा जो क्लस्टर है वो डिजाइन कर लेंगे फिर उसके अंदर हम क्या करेंगे दो पार्टीशन करेंगे इस क्लस्टर के अंदर अब डिपेंड ऑन यहां पे डिस्टेंस के ऊपर कि इन दोनों के बीच में डिस्टेंस कितनी है यहां पे मतलब क्या करेंगे यहां पे कि भाई मैंने यहां पे ये दो क्लस्टर डिजाइन किया सबसे पहले इन दोनों की डिस्टेंस है ये डिस्टेंस मैक्सिमम है तो क्लस्टर बनेगा यदि ये डिस्टेंस मैक्सिमम नहीं है तो क्लस्टर नहीं बनेगा फिर हम क्या करेंगे कोई और अप्रोच ले लेंगे तो बेसिकली गाइज यहां पे क्या कर रहे हैं हम यहां पे कि आप यहां पर क्या करें हैं यहां पे इन दोनों को क्लस्टर बना रहे हैं फिर क्या कर रहे हैं गाइ यहां पे फिर इन दोनों को और क्लस्टर बना रहे हैं एंड देन फाइनली आपके पा सारे डटा पॉइंट क्या हो रहा है स्प्लिटिंग हो रहा हैं तो बेसिकली डाइवर्सिटी क्लस्टरिंग के अंदर आपके पास क्या हो रहा है गाइज यहां पे कि आपके पास टॉप टू बॉटम अप्रोच है टॉप टू बॉटम अप्रोच का मतलब क्या है गाइज सबसे पहले आपका सारा डेटा सेट आया आपने उसको क्या किया आपने दो पार्ट के अंदर स्प्लिटिंग किया फिर आपने क्या किया फर्द और प्लाट के अंदर स्प्लिटिंग किया फिर फर्द और प्लाट के अंदर स्प्लिटिंग किया फिर फर्द और प्लाट के अंदर स्प्लिटिंग किया दैट इज कॉल्ड ऑफ डाइवर्सिटी क्लस्टरिंग तो गाइ इन दो मेथड की हेल्प से हम क्या करते हैं हम हमारे डेटा पॉइंट को क्या करते है क्लस्टर करते हैं अब इन दोनों पॉइंट्स के अंदर जो सबसे ज्यादा यूज केस में आने वाली जो आपके पास हेलक कस्टिंग की जो एल्गोरिथम्स है मतलब जो मेथड्स है यहां पे वो कौन सा है यहां पे एलोमेटिक क्लस्टरिंग है मतलब एलोमेटिक क्लस्टरिंग आपके लिए सबसे बेस्ट होती है उसी अप्रोच की हेल्प से आप क्या करते हैं बेस्ट नंबर ऑफ क्लस्टर्स निकालते हैं अब मेन पॉइंट यहां पे आता है कि ये जो मेन डेटा पॉइंट है मतलब हमारे पास एक क्लस्टर बना उस एक क्लस्टर के बाद में हमारे पास ये जो दूसरा क्लस्टर बनता है मतलब आपके पास जैसे कि मैंने क्या किया गाइज यहां पे कि ये दोनों को मिला के तो एक क्लस्टर बना लिया लेकिन ये इसके साथ किस तरह से लिंकेज होगा तो इसके तरह मतलब इस तरह से किस तरह से अगला क्लस्टर बनेगा इसके लिए हमें जरूरत पड़ती है लिंकेज की यस ये लिंकेज क्या करते हैं गाइ यहां पे कि हमारा जो एक डेटा पॉइंट आ गया उस डेटा पॉइंट से वो कितना डिस्टेंस पे है उसके बाद किस तरह से क्लचर बनाना है उसके लिए हमें लिंकेज की जरूरत पड़ती है इस लिंकेज के अंदर हमारे पास आता है सिंगल लिंकेज देन आता है कंप्लीट लिंकेज एवरेज लिंकेज सिंक्रन लिंकेज इसके अलावा भी और भी सारे लिंकेज आते हैं ये कैसे वर्क करते हैं तो बेसिकली गाइज सिंगल लिंकेज के अंदर क्या करते हैं कि भाई जो आपका क्लस्टर बना है उस क्लस्टर से जो अगला पॉइंट यहां पे मिनिमम डिस्टेंस पे होगा जितना मिनिमम डिस्टेंस पे होगा वो लिया जाएगा कंप्लीट लिंकेज के अंदर हम क्या करते हैं मैक्सिमम डिस्टेंस को लेते हैं एवरेज डिस्टेंस में क्या करते हैं उनकी एवरेज डिस्टेंस को निकालते हैं और सेंट्रड लिंकेज में क्या करते हैं उसका सेंटर पॉइंट निकालते हैं देन उस तरह से वर्क करते हैं चलिए एक छोटा सा एग्जांपल लेके समझते हैं कि आखिर ये डेंडो ग्राम बनता कैसे है तो चलिए इसको जरा समझते हैं तो मैं यहां पे क्या कर रहा हूं एक एग्जांपल ले रहा हूं यहां पे य वाइट बोर्ड पे एक एग्जांपल ले रहा हूं यहां पे लेट्स सपोज कंसीडर करते हैं कि हमारे पास क्या है ये हमारे पास डेटा पॉइंट है जैसे कि ये हमारा x1 पॉइंट है और ये हमारा x2 पॉइंट है और इस पॉइंट के ऊपर हमारे पास क्या है कुछ इस तरह से पॉइंट्स पड़े हैं यहां पे यस ये पॉइंट्स पड़े यहां पे अब इन पॉइंट्स के अंदर हमारे पास बहुत सारे पॉइंट थे लेकिन मैं यहां पे कुछ एक दो पॉइंट्स को ही क कंसीडर करूंगा यहां पे लेट्स सपोज मैं फोर पॉइंट्स को ही कंसीडर कर रहा हूं यहां पे दैट a पॉइंट देन b पॉइंट देन c पॉइंट एंड देन डी पॉइंट अब हम क्या करने वाले हैं गाइज यहां पे कि ये जितने भी हमारे पॉइंट्स हैं यहां पे इन पॉइंट की डिस्टेंस को कैलकुलेट करेंगे फर्स्ट ऑफ ऑल हमारा डिस्टेंस कैलकुलेशन होता है यहां पे तो आपको क्या करना है डिस्टेंस कैलकुलेशन करना है तो जो भी डिस्टेंस कैलकुलेशन हुई है मैं उसकी एक मैट्रिक्स डिजाइन कर रहा हूं यहां पे मैं इसको थोड़ा सा पहले तो कम कर लेता हूं और मैं क्या कर रहा हूं यहां पे गाइज यहां पे एक मैट्रिक्स डिजाइन कर रहा हूं कि जो भी हमारा डिस्टेंस कैलकुलेट हुई है उनकी मैट्रिक्स क्या है लेट्स हमारे पास a पॉइंट है b पॉइंट है c पॉइंट है एंड d पॉइंट है ऊपर भी क्या है a पॉइंट देन b पॉइंट देन c पॉइंट एंड d पॉइंट अब मैं बता रहा हूं किस तरह से आपका डेंडो ग्राम बनता है यहां पे तो आपने क्या किया यहां पे एक मैट्रिक्स डिजाइन कर ली अब देखिए a और a के बीच की डिस्टेंस क्या होगी a और a की डिस्टेंस हमारी रो होने वाली है b और b की डिस्टेंस रो होने वाली है c और c की डिस्टेंस आपके पास यहां पे ज़ीरो होने वाली है एंड डी एंडडी की डिस्टेंस आपके पास जीरो होने वाली है तो लेट्स हमने क्या किया यहां पे जिनकी खुद की डिस्टेंस है वो रो होगी क्योंकि देखिए वो पॉइंट वहीं पे है और डिस्टेंस को कैलकुलेट करेंगे उसी से तो वो तो आपके ज़ीरो ही निकलने वाली है राइट अब सेकंड पॉइंट यहां पे आता है कि इस पर्टिकुलर पॉइंट से बाकी लोगों की डिस्टेंस कितनी है और यहां पे डिस्टेंस जो हम कैलकुलेट कर रहे हैं दैट अ यूक्लिड डिस्टेंस यस यें डिस्टेंस निकालनी है तो अब मैं क्या कर रहा हूं रैंडम डिस्टेंस भर रहा हूं क्योंकि यहां पे हमें एगजैक्टली डिस्टेंस तो नहीं पता तो मैं रैंडम कुछ भी डिस्टेंस भर रहा हूं लेट्स सपोज a और b की जो डिस्टेंस आपको दिख रही है दैट अ टू जस्ट टू डिस्टेंस है यहां पे और a और c की डिस्टेंस है ये आपके पास फोर है और a c और b की डिस्टेंस की बात करें तो आप यहां पे फाइव मान लीजिए d और a की डिस्टेंस की बात करें तो ये आपके सिक्स मान लीजिए d और b की बात करें तो ये सेन मान लीजिए और d और c की बात करें तो ये आपके पास यहां पर एट मान लीजिए ठीक है ये कुछ डिस्टेंस हमने कैलकुलेट कर लिए अब ये ग्राफ आप ऊपर भी ये जो डाटा है यहां पे ऊपर भी भर सकता है लेकिन मैं फिलहाल ऊपर नहीं भर रहा हूं राइट अब हमें करना क्या है अब हमें सबसे पहले इनके अंदर जो सबसे मिनिमम डिस्टेंस है उसे फाइंड आउट करना है मतलब हम हमारा पहला क्लस्टर डिजाइन करने जा रहे हैं यहां पे मतलब पहला जो ग्रुप्स है वो डिजाइन करना जा रहे है अब इनके अंदर जो सबसे मिनिमम डिस्टेंस कौन सी दिख रही है सबसे मिनिमम जो डिस्टेंस हमें दिख रही है दैट अ टू यस सबसे मिनिमम डिस्टेंस हमारे पास क्या आ रही है टू हमारे पास सबसे मिनिमम डिस्टेंस हमें मिल रही है इसका मतलब क्या हुआ गाइज यहां पे कि अब आप अपना क्लस्टर डिजाइन कर लीजिए और वो क्लस्टर कौन सा होगा गाइज यहां पे ये a और b का होने वाला है और इनके बीच की डिस्टेंस कितनी है टू डिस्टेंस है तो चलिए साथ-साथ हम यहां पर हमारा जो डेंडो ग्राम है वो भी हम यहां पर डिजाइन कर लेते हैं कि ये डेंडो ग्राम किस तरह से बनेगा तो मैं डेंडो ग्राम भी बनाने जा रहा हूं यहां पर साथ-साथ ठीक है तो एक तरफ हमारे पास क्या आएगा हमारे डेटा पॉइंट आएंगे तो ये हमारा पहला डेटा पॉइंट ए आया है और ये हमारा दूसरा डेटा पॉइंट b आया अब इन दोनों के बीच की डिस्टेंस को हमने कैलकुलेट किया और कैलकुलेट करने पर हमारे पास आंसर कितना आया टू आया तो वो हमने यहां पे लिख लिया मतलब इस तरफ हमारे पास क्या आएंगे डेटा पॉइंट आएंगे यस यहां पे क्या आएंगे डटा पॉइंट्स हमारे पास आने वाले हैं और इस तरफ क्या आने वाली है डिस्टेंस आपके पास यहां पे आने वाली है राइट तो डिस्टेंस कितनी आई है आपके पास टू आई है ओके अब हमारे पास क्या होगा ये क्लस्टर बन चुका है अब इस क्लस्टर से अगला डेटा पॉइंट कौन सा हो वाला है अब यहां पे देखिए हमारे पास डेटा पॉइंट कम है इसलिए हमने एक ही क्लस्टर बनाया अब यदि हमारे पास डेटा पॉइंट ज्यादा हो होते हैं तो उनमें से काफी ऐसे डेटा पॉइंट होंगे जिनके बीच के क्लस्टर की जो डिस्टेंस होगी वो सेम होगी तो वो भी आपस में मिलकर एक क्लस्टर डिजाइन करेंगे राइट लेकिन हमारे पास अभी क्या है डेटा पॉइंट कम है तो उसको डेटा पॉइंट को कम लेते हुए मैं यहां पे वर्किंग कर रहा हूं अब हमारा नेक्स्ट टारगेट होगा कि a और b मिलके हमारे पास एक क्लस्टर बन चुका है तो अगला क्लस्टर कौन सा बनेगा तो यहां पर काम आते हैं आपके लिंकेज इस लिंकेज के बेसिस पे आप क्या करते हैं कि अगला डेटा पॉइंट उनके साथ कौन सा जुड़ेगा वो डिसाइड करते हैं तो फिलहाल अभी मैं जो यहां पे ले रहा हूं दैट इज आपके पास सिंगल लिंकेज की बात कर रहा हूं यहां पे सिंगल लिंकेज में क्या होता है गाइ यहां पे कि ये जो डेटा पॉइंट है इस डेटा पॉइंट से अगले डेटा पॉइंट के बीच की मिनिमम डिस्टेंस को कैलकुलेट किया जाता है मतलब दोनों के बीच में मिनिमम डिस्टेंस कौन सी है वो हम कैलकुलेट करेंगे कैसे करेंगे तो देखिए मैं प पहले क्या कर रहा हूं इस मैट्रिक्स को जोड़ा छोड़ा सा चेंज कर रहा हूं यहां पे और मैट्रिक्स को चेंज करके क्या कर रहा हूं गाइज यहां पे कि अब a और b मिलके तो हमारे पास क्लस्टर बन चुका है तो मैं a और b का क्या कर रहा हूं एक सिंगल ग्रुप बना रहा हूं पीछे रह गया हमारे पास यहां पे c और डी यहां पे बात कर लेते हैं तो हमने क्या किया a और b का एक ग्रुप बना लिया यहां पे एंड पीछे रह गया आपके पास यहां पे c और डी अच्छा ए ब के बीच की डिस्टेंस रो है यहां पे यस c और c के बीच की डिस्टेंस भी रो हो जाएगी d और d के बीच डिस्टेंस क्या हो जाएगी रो हो जाएगी अच्छा एक और देख देखते हैं यहां पे ओके एक और चीज देखते हैं d और d के बीच की डिस्टेंस भी हमारे पास क्या हो जाएगी यहां पे जीरो हो जाएगी अब हम क्या कर रहे हैं गाइ यहां पे देखिए c और a की डिस्टेंस देखते हैं या c और a की डिस्टेंस देखते हैं तो ये अभी इसके लिए वेट करते हैं यहां पे और c और c की डिस्टेंस तो जीरो ही है यहां पे अच्छा d और d की डिस्टेंस जीरो है लेकिन d और c की डिस्टेंस ये हमें पता है d और d और c की डिस्टेंस वो कितनी है गाइज यहां पे d एंड एंड c की जो डिस्टेंस है आपके पास यहां पे वो कितनी है एट है तो मैं ए रख लेता हूं इस ग्राफ को थोड़ा इस मैट्रिक्स को थोड़ा सा सही बना देते हैं यहां पे राइट तो मैट्रिक्स को थोड़ा सा सही कर देते हैं तो उसके लिए मैं थोड़ा सा लाइन का इस्तेमाल करूंगा यहां पे मैट्रिक्स को सही बनाने के लिए तो इस मैट्रिक्स को थोड़ा सा सही बना लेते हैं यहां पे गाइस तो मैं यहां पे क्या कर रहा हूं मैट्रिक्स को सही बना रहा हूं और अब हमारे पास क्या बन गए यहां पे तीन पॉइंट्स बन गए हैं यहां पे दैट्ची पॉइंट्स हमारे पास यहां पे आ चुके हैं कुछ इस तरह से ओके अब जरा समझते हैं इन पट पंट्स को क्या है यहां पे तो ये हमारे पास ए है देन c है और देन d है यहां पे भी क्या आएगा ए आएगा देन आपके पास क्या आएगा c आएगा एंड देन d आएगा अच्छा ए के बीच रो है c और c के बीच की रो है और d और d की रो है अच्छा c और d के बीच की डिस्टेंस देखें तो वो कितनी आ रही है एट आ रही है लेकिन अभी c और ए की डिस्टेंस बाकी है और ए और d के बीच की डिस्टेंस बाकी है अब ये कैसे कैलकुलेट होगी तो अब हमने क्या इस्तेमाल किया यहां पे हम इस्तेमाल कर रहे हैं यहां पे कौन सा सिंगल आपके पास लिंकेज का यस सिंगल आपके पास लिंकेज का इस्तेमाल कर रहे हैं तो सिंगल लिंकेज के अंदर बात करें तो सिंगल लिंकेज क्या करेगा गाइज यहां पे कि ये जो आपका डेटा पॉइंट है यस ये आपका जो क्लस्टर बनाया इस क्लस्टर के इस पॉइंट के बीच की डिस्टेंस निकालेंगे हम यहां पे राइट इस डटा पॉइंट के इसके बीच की भी डिस्टेंस निकालेंगे इन दोनों में जो सबसे मिनिमम डिस्टेंस होगी वही हमारी कैलकुलेट की जाएगी वही हम क्या करेंगे कंसीडर करेंगे इसी तरह से इन दोनों के बीच की डिस्टेंस भी निकालेंगे और इन दोनों के बीच की डिस्टेंस भी निकालेंगे फिर इनमें जो सबसे मिनिमम डिस्टेंस होगी वह हम यहां पे क्या करेंगे कैलकुलेटेड करेंगे चलिए कैलकुलेट करते हैं किस तरह से निकालते हैं यहां पे तो देखिए a और b के अंदर आपके पास बात करें यहां पे तो ए के बीच की डिस्टेंस ए और यहां पे पे c के बीच की डिस्टेंस की बात कर रहे हैं हम यहां पे राइट तो देखिए मैं यहां पे क्या करूंगा a b और हमारे पास क्या हो रहा है c के बीच की डिस्टेंस निकालनी है तो हम क्या करेंगे a और c की डिस्टेंस निकालेंगे अच्छा a और c की डिस्टेंस निकालेंगे तो वो कितनी आ रही है अकॉर्डिंग टू दिस मैट्रिक्स चलिए मैं इसको भी मैट्रिक्स को थोड़ा सा सही कर देता हूं यस ताकि आप लोगों को क्या हो कंफ्यूजन ना हो यहां पे तो मैं इसको भी क्या कर लेता हूं थोड़ा सा सही कर देता हूं राइट ताकि आपको कंफ्यूजन ना हो चलिए अब हमें क्या करना है a और c के बीच की डिस्टेंस निकालनी है a और c के बीच की डिस्टेंस कितनी है गाइज यहां पे फोर है अब हमें क्या करना है b और c के बीच डिस्टेंस निकालनी है b और c के डिस्टेंस की बात की हमने यहां पे फाइव है अब हमने क्या डिसाइड किया था मिनिमम डिस्टेंस क्योंकि लिंकेज कौन सा है हमारा आपके पास सिंगल लिंकेज है और सिंगल लिंकेज क्या करता है मिनिमम डिस्टेंस को कंसीडर करता है और मिनिमम डिस्टेंस कितनी है गाइज यहां पे फोर है हमारे पास यहां पे तो हम यहां पे क्या लिख देंगे फोर लिख देंगे ओके तो ये हमारी पहली डिस्टेंस आ चुकी है अब हमें क्या करना है यहां पे हमें ए यस हमारे पास जो ए है यहां पे इस ए के साथ हमें क्या करना है d की डिस्टेंस को भी कंसीडर करना है तो चलिए पहले a और d की डिस्टेंस कैलकुलेट करते हैं a और d की डिस्टेंस हमारे पास कितनी आई है सक्स आई है अच्छा नेक्स्ट हमारे पास क्या है b और डी की डिस्टेंस कैलकुलेट करनी है तो बी और डिस्टेंस b और डी की डिस्टेंस कितनी है सेवन है तो मैंने सेवन निकाला इसमें मिनिमम कौन सा है मिनिमम आपका सिक्स है तो ये हमने कंसीडर कर लिया तो इस तरह से आपका क्या हुआ दूसरी मैट्रिक्स तैयार हो गई है अब फिर से हम क्या करेंगे इस सब के अंदर मिनिमम डिस्टेंस को कैलकुलेट करेंगे सबसे मिनिमम डिस्टेंस कौन सी है सबसे मिनिमम डिस्टेंस हमें यहां पे फोर दिख रही है मतलब इस ए का जो अगला क्लस्टर आपका बनने वाला है वो किसके साथ बनेगा c के साथ बनेगा तो अब हमारा क्लस्टर स्टार्ट हुआ है यहां पे फिर से और ये क्लस्टर कौन सा बना है यहां पे ये आपके पास स स के साथ आपका डिजाइन हो चुका है और यहां पे बात करें तो ये बी के साथ अब क्या जुड़ेगा c भी जुड़ेगा यहां पे और ये डिस्टेंस कितनी है गाइ यहां पे फोर के साथ क्लस्टर बना है यहां पे तो बेसिकली मैं यहां पे ये क्लस्टर बनाऊंगा और ये कितना पॉइंट पे आएगा फोर पॉइंट पे आ जाएगा राइट तो ये आपका एक और क्लस्टर डिजाइन हो गया अब बारी है हमारे पास d की अब डी कैसे बनेगा यहां पे जरा उसकी बात करें हैं तो अब आपकी जो मैट्रिक्स है वो भी अब फिर से क्या होगी चेंज हो जाएगी मैट्रिक्स चेंज होग कैसे बनेगी गाइ यहां पे यस ये मैट्रिक्स चेंज हो के कैसे बनेगी तो जरा देखें तो ये मैट्रिक्स अब कुछ इस तरह से डिजाइन होगी अब यहां पे बात करें तो अब आपके पास पॉइंट्स भी कम बच गए हैं यहां पे अब पॉइंट की बात करें तो आपके पास क्या बना ए c बना और पीछे रह गया आपका d यहां पे बात करें तो ए c बना और पीछे रह गया आपका d राइट ए c के बीच की डिस्टेंस रो और d और d आपस में करेंगे ज़ीरो डिस्टेंस रखेंगे अब ये जो ए c है इस d के साथ कितनी डिस्टेंस रखता है वो मिनिमम डिस्टेंस हम यहां पे ढूंढेंगे राइट क्योंकि हमने लिंकेज कौन सा इस्तेमाल किया है सिंगल लिंकेज इस्तेमाल किया है तो अब a b c और d की डिस्टेंस निकालनी है तो a और d की डिस्टेंस आप कैलकुलेट कीजिए पहले a और d की डिस्टेंस हमारे पास कितना कितनी आई है सिक्स आ गई है फिर उसके बाद b और d की डिस्टेंस कैलकुलेट कीजिए b और d की डिस्टेंस आपके पास कितनी आई है सेवन आई है c और d की डिस्टेंस भी कैलकुलेट कर लीजिए c और d की डिस्टेंस कैलकुलेट करें दैट एट डिस्टेंस आइ है इन सब के अंदर सबसे मिनिमम कौन सी है आपकी सिक्स डिस्टेंस है और ये सिक्स डिस्टेंस हमारी फाइनल डिस्टेंस होगी ओके तो अब हमने क्या किया सिक्स डिस्टेंस ले लिया यहां पे सिक्स डिस्टेंस लेते ही हमारे पास जो क्लस्टर डिजाइन होगा वो ये बचा हुआ जो क्लस्टर है वो डिजाइन हो जाएगा और ये किसके साथ होगा सिक्स डिस्टेंस के साथ कैलकुलेट होगा राइट तो अब मैं यहां पे पे अगला पॉइंट ले रहा हूं ट्स अडी पॉइंट और ये डी पॉइंट जो आगे जाके आपका जुड़ने वाला है गाइज यहां पे दैट इज अ सिक्स के साथ यस ये किसके साथ जुड़ेगा यहां पे सिक्स के साथ जुड़ेगा तो इस तरह से आपका क्या बनता है डेंडो ग्राम आपका डिजाइन हो जाता है अब डेंडो ग्राम तो डिजाइन हो गया लेकिन प्रॉब्लम यहीं पे आती है कि सर बेस्ट नंबर ऑफ क्लस्टर कैसे डिजाइन करेंगे मतलब बेस्ट नंबर ऑफ क्लस्टर कैसे होगा तो देखिए बेस्ट नंबर ऑफ क्लस्टर बनाने के लिए अब आपको एक छोटी सी अप्रोच का इस्तेमाल करना पड़ेगा और वो अप्रोच क्या है गाइज यहां पे जरा समझिए थोड़ी सी ट्रिकी अप्रोच है मतलब थोड़ी सी डिफिकल्ट अप्रोच है लेकिन आपको थोड़ा सा फोकस करना पड़ेगा उस अप्रोच के ऊपर कि कैसे वर्क करता है आपको क्या करना है फर्स्ट ऑफ ऑल जितने भी ये लाइंस बन रही है यस जितने भी ये लाइंस बन रही है आप लोगों को दिख रही है यहां पे आप क्या करेंगे इन लाइंस से गुजरने वाली एक लाइन डिजाइन करेंगे जैसे कि मैं यहां पे क्या कर रहा हूं एक लाइन डिजाइन कर रहा हूं इस तरह से यस ये एक लाइन ये डिजाइन कि है मैंने यहां पे देन सेकंड लाइन मैंने यहां पे ये डिजाइन कर दी है और थर्ड लाइन मैंने यहां पे ये डिजइन कर दी है अब आपको क्या करना है गाइ यहां पे यस जो भी मैंने डिजाइन कि लाइंस यहां पे अब आपको क्या करना है अब आपको वो सबसे मैक्सिम मम लाइन आपको निकालनी है जो कि नॉन कटिंग है मतलब जिसको कोई लाइन नहीं कट कर रही है जैसे देखिए यहां पर ये सबसे बड़ी मैक्सिमम लाइन है ये आपकी सबसे बड़ी मैक्सिम लाइन दिख रही होगी आपको मैं थोड़ा सा डेंडो ग्राम को थोड़ा सा बड़ा कर देता हूं डेंडो ग्राम आपको समझ में आ गया होगा यहां पे अब थोड़ा डेंडो ग्राम को बड़ा कर देते हैं यहां पे अब इसके अंदर सबसे मैक्सिमम लाइन कौन सी है सबसे बड़ी लाइन कौन सी है आप बोलेंगे सबसे बड़ी लाइन ये है लेकिन इसको कितनी लाइन कट कर रही है तीन लाइन कट कर रही है तो हमें ये कंसीडर नहीं करना है अब नेक्स्ट बड़ी लाइन कौन सी देंगे आप यहां पे नेक्स्ट बड़ी लाइन आपके पास ये है इसको कितनी लाइन कट कर रही है गाइज यहां पे इसको को एक लाइन कट कर रही है तो ये आपके पास हो गई नेक्स्ट बड़ी लाइन कौन सी होगई गाइज यहां पे ये भी है और ये भी है लेकिन इन दोनों के बीच की डिस्टेंस देखिए देखिए आपके पास फोर और सिक्स है यस फोर और सिक्स है तो फोर के बाद फाइव एंड सिक्स मतलब दो का डिस्टेंस है और इसके बीच की बात करें हैं टू एंड थ्री और फोर मतलब इनके बीच में भी दो का डिस्टेंस है तो आप चाहे तो ये भी ले सकते हैं आप चाहे ये भी ले सकते हैं लेकिन मैं आप लोगों को यही आपको सजेस्ट करूंगा कि ये डिस्टेंस टू और फोर का नहीं होगा ज्यादा ही डिस्टेंस होने वाला होगा यहां पे तो गाइज यहां पे आपकी ये वाली ही सबसे बड़ी डिस्टेंस कह लाएगी आपके पा यहां पे यस क्योंकि देखिए अभी तो हमने क्या किया एक रैंडम डेटा लिया उस रैंडम डटा के ऊपर काम किया लेकिन आपके पास यहां पे हर बार रैंडम डाटा नहीं मिलेगा आपको परफेक्ट डटा मिलेगा यहां पे तो उस वक्त आपको जो सबसे बड़ी डिस्टेंस है वो आपको मिल जाएगी लेट्स मान लीजिए कि आपके पास ये है आपकी सबसे बड़ी लाइन यस आपके पास क्या है ये है आपकी सबसे बड़ी लाइन अब इस सबसे बड़ी लाइन के अंदर हमें क्या करना है गाइज यहां पे इस सबसे बड़ी लाइन से अब हमें क्या करना है एक लाइन को कट करना है यस इस सबसे बड़ी लाइन के मिडल से हमें क्या करना है एक लाइन को कट करना है जैसे कि मैंने यहां पे ये लाइन को कट कर दिया अब जैसे मैंने लाइन को कट किया लाइन को कट करने के बाद आपको कितने डटा पॉइंट मिले तो आपके पास देखो एक ये वाला आपको पॉइंट मिला यहां पे यस एक ये वाला पॉइंट आपको मिला यहां पे और एक आपके पास ये वाली लाइन मिली इसका मतलब इसके अंदर कितने नंबर ऑफ क्लस्टर बनने वाले हैं गाइ यहां पे यहां पे दो नंबर ऑफ क्लस्टर बने होंगे पहला क्लस्टर आपके पास ये बनेगा जो कि किसका होगा ए बी स का आपके पास होगा और दूसरा क्लस्टर आपका डी अकेला बनाएगा ट डी अकेला इस तरह से क्लस्टर बनाएगा तो गाइस यहां पे बात करें रिकल कस्टिंग के अर तो रिकल कस्टिंग आपके पास यहां पे कुछ इस तरह से हुआ करती है अब मैं आपको आपको थोड़ा सा डेंडो ग्राम भी दिखा देता हूं कि डोग्रिल्सेक्स ढूंढते हैं जो कि नॉन कटिंग होनी चाहिए किसी से भी कट नहीं करनी चाहिए और वो जो सबसे लंबी डिस्टेंस होगी उसको मिडल से कट कीजिए और जितने भी आपके नंबर ऑफ क्लस्टर बनेंगे वो आपके पास क्या होंगे बेस्ट नंबर ऑफ क्लस्टर्स आपके पास होने वाला है हे एवरीवन वंस अगेन वेलकम टू डब्स कपटेक माय सेल्फ ग और आज इस वीडियो के जरिए हम बात करने वाले हैं एलमेट क्लस्टरिंग के बारे में देखिए रिकल क्लस्टरिंग के अंदर हमने समझा था कि दो तरीके की क्लस्टरिंग होती है आपके पास होती है एक एलोमेटिक क्लस्टरिंग और दूसरी होती है डाइवर्सिटी क्लस्टरिंग तो उसमें से आज हम यहां पे एलोमेटिक क्लस्टरिंग को समझेंगे यदि हमारे पास कोई डेटा सेट आ जाए तो उस डटा सेट में से कैसे कितने नंबर ऑफ क्लस्टर निकलने वाले हैं एलोमेटिक क्लस्टरिंग की हेल्प से वो हम यहां पर आज प्रैक्टिकली तौर पे देखने वाले हैं तो चलिए जरा इसे स्टार्ट करते हैं तो देखिए सबसे पहले मैं अपने डेटा सेट के पास जाऊंगा और ये देखिए मेरे पास आयस के नाम से एक डेटा सेट पड़ा है आयस डॉ के नाम केम से जिसके अंदर एक आयस फ्लवर के सपल लेंथ सपल विड्थ पैटल लेंथ एंड पैटल विड्थ के बारे में यहां पे इंफॉर्मेशन दे रखी है अब मुझे यहां पे ये बताना है कि इसके अंदर कितने नंबर ऑफ फ्लावर्स हैं देखिए मैंने ऐसा ही डाटा चूज किया है जो कि आप डे टू डे लाइफ के अंदर यूज़ कर रहे हैं मतलब हम बहुत टाइम से इसे यूज़ करते आए हैं कि एक आयस फ्लावर डाटा सेट है जिसके अंदर हमारे पास तीन तरीके के फ्लावर है और वो कौन-कौन से हैं सेटो सा वर्सी कलर एंड वर्जनी का तो बस हमें भी क्या करना है यहां पे एलोमेटिक क्लस्टरिंग की हेल्प से यह पता लगाना है कि इसके अंदर कितने नंबर ऑफ क्लस्टर्स होने वाले हैं तो चलिए जरा इसे शुरू करते हैं तो इसके लिए ले चलता हूं मैं आपको जुपिटर नोटबुक के ऊपर जहां पे मैं यह सब कुछ काम करने वाला हूं अब इसको यूज़ करने से पहले हमें कुछ रिक्वायर्ड मॉड्यूल की जरूरत पड़ेगी तो हम पहले उन रिक्वायर्ड मॉड्यूल को क्या करते हैं इंपोर्ट करते हैं तो मैं यहां पे इंपोर्ट करने जा रहा हूं किसे सबसे पहले मैं इंपोर्ट करूंगा यहां पे पांडा एलियाज और पडी को देन मैं इंपोर्ट करूंगा यहां पे किसे मैट प्लॉट लिप को क्योंकि ग्राफ वगैरह हम यहां पे बहुत बनाने वाले हैं मैं लेने वाला हूं मैट प्लॉट लिप को ताकि हम ग्राफ बनाने वाले हैं तो मैटल प्लॉट मैं यहां पे पीवा प्लॉट लूंगा एलियाज ऑफ मैं लेने वाला हूं पीएटी इसके साथ-साथ मैं इंपोर्ट करने वाला हूं किसे सी बन को तो सी बन एलियास ऑफ एसएनएस ले लेते हैं चलिए अब हम इसे रन करते हैं और सबसे पहले हम हमारे जो डेटा सेट है उसे हम लोड करते हैं और लोड करने के लिए हम इस्तेमाल करेंगे pd3 यहां पे हमें क्या करना है हमारा जो डेटा सेट है और डेटा सेट का नाम क्या है आड सए इसके ऊपर जाके क्लिक करके इसका कॉपी पाथ करते हैं मतलब इसका पाथ विद इसका फाइल नेम वगैरह सब कुछ ले लेते हैं चलिए यहां जाके इसे पेस्ट कर देते हैं और इसके आगे आर लगा देते हैं दैट अ मेकिंग अ रॉ स्ट्रिंग ओके अब इस डेटा सेट के अंदर डाटा किस तरह से दिखाई दे रहा है पहले उसे देख लेते हैं यहां पे और देखने के लिए उसके लिए हैड टू का इस्तेमाल करेंगे और हैड टू के अंदर हमारे पास दो रो हमारे पास आ जाएगी अब देखिए हमारे पास डटा आ चुका है जिसके अंदर सपल लेंथ सपल विड्थ पैटल लेंथ एंड पैटल विड्थ के बारे में हमें इंफॉर्मेशन दे रखी है अब देख लेते हैं क्या ये डाटा लीनियर है या नॉन लीनियर है देखिए ग्लोमेटिक क्लस्टरिंग या फिर आप बात करें रिकल कस्टिंग जो वर्किंग करती है वो आपके पास लीनियर सेपरेबल डाटा के ऊपर वर्क करती है मतलब आपका डेटा लीनियर सेपरेबल होना चाहिए तभी आप वर्क कर सकते हैं यदि आपका नॉन लीनियर सेपरेबल डाटा है या किसी अदर शेप के अंदर डाटा है तो वहां पे एलोमेटिक क्लस्टरिंग वर्क नहीं करती है अच्छे तरीके से तो वहां पे आपको और भी दूसरी तरह की जो क्लस्टरिंग होती है उनका इस्तेमाल करना पड़ता है तो बेसिकली मैं यहां पे क्या करूंगा गाइज यहां पे बेसिकली गाइज यहां पे चेक करूंगा कि ये जो डाटा है क्या ये लीनियर सेपरेबल है तो इसके लिए हम बनाएंगे यहां पे पेयर प्लॉट तो मैं यहां पे एसए डॉट क्या करने वाला हूं गाइ यहां पे पेयर प्लॉट का इस्तेमाल करूंगा और पेयर प्लॉट के अंदर डेटा के अंदर मैं अपना जो डेटा सेट है वो प्रोवाइड कर दूंगा और उसके बाद मैं इस ग्राफ को देखने के लिए मैं पीएटी डॉट क्या करूंगा गाइ यहां पे शो फंक्शन को रन करूंगा और ये मेरे पास क्या करेगा इसका एक पेयर प्लॉट बना के देगा जहां पे हमें इंफॉर्मेशन मिल जाएगी कि क्या ये लिनियली सेपरेबल है तो जैसा कि देखिए ये ग्राफ आया है इस ग्राफ को यदि हम ऑब्जर्वेशन करें तो देखिए हमारे पास जो डाटा है वो काफी लीनियर सेपरेबल दिख रहा है जैसे कि देखिए यह वाला जो ग्रुप है और ये वाला ग्रुप है अलग दिख रहा है ये वाला जो ग्रुप है ये वाला ग्रुप अलग दिख रहा है ये वाला ग्रुप और ये वाला ग्रुप अलग दिख रहा है तो बेसिकली इसके अंदर दो ग्रुप बनने चाहिए थे यस बेसिकली इसके अंदर कितने ग्रुप बनने चाहिए दो ग्रुप बनने चाहिए लेकिन एलोमेटिक क्रस्टिंग से पता करते हैं कि इसके अंदर कितने ग्रुप्स बनेंगे तो मैं यहां पे क्या करता हूं इसे अखबार के लिए एक बार के लिए हाइड कर देता हूं अब हमारा नेक्स्ट टारगेट क्या होगा कि जो हमारे पास ये डाटा सेट आ रखा है इस इस डेटा सेट पे हम क्या करें पहले डेंडो ग्राम बनाएं और डेंडो ग्राम से हम यह पता करें कि इसके अंदर नंबर ऑफ क्लस्टर कितने हैं देन उसके बाद हम उस नंबर ऑफ क्लस्टर को ले जाके एलोमेटिक क्लस्टरिंग के अंदर रखेंगे तो एलोमेटिक क्लस्टरिंग हमें क्या करेगी यहां पे बता देगी कि कौन-कौन से ग्रुप्स बन रहे हैं और किस-किस तरह से बन रहे हैं तो चलिए सबसे पहले यहां पे डेंटो ग्राम बनाते हैं अब डेंटो ग्राम बनाने के लिए आपको जरूरत पड़ती है साई पाई लाइब्रेरी की क्योंकि उसके थ्रू आपका डेंटो ग्राम बनता है तो अब हम क्या करेंगे सब सबसे पहले साई लाइब्रेरी को हमारे सिस्टम में इंस्टॉल करेंगे तो उसके लिए आप googlethalli.com भा मेरे सिस्टम में इंस्टॉल है इसलिए रिक्वायरमेंट ऑलरेडी सेटिस्फाई दिखा रहा है यदि आपके सिस्टम में इंस्टॉल नहीं है ये क्या करेगा आपके पास डाउनलोड करेगा चलिए सापा हमारा सिस्टम में डाउनलोड है तो मैं इसे क्या कर देता हूं क्लोज कर देता हूं अब मैं बैक टू द वापस टॉपिक पे आ जाता हूं तो चलिए सा पाई के थ्रू हम क्या करते हैं डंडो ग्राम बनाते हैं डंडो ग्राम बनाने के लिए मैं यहां पे क्या करने वाला हूं इंपोर्ट करने वाला हूं और इंपोर्ट किसे करूंगा यहां पे सबसे पहले साई को करूंगा और साई के अंदर जाने के बाद दैट मैं क्लस्टर को लेके जाऊंगा एंड क्लस्टर के अंदर आपको मिलेगा यरार की यस इस यरार की के थ्रू ही हम हमारा डेंटो ग्राम बना पाएंगे इसका एक लिया रख देते हैं और इस एलियास को हम बना लेते हैं एससी के नाम से चलिए इस एससी के अंदर आपको मिलेगा डेंडो ग्राम इस डेंडो ग्राम के थ्रू ही हम हमारा ग्राफ बना पाएंगे अब इस एंडोग्राम को बनाने के लिए हमें जरूरत पड़ेगी हमारे लिंकेज की तो अब हम पहले लिंकेज को इंपोर्ट करेंगे और इसके साथ-साथ हमें जरूरत पड़ेगी हमारे डाटा की तो दोनों चीजें यहां पे क्या करते हैं प्रोवाइड करते हैं देखिए जैसे ही आप ऊपर ओपन करेंगे तो आपको सबसे पहले जड मांगा जाएगा दैट जड इज आपके पास लिंकेज यस इस लिंकेज को देना पड़ेगा तो चलिए लिंकेज लगाते हैं यहां पे तो एससी डॉट आपको इसमें जाना है यहां पे लिंकेज के अंदर जाना है और लिंकेज के अंदर आप जाएंगे तो लिंकेज के अंदर आपका सबसे पहले आपका डटा एंड लिंकेज का मैथड लिखा मिलेगा तो डेटा कहां है हमारा तो डेटा हमारा डेटा सेट के अंदर है तो डेटा के अंदर मैं डेटा सेट पास करा देता हूं और बात करते हैं यहां पे मेथड के बारे में देखिए जैसे कि मैंने आपको बताया था कि इसके अंदर जो मेथड्स होते हैं वो आपके पास बहुत से तरीके होते हैं इसके अंदर आपका सिंगल लिंकेज भी मिलता है इसके अंदर आपके पास यहां पे आपका कंप्लीट लिंकेज मिलता है सेंट्रड लिंकेज मिलता है ऐसे बहुत से तरह के लिंकेज मिलते हैं इसके साथ-साथ जो आप डिस्टेंस कैलकुलेट करते हैं उसके लिए आप मैट्रिक्स का इस्तेमाल कर सकते हैं और इसके अंदर आप यूक्लिडियन मैट्रिक्स का इस्तेमाल कर सकते हैं या फिर मैनहैटन डिस्टेंस का भी आप इस्तेमाल कर सकते हैं तो चलिए देखिए इसके अंदर कौन-कौन से लिंकेज है तो जैसे कि आप इसके अंदर थोड़ा सा नीचे की तरफ चलेंगे तो आपके पास देखिए सिंगल लिंकेज आपको मिलल जाएगा कंप्लीट लिंकेज आपको मिल जाएगा आपको एवरेज लिंकेज भी मिल जाएगा इसी तरह से व अ वेटेज लिंकेज भी मिल जाएगा सेंट्रल लिंकेज भी मिल जाएगा आपके पास मीडियन लिंकेज है वार्ड लिंकेज है ऐसे करके बहुत सारे लिंकेज आपके पास मिल जाएंगे और बात करें डिस्टेंस के बारे में यस ये जो आपने पास यहां पे डिस्टेंस कैलकुलेट की है तो उस डिस्टेंस को कैलकुलेट करने के लिए आप मैट्रिक्स के अंदर यूक्लिडियन मैट्रिक्स का इस्तेमाल कर रहे हैं तो मैं बेसिकली यहां पे सिंगल लिंकेज का ही इस्तेमाल करूंगा तो मैं यहां पे डाटा दे चुका हूं और अब बारी है हमारे मेथड और आपके पास डिस्टेंस कैलकुलेट करने की तो वो चीज मैं डायरेक्टली पास करा रहा हूं तो देखिए मेथड हमने कौन सा इस्तेमाल किया है आपके पास सिंगल लिंकेज और इसके साथ-साथ मैट्रिक्स कौन सी पास की है यूक्लिड एन मैट्रिक्स पास की है चलिए इसको ग्राफ को बनाने के लिए मैं पीएटी डॉट यहां पर शो फंक्शन को कॉल करूंगा और जैसे ही मैं यहां पे रन करता हूं दैट्ची 20 का ग्राफ बना दूंगा और जैसे ही हम रन करेंगे दैट अ 10 20 काफी लार्ज ग्राफ हो चुका है देन मैं 20 10 का ग्राफ कर लेता हूं इसकी जगह 20 कॉमा आपके पास 20 चलिए 20 20 का ग्राफ कर लेते हैं यहां पे तो एक बहुत ही लार्ज अमाउंट ऑफ एक बहुत ही लार्ज ग्राफ मिल जाएगा अब हमारी बारी है इसके अंदर नंबर ऑफ क्लस्टर निकालने की तो इसके लिए हम क्या करते हैं इसको सेव कर लेते हैं और फिर बाहर जाके हम इसके अंदर नंबर ऑफ क्लस्टर निकालते हैं तो इसके लिए मैं पीएटी डॉट क्या करूंगा यहां पे सेव फिगर का इस्तेमाल करूंगा और सेव फिगर के अंदर जाके मैं इसका नाम डेमो डॉट आपके पास जेपीजी के अंदर सेव कर लूंगा चलिए इसे रन करते हैं तो ये हमारे पास क्या कर चुका है सेव हो चुका है हमारे लोकल ड्राइव के अंदर और जैसा कि आप यहां पर देख भी पा रहे हैं और अब हम इसे ओपन करते हैं और इसके अंदर नंबर ऑफ क्लस्टर निकालते हैं देखिए अब हमें यहां पे आपके पास लांगेस्ट लाइन निकालनी है जो विदाउट कट होनी चाहिए तो इसके अंदर सबसे लांगेस्ट लाइन आपको कौन सी दिख रही है देखिए इसके अंदर आपके पास बहुत सी लाइंस जा रही है लेकिन मुझे जो सबसे लांगेस्ट लाइन जो दिख रही है दैट यहां से स्टार्ट होके वो आपका सबसे ऊपर जा रही है और ये विदाउट कटिंग लाइन है यस आप यहां पे देख पाएंगे कोई भी कटिंग लाइन इसमें से नहीं पास हो रही है आपके पास लांगेस्ट लाइन जो विदाउट कटिंग हो रही है और जब मैं इसको मिडल में से कट कर दूंगा यस जब मैं इसे मिडल में से कट करूंगा तो वहां से हमें मिल जाएंगे नंबर ऑफ क्लस्टर देखिए इसको थोड़ा सा ऑब्जर्वेशन करने के लिए मैं इसको ले चलता हूं आपके पास पेंट ऑप्शन के अंदर जहां पे हम वो लांगेस्ट लाइन को फाइंड आउट करेंगे तो अब देखिए हमारा ये ग्राफ आ चुका है इस ग्राफ को थोड़ा सा हल्का सा मैं छोटा कर देता हूं यहां पे और मैं लाइन बनाने जा रहा हूं यहां पे तो देखिए हमें लगता था कि ये सबसे लांगेस्ट लाइन है लेकिन यदि मैं यहां से यहां लाइन बल ड्रॉ करूं तो एक लाइन इसे कट कर रही है इवन दैट आप नीचे भी लाइनों को ढूंढेंगे तो उनमें से काफी लाइन एक दूसरे को कट करती हुई दिखाई दे रही है लेकिन यह वाली हमें सबसे लांगेस्ट लाइन मिल रही है जो कि विदाउट कटिंग है आप यहां पर देख सकते हैं ये आपके सबसे टॉप मोस्ट लाइन है और ये आपके सबसे लांगेस्ट लाइन है जो कि विदाउट कटिंग है तो अब हमें क्या करना है यहां पे हमें नंबर ऑफ क्लस्टर निकालना है तो मैं क्या करूंगा यहां पर आपके पास यस मैं क्या करने वाला हूं गाइ यहां पे इस लाइन से होने वाली कटिंग एक लाइन बनाने वाला हूं और एक ब्लैक कलर की लाइन जो हमने टॉप मोस्ट प बनाई थी वो भी हम वापस बना लेते हैं यहां पे दैट स ये तो अब मैंने ये जो लाइन कट करने वाली बनाई है यहां पे ये हमें क्या देगा नंबर ऑफ क्लस्टर देगा और ये नंबर ऑफ क्लस्टर हमें कितनी डिजाइन करके दे रहा है दैट इज अ वन क्लस्टर एंड दैट इज अ टू क्लस्टर मतलब ये हमें दो क्लस्टर बनाने की आपके पास डिमांड कर रहा है बेसिकली ये हमें बोल रहा है कि इसके अंदर दो क्लस्टर बनेंगे तो हम यहां पे क्या करेंगे टू नंबर ऑफ क्लस्टर बनाएंगे हालांकि इसके अंदर तीन क्लस्टर हैं लेकिन ये बोल रहा है दो ही क्लस्टर यहां पे बनने वाले हैं तो चलिए जरा देखते हैं यहां पे कि टू क्लस्टर्स कैसे बन रहे हैं यहां पे और किस तरह से बन रहे है तो ये हमारा बन गया ड ग्राम अब डेंड्रोग्राम बनाने के बाद अब हम बढ़ रहे हैं नंबर ऑफ क्लस्टर बनाने के लिए इसके लिए मैं क्या करूंगा फ्रॉम साइकिल न के अंदर चलूंगा डॉट यहां पे चलूंगा आपके पास क्लस्टर के अंदर और क्लस्टर के अंदर मैं यहां पे इंपोर्ट करने वाला हूं किसे एलोमेटिक क्लस्टर को यस आपको मिल जाएगा यहां पे ग्लोमेट क्लस्टर आप इसे रन कीजिए अब ये जो एलोमेटिक क्लस्टर है इसके लिए आप क्या करें एक वेरिएबल बना ले मतलब एक ऑब्जेक्ट बना लें तो मैं यहां पे क्या कर रहा हूं एसी के नाम से एक वेरिएबल बना रहा हूं यहां पे और यहां पर मैं एलोमेटिक क्लस्टर को कॉल कर रहा हूं एलोमेटिक क्लस्टर आपसे सबसे पहले क्या मांगेगा नंबर ऑफ क्ल आप कौन से नंबर ऑफ क्लस्टर देना चाहते हैं वो बताइए तो मैं क्या कर रहा हूं यहां पे n नंबर ऑफ क्लस्टर की बात करूं तो ए नंबर ऑफ क्लस्टर दे रहा हूं टू और इसके साथ-साथ इसी के अंदर आपको लिंकेज भी मिलेगा और वो लिंकेज कौन सा है यहां पे वार्ड है लेकिन हमने कौन सा लिंकेज इस्तेमाल किया है हमने यहां पे इस्तेमाल किया है आपका सिंगल लिंकेज तो मैं बेसिकली लिंकेज को भी चेंज करूंगा और लिंकेज के अंदर मैं वर्ड को जगह क्या इस्तेमाल करने वाला हूं गाइज यहां पे मैं सिंगल लिंकेज को कॉल करने वाला हूं तो मैं यहां पे सिंगल लिंकेज को कॉल करूंगा अच्छा देखिए ऊपर जो लिंकेज लिखा है इस लिंकेज को भी आप चेंज कर सकते हैं और नंबर ऑफ क्लस्टर भी आपको यहां पे अलग-अलग देखने को मिल जाएंगे जैसे कि इसके अंदर लिंकेज की बात करें यहां पे तो एक बार देखिए कंप्लीट लिंकेज डाल के देखते हैं कि कंप्लीट लिंकेज कितने बना देता है तो मैंने कंप्लीट लिंकेज नाया है यहां पे और कंप्लीट लिंकेज से चेक कर लेते हैं कि कंप्लीट लिंकेज कितने बना के दे र है तो यदि आप कंप्लीट लिंकेज भी देखेंगे ऑब्जर्वेशन देंगे तो यहां से भी आपके पास दो ही क्लच बनेंगे क्योंकि सबसे लांगेस्ट लाइन यही दिखाई दे रही है इसी तरह से यदि आप वार्ड लिंकेज को लेते हैं यस इसी तरह से आप यहां पे वार्ड लिंकेज को लेते हैं या फिर मैं बात करूं यहां पे वेटेज लिंकेज लेते हैं सेंट्रल लिंकेज को लेते हैं मीडियन लिंकेज को लेते हैं तो तो ये भी आपके पास कितनी बनाते हैं वो भी आप यहां पे चेक कर सकते हैं दैट इ अ हाइपर पैरामीटर ये आपके पास क्या कहलाता है हाइपर पैरामीटर कहलाते है तो आप यहां पे वार्ड दे के देखिए यस वार्ड से आपके पास क्या होगा चेंजेज हो सकता है तो देखिए वार्ड के अंदर भी देखिए तो आपके पास ये भी आपके पास क्या कर रहा है दो नंबर ऑफ क्लस्टर बता रहा है और इसके पीछे रीजन यदि आप जानना चाहे कि ये दो ही क्यों क्लस्टर बता रहे हैं और इसके पीछे रीजन बहुत ही क्लियर है सिंपल सा है ये आप पेयर प्लॉट से देख सकते हैं जब मैं यहां पे पेयर प्लॉट बना रहा हूं यहां पे तो पेयर प्लॉट बनाने के बाद आप ऑब्जर्वेशन देख पा रहे हैं कि पहला तो ग्रुप आपका ये बन रहा है और दूसरा ये टोटल ग्रुप बन रहा है यहां पे तो यहां पर जो डिफरेंशिएबल नहीं मिल पा रहे हैं राइट चलिए इसने बोला है दो क्लस्टर बनाने का है तो इसने बोला है यहां पे दो क्लस्टर हमें बनाने हैं तो वो दो क्लस्टर बना लेते हैं अब एसी डॉट हम क्या करते हैं फिट प्रिडिक्ट कर देते हैं फिट प्रिडिक्ट के थ्रू हम क्या कर रहे हैं प्रेडिक्शन कर रहे हैं कि कितने नंबर ऑफ क्लस्टर यहां पे बनने वाले हैं तो इसके लिए हम क्या कर रहे हैं हमारा जो डेटा सेट है वो यहां पर डाल देते हैं और रन करते हैं तो ये देखिए दो क्लस्टर हमारे पास डिजाइन हो चुके हैं अब मैं एक काम करता हूं मेरे डेटा सेट के अंदर क्या कर रहा हूं गाइ यहां पे इस डाटा को अपलोड कर देता हूं मतलब ये जो क्लस्टर ब के आया जो डेटा अपलोड कर देते हैं और फिर देखते हैं कि किस तरह से क्लस्टर बना है तो इसके लिए मैं क रहा हूं डेटा सेट के अंदर जाऊंगा यहां पे और डेटा सेट के अंदर जाने के बाद मैं यहां पे क्या करने वाला हूं टिक के नाम से एक कॉलम बनाने वाला हूं तो जिसके अंदर हम ये प्रेडिक्शन वाला जो डाटा है वो पास कर देंगे चलिए अब हमारे डेटा सेट को देखें यहां पे तो डटा सेटड हैड को लगा के इसके अंदर दो डाटा देखेंगे सपल लेंथ एंड पैटर्न लेंथ एंड सपल विड्थ एंड पैटन विड्थ जो है वो आपको मिल चुकी है और प्रेडिक्शन वाला जो डाटा है वो आपको मिल चुका है तो चलिए इसको देखते हैं ये किस तरह से क्लस्टर कर चुका है इसके लिए मैं क्या करूंगा एए डॉट वापस क्या बनाऊंगा यहां पे पेयर प्लॉट बनाने वाला हूं और पेयर प्लॉट के अंदर जाके हम क्या करेंगे हमारा जो डाटा है वो ट्रांसफर करेंगे किस फॉर्मेट के अंदर डेटा सेट के अंदर एंड नेक्स्ट चीज हम यहां पर ये करने वाले हैं इसके अंदर हम पास करेंगे हमारा ू पैरामीटर और हू पैरामीटर के अंदर ये जो प्रोडक्ट लिखा हुआ है इसको हम पास करवा देंगे अब हम इस ग्राफ को शो कराएंगे तो उसके लिए मैं पीएटी डॉट क्या करने वाला हूं शो फंक्शन को रन करने वाला हूं और अब हम देखेंगे कि किस तरह से इसने क्लस्टर डिजाइन किए हैं चलिए वेट करते हैं ओके जैसा कि हमें पता था कि एक ग्रुप ये बनने वाला है और एक ग्रुप ये बनने वाला है तो इसने दो क्लस्टर ही डिजाइन किए हैं जैसे कि आप देख पा रहे हैं सभी जगह पर इन्होंने दो-दो क्लस्टर बनाए हैं और बहुत ही परफेक्टली दो-दो क्लस्टर बनाए हैं यहां पे और इसके पीछे रीजन बहुत ही सिंपल है कि यहां पर बनने थे आपके तीन क्लस्टर मतलब यहां पे इसी के अंदर आपको दो क्लस्टर बनने थे लेकिन रिकल क्लस्टरिंग क्या करता है डिस्टेंस के बेसिस पर वर्क करता है और आज के इस वीडियो के जरिए हम बात करें करेंगे डीवी स्कन क्लस्टरिंग के बारे में कि ये क्लस्टरिंग कैसे वर्किंग करती है यदि आपको पाइथन मशीन लर्निंग डेटा साइंस एंड डेटा एनालिसी फीड में अपने आपको को ग्रो करना है तो इसके लिए डब्ल्यू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो देखिए बेसिकली गाइ यहां पर बात करें तो डीबी स्कन क्लस्टरिंग आपके पास क्या है डेंसिटी बेस क्लस्टरिंग का एग्जांपल है मतलब बेसिकली आपका जहां डेंसिटी सबसे ज्यादा होगी वहां पे आपके पास क्या करेगा यह अपने आपको क्लस्टर बनाएगा और जितने भी हमारे पास दूसरे पॉइंट्स रह जाएंगे उनको हम यहां पे नॉइस पॉइंट के तौर पे क्लस्टरिंग करेंगे तो दैट अ डीबी स्क्रीन क्लस्टरिंग का जो इस्तेमाल किया जाता है गाइज यहां पे दैट अ नॉन लीनियर सेपरेबल डाटा के ऊपर किया जाता है अब जैसे कि देखिए हमारे पास यहां पे इस तरह का यदि आपके पास डाटा मिल जाए और इसके ऊपर यदि हम हमारी केमन लस्टिंग को इस्तेमाल करें तो केमन कस्टिंग क्या करती है आपके सेंटर पॉइंट ढूंढने की कोशिश करती है और वो यहां पे दो सेंटर पॉइंट यहां पे बना लेगी अब जब ये दो सेंटर पॉइंट बना लेगी तो उसके हिसाब से क्या होगा कि यहां पे ये वाला पार्ट और ये वाला पार्ट क्लस्टर हो जाएगा जबकि एक्चुअल में ये क्लस्टरिंग ऐसे नहीं होने वाली है ये क्लस्टरिंग क्या होगी आपके पास यहां पे ये जो ब्लू वाला पार्ट है एक अलग क्लस्टर होगा और आपके पास यहां पे ये जो पार्ट है ये अलग क्लस्टर होगा तो बेसिकली गाइस हम क्या चाहते हैं कि हमारे पास जब हमारे पास कोई भी नॉन लीनियर डेटा सेट है नॉन लीनियर मतलब लीनियर सेपरेबल नहीं है यहां पे उसे सेपरेबल नहीं किया जा सकता है तो उस वाले केसेस के अंदर हम डीवी स्कन क्रस्टिंग का इस्तेमाल कर सकते हैं और डीवी स्कन क्रस्टिंग के थ थ्रू हम उससे क्या कर सकते हैं क्लस्टर कर सकते हैं मतलब नंबर ऑफ क्रुप बना सकते हैं और एक स्पेशल केस मैं आपको बताना चाहूंगा कि डीबी स्केन क्लस्टरिंग का इस्तेमाल आउटलायर डिटेक्शन के अंदर भी किया जाता है क्योंकि ये आउटलायर के साथ रोबट है यहां पे बेसिकली ये आपके पास आउटलायर को बहुत अच्छे तरीके से डिटेक्ट कर लेती है और उनको अलग से इंडिकेट भी कर देती है तो बेसिकली डीवी स्कन क्लस्टरिंग जो आपके पास है यहां पे गाइस यहां पे एक स्पेशल केस है नॉन लीनियर डेटा सेट के लिए और आउटलायर डिटेक्शन के लिए अब बेसिकली ये जानते हैं कि एक्चुअल में ये डीबी स्क्रीन क्रस्टिंग कैसे क्लस्टर बनाती है मतलब ग्रुप्स कैसे बनाती है ये जो आपके पास यहां पे एक सर्कुलर फॉर्मेट दिख रहा है ये ग्रुप्स कैसे बनाती है तो अब हम इसमें ग्रुप्स बनाना सीखते हैं तो ग्रुप्स बनाने के लिए आपको कुछ पॉइंट्स की जरूरत होती है मतलब डीबी स्कन कस्ट के अंदर कुछ चीजों की जरूरत होती है और वो कौन-कौन चीजें हैं यहां पे तो सबसे पहली जो चीज होती है गाइज यहां पे दैट इज अ मिनिमम पॉइंट्स यस मिनिमम पॉइंट की बात करूंगा यहां पे मिनिमम पॉइंट्स की जरूरत होती है अब ये मिनिमम पॉइंट्स आप कितने भी डिसाइड कर सकते हैं तीन चार पांच जो भी आप डिसाइड करना चाहे वो पॉइंट्स यहां पे डिसाइड कर सकते हैं दैट अ सबसे पहली जो जरूरत होती है दैट अ मिनिमम पॉइंट्स की जरूरत होती है और मैं यहां पे मिनिमम पॉइंट्स कितना लेना चा रहा हूं गाइज यहां पे मैं फोर मिनिमम पॉइंट्स को यहां पे लूंगा सेकंड यहां पे सबसे ज्यादा इंपॉर्टेंट जरूरत होती है दैट इज अ एप्सन यस एप्सन की जरूरत होती है एप्सन को आप एक तरीके से मान सकते हैं रेडियस की जरूरत होती है यस रेडियस की जरूरत होती है और रेडियस मैं मान लेता हूं 0.5 मेरी रेडियस है अी मैं यहां पे क्या कहने जा रहा हूं इसका अभी 2 मिनट में आपको आंसर्स मिल जाएगा यहां पे तो ये दो चीजों की जरूरत होती है अब इन दो चीजों के अलावा भी आपके पास तीन मेजर इंपॉर्टेंट चीजें होती है कौन-कौन से पॉइंट्स होते हैं वहां पे तीन मेजर इंपॉर्टेंट चीजें होती है यहां पे जस पहला पॉइंट होता है आपके पास यहां पे कोर आपके पास कोर पॉइंट यस आपके पास क्या होता है कोर पॉइंट आपके पास होता है दूसरा आपके पास यहां पे बात करूं यस मैं बी पॉइंट्स की बात करूं तो दूस बी पॉइंट होता है आपके पास क्या यहां पे बाउंड्री पॉइंट यस क्या होता है यहां पे बाउंड्री पॉइंट आपके पास यहां पे होता है दैट इज अ थर्ड पॉइंट की बात करें गाइज यहां पे तो थर्ड पॉइंट आपके पास होता है गाइज यहां पे आपके पास नॉइस पॉइंट यस ये तीन पॉइंट्स आपके पास होते हैं डीवी स्किन क् ंग क्लस्टर कैसे बनाती है जरा उसको समझते हैं तो बेसिकली मैं यहां पे क्या कर रहा हूं एक डेटा सेट बना रहा हूं यहां पे सबसे पहले ठीक है तो लेट्स सपोज हमारे पास कंसीडर करते हैं कि ये हमारे पास कुछ इस तरह का डेटा पॉइंट है और इस तरह का डेटा पॉइंट आप देख भी रहे हैं यहां पे अभी यस आपने आगे भी देखा यहां पे तो लेट्स सपोज कर लेते हैं यहां पे कि हमारा जो डेटा पॉइंट्स है वो कुछ इस तरीके से चल रहा है यहां पे और हमारे पास कुछ डाटा यहां पे भी पड़ा है कुछ इस तरह से तो ये हमारे पास क्या है कुछ डेटा सेटप अब इसके अंदर नंबर ऑफ़ क्लस्टर की बात करें तो नंबर ऑफ क्लस्टर कितने बनेंगे यहां पे तो दो क्लस्टर बनेंगे पहला ये क्लस्टर बनेगा तीसरे क्लस्टर बनेगा अब ये क्लस्टर बनाते कैसे हैं तो सबसे पहले यहां पे आता है कोर पॉइंट के बारे में यस कोर पॉइंट क्या है गाइज यहां पे तो डीबी स्क्रीन क्रस्टिंग क्या करती है कि आपके पास ये जितने भी पॉइंट्स बड़े हैं यस आपके पास य जितने भी पॉइंट्स बड़े हैं इन पॉइंट्स के ऊपर लेट्स सपोज मैं इस पॉइंट की बात करूं यहां पे इस पॉइंट्स के ऊपर आपके पास क्या करती है एक सर्कल डिजाइन करती है यस इस पॉइंट के ऊपर आपके पास क्या करती है एक इस तरह से सर्कल डिजइन कर लेती है अब जब ये सर्कल हमारा डिजाइन हो जाता है तो इस सर्कल के अंदर आपके पास जरूरत पड़ती है रेडियस की रेडियस मतलब एसन की जरूरत पड़ती है तो ये रेडियस हमने कितनी बनाई है 0.5 की बनाई है तो बेसिकली यहां पे क्या होता है एक 0.5 की रेडियस का एक सर्कल डिजाइन हो जाता है यहां पे अब ये जो हमारा सर्कल बना है इस सर्कल में हमें जरूरत पड़ती है मिनिमम पॉइंट्स की कि कितने नंबर ऑफ मिनिमम पॉइंट्स हमारे पास होने चाहिए तो यहां पर मैंने बोला कि फोर नंबर ऑफ मिनिमम पॉइंट्स होने चाहिए तो बेसिकली इसके अंदर हम क्या करते हैं कि ढूंढते हैं कि इसके अंदर कितने पॉइंट्स आए हैं यहां पे तो यहां पर यदि पॉइंट्स की बात करें तो लेट्स सपोज आपके पास ये पॉइंट है तो आप क्या करते हैं कि ये जो एसन नाम का जो आपने पास यहां पे रेडियस का एक सर्कल जो बनाया है आपके पास यहां पे ये जो आपने सर्कल्स बनाया यहां पे इस एसन नाम का यहां पे क्या करर है आपने ये सर्कल बनाया इस सर्कल के अंदर आपके पास जो मिनिमम पॉइंट्स आपके पास होने चाहिए गाइज यहां पे वो कितने होना चाहिए फोर होने चाहिए यस आपके पास फोर होने चाहिए फोर से ज्यादा भी हो सकते हैं लेकिन एक कोर पॉइंट बनने के लिए आपके पास क्या होना चाहिए मिनिमम पॉइंट कितना होना चाहिए फोर होना चाहिए अब यहां पे क्वेश्चन आता है कि जिस पॉइंट को लेके हमने हमारा जो स जिस पॉइंट को लेके हमने हमारा सर्कल जो बनाया है यहां पे दैट इज अ सेंटर पॉइंट क्या वो पॉइंट हमारे पास कोर पॉइंट में आएगा कोई क्या वो मिनिमम पॉइंट में आएगा यस वो भी हमारा मिनिमम पॉइंट में आने वाला है तो बेसिकली गाइज यहां पे सर्कल के अंदर बात करें तो कितने पॉइंट्स होने चाहिए आपके पास मिनिमम और मिनिमम चार पॉइंट होने चाहिए दैट इज अ बनता है आपका कोर पॉइंट यस ये आपका क्या बनता है कोर पॉइंट बनता है मतलब लेट्स आपने इस पॉइंट को लेके आपने अपना एक सर्कल डिजाइन किया और इसके अंदर आपका चार पॉइंट बन गए तो अब आप फर्द आगे चलने के लिए रेडी हैं यस आप क्या करेंगे आगे चलके रेडी हो जाएंगे और ये आपका कोर पॉइंट बन जाएगा यहां पे अब आपके पा जो कोर पॉइंट बना मतलब कोर सर्कल पॉइंट बन गया यहां पे फिर आप क्या करते हैं फिर अगले डेटा पॉइंट के ऊपर फिर से आप क्या करते हैं एक और यहां पर सर्कल डिजाइन करते हैं ऐसे करते-करते आप क्या करते हैं सभी पॉइंट्स के ऊपर आप क्या करते रहते हैं इस तरह से सर्कल डिजइन करते रहते हैं आपने यहां पे क्या किया इस तरह से बेसिकली सर्कल डिजाइन करना स्टार्ट कर दिया है और ये सर्कल आपके पास बनते रहते हैं अब यहां पे आता है बाउंड्री पॉइंट्स यस बाउंड्री पॉइंट्स क्या होगा जहां पे जाके हमारा जो सर्कल है वो एंड होगा क्योंकि सर्कल कहीं ना कहीं तो एंड होगा मतलब ये सर्कल बनते रहेंगे बनते रहेंगे इसका कहीं ना कहीं जाके एंड तो होने वाला है और वो एंड कब होने वाला है तो वो कहलाता है आपका बाउंड्री पॉइंट्स अब ये बाउंड्री पॉइंट कैसे बनता है तो एक ऐसा सर्कल जब आपके पास बनेगा सबसे कॉर्नर पॉइंट का एक ऐसा सर्कल बनेगा जिसके अंदर मिनिमम पॉइंट्स जो आपने रखे हैं यहां पे उस मिनिमम पॉइंट से आपके पास क्या होंगे लेस्ट डेटा आपको मिलेंगे यस मिनिमम पॉइंट से आपके पास क्या मिलेंगे बहुत ही कम डेटा आपको मिलने वाला है जैसे कि आपने मिनिमम पॉइंट कितने लिए हैं यहां पे चार लिए हैं यहां पे यहां से कम जैसे आपके पास थ्री हो सकता है टू हो सकता है या जीरो भी हो सकता है काफी ऐसे आपके पास यहां पे पॉइंट्स होते हैं वो मिनिमम पॉइंट से कम हो जाते हैं यस मैं यहां पे बोलूंगा कि आपके पास कोर पॉइंट के अंदर कंडीशंस क्या है गाइज यहां पे कि नंबर ऑफ पॉइंट्स जो आपके पास आएंगे यस नंबर ऑफ पॉइंट जो आपके पास आएंगे वो आपके पास क्या होना चाहिए ग्रेटर दन आपके पास इक्वल्स टू होने चाहिए किसके मिनिमम पॉइंट्स के अंदर होने चाहिए तो वो आपके पास क्या बनेगा कोड पॉइंट्स बनेगा यदि आपके पास नंबर ऑफ पॉइंट जो आप यहां पर ले रहे हैं एक सर्कल के अंदर वो आपके पास क्या है लेस देन है किसके लेस देन है गाइज यहां पे मिनि बम पॉइंट की लेस देन है तो वो आपका क्या बनेगा एक बाउंड्री पॉइंट बनेगा मतलब यहां पे आके जाके आपका जो सर्कल है वो रुक जाएगा मतलब आपका क्लस्टर जो है रुक जाएगा अब नॉस्ट पॉइंट क्या होता है गाइज यहां पे ऐसे पॉइंट्स जहां पे आपके पास सर्कल बनेंगे और आपके पास उसके अंदर कोई भी और पॉइंट नहीं आने वाले मतलब आपके पास इस सर्कल से आगे वाले अब ऐसे पॉइंट बन गए आपके पास यहां पे जैसे कि एक पॉइंट यहां बन गया एक पॉइंट यहां बन गया एक पॉइंट यहां पे आ गया अब यहां पे आप यदि सर्कल बनाएंगे तो कोई भी पॉइंट्स आपके पास एक्स्ट्रा पॉइंट नहीं आने वाला मतलब मिनिमम पॉइंट आपके पास क्या है एक ही पॉइंट आपके आएगा जो कि इसका नेचुरल पॉइंट है आपके पास यहां पे वही आने वाला है यहां पे तो बस गाइज यहां पे वही नेचुरल पॉइंट्स आते हैं तो उनको बोलते हैं नॉइस पॉइंट और इस नॉइस पॉइंट को हम क्या बोलते हैं गाइज यहां पे आउटलायर भी बोला जाता है यस गाइज ये आउटलायर के तरह काम करते हैं तो डीबी स्किन क्रस्टिंग क्या करता है गाइज यहां पे सबसे पहले आपका एक पॉइंट ढूंढता है उस पॉइंट से आपका क्या करता है सर्कल डिजाइन करता है जो भी आपने एसन दी है उस एप्सन के बेसिस पे सर्कल डिजाइन करेगा उस सर्कल के अंदर नंबर ऑफ पॉइंट्स को काउंट करेगा अब जितने भी नंबर ऑफ पॉइंट्स काउंट है वो आपके पास मिनिमम पॉइंट्स से आपके पास ज्यादा है तो वो आगे से आगे आगे से आगे आगे बढ़ता रहेगा यदि जिस सर्कल पॉइंट के अंदर आपके पास मिनिमम पॉइंट से कम पॉइंट्स आपके पास आने लग जाएंगे वहां पे वो सर्कल स्टॉप हो जाएगा मतलब डीबी स्कन क्लस्टरिंग वहां पे अपने आप को क्लस्टर बनाना स्टॉप कर देगी और ये क्लस्टर वहां जाके रुक जाएगा और यदि आपके पास नंबर ऑफ पॉइंट्स जो हैं एक ही आता है और उसके आसपास कोई सर्कल पॉइंट्स नहीं आते और भी कोई पॉइंट्स नहीं आते तो वो हमारा क्या बन जाएगा नॉइस पॉइंट बन जाएगा जिसे हम यहां पे आउटलायर भी बोलते हैं तो बेसिकली इस तरह से आपके पास डीवी स्क्रीन कस्टिंग काम करता है मैं एक छोटा सा विजुलाइजेशन आपको दिखाना चाहूंगा जिसके थ्रू आप डीवी स्क्रीन कस्टिंग को और अच्छे से समझ पाएंगे तो देखिए ये हमारे पास यहां पे डटा पॉइंट है यस इसके ऊपर हम यहां पे देखिए सर्कल्स बनाते जा रहे हैं राइट इस तरह से हमारा सर्कल्स बनता जा रहा है और ये नंबर ऑफ क्लस्टर्स जो है वो डिजाइन होते जा रहे हैं अब देखिए ये सर्कल्स बनाना वहां स्टॉप कर दिया क्योंकि उसके अंदर मिनिमम पॉइंट्स आपके पास नहीं आए हैं मतलब मिनिमम जो फोर पॉइंट्स हैं वो नहीं आए अब देखिए ये क्लस्टर करता करता करता वहां पे पहुंचेगा अब देखिए अंदर भी आपके क्लस्टर्स होने स्टार्ट हो रहे हैं जैसे आप यहां देख पाएंगे अंदर भी क्लस्टर होना स्टार्ट हो र है और यहां देखेंगे क्लस्टर हो र है और बाकी जितने भी ब है वो आपके क्या कर रहे है आपके आउटलायर पॉइंट्स यहां पे कहलाते है तो बेसिकली डीबी स्कन क्लस्टरिंग कब काम आती है जब भी आपके पास नॉन लीनियर सेपरेबल डाटा आपके पास हो मतलब आपके पास इस तरह के शेप्स वगैरह यहां पे हो तो उस वक्त आपके पास क्लस्टर्स बनाने के लिए काम में ली जाती है आपकी डीवी स्क्रीन कस्टिंग हे एवरीवन वंस अगेन वेलकम टू ड कपटेक माय सेल और आज के इस वीडियो के जरिए हम डीबी स्क के बारे में समझने आ रहा है यदि आपके पास लीनियर सेपरेबल डाटा है तो इसके अंदर आप केमन कस्टिंग का इस्तेमाल कर सकते हैं रिकल कस्टिंग का इस्तेमाल कर सकते हैं लेकिन यदि नॉन लीनियर डेटा सेट आ जाए तो उस वक्त आपको क्या करना है ट्स यूजर डीबी स्कन क्रस्टिंग तो आज के इस वीडियो के जरिए हम उसे डिटेल के साथ देखने वाले हैं तो चलते हैं हमारे जुपिटर नोटबुक के अंदर और वहां पर हम डीब स्कन क्रस्टिंग को डिटेल के साथ समझते हैं तो इसके लिए हमें रिक्वायर्ड डटा सेट की जरूरत पड़ेगी तो इसके लिए हमें नॉन लीनियर डेटा सेट चाहिए तो मैं क्या करूंगा साइकेड लान के अंदर हमारे पास डेटा सेट बहुत सारे लेबल्स है है तो उसी के अंदर से मेक मून नाम से हमारे पास डेटा सेट है वहीं से मैं डेटा सेट लूंगा और वहीं से मैं एक नॉन लीनियर डेटा सेट क्रिएट करने वाला हूं कैसे जरा समझिए यहां पे तो इसके लिए मुझे रिक्वायर्ड लाइब्रेरी है तो पहले मैं इनको इंपोर्ट कर लेता हूं मैं यहां पे इंपोर्ट करूंगा यहां पे सबसे पहले आपके पास मैट पलफ को क्योंकि मुझे ग्राफ बनाने की जरूरत पड़ेगी तो मैं मैट पलफ डॉट यहां पर क्या करने वाला हूं पवा प्लॉट एलियाज ऑफ यहां पर हम पीएटी लेंगे उसके साथ-साथ हम यहां पे इंपोर्ट करेंगे और इंपोर्ट कैसे करने वाले हैं गाइज यहां पे सी बन को करने वाले हैं एलियाज ऑफ एएएस लेने वाले हैं यहां पे और इसके साथ-साथ अब हम मैं चलूंगा यहां पे फ्रॉम साइकल न के अंदर चलूंगा और साइकल न के अंदर जाने के बाद मेरे पास है यहां पे डटा सेट्स के अंदर मैं जाके इंपोर्ट करने वाला हूं यहां पे और वो है आपका मेक मून यस मुझे यहां पर मेक मून डाटा सेट चाहिए तो मैं मेक मून डटा सेट को लेने वाला हूं अब मेक मून डटा सेट के थ्रू हम क्या करें हैं हमारा डटा सेट कट कर रहे हैं और मेक मून जो हमें आउटपुट देता है वो दो डाटा देता है एक तो एक्स एक्सेस का डाटा और दूसरा होता है y एक्सेस का डेटा तो मैं यहां पे x y के नाम से एक वेरिएबल बना रहा हूं मेक मून जो डेटा सेट है इसे मैं कॉल करने वाला हूं जब हम इसे कॉल करते हैं तो ये नंबर ऑफ सैंपल्स आपसे पूछता है यहां पे और ये आपके नॉइस की वैल्यू भी पूछता है सफल चाहिए या नहीं चाहिए रैंडम स्टेट भी आपसे पूछता है तो चलिए ए नंबर ऑफ सैंपल्स दे देते हैं पहले तो ए नंबर ऑफ सैंपल्स के अंदर मैं यहां पे 250 सैंपल्स मैं यहां पे लेने वाला हूं और इसके साथ-साथ मैं यहां पे कुछ नॉइस भी लूंगा और नॉइस मैं लूंगा 0.5 पर यस आपका 0.5 पर मैं यहां पे नॉइस लेने वाला हूं चलिए हमारा डेटा सेट रेडी है चलिए इसको देख लेते हैं कि डेटा सेट दिख क्या स रहा है तो यदि मैं एकस एक्सेस का डाटा देखूं तो मुझे इस तरह का डाटा दिख रहा है जहां पे आपके पास ये आपका एकस एक्सेस है और एक्स एक्सस के अंदर आपके पास दो कॉलम तैयार किए इसने और यदि मैं y एक्सिस का डाटा देखूं तो ये y एक्सिस का डाटा है जहां पे 01 टेक्शन दिया है हमें अब हमें क्या करना है इसका ग्राफ बनाना है बेसिकली कि ये ग्राफ कैसे दिखाई देता है x और y एक्सिस का ग्राफ कैसे दिखाई देगा ये हमें जरूरत है तो देखिए इस एक्स एक्सिस के अंदर दो कॉलम है आपके पास यहां पे तो क्यों ना हम इसका एक डेटा फ्रेम तैयार कर लें और डेटा फ्रेम तैयार करने से हमें और ज्यादा अच्छे तरीके से काम हो पाएगा तो मैं इंपोर्ट कर लेता हूं किसे यहां पे पांडा एलियाज ऑफ यहां पर मैं करूंगा यहां पे पीडी के तौर पे और मैं क्या करने वाला हूं इस डेटा सेट के अंदर ये दो डेटा मैं यहां पे देने वाला हूं मेरे पास यहां पे दो डाटा किस-किस फॉर्मेट के अंदर है एक तो x के अंदर है दूसरा y के अंदर है क्यों ना हम एक डेटा सेट तैयार कर ले तो इसके लिए मैं डीएफ नाम से एक डिक्शनरी क्रिएट करने वाला हूं और इसके अंदर डटा वन मतलब डेटा वन मतलब हमारा पहला कॉलम है उसको लेते हैं यहां पे इसके लिए मैं क्या करने वाला हूं देखिए हमारा जो एक्स एक्सेस है इसके अंदर मुझे फर्स्ट कॉलम चाहिए तो मैं एक एक्सेस के अंदर जाके क्या करूंगा यहां पे जीरो रखूंगा तो दैट मेरा पहला कॉलम इस तरह से आएगा लेकिन मुझे पहला कॉलम इस तरह से नहीं चाहिए मुझे तो मेरा पहला सारा डाटा चाहिए का यहां पे तो इसके लिए मुझे क्या करना पड़ेगा मुझे सारी रोज चाहिए देन कॉलम की अंदर बात करें तो हमें जीरो कॉलम चाहिए देन रन करूंगा तो दैट्ची क कर लेते हैं कि क्या ये जीरो कॉलम है या नहीं है तो मैं x एक्सस का लेटर लूंगा यहां पे x एक्सस के अंदर देखिए पहला क्या है यहां पे 0.8 है यस यहां पे भी आपका 0.8 आया है यहां पे उसके बाद है आपका पास यहां पे 0.65 है यहां पे यस 0.65 आ चुका है उसके बाद आप देखिए 0.08 है यहां पे तो यस 0.8 आ चुका है तो 0.87 यस ये भी आ चका है उसके बाद देखिए 6799 6799 इसका मतलब हमारा एक्स एक्सेस का डाटा आ चुका है यहां पे यस तो इस तरह से हम यहां पे अपने एक्स एक्सेस का डाटा गेट कर सकते हैं टस अ फर्स्ट कॉलम ठीक है तो मैं यहां पे ये रख रहा हूं एंड उसके बाद में हम क्या कर रहे हैं एक दूसरा और कॉलम बना रहे हैं दैट इज अ डटा टू के नाम से और इसके अंदर क्या कर रहे हैं x देन कॉलम एंड स्क्वायर मुझे सारा डाटा चाहिए और फर्स्ट कॉलम का डाटा चाहिए होगा और उसके बाद हमारा जो आउटपुट है वो रेडी करेंगे तो मैं यहां पे आउटपुट लेने वाला हूं आउटपुट के नाम से एक की बनाई है यहां पे और इसके अंदर मैं अपना y पास करूंगा दैट माय डीएफ इज रेडी अब डीएफ रेडी होने के बाद में मैं अपना डेटा सेट तैयार करूंगा यहां पे तो मैं क्या कर रहा हूं यहां पे डटा सेट के नाम से एक वेबल बना लेता हूं और पीडी डॉट हम क्या करेंगे डाटा फ्रेम बना लेंगे और डाटा फ्रेम के अंदर इस डीएफ को पास कर देते हैं और रन करते हैं दैट्ची क करते हैं कि इसका ग्राफ कैसे आ रहा है क्या ये नॉन लीनियर है या लीनियर है इसके लिए मैं स्केटर प्लॉट का इस्तेमाल करूंगा तो मैं एस डॉट यहां पर स्केटर प्लॉट्स बनाने वाला हूं और स्केटर प्लॉट के अंदर एक् एक्स के अंदर यस एकस एक्सेस के अंदर मैं हमारा जो है डाटा वन है वो पास करूंगा एंड y एक्सेस के अंदर जो हमारा डटा टू है वो पास करने वाला हूं और डाटा के अंदर मैं यहां पे हमारा जो डेटा सेट है वो पास करने वाला हूं इस ग्राफ को देखने के लिए मैं पीएटी ड शो फंक्शन का इस्तेमाल करूंगा और रन करूंगा देखिए हमारे पास एक नॉन लीनियर डेटा आया है और जैसे कि आपको दिख भी रहा है अब इसे लीनियर सेपरेबल करें यदि मैं केबिन कस्टिंग के थ्रू करूं तो ये हमें रंग प्रिडिक्शन करके देने वाला है इसकी जगह यदि मैं डीबस केन कस्टिंग करूं तो ये मै ये हमें एक बेटर रिजल्ट यहां प देगा तो चलिए हम डीवी स्कन कस्टिंग का यहां पर इस्तेमाल करते हैं और यहां पर प्रोटेक्शन करते हैं चलिए कैसे करेंगे आप यहां प डीवी स्कन कस्टिंग को तो फ्रॉम आप जाएंगे साइकल लन के अंदर वहां जाने के बाद में आप क्या करेंगे यहां पे क्लस्टर के अंदर चलेंगे और क्लस्टर के अंदर जाने के बाद दैट आप इंपोर्ट करने वाले हैं किसे इंपोर्ट करने वाले हैं गाइस यहां पे आप इंपोर्ट करेंगे डीबी स्कन क्लस्टरिंग को यस डीबी स्कन के नाम से आपका अब डीबी स्क्रीन कस्टिंग के लिए आपको एक वेरिएबल की जरूरत पड़ेगी मतलब एक क्लास की जरूरत पड़ेगी तो मैं यहां पे डीबी के नाम से एक वेरिएबल बना आ रहा हूं यहां पे और डीब स्कन क्रस्टिंग को कॉल कर रहा हूं अब डीब स्कन कस्टिंग के अंदर सबसे पहले आपके पास मिलता है एसन एसन का मतलब है आप कितने रेडियस का सर्कल लेने वाले हैं और उसके बाद आपको मिलता है मिनिमम सैंपल कितने मिनिमम सैंपल का लेने वाले हैं और यहां पे मैट्रिक्स के तौर पे यूक्लिड मैट्रिक्स इस्तेमाल कीया जा रही है मैट्रिक्स किसलिए क्योंकि जो आप डिस्टेंस देने वाले हैं मतलब आप जो सर्कल की रेडियस लेंगे तो उसके लिए भी तो आपको डिस्टेंस की जरूरत पड़ेगी तो उसके लिए आपकी जरूरत पड़ेगी यूक्लिड डिस्टेंस की तो चलिए ये दोनों देते हैं तो मैं एसन की जो वैल्यू है यहां पे यस एसन की वैल्यू है वो 0 फाइव रख रहा हूं यहां पे और आपके पास यहां पे टोटल यस मिनिमम सैंपल्स की बात करें यहां पे तो मिनिमम सैंपल्स को मैं यहां पे अभी फाइव कर रहा हूं यहां पे चलिए अब उसके बाद में मैं क्या करूंगा डीबी डॉट यहां पर क्या करूंगा फिट और प्रिडिक्ट करने वाला हूं और फिट प्रिडिक्ट के अंदर जो हमारा डाटा है यस जो हमारा डेटा सेट है उसको पास करेंगे लेकिन एक चीज का ध्यान रखिएगा डेटा सेट के अंदर आपके पास यहां पे जीरो और वन भी आपको मिल रहा है तो उसको हमें हटाना पड़ेगा तो मैं एक बार के लिए क्या कर रहा हूं इसवा आउटपुट को एक बार के लिए हटा देता हूं है ना क्योंकि ये वा आउटपुट हमें आगे चलते हुए प्रॉब्लम क्रिएट करेगा तो मैं इसे रन करता हूं यहां पे और इसे रन करता हूं इसे रन करता हूं और इसे रन करता हूं ओके अब देखिए मैं एक बार डेटा सेट कर अर देख लेता हूं कि कौन-कौन से कॉलम्स हमारे पास बचे हैं तो डेटा सेट को देखने के लिए मैं यहां पे क्या करूंगा डटा सेट डॉट यहां पर मैं हैड का इस्तेमाल करूंगा और उसके अंदर टू डेटा खूंगा तो यस हमारे पास दो ही डेटा रहे हैं यहां पे और अब हम क्या करेंगे इस डेटा सेट को देंगे लेकिन मुझे लगता है यहां पर हमने जो रेडियस है वो काफी ज्यादा ले ली है तो इसके लिए मुझे क्या करना पड़ेगा इसकी रेडियस को थोड़ा सा कम करना पड़ेगा और रेडियस को कम करके हम क्या कर रहे हैं इसकी 0.2 रेडियस दे रहे हैं और 0.2 डस लेने के बाद में देखिए इसने काफी 0 1 2 3 के नाम से यहां पे नंबर्स बनाए हैं मतलब हमारे पास यहां पे इन्होंने क्लस्टरिंग कर दिया है अब इस क्लस्टरिंग को चेक करते हैं कि क्या ये क्लस्टरिंग इसके पास सूटेबल है या नहीं है तो एक काम करते हैं यहां पर हम क्या करते हैं डेटा सेट के अंदर एक कॉलम तैयार कर लेते हैं देर इज अ डेटा सेट और उस कॉलम का नाम हम क्या रखेंगे प्रिडिक्ट कॉलम तो मैं यहां पे क्या कर रहा हूं आपके पास प्रिडिक्ट कॉलम को इस्तेमाल कर रहा हूं यहां पे राइट और प्रिडिक्ट कॉलम बना रहा हूं यहां पे जिसके थ्रू जो प्रेडिक्शन का आउटपुट है वो हमें यहां पर देखने को मिल जाएगा चलिए अब हम क्या करने वाले हैं गाइज यहां पे ग्राफ बना के चेक करेंगे कि किस तरह से प्रोटेक्शन हुआ है इसके लिए मुझे यही स्केटर प्लॉट की जरूरत पड़ेगी दोबारा यस इसी स्केटर प्लॉट की जरूरत दोबारा जरूरत पड़ेगी लेकिन इसके अंदर हम एक पास कराएंगे ह्यू पैरामीटर और ह्यू पैरामीटर्स के अंदर हम पास कराएंगे इस फिडिक क्यास कॉलम को और जैसे ही हम रन करेंगे तो देखिए इन्होंने दो तीन क्लस्टर तैयार किए है यहां पे पहला क्लस्टर आपका ये तैयार किया है दूसरा क्लस्टर ये तैयार किया है एंड बीच में आपका एक अलग से क्लस्टर तैयार किया क्योंकि इनके दोनों में बीच में काफी अच्छा गैप दिखाई दे रहा है आप लोगों को राइट इसी वजह से एक अच्छा सा क्लस्टर हमें यहां पे तैयार करके दिया है तो गाइ यहां पे आप डीवी स्कन क्रस्टिंग का इस्तेमाल करते हुए इस तरह से जब आपके पास नॉन लीनियर डाटा होता है तो उनके अंदर आप प्रोडक्शन कर सकते हैं अच्छा एक बार देख लेते हैं कि हमारा जो फाइनल आउटपुट जो y है यदि हम यहां पे y दें यस ये जस्ट y दें तो इस y के ऊपर क्या रिजल्ट आता है सो मैं एक काम करता हूं इस y के ऊपर एक बार रिजल्ट देख रहा हूं क्योंकि y भी हमारे पास आया है यहां पे तो यदि मैं य के अंदर हमारा जो y है वो पास करूं और फिर मैं रिजल्ट देखूं तो इन्होंने इस तरह से क्लस्टरिंग की है मतलब हमने कहीं ना कहीं आपके पास जो एसन की जो वैल्यू है उसके अंदर कुछ ना कुछ गड़बड़ की है एक काम करते हैं मिनिमम सैंपल को एक बार तीन करके देखते हैं तो मे बी हमारे पास यहां पे क्लस्टर सही हो जाए नहीं हमारे पास व भी क्लस्टर सही नहीं होआ क्योंकि हमारे पास जो ये डिस्टेंस है इस डिस्टेंस की वजह से क्लस्टर सही हो रहे है राइट तो मिनिमम सैंपल पॉइंट को आप फाइव ही रखिए और एसन की जो वैल्यू है यहां पे इसे बढ़ा दीजिए आप इसे थ्री से बढ़ा दीजिए यहां पे और जैसे आप थ्री से बढ़ाएंगे तो ये काफी हद तक आपके सही करने की कोशिश करेगा अ थ्री से आप यहां पर अ फोर कर दीजिए यहां पे और फोर करने के बाद ये सही करने की कोशिश करेगा लेकिन हां हालांकि इतना अच्छी तरीके से ये नहीं बन पा रहा है अभी भी आपके पास क्या कर रहा है ये आपके पास तीन ही क्लस्टर बता रहा है मतलब यह बता रहा है कि इसके अंदर तीन क्लस्टर बना ले हैं और डेफिनेटली इसके अंदर तीन क्लस्टर ही होंगे रीजन क्यों क्योंकि उनके बीच में काफी अच्छा गैप है यस काफी अच्छा गैप होने की वजह से आपके पास तीन क्लस्टर मिलने वाला है और जैसे कि आप देख रहे हैं टू और वन भी आपको मिल रहा है अदर वाइज आप यहां पे 0.5 कर दीजिए 0.5 करने पर तो आपके पास यहां पर आपके पास दो एक ही क्लस्टर आपको देखने को मिलेगा यस और रन करेंगे तो आपका यहां पे भी दो ही क्लस्टर देखने को मिलेंगे और रन करेंगे यहां करेंगे तो आपका तीन क्लस्टर मिलेंगे और ओरिजिनल डेटा सेट में दो क्लस्टर है तो गाइ आपके पास क्या कर र है आप यहां पे एसन की वैल्यू जैसे-जैसे चेंज करते रहेंगे वैसे-वैसे नंबर ऑफ क्लस्टर्स जो है वो आपके पास उसके हिसाब से चेंज होते रहेंगे चलिए अ रन कर देते हैं और रन करके देखें तो अभी भी आपके पास तीन क्लस्टर यहां पे डिजाइन दिखा रहा है क्योंकि ट्स अ गैप ये गैप जो है वो काफी ज्यादा यहां पर है इस वजह से क्लस्टर करने के लिए आप चाहे केनस नेबर को इस्तेमाल करें चाहे आप हेकल कस्टिंग को इस्तेमाल करें इन दोनों टेक्निक के अंदर हमें नंबर ऑफ क्लस्टर को ढूंढना होता है अब यदि हमने इन दोनों टेक्निक के अंदर से नंबर ऑफ क्लस्टर ढूंढा है तो हमें कैसे पता चलेगा कि हमने जो नंबर ऑफ क्लस्टर निकाले हैं वो सही है या गलत है जैसे कि मैंने एक डेटा सेट लिया और इस डेटा सेट के ऊपर मैंने क्या किया क्लस्टरिंग एल्गोरिथम अप्लाई की और क्लस्टरिंग एल्गोरिदम ने मुझे दो क्लस्टर यहां पे बना के दिखाए अब ये सही है या गलत है ये हमें कैसे पता चलेगा इसके लिए हम इस्तेमाल करते हैं सलेट स्कोर का सलेट स्कोर हमें एक वैलिडेट आंसर बताता है और हमें ये बताता है कि आपने जो नंबर ऑफ क्लस्टर निकाले हैं वो सही है या नहीं है तो आज के इस वीडियो के जरिए हम सेलेट स्कोर के बारे में डिटेल के साथ जानने वाले हैं कि ये सेलेट स्कोर कैसे काम करता है और किस तरह से कोई भी आप एल्गोरिथम इस्तेमाल कर रहे हैं क्लस्टरिंग के लिए तो उसके अंदर कैसे फाइंड आउट करता है बेस्ट नंबर ऑफ क्लस्टर चलिए जरा इसको जानते हैं आज के इस वीडियो के जरिए यदि आपको python2 के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो बेसिकली सैलरी स्कोर क्या है यहां पे एक वैलिडेशन मेथड है सैलेड स्कोर जो अपना आंसर देता है वो -1 टू 1 के बीच में देता है अब बेसिकली गाइज ये सेलेट स्कोर -1 टू 1 के बीच में कैसे आंसर देता है इसमें से कौन सा आंसर बेस्ट है -1 की तरफ या वन की तरफ इसे जानते हैं तो सबसे पहले बात करते हैं हम इस सेल स्कोर के फॉर्मूले के बारे में तो देखिए सेलेट स्कोर का जो फॉर्मूला होता है वो आपके पास कुछ इस तरह से होता है s i = b i - ऑफ i a ऑफ i डिवाइड बाय मैक्स ऑफ a ऑफ i b i ये आपका क्या होता है सेलेट स्कोर का फॉर्मूला होता है और इस सेलेट स्कोर से आपकी अपनी वैल्यू निकलती है अब देखिए यहां पे बात करें तो ये जो सेलेट स्कोर है इस सेलेट स्कोर के अंदर आपकी जो रेंज है वो -1 से व के बीच में आपके पास होती है और यदि आपके पास सेलर स्कोर की -1 से व के बीच में स्कोर रेंज होती है यहां पे यदि आपके जो सेलेट स्कोर की जो वैल्यू है यहां पे वो आपके पास वन के करीब आ जाए इसका मतलब आप क्या मानेंगे कि आपके पास बेस्ट आपके पास क्लस्टरिंग हुई है यहां पे और वही नंबर ऑफ क्लस्टरिंग आपके लिए बेस्ट है सेकंड चीज यदि आपके पास -1 की तरफ चले जाए तो आपके पास क्या है यहां पे सबसे बैड क्लस्टरिंग यहां पे हुई है यहां पे मतलब ये कस्टिंग अच्छी नहीं है यहां पे जो नंबर ऑफ आपने क्लस्टर निकाले हैं वो भी यहां पर परफेक्ट नहीं है तो बेसिकली आप क्या करते हैं सेलेट स्कोर की वैल्यू निकालते हैं इस पर्टिकुलर फॉर्मूले से हेल्प कैसे और यहां से आपको पता चलता है -1 के बीच की रेंज से ताकि आपको पता चल सके कि कौन सा आपका नंबर है जहां पे आपको बेस्ट क्लस्टरिंग देखने को मिली है दैट इज अ सेलेट स्कोप अब बात करते हैं कि इसके अंदर a ऑफ a ऑफ i और b ऑफ आ है क्या तो इसको जरा समझते हैं डिटेल के साथ सबसे पहले मैं बात करूंगा यहां पे a ऑफ i के बारे में कि ये a ऑफ i है क्या लेट्स सपोज यहां पर हम मानते हैं कि हमारे पास एक डेटा सेट है एक डेटा सेट है जहां पे हमारे पास कुछ इस तरह से डाटा पड़े है अब हमें बोला जा रहा है कि इसके अंदर आप क्या करें नंबर ऑफ क्लस्टर बनाएं तो सबसे पहले बात करते हैं ये एआई है क्या इसको आप मान लीजिए एक क्लस्टर है और इस क्लस्टर के अंदर हम क्या करते हैं कि कोई भी एक डेटा पॉइंट को पिक अप कर द हैं उस डेटा पॉइंट से आपके पास जितने भी दूसरे डेटा पॉइंट्स हैं उन सब की क्या करते हैं डिस्ट डिटेंस को निकालते हैं डिस्टेंस ऑफ d यस आप क्या करते हैं इस पर्टिकुलर पॉइंट से क्या करते हैं इन सब की डिस्टेंस को मेजर करते हैं और इन डिस्टेंस को मेजर करने के बाद हम इसका क्या करते हैं गाइज यहां पे मीन कंसीडर करते हैं मतलब आपने क्या किया यहां पे पर्टिकुलर कोई एक पॉइंट लिया उन सबसे आपके सबसे डिस्टेंस निकाली और उसके बाद क्या किया मीन निकाला अब ये आपके पास एक बार ऐसा नहीं होता है आपके पास जितने भी डेटा पॉइंट है उन सबके क्या निकाले जाते हैं मीन निकाले जाते हैं तो आपने क्या किया यहां पे जैसे इस पर्टिकुलर पॉइंट को लेके आपने क्या किया बाकी जितने भी पॉइंट है उनकी डिस्टेंस को कैलकुलेट किया और डिस्टेंस को कैलकुलेट करने के बाद में आपने क्या निकाला मीन निकाला इसी तरह से आप क्या हुआ आपके पास यहां पे आपने इस पॉइंट को पिक अप किया इस पॉइंट से इस पॉइंट का डिस्टेंस इस पॉइंट से इस पॉइंट का डिस्टेंस इस पॉइंट का इस पॉइंट का डिस्टेंस ये सारा कैलकुलेट करके आपने क्या करना मीन निकाला लेट्स आपके पास यहां पे ये वाला पॉइंट आया इस वाले पॉइंट से भी हमने क्या किया जितने भी पॉइंट्स हैं उनकी डिस्टेंस को निकाला एंड देन मी निकाला ऐसे करके आपने क्या किया सभी को यहां पे ऐड कर दिया या फिर आप एक काम कर सकते हैं देखिए नंबर ऑफ नंबर पॉइंट्स आपके पा सेम होंगे यहां पे तो आप क्या करेंगे सबसे पहले जितने भी डिस्टेंस है उस डिस्टेंस का आप क्या करेंगे सम निकालेंगे सम निकालने के बाद में आप क्या करेंगे यहां पे मीन कर देंगे अब देखिए मीन के अंदर हमने -1 क्य किया है यस ये c i -1 क्यों किया है यहां पे क्योंकि देखिए जब आप यहां पे मीन निकालने जा रहे हैं मतलब आप डिस्टेंस कैलकुलेट करने जा रहे हैं तो देखिए इस पर्टिकुलर पॉइंट से आप इन सब की ये डिस्टेंस कैलकुलेट कर रहे हैं तो बेसिकली ये पर्टिकुलर पॉइंट तो आपके पास कंसीडर होगा ही नहीं क्योंकि ये ऑलरेडी आपके पास क्या है मीन का पॉइंट रह चुका है तो ये पर्टिकुलर पॉइंट आपके पास कंसीडर होने वाला है नहीं तो बेसिकली आपके पास इसलिए यहां पे -1 को कंसीडर किया गया है दैट इज a ऑफ i यस ये क्या कहलाता है आपका पास a ऑफ कहलाता है अब आती है b आ की वैल्यू कि ये बफ की वैल्यू कैसे फाइंड आउट करते हैं तो देखिए आपके पास ये जो डेटा पॉइंट्स है इन डेटा पॉइंट से आपके जो दूसरा क्लस्टर है लेट्स सपोज ये आपके पास क्या है आपका दूसरा क्लस्टर यहां पे इस दूसरे क्लस्टर से सबसे मिनिमम डिस्टेंस के वाला आपका डटा पॉइंट कौन सा है वो आप फाइंड आउट करते हैं तो लेट्स मान लेते हैं कि ये आपका पॉइंट है जो सबसे मिनिमम हमें दिख रहा है यहां पे फिर क्या किया जाता है इस पर्टिकुलर पॉइंट से इसके बीच की जितनी भी डिस्टेंस है ये डिस्टेंस आपके पास कैलकुलेट की जाती है ये जो आप डिस्टेंस देख रहे हैं ये डिस्टेंस आपके पास कैलकुलेट की जाती है और डिस्टेंस को कैलकुलेट करने के बाद में वही आपके पास क्या किया जाता है सम किया जाता है और सम करके क्या किया जाता है गाइज यहां पे मीन निकाला जाता है तो देखिए यहां पे इस फॉर्मूले में आप देखेंगे तो देखिए मिनिमम ऑफ डिस्टेंस आपके पास है यहां पे आपने क्या किया इस पर्टिकुलर पॉइंट से जितने भी हमारे डेटा पॉइंट है उन डेटा पॉइंट की आपने क्या करी डिस्टेंस निकाली डिस्टेंस निकालने के बाद में आपने क्या किया उनका मीन निकाल लिया दैट इज कॉल्ड ऑफ b i इस तरह से आप यहां पे क्या करते हैं a i और b i की वैल्यू निकालते हैं अब देखिए a i और b i की जो वैल्यू आपके पास निकली है यहां पे आप क्या करते हैं सिंपल सा इसमें डिवाइड करते हैं देखिए मैं यहां पे क्या कर रहा हूं डिवाइड कर रहा हूं तो मैंने क्या किया गाइज यहां पे देखिए a ऑ i s a i / b i मैंने यहां पे रखा है अब देखिए यहां पे सबसे बेस्ट क्लचर कब होगा यस सबसे बेस्ट क्लस्टर आपके पास कब कहलाएगा जब देखिए आपके पास ये डिस्टेंस आपके पास यहां पे ज्यादा होगी या ए i की वैल्यू ज्यादा होगी तो ओबवियस सली बात है यहां पे कि आपके जो ए i की जो वैल्यू है वो ग्रेटर दन हो जाएगी b i से यस आपके पास क्या होगी गाइज यहां पे मैं बात करूं तो देखिए आपने जो ये आपने जो यह पास रेशियो निकाला है इस रेशो के अंदर आपके पास जो a आ की जो वैल्यू है यहां पे ये आपके पास क्या होगी ग्रेटर दन हो जाएगी b i से तब आपके पास क्या होगा बेस्ट क्लस्टर होगा क्यों बेस्ट क्लस्टर होगा देखिए एफ आ है क्या एफ आ आपके पास है एक पर्टिकुलर कस्टर के अंदर आपके पास जितनी भी डिस्टेंस है वो आपके पास कहलाती है और बीफ आ क्या है यहां पे एक पर्टिकुलर कस्टर से जो बाकी बचे हुए जितने भी पॉइंट्स है उनकी डिस्टेंस को कैलकुलेट करता है तो यदि देखिए आपके पास ये वाली जो डिस्टेंस है ये ज्यादा आपके पास हो गई मतलब ये वाली जो वैल्यू है ये आपके पास ज्यादा हो गई तो इसका मतलब आपका जो क्लस्टर है वो बैस्ट नहीं है जबकि ये वाली जो डिस्टेंस है ये ज्यादा आपके पास आई है इसका मतलब इसने बेस्ट नंबर ऑफ क्लस्टरिंग यहां पे की है तो बेसिकली हम क्या करते हैं एफ आ को ग्रेडर देन करते हैं अब एफ का ग्रेटे दन होने का मतलब क्या है गाइ यहां पे कि आपकी जो वैल्यू है वो आपके पास क्या होती है वन के करीब चली जाती है वन के करीब जाने का मतलब क्या है आपने वहां पे बेस्ट नंबर ऑफ क्लस्टर यहां पे निकालने हैं तो सेलेट स्कोर क्या करता है गाइज यहां पे आपको एक वैलिडेट आंसर निकाल के देता है जिसके थ्रू आप क्या करते हैं बेस्ट नंबर ऑफ क्लस्टर यहां पे फाइंड आउट करते हैं अब ये निकालते कैसे हैं इसको थोड़ा प्रैक्टिकली जरा समझते हैं यहां पे मैं ले चलता हूं आपको टिकल के ऊपर देखिए मैंने यहां पे पहले से क्या कर रखा है एक आयस डेटा सेट फ्लावर का जो डेटा सेट है उसके ऊपर नंबर ऑफ क्लस्टर्स यहां पे फाइंड आउट कर रके हैं और यूजिंग आपके पास केम इन क्लस्टरिंग के ऊपर यदि आप लोगों ने मेरी केम इन कस्टिंग की वीडियो देखी होगी तो वहां पे आप लोगों को पता होगा कि ये नंबर ऑफ क्लस्टर्स मैंने कैसे निकाले थे और ये प्रोग्राम मैंने कैसे बनाया था एक बार मैं फिर से ये प्रोग्राम फिर से बना लेता हूं देखिए सबसे पहले मैं क्या कर रहा हूं अपने जो रिक्वायर्ड लाइब्रेरी है इनको मैं इंपोर्ट कर रहा हूं एंड देन उसके बाद में मैं क्या कर रहा हूं गाइ यहां पे अपने डेटा सेट को लोड कर रहा हूं उसके बाद ये मेरा डेटा सेट यहां पर लोड हो चुका है उसके बाद मैं अपने डेटा सेट को दिर हूं कि किसके अंदर कितने नंबर ऑफ क्लस्टर्स यहां पे डिजाइन हो सकते हैं तो इस डटा सेट को देखने पर हमें यह पता चला कि इसके अंदर दो ही क्लस्टर डिजाइन हो सकते हैं लेकिन हम देखेंगे कि यहां पे कितने नंबर ऑफ क्लस्टर्स हमें के मीन बताता है तो चलिए चेक करते हैं यहां पे तो इसके लिए मैंने केविन क्लस्टरिंग का इस्तेमाल किया फिर मैंने डब्ल्यू सीएसएस का इस्तेमाल किया मतलब विदन अ क्लस्टर सम स्क्वायर का मैं यहां पे वैल्यू कैलकुलेट कर रहा हूं जिसके थ्रू हमें क्या मिलने वाला है यहां पे हमें नंबर ऑफ क्लस्टर मिलने वाला है मतलब गाइज यहां पे हमें बेस्ट स्कोर मिलने वाला है नंबर ऑफ क्लस्टर का चलिए रन करते हैं यहां पे इसे तो ये डब्ल्यू सीएसएस की वैल्यू कैलकुलेट हुई है और डब्ल्यू सीएसएस की वैल्यू कैलकुलेट करने के बाद में मैंने यहां पे नंबर ऑफ क्लस्टर ढूंढ है यहां पे अब देखिए नंबर ऑफ क्लस्टर में कंफ्यूजन है कि थ्री आएगा या फोर आएगा तीन क्लस्टर के हिसाब से मैंने क्या किया हमारे डेटा सेट को क्लस्टर किया है और मैंने जब क्लस्टर का रिजल्ट दिखा है तो क्लस्टर का जो रिजल्ट हुआ है यहां पे वो हमें कुछ प्रिडिक्ट होके दिखा है और जब हमने इसे ऑर्डिनरी डटा से साइड से कंपेयर किया है तो ये काफी अच्छा क्लस्टर निकला है लेकिन मुझे यहां पे एक सिक्योरिटी निकालनी पड़ेगी कि बेस्ट नंबर ऑफ क्लस्टर कितने होने चाहिए बिक बिकॉज देखिए हर बार हमारे पास हमारा रिजल्ट नहीं होता है तो हम यहां पर नहीं चेक कर सकते कि इसके अंदर कितने नंबर ऑफ क्लस्टर बनने वाले हैं तो इसके लिए मुझे यहां पे क्या करना पड़ेगा हमारे डटा सेट के ऊपर एक सिक्योरिटी लानी पड़ेगी इसके लिए हम क्या करते हैं स्ट स्कोर का यहां पे इस्तेमाल करते हैं अब ये सेटल स्कोर निकालते कैसे हैं यहां पे जरा समझते हैं यहां पे तो इसके लिए आपको कहां जाना है फ्रॉम सबसे पहले आपको जाना है साइक लाइन के अंदर साइकल लाइन के अंदर जाने के बाद आप कहां जाएंगे मैट्रिसेज के अंदर क्योंकि मैट्रिसेज के अंदर हमें सारी एक्यूरेसी मैट्रिक्स देखने को मिलती है इसके लिए हम यहां पे जाके क्या करेंगे इंपोर्ट करेंगे सलेट स्कोर को यहां पे तो मैंने यहां पे सलेट स्कोर को इंपोर्ट कर दिया अब सलेट स्कोर हमसे क्या-क्या डिमांड करता है चलिए उसको देखते हैं यहां पे देखिए सलेट स्कोर को ओपन करने के बाद सबसे पहले हमारे पास एक्स एक्सेस का डाटा मांगता है फिर उसके बाद यहां पे लेबल्स मांगता है लेबल्स का मतलब यहां पे है कि आपका आउटपुट्स क्या निकल के आए है यहां पे वो आपसे डिमांड करता है उसके बाद यहां पे देखिए डिस्टेंस के लिए इन्होंने यूक्लिड मैट्रिक्स का इस्तेमाल किया है सैंपल साइज भी आप दे सकते हैं रैंडम स्टेट भी आप दे सकते हैं तो अब देखिए सबसे पहले आपसे क्या मांगा जा रहा है आपका डेटा मांगा जा रहा है अब डेटा कहां है आपके पास यहां पे तो डेटा आपके पास यहां पे डेटा सेट के अंदर है दैट्ची इज योर डाटा सेट तो ये रहा आपका डेटा सेट जहां पे आपका डेटा सेट पड़ा है लेकिन प्रेडिक्शन का जो रिजल्ट है वो हमें चेक करना है तो प्रेडिक्शन का रिजल्ट यहां पर चेक करने के लिए मैं क्या करने वाला हूं गाइ यहां पे कि आपके पास ये जो हमने क्लस्टर बनाया था कहां पे केमन क्लस्टर बनाया था बस यहीं पे हमें हमारा लेबल्स भी मिलने वाला है कैसे मिलेगा यहां पे तो देखिए ये जो केएम ए मैंने यहां पे लिखा है यहां पे डॉट यहां पे हमें क्या करेंगे डॉट करके यहां पे लेबल्स निकालेंगे तो देखिए यहां पे मुझे लेबल्स मिल जाएंगे लेबल्स का मतलब है गाइज यहां पे कि इसने इस डेटा सेट के साथ किस तरह से प्रेडिक्शन किया प्रेडिक्शन करने का मतलब क्या है 0 व क्या आंसर लिखा है दैट इज अ प्रेडिक्शन आंसर तो यहां पे आपको लेबल्स भी आपको मिल जाएगा चलिए सेलेट स्कोर को यहां पे लगाते हैं मतलब इसके नीचे लगाते हैं और चेक करते हैं कि हमने जो नंबर ऑफ क्लस्टर बनाए वो सही है या नहीं है मतलब इस पे सेलेट इसको सही आंसर दे रहा है या नहीं दे रहा है चलिए तो मैं यहां पे फिर से वापस इंपोर्ट कर लेता हूं क्योंकि मैंने यहां पे गलती से उसे हटा दिया यहां पे तो मैं यहां पे साइकल न के अंदर चलता हूं साइकल न के अंदर जाने के बाद दैट मैं मैट्रेस पे जाता हूं मैट्रेस पे जाने के बाद दैट मैं इंपोर्ट करूंगा यहां पे और किसे इंपोर्ट कर रहा हूं यहां पे सेलेट स्कोर को तो तो ये हमारा आ गया सेलेक्ट स्कोर चलिए सेलेक्ट स्कोर को लगाते हैं यहां पे तो मैंने यहां पे लगाया सेलेक्ट स्कोर सेलेक्ट स्कोर के बाद में मेरा जो डेटा है वो हमारे पास क्या है डेटा सेट के तौर पे है यहां पे सेकंड चीज यहां पे क्या मांगी गई है यहां पे लेबल्स मांगी गई है और लेबल्स के अंदर हमने क्या यहां पर लेबल्स रख रके है दैट के एम एन यस केएम ए डॉट यहां पर लेबल्स को मैंने कॉल कर दिया यहां पे राइट तो ये हमारा लेबल्स आ गया रन करते हैं यहां पे तो यहां पे जो लेबल आया है दैट अ 61 अब ये 61 सही है या गलत है हमें कोई आईडिया नहीं लग रहा है तो हम क्या करेंगे गाइस यहां पे सेलेट स्को डायरेक्टली नहीं निकालने वा देखिए ये 61 आया है दैट अ पॉजिटिव स्कोर ये वन के करीब है इसका मतलब क्या हुआ कि यहां पे नंबर ऑफ क्लस्टर जो हमने चूज किए थ्री दैट इज अ परफेक्ट क्लस्टर लेकिन हम यहां पे क्या करेंगे चेक करेंगे कि कौन सा नंबर ऑफ क्लस्टर यहां पे बेस्ट होने वाला है तो बेसिकली मैं यहां पे लगाने वाला हूं लूप तो अब ये लूप कैसे लगेगा और किस तरह से काम होगा जरा समझिए यहां पे तो वापस आ जाते हैं थोड़ा सा नीचे और जैसा हमने यहां पे डब्ल्यू सीएसएस के साथ किया था मतलब डब्ल्यू सए निकालने के लिए किया था वही काम हम यहां पे दोबारा करने वाले हैं और सेलेट स्कोर और नंबर नबर ऑफ क्लस्टर के बीच में ग्राफ बनाएंगे ताकि हमें आईडिया लग सके कि इसके अंदर सबसे नंबर ऑफ बेस्ट क्लस्टर कौन सा है क्या हमने जो डब्लू निकाला वही हमारा राइट क्लस्टर है या नहीं है चलिए कैसे पता लगाएंगे तो अब जरा समझिए तो मैं यहां पे फोर्ड लूप चला देता हूं फर आ एंड क्या करूंगा यहां रेंज का इस्तेमाल करूंगा और इस रेंज के अंदर दो क्लस्टर से लगाकर मैं 21 ले लेता हूं मतलब 20 क्लस्टर्स यहां पे डिजाइन करता हूं जैसे देखिए मैंने डब्ल्यू सीएसएस के अंदर 20 क्लस्टर डिजाइन किए थे चलिए अब नेक्स्ट टारगेट क्या होगा यहां पे कि i की वैल्यू आएगी मतलब ये हमें नंबर ऑफ क्लस्टर देगा इस नंबर ऑफ क्लस्टर के ऊपर हमें हमारा स्लाइट स्कोर भी निकालना है और नंबर ऑफ क्लस्टर के बीच में ग्राफ बनाना है तो कैसे निकालेंगे तो देखिए इसके लिए मैं क्या कर रहा हूं यहां पे केएम के नाम से यहां पे वेरिएबल बना रहा हूं मतलब के मन क्लस्ट के नाम से वेबल बना रहा हूं देखिए पहले चेक कर लेते हैं इससे पहले हमने कभी बनाया या नहीं बनाया यस k ए के नाम से हमने पहले भी बना रखा है तो गाइज यहां पे k ए1 के नाम से एक वेरिएबल बनाते हैं और केमन जो क्लस्टर है यहां पे उसे कॉल कर लेते हैं अब केमन क्लस्टर के अंदर हमें मिलते हैं नंबर ऑफ क्लस्टर इस नंबर ऑफ क्लस्टर के अंदर मैं i खूंगा यहां पे फिर मैं क्या कर रहा हूं यहां पे केमन वन जो है यहां पे इसे फिट करूंगा फिट करने के लिए क्या करूंगा यहां पे हमारा जो डेटा सेट है वो मैं पास कराऊंगा उसके बाद जो ये के मन वन है यहां पे इसका हमें क्या करना है लेबल्स को फाइंड आउट करना है और इसी लेबल्स के ऊपर हमें हमारा सेलेट स्कोर निकालना है चलिए तो मैं यहां पे क्या करता हूं हमारा जो सेलेट स्कोर है यहां पे वो कॉल करता हूं यहां पे डाटा के अंदर मैं अपना डेटा सेट पास करा देता हूं और लेबल निकालना है तो k1 यहां पर क्या करूंगा लेबल्स का इस्तेमाल करूंगा तो ये हमें क्या करके लाके देगा इसका लेबल्स भी लाके दे देगा चलिए अब इस लेवल्स के अंदर जो आपका डाटा आया है इसे हम कहीं ना कहीं सेव कर लेते हैं तो मैं यहां पे क्या कर रहा हूं यहां पे ये जो सलेट स्कोर है तो मैं एसएस के नाम से एक वेलेबल बनाता हूं और एक लिस्ट के अंदर इस को सेव कर लेते हैं देखिए एएस डॉट यहां पे क्या करेंगे अपेंड का इस्तेमाल करेंगे राइट और अपेंड के थ्रू ये जो सेलेट स्कोर की वैल्यू आई है इसे हम यहां पे क्या करेंगे सेव कर लेंगे चलिए इसे रन करते हैं तो ये हमें हमारे सेलेट स्को सब आके लके दे दिया यहां पे अब देखिए इसके अंदर कुछ वार्निंग आई है वार्निंग को हम इग्नोर करते हैं क्योंकि देखिए वार्निंग आपके पास एरर नहीं होती है तो एक बेसिक वार्निंग है इसको आप इग्नोर कर सकते हैं अभी देखिए वार्निंग बोल रहा है कि आप n यूनिट का इस्तेमाल कर रहे हैं वो चेंजेज हो चुका है दैट्ची इस तरह से मे भी हमारा जो पाइथन है वो अपडेट हुआ नहीं है तो इस वजह से वार्निंग आई है यदि आप लेटेस्ट पाइथन को इस्तेमाल करते हैं तो वहां पे ये वार्निंग नहीं आएगी आपके पास अब देखिए ये जो एसएस आया है यहां पे एसएस वर्सेस हम नंबर ऑफ़ क्लस्टर के बीच में ग्राफ बनाने वाले हैं ताकि हमें मिल सके कि हमारा बेस्ट नंबर ऑफ क्लस्टर कौन सा है तो इसके लिए मैं क्या करने वाला हूं गाइज यहां पे अ एक काम करते हैं एसएस तो हमारे पास आ चुका है नंबर ऑफ क्लस्टर्स हमें निकालना है नंबर ऑफ़ क्लस्टर्स के लिए हम क्या कर रहे हैं यहां पे गाइज यहां पर हम क्या कर रहे हैं एक नंबर ऑफ क्लस्टर के नाम से वेलेबल बनाते हैं मतलब ए c के नाम से बराबर बनाते हैं यहां पे इसी के अंदर क्या करने वाला हूं मैं यहां पे लिस्ट कंप्रेंशन का इस्तेमाल करूंगा और लिस्ट कंप्रेंशन के थ्रू मैं नंबर ऑफ क्लस्टर डिजाइन करूंगा अब इसके लिए मैं कर रहा हूं यहां पे जे ले रहा हूं एंड फॉर जे इन यस फॉर जे इन क्या करेंगे यहां पे रेंज का इस्तेमाल करेंगे और रेंज के अंदर यहां पे टूमा 21 रख लेंगे यहां पे तो देखिए ये सैलेड स्कोर भी आ चुका है और नंबर ऑफ़ क्लस्टर भी आ चुका है चलिए इसके बीच में ग्राफ बनाते हैं ग्राफ बनाने के लिए मैं पीएटी डॉट यहां पे क्या करूंगा प्लॉट फंक्शन का इस्तेमाल करूंगा पीएटी डॉट मैं करने वाला हूं यहां पे गाइज प्लॉट फंक्शन का इस्तेमाल कर रहा हूं प्लॉट फंक्शन के अंदर एक एक्सिस के अंदर मैं क्या दूंगा नंबर ऑफ क्लस्टर दूंगा तो ये हो गया नंबर ऑफ क्लस्टर एंड y एक्सिस के अंदर मैं क्या दूंगा सेलेट स्कोर दूंगा यहां पे और इस ग्राफ को शो देखने के लिए मैं पीएटी डॉट यहां पर शो ग्राफ शो का फंक्शन का इस्तेमाल करूंगा और गाइस हम इसे रन करते हैं तो देखिए हमें यहां पर नंबर ऑफ क्लस्टर्स वगैरह सब कुछ मिल चुका है यहां पे और सेलेट स्कोर के बारे में भी इंफॉर्मेशन मिल चुकी है अब हम क्या करते हैं गाइज यहां पे अ इस ग्राफ के अंदर जो एक्स लेबल है वो सही नहीं आया है पहले तो उसको सही करते हैं और ये x एक्सेस में क्या है और y एक्सेस में क्या है तो उसको भी हम शो करते सही करते हैं यहां पे अ पीएटी डॉट मैं क्या कर नाहा हूं गाइज यहां पे x लेवल को यहां पे इस्तेमाल कर रहा हूं और x लेवल के अंदर हम क्या कर रहे हैं यहां पे नंबर ऑफ क्लस्टर का इस्तेमाल कर रहे हैं नंबर ऑफ क्लस्टर लिखने वाला हूं यहां पे और वा एक्सिस के अंदर हम क्या कर रहे हैं गाइज यहां पे पीएटी डॉट यहां पर y लेबल लेंगे यहां पे और वा लेबल के अंदर हम इस्तेमाल कर रहे हैं हमारे सेलेट स्कोर का तो मैं यहां पे लिख देता हूं सेलेट स्कोर तो ये देखिए मैं यहां पे सेलेट स्कोर लिख देता हूं और सेकंड चीज हमें हमारे कास क्या करना है कि जो हमारे पास x लेवल है उस x लेवल के अंदर भी आपके देखिए नंबर ऑफ जो वैल्यू है यहां पे सही नहीं आ रही है तो इनको भी सही करना है तो इसके लिए पीडी डॉट यहां पे क्या करूंगा एक्स ट्रिक का इस्तेमाल करूंगा यहां पे यस पीडी ड एक ट्रिक का इस्तेमाल करूंगा और पीडी ड एक्सट के अंदर मैं नंबर ऑफ सी को यहां पे पास आउट करा दूंगा चलिए रन करते हैं तो देखिए दोनों जगह हमारे पास नंबर भी आ चुके हैं और सेल एड स्को भी आ चुका है तो यहां पर देखिए एक्सटिक का वाइट ट्रिक मैंने यहां पे लगा दिया है यहां पे और एक्सटिक का वाइट ट्रिक लगाने के बाद में ये देखिए हमारे पास सेलेक्ट स्कोर की वैल्यू आ चुकी है अब इस सेलेक्ट स्कोर के अंदर हाईएस्ट सेलेट स्कोर कहां मिल रहा है हमें यहां पे हाईएस्ट सेल स्कोर हमें यहां पे टू पे मिल रहा है चलिए इसको और अच्छे से देखने के लिए मैं क्या कर रहा हूं यहां पे आपके पास अ मैं ग्रिड भी लगा देता हूं यहां पे तो पीएटी डॉट मैं क्या कर रहा हूं यहां पे ग्रिड का इस्तेमाल करूंगा और ग्रिड के अंदर मैं क्या कर रहा हूं यहां पे गाइस एक्स एक्सेस की वाली ग्रिड देने वाला हूं तो मैं यहां पे एक्सेस का इस्तेमाल करूंगा और एक्सेस के अंदर एक्स एक्सेस डालूंगा यहां पे और हम रन करेंगे तो देखिए सबसे बेस्ट जो सेलर स्कोर मिल रहा है यहां पे वो टू पे मिल रहा है इसका मतलब क्या हुआ इसका मतलब सिंपल सा है गाइज यहां पे कि यहां पे नंबर ऑफ क्लस्टर्स कितने बनने चाहिए केवल और केवल टू क्लस्टर बनने चाहिए क्योंकि देखिए उसके बाद आपके जो देखिए सेलेट स्कोर की जो वैल्यू है वो लगातार घटती जा रही है इसका मतलब ये जो बेस्ट सेलर स्कोर आपको बता रहा है दैट इज अ टू यस आपके लिए बेस्ट सेल स्कोर कौन सा है आपके पास गाइज यहां पे टू है इसका मतलब इस पर्टिकुलर डेटा सेट के ऊपर टू ही क्लस्टर बनने चाहिए जबकि हम यहां पे बात करें कि हमारे पास ये जो कर्वेचर है मतलब हमारे पास ये जो एल्बो कर्वेचर हमने बनाया यहां पे डब्ल्यू सीएसएस का कर्वेचर बनाया है ये डब्ल्यू सए का कर्वेचर हमें क्या बता रहा है थ्री बता रहा है इसका मतलब क्या हुआ गाइज यहां पे बेसिकली सैलिड स्कोर हमें टू बता रहा है तो यहां पे दो ही क्लस्टर बने चाहिए और इसका पीछे रीजन भी बहुत सिंपल सा है रीजन बहुत ही सिंपल सा है गाइ यहां पे क्या है रीजन कि आपके पास यहां पे देखिए क्लस्टर ढूंढने निकलेंगे ना यहां पे तो आपको दो ही ग्रुप मिलेंगे आपको तीन ग्रुप नहीं मिलने वाले हैं तो इसका मतलब क्या हुआ गाइज यहां पे कि सेलेट स्कोर आपको एक बेटर कॉन्फिडेंस देता है कि आपने जो नंबर ऑफ क्लस्टर निकाले हैं वो सही है या नहीं है तो बेसिकली हमने जो नंबर ऑफ क्लस्टर निकाले वो सही नहीं है पर्टिकुलर डेटा के लिए पर्टिकुलर डेटा के लिए यहां पे नंबर ऑफ़ क्लस्टर कितने होने चाहिए टू होने चाहिए और डब्ल्यू सीएसएस की बात करें यहां पे यस डब्ल्यू सीएसएस की बात करें तो हमें तीन क्लस्टर देता है यहां पे और जबकि हम यहां पे बात करें सैलिड स्कोर की तो सैलेड स्कोर हमें आंसर दे रहा है टू मतलब हम टू क्लस्टर को ले सकते हैं लेकिन उसके बाद भी हम जितने नंबर ऑफ क्लस्टर ले सकते हैं वो यहां पे ले सकते हैं मतलब मैक्सिमम जो यहां पे क्लस्टर बनने चाहिए वो दो ही बनने चाहिए फिर आपकी जो इच्छा है आप उतने नंबर ऑफ क्लस्टर डिजाइन कर सकते हैं और आज के इस वीडियो के जरिए हम बात करने वाले हैं एसोसिएशन लर्निंग के बारे में देखिए हमने अनसुरा मशीन लर्निंग को स्टार्ट किया था और अनसुरा मशीन लर्निंग के अंदर दो टाइप की कैटेगरी होती है पहली होती है आपके पास क्लस्टरिंग और दूसरी होती है एसोसिएशन देखिए क्रस्टिंग के अंदर हम क्या करते हैं ग्रुप्स बनाते हैं मतलब हमारा जो डाटा होता है उसके अंदर छोटे-छोटे ग्रुप्स बनाते हैं कि जो जिससे रिलेटेड करता है उसको उस ग्रुप के अंदर ट्रांसफर कर देते हैं एसोसिएशन लर्निंग के अंदर हम यह समझते हैं कि सबसे ज्यादा फ्रीक्वेंसी प्रोडक्ट कौन सा सेल हो रहा है क्या वो एक दूसरे के साथ रिलेट कर रहे हैं क्या वो एक दूसरे के साथ रिलेशन नहीं रख रहे हैं मतलब बेसिकली मॉल के अंदर किसी प्रोडक्ट को अरेंज किया जाता है तो वो किस तरह से अरेंज किया जाता है कोई भी प्रोडक्ट को आप किस तरीके से अपनी शॉप के अंदर अपने मॉल के अंदर या फिर कहीं पे भी आप यहां पे अरेंज कर सकते हैं वो चीज आपको कौन बताता है एसोसिएशन लर्निंग बताता है तो एसोसिएशन लर्निंग आपके पास क्या कर आती है एसोसिएशन लर्निंग आपके पास किसी भी चीज के प्रोडक्ट के अंदर किस तरह से उसको सिस्टेमेयर है दैट ये आपको एसोसिएशन लर्निंग के थ्रू फाइंड आउट किया जाता है अब ये किस तरह से फाइंड आउट होता है क्या इसकी टेक्निक है इसको हम डिटेल के साथ समझते हैं देखिए एसोसिएशन लर्निंग आपके पास क्या है एक मशीन लर्निंग की टेक्निक है जिसके थ्रू हम क्या करते हैं कि जो भी हमारा डेटा सेट है उस डेटा सेट के अंदर हम पैटर्न ढूंढते हैं कि कौन सा डाटा किस डाटा के साथ रिलेशन रखता है मतलब आप इस तरह से मान लीजिए कि आपके पास कोई कॉलम्स रखे हुए हैं x x1 x2 x3 x2 इस तरह से आपके पास कॉलम है यहां पे राइट ये x1 x2 x3 जो कॉलम आपके पास दिए गए हैं ये किस तरह से आपके पास रिलेशन में रखते है मतलब ये एक प्रोडक्ट एक दूसरे के साथ किस तरह से रिलेशनशिप में रहते हैं यहां पे इसके बारे में हम क्या करते हैं एसोसिएशन लर्निंग के थ्रू फाइंड आउट करते हैं अब इसका जो यूज़ केस है वो सबसे ज्यादा मार्केट बास्केट एनालिसिस में किया जाता है मतलब जो भी हमारे सुपरमार्केट है उस सुपरमार्केट के अंदर प्रोडक्ट को किस तरह से अरेंज करना है उसके लिए हम एसोसिएशन लर्निंग का सबसे ज्यादा इस्तेमाल करते हैं अब इसके अंदर ये एसोसिएशन लर्निंग किस तरह से वर्क करती है जरा उसको समझते हैं देखिए मार्केट बास्केट एनालिसिस के अंदर या फिर इन सुपरमार्केट के अंदर सबसे पहला काम क्या गया जाता है कि आपके पास उस सुपरमार्केट के अंदर जो प्रोडक्ट परचेस किए जा रहे हैं उन परचेस की उन प्रोडक्ट जो परचेस प्रोडक्ट के जो प्रोडक्ट परचेस किए जा रहे हैं उन प्रोडक्ट की आपके पास क्या करती है एक लिस्ट बना ली जाती है मतलब बेसिकली उनको एक रिकॉर्ड कर लिया जाता है रिकॉर्ड करने के बाद में एसोसिएशन लर्निंग आपके पास क्या करती है सबसे पहले जो सबसे फ्रीक्वेंसी है देन उसके बाद क्या करती है गाइज यहां पे उसका जो सेकंड प्रोडक्ट है जो उसके बाद बाय हुआ है या फिर उसके साथ बाय हुआ है यहां पे उनको फाइंड आउट करती है देन हमें यहां पे ये सजेशन देती है कि आपको इस प्रोडक्ट के बाद में दूसरा प्रोडक्ट रखना चाहिए लेट्स सपोज कोई ए प्रोडक्ट है जो कि सबसे ज्यादा सेलिंग प्रोडक्ट है उसके बाद यहां पे a के साथ कौन सा प्रोडक्ट सबसे ज्यादा सेल हो रहा है है वो निकाला जाता है जस्ट लाइक अ सी प्रोडक्ट बी प्रोडक्ट की मैं बात नहीं कर रहा बी प्रोडक्ट एक इंडिविजुअल प्रोडक्ट हो सकता है यहां पे मे बी वो इंडिविजुअल सेलिंग हो रहा है यहां पे लेकिन मान लो लेट्स सपोज आपके पास कोई सी प्रोडक्ट है जो ए प्रोडक्ट के साथ सेल हो रहा है लेकिन उसकी सेलिंग कम है लेकिन यहां पे सेल जरूर हो रहा है तो बेसिकली गाइज यहां पे एसोसिएशन लर्निंग हमें ये बताता है कि ए प्रोडक्ट के बाद में जो सी प्रोडक्ट है वो आपके पास a के साथ बाय हुआ है मतलब एक के साथ फ्रीक्वेंसी करने जा रहे हैं तो उस वक्त आप क्या करेंगे a के बाद आप अपना जो अगला प्रोडक्ट है वो कौन सा रखने वाले हैं c प्रोडक्ट को रखने वाले हैं ना कि बी प्रोडक्ट को देखिए ब प्रोडक्ट यदि हमारे पास मोस्ट सेलिंग प्रोडक्ट हो सकता है लेकिन हम यहां पे बी प्रोडक्ट को नहीं रखेंगे हम किस प्रोडक्ट को रखेंगे स प्रोडक्ट को रखेंगे क्यों क्योंकि ये दोनों प्रोडक्ट बहुत ही फ्रीक्वेंसी [संगीत] आपके पास साथ-साथ मतलब ये दोनों आपके पास क्या हो रहा है फ्रीक्वेंसी यहां पे बाय हो रहे हैं तो इसके लिए हम क्या कर रहे हैं गाइ यहां पे इनको सिस्टमैटिक वे के अंदर अरेंज करते हैं इसके लिए हम क्या इस्तेमाल कर रहे हैं एसोसिएशन लर्निंग को इस्तेमाल करते हैं काफी लोग इसको एसोसिएशन रूल लर्निंग भी बोलते हैं काफी लोग इसे एसोसिएशन लर्निंग भी बोलते हैं अब इस एसोसिएशन लर्निंग के अंदर जो टेक्निक इस्तेमाल की जाती है वो टेक्निक होती है ए देन बी मतलब आप इफ ए खरीद रहे हैं तो देन आप बी भी खरीद सकते हैं मे बी आपके पास बी नहीं भी खरीद सकते हैं और मे बी बी खरीद सकते हैं तो ये चीज आपके पास कैसे निकाली जाती है आपके पास एसोसिएशन लर्निंग के थ्रू निकाली जाती है फ इस के अंदर रूल कौन सा वर्क करता है इफ a देन बी मतलब ए प्रोडक्ट खरीदा गया है तो उसके बाद बी भी खरीदा जा सकता है यह आपके क्या करता है एसोसिएशन लर्निंग वर्क करता है अब ये जो एसोसिएशन लर्निंग है यहां पे ये आपके पास तीन चीजों पे मेजर वर्क करती है ये तीन चीजें कौन-कौन सी है सबसे पहले आता है आपका सपोर्ट दूसरा आता है आपका कॉन्फिडेंस और तीसरा आता है लिफ्ट इन तीन मेथड के हेल्प से हम यह पता लगाते हैं कि कोई भी दो प्रोडक्ट आपस में एसोसिएट है या नहीं है हां हालांकि मोस्ट बाय प्रोडक्ट आप वैसे भी निकाल सकते हैं डायरेक्टली मोस्ट सेलिंग प्रोडक्ट हमारे यहां पे टारगेट गोल नहीं होता है हमारा टारगेट गोल ये होता है कि लेट्स ए प्रोडक्ट के बाद में नेक्स्ट प्रोडक्ट कौन सा रखा जाए वो सी प्रोडक्ट होगा या बी प्रोडक्ट होगा या डी प्रोडक्ट होगा एनीथिंग एल्स कोई भी प्रोडक्ट हो सकता है तो उसको निकालने के लिए हमें क्या करना पड़ता है इन तीन मेथड्स की जरूरत पड़ती है दैट इज अ सपोर्ट देन सेकंड इज कॉन्फिडेंस थर्ड वन इज लिफ्ट इन तीन के हेल्प से हम क्या करते हैं ये चीजें फाइंड आउट करते हैं अब ये कैसे फाइंड आउट करते हैं जरा इसे समझते हैं एक एग्जांपल के थ्रू लेट्स यहां पे हमारे पास क्या है एक डेटा सेट है इस डेटा सेट के अंदर मैंने क्या किया है छह कस्टमर का रिकॉर्ड ट्रैक किया है यहां पे जो कि कुछ प्रोडक्ट बाय कर रहे हैं जैसे कि आप देख पा रहे हैं यहां पे आइटम वन आइटम टू आइटम थ्री मतलब जो यहां पे कोई भी पर्टिकुलर पर्सन है वो हाईएस्ट तीन आइटम लेके जा रहा है यहां पे और लोएस्ट वन आइटम लेके जा रहा है अब सेकंड चीज यहां पे क्या हो रहा है कि कोई भी कस्टमर कौन से क्या-क्या आइटम लेके जा रहा है मैंने उसका एक रिकॉर्ड अरेंज कर रखा है यहां पे अब मुझे यहां पे पता लगाना है कि बेसिकली यदि मैं अपने मॉल के अंदर सभी चीजों को अरेंज करूं जैसे पहले क्या ना पहले मैंने एक रैंडम सबको अरेंज कर दिया था लेकिन अब मैं इनको सिस्टेमेयर वे के अंदर अरेंज करूं तो मैं किस तरह से अरेंज करूं तो इसके लिए मुझे यहां पे इन तीन चीजों की जरूरत पड़ेगी कौन-कौन सी है सपोर्ट कॉन्फिडेंस एंड लिफ्ट की अब ये सपोर्ट कॉन्फिडेंस लिफ्ट कैसे वर्क करता है जरा उसको समझते हैं यहां पे देखिए सपोर्ट विक्ट और कॉन्फिडेंस वर्किंग जो प्रोसीजर है यहां पे वो एक अलग तरीके से वर्किंग करते हैं उसके लिए हमें अलग से एल्गोरिथम पढ़नी पड़ेगी जो कि आने वाले वीडियो के अंदर हम एल्गोरिथम को डिस्कस करेंगे लेट्स यहां पे अभी मैं उनके फॉर्मूले के बारे में बताऊंगा कि ये फॉर्मूले किस तरह से वर्क करते हैं आपको बेटर अंडरस्टैंडिंग देने के लिए मतलब आपको एसोसिएशन करने के लिए अब देखिए कैसे यहां पे मतलब मुझे यहां पे प्रोडक्ट को अरेंज करना है तो हाउस फाइंड दिस प्रोडक्ट कि हम किस तरह से प्रोडक्ट को अरेंज करेंगे यहां पे ओके तो सबसे पहले हम क्या निकालते हैं यहां पे सपोर्ट निकालते हैं व्हाट इज द सपोर्ट देखिए सपोर्ट आपके पास क्या करता है यहां पे कि आपका कौन सा प्रोडक्ट है वो कितनी बार बाय हो रहा है यहां पे उसकी प्रोबेबिलिटी निकालता है लेट्स सिंपल एग्जांपल कि सपोर्ट क्या करता है गाइज यहां पे कि आपका जो भी प्रोडक्ट है वो आपके पास कितनी बार बाय हुआ है यहां पे उसकी प्रोबेबिलिटी निकालता है लेट्स एग्जांपल के तौर पे हम बात करें यहां पे तो मैं चाहता हूं यहां पे कि मेरे पास यहां पे देखो बीकॉन है यस यहां पे क्या है बीकॉन है अब ये बकन कितनी बार बाय हो रहा है इसकी हमें प्रोबेबिलिटी निकालनी है टस 1 टूथ एंड फोर तो यहां पे मैं यदि मैं बकन की आपके पा सपोर्ट निकालूं मतलब s ऑफ बी निकालूं यहां पे तो s ऑफ ब आपके पास कितना हो जाएगा यहां पे तो ये हो जाएगा 4/6 अब ये 4/6 क्यों हुआ तो देखिए टोटल नंबर ऑफ कस्टमर हमारे यहां पे कितने आए हैं सिक्स कस्टमर आए हैं उसमें से फोर्थ नंबर ऑफ कस्टमर ने यहां पे क्या कर रखा है बकन को बाय कर रखा है तो दैट इज अ सपोर्ट यस ये क्या है हमारे पास हो गया सपोर्ट हो गया अब देखिए सपोर्ट का इस्तेमाल क्यों करती है कंपनियां यहां पे सपोर्ट का इस्तेमाल इसलिए करती है जैसे हमारे पास बहुत सारे प्रोडक्ट आपके पास है इन प्रोडक्ट के अंदर हमें वो प्रोडक्ट निकालना है जो सबसे लेस्ट सेलिंग है अब लेस्ट सेलिंग का आप एग्जांपल किस हिसाब से ंगे मतलब आपके पास एक कोई लिमिटेशन या क्राइटेरिया तो होगा उसके हिसाब से लेंगे तो बेसिकली यहां पे कंपनियां क्या करती है आपके पास जो सपोर्ट है यहां पे वो सपोर्ट मान लेते हैं कि 50 पर से ऊपर जो आपके पास सेलिंग है वो हमारे पास क्या है आपके पास बेटर सेलिंग है यहां पे लेकिन 50 पर से नीचे से है यहां पे तो वो हमारे पास क्या है लेस सेलिंग प्रोडक्ट है और कंपनियां जो लेस सेलिंग प्रोडक्ट होती है उन्हें अपने अ स्टोर से बाहर निकाल देती है बेसिकली उनको यहां पे अरेंज नहीं करती है उनकी जो आपके पा सेलिंग होती है वो कम हो रही है तो हम उनको क्या करते हैं बाहर कर देते हैं देन आपके पास सपोर्ट क्या कर रहा है दो तरीके से हेल्प करता है पहला आपके पास किस तरह से हेल्प कर रहा है यहां पे कि आपका लेस्ट सेलिंग प्रोडक्ट कौन सा है वो फाइंड आउट करने के लिए करता है यहां पे सेकंड सपोर्ट आपको ये भी आपको इंश्योर कराता है कि आपके पास लेट्स सपोज आपने बिकन बाय किया तो बिकन के साथ नेक्स्ट प्रोडक्ट आपका आपका कौन सा आना चाहिए वो भी यहां पे इंडिकेट करता है लेट्स यहां पे देखेंगे तो बिकन के बाद में जो सबसे ज्यादा बाय प्रोडक्ट है वो कौन सा है एग ही है क्योंकि एग जो आया है वो तीन बार आया है इसके अलावा हम यहां पे देखें तो बिकन के अलावा आप एग के अलावा यदि हम और ढूंढे तो देखिए शोप दो बार आ रखा है एप्पल भी दो बार आ रखा है बनाना केवल एक बार आ रखा है तो यहां पर हमें क्या करना होता है हमें सपोर्ट निकालना होता है फिर से सपोर्ट क्या निकालना होता है बिकन एंड आपके पास एग का बिकन एंड एग का सपोर्ट निकालने थे दैट इज अ 3/6 आता है यहां पे अब अब ये जो 3/6 है ये हमारे जो मिनिमम सपोर्ट क्राइटेरिया होगा जस्ट लाइक कोई भी आपका एक मिनिमम सपोर्ट क्राइटेरिया आप डिसाइड कर लेते हैं यहां पे ओके तो ये मिनिमम सपोर्ट हमने क्या माना लेट्स सपोज 50 माना तो ये 50 पर के क्राइटेरिया को पार कर रहा है या नहीं कर रहा है लेट्स ये 50 पर के क्राइटेरिया को पार कर रहा है इसका मतलब क्या हुआ ये दोनों जो प्रोडक्ट है ये साथ-साथ रखे जा सकते हैं तो गाइस सपोर्ट हमें क्या करता है यहां पे बताता है कि कोई भी दो प्रोडक्ट आप ले रहे हैं यस कोई भी दो प्रोडक्ट आप ले रहे हैं वो आपके पास मिनिमम क्राइटेरिया से पार है या नहीं है मिनिमम क्राइटेरिया जरूरी नहीं है 50 पर होना चाहिए आपके पास 30 पर 20 10 पर आपके अपने अकॉर्डिंग यहां पर चूज कर सकते हैं मतलब अपने प्रोजेक्ट के अकॉर्डिंग आप यहां पे चूज कर सकते हैं तो बेसिकली सपोर्ट यहां पर क्या बता रहा है आपको कि आपका कौन सा प्रोडक्ट है जो सबसे ज्यादा बाय हुआ है यहां पे सेकंड सपोर्ट आपको ये भी बताता है यहां पे कि आपको कौन से दो प्रोडक्ट आपको साथ-साथ रखने चाहिए जैसे यहां पे बिकन और एक का देखें तो इसका सपोर्ट हमारे पास क्या मिल रहा है 3/6 मिल रहा है दैट इज 3 1 3 3 6 यहां पे एंड उसके बाद मैं इसका परसेंटेज निकालू यहां पे तो दैट आपके पास कितना आएगा यहां पे 50 पर आने वाला है इसका मतलब बकन और एक को एक साथ रखा जा सकता है राइट क्योंकि ये आपके पास यहां पे साथ-साथ बाय हो रहे हैं यहां पे अब सेकंड चीज यहां पे देखिए आप किसी और का भी सपोर्ट निकाल सकते हैं जैसे बन वर्सेस apple.ca का निकाल रहा हूं यहां पे तो देखिए बकन और का निकाले तो 2 1 2 2 * 3 6 आ रहा है और यदि मैं इसको डिवाइड करूं यहां पे तो 3 * 3 9 और 3 * 3 9 मतलब 33 ऑलमोस्ट 33 पर आपके पास आ रहा है यहां पे यस 33 पर आ रहा है यहां पे तो 33 पर मिनिमम सपोर्ट से कम है इसका मतलब हम बिकन और एल को एक साथ नहीं रख सकते पर्टिकुलर ट्रांजैक्शन के अंदर तो सपोर्ट हमें क्या बता रहा है यहां पे बेसिकली सपोर्ट एक तरीके से प्रोबेबिलिटी है यहां पे कि कोई भी प्रोडक्ट आपके पास कितनी बार बाय हो रहा है उसकी एक प्रोबेबिलिटी निकाल रहा है या कोई भी दो प्रोडक्ट एक साथ कितनी बार बाय हो रहा है उनकी प्रोबेबिलिटी आपको निकाल के है दैट सपोर्ट अब सपोर्ट के बाद में आता है कॉन्फिडेंस ओके कॉन्फिडेंस हमें क्या बता है यहां पे शोर्ट लाके देता है शर्टी किस तरह की यहां पे लेट्स हमने यहां पे क्या निकाला कि हमने देखा कि यहां पे बीकॉन एंड एग इनका सपोर्ट सबसे ज्यादा आ रहा है मतलब इन दोनों को पासपास रखना चाहिए लेकिन अभी हमें यहां पे क्या चाहिए यहां पे कि हम पहले बिकन को रखें या पहले ग को रखें मतलब गाइज यदि मैं यहां पे अरेंजमेंट के लिए चलूं तो मैं यहां पे एग के बाद बिकन रखूं या फिर बिकन के बाद मैं यहां पे एग रखूं ये कैसे फाइंड आउट होगा तो इसके लिए हमें चाहिए कॉन्फिडेंस कॉन्फिडेंस हमें एक्स्ट्रा यहां पे क्या करता है यहां पे सपोर्ट देता है मतलब एक्स्ट्रा आपको यहां पे कॉन्फिडेंस लाके देता है कि आपके पास जो दो प्रोडक्ट बाय हो रहे हैं उन दो प्रोडक्ट का अरेंजमेंट किस तरह से होना चाहिए e ब होना चाहिए या बी होना चाहिए ये आपको कौन लाके देगा आपको कॉन्फिडेंस लाके देगा अब ये कॉन्फिडेंस की वैल्यू निकाली कैसे जाती है तो देखिए कॉन्फिडेंस की वैल्यू आपके निकाली जाती है आपके पास सपोर्ट ऑफ x इंटरसेक्शन ऑफ y x इंटरसेक्शन ऑफ y मतलब x और y आपके पास साथ-साथ कब आय हुए हैं उसका आपको सपोर्ट चाहिए उसके बाद में आप किसके पास निकालने वाले हैं सपोर्ट ऑफ x यस आपको सपोर्ट ऑफ x निकालना है दैट इज अ इसे आप इस तरह से मान सकते हैं है दैट इज अ कंडीशनल प्रॉबिटी यदि आपने कंडीशनल प्रॉबिटी पढ़ी है तो वहां पे हमने ये बहुत अच्छे ढंग से क्लियर किया है कंडीशनल प्रॉबिटी क्या होता है x / y आपके पास होता है यहां पे आप क्या लिखते हैं p ऑफ आपके पास क्या होता है x इंटरसेक्शन ऑफ y होता है यहां पे देन p ऑफ आपके पास क्या आ जाता है y आ जाता है ये आपके पास क्या होता है गाइज यहां पे कंडीशनल प्रोबेबिलिटी होती है तो बेसिकली गाइज कंडीशनल प्रोबेबिलिटी के जैसे कंडीशनल प्रोबेबिलिटी आपके पास क्या होती है कॉन्फिडेंस होती है यहां पे कंडीशनल प्रोबेबिलिटी आपके पास क्या करती है कॉन्फिडेंस का रोल करती है यहां पे और इसके अंदर हम क्या निकाल रहे हैं यहां पे कि आप e के बाद b रखेंगे या b के बाद e रखने वाले हैं इसके थ्रू निकालते हैं दैट्ची डिवाइड बाय किसे कर देंगे यहां पे सपोर्ट ऑफ यहां पे मैं b की बात करूंगा ट्स इसके अंदर क्या होगा यहां पे सपोर्ट ऑफ e इंटरसेक्शन ऑफ b की बात हो गई यहां पे और सपोर्ट ऑफ मैं क्या करूंगा यहां पे e निकालू हगा इन दोनों की वैल्यू निकालूं और इन दोनों की वैल्यू में से जो आपके पा सबसे ज्यादा आएगी या फिर आप ये कह सकते हैं कि आपकी कॉन्फिडेंस की वैल्यू भी एक फिक्स होती है कॉन्फिडेंस की वैल्यू आपके पास फिक्स होती है लेट्स सपोज हमने 50 पर कॉन्फिडेंस की वैल्यू फिक्स कर है इसके अबोव यहां पे वैल्यू चली जाएगी हम उसको लेंगे आपके पास अरेंज में जैसे कि e के बाद b लेना है या b के बाद e लेना है ये चीज हमें निकालेगा तो कॉन्फिडेंस यहां पे क्या कर रहा है एक एक्स्ट्रा श्यर दे रहा है हमें यहां पे हमने जो प्रोडक्ट अरेंज किया है यहां पे वो किस तरह से होगा e या बी होगा या बी होगा ये आपको निकाल के देता है कॉन्फिडेंस अब बात करते हैं यहां पे लिफ्ट की लिफ्ट हमें क्या करता है लिफ्ट हमें यहां पे एक एक्स्ट्रा शर्टी और देता है यहां पे जो आपने दो प्रोडक्ट अरेंज किए हैं यहां पे वो दोनों प्रोडक्ट आपको साथ-साथ रखने चाहिए मतलब गाइज यहां पे एक सिंपल सा एग्जांपल देखके समझाता हूं मैं आपको कि साथ-साथ रखने का मतलब क्या हुआ यहां पे लेट्स यहां पे मान लीजिए कि आपका प्रोडक्ट ऑफ a है यहां पे और प्रोडक्ट ऑफ बी है आपने ये दो प्रोडक्ट आपके पास है यहां पे और आप यहां पे देखना चाहते हैं कि ये जो a के बाद में बी बाय हुआ है या नहीं हुआ है या a और b आपके पास इंडिविजुअल बाय हुए हैं यहां पे या फिर a और b के बीच में कोई रिलेशन है राइट जैसे आपको इस तरह की चीजें निकालनी है तो इसके लिए आप क्या करते हैं लिफ्ट का इस्तेमाल करते हैं देखिए जनरली क्या होता है यहां पे कि जब आप मार्केट बास्केट एनालिसिस निकालते हैं तो काफी ऐसे प्रोडक्ट होते हैं जो सबसे ज्यादा सेलिंग होते हैं लेट्स मैं मान लू यहां पे a सबसे मोस्ट सेलिंग प्रोडक्ट है उसके बाद b भी आपके पास क्या है मोस्ट सेलिंग प्रोडक्ट है अब हमने यहां पे सपोर्ट और कॉन्फिडेंस तो निकाला सपोर्ट और कॉन्फिडेंस निकालने पे हमें पता चला कि हां a के बाद b रखते हैं और b के बाद a रख सकते हैं लेकिन हमें अभी तक ये सिक्योरिटी नहीं मिली है कि जो आने वाले लोग हैं वो a के बाद बी को खरीद रहे हैं या नहीं खरीद रहे हैं मतलब आपके पास बिकन के बाद ए को खरीद रहे हैं या नहीं खरीद रहे ये शयो टी अभी तक नहीं मिली है देखिए मोस्ट ऑफ द पीपल ऐसे होंगे जो ए के बाद बी को खरीद रहे होंगे लेकिन मोस्ट ऑफ द पीपल ऐसे होंगे जो ए के बाद बी को खरीद ही नहीं रहे होंगे बी को इंडिविजुअली बाय कर रहे होंगे और ए को भी इंडिविजुअली बाय कर रहे होंगे तो इस चीज के बारे में हमें एक्स्ट्रा श्योर कौन देगा इस चीज के बारे में एक्स्ट्रा श्योर आपको लिफ्ट देने वाला है तो लिफ्ट का काम क्या होता है गाइ यहां पे कि a के बाद b प्रोडक्ट बिका है या नहीं बिका है मतलब a के साथ बिका है या a से अलग बिका है ये चीज आपको यहां पे लिफ्ट बताता है अब ये लिफ्ट कैसे बताता है तो लिफ्ट के लिए आपको क्या करना पड़ता है सपोर्ट ऑफ a और b एक साथ निकालते हैं फिर सपोर्ट ऑफ ए और सपोर्ट ऑफ b आप दोनों को अलग-अलग निकाल के डिवाइड करते हैं तो यहां पे लिफ्ट की वैल्यू आती है ये लिफ्ट की वैल्यू आपके पास क्या होती है गाइज यहां पे ग्रेटर दन 1 लेस दन व और इक्वल ट 1 आती है अब देखिए ग्रेटर दन व यदि आपके पास लेफ्ट की वैल्यू आ रही है इसका मतलब श्यर है यहां पे कि कोई पर्स a प्रोडक्ट को खरीद रहा है यहां पे तो उसके साथ-साथ वो ब प्रोडक्ट को भी खरीद रहा है मतलब ये दोनों प्रोडक्ट आपके पास क्या हो रहा है साथ-साथ बाय किए जा रहे हैं लेकिन यदि मैं बात करूं लिफ्ट आपके पास वैल्यू लेस दन आपके पास वन आ जाती है यस वन से छोटी आ जाती है यहां पे तो इसका मतलब क्या हो रहा है यहां पे कि ये दोनों मोस्ट सेलिंग प्रोडक्ट तो है लेकिन ये दोनों साथ-साथ नहीं बाय हो रहे हैं मतलब ये इंडिविजुअल बाय हो रहा है और ब इंडिविजुअल बाय हो रहा है लेकिन मोस्ट सेलिंग प्रोडक्ट है यहां पे तो आप इनको साथ-साथ नहीं रखेंगे बेसिकली लिफ्ट इ ट 1 का मतलब है यहां पे कि यहां पर कोई एसोसिएशन नहीं है मतलब आपके पास यहां पे इन दोनों की जगह कोई ऐसा तीसरा प्रोडक्ट हो सकता है जो कि इसको रिप्लेसमेंट कर सकता है मतलब आपके पास a और बी को आप पासपास रखेंगे तो उससे कोई अ दिक्कत नहीं होगी यहां पे लेकिन ये आपके पास यहां पे सेपरेटली यहां पे बात करें कि यहां पे कोई एसोसिएशन नहीं है मतलब यहां पे इसकी जगह दूसरा प्रोडक्ट रिप्लेसमेंट किया जा सकता है तो गाइस लिफ्ट हमें क्या करता है एक एक्स्ट्रा इंश्योरिटी देता है यहां पे कि आपके पास जो दो प्रोडक्ट है साथ बाय हो रहे हैं या नहीं हो रहे हैं ये आपको इंश्योर करता है तो आई थिंक आई होप सो समझ में आया होगा कि आपके पास लिफ्ट सपोर्ट एंड कॉन्फिडेंस कैसे वर्क करते हैं अब इन तीनों के ऊपर हमारे पास क्या करती है हमारी एल्गोरिथम्स वर्क करती है ये एल्गोरिथम्स अलग-अलग तरीके से वर्क करती है तो इसके लिए कौन-कौन से एल्गोरिथम्स हैं यहां पे हम जो एल्गोरिथम्स यूज़ करते हैं दैट इज अपयोरी ई क्लट एंड एफ ग्रो ये तीन तरह के एल्गोरिथम्स एसोसिएशन लर्निंग के अंदर इस्तेमाल होती है यहां पे इन तीन एल्गोरिथम के थ्रू हम ये निकालते हैं कि हमारे पास जो मोस्ट सेलिंग प्रोडक्ट है वो कौन सा है और उसके बाद उसके साथ-साथ कौन सा प्रोडक्ट बाय हो रहा है ये चीजें हम यहां पे निकालते हैं अब इसका इस्तेमाल कहां-कहां किया जाता है तो इसका इस्तेमाल की बात करें तो मार्केट बक्स एनालिसिस के अंदर किया जाता है मेडिसिन के अंदर किया जाता है आपका यहां पे और आज के इस वीडियो के जरिए हम बात करेंगे अपयोरी एल्गोरिथम के बारे में देखिए कैसे वर्क करती है इसको जरा समझते हैं यहां पे यदि आपको पाइथन मशीन लर्निंग डाटा साइंस एंड डेटा एनालिस जैसी फील्ड में अपने आपको को ग्रो करना है तो इसके लिए डस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जवाइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिया गया कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो देखिए हमारे पास यहां पे एक डेटा सेट है यहां पे बेसिकली मतलब एक ट्रांजैक्शन सेट्स है यहां पे जिसके अंदर हमने क्या कर रखा है t1 t2 t3 t4 के तौर पे यहां पे जितने भी ट्रांजैक्शन हुए हैं वो दिखे यहां पे और यहां पे आइटम के नाम लिख रखे हैं अब जैसे आप बाजार में जाते हैं तो आइटम क्या लेके आते हैं ब्रेड बटर मिल्क वगैरह ये लेके आते हैं ना यहां पे ये कुछ आइटम्स के नाम लिख रहे हैं जो कि यहां पे बाय हुए हैं यहां पे अब हमें यहां पे ये समझना है कि ये किस तरह से यहां पे वर्क करती है और किस तरह से यहां पे प्रोडक्ट का आइटम सेट्स निकालती है वो वो हमें देखना है यहां पे अब कैसे निकालेंगे यहां पे तो सबसे पहले हमें क्या करना पड़ेगा सबसे पहले हमें यहां पे मिनिमम सपोर्ट एंड मिनिमम कॉन्फिडेंस डिसाइड करना पड़ेगा तो देखिए मैं क्या कर रहा हूं यहां पे हमारे पास जो सबसे यहां पे मिनिमम जो आपका सपोर्ट है मैं वो डिसाइड कर रहा हूं यहां पे और ये जो मिनिमम सपोर्ट है दैट मैं डिसाइड कर रहा हूं दैट इ 50 ओके और मैं कॉन्फिडेंस की बात करूं यहां पे यस मैं कॉन्फिडेंस की बात करूं तो कॉन्फिडेंस भी मैंने डिसाइड कर रखा है यहां पे 50 पर ये भी हमारे पास क्या है मिनिमम कॉन्फिडेंस है इससे ज्यादा होगा तो हम साथ में लेंगे नहीं तो नहीं रहेंगे यहां पे अब ये डिसाइड करने के बाद में अब हमें क्या करना है हमें सबसे पहले सबसे पहला जो काम होता है गाइज यहां पे वो हमें इंडिविजुअल प्रोडक्ट का सपोर्ट निकालना पड़ेगा क्यों हमें यहां पे जो लेस बाय प्रोडक्ट है उनको बाहर निकालना पड़ेगा और जो सबसे फ्रीक्वेंसी डी लिख देता हूं और जिसमें जो जो होगा उनको कंसीडर कर लेंगे और जो नहीं होगा उन्हें आउट ऑफ करते रहेंगे ठीक है तो मैं यहां पे ए बी सी लिख देता हूं जस्ट ए सी डी ई एफ जी एच आई जे के एल एम एन ओ पी क्यू आर एस टी यू वीड एक वा एंड z ओके तो मैंने यहां पे अल्फाबेटिक ऑर्डर पे लिख दिया है क्योंकि बहुत सारे अल्फाबेट्स है यहां यहां पे तो मैंने अल्फाबेटिक ऑर्डर पे लिख दिया है और हम क्या करेंगे यहां पे इनके सपोर्ट निकालते रहेंगे चलिए सबसे पहले a का सपोर्ट निकालते हैं दैट a आपके पास क्या है वन टाइम्स आया यहां पे देखिए यहां पे पहली रो में भी नहीं है दूसरे में भी नहीं है तीसरे में भी नहीं है चौथे में नहीं है पांचवे में है तो टस अ वन टाइम आया है यहां पे अच्छा वन टाइम आया है कितने में 4f ट्रांजैक्शन के अंदर देस अ 1/5 एंड 1/5 * मल्टीप्लाई बाय आप 100 करेंगे तो 5 * 2 10 मतलब 20 पर आपके पास आएगा दज अ मिनिमम सपोर्ट से ये क्राइटेरिया पार नहीं कर रहा है यहां पे इसका मतलब क्या है हम इस a प्रोडक्ट को यहां से एलिमिनेट कर देंगे क्योंकि प्रोडक्ट हमें नहीं लेना है देन अ बात करें यहां पे बी प्रोडक्ट के बारे में तो देखिए बी प्रोडक्ट यहां पे यूज़ ही नहीं हुआ है तो हम b को हटा देंगे देन सी प्रोडक्ट के बारे में बात करेंगे तो देखिए c यहां यूज़ नहीं हुआ है c यहां पे भी यूज़ नहीं हुआ है c यहां यूज़ हुआ है यहां यूज़ हुआ है और कहीं नहीं यूज़ हुआ है मतलब ये क्या हो रहा है टू टाइम्स यूज़ हो रहा है देन 2/5 * मल्टीप्ला बा 100 करेंगे यहां पे तो 5 * 2 10 मतलब 20 ले लू यहां पे एगजैक्टली तो 2 * 2 कितना हो गया फर मतलब 40 पर यहां पे आया है तो c को भी हम एलिमिनेट करेंगे क्योंकि c आपका क्या है 40 टाइम 40 पर आया मतलब फोर टाइम आया चलिए एक काम करते हैं यहां पे साइड में मैं लिखता भी रहूंगा ताकि आप लोगों को कंफ्यूजन ना हो तो a हमारे पास वन टाइम आया है एंड सी हमारे पास कितना आ रहा है टू टाइम आया है अब बात करेंगे डी के बारे में देखिए डी के बारे में बात करें तो फर्स्ट टाइम नहीं है देन सेकंड टाइम की बात करें तो वन टाइम है एंड यहां पे भी नहीं है यहां पे भी नहीं है यहां पे भी नहीं है इसका मतलब डी को भी एलिमिनेट करने की जरूरत है क्योंकि डी जो है आपके पास यहां पे ओनली फॉर वन टाइम आया है यहां पे अच्छा अब बारी है e की देखिए e वन टाइम टू टाइम एंड यहां पे नहीं है द थ्री एंड देन फोर तो फोर टाइम आया और फोर टू जाता है आपका सिक्स मतलब आपका 60 पर आने वाला है तो e का यदि मैं यहां पे प सपोर्ट निकालूं दैट आपके पास कितना आएगा 60 पर आने वाला है क्योंकि दैट अ कमिंग ऑफ फोर टाइम यस ये कितना आया फोर टाइम आपके पास आया e के बाद आप एफ की बारी है यहां पे देखिए एफ निकाल यहां पे तो एफ यहां पे यूज ही नहीं हुआ है चलिए अब बात करें जी के बारे में तो ये देखिए जी इन सभी के अंदर कहीं नहीं यूज़ हुआ है तो बेसिकली जी भी एलिमिनेट हो जाएगा अब बारी है किसकी h के बारे में तो देखिए यहां यूज़ नहीं हुआ यहां पे भी यूज़ नहीं हुआ यहां यहां कहीं नहीं यूज़ हुआ है तो h भी एलिमिनेट हो जाएगा उसके बाद है i की बारी देखिए i कितनी बार आया है यहां पे यहां यूज़ नहीं हुआ है यहां भी यूज़ हुआ है यहां नहीं हुआ है यहां नहीं हुआ है यहां नहीं हुआ है तो इसका मतलब आई भी हमारा एलिमिनेट हो जाएगा दैट अ वन टाइम यूसेज है केवल यहां पे जे की बात करें तो जे इन पूरे में कहीं पे भी यूज नहीं हुआ है तो मैं इनको भी बाहर निका लूंगा अब आरही है k की देखिए k वन टाइम टू टाइम थ्री टाइम फोर टाइम और फाइव टाइम फाइव टू फाइव टाइम आया इसका मतलब इसका 100% सपोर्ट निकलने वाला है तो k हमारे पास कितना टाइम आया फाइव टाइम आया है तो मैं इसको यहां रख लूंगा चलिए उसके बाद है आपका एल एल के बारे में बात करें यहां पे तो देखिए एल भी यहां पे कहीं यूज नहीं हुआ है अब आरही है ए की देखिए m की बात करें तो देखिए वन टाइम यूज हुआ है यहां नहीं यूज हुआ है यहां यूज़ हुआ है यहां नहीं यूज़ हुआ है यहां यूज़ हुआ है दैट इ द थ्री टाइम 3 * 2 6 इज द 60 तो m को क्या करेंगे हम यहां पे थ्री टाइम यूज़ हुआ है दैट यहां रख लेंगे अब आ है m के बाद में n की देखिए वन टाइम यूज़ है टू टाइम यूज है यहां नहीं यूज है यहां पे भी यूज नहीं है यहां पे भी यूज़ नहीं है इसका मतलब n कितनी बार हुआ है यूज टू टाइम हुआ है एंड टू टाइम होने की वजह से एलिमिनेट हो गया है तो एंड यहां पे टू टाइम आ गया चलिए अब बारी है o की देखिए o की बात करें वन टाइम टू टाइम एंड थ्री टाइम यूज़ हुआ है देन ओ की बाद बात करें तो थ्री टाइम यूज़ हुआ यहां पे चलिए ओ के बाद अब बा आ है किसकी p की तो अ देखिए यहां पे p यूज ही नहीं हुआ है देन बात करें यहां पे q की बात करें तो देखिए q भी यहां पे यूज नहीं हुआ है देन r की बात करें तो आ देखिए यहां नहीं हुआ यहां पे भी नहीं हुआ यहां पे भी नहीं हुआ यहां पे भी नहीं हुआ देन हट गया यहां पे एस की बात करें तो देखिए यहां यूज नहीं हुआ एस यहां पे भी एस यूज नहीं हुआ है यहां पे भी नहीं हुआ है यहां पे भी नहीं हुआ है यहां पे भी नहीं हुआ t की बात करें देन t भी एलिमिनेट हो जाएगा बारे में अब बारी है यहां पे य की देखिए यू यहां पे भी नहीं हुआ यहां पे भी नहीं हुआ यहां पे भी नहीं हुआ यहां पे भी नहीं हुआ यहां पे भी नहीं हुआ मतलब किसी में यू इस्तेमाल ही नहीं हु हुआ है तो अब बारी है v की तो v की देख लेते हैं यहां पे तो v यहां पे इस्तेमाल ही नहीं हुआ है यहां पे बात करें डब् के बारे में तो w भी यहां पे नहीं इस्तेमाल हुआ है तो इसे भी हम हटा देते हैं यहां पे एंड बात करें x के बारे में तो देखिए x के बारे में देखेंगे तो x भी यहां पे नहीं इस्तेमाल हुआ है y इस्तेमाल हुआ है दैट अ थ्री टाइम तो मैं y की वैल्यू लूंगा यहां पे थ्री टाइम ओके एंड z की बात करें तो z इस्तेमाल ही नहीं हुआ है तो ये हमारे कुछ प्रोडक्ट आए हैं जो कि हमारे पास क्या है गाइज यहां पे इस तरह से बाय हो रहा है अब देखिए मैं इन प्रोडक्ट को सभी को एलिमिनेट कर रहा हूं रीजन क्या है यहां पे कि इनका सपोर्ट यदि हम निकालेंगे तो वो आपके पास क्या आने वाला है 50 पर से कम आने वाला है और हमने मिनिमम सपोर्ट क्या मान रखा है यहां पे मिनिमम सपोर्ट 50 पर मान रखा है तो इसका मतलब क्या हुआ गाइज यहां पे कि हमें यही प्रोडक्ट लेने है जो 50 पर से ऊपर है 50 पर से नीचे वाले प्रोडक्ट हमें नहीं लेने है तो दैट्ची y आपके पास हो गया यहां पे अब मैं इनको क्या करूंगा अरेंज करूंगा यहां पे सिस्टमैटिक वे के अंदर अरेंज करना है दैट अ क्या करना है यहां पे k लेना है सबसे पहले क्योंकि सबसे ज्यादा बा वाला प्रोडक्ट यही है उसके बाद आपको क्या करना है यहां पे e लेना है e के बाद में आप क्या कर सकते हैं यहां पे m ले सकते हैं ओ ले सकते हैं और y ले सकते हैं तो ये हमारे प्रोडक्ट आ चुके है जबकि इनके नंबर में लिख देता हूं यहां पे इसका फाइव है यहां पे देन फोर है यहां पे एंड थ्री है इसका भी थ्री है एंड इसका भी थ्री है तो ये प्रोडक्ट हमारे पास आ चुके हैं अभी तक हमने क्या किया है हमारे पास मोस्ट बाइंग प्रोडक्ट जो है वो हमने निकाले यहां पे अब सेकंड टारगेट क्या होगा गाइज यहां पे सेकंड टारगेट हमारे पास ये होगा कि अब इनको अरेंज कैसे करना है तो इनको अरेंज करने के लिए हम क्या करेंगे दो-दो के पेयर बनाएंगे अब दो-दो के पेयर किस तरह से बनाने हैं तो देखिए सबसे पहले मैं क्या करूंगा इस के का प्रोर बनाऊंगा उसके साथ-साथ k ए का भी पेयर बनाऊंगा और उसके बाद मैं क्या करूंगा k का भी पेयर बनाऊंगा और उसके बाद मैं क्या करने वाला हूं गाइ यहां पे k y का पेयर बनाऊंगा ये तो हो गया हमारे पास k के साथ पेयरिंग अब हमारे पास e की पेयरिंग हो गई मतलब हम क्या कर रहे हैं इनके इसके साथ पेयरिंग कर रहा हूं मैं इसकी इसके साथ पेयरिंग कर रहा हूं इसकी इसके साथ पेयरिंग कर रहा हूं और इसकी इसके साथ पेयरिंग कर रहा हूं अब हम इसकी बायंग निकालेंगे सेकंड हमें इसके साथ-साथ e और आपका पेयरिंग बनानी है m की भी बनानी है और उसके बाद में ओ की भी निकालनी है और e वा की भी पेयरिंग निकालनी है अच्छा इसके साथ-साथ हमें यहां पे क्या करना है m की भी पेयरिंग निकालनी है और m की भी पेयरिंग निकालनी है एंड o y की भी पेयरिंग निकालनी है तो अब हमें क्या करना है इनके भी यहां पे क्या करना है सपोर्ट निकालने है और चलिए सपोर्ट निकाल देते हैं इनके भी यहां पे तो देखिए के को देखना है तो के एक बार आया है यहां पे के दो बार आया है यहां पे और यहां पे के का इस्तेमाल नहीं है यहां पे भी के आया है यहां पे भी के है मतलब ये फोर टाइम आया आपके पास यहां पे तो इसे हमें तो रखना ही है यहां पे अब बारी है यहां पे k ए की चलिए देखिए k ए एक बार है यहां पे k और m यहां नहीं है k और m यहां पे भी है यहां नहीं है और यहां है मतलब थ्री टाइम आया है यहां पे तो इसको भी हम रखेंगे अब बारी है यहां पे k की देखिए k यहां पे भी है k यहां पे भी है k नहीं है और k यहां पे भी है मतलब ये भी है थ्री टाइम्स की तो इसे रखेंगे उसके बाद हमारे पास क्या है गाइज यहां पे उसके बाद है k y यस अब हमारे पास है k देखिए ky1 बार है k दूसरी बार है k y हमारे पास तीसरी बार है यहां पे केवा और केवा ने इस्तेमाल किया मतलब थ्री टाइम यूज़ किया है तो मल हमें इन सब को रखना पड़ेगा क्योंकि मिनिमम सपोर्ट के क्राइटेरिया से ये अबोव है मिनिमम सपोर्ट का क्राइटेरिया मान लीजिए लेस ब तीन है मतलब थ्री के आसपास है यहां पे ये मान लीजिए आप राइट चलिए अब बात करते हैं यहां पे ईम के बारे में यस ईम की बात करें यहां पे तो देखिए ई और एम की बात करें तो दैट ईम एक बार है यहां पे मम यहां नहीं है ईम यहां नहीं है ई यहां नहीं है m यहां पे है तो ईम आपके पास कितने ब टाइम आया टू टाइम आया इसका मतलब क्या हुआ हम इनको तो साथ नहीं रख सकते देखिए यहां नहीं रख सकते देखिए e और ए आपके पास दो बार ये है तो ये साथ है नहीं हमारे पास तो मैं इस प्रोडक्ट को बाहर ही निकालू हगा राइट मतलब इनको सपोर्ट से बाहर है तो बाहर निकालेंगे अब क्या करेंगे ओ निकालेंगे तो ओ वन टाइम ओ टू टाइम एंड ओ थ्री टाइम्स मतलब ओ हमारा थ्री टाइम्स आया है ट्स ये हमें रखना पड़ेगा देन अब बारी है यहां पे ईवा की दैट्ची के लिए दैट व्हाई वन टाइम एंड यहां पे नहीं यूज़ हुआ है यहां पे भी नहीं यूज़ हुआ है यहां पे भी नहीं यूज़ हुआ है और यहां पे भी यूज़ नहीं हुआ है तो बेसिकली वन टाइम है तो उसे तो डेफिनेटली हटाना पड़ेगा यहां पे एवा की बात करें तो ट्स वन टाइम यहां पे नहीं इस्तेमाल हुआ है यहां पे इस्तेमाल हुआ है यहां फिर से नहीं हुआ है और यहां से नहीं हुआ है तो कितनी बार हुआ है टू टाइम हुआ है तो बेसिकली हम इसे एलिमिनेट ही करेंगे अब बात ये है यहां पे ओ की तो देखिए o वन टाइम है ओवा टू टाइम है एंड यहां पे है ही नहीं और यहां पे तो ऑलवेज नहीं है तो टू टाइम है तो इसे भी हटाना पड़ेगा तो हमारे पास नेक्स्ट मोस्ट फ्रीक्स बाय प्रोडक्ट हमारे पास आ चुका है दैट इज अ केई आपके पास आ गया k एम भी आ चुका है के भी आ चुका है केवा भी आ चुका है और इसके बाद ओ भी आ चुका है देन मैं प्रोडक्ट लिख लेता हूं यहां पे के आपके पास फोर टाइम है और फिर उसके बाद है k ए आपके पास कितना है थ्री टाइम्स है यहां पे फिर उसके बाद यहां पे बात करें के जो है आपके पास यहां पे वो थ्री टाइम्स है केवा आपके पास हो गया आपका थ्री टाइम्स हो गया और ओ आपके पास क्या हो गया थ्री टाइम्स हो गया अब हमें क्या करना है नेक्स्ट बाय प्रोडक्ट निकालना है मतलब हमने दो प्रोडक्ट तो एक साथ साथ निका लिए हम तीन प्रोडक्ट भी साथ निकाल सकते हैं इसके लिए हमें क्या करना पड़ेगा देखिए के आपके पास एक बन चुका है अब हमें क्या करना पड़ेगा गाइ यहां पे नेक्स्ट आपका जो टारगेट रहेगा वो तीन-तीन का पेयर का साथ रहेगा अब ये तीन-तीन का पेयर कैसे बनाना है अब वो जरा देख लेते हैं यहां पे देखो के तो आपके पास आ ही चुका है यहां पे के के साथ आप क्या जोड़ेंगे m को भी जोड़ेंगे केई के साथ आप ओ को भी जोड़ेंगे केई के साथ यस यहां पे क्या करेंगे केई के साथ आपको क्या करना है वा को भी ऐड ऑन करना है और इनके सपोर्ट निकालने है चलिए निकालते हैं यहां पे कि इनमें से कौन यहां पे बेस्ट आने वाला है तो देखिए के आपके पास ये रहा के आपके पास एक और ये रहा एंड के आपके पास एक और ये रहा एंड के आपके पास एक और ये रहा तो चार बार के है यहां पे अब के के साथ m निकालते हैं देखिए m एक बार आया यहां पे m यहां पे नहीं यूज़ हुआ है ए यहां पे भी यूज नहीं हुआ है ए यहां पे यूज हुआ है मतलब ये टू टाइम आपके पास आ रहा है अच्छा ओ के बारे में बात करें तो देखिए एक बार आया है दो बार आया है और तीन बार आया है तो बस ये तीन बार आ चुका है उसके बाद में देखिए के के साथ y की बात करें तो देखिए वन टाइम आया है टू टाइम्स आया है यहां पे और टू टाइम्स ही आया ओनली फॉर यहां पे तो टू टाइम्स आ गया इसका मतलब आपके मिनिमम सपोर्ट कटेया को कौन ऊपर ले जा रहा है ट्स मिनिमम साइड पर क्राइटेरिया से ऊपर आपका केइओ ले जा रहा है मतलब आप क्या करेंगे केइओ प्रोडक्ट को एक साथ रखेंगे मतलब फर्स्ट k फिर देन e एंड देन o अब यहां पे आपको रुकना नहीं है क्यों क्योंकि अभी तक तो आपने ये तीन प्रोडक्ट एक साथ जितने बाय हुए हैं ये आपने निकाले हैं अब आपको क्या निकालना है इनका कॉन्फिडेंस निकालना है के का कॉन्फिडेंस निकालना है और े का भी कॉन्फिडेंस निकालना है मतलब पहला प्रोडक्ट आपके पास के आएगा या े आने वाला है आई डोंट नो आपको ये निकालना पड़ेगा कि कौन यहां पे आने वाला है तो इसके लिए हम क्या जाएंगे कॉन्फिडेंस के ऊपर जाएंगे तो आपको यहां पे प्रोडक्ट तो मिल गया दैट द प्रोडक्ट इज़ केइओ राइट अब लेकिन हमें ये यहां पे डिसाइड करना है कि कौन सा किसके बाद आने वाला है तो देखिए केइओ आपके पास आया है अ तो इसके अंदर के भी निकालेंगे और ई के भी निकालेंगे तो मैं बस a का निकालने जा रहा हूं कि a का कॉन्फिडेंस कैसे निकलने वाला है देन फिर फर्द आप निकाल सकते हैं आगे राइट और अपना बेस्ट सेलिंग प्रोडक्ट निकाल सकते हैं चलिए देखिए यहां पे बात करें तो किस तरह से निकालेंगे तो देखिए देखिए के आपके पास एक बार है के दो बार है और के आपका तीन बार है और के आपका क्या है चार बार है तो बेसिकली यदि मैं कॉन्फिडेंस निकालूं यस के का यदि मैं कॉन्फिडेंस निकालूं तो ये क्या आ रहा है फोर बार आ रहा है अब यहां पे मुझे क्या निकालना है e का डिवाइड करना है देखिए e कितनी बार आया है वो खा डिवाइड कर लेते हैं तो देखिए e जो आपके पास आया है वो फोर टाइम आया है तो 4/4 * आपके पास 100 करेंगे तो आपके पास क्या आ रहा है यहां पे 100% आपके पास आ रहा है यस ये आपके पास क्या आ रहा है 100% आ रहा है 4/4 है यहां पे राइट अब देखिए नकाल हैं कि ै आने वाला है तो देखिए ारे में बात करें यहां पे तो े आपके पास क्या आ रहा है देखिए e के मतलब e और के कितनी बार आ रहा है वन टाइम टू टाइम ए थ्री टाइम एंड फोर टाइम ये आ रहा है देखिए हमने यहां पे डाउन भी कर रखा है दैट फोर आ गया अब डिवाइड बाय क्या करना है k निकालना है मतलब हम बेसिकली क्या निकाल रहे हैं आप यहां पे प्रोबेबिलिटी ऑफ यहां पे निकाल रहे हैं बेसिकली k के सेलिंग प्रोडक्ट देन e और यहां पे प्रोबेबिलिटी निकाल रहे हैं यहां पे देन e सेलिंग ऑफ आपके पास k या e सेरिंग ऑफ k ये निकाल हम यहां पे चलिए फॉर्मूला भी देख लेते हैं यहां पे फॉर्मूला क्या है यहां पे तो मैं आपको थोड़ा फार्मूला विजिट करा रहा हूं यहां पे किसका आपके पास कॉन्फिडेंस का देखिए कॉन्फिडेंस का जो फॉर्मूला है यहां पे वो क्या है आपके पास यहां पे आपके पास p y ऑफ x यहां पे है a इंटरसेक्शन ऑफ b है अब देखिए जो नीचे आता है यहां पे वो आपका डिवाइड आता है मतलब बाद में जो आ रहा है उसका डिवाइड करना होता है राइट तो हम भी वही कर रहे हैं यहां पे चलिए तो अब यहां पे देख लेते हैं कि ये कैसे आ रहा है और किस तरह से आ रहा है देखिए तो मैंने यहां पे क्या निकाला है यहां पे e के साथ निकाला है ट 4/4 एंड e / k निकाला है यहां पे तो मतलब यहां पे क्या आएगा k नीचे आएगा k कितना है यहां पे फाइव है यहां पे एंड मल्टीप्लाई बा 100 करूंगा यहां पे और एक बार मैं मल्टीप्लाई बाय 100 यहां पे करूंगा देखिए इसका यहां पे डिवाइड कर रहा है तो ये कितना आ रहा है 100% यहां पे आ रहा है राइट यहां पे कितना आ रहा है देखिए 4/4 आपके पास व 100% आ गया अब इसका देख लेते हैं यहां पे 5 * 1 5 5 * 2 10 20 और 4 * 2 8 80 पर आ रहा है इसका मतलब क्या हुआ गाइज यहां पे इसका मतलब डेफिनेटली है कि फर्स्ट प्रोडक्ट आपका k आएगा देन सेकंड प्रोडक्ट आपका पास e आएगा इसी तर से आप o का भी निकाल सकते हैं मतलब ओ के अंदर o e आएगा या ओ आने वाला है ये चीज निकालने के लिए फिर आप फिर से क्या करेंगे कॉन्फिडेंस निकालेंगे यहां पे दैट इस तरह से आपके पास क्या निकलता है कॉन्फिडेंस निकलता है और कॉन्फिडेंस और सपोर्ट के हेल्प से हमने अपयोरी एल्गोरिथम के अंदर क्या निकाला टर्म्स निकाला यहां पे मतलब वो प्रोडक्ट निकाले जो आपके पास यहां पे अरेंज होंगे तो सबसे पहला प्रोडक्ट क्या होगा k आएगा देन सबसे सेकंड प्रोडक्ट e आएगा एंड थर्ड प्रोडक्ट आपके पास ओ आने वाला है इस तरह से आपका जो डाटा है वो यहां पे अरेंज होने वाला है और आज के इस वीडियो के जरिए हम बात करने वाले हैं अपयोरी एल्गोरिथम के बारे में और उसके प्रैक्टिकल इंप्लीमेंटेशन के बारे में चलिए सबसे पहले हम एक काम करते हैं हम डेटा सेट को देखते हैं डेटा सेट का ऑब्जर्वेशन लेते हैं एंड देन उसके ऊपर कैसे वर्क करना है वो अब हम समझते हैं तो मैं ले चलता हूं आपको डेटा सेट के ऊपर तो देखिए मेरे पास एक डेटा सेट है जो कि एक गॉस डेटा सेट है यहां पे जो कि आपके पास क्या हो रहा है कि किसी भी गॉस स्टोर्स के अंदर कौन-कौन से प्रोडक्ट बाय हुए हैं यहां पे उसके बारे में डिटेल्स दे रखी है हाईएस्ट टू हाईएस्ट यहां पर 11 प्रोडक्ट बाय हो रखे हैं जो कि हमें यहां पर बता रहा है यहां पे इसके साथ-साथ कौन से प्रोडक्ट किस-किस तरह से बाय हुए हैं वो सारी की सारी डिटेल्स यहां पर लिखी हुई है कि कौन सा पर्सन क्या बाय करके जा रहा है ऐसे हमने काफी डाटा सेट इकट्ठा कर रखा है एक मतलब मान लीजिए एक मॉल का डटा सेट है यहां पे और ये अराउंड हमारे पास कितना है 9000 के आसपास डाटा यहां पर देखने को मिला है अब हम क्या करने वाले हैं इस डेटा सेट के ऊपर वर्क करेंगे और इस डेटा सेट के ऊपर हम यहां पर फ्रीक्वेंसी बाय प्रोडक्ट जो कौन सा है वो निकालेंगे इसके साथ-साथ पहला प्रोडक्ट के साथ दूसरा प्रोडक्ट कौन सा एसोसिएट है ये भी हम फाइंड आउट करेंगे यूजिंग अ प्यूरी एल्गोरिथम के थ्रू चलिए तो जरा इसे समझते हैं ये कैसे वर्क करता है तो इसके लिए मैं ले चलता हूं आपको जुपिटर नोटबुक के ऊपर जहां पे हम ये काम करने वाले हैं सबसे पहले हम यहां पे जो रिक्वायर्ड लाइब्रेरी है उसे इंपोर्ट करते हैं जस्ट लाइक अ पांडा एलियाज ऑफ पीडी यस पांडा को इंपोर्ट करते हैं यहां पे ताकि हम अपने डेटा सेट को लोड कर सके तो मैं डेटा सेट को लोड करने के लिए पडी डरी सीएसवी का इस्तेमाल करने वाला हूं जहां पे मैं ग सरीज के नाम से मेरे पास जो डेटा सेट है उसे मैं लोड कर रहा हूं अब यदि मैं डेटा सेट को देखूं यहां पर डेटा सेटड हैड लगा के इसके अंदर तीन डाटा देखूं तो मुझे कुछ इस तरह से डेटा सेट मुझे दिखाई देता है अब इस डेटा सेट के अंदर देखिए हमारे पास आइटम्स है आइटम वन आइटम टू आइटम थ्री दे रखे है यहां पे कुछ नैन वैल्यू भी यहां पर दे रखी है फर्स्ट ऑफ ऑल हमारा यहां पे क्या टारगेट होगा कि ये जो नैन वैल्यू है इन नैन वैल्यू को हम हटाएं मतलब हम नैन वैल्यू को क्या करना चाहते हैं रिमूव करना चाहते हैं पहला हमारा टारगेट यहां पे होगा अब नैन वैल्यू को रिमूव करने के लिए आप ऐसा ना करें कि मतलब मिसिंग वैल्यू को फिल कर लें ना इसके अंदर हमें क्या करना पड़ेगा थोड़ा सा हमें चेंजेज करना पड़ेगा यहां पर हमें लिस्ट ओवर लिस्ट का इस्तेमाल करना पड़ेगा मतलब मुझे क्या करना पड़ेगा एक लिस्ट बनानी पड़ेगी जस्ट लाइक अ मार्केट लिस्ट के तार पे और उसके अंदर हमें एक और लिस्ट बनानी पड़ेगी जस्ट लाइक अ कस्टमर लिस्ट यस ये कस्टमर क्या क्या प्रोडक्ट बाय करके गया है जैसे a प्रोडक्ट बाय किया है बी प्रोडक्ट बाय किया है ये लिस्ट हमें तैयार करनी पड़ेगी देन जो दूसरा कस्टमर है वो क्या बाय करके गया है जस्ट लाइक ए प्रोडक्ट बाय करके गया है सी प्रोडक्ट बाय करके गया है वो लिस्ट हमें यहां पे बनानी पड़ेगी क्यों बनानी पड़ेगी इससे हमारे पास क्या होगी ये जो नैन वैल्यू है जितनी भी ये सारी हमारे पास रिमूव हो जाएगी मतलब ये नैन वैल्यू हमारे पास यहां पर एक भी देखने को नहीं मिलेगी तो बेसिकली गाइज हमें यहां पर सबसे पहला जो वर्किंग करना है इस नैन वैल्यू को यहां से हटाना है और हमें क्या करना है एक परफेक्टली लिस्ट तैयार करनी है जो कि आपके पास लिस्ट ओवर लिस्ट के तौर पे होनी चाहिए अब ये लिस्ट ओवर लिस्ट कैसे बनेगी जरा उसको समझते हैं यहां पे राइट तो सबसे पहले मुझे क्या करना है कि ये जो आइटम है यस आइटम वन आइटम टू आइटम थ्री ये जो नाम है वो लेके आने हैं यहां पे ये कैसे ला सकते हैं तो आप डेटा सेट के पास जाइए दैट यहां पर जाके क्या करेंगे कॉलम्स को कॉल करेंगे तो आपके पास जितने भी कॉलम के नेम हैं वो आपके पास यहां पे आ जाएंगे देन अब मुझे क्या करना है गाइज यहां पे ये क्राइसिस फूड की जरूरत है ये क्राइसिस फूड कैसे आएगा तो मैं डेटा सेट के पास जाऊंगा यहां पर और मैं जाके क्या करूंगा आइटम वन को कॉल करूंगा एंड देन स्क्वायर बैकेट ऑफ ज़ीरो लगाऊंगा यहां पर तो देखिए मेरे पास ये जो क्राइसिस फूड है वो देखने को मिल जाएगा तो बेसिकली हम इस तरह से डाटा निकाल सकते हैं अब देखिए मैं एक और चीज यहां पे इंपॉर्टेंट चीज बताना चाहूंगा कि ये जो एनए दिख रहा है आप लोगों को यहां पर ये जो एनए होता है ये फ्लोटिंग कंटेंट होता है जबकि ये देखिए क्राइसिस फूट हो गया सेमी फर्निश ब्रेड हो गई यहां पे ये सारे कंटेंट कैसे हैं स्ट्रिंग कंटेंट है चलिए इसको भी एक बार देख लेते हैं कि कैसे आपके पास यहां पर फटिंग कंटेंट है तो देखिए मैं यहां पे आइटम फाइव डालता हूं तो मुझे नैन देखने को मिलता है अब इस नैन की यदि मैं यहां पर टाइप को चेक करूं यस इस नैन की यदि मैं टाइप को चेक करूं तो देखिए आपको क्या देखने को मिलती है फ्लोटिंग टाइप मिलती है इसका मतलब नैन वैल्यू को निकालने का हमारे पास सबसे सिंपल तरीका आ गया यहां पे कि हम फ्लोटिंग कंटेंट को अलग कर देंगे और जो स्ट्रिंग कंटेंट है उन्हें अलग कर देंगे और हम एक लिस्ट तैयार कर लेंगे अब ये लिस्ट कैसे तैयार होती है जरा इसे डिटेल के साथ समझते हैं देखिए सबसे पहले मुझे यहां पे क्या करना है मुझे ये पूरी की पूरी रो चाहिए मतलब मुझे मुझे पहला जो आइटम है वो चाहिए का यहां पे तो दैट्ची 4 आई इन यहां पर क्या करने वाला हूं गाइज यहां पर रेंज का इस्तेमाल करूंगा यस यस फ मैं फोर इन आई इन क्या करने वाला हूं यहां पर रेंज का इस्तेमाल करने वाला हूं रेंज के अंदर हमें क्या करना है यहां पर जीरो से स्टार्ट करना है और रुकना कहां पर है तो रुकना हमें यहां पर जो डटा सेट दिख रहा है आपको यहां पर यस डटा सेट डॉट यहां पर हम क्या करेंगे गाइज शेप का इस्तेमाल करेंगे तो शेप के अंदर हमें यहां पर नंबर ऑफ रोज मिल जाएगी बस यहीं पे हमें रुकना है तो मैं क्या करूंगा यहां पर रुकना कहां पर है तो रुकना मुझे क्या करना है डेटा सेट्स के पास जाना है एंड डॉट यहां पर क्या करूंगा मैं शेप का इस्तेमाल करूंगा एंड देन स्क्वायर ब्रैकेट ऑफ ़ का इस्तेमाल करूंगा यहां पर जाके रुकना है अब देखिए ये देखिए 9835 दैट द लास्ट रो यस 9835 इज माय लास्ट रो यस आप इस डेटा सेट से भी ऑब्जर्वेशन कर सकते हैं य देखिए 9865 इज लास्ट रो तो एक एडवांस देना होता है जो कि हमने दे रखा है यहां पे राइट तो आप एक बार चेक भी कर सकते हैं कि क्या लास्ट रो में आपका डाटा है तो देखिए डेटा सेट के पास जाएंगे जस्ट मैं यहां पे आइटम के पास जाता हूं यस मैं किसके पास जाता हूं आइटम वन के पास जाता हूं एंड देन स्क्वायर ब्रैकेट 9835 को एंटर करेंगे यहां पे एंड रन करेंगे तो बेसिकली यहां पे की एरर आ चुकी है राइट 9835 पे आपके पास क्या आ गई की एरर आ गई है और यदि मैं यहां पर फोर एंटर करता हूं तो देखिए मेरे पास चिकन देखने को मिलता है दैट द लास्ट रो इज 9835 4 ओके तो यहां पर शेप जरो इसलिए लगा रखी है क्योंकि रेंज फंक्शन हमें एक एडवांस देता है तो एडवांस की वैल्यू हमें यहां पर मिल चुकी है चलिए दैट्ची अब मैं इस्तेमाल करूंगा मेरा जो डेटा सेट है इसके अंदर जाऊंगा एंड दैट कॉलम को इस्तेमाल करूंगा राइट यहां से मेरे जितने भी कॉलम्स है वो मुझे यहां पर मिल जाएंगे अब मिलने के बाद में मुझे क्या करना है मुझे मेरा डेटा दिखाना है कि डेटा कैसा दिखाई देता है तो देखिए डेटा को पहले में हम देख लेते हैं यस डेटा को देख लेते हैं कि क्या मेरा डेटा आता है या नहीं आता है तो उसके लिए मैं क्या कर रहा हूं यहां पर डेटा सेट के पास जाऊंगा देन स्क्वायर ब्रैकेट ऑफ जे डालूंगा यहां पर देन स्क्वायर ब्रैकेट ऑफ आई डालूंगा और रन करूंगा तो देखिए मेरे पास जितने भी डाटा है वो सारे के सारे आ चुके हैं यहां पर अब देखिए आपके पास यहां पर सारे डाटा मिल जाएंगे अब मुझे इसमें से फिल्टर करना है हमारे नन वैल्यू को विदाउट नन वैल्यू को देन सेकंड चीज हमें यहां पर एक मार्केट की लिस्ट बनानी है जिसके अंदर हर एक कस्टमर की लिस्ट हमें तैयार करनी है तो चलिए बनाते हैं यहां पे तो मैं क्या कर रहा हूं यहां पे एम ए आर के ईटी मार्केट के नाम से एक वेरिएबल बना लेते हैं मतलब एक लिस्ट बना लेते हैं जो कि एक फाइनल लिस्ट हमारे पास होगी यहां पे उसके बाद में हमें क्या चाहिए उसके बाद में हमें कस्टमर की लिस्ट चाहिए तो मैं यहां पे सीयस कस के नाम से एक वेरिएबल बना लेता हूं यहां पे और ये मेरी बन गई कस्टमर की लिस्ट अब मुझे क्या करना है ये जो मेरा डटा आ रहा है इस डेटा की टाइप के ऊपर हमें क चेक करना है और उसके हिसाब से हमें डाटा ट्रांसफर करना है कैसे करेंगे इफ यस यहां पर मैं कंडीशन स्टेटमेंट लगाऊंगा यहां पे इफ लगाऊंगा एंड देन लिखूंगा यहां पर मेरा जो डाटा सेट है इसके अंदर जो j है एंड जो हमारे पास i है यस इसकी जो टाइप यदि हम कंसीडर करें यस क्या कंसीडर करें यहां पे टाइप कंसीडर करें ये जो टाइप आपके पास क्या होनी चाहिए इक्वल्स टू इक्वल्स टू यहां पर यदि ये एटीआर हो जाती है स्ट्रिंग हो जाती है तो हमें क्या करना है कस्टमर के अंदर डाटा ट्रांसफर करना है और ये कैसे करेंगे सयस डॉट यहां पर क्या करने वाला हूं गाइज यहां पर अपेंड का इस्तेमाल करूंगा और अपेंड के अंदर क्या टाइप क्या भेजना है मुझे यहां पर डाटा सेट देन स्क्वायर ब्रैकेट ऑफ z एंड देन स्क्वायर ब्रैकेट ऑफ़ आ यस ये मुझे ट्रांसफर करना है अच्छा कोई और हो तो नहीं मुझे कोई ट्रांसफर रेस्टेंट नहीं करना यहां पर अच्छा ये एक बार में अपना काम पूरा कर दे उसके बाद क्या करना है उसके बाद जो यहां पे ये जो सीएस कस वाला जो डाटा है ये कहां डालना है मुझे मार्केट में डालना है तो मार्केट डॉट मैं क्या करने वाला हूं यहां पर अपें का इस्तेमाल करूंगा और इसमें सीएस का इस्तेमाल करूंगा चलिए रन करते हैं इसे तो ये मार्केट की जो लिस्ट है वो तैयार हो गई है विदाउट नन वैल्यू के साथ यस तो मैं मार्केट के अंदर दिखाऊं आप लोगों को तो देखिए मार्केट की एक लिस्ट तैयार हो चुकी है यस जिसके अंदर हमारे पास हर पर्टिकुलर पर्सन की जो जो उसने बाय किया है उसकी डाटा हमें दिख है जैसे देखिए क्रेसेस फूड सेमी फर्निश बेड अ मार्गन रेडी टू शॉप्स आ गया है आपके पास यहां पे ट्रेपिक फूड्स आ गया योगेस्ट आ गया कॉफी आ गया होल मिल्क आ गया ऐसे करते हुए मेरे पास जितने भी डाटा है वो सारे डाटास हमें देखने को मिल गए हैं यहां पे राइट तो इस तरह से हमें यहां यहां पर सारे डाटा हमें देखने को मिल चुका हैं अब हम यहां पर जो चाहे वो एनालिसिस कर सकते हैं क्योंकि अब हमारी नैन वैल्यू जो है वो यहां से गायब हो चुकी है चलिए अब हमारा नेक्स्ट टारगेट क्या होगा नेक्स्ट टारगेट मैं यहां पर ये फाइंड आउट करूंगा कि यहां पर सबसे ज्यादा मोस्ट फ्रीक्वेंसी [संगीत] प्रोडक्ट है वो कौन सा है ये हमें निकालना है चलिए हम कैसे निकालेंगे तो इसके लिए हम एक आपके पास मॉड्यूल का इस्तेमाल करेंगे और दैट्ची तो हम यहां पे क्या इस्तेमाल करने वाले हैं इस कलेक्शन मॉड्यूल का इस्तेमाल करने वाले हैं यहां पे तो मैं कलेक्शन मॉड्यूल को इस्तेमाल करूंगा और कलेक्शन मॉड्यूल के अंदर मुझे क्या मिलने वाला है यहां पे काउंटर मिलने वाला है ये काउंटर हमें क्या करेगा काउंटिंग करके देगा यहां पर हमारे डटा की अब ये डेटा की काउंटिंग कैसे करके देता है जस्ट लाइक देखिए एक एग्जांपल के तौर पे मैं आपको दिखाना चाहूंगा जैसे कि मैंने यहां पे क्या किया दो बार a दे दिया है मतलब मैं तीन बार ए दे देता हूं यहां पर एक बार s दे देता हूं एक बार और s दे देता हूं और एक बार मैं d दे देता हूं एंड देन रन करता हूं तो देखिए मुझे यहां पे ये काउंटिंग करके दे रहा है कि a जो आया है वो थ्री टाइम्स आया है ए जो आया है वो टू टाइम आया है डी जो आया है दैट्ची काउंटिंग करके देता है तो दैट अ वेरी बेनिफिट पॉइंट्स कि हमें यहां पे ये जो मार्केट मिला है यहां पे इस मार्केट की हेल्प से हम इस तरह से काउंटिंग कर सकते हैं अब ये मार्केट के हेल्प से किस तरह से काउंटिंग करेंगे यहां पर कौन सा प्रोडक्ट कितनी बार बाय हुआ है ये कैसे काउंटिंग करेंगे तो मुझे एक लिस्ट चाहिए लिस्ट के अंदर सारे एलिमेंट चाहिए यहां पे देखिए हमारे पास लिस्ट तो है लेकिन लिस्ट के अंदर लिस्ट है यदि मैं यहां पे मार्केट को आपको दिखाऊं यहां पर तो मार्केट के अंदर क्या है लिस्ट के अंदर लिस्ट हमें यहां पे देखने को मिली है तो अब हमें क्या करना है इसे सिंगल लिस्ट के अंदर अर कन्वर्ट करना है और इसको सिंगल लिस्ट में कन्वर्ट करने के लिए हम इस्तेमाल करेंगे किसका नपाई का अ मैं यहां पे क्या करने वाला हूं यहां पे इंपोर्ट करने वाला हूं किसे यहां पर अ नपाई को यहां पे इंपोर्ट कर नाहा हूं यहां पे एलियास ऑफ एनपी का इस्तेमाल करूंगा यहां पे दैट अ नपाई अब देखिए ये जो नपाई हमारे पास आया है यहां पे इस नपाई के थ्रू हम इस मार्केट को सही करने वाले हैं चलिए तो अब हमें क्या करना पड़ेगा एक लिस्ट हमें यहां पर देनी पड़ेगी अब इस लिस्ट को हम तैयार करते हैं इस मार्केट से कैसे करेंगे यहां पर ट्स अ सिंपल फड लूप का इस्तेमाल करूंगा और कोई चीज का इस्तेमाल नहीं करने वाला यहां पर सिंपल सा तो देखिए एल नाम से एक लिस्ट तैयार कर लेते हैं यहां पे फिर हम क्या करते हैं एक फोर लूप चलाते हैं देन फोर आई इन मैं यहां पे इस्तेमाल करूंगा किसका मार्केट का इस्तेमाल करूंगा एंड कॉलन लगा के यदि मैं यहां पर प्रिंट ऑफ आ कर रहा हूं यहां पर यस यहां पर देखिए मैं आपको थोड़ा सा एक्सप्लेन करूं यहां पर तो मैं यहां पे कर रहा हूं प्रिंट ऑफ यहां पे क्या कर रहा हूं आ का इस्तेमाल कर रहा हूं यहां पे तो बेसिकली हमारे पास डेटा आ रहा है अब मुझे यहां पे क्या करना पड़ेगा एक बार और रिट्रेट करना पड़ेगा दैट्ची क्या करना है इस एल में डालना है तो मैं एल डॉट यहां पर क्या करूंगा अपेंड करूंगा यहां पर और अपेंड के अंदर क्या करने वाला हूं सिंपल सा जे का इस्तेमाल करनाला हूं एंड देन रन करते हु यहां पर मेरा सारा डाटा इस एल के अंदर आ चुका है अब यदि आप इस एल को ऑब्जर्व करेंगे यहां पे तो आपको एक ही लिस्ट के अंदर सारे डाटा देखने को मिल जाएंगे बस हमें यही चाहिए था हमारे इस कलेक्शन मॉड्यूल के लिए और इस काउंटर के अंदर ले जाके मैं इस एल को ट्रांसफर कर दूंगा और मैं जैसे ही रन करूंगा मेरे पास एक डिक्शनरी आ जाएगी और उस डिक्शनरी के अंदर मेरे पास जितना भी डाटा है वो सारा का सारा डाटा मुझे यहां पर देखने को मिल जाएगा कि होल मिल्क कितना है और दूसरी चीजें कितनी भी है सब कुछ मुझे यहां पर देखने को मिल जाएगा दैट इज अ लाइक अ डिक्शनरी चलिए इसे हम क्या करते हैं किसी वेरिएबल के अंदर सेव कर लेते हैं यहां पे चलिए मैं इसे p नाम के एक वेरिएबल में सेव कर लेता हूं प डॉट यदि मैं यहां पर कीज का इस्तेमाल करूं यहां पर तो मुझे देखिए सारी की सारी कीज मिल जाएगी और यदि मैं प डॉट यदि मैं वैल्यू का इस्तेमाल करूं यहां पर तो देखिए मुझे सारी की सारी वैल्यूज देखने को मिल जाएगी मतलब कौन सा कितनी बार रिपीट हुआ है ये सारी चीजें मुझे यहां पर देखने को मिल जाएगी अब हमें क्या करना है हमें तो एक आपके पास एक डेटा फ्रेम तैयार करना है ताकि हम एक ऑब्जर्वेशन ले सक कि हमारा कौन सा डाटा कितनी बार रिपीटेशन हुआ है मतलब मोस्ट हाईएस्ट सेलिंग प्रोडक्ट कौन सा है वो देख सके यहां पे तो बेसिकली मैं एक आपके पास यहां पे डेट अ बेसिकली एक डेटा फ्रेम तैयार कर रहा हूं यहां पर तो उसके लिए मैं डी नाम से एक डिक्शनरी तैयार कर लेता हूं उसके अंदर सबसे पहले हम क्या कर रहे हैं यहां पर हम यहां पे इस्तेमाल कर रहे हैं हमारे आइटम का नाम यस हम क्या इस्तेमाल करेंगे हमारे आइटम्स का नाम क्योंकि देखिए आप ऊपर देखेंगे तो आइटम ही आपको देखने को मिल रहा है तो बेसिकली हम क्या करेंगे यहां पर आइटम नेम के नाम से एक वेरिएबल बना लेंगे मतलब एक कॉलम का नाम बना लेंगे और इसके लिए हम क्या इस्तेमाल कर रहे हैं प डॉट यहां पर कीज का इस्तेमाल करने वाले हैं एंड देन नेक्स्ट हमारे पास क्या होगा यहां पर रिपीटेशन रिपीटेशन का मतलब बेसिकली गाइज यहां पर वैल्यूज है आपके पास यहां पर कितनी बार रिपीट हुआ यहां पर तो मैं यहां पर वैल्यूज रखूंगा यहां पर कि कौनसी-कौनसी कितनी बार वैल्यूज आई है यहां पर उसके लिए मैं प डॉट यहां पर क्या करना हूं वैल्यूज का इस्तेमाल करूंगा यहां पर सिंपल सा राइट तो ये मेरे पास डिक्शनरी बन गई है अब मैं इसका एक डेटा फ्रेम तैयार कर लेता हूं तो डीएफ के नाम से बना रहा हूं यहां पे गाइज अ एक डेटा फ्रेम तैयार कर लेता हूं यहां पे तो पीडी डॉट यहां पर मैं कर रहा हूं एक डेटा फ्रेम तैयार करूंगा और डेटा फ्रेम के अंदर सिंपल साइज टी को पास कर दूंगा तो मेरे पास वो सारे प्रोडक्ट आ चुके हैं जो कि बार-बार रिपीटेशंस हो रहे हैं अब मुझे क्या करना है इसे आपका शॉर्ट करना है तो मैं यहां पे क्या कर रहा हूं यहां पर सिंपल सा शॉर्ट का इस्तेमाल कर रहा हूं राइट तो मैं यहां पर शॉर्ट बाय वैल्यू कर रहा हूं यहां पर और शॉर्ट बाय वैल्यू के अंदर मैं किसका इस्तेमाल कर रहा हूं यहां पर बाय का इस्तेमाल कर रहा हूं और बाय के अंदर जाके मैं क्या करूंगा यहां पर इस वैल्यू पॉइंट्स के हिसाब से आप क्या करूंगा यहां पर शॉर्ट करूंगा यस मैं वैल्यूज के हिसाब से शॉर्ट कर रहा हूं तो वैल्यूज के हिसाब से मेरे पास शॉटिंग आ चुका है लेकिन मुझे क्या करना है यहां पर मेरी असेंडिंग को क्या करना है यहां पर फाल्स करना है क्योंकि मुझे हाईएस्ट सेलिंग प्रोडक्ट मुझे पहले चाहिए तो हाईएस्ट सेलिंग प्रोडक्ट भी आ चुका है देखिए यहां पर मुझे कुछ नाम मुझे दिखाई नहीं दे रहे है तो मुझे इस नाम को देखने के लिए मैं ऊपर जाऊंगा और पीडी डॉट यहां पर क्या इस्तेमाल करूंगा सेट ऑप्शन का इस्तेमाल करूंगा और सेट ऑप्शन के अंदर यस मैं यहां पे इस्तेमाल कर रहा हूं डिस्प्ले डॉट आपके पास क्या कर रहा हूं मैक्स अंडर मैं यहां पे इस्तेमाल करूंगा रोज का और जो रोज लेने वाला हूं यहां पर अराउंड देखिए नीचे देख लेते हैं कितनी है आपके पास 167 है तो मैं यहां पे 200 अराउंड लेने वाला हूं यहां पर चलिए रन कर लिया है मैंने इसको और अब जाके मैं नीचे जाके रन करूं यहां पर तो मुझे वो सारे डाटा मिल जाएंगे जो आपके पास रिपीटेशन है इसके अंदर हमें क्या देखने को मिल रहा है यहां पर होल मिल्क सबसे ज्यादा रिपीटेबल है उसके बाद अदर वेजिटेबल हमारे पास और रिपीटेबल है अभी हमारे पास रोल बिंस भी है यहां पर सोडा भी है यहां पर योगेस्ट भी है यहां पर एंड नीचे जाएंगे तो हमारे पास और भी प्रोडक्ट यहां पर देखने को मिल जाएंगे तो इस तरह से हम यहां पर क्या पता लगा सकते हैं इस तरह से हम ये पता लगा सकते हैं कि हमारे पास मोस्ट सेलिंग प्रोडक्ट कौन सा है और लीस्ट सेलिंग प्रोडक्ट कौन सा है लेकिन अभी तक हमने अपयोरी एल्गोरिथम को यूज़ नहीं किया है अभी तक हम केवल और केवल क्या कर रहे हैं हम यहां पर पता लगा रहे हैं कि मोस्ट सेलिंग प्रोडक्ट हमारे पास कौन सा आया है तो अभी तक मोस्ट सेलिंग प्रोडक्ट कौन सा आया है यहां पर होल मिल्क आया है और कौन सा आया है अदर वेजिटेबल आया है और कौन सा आया है रोज पंस आया है अब हमें क्या करना है गाइज यहां पे अब हमें यहां पर ये पता लगाना है कि पहला जो प्रोडक्ट बाय हो रहा है उसके साथ हमारे पास एसोसिएट प्रोडक्ट कौन सा है और वो भी किसके हेल्प से अपयोरी एल्गोरिथम के हेल्प से तो अब ये अपयोरी एल्गोरिथम लगाएंगे कैसे तो उसके लिए मुझे जरूरत पड़ेगी एमएल एक्सें मॉडल की यहां पे तो देखिए आपके पास साइकल र्न की जो लाइब्रेरी है यहां पर उसके अंदर आपको नहीं मिलेगा एसोसिएशन रूल्स यहां पे उसके लिए आप आपको जरूरत पड़ेगी एएल एक्सें की तो इसके लिए हम क्या करेंगे एएल एक्सटें को सबसे पहले यहां पर इंस्टॉल करेंगे तो आपको जाके क्या करना है नेट पे सर्च करना है एल एक्सटें python2 लिख देना है और ये एमएल एक्सटें आपके सिस्टम में डाउनलोड हो जाएगा देखिए फिलहाल अभी मेरे सिस्टम में इंस्टॉल है इसलिए रिक्वायरमेंट ऑलरेडी स्टेटस् फाई दिखा रहा है यदि आपके सिस्टम में इंस्टॉल नहीं है तो ये इंस्टॉलेशन प्रोसेस फॉलो करेगा देन अब आ जाते हैं हम वापस यहां पे पॉइंट आउट पे वापस आ जाते हैं अपनी शीट के ऊपर और यहां से हम अपयोरी एल्गोरिथम को इस्तेमाल करते हैं देखिए यहां पर जो एप एल्गोरिथम इस्तेमाल की जा रही है उसके लिए हमें एक स्पेसिफिक मैट्रिक्स तैयार करनी पड़ती है अब ये स्पेसिफिक मैट्रिक्स कैसी होती है यहां पर जरा समझिए यहां पर देखिए आपके पास जितने भी प्रोडक्ट है यहां पे उस प्रोडक्ट की एक स्पेसिफिक मैट्रिक्स यहां पे बनती है और वो मैट्रिक्स कुछ इस तरह से बनती है जस्ट लाइक मैं आप लोगों को छोटे से एग्जांपल के तौर पे बताऊं यहां पर तो आप कुछ इस तरह से मान सकते हैं कि लेट्स सपोज आपके पास कोई ए पर्सन है यहां पे वो ए पर्सन आपके पास क्या कर रहा है ए प्रोडक्ट प्रोडक्ट ले रहा है बी प्रोडक्ट ले रहा है और c ले रहा है राइट कोई बी पर्सन है यहां पे वो a ले रहा है एंड c ही ले रहा है यहां पर बी नहीं ले रहा है यहां पर और कोई आपके पास सी पर्सन है यहां पर वो क्या कर रहा है a ले रहा है एंड आपके पास यहां पर b ही ले रहा है c नहीं ले रहा है अब हम यहां पे क्या करेंगे एक मैट्रिक्स तैयार करेंगे और वो मैट्रिक्स कौन सी होने वाली है गाइज यहां पे वो मैट्रिक्स कुछ इस तरह से होगी a हो जाएगा b हो जाएगा देन आपका c हो जाएगा मतलब ये आपके पास क्या बनने वाले हैं आपके कॉलम के नेम बनने वाले हैं उसके बाद में जो आपका यहां पर पहला पर्सन है जैसे पहला पर्सन इज़ ए दूसरा पर्सन इज़ बी एंड तीसरा पर्सन ऑफ़ सी a पर्सन ने a प्रोडक्ट खरीदा यस खरीदा है तो इसकी जगह आपका ट्रू हो जाएगा a पसन ने क्या b प्रोडक्ट खरीदा है यस ये खरीदा है तो इसकी जगह ट्रू आ जाएगा a पसन ने क्या c प्रोडक्ट खरीदा है यस ये खरीदा है देन ट्रू आ जाएगा देन आपके पास b जो है पर्सन वो a को प्रोडक्ट बाय करता है क्या यस यस करता है यहां पे तो ट्रू आ जाता है यदि b प्राइट करता है क्या नहीं करता है तो फॉल्स आ जाएगा यहां पर सी बाय करता है क्या यस करता है तो ट्रू आ जाता है देन सी पर्सन की बात करें यहां पर तो यस यह बाय करता है तो ट्रू आ जाएगा देन ये भी बाय करता है देन ट्रू आ जाएगा और ये बाय करता है क्या तो ये बाय नहीं करता है देन फाल्स रहेगा तो गाइ आपके पास जो ये डाटा आपके पास पड़ा है यहां पर इस डाटा की हम क्या करते हैं इस तरह से एक मैट्रिक्स तैयार करते हैं क्या करते हैं इस तरह की एक मैट्रिक्स तैयार करते हैं दैट इज मैट्रिक्स हमारे पास ये हेल्प करेगी अपयोरी एल्गोरिथम के अंदर फ्रीक्वेंसी पैटर्न को निकालने में मतलब हमारे पास यहां पर पहले प्रोडक्ट के बाद में कौन सा दूसरा प्रोडक्ट बाय हो रहा है इसको निकालने में हमारी हेल्प करेगी अब ये कैसे बाय हेल्प करेगी जरा इसे समझते हैं यहां पे तो देखिए मैं यहां पे जाऊंगा फ्रॉम एमएल एक्सें के अंदर चलूंगा यहां पर एमएल एक्सें के अंदर चलने के बाद दैट मैं कहां जाऊंगा प्री प्रोसेसिंग के अंदर जाऊंगा और प्री प्रोसेसिंग में जाने के बाद मैं ट्रांस इनकोडर को यहां पे इंपोर्ट करूंगा और इंपोर्ट करूंगा यहां पर मैं ट्रांस इनकोडर को यस आपको क्या करना है आपको एमल में जाना है देन प्री प्रोसेसिंग में जाना है फिर उसके बाद ट्रांस इनकोडिंग में जाना है ट्रांस एन कोडिंग के अंदर ट्रांस एन कोडर पे जाना है राइट हमें इसको यूज़ करना है अब इसके लिए हम क्या करेंगे टीआर के नाम से एक वेरिएबल बना लेंगे और ये जो ट्रांस एन कोडर है अब हम क्या करेंगे इसे रन कर देंगे रन करने के बाद में हम टीआर में जाएंगे और टीआर में जाने के बाद ये जो ट्रांस इनकोडर है इसे हम यहां पर कॉल करेंगे अब देखिए ये जो टीआर है टीआर डॉट हमें क्या करना है मॉडल को सबसे पहले क्या करना है फिट करना है फिट के अंदर हमें क्या करना है हमारा जो मार्केट वाला जो डाटा है वो हमें पास ऑन कराना है ये हमारा पास ऑन हो चुका है यहां पे उसके बाद में हमें टीआर डॉट क्या करना है गाइस यहां पर हमें यहां पे डाटा को ट्रांसफॉर्म करना है और ट्रांसफॉर्म के अंदर हमें हमारा जो मार्केट है उसे हमें पास करा देना है तो देखिए अब हमें क्या कर रहा है ये एक मैट्रिक्स बना के दे रहा है क्या बना के दे रहा है एक मैट्रिक्स बना के दे रहा है जहां-जहां हमें डाटा यहां पर देखने को मिल रहा है वहां वहां हमें ट्रू मिल रहा है जहां-जहां हमें डाटा नहीं मिल रहा है वहां पे हमें फाल्स मिल रहा है तो अभी हमें क्या मिली एक मिली है इस मैट्रिक्स से हम क्या करेंगे वापस एक डटा फ्रेम तैयार करेंगे और उस डटा फ्रेम को हम इस्तेमाल करेंगे किसमें अ प्यूरी के अंदर कैसे इस्तेमाल करने वाले हैं गाइ यहां पर तो फिर से मुझे क्या करना पड़ेगा डेटा फ्रेम तैयार करना पड़ेगा अच्छा मैं देख लेता हूं ऊपर कोई डेटा फ्रेम पहले से नहीं बना हुआ है नहीं बना हुआ है हमारे पास यहां पे तो देखिए हमें यहां पे क्या कर रहे हैं न्यू डीएफ बना रहे हैं यहां पे उसके लिए हम क्या कर रहे हैं पीडी डॉट यहां पर क्या करेंगे डाटा फ्रेम का इस्तेमाल कर रहे हैं जहां पे हम ये ट्रांस एन कोडर देंगे उसके बाद में हमें देने है कॉलम्स की नीम यस मुझे क्या देने है कॉलम्स के नेम देने है कॉलम्स के नेम के लिए मैं क्या करूंगा यहां पर ये जो टीआर है र डॉट यहां यहां पर हम करेंगे कॉलम्स यहां से हमें मिल जाएंगे हमारे कॉलम्स के नेम और यहां से हमारा डेटा फ्रेम तैयार हो जाएगा यदि मैं इस डीएफ को दिखाऊं यहां पर तो देखिए डीएफ के अंदर हमारे पास डेटा आ चुका है अब देखिए यहां पे इंस्टेंट फूड प्रोडक्ट ये सबसे पहला आपके पास है और यहां पे क्या आ रहा है फॉल्स आ रहा है इसका मतलब ये जो पहला पर्सन है उसने इंस्टेंट फूड प्रोडक्ट खरीदा ही नहीं है अच्छा देखिए यदि पहले पर्सन की बात करें तो इसने क्या खरीदा है क्राइसिस फूड्स को खरीदा है तो यदि मैं जाके देखूं यहां पर तो मेरे को क्राइसिस फूड के अंदर कहीं ना कहीं मुझे ट्रू मिल जाएगा यस तो थोड़ा सा आगे मूव करें तो क्राइसिस फूड भी हमें मिल जाएगा और क्राइसिस फूड के अंदर कहीं ना कहीं हमें टू मिल जाएगा अब देखिए यहां पर काफी डाटा हमें शो नहीं हो रहा है और उसके शो नहीं होने का रीजन क्या है हमने यहां पर मैक्स कॉलम का इस्तेमाल नहीं किया है यदि हम मैक्स कॉलम का इस्तेमाल करते तो हमें वहां पे भी क्या मिलता ट्रू देखने को मिलता चलिए हमारा जो डेटा फ्रेम है वो रेडी हो गया है यहां पे अब हम रेडी हैं अपयोरी एल्गोरिथम के लिए चलिए अपरी एल्गोरिथम को अप्लाई करते हैं तो मैं चलता हूं यहां पर फ्रॉम एमएल एक्सटेंट में चलता हूं एमएल एक्सटेंट के अंदर जाने के बाद डॉट मैं यहां पे जाता हूं फ्रीक्वेंसी पैटर्न में यस फ्रीक्वेंसी पैटर्न में चलेंगे तो मैं यहां पे क्या कर रहा हूं यहां पे गाइस इंपोर्ट कर रहा हूं और इंपोर्ट कैसे कर रहा हूं गाइ यहां पर मैं अपयोरी को इंपोर्ट कर रहा हूं अब देखिए ये जो अपयोरी आपको दिख रहा है यहां पर इस अपयोरी को इस्तेमाल करना है इस अपयोरी में सबसे पहले आपका पास क्या मांगा जाएगा आपका डेटा सेट मांगा जाएगा मिनिमम सपोर्ट आपसे मांगा जाएगा यहां पर यूज़ कॉलम नेम आपको कॉलम के नाम चाहिए या नहीं चाहिए मैक्सिमम लेंथ कितनी चाहिए मतलब आपके पास यहां पे फ्रीक्वेंसी पैटर्न सेट की दो मैक्सिमम लेंथ चाहिए तीन मैक्सिमम लें चाहिए फोर मैक्सिम लेंथ चाहिए कितनी चाहिए वो आप यहां पर इस्तेमाल कर सकते हैं तो बेसिकली कुछ यहां पर हाइपर पैरामीटर्स हैं उन हाइपर पैरामीटर्स को हमें देना पड़ेगा सबसे पहले है डीएफ डीएफ मतलब डेटा फ्रेम मुझे देना है यहां पर तो अभी-अभी हमने डीएफ तैयार किया है यहां पर वो पहले हम देंगे यहां पर उसके बाद है मिनिमम सपोर्ट देखिए मैं मिनिमम सपोर्ट का इस्तेमाल करूंगा यहां पे और मिनिमम सपोर्ट की वैल्यू यहां पर 0.07 रखूंगा मतलब मैं 7 पर ही मिनिमम सपोर्ट रखने वाला हूं अब आप ऐसा सोचेंगे कि यहां पर मिनिमम सपोर्ट 50 पर क्यों नहीं रखा जैसे कि हमने प्रैक्टिकल में देखा था कि मिनिमम सपोर्ट आपका 50 पर रहता है वैसा क्यों नहीं रखा यहां पर तो उसके पीछे रीज़न बहुत ही सिंपल है क्योंकि देखिए वहां पर हमारे पास क्या था डटा बहुत छोटा था और हमें दिख भी रहा था कि बहुत सारा डाटा बार-बार रिपीटेशन हो रहा है लेकिन अभी हम यहां पे देखेंगे हमारा जो डाटा सेट है वो काफी लार्ज है और लार्ज अमाउंट ऑफ डेटा सेट के अंदर रिपीटेशन होना डाटा बहुत ही कम चांसेस होते हैं बहुत ही रेयर चांसेस होते हैं यहां पर डेटा के रिपीटेशन के इसलिए हम क्या कर रहे हैं यहां पर मिनिमम सपोर्ट को क्या कर रहे हैं बहुत ही कम रख रहे हैं यदि हमें लगेगा मिनिमम सपोर्ट को ज्यादा रखने की जरूरत है तो हम मिनिमम सपोर्ट को ज्यादा भी रख लेंगे लेकिन अभी फिलहाल मैं यहां पे क्या कर रहा हूं कम ही रख रहा हूं यहां पर अब देखिए यहां पर क्या इस्तेमाल कर रहे हैं आपके पास यूज कॉलम नेम यस मुझे यहां पे कॉलम के नाम यूज़ करने हैं क्योंकि देखिए कॉलम के नाम के बिना हमें कैसे पता चलेगा कि कौन सा प्रोडक्ट किसके बाद रिपीटेशन हो रहा है तो यस यूज़ कॉलम नेम हम यहां पे रखेंगे तो उसके लिए मैं यहां पे क्या कर रहा हूं ट्रू कर रहा हूं यहां पर उसके बाद में नेक्स्ट चीज क्या है गाइ यहां पर नेक्स्ट चीज है मैक्सिमम लेंथ मैक्सिम लेंथ मतलब कितने प्रोडक्ट आपको होने चाहिए मैक्सिमम तो मैक्सिमम एटलीस्ट मेरे पास यहां पर तीन प्रोडक्ट या दो प्रोडक्ट तो होने ही होने चाहिए तो मैक्सिमम मैं तीन प्रोडक्ट रख सकता हूं तीन से ज्यादा प्रोडक्ट मुझे नहीं चाहिए मैं तीन प्रोडक्ट रखूंगा देन मैं जैसे ही रन करूंगा देखिए मेरे पास वो आपके पास लिस्ट आ चुकी है जो कि आपके पास रिपीटेशन प्रोडक्ट की है अब देखिए मिनिमम सपोर्ट मैंने कितना रखा है यहां पर 0.07 रखा है यहां पर देखिए 0.010 पे भी आपके पास यहां पे डटा आया है यहां पे 0.07 का भी आया है यहां पे डाटा और आप थोड़ा नीचे चलेंगे तो आपके पास यहां पे प्रोडक्ट भी आ चुका है अभी देखिए आपके पास जो सबसे रिपीटेशन प्रोडक्ट आप देखेंगे तो वो कौन सा है अदर वेजिटेबल्स और होल मिल्स आपको दिख रहा है यहां पर दैट द रिपीटेशन प्रोडक्ट और वो कितना है 0.07 पे है अच्छा ये देखिए ये जो डेटा सेट आप देख रहे हैं यहां पर यस ये डेटा सेट अभी तक आपके पास असेंडिंग और डिसेंडिंग ऑर्डर में नहीं है क्योंकि कोई भी कुछ भी चल रहा है यहां पर तो मैं इसे यहां पर क्या करूंगा असेंडिंग एंड डिसेंडिंग करूंगा मतलब मैं यहां पे क्या कर रहा हूं इसे शॉर्ट कर रहा हूं यस मैं यहां पे क्या करूंगा इसे शॉर्ट करूंगा मतलब मैं इसे क्या करूंगा गाइज यहां पर शॉर्ट करूंगा तो चलिए पहले इसका टाइप देख लेते हैं कि ये टाइप कौन सा है यहां पर तो इसका टाइप में यदि मैं चेक करूं यहां पर तो पांडा कोड डाटा फ्रेम हमें दिख रहा है यहां पर बेसिकली इसका टाइप हमें क्या दिख रहा है पांडा कोड डाटा फ्रेम है यहां पर तो डॉट यहां पर मैं क्या कर सकता हूं शॉर्ट का इस्तेमाल कर सकता हूं और मैं यहां पर शॉर्ट क्या करूंगा शॉर्ट बाय वैल्यू का इस्तेमाल करूंगा यहां पर और शॉर्ट बाय वैल्यू किसके हिसाब से करना है यहां पर यस तो पहले मुझे यहां पर अपना इसे मैं एक बार के लिए हटा दूंगा यहां पर रन करूंगा तो मुझे क्या करना है बेसिकली सपोर्ट के बेसिस पे करना है यहां पर यस किसके बेसिस पे करना है तो मैं यहां पर क्या कर रहा हूं शॉर्ट बाय आपके पास यहां पर इस्तेमाल करूंगा यस मैं यहां पे क्या कर रहा हूं यहां पे इसे शॉर्ट कर रहा हूं यहां पे बेसिकली यस शॉर्ट बाय वैल्यू और शॉर्ट बाय वैल्यू के अंदर मैं इस्तेमाल करूंगा किसका बाय का इस्तेमाल करूंगा और बाय के अंदर जाके मैं किसका इस्तेमाल कर रहा हूं गाइज यहां पर सपोर्ट का इस्तेमाल कर रहा हूं कि भाई मुझे सपोर्ट के हिसाब से इसे शॉटिंग करके दे दी जाए एंड रन करेंगे तो देखिए सपोर्ट के अंदर जो सबसे मिनिमम सपोर्ट है 0.07 वो हमें मिल चुका है और इसके अंदर देखिए दो प्रोडक्ट एक साथ आ चुके हैं और वो कौन से हैं अदर वेजिटेबल और होल मिल्स आप इनको ले सकते हैं यहां पर राइट और नीचे देखेंगे यहां पर तो आपका देखिए यहां पर वैल्यू जो है वो लगातार बढ़ती जा रही है और ये टू तक चल रहा है अब टू मतलब 20 पर है आपके पास यहां पर है देखिए 20 पर में जैसा कि मैंने आप लोगों को बोला था कि 20 यदि आप लेते हैं 50 पर यदि आप लेते हैं तो उसके अंदर आपको बाय प्रॉडिट एक साथ दो नहीं मिलेंगे बहुत कम मिलेंगे यहां पर 0.7 के ऊपर भी मुझे क्या मिला है एक ही मिला है यहां पर कोई और दूसरा मिला ही नहीं है यहां पर तो बेसिकली मुझे और कम करना पड़ेगा मैं 0.05 करके यहां पर खूंगा यहां पर मैं जैसे ही रन कर रहा हूं यहां पर तो देखिए 0.05 के हिसाब से मुझे मिल चुका है अब देखिए यहां पर देखिए 0.05 के अंदर देखिए यहां पर तो देखिए रोल बिल्स और होल मिल को हम रख सकते हैं यहां पे जो कि 0.05 सपोर्ट है यहां पर उसके बाद देखिए योगेश एंड होल मिल्क भी है आपके पास यहां पे तो इसको भी हम यहां पर कंसीडरेशन कर सकते हैं यहां पर और उसके बाद में हम चले देखिए अदर वेजिटेबल एंड होल मिल्क्स भी है यहां पर ये भी देखने को मिल रहा है यहां पर और भी बहुत सारी चीजें देखने को मिली है राइट तो मैं एक काम करता हूं यहां पर कि ये जो मैक्सिमम लेंथ है एक बार के लिए इसे यहां पर रिमूव करके देख लेते हैं शायद इससे कुछ प्रोडक्ट के अंदर कुछ चेंजेज आए राइट तो देखिए कोई ज्यादा चेंजेज नहीं आए यहां पर क्योंकि रोल बिनस एंड होल मिल्क ही अभी यहां पर देखने को मिला है योगेस्ट एंड होल मिल्क है यहां पर और थोड़ा नीचे चले यहां पर थोड़ा सा और नीचे चले तो देखिए अदर वेजिटेबल एंड होल मिल्स है वो भी 0.07 पे है और इससे पहले यदि डाटा को देखेंगे तो वहां पे दोदो के सपोर्ट के तो अभी तक कोई डटा मुझे नहीं देखने को मिल हैं राइट तो बेसिकली गाइस हमें क्या-क्या मिला है यहां पर अदर वेजिटेबल के साथ हम होल मिल्क रख सकते हैं पहला फ्रीक्वेंसी पैडल यहां प मिला है दूसरा है योगेस्ट के साथ हम होल मिल्क रख सकते हैं यहां पर और तीसा रोल बल्स के साथ होल मिल र सकते है लेकिन इन सब के अंदर जो सबसे ज्यादा हमें देखने को मिला है दैट अदर वेजिटेबल के साथ होल मिल्स मिला है तो बेसिकली हम इसी का ही इस्तेमाल करने वाले हैं राइट तो इस तरह से हम यहां पे पता लगा सकते हैं अब अब आप चाहे तो सपोर्ट की वैल्यू को और कम कर सकते हैं जैसे 0.01 ही मैं सपोर्ट की वैल्यू रखूं यहां पर तो 0.07 के हिसाब से भी हमारे पास सपोर्ट की वैल्यू रख लेकिन नंबर ऑफ रो आपका क्या है 282 आने की वजह से हमें दिख नहीं रही है तो बेसिकली मैं यहां पर 500 कर लेता हूं ताकि हमें यहां पर सारे डाटा आराम से देखने को मिले और मैं जैसे ही रन करूंगा यहां पर गाइस तो मेरे पास डटा आ चुका है अब देखिए 0.0 मैंने क्या किया वन पे इस्तेमाल किया है तो सॉल्ट मिल रहा है देखिए अभी अब तो हमारे पास दोदो की प्रोडक्ट तो काफी आ चुके हैं जस दोदो के प्रोडक्ट मेरे पास देखेंगे तो काफी आ चुके है अब तो मुझे यहां पर काफी बहुत सारे प्रोडक्ट मिल चु हैं जो कि रिपीटेशंस हो रहे हैं वो काफी देखने को मिल रहे हैं यहां पर क्योंकि हमने यहां पर मिनिमम सपोर्ट को 1 पर रख दिया है मतलब 1 पर जो आपके पास है वो डेटा हमारे पास है तो 1 पर तो बहुत कम होता है मैं 5 पर एटलीस्ट रखूंगा यहां पर और 5 पर के हिसाब से हमारे पास जो डेटा आया है यहां पर वो क्या है अदर वेजिटेबल और होल मिल्स है मतलब इन दो प्रोडक्ट को हम साथ-साथ रख सकते हैं मतलब जो पर्सन होल मिल्क खरीदने आ रहा है यहां पर वो पर्सन अदर वेजिटेबल्स भी खरीद के जा रहा है अदर वेजिटेबल्स का मतलब यहां पे बेसिकली वेजिटेबल्स सही है यहां पर तो वो वेजिटेबल्स भी खरी के जा रहा है या फिर जो वेजिटेबल खरीद के जा रहा है वो होल मिल्क भी खरीद के जा रहा है अच्छा एक चीज यहां पर देखेंगे तो इसके अंदर आपको कॉन्फिडेंस देखने को नहीं मिलेगा यस यहां पे कॉन्फिडेंस नहीं है यहां पर बेसिकली यहां पर आपके सपोर्ट के बेसिस पे ही काम चल रहा है यहां पर तो इसलिए हम यहां पर सपोर्ट के बेसिस पे ही वर्किंग कर रहे हैं और आज के इस वीडियो के जरिए हम बात करेंगे एफपी ग्रोथ एल्गोरिथम के बारे में कि ये किस तरीके से वर्क करती है और यह किस तरीके से आपके पास फ्रीक्वेंसी पैटर्न को निकालती है यदि आपको पाइथन मशीन लर्निंग डाटा साइंस एंड डेटा एनालिस जसी फील्ड में अपने आप को ग्रो करना है तो इसके लिए डब्लू कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपने स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं एफपी ग्रोथ एल्गोरिथम स्टार्ट करने से पहले हम यहां पर ये देखते हैं कि एफपी ग्रोथ एल्गोरिथम कौन-कौन से स्टेप को फॉलो करती है तो देखिए सबसे पहला जो स्टेप्स इसके अंदर होता है वो हमारा होता है फ्रीक्वेंसी पैटर्न सेट मतलब हमारे पास कोई भी डाटा कितनी बार रिपीटेशन हुआ है यहां पर वो हमें पहले फाइंड आउट करना होता है उसके बाद हमें यहां पे क्या बनाना पड़ता है ऑर्डर आइटम सेट्स बनाने पड़ते हैं यहां पे ऑर्डर आइटम सेट्स बनाने के बाद में हमें क्या बनाना है यहां पे कंडीशनल पैटर्न सेट्स बनाना है जिसके थ्रू हम यहां पे ट्री बिल्ड करेंगे एंड देन लास्ट में हमें यहां पे करना है फ्रीक्वेंसी पैटर्न रूल को फॉलो करना है और हमें यहां पे ये फाइंड आउट करना है कि कौन-कौन से प्रोडक्ट यहां पे एसोसिएट होने वाले हैं राइट तो ये कुछ यहां पे टर्म्स हो च होती है जिनको हम फॉलो करने वाले हैं चलिए अब जरा इसे समझते हैं एक डेटा सेट के साथ तो देखिए मैंने एक डेटा सेट ले रखा है जो कि एक मार्केट का डेटा सेट है जहां पे हमारे पास कुछ पांच ट्रांजैक्शंस हुए हैं और पांच ट्रांजैक्शन के अंदर कुछ ये वाले जो प्रोडक्ट्स हैं दिख रहे हैं आपको ई के एलएम ये प्रोडक्ट सेल हुए हैं अब यहां पे ई के एलएम जो आप वाय दिख रहे हैं यहां पर दैट इज अ प्रोडक्ट नेम आप ये से मान के चलिए ये हमारे पास क्या है प्रोडक्ट नेम है अब हमें यहां पे ये फाइंड आउट करना है कि पहला आपके पास प्रोडक्ट कौन सा होने वाला है और पहले प्रोडक्ट के बाद में दूसरा प्रोडक्ट कौन सा होने वाला है वो निकालना पड़ेगा लेकिन इसको निकालने से पहले हम यहां पर ये निकालेंगे कि फ्रीक्वेंसी पैटर्न सेट्स क्या है मतलब फ्रीक्वेंसी पैटर्न सेट्स का मतलब क्या है गाइस यहां पर कि कौन सा प्रोडक्ट कितनी बार बाय हो रहा है यहां पर ये हमें निकालना होगा चलिए अब से फाइंड आउट करते हैं तो इसके लिए मैं बेसिक क्या कर रहा हूं यहां पर बहुत सारी अल्फाबेट्स का यूज हुआ है तो मैं एक बेसिक अल्फाबेट्स लिख लेता हूं और जो जो प्रोडक्ट जितनी बार रिपीट हुआ है उनकी काउंटिंग लिख लेता हूं एंड देन उसके बाद हम फ्रीक्वेंसी पैटर्न सेट्स बनाएंगे चलिए तो सबसे पहले मैं यहां पे एक अल्फाबेट्स ऑर्डर लिख देता हूं यहां पर तो देन ए और बी सी एंड डी ई एफ जी जी के बाद में एच आई जे के एल एम एन ओ प क्य आर एस टी य व डब्लू एक्स वा जड ठीक है तो मैंने यहां पे क्या कर रखा है अल्फाबेट्स लिख दिए अब हम पता करेंगे कि इसमें कौन-कौन से प्रोडक्ट बाय हुए हैं और कौन-कौन से प्रोडक्ट बाय नहीं हुए हैं ठीक है और कितनी बार बाय हुए हैं पहले हम वो निकाल लेते हैं तो सबसे पहले मैं बात करूंगा यहां पर a की तो a देखूं यहां पर तो जितने भी पांच ट्रांजैक्शन हुए हैं इन पांच ट्रांजैक्शन के अंदर a जो हुआ है वो केवल और केवल वन टाइम यहां पर ट्रांजैक्शन हुआ है तो इसका वन टाइम मैंने लिख दिया यहां पर अब बात करते हैं बी के बारे में तो बी यहां पर बाय नहीं हुआ है तो मैं इसे एलिमिनेट कर देता हूं सी यहां पे बाय हुआ है और सी जो बाय हुआ है दैट टू टाइम्स बाय हुआ है यहां पे नहीं हुआ है यहां पे नहीं हुआ है दैट सी जो आपके पास है दैट अ टू टाइम आपके पास आ है ओके उसके बाद बात करें डी के बारे में तो आप डी को देखेंगे तो इसमें नहीं है इसमें है आपके पास वन टाइम इसके अंदर नहीं है इसके अंदर भी नहीं है इसके अंदर नहीं है तो डी आपके पास वन टाइम आया डी के बाद बात करते हैं आप ई के बारे में तो देखिए ई इसमें है इसमें भी है इसमें नहीं है इसमें है और इसमें है तो दैट्ची एफ के बाद में अब मैं बात करता हूं जी के बारे में तो जी भी देखो यहां पर इस लाइन के अंदर इस लाइन के अंदर कहीं पे भी यूज नहीं हुआ है तो मैं ऐसे हटा देता हूं बात करते हैं h के बारे में तो h के अंदर देखेंगे तो यहां पे भी नहीं हुआ है यहां पे भी नहीं हुआ यहां पे भी नहीं हुआ यहां पे भी नहीं हुआ बात करते हैं आ के बारे में तो यस आ हमारे पास हुआ है लेकिन वन टाइम यूज हुआ है केवल यहां पे i तो मैं i = 1 लिख लेता हूं यहां पर राइट तो मैंने i = 1 लिख दिया यहां पर अब बात करते हैं j के बारे में तो देखिए j भी यूज नहीं हुआ है यहां पर मैं हटा देता हूं अब बारी है k की तो देखिए k आपके पास 1 2 3 4 एंड फाइव टाइम हुआ है तो k की वैल्यू लिखूंगा यहां पर फाइव टाइम यूज़ हुआ है k के बाद में अब हमारे पास है l अब देखिए l को देखेंगे ना यहां पे तो ऊपर नहीं है यहां पे भी नहीं है यहां पे भी नहीं है यहां पे भी नहीं है तो l नहीं यूज़ हुआ है अब बात करें m के बारे में तो देखिए m इसमें आ रहा है इसमें नहीं है इसमें आ रहा है इसमें नहीं है इसमें आपके पास आ रहा है तो m की वैल्यू कितनी आई है गाइज यहां पर थ्री टाइम्स आई है राइट तो m हमारे पास यहां पे आ चुका है m के बाद बात करें n के बारे में यस n यहां पे यूज़ हुआ है तो मैं n को बीच में डाल देता हूं यहां पे कहीं ठीक है एंड देखेंगे यहां पे वन टाइम टू टाइम्स यूज़ हुआ है इसके अंदर नहीं है इसके अंदर भी नहीं है इसके अंदर भी नहीं है तो बेसिकली टू टाइम्स यहां पे n यूज हुआ है यहां पे अब बारी है किसकी o की तो मैं एक बार o को भी चेक कर लेता हूं यहां पर ओ कितनी बार है तो वनटू इसमें नहीं है एंड इसमें है इसमें नहीं है तो ट्स अ थ्री टाइम्स यूज हुआ है उसके बाद बात करते हैं p के बारे में तो देखिए p के बारे में बात करें तो देखिए इसमें नहीं है इसमें भी नहीं है इसमें भी नहीं है इसमें भी नहीं है और इसमें भी नहीं है दर्स अ p यहां पर नहीं यूज हुआ है तो मैं हटा देता हूं p के बाद मैं बात करता हूं q के बारे में तो वो भी नहीं है r के बारे में बात करूं तो देखिए इसमें भी नहीं है इसमें भी नहीं है इसमें भी नहीं है कहीं पे भी r नहीं है s के बारे में बात करें तो s भी आपके पास नहीं है t की बात करें तो t भी हमारे पास नहीं है य की बात करें तो य आपके पास वन टाइम आया देखिए ऊपर नहीं है ऊपर नहीं है ऊपर नहीं है यहां पे है केवल और जगह नहीं है तो मैं य की बात करूं तो केवल और केवल वन टाइम्स यहां पे आए हैं अब बात करें v के बारे में तो v नहीं है देखिए इसमें भी नहीं है इसमें भी नहीं है कहीं पे भी नहीं है v के बाद में डब् की बात करें तो देखिए इसमें नहीं है इसमें भी नहीं है इसमें भी नहीं है इसमें भी नहीं है इसमें भी नहीं है तो कहीं पे भी डब्लू नहीं है तो बेसिकली डब्लू नहीं यूज होगा देन x के बारे में बात करें तो x भी नहीं है कहीं पे भी तो मैं इसे हटा देता हूं अच्छा y की बात करें तो y वन टाइम टू टाइम थ्री टाइम्स y है यहां पे तो y की बात करूं तो y = ट थी टाइम्स आपके पास दिख रहा है एंड देन z की बात करें तो z कहीं पे यूज़ नहीं हुआ है तो इसे हम छोड़ देते हैं तो इस तरह से मैंने क्या किया एक फ्रीक्वेंसी पैटर्न सेट निकाला है और इस फ्रीक्वेंसी पैटर्न सेट को मैं यहां पे लिख लेता हूं दज अ a जो आया है वन टाइम आया है n की बात करें तो ये आपका टू टाइम आया है सी की बात करें ये भी टू टाइम आया है डी की बात करें तो ये वन टाइम आया है ई की बात करें दैट स अ फोर टाइम आया है आई की बात करें तो ये वन टाइम आया है के की बात करें तो ये फाइव टाइम आया है m की बात करें दैट अ थ्री टाइम्स आया है o की बात करें तो ये भी थ्री टाइम्स आया है य की बात करें दैट अ वन टाइम और y की बात करें ट्स अ थ्री टाइम तो इस तरह से हमने क्या किया यहां पर हमारे फ्रीक्वेंसी पैटर्स जो है यहां पर वो मैंने यहां पर निकाल दी हमारा कौन सा प्रोडक्ट कितनी बार बाय हो रहा है यहां पर ट्स वो हमने यहां पे फाइंड आउट कर लिया अब नेक्स्ट टारगेट यहां पे क्या होता है हम यहां पे नेक्स्ट टारगेट के अंदर मिनिमम सपोर्ट्स को फाइंड आउट करते हैं यस मिनिमम हमें सपोर्ट्स को निकालना है यहां पर कि आप कितने सपोर्ट्स को एक्सेप्ट करते हैं तो बेसिकली मिनिमम सपोर्ट की वैल्यू जो है मैं डिसाइड कर रहा हूं देर इज थ्री यस मैं थ्री डिसाइड कर रहा हूं यहां पर कि इसके नीचे वाला हुआ उनको हम कंसीडरेशन नहीं करेंगे और इसके ऊपर वाला हुआ उन्हें हम कं कशन करेंगे तो बेसिकली गाइज मैं बात करूं तो देखो a यहां नहीं आएगा n भी नहीं आएगा n c भी नहीं आने वाला d नहीं आने वाला e आएगा हमारे पास यहां पे i नहीं आएगा क्योंकि वन टाइम यूज़ हुआ है m आएगा o आएगा u भी नहीं आएगा और ये सारी चीजें आएगी तो अब हमने क्या किया इनके फ्रीक्वेंसी पैटर्न सेट्स तैयार कर लिए है जो कि मिनिमम सपोर्ट को क्राइटेरिया को फुलफिल करते हैं एक काम करते हैं इनको सिस्टमैटिक वे के अंदर अरेंजमेंट कर लेते हैं क्योंकि इनकी हमें जरूरत पड़ने वाली है तो सबसे पहले मैं बात करूंगा यहां पर k = 4 की इसकी जरूरत पड़ेगी e सॉरी k = 5 है हमारे पास तो e = टू की बात करें तो फोर हमारे पास आ जाएगा उसके बाद हमारे पास देखिए नीचे यहां पर ये दोनों एलिमिनेट होने के बाद में अब बचे हैं यहां पर m m इक्वल टू क्या है 3 है o इक्वल टू क्या है यहां पर थ्री है एंड y = 3 है राइट ये हमने यहां पे बिल्ड कर दिया अब देखिए पहला स्टेप्स हमने कंप्लीट कर लिया जहां पे हमने क्या निकाला फ्रीक्वेंसी पैटर्न सेट करा अब हमें क्या निकालना है हमें ऑर्डर आइटम सेट्स बनाना है और इस ऑर्डर आइटम सेट से हमें कंडीशनल पैटर्स का ट्री डिजाइन करना है यहां पे बेसिकली तो अब ये कैसे डिसाइड करेंगे जरा देखते हैं यहां पे देखिए हमारे पास ये हमारे प्रोडक्ट के नाम आ चुके हैं जो कि हमें यूज करना है यस ये हमारे जो प्रोडक्ट के नाम है ये हमारे पास आ चुके हैं जो कि हमें यूज़ करना है अब नेक्स्ट टारगेट क्या होगा कि ये जो नाम लिखे हैं इन नाम को अरेंजमेंट करना है इसके अकॉर्डिंग राइट इनके अकॉर्डिंग मुझे अरेंजमेंट करना है मतलब सबसे पहले क्या आएगा यहां पर k आएगा यस सबसे पहले क्या आएगा यहां पर यदि वो नाम है तो हमें उस तरीके से अरेंजमेंट करना पड़ेगा यहां पे तो चलिए अरेंजमेंट करते हैं यहां पे ठीक है तो मैं इसी के जस्ट सामने अरेंजमेंट कर रहा हूं यहां पर यस कि ये अरेंजमेंट कैसे होगा तो सबसे पहले देखिए k आएगा k के बाद में इसमें e है तो e भी आने वाला है यहां पर उसके बाद देखिए m भी है तो मैं m भी लिख लेता हूं यहां पर देन o भी है और देन y भी है तो मैं इस तरह से लिख लेता हूं अच्छा बात करते हैं इस बार प्रोडक्ट के अंदर तो देखिए आपके पास देखो k भी दिख रहा है k के बाद में आपको e भी दिख रहा है e के बाद में बात करें हैं देखिए m m इसके अंदर नहीं है यस m इसके अंदर नहीं है देन o और y है तो मैं o और y ले लूंगा यहां पे राइट अब हमें क्या करना है इसमें भी सर्च करना है तो देखिए इसमें k आ गया k के बाद में देखिए आपके पास यहां पे e e नहीं नजर आ रहा मुझे यहां पर m नजर आ रहा है और y नजर आ रहा है तो मैं यहां पे m और y लिखूंगा अच्छा आप जो नहीं है उनको एलिमिनेट कर सकते हैं हमलोग कैंसिल आउट कर सकते हैं यहां पे जैसे कि देखिए आपके पास k है e है ठीक है m है n नहीं है तो मैं मैं यहां से हटा सकता हूं और बेसिकली डी नहीं है ठी e और के है n नहीं है और y है तो देखिए एक दोती चार प्रोडक्ट हमारे पास आ चुके हैं इस जगह प बात करें तो देखो सी नहीं है ठीक है के है यहां पर के के बाद एम भी है यहां पर य नहीं है और वा है यहां पर यहां बात करें देखो सी नहीं है सी के बाद में बात करें देखो ई आपके पास है यहां पे आई की बात करें तो देखिए आई भी नहीं है यहां पर के और ओ है यहां पर तो मैंने रख दिया इसके अंदर बात करें देखो ए नहीं है ए नहीं है यहां पर तो देखिए e आ गया यहां पर के आ गया और ए आ गया यस इस तरह से हमारा पैटर्न बन गया अब बेसिकली इसके अंदर अरेंज करेंगे तो क्या आएगा k आएगा e आएगा एंड o आएगा इसके अंदर अरेंजमेंट करूं यहां पर तो क्या आने वाला है यहां पर तो यहां पर k आने वाला है e आने वाला है और m आने वाला है तो इस तरह से हमने क्या किया यहां पर ऑर्डर आइटम सेट्स बनाए मतलब ये जो आप देख रहे हैं यहां पर ये जो ऑर्डर आइटम सेट्स आप यहां पे देख रहे हैं ये ऑर्डर आइटम सेट्स मैंने डिज़ाइन कर दिए अब ऑर्डर आइटम सेट्स डिज़ाइन करने के बाद में अब हमें क्या करना है कंडीशनल पैटर्स निकालने हैं यहां पर मतलब मुझे ट्रीज डिज़ाइन करनी है यहां पे अब ये ट्री डिज़ाइन कैसे होगी जरा समझते हैं यहां पे तो पहले ये जो आइटम सेट्स हैं यहां से मैं हटा देता हूं और यहां पर लिख लेता हूं एक जगह पे पे ताकि मेरे पास एक ब्लैंक स्पेस मिल जाए ताकि मैं उसके अंदर अपना जो ट्री प्लांट है वो मैं लिख दूं मतलब जो एक ट्री लाइक स्ट्रक्चर्स हैं वो मैं डिजाइन कर लूं राइट तो अब ये ट्री लाक डिजाइन कैसे बनने वाली है जरा उसको आप डिटेल के साथ समझते हैं देखिए सबसे पहले यदि कोई पर्सन परचेस करने आ रहा है राइट सबसे पहले क्या कर रहा है कोई पर्सन परचेस करने आ रहा है तो उसके पास एक बैग होगा और वो बैग होगा नल आप ऐसे कंसीडर कीजिए कि उसका बैग जो होगा वो एकदम ब्लैंक होने वाला है यहां पे तो सबसे पहले आप इस्तेमाल किससे करेंगे स्माल कहां से करेंगे तो आप नल से आप इसे स्टार्ट करेंगे नल से स्टार्ट करने के बाद में अब आपका जो पहला पर्सन है ये प्रोडक्ट जो लिस्ट ले रहा है यहां पर उनको एक ट्री लाइक स्ट्रक्चर्स यहां पर देना है राइट अब ये ट्री लाइक स्ट्रक्चर किस तरह से देंगे तो सबसे पहले आपके पास क्या आएगा यहां पर k आएगा और k की जो पैटर्स है वो कितनी बार आया है एक बार बाय हुआ है उस k के बाद में इसने क्या बाय किया है यहां पर k के बाद इसने e बाय किया है और e वन टाइम बाय किया है उसके बाद बात करेंगे m के बारे में यस m कितनी बार बाय हुआ है यहां पर यस मैं बात करूं यहां पर m के बारे में तो m कितनी बार बाय हुआ है यहां पे गाइज यहां पे वन टाइम बाय हुआ है देन बात करें o की तो यस o कितनी बार बाय हुआ है यहां पर दैट अ वन टाइम एंड उसके बाद लास्ट में जो को आया है यहां पे दैट अ y तो y आपके पास आ गया वन टाइम मतलब एक ट्री बन गया आपके पास यहां पे एक कस्टमर का अब हमें क्या करना है सेकंड ट्रांजैक्शन का बनाना है या सेकंड कस्टमर का बनाना है तो देखिए k की वैल्यू आपके दोबारा आई है तो मैं यहां पे टू लिख दूंगा e की वैल्यू भी दोबारा आई है तो देन मैं टू लिख दूंगा अब देखिए e के बाद में o आया है m नहीं भाई हुआ है तो मैं यहां से एक ब्रेक डाउन करूंगा यहां पर और यहां बनाऊंगा o कॉलन वन बना दूंगा यहां पर और o के बाद में क्या आ रहा है मेरा y आ रहा है तो मैं y कॉलम वन बना दूंगा राइट इस तरह से हमारे सेकंड ट्रांजैक्शन भी कंप्लीट हो है अब बारी है हमारे थर्ड ट्रांजैक्शन की तो देखिए थर्ड ट्रांजैक्शन के अंदर देखिए k आया है तो मैं k a को कर दूंगा यहां पर थ्री उसके बाद देखिए m आया है सीधा e नहीं आया है तो मैं यहां पे क्या करूंगा m बनाऊंगा यहां पर और m के अंदर क्या करूंगा वन करूंगा m के बाद में क्या है मेरे पास यहां पे y है तो मैं यहां पे ले लूंगा y और y कॉलम वन कर दूंगा तो ये हमारे पास क्या बन गया एक और ट्री बन गया राइट अब बात करते हैं इसके के ओ की बात करते हैं तो देखिए के आपका एक बार और आया यहां पर जैस फोर टाइम करूंगा e जो आपके पास आया थ्री टाइम्स आया तो मैं इसके यहां पे कर दूंगा फिर आपका ओ आया है तो ओ को मैं कर दूंगा यहां पे टू राइट ये आपका सेकंड हो गया अब बात करते हैं थर्ड के बारे में तो देखिए k आया है k के अंदर मैं क्या करने वाला हूं यहां पर फाइव करने वाला हूं यहां पर उसके बाद में देखिए e की बात करते हैं तो e के अंदर मैं एक और बढ़ा लेता हूं यहां पर फो के हिसाब से m के अंदर एक और बढ़ाना है तो m के हिसाब से मैं टू बढ़ा देता हूं तो दैट्ची के अंदर से हमें क्या करना है हमें फाइंड आउट करना है हमारे पैटर्न सेट्स को जो कि हमें ये बताएगा कि आपका प्रोडक्ट कौन सा किस तरह से रिपीटेड हो रहा है ठीक है तो अब मुझे इस ट्री की जरूरत पड़ेगी तो देखिए मैं एक काम करता हूं इस ट्री को हमारे दूसरा जो पेज है वहां पे मैं इसे कंसीडर करवा देता हूं मतलब वहां पे मैं इसे शिफ्ट कर देता हूं तो अब देखिए मैं इस टी को उठाता हूं यहां से राइट एंड देन कॉपी एंड नेक्स्ट वाला जो पेज है यहां पे पेस्ट कर देते हैं ताकि अब हम यहां पे इसे आराम से समझ सके और काम कर सके कि ये कैसे काम करने वाला है राइट चलिए तो मैंने यहां पे पेस्ट कर दिया है और अब इसे हम ओपन कर देते हैं अच्छा पहले हमारे पास क्या था नल था जो कि हमारे पास रह गया पीछे तो कोई बात नहीं इसको मैं यहां लिख देता हूं अब हम बात करते हैं कैसे काम शुरू होगा मतलब हमारे पास जो ये फ्रीक्वेंसी पैटर्न सेट का जो ट्री है यस ये ट्री है ये ट्री कैसे प्लांट करेगा और ये ट्री कैसे रूल्स बनाएगा अब वो हमारी बारी है यहां पर मतलब अब हम यहां पे थर्ड टू फोर्थ स्टेप के अंदर मूव कर रहे हैं राइट अब थर्ड टू फोर्थ स्टेप मूव करते वक्त आपको क्या करना है देखिए सबसे पहले y को आप अलग ले लीजिए यस y को अलग ले लीजिए और y से बनने वाले जितने भी आपके पास आइटम सेट्स है उनकी लिस्ट बनाइए तो देखिए पहले क्या बन रहा है यहां पर ओ एम इ के बन रहा है यहां पर राइट एक ये पैटर्न बन रहा है यहां पे अच्छा वा से देखेंगे यहां पे तो ओ इ के बन रहा है यहां पर तो मैं यहां पे बात करूं तो क्या बन रहा है ओ e और के बन रहा है यहां पर राइट और यदि मैं वा से बात करूं तो m के बन रहा है यहां पर तो मैं यहां पर बनाऊंगा m और k बना लूंगा यहां पर राइट तो ये देखिए कैसे कर रहा हूं यहां पर वापस समझिए का यहां पर क्या कर कर रहे हैं हम यहां पर देखिए इस y से मैं कहां जा रहा हूं ऊपर की तरफ जा रहा हूं मूव कर रहा हूं तो ये वाला बन रहा है ओ इ एम के यस ओ के बन रहा है इस y से बात करूं तो देखिए यहां से इस तरह से मूव कर रहा है राइट तो ये जिस तरह से मूव कर रहा है मैंने वही लिखा है यहां पर बेसिकली ठीक है अब बनते हैं y के बाद आगे बढ़ते हैं यहां पर y के बाद नेक्स्ट डकेट क्या है हमारा o रहेगा यहां पर यस आप यहां पर o ले सकते हैं ठीक है तो मैं o को ही कंसीडर करूंगा तो देखिए मैंने o को कंसीडर किया है और o के हिसाब से देखूं तो m के बन रहा है यहां पर यस m के बन रहा है यहां पर और यहां पे बात करूं ओ के बारे में तो e के बन रहा है यहां पर तो मैंने यहां पे e डिसाइड कर लिया यहां पर अब बारी है किसकी m की बारी है तो चलिए m के ऊपर डिज़ाइन करते हैं m के ऊपर क्या आ रहा है e आ रहा है यहां पर तो मैं e के रख देता हूं यहां पर और इस m के ऊपर देखेंगे तो केवल और केवल क्या आ रहा है k आ रहा है तो इस m के ऊपर केवल और केवल क्या आ रहा है k आ रहा है अब बारी है किसकी e की तो e के ऊपर बात करें तो आपके पास क्या आ रहा है k आ रहा है केवल और केवल और कुछ भी नहीं आ रहा यहां पर और लास्ट हमारा k रह गया तो उसके तो है ही नहीं यहां पर है ना तो बेसिकली ये हमारे पास क्या बन गया एक ट्री लाक स्ट्रक्चर बन गया अब यहां से हम हमारा रूल निकालेंगे रूल निकालने के लिए पहला रूल क्या है यहां पर देखिए रूल्स क्या क्या है यहां पर देखिए आपके पास ये जो तीन बास्केट बने हैं यस ये जो तीन बास्केट बने है इनमें कॉमन टर्म्स कौन-कौन स है आप उन्हें फाइंड आउट कर लीजिए तो बेसिकली देखिए यहां पर के दिख रही है यहां पे भी दिख रही है k यहां पे भी दिख रही है k देखिए e इसमें है e इसमें है लेकिन e इसमें नहीं है तो बेसिक तौर पे बात करूं यहां पर तो केवल और केवल के ही आएगा बात करते हैं इस बारे में देखिए ई के यहां दिख रहा है इ के यहां दिख रहा है तो बस यहां पर इ के ही दिख रहा है m नहीं दिख रहा है तो उसे छोड़ दूंगा मैं यहां पे इन दोनों में भी मुझे के ही दिखाई दे रहा है अब क्या रूल बना है जरा देखिए यहां पर देखिए जब आप y को लेने जा रहे हैं तो इसके सपोज इसके बाद में क्या कर रहे हैं आप यहां पर k को ले रहे मतलब k के बाद आप y को इस्तेमाल कर रहे हैं आप ऐसा बोल सकते हैं यहां पे राइट इसके अंदर बात करें यहां पर तो देखिए आप क्या ले ले रहे k देन e एंड देन आप क्या कर रहे हैं o को बाय कर रहे हैं तो ये एक पैटर्न सेट आपका ये तैयार हो गया नीचे बात करें यहां पर तो देखिए आपके पास क्या बन रहा है k ए बन रहा है यहां आपके पास एक पैटर्न सेट तो आप ये ले सकते हैं राइट और सबसे नीचे तो e के बन ही रहा है यहां पे अब जहां तीन बन रहे हैं वहां की बात करते हैं यहां पे तो देखिए e सबसे पहले k आया देन e आया एंड देन o आया तो अब इसके अंदर पैटर्न की बात करूं तो क्या-क्या पैटर्न बने जा सकते हैं इसके अंदर से राइट इन तीन के अंदर तो सबसे पहले देखिए े बनेगा दैट अ क्लियर है यहां पे फिर देखिए यहां पे k भी बना सकते हैं आप यहां पर यस और फिर क्या बना सकते हैं केइओ भी बना सकते हैं यहां पे तो यह पैटर्न सेट तीन तैयार हो र है मतलब आप इन दोनों को कंबाइन ले सकते हैं इन दोनों को कंबाइन ले सकते हैं या इन तीनों को कंबाइन के तौर पे ले सकते हैं तो इस तरह से आपके पास क्या होगा यहां पर आपके पैटर्न सेट बन जाएंगे तो एप ग्रोथ एल्गोरिथम आपके पास किस तरह से फाइंड आउट करता है पहले आप लाख स्ट्रक्चर्स बनाते हैं देन उसके बाद यहां पे वर्क करता है तो यह किस तरह से कर रहा है तो देखिए इसके अंदर से रिजल्ट क्या निकला के के और के ओ निकला यहां पर तो ये तीन पैटर्स यहां पे निकले हैं जो कि इसके अंदर वर्क करते हैं तो इस तरह से क्या करता है आप भी एक्वी ग्रोथ एल्गोरिथम आपके पास ये जो चार रूल्स आप देख रहे हैं इन चार रूल्स की हेल्प से क्या करता है फाइंड आउट करके देता है यहां पर आपके पास जो भी फ्रीक्वेंसी पैटर्स हैं मतलब आपके पास पहले के बाद में दूसरा कौन सा रिपीटेशन हुआ है और आज के इस वीडियो के जरिए हम बात करेंगे एफपी ग्रोथ एल्गोरिथम के बारे में देखिए लास्ट वाले वीडियो के अंदर हमने एफपी ग्रोथ एल्गोरिथम को बहुत डिटेल के साथ समझा था और और आज की इस वीडियो के जरिए हम इसके प्रैक्टिकल इंप्लीकेशन को समझने वाले हैं देखिए मैं आप लोगों को सजेस्ट करूंगा यहां पर कि आप एप्पी ग्रोथ एल्गोरिथम के प्रैक्टिकल को देखने से पहले अपयोरी वाला जो एल्गोरिथम का जो प्रैक्टिकल है उसे देख लीजिए क्योंकि वहां पर मैंने काफी चीजें बहुत डिटेल के साथ समझाई है और वही पार्ट यहां पर कुछ रिपीट होने वाला है यहां पर बस एक एल्गोरिथम को छोड़ के एल्गोरिथम मैं यहां पर वापस नहीं लगाने वाला हूं यहां पर बाकी काफी पार्ट यहां पर रिपीटेशन होने वाला है पहले इस वीडियो को अच्छी तरीके से देख लीजिए देन इसके ऊपर आइएगा यहां पर और यदि आपने वो वीडियो देख ली है तो देन वेल एंड गुड है और नहीं देखी है तो प्लीज आप उसे देख लीजिए और इस वीडियो पेप फिर बाद में वापस रिटर्न कीजिए अब मैं बात करूंगा यहां पर एपी ग्रोथ एल्गोरिथम कैसे वर्क करती है यहां पर इसका प्रैक्टिकल इमिटेशन क्या है यहां पर तो उसको जरा समझते हैं यहां पर तो देखिए एपी ग्रोथ एल्गोरिथम मार्केट बस के एनालिसिस के लिए इस्तेमाल की जाती है तो पहले मैं आपको थोड़ा मार्केट का एनालिसिस का डटा दिखा देता हूं यहां पर तो देखिए ये रहा हमारा डाटा यहां पर जो कि एक मार्केट का डाटा है जैसा कि हमने लास्ट टाइम भी यूज़ किया था अ प्यूरी के अंदर वही डाटा मैं दोबारा यहां पे यूज़ कर रहा हूं यहां पर और ये डाटा आप देख पा रहे हैं यहां पर इसके अंदर कौन सा पर्सन क्या क्या चीजें परचेस करके गया है वो हमें दिख रहा है यहां पर और टोटल 11 आइटम्स यहां पर बाय किए हैं किसी पर्टिकुलर पर्सन ने यस मैं बात करूं यहां पर जैसे कि आप गए तो आपने 11 आइटम बाय किए मैं गया तो मैंने केवल चार आइटम ही बाय किए हैं तो उस तरह का कुछ डाटा हमने क्या कर रखा यहां पर इकट्ठा कर रखा है अब इस डाटा के ऊपर हम क्या कर रहे हैं हम यहां पर एफबी ग्रोथ एल्गोरिथम को अप्लाई करेंगे और हम ये फाइंड आउट करेंगे कि आपके पास पहला जो बाय प्रोडक्ट है उसके बाद जो उसका सिमिलर बाय प्रोडक्ट मतलब उसके बाद जो बाय प्रोडक्ट हो रहा है यहां पर वो कौन सा है ये चीज हम यहां पर निकालने की कोशिश करेंगे तो चलिए जुपिटर नोटबुक के ऊपर चलते हैं और इसे जरा समझते हैं तो सबसे पहले मैं क्या कर रहा हूं यहां पर पांडा को इंपोर्ट करता हूं सबसे पहले यस हमारे लिए ज जरूरी चीजें है यहां पर फिर यहां पर डिस्प्ले सेट ऑप्शन को इस्तेमाल करूंगा ताकि मैं अपने डेटा सेट को पूरा अच्छे तरीके से एनालिसिस कर सकूं और उसके बाद मैं अपने डेटा सेट के ओपन करूंगा यहां पर डटा सेट को ओपन करने के बाद इसके हैड लगा के तीन-चार डाटा को देखने की देखेंगे यहां पर जो कि हमें यहां पर देखने को मिल रहा है अब उसके बाद हम हमारे डेटा सेट के शेप देखेंगे कि कितना डाटा है यहां पर और यहां पर मैंने अपना एक डेटा सेट तैयार करने की कोशिश की है जो कि मेरे लिए आगे रिक्वायर्ड भी होने वाला है यहां पर मतलब ये डाटा जो हमारे पास यहां पर है इसके अंदर नैन वैल्यू आपके पास है इस नैन वैल्यू को हटाना है हमें यहां पर और बेसिकली हमें एक लिस्ट के अंदर एक और लिस्ट डालनी है मतलब एक मार्केट की लिस्ट के अंदर छोटे-छोटे कस्टमर्स की लिस्ट डालनी है राइट ऐसा कुछ करना है हमें यहां पर उसके लिए मैंने यहां पर एक बेसिकली अ कोड लिखा है यहां पर बेसिकली उसके जरिए मैंने ये काम किया है यहां पर तो मैं यहां पर देखिए मार्केट की थोड़ी लिस्ट दिखा दूं ये कैसे बनी है यहां पर तो देखिए सबसे पहले एक लिस्ट है उस लिस्ट के अंदर जो पहला कस्टमर आया है उसकी आपको लिस्ट दिख रही है उसके बाद जो दूसरा कस्टमर आया उसकी लिस्ट दिखी है यहां पर उसके बाद जो तीसरा कस्टमर आ है उसकी लिस्ट आपको मिल रही है उसके बाद जो चौथा कस्टमर आया उसकी लिस्ट मिल रही है तो बेसिकली ऐसे करते हुए मैंने क्या कर रखा है यहां पर सारी जो लिस्ट है वो मैंने क्या कर ख है यहां पर बना रखी है तो बेसिकली एक डेटा तैयार किया यहां पर अब ये डेटा कैसे तैयार किया है ये डाटा तैयार करने के लिए आपको थोड़ा सा यहां पे अपय एल्गोरिथम काली जो वीडियो है वो देखनी पड़ेगी राइट उसके बाद में देखिए मैंने यहां पे क्या कर रखा है यहां पर मैं अपने देखना चाहता हूं प्रोडक्ट को कि कौन सा सबसे ज्यादा बाइंग प्रोडक्ट है वो चीज देखना चाहता हूं तो उसके लिए मैंने क्या किया यहां पर एक लिस्ट तैयार की है उस लिस्ट के अंदर सारा डाटा एक साथ डाल दिया है क्योंकि हम यहां पर इस्तेमाल कर रहे हैं कलेक्शन मॉड्यूल का और कलेक्शन मॉड्यूल हमें क्या करता है काउंटिंग करके देता है कि कौन सा डाटा कितनी बार रिपीटेशन यहां पर हुआ है उसके बाद चलते हैं आइटम डेटा सेट के अंदर और आइटम डेटा सेट के बाद में मैं यहां पर एक डेटा फ्रेम तैयार कर रहा हूं यहां पर जिसके थ्रू हमें ये पता चल रहा है यहां पर कि कौन सा सबसे बाइंग प्रोडक्ट है तो सबसे ज्यादा बाइंग प्रोडक्ट कौन सा है होल मिल्क है उसके बाद हमारा अदर वेजिटेबल्स है उसके बाद हमारा रोज बिनस है उसके बाद हमारा सोडा है फिर योग वेस्ट है एंड देन यहां पर रूट वेजिटेबल्स है और उसके बाद बॉटल वाटर है यस बॉटल वाटर है यहां पर एंड आपके पास क्या है टिपिकल फ्रूट्स है तो ऐसे करके बहुत सारा डाटा यहां पर दे रखा है जो कि रिपीटेशन यहां पर डटा है राइट अब हमें क्या करना है हमें वो डाटा निकालना है जो सबसे ज्यादा फ्रीक्वेंसी है लेकिन उससे पहले हमें क्या करना है हमारे डाटा को इनकोडिंग करनी पड़ेगी इनकोडिंग किस तरह से करनी है तो बेसिकली इसके बारे में थोड़ा सा हम जान लेते हैं कि ये इनकोडिंग होगी कैसे तो ये इनकोडिंग जानना बहुत ज्यादा जरूरी है यदि आपने लास्ट वाले वीडियो के अंदर भी नहीं देखा तो कोई बात नहीं इसमें देख लीजिए आपके पास जैसे जसे कोई पर्सन ए है राइट ए प्रोडक्ट a को बाय करता है बी को बाय करता है सी को बाय करता है बी जो पर्सन है यहां पर वो a और केवल बी को ही बाय करता है सी जो पर्सन है वो ए और आपका सी को ही बाय करता है यहां पर तो कुछ इस तरह से अब हमें क्या करना है यहां पर इनकोडिंग करनी है बेसिकली हमें यहां पर एक डेटा सेट तैयार करना है जिसके अंदर ऊपर जो कॉलम के नाम आपके पास बनेंगे यहां पर वो क्या बनेंगे वो आपके पास आइटम के नाम बनेंगे जैसे a बी और c यहां पर आपके कस्टमर के नाम आ जाएंगे जैसे कि ए हो गया यहां पर दैट इज अ कैपिटल p हो गया c हो गया अब इसके अंदर जो आपका डाटा आ रहा है जैसे a आ रहा है तो a की जगह आपके पास क्या मिलेगा ट्रू मिलेगा b की जगह भी आपको ट्रू मिलेगा स उसने बाय किया है तो ट्रू मिलेगा अच्छा b बाय किया है यस अ b के अंदर a ने बाय किया है यस बाय किया है तो ट्रू मिल जाएगा यहां पे भी ट्रू मिल जाएगा c बाय नहीं किया है तो उसकी जगह फॉल्स मिल जाएगा स की बात करें तो यहां पर आपको ट्रू मिल जाएगा यस a बाय किया है इसलिए और ब बाय नहीं किया है तो बी बाय नहीं किया है तो इसकी जगह फाल्स होल जाएगा c बाय किया है तो c बाय करने की जगह ट्रू मिल जाएगा तो बेसिकली हमारे पास क्या होगा इस तरह का एक डेटा सेट तैयार हमें हो जाएगा जो कि आगे चलते हुए हमारी एफबी ग्रोथ एल्गोरिथम के लिए जरूरी है राइट तो हमने क्या किया बेसिकली इस ट्रांस इनकोडर की हेल्प से यस ये जो हमने यहां पर जो ट्रांस इनकोडर यहां पर इस्तेमाल किया है इस ट्रांस इनकोडर की हेल्प से हमने इस तरह का एक डटा सेट तैयार किया है चलिए मैं इसे रन कर लेता हूं और यहां पर रन कर लेता हूं और ये भी रन कर लेता हूं राइट तो ये हमने यहां पे क्या किया है सबसे पहले ट्रांस एडर का इस्तेमाल किया है फिर मॉड डट फिट किया है फिट करने के बाद में हमने क्या किया यहां पे ट्रांसफॉर्म किया है और ट्रांसफॉर्म का एक डेटा फ्रेम तैयार कर लिया है और डेटा फ्रेम यदि मैं आपको दिखाऊ दिखाऊ तो ये कुछ इस तरह का आपको दिखेगा राइट सब हमारे पास ऊपर जो है वो प्रोडक्ट के नाम हो जाएंगे और उसके बाद ये हमारे सारे क्या हो जाएंगे कस्टमर्स हो जाएंगे और उन्होंने जो जो प्रोडक्ट बाय किया है उसकी जगह ट्रू फॉल्स ट्रू फॉल्स आपको देखने को मिल जाएगा राइट तो इस तरह से हमारा जो डेटा सेट है वो तैयार हो जाएगा अब हमारी बारी है यहां पर एफपी ग्रोथ एल्गोरिथम अप्लाई करने की तो देखिए एफपी ग्रोथ एल्गोरिथम कैसे अप्लाई होगी तो मैं चलूंगा यहां पर फ्रॉम एमएल एक्सटें के पास चलूंगा यहां पर एमएल एक्सटें के अंदर जाने के बाद में मैं इस्तेमाल करूंगा यहां पर किसका फ्रीक्वेंसी पैटर्न का यस इसका इस्तेमाल करने वाला हूं और फ्रीक्वेंसी पैटर्न सेट के अंदर आपको मिलेगी एफपी ग्रोथ यस इस एफपी ग्रोथ का आपको इस्तेमाल करना है चलिए ये जो एफपी ग्रोथ आपके पास आई है यहां पर इसका हम इस्तेमाल करेंगे फ्रीक्वेंसी डेटा सेट को निकालने के लिए और इसके अंदर सबसे पहले हमें क्या चाहिए डीएफ चाहिए डीएफ का मतलब क्या है गाइज यहां पे हमारा डेटा फ्रेम चाहिए मिनिमम हमें सपोर्ट चाहिए यूज कॉलम ने मतलब हमें कॉलम नेम का यूज करना है मैक्सिमम लेंथ कितनी है ये सब चीजें हमें जरूरत चाहिए अच्छा वेर बॉस का मतलब क्या होता है वेयर बॉस का मतलब होता है बेसिकली सिंपल सा कि यदि आपके अपने प्रोसेसर को साथ-साथ देखना है कि ये प्रोसेसर कैसे वर्क कर रहा है तो उसके लिए आप इस तर तो माल कर सकते हैं अदर वाइज इसे छोड़ दीजिए चलिए सबसे पहले हमें डेटा फ्रेम देना है तो मैं यहां पे डटा फ्रेम दे देता हूं यहां पर कॉमा लगा के फिर हमें जरूरत पड़ेगी मिनिमम सपोर्ट की तो मैं मिनिमम सपोर्ट दे रहा हूं 0.07 पर यहां पे दे रहा हूं अब आप बोलेंगे 0.07 क्यों दिया है क्योंकि देखिए दैट इज अ मार्केट डाटा और मार्केट डाटा के अंदर बहुत ही अ बहुत ही बहुत ही मिनिमम चांसेस होते हैं कि कोई प्रोडक्ट आपके पास फ्रीक्वेंसी बाय हो रहा है यहां पर बहुत ही कम है यहां पर इसलिए हम यहां पे कह रहे हैं मिनिमम सपोर्ट 0.07 रख रहे है यदि हमें लगेगा कि ये सपोर्ट कम है तो हम इसकी वैल्यू को बढ़ा भी देंगे दैट इज अ हाइपर पैरामीटर यस इस हाइपर पैरामीटर को हम चेंजेज कर सकते हैं बात करते हैं हम यहां पे आगे आगे हैं यहां पे यूज़ कॉलम नेम यस हमें यूज़ कॉलम नेम करना है कॉलम का नाम हमें यूज़ करना है तो बेसिकली इसके लिए मैं यहां पर ट्रू करूंगा उसके बाद है आपके पास यहां पर मैक्सिमम लैन मैक्सिमम लें के अंदर मुझे यहां पर तीन लेंथ तक का डाटा मुझे यहां पर देखना है और मैं रन करूंगा तो देखिए मेरे पास वो डटा आ चुका है जो कि बार-बार आपका रिपीटेशन कर रहा है अब देखिए यहां पर डाटा जो हो रहा है वो आपके पास कुछ भी आ रहा है ऊपर नीचे कुछ भी आ रहा है लेकिन जो फ्रीक्वेंसी पैटर्न सेट हमें देखने को मिला है 0.07 पे भी वो क्या मिला है अदर वेजिटेबल मिला है चलिए पहले हम क्या करते हैं शॉटिंग कर लेते हैं शॉटिंग करने के लिए मैं यहां पे क्या करूंगा डॉट शॉर्ट का इस्तेमाल करूंगा यहां पर यस मैं यहां पे ऐसे क्या करने वाला हूं शॉर्ट करने वाला हूं और शॉर्ट बाय क्या करने वाला हूं वैल्यू का इस्तेमाल करूंगा यस पहले मैंने यहां पे कहीं इस्तेमाल किया होगा तो ये देखिए शॉर्ट बाय वैल्यूज का इस्तेमाल कर रहा हूं बेसिकली वो शो नहीं हो रहा है राइट तो मैं यहां पे शॉर्ट बाय वैल्यू का इस्तेमाल करूंगा और शॉर्ट बाय वैल्यूज के अंदर मैं इस्तेमाल करूंगा यहां पे बाय का और बाय के अंदर हम किसके थ्रू शॉर्ट कर रहे हैं हम बेसिकली सपोर्ट के थ्रू से शॉटिंग करने वाले हैं एंड देन जैसे ही मैं रन करूंगा देखिए 0.07 के ऊपर जो मेरे पास रिपीटेशन प्रोडक्ट है वो कौन सा है अदर वेजिटेबल एंड होल मिल्स ही मुझे मिल रहा है मतलब देखिए यहां पर 0.07 होते हुए भी आप देखेंगे ना तो यहां पर केवल और केवल एक ही प्रोडक्ट का नाम आया है बाकी अदर प्रोडक्ट तो आपके सिंगल सिंगल प्रोडक्ट आ र हैं तो उनके सिंगल सिंगल प्रोडक्ट के सपोर्ट दिख र है लेकिन ये दो प्रोडक्ट एक साथ का सपोर्ट 0.7 केवल और केवल सिंगल ही आया है इसके अलावा और आया नहीं है यहां पर तो बेसिकली मिनिमम सपोर्ट की वैल्यू और कम करनी पड़ेगी जब जाके हमारे पास और भी नाम आने वाले हैं यहां पर देखिए मेरे पास और कम करने पर क्या-क्या नाम आया अदर वेजिटेबल अदर वेजिटेबल और होल मिल्स का आया यहां पर उस उसके बाद थोड़ा और चलू तो यहां पे होल मिल्क और योगश आया यहां पर और होल मिल्स एंड रोल बिल्स आ यहां पर तो ये कुछ प्रोडक्ट के नेम है जो कि आपके पास रिपीटेशन कर रहे हैं मतलब कोई पर्सन यहां पर होल मिल्क बाय कर रहा है तो वो अदर वेजिटेबल को भी बाय कर रहा है और यदि कोई पर्सन अदर वेजिटेबल को बाय कर रहा है तो वो होल मिलक को भी यहां पर बाय कर रहा है तो ये दो प्रोडक्ट ऐसे हैं जो आपके साथ क्या कर रहे हैं साथ-साथ बाय आपके पास हो रहे हैं और आज के इस वीडियो के जरिए हम बात करने वाले हैं यहां पर असेंबल लर्निंग के बारे में कि असेंबल लर्निंग होती क्या है और ये काम कैसे करती है देखिए असेंबल लर्निंग के अंदर आपके पास आपके जो मॉडल है उसको इंप्रूव किया जाता है आज के टाइम के अंदर जो सबसे ज्यादा यूज आने वाली जो टेक्निक है दैट इज कॉल्ड ऑफ असेंबल लर्निंग देखिए आप कितने भी कंपटीशन एग्जाम को देखते हैं चाहे आप हैक रं का कंपटीशन एग्जाम देखें या केगल कंपटीशन को देखें तो वहां पे भी जितने कंपटीशन होते हैं उन कंपटीशन को जीतने वाला जो आपका प्रोजेक्ट होता है या फिर मैं बात करूं जीतने वाला जो मॉडल होता है है वो असेंबल लर्निंग से बना हुआ होता है अब असेंबल लर्निंग काम कैसे करती है इसको थोड़ा सा देखते हैं यहां पर कि आपके मॉडल को इंप्रूव कैसे करती है इसको जरा देखें तो इसको एक छोटे से एग्जांपल से समझते हैं यहां पर लेट्स सपोज अज्यू कीजिए कि आप एक कोई नोवल लिखते हैं अब आप एक नोवल राइटर नहीं है लेकिन उसके बाद भी आप एक बहुत अच्छी नोवल लिखने की कोशिश करते हैं और आपको एक नोवल लिखते हैं अब ये नोवल लिखने के बाद में आप क्या करते हैं अपने किसी एक फ्रेंड को जाके दिखाते हैं कि भाई ये नोबल कैसे लिखी हुई है तो आपका फ्रेंड आपका बहुत अच्छा फ्रेंड होगा तो वह आपको कभी भी डी मोटिव नहीं होने देगा यह जो नोवल है यहां पर वो बहुत अच्छी है और आप इसे क्या करते हैं अपने पॉइंट्स को नोट डाउन कर लेते कि हां ये नोवल बहुत अच्छी है देन आप उसे क्या कर देते हैं पब्लिश करवा देते हैं और पब्लिश करा के आप उसकी कॉपी मार्केट के अंदर सेल कर लेते हैं अब जैसे ही आपने उस कॉपी को मार्केट के अंदर सेल किया तो उसकी सेलिंग हुई नहीं और वो जीरो हो गई क्योंकि वो एक्चुअल में वो नोबल इतनी अच्छी नहीं थी अब इस केसेस में आप अपने फ्रेंड को बोलते हैं कि यार मेरी नोबल तो बिकी नहीं है यहां पर अब कैसे ये रीजन क्या है यहां पर तो वो अब आपको सीरियस रीजन बताता है कि एक्चुअल में आपकी जो नोवल है वो अच्छी नहीं थी बट एज अ गुड फ्रेंड मैंने आपको बोल दिया कि ये नोवल अच्छी है राइट तो अब ऐसे सिनेरियो के अंदर आप क्या करेंगे आप सिंपल सा एक ही काम करेंगे आप उस नोबल को लेंगे और उस नोबल को लेके आप एक जिने को नहीं आप डिफरेंट डिफरेंट जो आपके पास यहां पे पर्सन है उनको यह नोवल सुनाएंगे कि देखिए ये नोवल ऐसी है आप बताइए क्या रिव्यू है आपका यहां पर अब सब यहां पर डिफरेंट डिफरेंट अपने रिव्यू देंगे और डिफरेंट डिफरेंट रिव्यूज देने के बाद में जो आपके पास जो सबसे अच्छे रिव्यूज होंगे जिनके सबसे ज्यादा अच्छे रिव्यूज होंगे यहां पर उनको आप गैप कर लेंगे जैसे आपने पांच लोगों को नोवल सुनाई अब पांच लोगों को नोवल सुनाने के बाद में उनमें से तीन लोगों ने बोला कि दैट अ गुड नोवल या चार लोगों ने बोला कि दैट अ गुड नोवल यस आप इसे पब्लिश करवा दीजिए तो अब आप जब इसे पब्लिश कराके मार्केट में बेचेंगे तो बेसिकली इसकी जो सेल है वो बहुत अच्छी होने वाली है लेकिन यदि पांच में से चार लोगों ने बोल दिया कि यह बहुत ही बेकार नुबल है तो आप क्या करेंगे उसे पब्लिश नहीं कराएंगे और आप दोबारा रिराइज जाएंगे सेम एज हमारी असेंबल लर्निंग के अंदर भी होता है असेंबल लर्निंग क्या है गाइस यहां पर बेसिकली एक सिंगल डटा सेट के ऊपर आप एक सिंगल मॉडलर ट्रेन करने की जगह आप क्या करते हैं एक सिंगल डाटा सेट के ऊपर मल्टीपल मॉडल्स ट्रेन करते हैं अब मल्टीपल मॉडल्स आपने ट्रेन किया है तो बेसिकली मल्टीपल मॉडल्स के जितने भी आपने मॉडल्स यूज किए हैं यहां पर वो क्या करते हैं अपनी पावर लगाते हैं जैसे कि आपने बोला कि ये एक डेटा सेट है इस डेटा सेट के ऊपर मैं डिसीजन ट्री एसवीएम सपोर्ट वेक्टर मशीन और के नियर्स नेबर तीनों मॉडल एक साथ अप्लाई करना चाहता हूं और एक साथ इनके आंसर्स देखना चाहता हूं तो तीनों मॉडल जब एक साथ वर्क करेंगे तो तीन अलग-अलग डिफरेंट डिफरेंट आंसर देंगे अब तीन में से आपके पास दो मॉडल उसके फेवर में मतलब राइट आंसर की फेवर में जा रहे हैं और एक आंसर थोड़ा सा डिग बिका रहा है यहां पर तब भी आपको जो एक्यूरेसी मिलेगी वो क्या मिलेगी की हायर मिलने वाली है तो बेसिकली असेंबल लर्निंग के अंदर हम क्या करते हैं गाइस यहां पर कि हम क्या करते हैं डिफरेंट डिफरेंट मॉडल को सेम मॉडल के ऊपर सेम टाइम के अंदर ट्रेड करते हैं और फिर उन डिफरेंट डिफरेंट मॉडल का जो भी आंसर होता है उन आंसर को कंबाइन करके एक सिंगल आंसर आपके सामने देते हैं दैट इज अ टेक्निक ऑफ असेंबल लर्निंग यस ये आपके स क्या कहलाती है असेंबल लर्निंग कहलाती है नाम से पता चल रहा है असेंबल यस असेंबल करने का मतलब क्या है पार्ट्स को ऐड ऑन करना तो बेसिकली आपके पास एक डाटा सेट के ऊपर एक मॉडल को ट्रेन करने की जगह आप डिफरेंट डिफरेंट मॉडल को एक साथ ट्रेन कर दीजिए दैट इज कॉल ऑफ असेंबल लर्निंग यस यदि आपको पाइथन मशीन लर्निंग डेटा साइंस एंड डेटा एनालिस जसी फील्ड में अपने आपको को ग्रो करना है तो इसके लिए डब्ल्यू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जवाइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं चलिए अब जरा इसकी डेफिनेशन पे आते हैं यहां पर तो देखिए असेंबल लर्निंग या असेंबल मैथ थर्ड्स आप इसे बोल सकते हैं यहां पर असेंबल लर्निंग इज द कॉमिनेशन ऑफ यस इज द कॉमिनेशन द इनसाइड द ओरिएंटेड मल्टीपल लर्निंग मॉडल्स यस आपके क्या करता है मल्टीपल लर्निंग मॉडल्स इसके अंदर दिए जाते हैं यहां पर 10 एक्यूरेट एंड इंप्रूव योर डिसीजन आपके डिसीजन और एक्यूरेट आंसर्स के लिए कैपेबल होता है तो बेसिकली गाइज मैं यहां पे बात करूं यहां पर तो असेंबल लर्निंग क्या दैट अ टेक्निक इ अ सिंपल टेक्निक है यहां पर जिसके अंदर आप क्या कर रहे हैं मल्टीपल मॉडल्स को एक साथ देख आप इसे ट्रेन करते हैं अब बात करते हैं कि असेंबल लर्निंग होती कितने तरीके की है तो बेसिकली असेंबल लर्निंग आपके पास दो तरीके की होती है दैट इ द फर्स्ट वन इज़ बैगिंग और सेकंड वन इज बूस्टिंग और बेसिकली ये क्या है मेन है यहां पर इसके अलावा भी बहुत सारी टेक्निक्स होती है उनके बारे में हम डिस्कस करेंगे लेकिन यह कोर टेक्निक है दैट इज अ बैगिंग एंड बूस्टिंग अब जानते हैं कि ऐसे कौन-कौन से एल्गोरिथम है जो कि असेंबल लर्निंग के अंदर काम करती है तो उनके अंदर मैं बात करूं टेक्निक के अंदर तो सबसे पहले आती है आपकी बेसिक टेक्निक यस सबसे पहले आपके पास क्या आती है बेसिक टेक्निक बे बेसिक टेक्निक के अंदर यदि मैं बात करूं यहां पर गाइस तो बेसिक टेक्निक के अंदर आपके पास कौन-कौन सी होती है मैक्स वोटिंग होती है एवरेज वोटिंग होती है और वेटेज एवरेज वोटिंग आपके पास देखने को मिलती है ये तीन तरीके की आपके पास क्या होती है बेसिक आपके पास असेंबल लर्निंग होती है फिर उसके बाद आती है आपकी एडवांस असेंबल लर्निंग एडवांस असेंबल लर्निंग के अंदर चलते हैं टेक्निक के अंदर तो इसके अंदर आपके आती है स्टार्टिंग आती है यस क्या आती है स्टार्टिंग आती है उसके बाद आपकी ब्लडिंग आती है बैगिंग आती है एंड बूस्टिंग आती है और जो सबसे ज्यादा आज के टाइम के अंदर पॉपुलर टेक्निक के अंदर आप लेंगे यहां पर तो वो कौन सी है बैगिंग एंड बूस्टिंग यस ये देन दो वन ऑफ द मोस्ट इंपॉर्टेंट टेक्निक और वन ऑफ द मोस्ट आपके पास यहां पर पॉपुलर टेक्निक इज द बैगिंग एंड बूस्टिंग अब बात करते हैं कि इस बैगिंग और बूस्टिंग के अंदर और कौन-कौन सी एल्गोरिथम्स आती है गाइज यहां पर तो यदि आप बैगिंग को थोड़ा और डिटेल के साथ जाएंगे तो इसके अंदर आपको क्या मिलेगा बैगिंग मीटा एस्टिमेटर मिलेगा और सेकंड जज मिलेगा आपको रैंडम फॉरेस्ट आपको मिलेगा थर्ड सेकंड चले यहां पर आपके पास बूस्टिंग के अंदर बात करें यस बूस्टिंग के अंदर बात कर तो बूस्टिंग के अंदर कौन-कौन सी होती है डा बूस्ट होती है आपके पास जीब बूस्ट होती है एकज बूस्ट होती है यहां पर लाइट बूस्ट है आपके पास यहां पर और कैट बूस्ट है तो गाइ ये आपके पास क्या है बूस्टिंग के एल्गोरिथम्स है तो गाइ असेंबल लर्निंग क्या है गाइ यहां पर डिफरेंट डिफरेंट मॉडल का कॉमिनेशन है ताकि आप इससे अपने मॉडल को क्या करें इंप्रूव कर सकें एक्यूरेट कर सकें ओवर फिटिंग से बचा सकें इनके लिए इस्तेमाल की जाती है और इसके अंदर दो मेजर इंपोर्टेंट टेक्निक्स है दैट अ बैकिंग और बूस्टिंग इसके अलावा भी कुछ बेसिक टेक्निक है जिसमें वोटिंग आ गई आपके पास यहां पर यस वोटिंग वाली आपके पास हो गई यह आपके पास टेक्निक होती है लेकिन दो मेजर इंपॉर्टेंट टेनिंग है दे इज अ बैगिंग और बूस्टिंग आने वाले वीडियो के अंदर हम क्या करेंगे असेंबल लर्निंग को और ज्यादा डिटेल के साथ देखेंगे कि यह कैसे काम करती है इसके अंदर सबसे पहले बेसिक टेक्निक से हम इस्तेमाल करेंगे स्टार्ट करेंगे जिसके अंदर मैक्स वोटिंग एवरेज वोटिंग वेटेज एवरेज वोटिंग इनको हम डिस्कस करने वाले हैं देन फर्द फिर हम मूव करेंगे यहां पर बैगिंग एंड बूस्टिंग के ऊपर जिसके अंदर हम बैगिंग को डिस्कस करेंगे और बूस्टिंग को हम डिस्कस करने वाले हैं तो चलिए जरा आप समझते हैं ये मैक्स वोटिंग कैसे वर्क करता है यहां पर तो देखिए मैक्स वोटिंग किस वक्त काम करेगा तो मैक्स वोटिंग आपके पास उस वक्त काम करेगा जब आपके पास किस तरह का डाटा हो क्लासिफिकेशन एनालिसिस का डाटा हो यहां पर यस क्लासिफिकेशन एनालिसिस का मतलब क्या है गाइज यहां पर यदि आपका जो आउटपुट है यदि ये आउटपुट आपके पास क्लासेस के अंदर डिवाइडेड है तब आप क्या करते हो यहां पर मैक्स वोटिंग का इस्तेमाल करते हो और इसके लिए जो असेंबल लर्निंग की जो टेक्निक काम आती है गाइज यहां पर इस असेंबल लर्निंग टेक्निक के अंदर आप इस्तेमाल करते हो आपके पास वोटिंग यस इसके लिए आप क्या इस्तेमाल करते हैं यहां पर वोटिंग क्लासीफायर का यहां पर वोटिंग आपके क्या करते हैं क्लासीफायर का आप इस्तेमाल करते हैं अब ये वोटिंग क्लासियर काम कैसे करता है जरा समझते हैं यहां पर तो गाइस आप क्या करते हैं सिंपल सा आपके पास कोई भी आपके पास एक डेटा सेट है लेट्स सपोज मेरे पास ये एक डेटा सेट है जिसके अंदर आपके पास क्या है 10000 रो है यस कितनी है 10000 रो है अब ये 10000 रो को आप क्या करते हैं दो पार्ट के अंदर तोड़ देते हैं कौन-कौन से के अंदर आप तोड़ते हैं यहां पर ट्रेनिंग के अंदर और दूसरा तोड़ देते हैं आप यहां पर टेस्टिंग के अंदर राइट जैसे कि ट्रेनिंग के अंदर आपने क्या किया यहां पर 8000 रो आपने ट्रेनिंग के अंदर तोड़ी और रिमेनिंग जो 2000 रो है यहां पर वो टेस्टिंग के लिए तोड़ दिया आपने अब ये जो 8000 रो है ना इस 8000 रो के ऊपर अभी तक आप काम क्या करते थे यहां पर एक सिंगल मॉडल आप अप्लाई करते थे यस आप क्या करते थे यहां पर एक सिंगल मॉडल अप्लाई करते थे जस्ट सपोज मैंने डिसीजन ट्री यहां पर इस्तेमाल कर दिया लेकिन मैक्स वोटिंग आपके पास ऐसा नहीं करने देता है मैक्स वोटिंग कहता है कि आप यहां पर सिंगल मॉडल की अप्लाई करने की जगह आप यहां पर मल्टीपल मॉडल को अप्लाई करें जैसे कि आपने क्या किया यहां पर आपने एक मॉडल नहीं अप्लाई किया आपने तीन मॉडल ले लिया या तीन से ज्यादा भी मॉडल ले सकते हैं आप यहां पर ले लिया आपने यहां पर और फिर उनको लेके इन 8000 डाटा के ऊपर आप क्या करें ट्रेड करें राइट जैसे कि मैंने क्या किया गाइज यहां पर सिंपल सी बात करूं तो मैंने क्या किया यहां पर m1 ले लिया यहां पर डिसीजन ट्री राइट और यहां पर मैंने ले लिया जस्ट लाइक मैं आपके पास यहां प ले लेता हूं एसवीएम ले लेता हूं और यहां पे ले लेता हूं के एए यस ये तीन मैंने मॉडल्स यहां पर डिसाइड कर लिया अब इन तीन मॉडल के ऊपर हम क्या करते हैं हमारे डाटा को क्या करते हैं ट्रेन करवा देते हैं यस मैंने यहां पे क्या किया इन तीन डेटा के ऊपर हमारे मॉडल को ट्रेन कराया और ट्रेन कराने के बाद तीनों अच्छे तरीके से ट्रेड हो चुके हैं अब बारी आती है टेस्टिंग वाले डेटा सेट के ऊपर कि ये प्रेडिक्शन कैसे करके देते हैं तो देखिए प्रोडक्शन के वक्त यदि आप अपना कोई न्यू डाटा जब आप इसे देते हैं यस जब आप यहां पे न्यू डाटा देते हैं तो य न्यू डाटा क्या होता है गाइज यहां पर m1 से भी ट्रेन होता है और m2 से भी ट्रेन होता है और इसके साथ-साथ m3 से भी ट्रेन होता है मतलब आप यहां पे क्या करते हैं तीनों से एक साथ क्या करते हैं ट्रेन करवाते मलब टेस्टिंग करवाते हैं यहां पर टेस्टिंग कराने ने का बाद में इनके कुछ ना कुछ रिजल्ट आते हैं यस आपके पास क्या होता है इनके कुछ ना कुछ आपके पास रिजल्ट आते हैं और ये रिजल्ट आपके पास कुछ इस तरह से हो सकते हैं जस्ट लाइक इसका रो आ गया इसका रो आ गया और इसके बाद वन आ गया अब आपके पास जो आपका फाइनल आंसर होता है उस फाइनल आंसर के अंदर आप क्या करते हैं मॉड ले लेते हैं मॉड मतलब आप यहां पे वोटिंग करते हैं वोटिंग करके जो सबसे ज्यादा मैक्सिमम डाटा है यहां पर वो आप कंसीडर कर लेते हैं अब जैसे मैक्सिमम की बात करें तो मैक्सिमम कौन है यहां पर जीरो सबसे ज्यादा मैक्सिमम है तो आप मड के अंदर क्या बोलेंगे यहां पर जीरो है तो मतलब आपके पास इस नए वाले जो डाटा आया है यहां पर इसके ऊपर आप क्या कर देते हैं बोल देते हैं कि दैट इज अ जीरो यस ये आपके पास क्या आ रहा है जीरो आ रहा है इसको एक बार फिर से समझ लेते हैं कि हम करते क्या है यहां पर यस मैं यहां पर एक बार फिर से आपको लोगों को समझा देता हूं यस उसके लिए हम क्या करें हैं बेसिकली मैं एक बार फिर से दिखा देता हूं कि ये मैक्स वोटिंग काम कैसे करती है यहां पर ठीक है तो इसके लिए मैं क्या कर रहा हूं गाइ यहां पर ये जो मेरे पास ग्राफ है इस ग्राफ को मैं थोड़ा सा हटाऊ यहां पर ताकि आप लोगों को थोड़ा समझ में आ सके कि ये मैक्स वोटिंग काम कैसे कर रही है राइट तो अब जरा समझिए यहां पर वापस दोबारा कि हमने क्या किया हमारा डेटा सेट लिया यहां पर और डेटा सेट जो भी था हमारे पास यहां पर यस डेटा सेट था जिसके अंदर हमारे पास क्या थी 10000 रो थी इस 10000 रो को हमने दो बार पार्ट में तोड़ा एक में क्या तोड़ा मैंने 8000 में तोड़ा और एक क्या किया मैंने यहां पर 2000 में तोड़ा 8000 वाले को मैंने क्या किया गाइज यहां पर बोल दिया कि ये हमारे पास कैसा है ट्रेनिंग डेटा सेट है यहां पर और ये जो 2000 वाला है इसको हमने क्या कर दिया यहां पर टेस्ट में कन्वर्ट कर लिया अब ट्रेनिंग डेटा सेट के अंदर हम पहले क्या करते थे एक मॉडल लेते थे अब मैंने ट्रेनिंग के अंदर क्या किया पांच मॉडल या तीन मॉडल ट्रेन किए जैसे m1 एक मॉडल ट्रेन किया m2 एक मॉडल ट्रेन किया और m3 एक मॉडल ट्रेन किया यस किसके ऊपर इसके ऊपर 8000 डाटा के ऊपर मैंने ये तीनों के ऊपर ट्रेन कर दिया यहां पर तीनों को ट्रेन करने के बाद में मेरे पास क्या बना एक फाइनल मॉडल्स यहां पे निकल के आ गया दैट स ये मेरा फाइनल मॉडल हमारे पास निकल के आया दैट इज अ मॉडल ऑफ m कह देता हूं यहां पर अब यहां पे मैं क्या करूंगा अपना टेस्टिंग डाटा दूंगा यस क्या दूंगा यहां पर अपना टेस्टिंग डाटा दूंगा तो ये जितना भी टेस्टिंग टा है ये क्या करता है गाइज यहां पर ये m1 के ऊपर भी ट्रेंड होता है ये m2 के ऊपर भी ट्रेन होता है और यह m3 के ऊपर भी ट्रेन करता है और ट्रेन करने के बाद में यह आपको तीन रिजल्ट निकाल के देता है वैसे तो फाइनली आपको एक ही रिजल्ट मिलेगा लेकिन यहां से तीन रिजल्ट निकलते हैं और ये तीनों अलग-अलग हो सकते हैं जैसे कि m1 मॉडल आपके पास किसका है हो मैक्स का यस किसका इस्तेमाल करते हो मैक्स का या फिर आप बोल सकते हो मोड का या फिर आप बोल सकते हो वोटिंग का यस आप इस इस्तेमाल करते हो और इस्तेमाल करने के बाद में गाइज क्या होता है एक फाइनल आंसर निकल जाता है दैट अ मैक्स कितना है यहां पे रो है तो जीरो आंसर निकल जाता है मतलब इस ट्रेनिंग डेटा सेट के अंदर जो आपने डाटा दिया है यहां पर इसका आंसर क्या निकल के आएगा गाइज यहां पर जीरो निकल के आएगा इस तरह से हमारी ये जो मैक्स वोटिंग है वो काम करती है तो गाइ यहां पर देखिए ऑटोमेटिक आपके मॉडल की एक्यूरेसी एकदम बढ़ गई है क्यों पहले आपके पास एक मॉडल एक ही आंसर देता था यहां पर अब आपके पास यहां पर तीन मॉडल मिलकर एक आंसर्स आपको दिख रहे हैं तो बेसिकली गाइज आपके मॉडल के एक्यूरेसी बढ़ जाती है यह तो बात हो गई हमारे पास क्लासिफिकेशन की लेकिन जब हम रिग्रेशन की बात करते हैं तब हमारे पास क्या होगा तो वहां पे हम इस्तेमाल करते हैं एवरेज वोटिंग का या फिर हम यहां पे इस्तेमाल करते हैं वेटेज एवरेज वोटिंग का अब यह एवरेज वोटिंग और वेटेज एवरेज वोटिंग क्या काम करती है गाइज यहां पर तो सेम एज जैसे पहला था यहां पर वैसे ही करती है यहां पर लेकिन अभी हम यहां पर क्या करेंगे कि आपका आंसर क्या है यहां पर रिग्रेशन का अब रिग्रेशन के अंदर हम बात करें यहां पर तो रिग्रेशन के अंदर हमारे पास क्या होता है आंसर 0 व के अंदर नहीं देखने को मिलते हैं तो हमें यहां पर आंसर क्या मिलेंगे तीन अलग-अलग आंसर्स मिलेंगे यस यहां पर हमें क्या मिलेंगे तीन अलग-अलग आंसर मिलेंगे जसे डेफिनेटली मैं इसकी जो डायग्राम है इसे एक बार रिमूव करके आपको थोड़ा सा और अच्छे से बताऊं यहां पर तो बेसिकली हमें यहां पर क्या मिलने वाला है गाइ यहां पर तीन अलग-अलग आंसर्स मिलने वाले है राइट जैसे कि मैं बात करूं हमारा रिग्रेशन का आंसर है तो ये हमारा पहला मॉडल m1 हो गया यहां पर ट्रेन उसके बाद ये m2 ट्रेन हो गया यहां पर और ये m3 आपके पास यहां पर ट्रेंड हो गया और तीनों ने मिलकर यस तीनों ने मिलकर आपके पास क्या किया एक मॉडल यहां पे बना दिया राइट अब ये मॉडल बनाया और इसको आपने क्या किया नया डाटा दिया यस न्यू डाटा जब आपने दिया यहां पर तो जब आपने न्यू डाटा दिया यहां पर तो न्यू डाटा देने के बाद में इसने क्या किया तीन आंसर्स आपके पास निकल के आए और तीन आंसर जैसे मान लो ये 20 आया ये 21 आया और ये 19 आ गया अब आप क्या करेंगे यहां पर इस सिचुएशन के अंदर इस सिचुएशन के अंदर आप इस्तेमाल करेंगे एवरेज का यस किसका इस्तेमाल करेंगे एवरेज का इस्तेमाल करेंगे और एवरेज आंसर यहां पे निकालेंगे और एवरेज आंसर क्या होने वाला है गाइज यहां पर 20 + 21 प् यहां पर 19 / 3 होने वाला है और ये आंसर आपके पास कितना आएगा गाइज यहां पर 21 आपके पास आने वाला है यस तो आपका जो एवरेज आंसर होगा वो आपका क्या होगा फाइनल आंसर होगा किसका इस न्यू डेटा सेट का ये आपके पास किसके अंदर होता है एवरेज वोटिंग अंदर है और ये एवरेज वोटिंग के अंदर इसलिए है यहां पर रीजन क्योंकि यहां पर जो आंसर है वो कैसा है रिग्रेशन एनालिसिस का है तो बेसिकली रिग्रेशन के अंदर आप क्या करते हैं एवरेज को फाइंड आउट करते हैं अब एक और चीज यहां पे बात करना चाहूंगा कि इसके लिए जो आप मॉडल इस्तेमाल करते हैं यहां पर वो क्या करते हैं यहां पर वोटिंग रिग्रेसर का इस्तेमाल करते हैं यस उसका क्या करते थे यहां पर वोटिंग क्लासिफिका इस्तेमाल करते थे और इसके अंदर हम जो इस्तेमाल करते हैं दैट अ वोटिंग रिग्रेसर का इस्तेमाल करते हैं अब यहां पर ये वेटेज एवरेज वोटिंग का मतलब क्या हुआ ये इस वेटेज का मतलब क्या है गाइज यहां पर वेटेज का सिंपल सा मैं आपको मतलब बताऊं यहां पे गाइस तो आप क्या कर रहे हैं ये मॉडल ले रहे हैं इस मॉडल के जो वेटेज होते है वेटेज मतलब इनके जो आप पास ये मान लीजिए इनके जो मैग्निटिया ये कितने टर्म्स के साथ काम करेंगे वो क्या है अभी वन वन है क्या है आप यहां पर सिंपल सा मान लीजिए वन व है यहां पर आप आपके पास यहां पर अब आपको लगता है कि यहां पर आपने डीटी इस्तेमाल किया यहां पर आपने k एन ए इस्तेमाल किया यहां पर यस यहां पे आपने एसवीएम इस्तेमाल किया अब आपको लगता है कि यहां पे के एन ए की जो टर्म्स है वो बहुत ही कम है यस केन जो है यहां पर बहुत ही कम तरीके से काम कर रहा है तो क्यों ना इस काम को बढ़ा दिया जाए या फिर आपको लगता है कि इनके वेटेज की वैल्यू को चेंज कर देते हैं क्या करते हैं यहां पर इनके वेटेज की वैल्यू को चेंज करते हैं और वेटेज की जो न्यू वैल्यू जो निकल के आती है जस्ट वो आप अपने हिसाब से रख सकते हैं यस जैसे कि मैंने यहां पे टू कर दिया यहां पे 0.5 कर दिया यहां पर मैंने फोर कर दिया तो अब क्या हो गया कि आपका जो मॉडल है जितना आपने वेटेज दिया है उतने टाइम से ज्यादा वर्किंग करना स्टार्ट कर देगा राइट उतने टाइम से क्या करेगा ज्यादा वर्किंग करना स्टार्ट कर देगा क्योंकि आपने वेट की वैल्यू को बढ़ा दिया है अब यदि आपने यहां पर 0.5 दिया तो बेसिकली ये कम काम करेगा और यहां पर आपने फोर दिया तो बेसिकली ये ज्यादा काम करेगा तो बेसिकली गाइज यहां पर क्या करते हैं वेटेज की वैल्यू को चेंज करके हम हमारे मॉडल की जो एक्यूरेसी है उसे और ज्यादा अच्छे तरीके से क्या करते हैं इंप्रूव करते हैं यहां पर तो बेसिकली वेटेज एवरेज वोटिंग के अंदर हम क्या करते हैं या वेटेज आप यहां पे भी इस्तेमाल कर सकते हैं आप क्लासिफिकेशन में भी इस्तेमाल कर सकते हैं और आप चाहें तो रिग्रेशन में भी इस्तेमाल कर सकते हैं वेटेज बस आपके पास क्या होता है कि कोई आपका मॉडल बहुत ही लो परफॉर्मेंस कर रहा होता है तो उसको हाई परफॉर्मेंस करने में आपकी हेल्प यहां पर करता है और आज के इस वीडियो के जरिए हम बात करने वाले हैं वोटिंग क्लासिफिका कैसे इस्तेमाल किया जाता है असेंबल लर्निंग के अंदर यदि आपको पाइथन मशीन लर्निंग डेटा साइंस एंड डेटा एनालिस जैसी फीड में अपने आपको को ग्रो करना है तो इसके लिए डब्ल्यू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो चलिए जरा इसे समझते हैं यहां पर अब देखिए मैं चलता हूं जुपिटर नोटबुक केप जहां पर मैं डटा सेट को लोड कराऊंगा और उसके बाद उसके ऊपर वर्किंग करेंगे अब इसके लिए जो रिक्वायर्ड लाइब्रेरी है पहले मैं इसे इंपोर्ट कर लेता हूं इंपोर्ट मैं कर रहा हूं यहां पे पांडा एस ऑफ पीडी को मुझे ग्राफ भी देखना पड़ेगा तो उसके लिए मैं यहां पे इंपोर्ट कर रहा हूं किसे मैट प्लॉट लिप को इंपोर्ट कर रहा हूं और मैट प्लॉट लिप के अंदर जाके मैं यहां पे क्या कर रहा हूं पीवा प्लॉट जो हमारे पास है उसे मैं कॉल कर रहा हूं एलियाज ऑफ पीएटी का इस्तेमाल करूंगा इसके साथ-साथ देखिए डटा सेट जो है यहां पर मैं सेकंड के अंदर पहले से बहुत सारे डेटा सेट पड़े हैं उसी डेटा सेट में से मैं एक डेटा सेट ले रहा हूं और वो डेटा सेट ले रहा हूं मून डेटा सेट यस मैं उसका इस्तेमाल करूंगा और उसके थ्रू मैं क्लासिफिकेशन के ऊपर काम करने वाला हूं तो मैं यहां पे फ्रॉम क्या करूंगा यहां पर साइकल इन के अंदर चलूंगा साइकल न के अंदर मैं जाऊंगा किसके पास यहां पर डटा सेट के पास जाऊंगा और डेटा सेट के अंदर जाने के बाद दैट मैं इंपोर्ट करने वाला हूं यहां पर मेक मून डाटा सेट के ऊपर यस मैं यहां पे क्या करने वाला हूं मेक अंडरस्कोर जो हमारा मूनन डेटा सेट है उसे मैं लेने वाला हूं अब देखिए मेक मून डेटा सेट के थ्रू मैं अपना एक डेटा सेट क्रिएट करूंगा एंड देन उसके ऊपर फिर वर्किंग करने वाला हैं तो चलिए कैसे करने वाला हैं तो मैं यहां पर सबसे पहले क्या करूंगा जो मेरा मेक मून है यहां पर उसे मैं कॉल करूंगा और मेक मून को कॉल करूंगा यहां पर और मेक मून के अंदर देखिए सबसे पहले पूछा जा रहा है नंबर ऑफ सैंपल्स आपको कितने नंबर ऑफ सैंपल चाहिए ठीक है उसके बाद आपको सफल चाहिए या नहीं चाहिए नॉइस कितना चाहिए यहां पर और रैंडम स्टेट की वैल्यू क्या होनी चाहिए तो देखिए मेरे पास नंबर ऑफ जो सैंपल्स है यहां पर उसकी वैल्यू बढ़ाऊ और नंबर ऑफ सैंपल्स की वैल्यू मैं करूंगा यहां पर लगभग लगभग 400 एंड उसके बाद मैं गाइज यहां पर क्या करने वाला हूं नंबर ऑफ सैंपल की जो वैल्यू है लगभग लगभग करूंगा यहां पर फ 500 मतलब मुझे 500 डटा चाहिए यहां पर उसके बाद में मुझे नॉइस भी चाहिए अच्छी खासी तो नॉइस की वैल्यू मैं 0.0 आपके पास 5 मैं अभी रखने वाला हूं ओके और ये मेक मून जो है यहां पर ये दो डाटा देगा x और y आपके पास दो डाटा देने वाला है और मैं इसे रन करूंगा अच्छा यदि x को देखेंगे तो x के अंदर हमारे पास दो आपके पास यहां पे फीचर आएंगे एक आएगा x1 फीचर और दूसरा होगा x2 फीचर तो मैं इन दोनों फीचर्स को अलग-अलग कर लेता हूं और एक प्रॉपर डेटा सेट के अंदर कन्वर्ट कर लेता हूं ताकि हम इसका ग्राफ भी बना सके और इसकी अच्छी तरीके से एनालिसिस भी कर सकें तो मैं एक काम कर रहा हूं मैं इसका डाटा फ्रेम तैयार कर रहा हूं यहां पर ठीक है तो डटा फ्रेम तैयार करने के लिए मैं डीए का इस्तेमाल करूंगा और पहले एक डिक्शनरी तैयार करूंगा यहां पर और डिक्शनरी के अंदर देखिए मेरे पास x1 फीचर बनेगा और यह x1 फीचर किससे बनेगा x एंड देन मैं कॉलम सारी रो लूंगा यहां पर इसकी एंड देन कॉमा लगा के इसका ज़ीरो इंडेक्स नंबर वाला सारा डाटा चाहिए इसी तरह से मैं यहां पर x2 फीचर लेने वाला हूं यहां पर जो कि मेरे पास क्या आएगा x देन कॉलन और यहां पर सारी रोज चाहिए एंड उसके बाद में 1 एथ कॉलम चाहिए उसके बाद मुझे y वाला कॉलम चाहिए यहां पर और y वाला कॉलम कहां से मिलेगा गाइज यहां पर मुझे से मिलने वाला है ये मेरी डिक्शनरी तैयार हो गई है यहां पर अब मैं अपना डेटा फ्रेम तैयार करने वाला हूं तो यहां पर मैं डेटा सेट के नाम से एक वेलेबल बनाऊंगा और पीडी डॉट यहां पर क्या इस्तेमाल करूंगा डाटा फ्रेम का इस्तेमाल करूंगा और उसके अंदर ये जो डीएफ है वो पास करा दूंगा तो मेरा डेटा सेट जो है वो रेडी है आप देख सकते हैं ये डेटा सेट आ चुका है जिसके अंदर एक्स एक्सेस का डाटा y एक्सेस का डाटा आ चुका है यहां पर और x1 के x के एक्सेस के अंदर x1 और x2 फीचर आ चुका है और y आ चुका है अब एक काम करते हैं इसका ग्राफ बनाते हैं ग्राफ बनाने के लिए मैं यहां पर सी बन का भी इस्तेमाल करूंगा तो मैं यहां पे इंपोर्ट करने वाला हूं किसे यहां पर सी बन लेने वाला हूं यहां पर सी बन एलिया ऑफ एएएस का इस्तेमाल करूंगा ओके चलिए अब मैं ग्राफ बना लेता हूं कि ग्राफ कैसे दिखेगा यहां पर तो एएए डॉट मैं यहां पे बनाऊंगा स्केटर प्लॉट यस यहां पे स्केटर प्लॉट बनाते हैं स्केटर प्लॉट के अंदर जो हमारा x एक्सेस है यहां पर उसके अंदर हम क्या करेंगे x1 फीचर को डालेंगे और जो मेरा y एक्सेस है यहां पर उसके अंदर हम क्या करेंगे x2 फीचर को डालेंगे और डाटा के अंदर मैं क्या करूंगा गाइज यहां पर अपना डेटा सेट डालूंगा और इसके साथ-साथ मैं यहां पे ह्यू पैरामीटर डालूंगा और ह्यू पैरामीटर्स के अंदर मैं y को डाल दूंगा एंड रन करेंगे इस ग्राफ को अच्छा ग्राफ को अच्छे से देखने के लिए मैं पीएटी डॉट क्या करूंगा यहां पर शो को कॉल कर देता हूं ओके तो मेरे पास ग्राफ कुछ इस तरह से दिख रहा है ये क्या है क्लासि डेटा सेट है जोकि हमें दिख भी रहा है यहां पर अब मुझे क्या करना है इसको क्लासिफाई करना है अच्छे तरीके से तो इसके लिए हम क्या करेंगे अलग-अलग डिफरेंट डिफरेंट मॉडल बनाएंगे और उसके थ्रू हम यहां पे इसका क्या करेंगे क्लासिफिकेशन करेंगे अच्छा मैं थोड़ी सी नॉइस को यहां पे बढ़ा देता हूं क्योंकि नॉइस ज्यादा अच्छी रहेगी तो नॉइस जितनी ज्यादा रहेगी उतना फायदा रहने वाला है मुझे यहां पर तो मैं नॉइस को थोड़ा चेंजेज करूंगा और नॉइस को चेंजेज करके मैं यहां पे क्या कर रहा हूं 0.1 कर रहा हूं यहां पर ओके एंड रन करते हैं और देखिए मैंने नॉइस को अच्छा नॉइस मेरे को ज्यादा और बढ़ानी थी यहां पर तो 0.1 की जगह मैं क्या कर रहा हूं यहां पर आपके पास वन कर देता हूं यहां पर ओके 1 पर नॉइस कर देता हूं और 1 पर में देखिए आपके पास काफी अच्छी आ चुकी है यहां पर अच्छा और ले लेते हैं यहां पर थोड़ी सी तो मैं यहां पर फाइव कर देता हूं ओके और मैं फाइव से चेक करता हूं या फाइव में तो बहुत ही ज्यादा आ चुकी है यहां पर तो लगभग लगभग मैं टू कर देता हूं यहां पर ओके तो यहां पर टू करके एक बार ट्राई करें यहां पर यस टू में काफी अच्छी नॉइस है यहां पर और काफी अच्छा डाटा सेट भी यहां पर आ चुका है अब ये क्या है क्लासिफिकेशन डेटा सेट है और मुझे यहां पर क्लासिफिकेशन एनालिसिस करनी है यहां पर ठीक है तो इसके लिए हम क्या करेंगे डिफरेंट डिफरेंट मॉडल्स बनाएंगे और उसके बाद चेक करेंगे अच्छा सबसे पहले क्या करेंगे ये जो डेटा सेट आ चुका है इस डेटा सेट के अंदर हमारे एक्स एक्सेस का डाटा और y एक्सेस का डाटा अलग-अलग करना था पहले मुझे लेकिन जो कि मैंने नहीं किया मैंने डेटा फ्रेम बना लिया यहां पर कोई बात नहीं हम स्टेप बाय स्टेप चलेंगे जैसे कि हम पहले करा करते थे हम पहले क्या करेंगे हमारा डेटा सेट लेंगे उस डेटा सेट के अंदर हम x एक्सिस और y एक्सिस का डटा अलग-अलग करेंगे देन ट्रेन टेस्ट के अंदर स्प्लिटिंग करेंगे ओके और ये नंबर ऑफ सैंपल्स भी थोड़ा बढ़ा लेंगे ठीक है नंबर ऑफ सैंपल मैं 1000 कर लेता हूं यहां पर ताकि थोड़ा अच्छा डाटा मेरे पास आ जाए यहां पर ओके तो यहां पर नंबर ऑफ सैंपल्स भी मैंने काफी अच्छे बढ़ा लिए यहां पर ताकि अच्छा डाटा जाए और हम आगे आराम से काम कर सकें चलिए तो अब जैसे पहले स्टेप्स करते थे वैसे ही अब में मैं दोबारा वापस स्टेप्स वही लेने वाला हूं यहां पर मुझे क्या चाहिए x एक्सेस का डाटा चाहिए का तो मेरे पास यहां पर डिपेंडेंट ए इंडिपेंडेंट वेरिएबल को मैं अलग-अलग कर रहा हूं यहां पर तो x a के नाम से एक वेरिएबल बना रहा हूं यहां पर जो कि क्या करेगा डेटा सेट के पास जाएगा डॉट मैं आलग का इस्तेमाल करूंगा यहां पर सारी दो को लूंगा यहां पर और कॉलम के अंदर क्या करूंगा गाइज यहां पर -1 को छोड़ दूंगा तो x a को जब आप यहां पर देखेंगे तो आपको x1 और x2 दिख जाएंगे इसी तरह से मुझे क्या चाहिए y एक्सेस का डाटा चाहिए तो मैं y a का इस्तेमाल करूंगा यहां पर ओके और उसके साथ क्या करूंगा डेटा सेट को कॉल करूंगा और वहां से जाके मैं y को गेट कर लूंगा तो मेरा y भी आ जाएगा ओके अब मेरा नेक्स्ट काम क्या होगा ट्रेन और टस्ट के अंदर स्प्लिटिंग करना तो मैं यहां पे फ्रॉम साइकिल न के अंदर जाऊंगा यहां पर एंड साइकल न के अंदर जाने के बाद दैट मैं जाऊंगा मॉडल सिलेक्शन के अंदर ओके मॉडल सिलेक्शन के अंदर जाने के बाद दैट मैं इंपोर्ट करने वाला हूं किसे ट्रेन टास्क स्प्लिटिंग को ताकि मेरे डाटा को स्प्लिटिंग कर सके ट्रेनिंग और टेस्टिंग के अंदर और हम इसे अच्छे से एनालिसिस कर सके अब देखिए x अंडर मुझे क्या करना पड़ेगा यहां पर पर ट्रेन के नाम से एक वेरिएबल बनाना है फिर यहां पर x टेस्ट के नाम से एक वेरिएबल बनाना है यहां पर फिर मुझे क्या करना है y मुझे क्या करना है ट्रेन के नाम से एक वेरिएबल बनाना है एंड y मुझे यहां पर टेस्ट के नाम से एक रेबल बनाना है और मैं क्या करूंगा ट्रेंट स्प्लिटिंग को कॉल करूंगा यहां पर मेरे पास क्या होगा x जो a है वो देना है देन कॉमा y एंडस को जो a है वो भी मुझे देना है अब मैं बात करूंगा यहां पर कि मेरी टेस्टिंग साइज कितनी देनी है तो दैट इज 0.2 % डिसाइड किया मैंने यहां पर एंड इसके साथ-साथ मुझे क्या करना है गाइज यहां पर रैंडम स्टेट भी देना है तो रैंडम स्टेट की वैल्यू दे देता हूं 42 ओके तो चलिए हमारा डाटा जो है वो ट्रेन टस्ट के अंदर स्प्लिटिंग हो चुका है अब हम क्या करने वाले हैं गाइ यहां पर अब हम यहां पर इस्तेमाल करेंगे हमारे डिफरेंट डिफरेंट मॉडल का जिसके थ्रू हम ट्रेनिंग करके देखेंगे कि हमारी मॉडल की एक्यूरेसी कितनी आती है यदि हमारी एक मॉडल की एक्यूरेसी अच्छी नहीं आई तो हम यहां पर इस्तेमाल करेंगे वोटिंग क्लासिफिका और हमारे मॉडल की एक्यूरेसी को इंप्रूव करेंगे चलिए तो मॉडल को कॉल करते हैं तो देखिए मैं फ्रॉम सेकंड के अंदर चलता हूं यहां पर सबसे पहले मैं यहां पर ट्री बेस मॉडल को लेता हूं यहां पर और ट्री बेस के अंदर मैं इंपोर्ट करूंगा यहां पर किसे ठीक है डिसीजन ट्री को करूंगा और डिसीजन टी को मैंने कॉल कर दिया यहां पर उसके बाद मैं फ्रॉम यहां पर जाऊंगा साइकल न के अंदर और साइकिल न के अंदर जाने के बाद में नेक्स्ट टॉपिक होगा हमारे पास यहां पर कि मैं एसवीएम को कॉल कर लूं यस यहां पर मैं एसवीएम को कॉल कर लेता हूं यस और एस डॉ साइकिल न के अंदर जाऊंगा यहां पर और साइकल न के अंदर जाने के बाद डॉट मैं एसवीएम को कॉल करना चाहूंगा यस मैं एसवीएम यूज़ करना चाहूंगा ओके सपोर्ट वेक्टर मशीन को यूज़ करेंगे और सपोर्ट वेक्टर मशीन के अंदर हम क्या करेंगे यहां पे गाइज इंपोर्ट करने वाले हैं यहां पर अब सपोर्ट वेक्टर मशीन में क्या करना है एसवीसी को यहां पर इंपोर्ट करना है चलिए उसके बाद नेक्स्ट नेक्स्ट हमारे पास क्या होगा फ्रॉम मैं यहां पर जाऊंगा आपके पास ने बाय के पास यस मैं ने बाय ले सकता हूं और ने बाय के अंदर मैं इंपोर्ट करने वाला हूं किसे यहां पर आपके पास गाउन एनबी को कर लेते हैं क्योंकि हमारा गाउन डाटा है यहां पर तो गाउन एनबी को कर लेते हैं ओके तो मैंने तीन मॉडल बना लिए है अब तीनों मॉडल को चेक कर लेते हैं कि कितना कितनी एक्यूरेसी दे रहा है सबसे पहले मैं डीटी को कॉल करता हूं मतलब डिसीजन ट्री को कॉल करता हूं अच्छा डिसीजन ट्री क्लासियर को कॉल करने के बाद में मैं क्या करता हूं यहां पे टीड म को क्या करता हूं फिट करता हूं एंड फिट के अंदर जाके मैं x अंडर क्या देता हूं ट्रेन देता हूं एंड क्या देता हूं यहां पर y ट्रेन देता हूं उसके बाद में dt50 पर कि क्या आ रहा है यहां पर x ट्रेन y ट्रेन का भी चेक करेंगे कि मेडल मेरा ओवरफिटिंग तो नहीं हो गया यहां पर कहीं एंड सेकंड चीज यहां पर टी डॉट यहां पे क्या करेंगे फिर से स्कोर चेक करेंगे और स्कोर के अंदर x टेस्ट एंड y टेस्ट को भी रन कर लेते हैं ओके मल्टीप्लाई बाय 100 कर लेते हैं और रन करते हैं ओके देखिए एक्यूरेसी देखिए यहां पर ओवरफिटिंग मॉडल बन चुका है जो कि 100% और 92 यहां पर मुझे दिखा रहा है और जो कि एक ओवरफिटिंग मॉडल है यहां पर जो कि हमें समझ में भी आ रहा ओके चलिए डीटी ने काफी अच्छा स्कोर दिया है यहां पर क्योंकि है ओवर फिटिंग है लेकिन ठीक है काम हो गया हमारा यहां पर ठीक है अब मैं चलता हूं एसवीएम के लिए तो एसवीएम के लिए एसवी के नाम से बना देता हूं यहां पर और यहां पर मैं क्या करता हूं एसवीसी को कॉल कर लेते हैं यस एसवीसी को कॉल किया यहां पर अब यहां पर मुझे क्या करना पड़ेगा एसवी को कॉल करना पड़ेगा ये डीटी को हटा के मैं एसवी को लगाऊंगा यहां पर और यहां पे भी मैं करूंगा डीटी को हटा के मैं एसवी को लगाऊंगा यहां पर रन करते हैं देखिए 96 और 96 काफी अच्छा मॉडल बना के दिया है विदाउट ओवरफिटिंग और काफी सही बना के दे दिया है यहां पर ओके लेकिन हमें हमारी एक्यूरेसी और अच्छी चाहिए ओके तो मैं यहां पे क्या करूंगा गाइ यहां पर नेक्स्ट मॉडल लूंगा यहां पर और जो कि होगा न एबी का तो मैं यहां पर जी एन बी का इस्तेमाल करूंगा ट्स अ गाश एनबी ओके तो मैं यहां पे गाश एनबी को कॉल करूं यहां पर यस जो कि हमारे पास जीएनबी मॉडल है यहां पर और ये हमें क्या स्कोर देने वाला है देख लेते हैं इसको भी है ना तो यहां पर इसे रन करें और इसे भी रन करें देन काश ए बी को देखें दैट 86 और 88 पर एक्यूरेसी आ रही है ओके ये भी क्या है आपके पास यहां पर बेस्ट टी है लेकिन इन सब में जो अच्छा मॉडल है वो अच्छा मॉडल आपके पास ये निकल के आ रहा है एंड ये आपका सेकंड है लेकिन ये आपका थर्ड है ओके लेकिन हम चाहते हैं कि इससे भी अच्छा मॉडल बनना चाहिए क्योंकि अच्छी एक्यूरेसी के साथ हमें आंसर मिलना चाहिए तो इसके लिए हम क्या इस्तेमाल कर सकते हैं गाइ यहां पर इसके लिए हम यहां पर वोटिंग क्लासिफाइड लर्निंग कैसे काम करती है जरा समझते हैं यहां पे तो मैं फ्रॉम सेकंड के अंदर जाऊंगा यहां पर एंड डॉट यहां पे कॉल करूंगा किसे असेंबल को असेंबल के अंदर मैं जाके इंपोर्ट करने वाला हूं यहां पर किसे वोटिंग क्लासिफाइज अ क्लासिफिकेशन डाटा ओके तो इसलिए हम क्लासिफिकेशन को इस्तेमाल कर रहे हैं यहां पर एंड मैं क्या करूंगा यहां पर वसी के नाम से एक वेरिएबल बना लूंगा मतलब ऑब्जेक्ट बना लूंगा यहां पर और यह वोटिंग क्लासिफाई कॉल कर दूंगा अब देखिए वोटिंग क्लासिफाइज ही आप कॉल करते हैं तो सबसे पहले आता है आपका एस्टिमेटर एस्टिमेटर का मतलब है गाइज यहां पर कि आप कौन-कौन से मॉडल्स यहां पे चूज करने वाले हैं व आप यहां पे दे दीजिए ठीक है उसके बाद आपका आ जाता है वेटेज वेटेज के अंदर आप अलग-अलग वेटेज को डिफाइन कर सकते हैं जो कि हमने आपको बताया था कि वेटेज एवरेज वोटिंग कैसे काम करती है यह हमने देख लिया था यहां पर ठीक है अब यह जो एस्टिमेटर है यह एस्टिमेटर आपको कैसे देना है तो यह एस्टिमेटर देना है आपको लिस्ट ऑफ आपको टपल देना है इस टपल के अंदर आपको क्या लिखना है सबसे पहले उस मॉडल का नाम लिखना है एंड देन एस्टिमेटर का नाम लिखना है तो इस तरीके से ये आपको पास कराना है तो चलिए मैं यहां पर एक लिस्ट बना लेता हूं तो एई के नाम से एक लिस्ट बना लेते हैं यहां पर इस लिस्ट के अंदर सबसे पहले मुझे क्या करना है एक टपल बनाना है इस टपल के अंदर जो मुझे मॉडल इस्तेमाल करना है उस मॉडल का नाम लिखना है तो दैट द dt1 मतलब मैं डिसीजन ट्री को इस्तेमाल करूंगा यहां पर तो मैंने यहां पे क्या किया डिसीजन ट्री क्लासि फायर को कॉल कर दिया ओके उसके बाद जो नेक्स्ट हमारा मॉडल जो होने वाला है यहां पर दैट इज अ आपके पास कौन सा होगा यहां पर एसवीएम का तो एव के नाम से नाम ले देता हूं यहां पर और यहां पे जो मॉडल हम यूज़ करेंगे दैट द एसवीसी ये सपोर्ट वेक्टर क्लासियर इसको हम इस्तेमाल कर रहे हैं देन जो हमारा थर्ड मॉडल होने वाला है यहां पे गाइज दैट इज अ आपके गाउन एन बी तो मैं यहां पर g एब 1 के नाम से बना लेता हूं यहां पर और यहां पर मैं कॉल कर देता हूं किसे न एनबी को कॉल कर देता हूं तो ये हमारे तीन मॉडल्स हमारे पास आ चुके हैं अब मैं क्या करता हूं इस एआई को यहां पे पास कर देता हूं अब जैसा आप पहले करते थे वैसे ही भी अभी भी यही काम करना है कि vc3 एंड क्या पास कराने वाले हैं यहां पर y ट्रेन पास कराना है यहां पर रन करते हैं हमारा मॉडल ट्रेन हो चुका है यहां पर तीनों पे ट्रेड हो गया है यहां पर एसवीसी काउच एंड तीनों पे ट्रेड हो चुका है अब मैं यहां पे वसी यस वीसी जो हमारे पास है यहां पर यस वसी डॉट मैं यहां पे क्या कर रहा हूं स्कोर चेक कर रहा हूं यस स्कोर चेक करते हैं स्कोर के अंदर क्या कर रहे हैं यहां पर x ट्रेन एंड y ट्रेन का स्कोर चेक करेंगे यस मल्टीप्लाई बाय 100 कर लेते हैं ताकि हमें एक्यूरेसी परसेंटेज में मिले यहां पर इसके साथ-साथ जो वसी है डॉट मैं क्या कर रहा हूं यहां पर फिर से स्कोर चेक कर रहा हूं जहां पे x टेस्ट एंड y को जो टेस्ट है यहां पर वो पास कर देते हैं और मल्टीप्लाई बाय 100 कर लेते हैं देखिए एक्यूरेसी जो है 97 और 95 आई है जो कि काफी अच्छी एक्यूरेसी है देखिए ऊपर वाली कितनी थी 96 और 96 थी यहां पे देखेंगे तो 100 और 92 है और यहां पे देखेंगे तो 86 और 88 है लेकिन इन तीनों के कंपैरेटिव 97 और 95 जो एक्यूरेसी है वो हमें यहां पर देखने को मिली है तो यहां पर बहुत सारे हाइपर पैरामीटर्स हैं उन हाइपर पैरामीटर को चेंज कर सकते हैं जैसे कि मैं वेटेज को चेंज कर सकता हूं यहां पर यस वेटेज को चेंज करके देख लेते हैं यहां पर कि वेटेज के अंदर अलग-अलग वेटेज डालने पर क्या फर्क पड़ता है तो देखिए वेटेज जो है गाइ यहां पर वो आपको लिस्ट के तौर पे देना है देखिए यहां पर वेटेज देखेंगे यहां पर तो दैट इज अ लिस्ट ओके आपको लिस्ट के तौर पे देना है तो एक काम करते हैं मैं यहां पे 0.5 एक का दे देता हूं वेटेज और दूसरे का फोर कर देता हूं और तीसरे का मैं यहां पर सेवन कर देता हूं ये मैंने अलग-अलग डिफरेंट डिफरेंट वेटेज डाले हैं अच्छा डिफरेंट डिफरेंट वेटेज डालने पर देखिए एक्यूरेसी में काफी फर्क आया है यहां पर ओके तो मैं थोड़ा सा वेटेज और चेंज करके देखता हूं यहां पर ओके एक्यूरेसी में काफी अच्छी आई है यहां पर 97 और 96 आ गया है यहां पर ओके अभी मैं यहां पर 100 इसका 10 कर देता हूं और फिर मैं चेक करता हूं अभी भी 96 और 97 आया है मतलब ये आपकी बेस्ट एक्यूरेसी यहां पर निकाल के दे रहा है तो इस तरह से आपका क्या कर रहा है वोटिंग क्लासिफिका सिफा में मैंने जैसा आपको बताया था यहां पर कि ये क्या करता है तीनों का जो आंसर्स होते हैं यस तीनों के जो आंसर्स होते हैं उस आंसर के बेसिस पे अपना आंसर देता है अब चेक करते हैं कि क्या ये वाकई में तीनों के आंसर के बेसिस पे अपना आंसर देते हैं तो इसके लिए मैं चेक करने के लिए क्या कर रहा हूं गाइज यहां पर आपको एक डेटा फ्रेम बना के दिखा रहा हूं यहां पर और उस डेटा फ्रेम में सब कुछ आंसर निकाल के दिखाऊंगा कि ये कैसे वर्क कर रहा है ठीक है मैं यहां पे क्या कर रहा हूं यहां पर आंसर आ रहा है यहां पर तो मैं यहां पे क्या कर रहा हूं पीआरडी के नाम से एक वेरिएबल बना रहा हूं और जो कि होगा एक डिक्शनरी होगा यहां पर जो कि अलग-अलग आंसर प्रेडिक्शन करके लाके देगा जैसे कि सबसे पहले डीटी का प्रेडिक्शन लाके देखेंगे फिर उसके बाद में हम क्या करेंगे आपके पास यहां पर एसपीएम का प्रेडिक्शन लाके देखेंगे उसी तरह से हम क्या करेंगे गाउचन एनबी का प्रेडिक्शन लाके देखेंगे और फिर वोटन क्लासि का लाके देखेंगे तो यहां पर आप चीज देखेंगे कि हमारे पास जैसे कि मैंने आपको थ्योरी में समझाया था कि आपके पास क्या होता है कि जो तीनों मॉडल्स होते हैं वो तीनों मॉडल ट्रेड होते हैं और जब आपका टेस्टिंग के लिए जो भी डटा आता है वो तीनों के साथ ट्रेड होता है और तीनों के साथ ट्रेड होने के बाद में जो भी उनका फाइनल रिजल्ट होता है मतलब जो मड आपका आंसर होता है वो मॉड आंसर आपको लाके यहां पर दिखाता है वो मॉड आंसर आपको क्या करता है शोर करके आपको दिखाता है यहां पर दैट इस तरह से आपके पास यहां पर ये वर्क करता है तो चलिए इस को भी हम यहां पर ऑब्जर्व कर लेते हैं कि क्या ये वाकई में इस तरह से काम करता है या फिर आपकी कोई दूसरी टेक्निक्स है राइट तो चलिए इसे रन कर लेते हैं अब देखिए मैं यहां पे क्या कर रहा हूं आपको एक डेटा फ्रेम के थ्रू कंपेयर करके आपको शो करेंगे यहां पर ठीक है तो मैं सबसे पहले क्या कर रहा हूं गाइस यहां पर आपके पास यहां पर इस्तेमाल कर रहा हूं dt1 का इस्तेमाल कर रहा हूं और टी के लिए क्या करेंगे गाइ यहां पर कि आपने डीटी के नाम से एक वेरिएबल बना रखा है यहां पर ओके टी डॉट यहां पर आप क्या करेंगे पेडिक का इस्तेमाल कर दीजिए और पीडी के अंदर क्या करते हैं गाइ यहां पर x अ क्या डालते हैं टेस्ट डाल देते हैं ओके इसी तरह से मैं क्या करता हूं यहां पर एसवीएम यस एसवीएम सपोर्ट वेक्टर मशीन का इस्तेमाल कर रहे हैं यहां पर और सपोर्ट वेक्टर मशीन के लिए आपने शायद एसवी के नाम से अपने वेरिएबल बनाए एसवी के नाम से आपने वेरिएबल बनाया यहां पर ठीक है एसवी डॉट यहां पे क्या करते हैं स्कोर निकाल देते हैं यस ए डट क्या करते हैं स्कोर निकालते हैं और स्कोर के अंदर भी मैं क्या करता हूं गाइज यहां पर x अंड क्या करता हूं टेस्ट लाल देता हूं इसी तरीके से मैं यहां पे क्या करता हूं घौस एनबी मतलब यहां पर जी एन बी नाम लेते हैं यहां पर और जी एनबी के लिए हम क्या कर रहे हैं यहां पे गाइज जीएनबी के नाम से हमने वेरिएबल बना रखा है उसी को कॉल करते हैं डॉट यहां पे क्या करते हैं उसका मैं क्या करता हूं यहां पर अच्छा स्कोर नहीं निकालना था ट्स से प्रिडिक्ट निकालना था ओके मैं यहां पे प्रिडिक को कॉल कर लेता हूं ओके मैं क्या करता हूं यहां पर पेडिक को कॉल कर लेता हूं इसी तरह से मुझे भी यहां पे क्या करना है इसका प्रिडिक्ट करना है तो मैं यहां पे प्रिडिक को कॉल कर लेता हूं और प्रिडिक्ट के अंदर x क्या करते हैं टेस्ट कर देते हैं ये आपका प्रोबेबिलिटी आ चुका है अब देखिए डटा फ्रेम बनाते हैं तो डेटा फ्रेम के लिए पीडी डॉट मैं यहां पे क्या करूंगा डटा फ्रेम का इस्तेमाल करूंगा और यहां पे पी आरडी जो आपके पास है उसको रन कर देते हैं चलिए देखिए आपके पास आपके के तीनों आंसर आ गए लेकिन अब मुझे क्या करना है यहां पर वसी का भी कॉल करना था तो मैं एक बार वसी मतलब 14 क्लासि का भी आंसर चाहिए ठीक है तो मैं यहां पे क्या करता हूं v सयस v स डॉट मैं यहां पे क्या करता हूं पेडिक को कॉल करता हूं और पेडिक के अंदर x अंडर क्या करते हैं यहां पर टेस्ट डाल देते हैं और रन करते हैं चलिए तो अब देखिए यहां पर आप आंसर को आराम से देख पाएंगे और ऑब्जर्व कर पाएंगे कि देखिए पहले वाले का वन है दूसरे वाले का वन है तो वन है आपका आंसर यहां पर तो आपको वन मिला यहां पर फिर जीरो जी जी है तो आपको जीरो मिला मड क्योंकि जीरो है यहां पर यहां पे भी मॉड क्या है जीरो तो जीरो मिला आपको यहां पर मड क्या है यहां पर वन है तो मिला आपको आंसर यहां पर देखिए यहां आंसर आप देखेंगे कि दो का आंसर जीरो है और एक का आंसर क्या है आपके पास वन है तो आंसर क्या मिला आपको यहां पर जीरो मिला क्योंकि मॉड यहां पर क्या आया गाइज यहां पर ज़ीरो मिला है आपका पा यहां पर इसी तरह से 98 का आंसर भी चेक कर लीजिए 98 में क्या है दो का आंसर वन आ रहा है और एक का आंसर आपका रो आ रहा है तो बेसिकली आंसर क्या आना चाहिए वन आना चाहिए तो देखिए आपका वन आंसर आपके सामने आया क्योंकि दैट इज अ मड इज वन यस मॉड क्या है हमारे पास यहां पर वन है तो इसलिए हमें वन मिला है तो इस तरह से आपके पास क्या करता है यहां पर ये वोटिंग क्लासिफाइड यहां पर दिए हैं उन मॉडल के अंदर जो भी उनके आंसर्स आएंगे यहां पर उन आंसर में से जो मॉड आंसर्स होगा वो आंसर आपको दे दिया जाएगा जैसा कि आप यहां पर देख पा रहे हैं तो इस तरह से आपके पास यहां पे क्या करता है वोटिंग क्लासिफाइड के तौर पे तो चलिए जरा अब इसे समझते हैं कि ये कैसे वर्क करता है तो इसके लिए हमें एक डेटा सेट चाहिए होगा तो देखिए मेरे पास एक डेटा सेट है जो कि एक रिग्रेशन डेटा सेट है यहां पर आप इसे एनालिसिस भी कर सकते हैं देखिए ये क्या है एक डेटा सेट यहां पर तो ये सीजीपीए वर्सेस पैकेज का डटा सेट है जहां पे आप सीजीपी के बेसिस पे आपको क्या करना है पैकेज जो है वो प्रिडिक्ट करके निकालना है यहां पर इस डाटा सेट पे मुझे क्या करना है यहां पर एनालिसिस करनी है और बेसिकली यहां पर इस डेटा सेट के ऊपर क्या करना है वर्किंग करना है तो चलिए जरा इसे वर्किंग करते हैं तो मैं ले चलता हूं आपको जुपिटर नोटबुक के पास जहां पे ये सारा काम होगा तो सबसे पहले मैं क्या कर रहा हूं जो रिक्वायर्ड लाइब्रेरी उसे इंपोर्ट करता हूं जस्ट लाइक पंडा को इंपोर्ट करते हैं सबसे पहले यहां पे पंडा एलस और पीडी को इंपोर्ट कर लेता हूं यहां पर चलिए उसके बाद हम क्या करते हैं हमारे जो डेटा सेट है उसे लोड कर लेते हैं तो डाटा सेट को लोड करने के लिए मैं पडी डॉट यहां पर र सीएवी का इस्तेमाल करूंगा और यहां पर मेरा जो डटा सेट है वो उसको देखते हैं क्या है यहां पर प्लेसमेंट सीएवी है अच्छा इसका एड्रेस लेके आते हैं और विद नेम लेके आते हैं तो दैट इज माय प्लेसमेंट सीएवी एंड विद एड्रेस तो मैं इसके ऊपर राइट क्लिक करता हूं कॉपी एज पाथ के ऊपर क्लिक करते हैं एंड देन यहां पे आके इसे पेस्ट कर लेते हैं अच्छा इसके आगे आर लगाते हैं ताकि रिलेटिव पाथ बन जाए और ये हमारा डेटा सेट लोड हो चुका है अच्छा डेटा सेट के अंदर डेटा को देख लेते हैं तो डेटा सेट के अंदर हैड लगा के इसके तीन डेटा को देखें तो ये डेटा आ चुका है अब यहां पर आपके पास क्या करता है डिपेंडेंट और इंडिपेंडेंट डाटा को अलग-अलग कर लेते हैं बट मतलब x एक्सिस और y एक्सिस के डेटा को अलग-अलग कर लेते हैं तो x एक्सिस के डाटा को अलग करते हैं उसके चलिए हम क्या करते हैं डेटा सेट के पास चलते हैं डॉट मैं आई लॉग का इस्तेमाल करूंगा सारी नंबर ऑफ रो चाहिए मुझे यहां पर और कॉलम के अंदर मुझे सारे कॉलम चाहिए लेकिन -1 मुझे नहीं चाहिए इसी तरह से मुझे वा एक्सेस का डाटा चाहिए और वा एक्सेस के लिए मैं डेटा सेट के पास जाऊंगा एंड देन स्क्वायर ब्रैकेट और यहां पर जाके क्या करूंगा पैकेज को कॉल कर दूंगा तो ये मेरे पास डेटा आ चुका है अब डेटा आने के बाद में मुझे क्या करना है यहां पर इस डटा को ट्रेन और टस्ट के अंदर स्प्लिटिंग करना है तो चलिए करते हैं यहां पर तो मैं फ्रॉम साइकल के अंदर जाऊंगा यहां पर डॉट यहां पर जाऊंगा मॉडल सिलेक्शन के अंदर यस मॉडल सिलेक्शन के अंदर चलते हैं और मॉडल सिलेक्शन के अंदर चलने के बाद दैट मैं इंपोर्ट करने वाला हूं यहां पर किसे इंपोर्ट करेंगे गाइज यहां पर दैट इज द ट्रेन ट स्प्लिटिंग को ओके यहां से मैं क्या करूंगा यहां पे इस डाटा को चार पार्ट के अंदर तोडूंगा दैट इज अ x अंडरस्कोर सबसे पहले क्या होगा यहां पर ट्रेन होगा यहां पर देन x टेस्ट होने वाला है यहां पर देन y यहां पर ट्रेन होने वाला है यहां पर एंड y आपके पास क्या होने वाला है यहां पे गाइज टेस्ट आपके पास होने वाला है राइट और ये हम क्या कर रहे हैं ट्रें टेस्ट फ्लेटिंग को कॉल कर रहे हैं जिसके अंदर आपके पास x एक्सेस का डटा y एक्सेस का डाटा एंड उसके बाद बात करें गाइज रैंडम स्टेट के बारे में रैंडम स्टेट को वैल्यू डाल देते हैं 42 और उसके बाद हम क्या करते हैं गाइज यहां पर टेस्टिंग साइज डाल देते हैं तो टेस्टिंग साइज डाली 0.2 20 ओके चलिए रन करते हैं अब उसके बाद में क्या कर रहे हैं गाइ यहां पर हम अलग-अलग मॉडल से इसे ट्रेन करते हैं और चेक करते हैं कि इसकी एक्यूरेसी क्या आ रही है अब देखिए कौन-कौन से मॉडल ले रहा हूं यहां पर तो सबसे पहले मैं फ्रॉम साइकन के अंदर जाने के बाद मैं यहां पर सबसे पहले सबसे पहला मॉडल है लीनियर मॉडल उसी को मैं चूज करूंगा यहां पर तो इंपोर्ट कर रहा हूं यहां पर किसे लीनियर मॉडल को जिसके अंदर लीनियर रिग्रेशन को कॉल करेंगे उसके बाद मैं यहां पे फ्रॉम साइकन के अंदर जाऊंगा यहां पर और ट्री बेस मॉडल को कॉल करूंगा एंड ट्री बेस मॉडल के अंदर आप सबको पता है कौन सा मॉडल यहां पर दैट इज अ डिसीजन ट्री यस डिसीजन ट्री रिग्रेसर को कॉल करेंगे उसके बाद में फ्रॉम यहां पर साइकल के अर फिर से चलेंगे और डॉट यहां पर चलेंगे एसवीएम के पास दैट इज अ सपोर्ट वेक्टर मशीन यस तो मैं यहां पे जाऊंगा एसवीएम के पास और यह दो बार आ गया है साइकन तो एक बार इसको हम यहां से हटा देते हैं चलिए उसके बाद हम क्या कर रहे हैं गाइज यहां पर इंपोर्ट करते हैं और इंपोर्ट कैसे करते हैं यहां पर एसवीआर सपोर्ट वेक्टर मशीन रिग्रेसर को कॉल करते हैं अब हम क्या करना है गाइज यहां पर ये तीनों के मॉडल बनाने है और चेक करने है कि कितने परसेंट एक्यूरेसी दे रहा है यहां पर ठीक है फिर हम क्या करेंगे यहां पे वो फटिंग रिग्रेसर का इस्तेमाल करके इसकी एक्यूरेसी को बढ़ाएंगे या इसके ओवर फिटिंग को ओवर कम करेंगे चलिए तो वन बाय वन काम करते हैं तो सबसे पहले एलआर के नाम से वेरिएबल बनाते हैं और जो हमारा लीनियर रिग्रेशन है उसे कॉल कर लेते हैं उसके बाद एलर डॉट क्या कर रहे हैं यहां पर मॉडल को फिट कर रहे हैं और फिट के अंदर मैं गाइज क्या कर रहा हूं यहां पर x ट्रेन एंड y अंडरस्कोर जो ट्रेन है वो डाटा दे रहा हूं उसके बाद एलर डॉट मैं करूंगा स्कोर भी चेक करूंगा ताकि मुझे पता चल कितने परसेंट एक्यूरेसी आ रही है तो इसके लिए x ट्रेन एंड y अंडर ट्रेन का इस्तेमाल करूंगा क्यों ताकि मैं एक्स्ट्रा ये भी देख सकूं कि ओवरफिटिंग तो नहीं हो गया हमारा मॉडल उसके साथ-साथ एल डॉट मैं क्या कर रहा हूं यहां पे गाइ स्कोर को चेक करूंगा स्कोर के अंदर x टेस्ट y जो टेस्ट है वो भी पास करूंगा और मल्टीप्लाई बा 100 कर लेते हैं रन करते हैं एक्यूरेसी तो बहुत ही कम आ रही है जैसे 77 पर एक्यूरेसी आ रही है इट्स अ वेरी पुअर एक्यूरेसी राइट अब हम इस एक्यूरेसी को बढ़ाएंगे कैसे या तो हम यहां पे डिसटी को इस्तेमाल करते हैं चलिए तो मैं dt3 रिग्रेसर को कॉल कर लेते हैं जहां-जहां एलआर लिगा हुआ है वहां पे मैं डीटी को इस्तेमाल कर लेता हूं तो तो यहां पे भी मैं डीटी ले लेता हूं और इसके साथ-साथ यहां आके भी मैं करता हूं गाइस डीटी कर लेता हूं ओके रन करते हैं डीटी ने काफी अच्छा स्कोर दिया लेकिन ओवर फिटिंग मॉडल बना दिया यहां पर देखिए ट्रेनिंग की एक्यूरेसी तो काफी अच्छी है टेस्टिंग की एक्यूरेसी बहुत कम है ठीक है अब मैं चलता हूं यहां पर किसके पास एसवीएम के पास तो चलिए सपोर्ट वेक्टर मशीन को कॉल कर लेते हैं यहां पर तो एसवीआर को कॉल किया मैंने यहां पर और यहां पर मैंने क्या किया गाइज यहां पर एसवी के नाम से वेरिएबल बनाया यहां पे भी एसवी के नाम से बनाया यहां पर और यहां पे भी मैंने एसवी को कॉल कर दिया है इसके साथ-साथ यहां पे भी मैं करता हूं एसवी को कॉल कर लेता हूं अच्छा रन हैं तो एसवीवी ने भी कुछ ज्यादा अच्छा आंसर निकाल के नहीं दिया है तो तीनों ने बहुत ही अच्छा आंसर नहीं दिया है ठीक है अब मैं क्या कर रहा हूं गाइ यहां पर अब मैं यहां पे इस्तेमाल करूंगा वोटिंग रिग्रेसर का जिसके थ्रू हम इसकी एक्यूरेसी को इंप्रूव करने की कोशिश करेंगे एंड या तो ओवरफिटिंग कम करने की कोशिश करेंगे राइट तो चलिए चलते हैं यहां पर किसके अंदर फ्रॉम साइकल टन के अंदर डॉट असेंबल के अंदर चलते हैं और असेंबल के अंदर मैं इंपोर्ट करने वाला हूं किसे यहां पे गाइज आपके पास वोटिंग रिग्रेसर को यस वोटिंग रिग्रेसर हमारे पास क्या करेगा हमें हेल्प करेगा इसकी एक्यूरेसी को बढ़ाने के लिए चलिए तो तो अब मैं क्या कर रहा हूं यहां पे गाइज वसी के नाम से एक रिबल बना देता हूं दैट इज अ वोटिंग रिग्रेसर ओके अ उसके बाद मैं क्या कर रहा हूं गाइ यहां पर दैट मैं वोटिंग रिग्रेसर को कॉल कर लेता हूं वोटिंग रिग्रेसर के अंदर सबसे पहले आपका पास क्या मांगा जाएगा आपका एस्टिमेटर मांगा जा रहा है तो हमें क्या करना है ये एस्टिमेटर पास करना है अब एस्टिमेटर कैसे पास करना है लिस्ट ऑफ एस्टिमेटर पास करना है यहां पर इस तरह से तो चलिए लिस्ट ऑफ एस्टिमेटर पास करते हैं तो मैं ए के नाम से एक वेरिएबल बना लेता हूं यस और उसके बाद में एक लिस्ट बनाते हैं लिस्ट के अंदर टपल बनाते हैं इसके अंदर सबसे पहले आपके पास क्या है लीनियर रिग्रेशन है तो lr1 के नाम से एक वेरिएबल बना देते हैं और यहां पर हमारा जो लीनियर रिग्रेशन है उसे हम कॉल कर लेते हैं तो दैट अ लीनियर रिग्रेशन उसके बाद गाइज क्या है हमारा नेक्स्ट मॉडल यहां पर आपका dt1 के नाम से बनाएंगे यहां पर और डिसीजन ट्री रिग्रेसर को कॉल कर लेंगे अब dt50 पर एसवीएम होगा यहां पर तो मैं यहां पे sv1 के नाम से वेरिएबल बनाऊंगा और यहां से एवी आ को कॉल कर लेते हैं तो ये तीन मैंने यहां पर मॉडल को चूज किया है अब मैं ए के नाम से जो डाटा है यहां ला के नाम से जो मैंने मॉडल बनाया है यहां पर उनको डाल देते हैं यहां पर और उसके बाद vc1 को क्या करते हैं गाइज यहां पर फिट कर लेते हैं फिट के अंदर मैं यहां पे क्या कर रहा हूं x ट्रेन एंड y जो ट्रेन है वो मैं पास करा रहा हूं तो हमारे तीनों मॉडल जो है वो ट्रेन हो गए यहां पर एक साथ वोटिंग के अंदर राइट और उसके बाद वसी डॉट क्या करते हैं यहां पर स्कोर चेक करते हैं स्कोर के अंदर गाइज मैं यहां पर क्या कर रहा हूं x ट्रेन मैं यहां पे भी चेक करूंगा कि मेरा मॉडल ओवरफिटिंग तो नहीं हो गया तो x ट्रेन एंड y ट्रेन का इस्तेमाल करेंगे इसके साथ-साथ मैं vc1 एंड y टेस्ट मतलब न्यू डाटा के साथ किस तरह से यह परफॉर्म कर रहा है वो भी हम यहां पर चेक कर लेते हैं चलिए रन करते हैं अच्छा मेरे मॉडल की एक्यूरेसी काफी अच्छी आई है लेकिन इसने मॉडल को ओवरफिटिंग बना दिया है काफी हद तक ओवरफिटिंग बना लिया दैट 87 और 75 बना चुका है हां ओवर फिटिंग आ चुका है यहां पर मॉडल लेकिन यहां ओवर फिटिंग नहीं है यहां पे देखेंगे तो ये ओवरफिटिंग है यहां पे देखेंगे तो ये ओवरफिटिंग है तो बेसिकली इसने एसवीआर को आपके पास यहां पे डोमिनेटिंग किया है और एसवीआर के थ्रू यहां पर आंसर देखने को मिल रहा है एसवीआर के जैसा ही आंसर मिल रहा है हां हालांकि ये अच्छा आंसर दे रहा है लेकिन उतना भी अच्छा आंसर्स हमें नहीं दे रहा है तो मे बी हमें यहां पे क्या करना पड़ेगा हमें वेटेज की वैल्यू को चेंजेज करना पड़ेगा तो मैं शायद वेटेज की वैल्यू को चेंजेज करने के बाद मेरे पास एक्यूरेसी अच्छी आ जाए तो मैं क्या कर रहा हूं यहां पर वेटेज की वैल्यू को चेंज करता हूं और वेटेज की वैल्यू को पहले तो 10 कर देता हूं दूसरा मैं 20 कर लेता हूं और दूसरा मैं 30 कर लेता हूं रन करते हैं एंड रन करते हैं नहीं एक्यूरेसी तो अभी भी वैसे की वैसे ही है यहां पर तो इसके अंदर कुछ ज्यादा आपका फर्क नहीं मिला है हां लेकिन एक आंसर आया है कि आपके जो एक्यूरेसी है वो काफी अच्छी हो चुकी है यहां पर अब लेट्स सपोज हमारे पास यहां पे ये वाला जो मॉडल है वो काम का नहीं है तो हम इसको चेंज कर सकते हैं या फिर डीटी के अंदर नंबर ऑफ आपके पास यहां पर डेप्थ है उसे कम कर सकते हैं मतलब हम इसे प्रोनिंग कर सकते हैं तो उससे भी शायद हमारा आंसर जो है वो काफी हद तक अच्छा हो सकता है लेकिन अभी तक आंसर हमें अच्छा नहीं मिला है अच्छा हमें यहां पे ये देखना पड़ेगा कि ये वोटिंग रिग्रेसर काम कैसे कर रहा है तो इसके बारे में मैंने आपको थ्योरी वाले सेशन में बताया था कि वोटिंग रिग्रेसर काम कैसे करता है ये क्या करता है कि गाइ आपके पास यहां पे ये जो तीनों के आंसर्स हैं जैसे लीनियर रिग्रेशन का आंसर है डिसीजन ट्री का आंसर है और एसपीआर का आंसर है ये तीनों के आंसर को क्या करता है एवरेज करके आपको निकाल के देता है तो इसको चेक कर लेते हैं कि क्या ये वाकई में उस तरह से काम कर रहा है या नहीं कर रहा है हां हालांकि इसके एक्यूरेसी को हम डिफरेंट डिफरेंट तरीके से बढ़ा सकते हैं हम चाहे तो हम यहां पे हाइपर पैरामीटर ट्यूनिंग कर सकते हैं यहां पर ठीक है हम चाहे तो यहां पे क्रॉस वैलिडेशन को लगा के चेक कर सकते हैं कि इसकी एक्चुअल एक्यूरेसी कितनी आनी चाहिए पर्टिकुलर मॉडल के ऊपर तो ऐसे बहुत सारे तरीके हैं यहां पर लेकिन अभी हम उस फेस पे नहीं जा रहे हम यहां पर देख रहे हैं कि ये वोटिंग क्लास हम यहां पर ये देख रहे हैं कि ये वोटिंग रिग्रेसर काम कैसे करता है बेसिकली तो मैं उसे यहां पर चेक करने वाला हूं कि ये वोटिंग रिग्रेसर काम कैसे कर रहा है तो चलिए जैसा कि मैंने थ्योरी में बताया था कि तीनों के आंसर का क्या किया जाता है एवरेज लिया जाता है तो वो चेक कर लेते हैं कि यहां पे क्या वाकई में एवरेज के साथ काम हो रहा है या नहीं हो रहा है तो इसको चेक करने के लिए मैं क रहा हूं यहां पर डीए नाम से एक वेरिएबल बनाऊगा और एक डिक्शनरी बना लेते हैं और एक डेटा फ्रेम बना के चेक कर लेते हैं कि तीनों में कंपेयर करके देख ले क्या आंसर होने वाला है ठीक है तो इसके लिए मैं क्या कर रहा हूं गाइ यहां पर आपके पास सबसे पहले एलआर का जो आंसर है वो लूंगा यहां पर अब एलआर का आंसर कैसे लेने वाला हूं यहां पर तो देखिए आपके पास जो एलआर है यहां पर एलआर डॉट क्या करेंगे यहां पर प्रिडिक का कॉल करेंगे एलर डॉ प्रिडिक को कॉल किया जिसके अंदर मैंने क्या किया गाइज यहां पर x टेस्ट डाल दिया ओके इसी के साथ-साथ यदि मैं यहां पे बात करूं डीटी के बारे में डिसीजन ट्री हमारे पास दूसरा मॉडल है यहां पर उसको लेंगे यहां पर तो मैं क्या कर रहा हूं गाइज यहां पर डीटी डॉट यहां पर क्या कर रहा हूं उसका प्रिडिक्ट कर रहा हूं और प्रिडिक्ट के अंदर गाइज मैं कर रहा हूं x अंडर टेस्ट डाल देता हूं उसके बाद में गाइज क्या है हमारे पास नेक्स्ट यहां पर नेक्स्ट यहां पर है एसवीएम तो मैं यहां पर एसवीएम लूंगा सपोर्ट एक्टर मशीन लूंगा यहां पर और इसका नाम कैसे है यहां पर दैट द एसवी के नाम से ओके तो मैंने एवी लिया यहां पर एवी डॉट क्या करेगा गाइज यहां पर प्रिडिक्ट कर लिया है और प्रिडिक्ट के अंदर x क्या कर दिया यहां पे गाइज टेस्ट डाल दिया उसके बाद जो नेक्स्ट है हमारा यहां पर वो है वीसी मतलब वोटिंग क्लासिफाई देन इसका क्या करना है हमें गाइज यहां पर इसको भी प्रिडिक्ट के कॉल पे कॉल करना है और य यहां पे भी क्या करूंगा x अंडर टस्ट डा दूंगा तो ये मेरा डीएफ तैयार हो चुका है अच्छा कहीं मैंने मिस्टेक की है यहां पर दैट्ची के नाम से एक वेरिएबल बनाना है एंड देन की बनाना है एंड एंटर करना है चलिए की बना लिया हमने यहां पर की बनाने के बाद में पीडी डॉट यहां पर क्या करहा हूं डेटा फ्रेम बनाऊंगा यहां पर और डेटा फ्रेम के अंदर इस डीएफ को डाल के पास कर दूंगा तो देखिए ये हमारा आंसर्स हमारे सामने आ चुके हैं अब मुझे यहां पर देखिए ये वाला जो पहला आंसर है ये वाला दूसरा आंसर है ये तीसरा आंसर है यहां पर ये इसका एवरेज आंसर है मतलब वसी का आंसर क्या होना चाहिए एवरेज आंसर होना चाहिए चाहिए चलिए एक काम करते हैं हैड लगा के इसके तीन डाटा को ही देखते हैं यहां पर क्योंकि मुझे तीन डाटा के साथ ही काम है यहां पर तो मैं यहां पे क्या करूंगा इन तीनों के आंसर को कॉपी कर लेता हूं और ये तीनों आंसर मैंने पेस्ट कर दिए हैं और मुझे क्या करना है इनका एवरेज निकालना है तो यहां पर प्लस कर देते हैं और ये हटा के यहां पे भी प्लस कर लेते हैं और डिवाइड बाय क्या कर रहा हूं यहां पे गाइज थ्री कर लेता हूं तो डिवाइड बाय मैंने थ्री कर दिया यहां पर एंड न क्या है तो देखिए आंसर क्या है यहां पर 2.8 15525 ऐसा कुछ आंसर आया यहां पर और यहां पर मैच करेंगे तो यही हमारे पास आंसर आ रहा है एग्जैक्ट आंसर आ रहा है तो इसका मतलब क्या हो रहा है गाइ यहां पर यहां पर ये जो वोटिंग रिग्रेसर है ना ये आपके पास क्या करता है एवरेज करता है मतलब तीनों का जो आंसर होएगा उसका एवरेज आंसर आपको लके देगा और जो आंसर हमें मिल रहा है ट्स उस तरह काम करेगा अब यहां पे जो ये एक्यूरेसी है इतनी ज्यादा अभी भी अच्छी नहीं आई है इसकी एक्यूरेसी अच्छी नहीं होने का रीजन हो सकता है रैंडम स्टेट रैंडम स्टेट की वैल्यू को चेंज करने पर शायद आपके वैल्यू चेंज हो जाए या फिर हम डिसटी के अंदर आपके पास यहां पर इसके हाइपर पैरामीटर ट्यूनिंग करें लीनियर रिग्रेशन के अंदर हाइपर पैरामीटर ट्यूनिंग करें एसआर के अंदर हाइपर पैरामीटर की ट्यूनिंग करें राइट तो इनसे भी काफी अच्छा फर्क पड़ता है और आपकी एक्यूरेसी आने के चांसेस और ज्यादा इंप्रूव हो जाते हैं राइट अब समझते हैं यह बैगिंग कैसे काम करता है यहां पर यदि आपको पाइन मशीन लर्निंग डेटा साइंस एंड डेटा एनालिस फील में अपने आपको को ग्रो करना है तो इसके लिए डब्लू कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जवाइन करके आप अपने स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो बेसिकली गाइज बैगिंग की बात करूं तो बैगिंग का पूरा नाम यादि आप बोले याद आप बैगिंग को बोले तो बैगिंग क्या है यहां पर बूट स्टेप एग्री एग्रीगेशन यस इसका पूरा नाम क्या है यहां पर बूट स्टेप एग्रीगेशंस हम इसे बोलते हैं यहां पर बेसिकली अब ये बूट स्टेप एग्रीगेशन करता क्या है बूट स्टेप एग्रीगेशन एक पैरेलल टेक्निक है गाइज यहां पर यस ये कौन सी टेक्निक है गाइज यहां पर ये एक पैरेलल टेक्निक है यहां पर अब ये पैरेलल टेक्निक का मतलब क्या है यहां पर बेसिकली ये पैरेलल टेक्निक क्यों बोली जा रही है इसके पीछे रीजन अभी आपको थोड़ी देर में समझ में आ जाएगा देर इज अ पैरेलल टेक्निक टू इंप्रूव योर मॉडल यस आपने मॉडल की जो एक्यूरेसी है उनको बढ़ाने के लिए आपके पास यहां पे यूज किया जाता है अब ये काम कैसे करता है जरा समझते हैं यहां पर तो ये क्या करता है कि आपके पास जो भी आपका ओरिजिनल डेटा सेट है आपके पास जो भी जितना भी ओरिजिनल डेटा सेट है उस ओरिजिनल डेटा सेट को छोटे-छोटे पार्ट्स के अंदर तोड़ता है अब ये छोटे-छोटे जितने भी पार्ट्स आपके पास लिए जा रहे हैं यहां पर ये पार्ट्स आपके रैंडम सिलेक्टेड होता है अब यहां पर हो सकता है कि इसके अंदर कुछ डाटा इस के अंदर भी आ चुका हो या हो सकता है कि इसके अंदर का का डेटा कुछ इसके अंदर भी आ चुका हूं तो ऐसा पॉसिबल है यहां पर आपके पास जैसे मान लीजिए कि आपके पास यहां पर 10000 रो है यस आपके पास क्या है यहां पर 10000 रो है यहां पर और 10000 रो में से आपने क्या किया ट्रेनिंग और टेस्टिंग के अंदर तोड़ चुके हैं आप यहां पर ट्रेनिंग और टेस्टिंग के अंदर तोड़ने के बाद में अब आप क्या रहे हैं गाइज यहां पर कि जैसे कि आपके पास 8000 रो आपके पास किसके अंदर आ गई यहां पर ट्रेनिंग के अंदर आ गई अब ये जो 8000 रो है ना इस 8000 रो को आप क्या करते हैं अलग-अलग सबसेट्स के अंदर तोड़ते हैं यस अलग-अलग सबसेट्स के अंदर तोड़ते हैं लेकिन एक चीज का ध्यान रखते हैं तोड़ते वक्त यहां पर कि आप जो सबसेट्स तोड़ रहे हैं वो आपके पास इसके ओरिजिनल डाटा के कंपेरटिवली बराबर ना आना चाहिए मतलब उससे हमेशा लेस देन ही होना चाहिए ये चीज आपको स्पेशली ध्यान रखना है भाई 8000 से कम ही आपको यहां पे क्या करना है ब्रेक डाउन यहां पे करना है अब आपने क्या किया बहुत सारे सबसेट्स तैयार कर लिए अब ये डिपेंड करे गा कि आप कितने नंबर ऑफ सबसेट्स बनाते हैं यस आप क्या करेंगे अलग-अलग सबसेट्स तैयार करेंगे अब अलग-अलग सबसेट्स तैयार करने के बाद में अब नेक्स्ट प्रोसेस स्टार्ट होता है दैट इ अ बैगिंग प्रोसेस इसके अंदर क्या करते हैं कि ये जितने भी सबसेट्स आपने बनाए लेट्स सपोज मैंने पांच सबसेट्स यहां पे तैयार किए हैं यस इन पांच सबसेट को आप क्या करते हैं पांच मॉडल्स को देते हैं अब ये पांच मॉडल्स जो होते हैं यहां पर ये सेम मॉडल होते हैं यहां पर मतलब सेम आपके पास यहां पर मॉडल्स हो सकते हैं जैसे कि मैंने डिसीजन ट्री इस्तेमाल किया राइट मैंने क्या किया डिसीजन ट्री इस्तेमाल किया तो इस डिसीजन ट्री को आप क्या करते हैं सबसेट नंबर वन देते हैं और सबसेट नंबर वन से आप क्या करते हैं ट्रेनिंग करते हैं य सबसेट नंबर वन से क्या करते हैं आप ट्रेनिंग करते हैं और ट्रेनिंग करके आपके पास फाइनल प्रेडिक्शन बना देते हैं उसके बाद में क्या करते है गाइ यहां पर आपने इसी डिसीजन ट्री को आपने क्या किया सबसेट टू दिया इसी डिसीजन ट्री को सबसेट नंबर थ्री दिया इसी को डिसीजन ट्री को सबसेट नंबर फोर दिया इसी को फाइव दिया तो आपने क्या किया पांच अलग-अलग डिसीजन ट्री बनाए मतलब आपने यहां पर dt1 बना दिया यहां पर यस इसी तरह से dt2 बना लिया उसके बाद डीटी आपके पास यहां पर थ्री बना लिया इसी तरह से dt4 बना लिया इसी तरह से आपने क्या किया dt543 दौर पे बात करूं तो मेरे पास मान लीजिए 1 2 3 4 5 ये मेरे पास यहां पर क्या है रो नंबर्स है मेरे डाटा की तो इसने क्या किया मैंने कुछ पूछा कि यहां पर कितने टुकड़े करने है तो पांच टुकड़े करना है तो मैंने पांच टुकड़े कुछ इस तरह से कर दिए कि पहले में 1 2 3 ले लिया यहां पर दूसरे के अंदर 2 3 4 ले लिया मैंने यहां पर तीसरे के अंदर 3 4 5 ले लिया मैंने यहां पर अब चौथे के अंदर बात करें तो 1 3 4 ले लिया मैंने यहां पर और पांचवे में बात करें तो 1 4 5 ले लिया यहां पर तो ये पांच अलग-अलग आपके टुकड़े हो गए यहां पर अब ये पांच अलग-अलग टुकड़े को हमने क्या किया पहले वाले को dt1 से टेंड किया तीसरे वाले फिर से डीडी को ट्रेन किया चौथे वाले को फिर से डीडी को ट्रेन किया पांच वाले को फिर से डीडी को ट्रेन किया यह पांचों डीडी के मॉडल अलग-अलग होंगे यहां पर यस पांच क्या होंगे आपके पास यहां पर अलग-अलग मॉडल्स यहां पर होते हैं अब पांचों अलग-अलग मॉडल्स को हमने क्या किया है गाइज यहां पर आपके पास कंबाइन करके एक सिंगल प्रेडिक्शन मॉडल बना दिया अब जब भी हमारे पास यहां पर न्यू डाटा आएगा यस हमारे पास क्या आएगा यहां पर न्यू हमारे पास डाटा आएगा यहां पर या फिर आप बोल सकते हैं कि हमारे पास क्या आ रहा है टेस्टिंग वाला जो डाटा आपके पास आ रहा है यहां पर यह टेस्टिंग वाला डाटा हम क्या करते हैं गाइज यहां पर इस मॉडल वन को भी देते हैं इसी तरह से ये डाटा मॉडल टू को भी मिलेगा ये डाटा मॉडल थ्री को भी मिलेगा ये डाटा मॉडल फोर को भी मिलेगा और ये डाटा मॉडल फाइव को भी मिलेगा मतलब पांचों मॉडल को हम क्या करेंगे एक-एक करके डाटा ट्रांसफर करेंगे अब पांचों तरीकों को डेटा ट्रांसफर करने के बाद में ये कुछ रिजल्ट देगा यहां पर अब मान लीजिए कि ये क्या है क्लासिफिकेशन एनालिसिस का है यहां पर अब जब ये क्लासिफिकेशन एनालिसिस का है तो बेसिकली मॉडल वन अपना आंसर देगा लेट्स सपोज रो इसका आंसर मिला आपको रो इसका आंसर मिला आपको यहां पर वन इसका आंसर मिला रो और इसका आंसर मिला आपको वन अब इन सब में मैक्सिमम आंसर किसका है यस यहां पर कितना है मैक्सिमम आंसर कितना है तो मैक्सिमम आंसर आपको दिख रहा है रो तो आपको मिल जाता है रो आंसर लेट्स सपोज ये क्लासिफिकेशन की जगह ये होता रिग्रेशन का यस ये क्या होता गाइज यहां पर रिग्रेशन एनालिसिस का होता तो रिग्रेशन एनालिसिस के अंदर आपके पास क्या होता है गाइज यहां पर ये मैक्सिमम वर्क नहीं करती वहां पे क्या करता आपका एवरेज वर्क करता कि जैसे मान लो यहां पे 20 आया यहां पे 21 आया यहां पे 22 आ रहा है यहां पे 19 आ रहा है यहां पर 18 आ रहा है यहां पर तो अब क्या होगा गाइज यहां पर 20 यस 20 20 + 21 + 22 + 19 + 18 डिवाइडेड बाय आपके पास क्या होगा 5 यस आपके पास यहां पे क्या निकलेगा गाइज यहां पर एवरेज आपके सस फाइंड होने वाला है अब जो भी आपका एवरेज फाइंड आउट हो रहा है यहां पर यस जो भी आपका क्या हो रहा है एवरेज फाइंड आउट हो रहा है यहां पर वो आंसर्स आपको दे जाता है या फिर जो मैक्स आपके पास फाइंड आउट होता है वो फाइनल आंसर आपको दे दिया जाता है तो इससे ऑटोमेटिक आपके पास आपके पास क्या हो गई आपके मॉडल की एक्यूरेसी बढ़ गई क्यों क्योंकि देखिए आपके पास जब आप यहां पर एक बार आप अपना मॉडल को ट्रेन करते हैं तो उसके अंदर आपका मॉडल परफेक्टली ट्रेन तो होता है हर एक डाटा के ऊपर ट्रेंड होता है लेकिन वो कुछ ऐसे इंपॉर्टेंट फीचर्स होते हैं उनको लैक कर सकता है राइट लेकिन जब आप बैगिंग का इस्तेमाल करते हैं तो बैकिंग क्या करता है यहां पर हर एक डेटा सेट के अंदर बहुत सारे टुकड़े करता है और बहुत सारे टुकड़े के ऊपर बहुत सारे मॉडल को अलग-अलग तरीके से ट्रेन करता है तो आपके पास होता क्या है यहां पर कि आपका डाटा हर एक सिचुएशन के अंदर आपका मॉडल ट्रेंड होता है और जब ये हर एक सिचुएशन के अंदर अपना मॉडल ट्रेंड करेगा तो डेफिनेटली आपके पास आपका जो डटा सेट है वो पूरी तरीके से ओवरऑल पूरा ट्रेड हो जाता है यस ओवरऑल क्या हो जाता है पूरा का पूरा ट्रेंड हो जाता है तो उससे आपके एक्यूरेसी होने के चांसेस बढ़ जाते हैं तो इस तरह से आपके पास क्या आता है बैगिंग जो है वो पैरेलल टेक्निक का इस्तेमाल करते हुए आपके मॉडल को बहुत अच्छी तरीके से क्या करता है ट्रेंड कर देता है यहां पर अब ये जो बैकिंग है ये टेकनिक जो है वो दो तरीके की होती है यहां पर पहली होती है बैगिंग मेटा एस्टिमेटर होती है और दूसरी होती है रैंडम फॉरेस्ट यस दूसरी आपके पास क्या है रैंडम फॉरेस्ट है यहां पर अब बैगिंग मेटा एस्टिमेटर में होता क्या है देखिए बैगिंग मेटा एस्टिमेटर आपके पास बैगिंग की तरह ही वर्किंग करता है कोई डिफरेंस तो है नहीं यहां पर बस सिंपल सा यहां पे यह है कि आप यहां पर एस्टिमेटर के तौर पे यस आप यहां पर एस्टिमेटर के तौर पे कोई भी मॉडल को चूज कर सकते हैं मतलब मैं बात करूं यहां पर कि आप कोई भी आप यहां पर एल्गोरिथम को चूज कर सकते हैं जैसे कि मैं यहां पे चाहूं तो k&n को चूज कर सकता हूं यस के नियर्स नेबर को चूज कर सकता हूं मैं चाहूं तो एसवीएम को चूज कर सकता हूं मैं चाहूं तो आपके पास डीटी को चूज कर सकता हूं यहां पर मैं चाहूं तो लीनियर रिग्रेशन को चूज कर सकता हूं मैं चाहूं तो लॉजिस्टिक रिग्रेशन को चूज कर सकता हूं मैं चाहूं तो न्यू बायस को चूज कर सकता हूं तो मैं जिस किसी जो भी चाहूं वो आपके पास चूज कर सकता हूं यस इसके अंदर कोई भी आपके पास यहां पर कोई भी मैंडेटरी नहीं होता है हां हालांकि यदि आप इनमें से कोई भी मॉडल नहीं देते हैं तो इसके अंदर एक बेस मॉडल जरूर होता है यहां पर यस वो बेस मॉडल कौन सा होता है यहां पर डीटी होता है मतलब डिसीजन ट्री इसका एक बेस मॉडल होता है लेकिन यदि आप बेस मॉडल की जगह कोई अपना मॉडल देना चाहे तो वो आप बैगिंग मीटा एस्टिमेटर को देके अपने मॉडल की एक्यूरेसी को इंप्रूव कर सकते हैं यहीं पे आता है रैंडम फॉरेस्ट देखिए रैंडम फॉरेस्ट आपके पास एक डिसीजन ट्री का ही पार्ट है राइट ये क्या है डिसीजन ट्री का पार्ट है लेकिन ये असेंबल टेक्निक का पार्ट है इसलिए हम इसे यहां पर डिस्कस कर रहे हैं हमने उस समय नहीं डिस्कस किया था जब हम रैंडम फॉरेस्ट पढ़ रहे थे बेसिकली रैंडम फॉरेस्ट के अंदर क्या होता है कि आपका जो बेस मॉडल होता है वो पहले से डिसीजन डिसाइड होता है और वो क्या होता है डिसीजन ट्री होता है इसे आप चेंजेज नहीं कर सकते मतलब रैंडम फॉरेस्ट के अंदर क्या होता है गाइ यहां पर आप पहले से ही क्या करता है आपका बेस मॉडल डिसाइड होता है और वो क्या होता है डीटी है आप उसे डीटी को चेंज नहीं कर सकते डीटी ही आपका यहां पर रहने वाला है तो इस तरह से आपका जो बैगिंग है वो यहां पर वर्किंग करता है यहां पर और बैगिंग जो है वो दो तरीके की है कौन सी एक तो बैगिंग मेटा एटी मटर है और दूसरा है रैंडम फॉरेस्ट यस इन दो तरीके से आप क्या कर सकते हो अपने मॉडल की एक्यूरेसी को इंप्रूव कर सकते हो चलिए अब जरा समझते हैं यह बैगिंग कैसे काम करता है बैगिंग मेटा एस्टिमेटर और रैंडम फॉरेस्ट जरा से समझते हैं यहां पर यदि आपको पाइथन मशीन लर्निंग डेटा साइंस एंड डेटा एनालिस की फील्ड में अपने आपको को ग्रो करना है तो इसके लिए डब्लू कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो मैं ले चलता हूं आपको जुपिटर नोटबुक के परस जहां पे मैंने क्या करखा है पहले जो मेरी रिक्वायर्ड लाइब्रेरी है वो मैंने ले रखा है यहां पर और मैंने डेटा सेट बनाने के लिए यहां पर मेक मून का इस्तेमाल किया यहां पर मेक मून से मैं अपना क्या कर रहा हूं डेटा सेट तैयार कर रहा हूं और जो कि डेटा सेट कुछ इस तरह से दिखता है ओके अब इस डेटा सेट को हम क्या करते हैं हम इस डेटा सेट को स्प्लिट करते हैं ट्रेन और टेस्ट के अंदर उससे पहले हमें क्या करना पड़ेगा डेटा सेट को स्प्लिटिंग करना पड़ेगा x और y के अंदर एंड देन काम करना पड़ेगा तो मैं यहां पे x a के नाम से एक वेरिएबल बना देता हूं जहां पे मैं क्या कर रहा हूं अपना जो डेटा सेट है यहां पर उसे लूंगा डॉट यहां पर आई लॉग का इस्तेमाल करते हुए यस सारी नंबर ऑफ रोज लूंगा एंड सारे नंबर ऑफ कॉलम लूंगा लेकिन -1 को छोड़ दूंगा इसी तरह से y a का इस्तेमाल करते हुए मैं करूंगा यहां पे गाइ डाटा सेट को लूंगा यहां पर और मेरे पास जो लास्ट वाला कॉलम है दैट अ y उसे मैं यहां पर लेके एंड रन कर देता हूं ठीक है आई थिंक मेरा वा ही है या y ही है तो मैंने y लेके रन कर लिया चलिए अब हम क्या कर रहे हैं हमारे डटा सेट के अंदर ट्रेन टेस्ट के अंदर स्प्लिटिंग करते हैं उसके लिए फ्रॉम सेकंड हैंड के अंदर चलते हैं डॉट कहां चल रहे हैं गाइज यहां पर मॉडल सिलेक्शन के लिए चलते हैं और दैट मैं इंपोर्ट कर रहा हूं यहां पर और क्या इंपोर्ट कर र हैं टेंट स्लेटिंग को कर र है यहां पर जाके मैं x अंडर क्या कर रहा हूं यहां पर ट्रेन का इस्तेमाल कर रहा हूं x अंडर मैं यहां पे टेस्ट का इस्तेमाल करूंगा यस x अंडरस्कोर मैं यहां पे टेस्ट का इस्तेमाल करने वाला हूं यहां पर ठीक है तो नेक्स्ट हमारे पास क्या होगा y अंडरस्कोर मैं यहां पर ट्रेन का इस्तेमाल करूंगा एंड y अंडरस्कोर मैं यहां पे टेस्ट का इस्तेमाल करने वाला हूं ओके और यहां पर हम क्या कर रहे हैं हमारी जो ट्रेन टे स्प्लिटिंग है उसे हम कॉल कर रहे हैं ओके एंड इसके अंदर सर मेरे पास x ए जो है उसको देंगे और y a जो है वो दूंगा यहां पर एंड नेक्स्ट टॉपिक क्या होगा गाइज यहां पर रैंडम स्टेट होगा देन रैंडम स्टेट की वैल्यू 42 दूंगा और टेस्टिंग जो साइज है यहां पर वो 0.22 रखने वाला हूं ओके इस तरह से हमारे पास क्या हो गया डटा हमारा स्प्लिटिंग हो चुका है अब मैं बात करूंगा कि बैगिंग मेटा एस्टिमेटर और रैंडम फरेस कैसे काम करता है तो इसके लिए मुझे जाना पड़ेगा फ्रॉम साइकल न के अंदर डॉट उसके बाद मैं जाना पड़ेगा सैबल के अंदर असेंबल के अंदर जाने के बाद ट मैं इंपोर्ट करूंगा यहां पर किसे बैगिंग मीटा एस्टिमेटर को मतलब आपके पास यहां पर बैगिंग क्लासिफाइड जेज मैं यहां पे फ्रॉम साइकल के अंदर चलूंगा यहां पर और डॉट वापस जाऊंगा असेंबल के अंदर और असेंबल के अंदर यस मैं यहां पे ये सेकंड दो बार आ चुका है तो एक बार इसे हटा देते हैं असेंबल के अंदर जाऊंगा असेंबल के अंदर जाने के बाद दैट मैं इंपोर्ट करने वाला हूं और किसे इंपोर्ट करने वाला हूं गाइज यहां पर मैं इंपोर्ट करूंगा रैंडम फॉरेस्ट को यस तो मैं रैंडम फॉरेस्ट क्लासिफाई को कॉल कर लेता हूं चलिए अब हम क्या कर रहे हैं दोनों का मॉडल बनाते हैं अब देखिए बैगिंग मेटा एस्टिमेटर को जब आप इस्तेमाल करते हैं मतलब बैगिंग क्लासियर को इस्तेमाल करते हैं जैसे कि मैं बीजी के नाम से क्वाब बना के इस को इस्तेमाल कर रहा हूं यहां पर बैकिंग क्लासिफिकेसियों ट्री यस ये डिसीजन ट्री को बेस एस्टिमेटर बान लेता है लेकिन हम यहां पे क्या कर रहे हैं नन नहीं डालेंगे हम कोई और एस्टिमेटर यहां पे यूज़ करेंगे अब जैसे ए मैं यहां पे दूसरा एस्टिमेटर कौन सा यूज कर रहा हूं एसवीएम को इस्तेमाल करूंगा तो इसके लिए मैं क्या करूंगा साइक टन के अंदर चलूंगा ओके डॉट उसके बाद मैं क्या कर रहा हूं गाइ यहां पर एसवीएम को कॉल करूंगा मेरा बेस एस्टिमेटर कौन सा होने वाला है यहां पर एवीएम यहां पर होगा राइट एंड देन मैं यहां पे इंपोर्ट करूंगा कैसे यहां पर एवीसी सपोर्ट वेक्टर क्लास वायल ओके तो ये हमारा बेस मॉडल होने वाला है अब ये बेस मॉडल कैसे रखेंगे यहां पर तो आपको क्या करना है सिंपल सा एस्टिमेटर की वैल्यू देनी है एस्टिमेटर की वैल्यू देने के बाद में मैं क्या करूंगा यहां पर ये जो मेरा एसवीसी है ये एसवीसी जो है यहां पर देन मुझे वो पास करना है यहां पर तो मैंने एसवीसी पास कर लिया है एज एस्टिमेटर के तौर पे नेक्स्ट चीज क्या है गाइज यहां पर नंबर ऑफ एस्टिमेटर मतलब आप कितने नंबर ऑफ सबसेट्स बनाना चाहते हैं मतलब आप अपने डेटा सेट को कितने पार्ट के अंदर तोड़ेंगे जितने पार्ट के अंदर आप तोड़ेंगे उतने ही आपके एस्टिमेटर उतने ही आपके मॉडल्स जो हैं वो ट्रेंड होने वाले हैं तो गाइस मैं यहां पे नंबर ऑफ एस्टिमेटर की वैल्यू देने वाला हूं तो देखिए मैं नंबर ऑफ एस्टिमेटर की वैल्यू दूंगा और नंबर ऑफ एस्टिमेटर की वैल्यू कर देता हूं 30 ओके ये दे रहा हूं एंड फिर उसके बाद क्या करूंगा गाइज यहां पर बीजी डॉट क्या करूंगा यहां पर मडल को फिट करूंगा फिट करने के बाद में मैं यहां पे पास कराऊंगा x ट्रेन एंड पास कराऊंगा यहां पर y इंड को ट्रेन एंड डन कर लेते हैं तो ये एसवीसी के हिसाब से तैयार हो चुका है यहां पर सपोर्ट वेक्टर क्लासियर के तैयार हो गया है यहां पर एंड बीजी डॉट यहां पर फिर से क्या कर रहे हैं यहां पर स्कोर चेक करते हैं स्कोर के अंदर मैं x ट्रेन एंड y ट्रेन जो है वो पास करूंगा मल्टीप्लाई बाय 100 कर लेते हैं इसी तरह से यहां पर बीजी डॉट मैं क रहा हूं यहां पर स्कोर चेक कर रहा हूं ठीक है और स्कोर के अंदर x यहां पर टेस्ट एंड y अको जो टेस्ट है वो पास कराते हैं मल्टीप्लाई बाय 100 कर लेते हैं स्कोर चेक करते हैं दैट 96 और 7 पर देखिए टेस्टिंग की एक्यूरेसी ज्यादा आ गई है और ट्रेनिंग की एक्यूरेसी कम आ गई है मतलब एक अच्छा मॉडल हमारे पास बन के तैयार हो चुका है बहुत ही काफी अच्छा मॉडल बना है यहां पर यदि आप डायरेक्ट एसवीसी से काम करते हैं ना तो डायरेक्ट एसवीसी से भी इतना अच्छा आंसर नहीं आ सकता चलो चेक कर लेते हैं कि डायरेक्ट एसवीसी हमें कितना आंसर देता है ठीक है तो मैं डायरेक्ट एसवीसी लगा के देख ता हूं यहां पर तो देखिए एसवी के नाम से एक वेबल बनाता हूं और यहां पर मैं डायरेक्ट एसवीसी को कॉल कर लेता हूं यहां पर उसके बाद एसवी डॉट यहां पे क्या कर रहा हूं मॉडल को फिट कर लेता हूं यहां पर एंड फिट के अंदर x ट्रेन एंड y ट्रेन को डाल देता हूं यहां पर उसके के बाद एवी डॉट यहां पर क्या करेंगे यहां पर स्कोर चेक कर लेते हैं और स्कोर के अंदर गाइज यहां पर क्या कर रहा हूं x अर या स्कोर के अंदर क्या कर रहे हैं गाइस यहां पर मैं यहां पर x ट्रेन एंड y अ जो ट्रेन है वो मैं पास कर लेता हूं मल्टीप्लाई बा 100 कर लेते हैं यस मल्टीप्लिकेशन बाय 100 कर लेते हैं उसके बाद एसवी डॉट फिर से क्या करना है स्कोर चेक कर लेते हैं यहां पर और स्कोर के अंदर x अंड टेस्ट एंड y जो टेस्ट है वो पास कर लेते हैं और मल्टीप्लाई बाय 100 कर लेते हैं देखिए 96 और 97 पर एक्यूरेसी है अच्छा यहां पे भी 96 और 97 पर एक्यूरेसी आ है मलब एक्यूरेसी में कुछ ज्यादा तो फर्क आया नहीं है चलिए एस्टिमेटर की वैल्यू को बढ़ा के चेक कर लेते हैं एक बार एस्टिमेटर की वैल्यू 50 कर लेते हैं यहां पर और 50 के हिसाब से देखें या 50 के हिसाब से 96 और 97 अभी देखिए एक्यूरेसी बढ़ चुकी है आप देखेंगे यहां पर आपके पास यहां पे 125 था यहां पर जो कि 37 हो चुका है यहां पर और ये रो था और ये 0.5 हो गया मतलब 5 पर एक्यूरेसी बढ़ी है देखिए % एक्यूरेसी भी बहुत ज्यादा एक्यूरेसी होती है यहां पर ठीक है ये 5.5 बढ़ाते बढ़ाते आप अपनी एक्यूरेसी को बहुत अच्छे एक्यूरेसी तक पहुंचा सकते हैं यदि मैं एस्टिमेटर की वैल्यू 100 कर लूं यस एस्टिमेटर इक्वल्स टू मैं यहां पर 100 एस्टिमेटर रखूं यहां पर राइट उसके हिसाब से चेक करें यहां पर तो देखिए 96.1 27 और ये मतलब ओरिजिनल आंसर पे ही हम पहुंच चुके हैं अच्छा एक बार 10 एस्टिमेटर लेके रखे यहां पर और 10 एस्टिमेटर पे देखें तो 10 एस्टिमेटर पे भी वही है यहां पर ओवरऑल 50 एस्टिमेटर आपके लिए बेस्ट रहेंगे और 50 एस्टिमेटर पे आपकी एक्यूरेसी काफी अच्छी आ रही थी राइट एक बार मैं वापस एक काम करते हैं कर्नल को रीस्टार्ट कर लेते हैं एंड रीस्टार्ट करने के बाद में मैं यहां पे क्या कर रहा हूं रन पे चल रहा हूं यहां पर और रन ऑल सेल कर देता हूं ताकि एक्यूरेसी एक बार मुझे दिख जाए कि कितनी परसेंट एक्यूरेसी आ रही है ओके तो 96 पॉइंट आपके पास आ रही है और 98 पॉ आपके पास आ रही है एसवीसी की ज्यादा आ रही है यहां पर और ये आपकी थोड़ी सी कम आ रही है राइट तो यहां पर आपके पास 20 मॉडल लेके चेक करें यहां पर ओके 20 में देखें या ये भी देखिए काफी अच्छी एक्यूरेसी तक पहुंच चुका है है ना तो इस तरह से आप यहां पे क्या कर सकते हैं बैगिंग का इस्तेमाल करके आप अपनी एक्यूरेसी बढ़ा सकते हैं अब सेकंड चीज है यहां पर रैंडम फॉरेस्ट यस ये रैंडम फॉरेस्ट कैसे इस्तेमाल होगा तो रैंडम फॉरेस्ट को इस्तेमाल करने के लिए गा मैं क्या कर रहा हूं यहां पर रेंडम फॉरेस्ट को इस्तेमाल करने के लिए मैं रैंडम फॉरेस्ट के लिए एक ऑब्जेक्ट तैयार कर लेता हूं दैट इज अ आरएफ के नाम से रैंडम फॉरेस्ट के नाम से ओके और यहां पर मेरा जो रैंडम फॉरेस्ट क्लासियर है इसे हम कॉल करते हैं यहां पे आपको एस्टिमेटर की वैल्यू नहीं पूछी जाती है सीधा ए नंबर ऑफ एस्टिमेटर पूछा जाता है मतलब आप अपने डेटा सेट को कितने पार्ट के अंदर स्प्लिटिंग करना चाहते हैं ये पूछा जाता है ना कि आपके पास ये पूछा जाता है कि आपके पास यहां पर कौन सा एस्टिमेटर होगा क्योंकि इसके अंदर जो एस्टिमेटर होता है जो बेस एस्टिमेटर होता है वो पहले से डिसाइड होता है दैट अ डिसीजन ट्री यदि आप इसे थोड़ा सा यहां यहां पर ओपन करेंगे यहां पर तो देखिए आपका जो एस्टिमेटर है वो पहले से डिसाइड है यस यहां पर जो आप थोड़ा सा नीचे मूव करेंगे तो आपका जो बेस एस्टिमेटर है वो पहले से डिसाइड है दैट इज अ डिसीजन ट्री यस तो यहां पे डिसीजन ट्री य है यहां पर और यहां पे देखिए क्राइटेरिया भी जीनी इंडेक्स वगैरह एंट्रोपय सब चल रहे है यहां पर तो मैं गाइज बात करूं यहां पर एन नंबर ऑफ एस्टिमेटर के बारे में ए नंबर ऑफ एस्टिमेटर मैं कर देता हूं कि 30 एस्टिमेटर चाहिए अब आरएफ डॉट यहां पे क्या करता है आपके पास यहां पर फिट करते हैं मॉडल को आरएफ डॉट क्या करते हैं यहां पे मॉडल को फिट करते हैं और फिट के अंदर गाइज मैं कर रहा हूं यहां पर एक्संड ट्रेन एंड y जो ट्रेन है वो पास करूंगा यहां पर फिर उसके बाद आरएफ डॉट क्या कर रहा हूं यहां पे गाइ स्कोर चेक करता हूं स्कोर के अंदर x टेस्ट ए पहले यहां पे ट्रेन कर देख लेते हैं x ट्रेन एंड y जो ट्रेन है वो पास करूंगा मल्टीप्लाई बाय 100 दूंगा एंड उसके बाद आरएफ डॉट मैं क्या करूंगा यहां पे डॉट स्कोर को चेक करूंगा यहां पर जिसके अंदर x टेस्ट एंड y जो टेस्ट है वो पास कर लेता हूं और मल्टीप्लिकेशन बाय 100 कर देता हूं यस मल्टीप्लाई बा 100 एंड रन करते हैं देखिए 195 बहुत अच्छी है एक्यूरेसी मिली है यहां पर बैकिंग मेटा एस्टिमेटर से ज्यादा अच्छी एक्यूरेसी मिली है यहां पर हालांकि ओवरफिटिंग हो चुका है इस ओवरफिटिंग को ओवरकम करा जा सकता है और ये कैसे किया जा सकता है यहां पे गाइज इसके अंदर बहुत सारे हाइपर पैरामीटर्स हैं उन हाइपर पैरामीटर्स की वैल्यू को चेंजेज करके आप कर सकते हैं जैसे कि आप मैक्स टप की वैल्यू को चेंज कीजिए राइट और आप काटेरिन को चेंज कीजिए यहां पर नंबर ऑफ स्लेडिंग को चेंज कीजिए यहां पर तो ऐसे बहुत सारे हाइपर पैरामीटर्स हैं यहां पर देखिए बहुत सारे हाइपर पैरामीटर्स हैं इन हाइपर पैरामीटर की वैल्यू को आप चेंज करके आप अपने एक्यूरेसी को बढ़ा सकते हैं तो गाइ इस तरह से आपके पास क्या करता है बैगिंग मेटा एस्टिमेटर एंड बात करें रैंडम फॉरेस्ट क्लासिफाई इस तरह से वर्क करता है और आप यहां पर अपने बेस्ट मॉडल को बना सकते हैं असेंबल लर्निंग के जरिए तो मैं देखिए आपके पास पहले से क्या कर रहा है एक डाटा सेट आपको दिखा देता हूं देखिए ये एक डाटा सेट है जो कि प्लेसमेंट का है क्योंकि आप देख के आए हैं यहां पर पहले भी हमने इसको काफी बार यूज़ किया है यहां पर जिसके अंदर हम सीजीपी के बेसिस पे हम पैकेज डिसाइड कर रहे हैं कि भाई किसी का कोई सीजीपी आ रहा है उसके बेसिस पे क्या पैकेज उसका होने वाला है दैट्ची है इसको मैंने क्या कर रखा है पहले से यहां पर कुछ कोड के जरिए लोड करा रखा है चलिए इस कोड को थोड़ा समझ लेते हैं यहां पर सबसे पहले मैंने क्या किया यहां पर पांडा को इंपोर्ट किया यहां पर उसके बाद में मैंने जो डेटा सेट है वो लिया मैंने यहां पर और डटा सेट को हेड लगा के तीन डाटा को दिखा यहां पर एंड फिर मैंने क्या किया यहां पर इसको इनपुट और आउटपुट के अंदर अलग-अलग किया है फिर मैंने इसको ट्रेन और टेस्ट के अंदर स्प्लिटिंग करके रखा है अब अब यहां पे हम क्या करेंगे बैगिंग मेटा एस्टिमेटर एंड रैंडम फॉरेस्ट को इस्तेमाल करके इसकी एक्यूरेसी को देखेंगे कि कितने परसेंट एक्यूरेट मॉडल बनाता है मतलब ये किस तरह से सबसेट के अंदर डिवाइड करके एक्यूरेट में आंसर देता है तो चलिए इसके लिए मैं क रहा हूं फ्रॉम सेकल के अंदर जाऊंगा डॉट उसके बाद मैं जाऊंगा असेंबल के अंदर असेंबल के अंदर जाने के बाद दैट मैं इंपोर्ट करने वाला हूं यहां पर क्या इंपोर्ट करने वाला हूं गाइस यहां पर मैं इंपोर्ट करूंगा बैगिंग रिग्रेसर का क्योंकि रिग्रेस एनालिसिस है तो इसलिए मुझे रिग्रेसर का इस्तेमाल करना पड़ेगा क्योंकि हम यहां पे क्या कर रहे हैं पैकेज को फाइंड आउट कर रहे हैं और पैकेज क्या है रिग्रेशन टाइप का डाटा है तो इसलिए हम रिग्रेशन एनालिसिस को इस्तेमाल कर रहे हैं उसके बाद मैं फ्रॉम साइकल न के अंदर चलूंगा यहां पर डॉट मैं फिर से असेंबल में जाऊंगा यहां पर और असेंबल में जाने के बाद में ट मैं यहां पे इंपोर्ट करने वाला हूं यहां पर और इंपोर्ट किसे करेंगे यहां पर रैंडम फॉरेस्ट को करेंगे और रैंडम फॉरेस्ट में किसको इस्तेमाल कर रैंडम फॉरेस्ट रिग्रेसर को इस्तेमाल करना है रैंडम फॉरेस्ट में रैंडम फॉरेस्ट रिग्रेसर को इस्तेमाल करना है चलिए तो बना लेते हैं यहां पर अब देखिए ये जो बैगिंग मेटा एस्टिमेटर बैगिंग मेटा एस्टिमेटर है मतलब बैगिंग रिग्रेसर जो आपको दिख रहा है इसका मैं ऑब्जेक्ट बना रहा हूं दैट इ अ बीजी और बैगिंग रिग्रेसर को मैं कॉल कर रहा हूं यहां पर बैगिंग रिग्रेसर के अंदर सबसे बड़ी प्रॉब्लम यह है कि आपको एस्टिमेटर देना पड़ता है कि आप कौन से एस्टिमेटर के ऊपर काम करने वाले हैं यदि आप यहां पे नन देते हैं तो बेसिकली ये कौन सा बेस एस्टिमेटर लेता है ये डिसीजन ट्री बेस एस्टिमेटर रहता है तो हम डिसीजन ट्री बेस एस्टिमेटर ले लेना नहीं चाहते हम कोई दूसरा बेस एस्टिमेटर देना चाहते हैं तो मैं यहां पे फ्रॉम सेकंड लान लूंगा यहां पर सेकंड लाइन के अंदर मैं जाऊंगा लीनियर मॉडल के अंदर एंड देन मैं यहां पे इंपोर्ट करूंगा किसे लीनियर रिग्रेशन को तो मैं यहां पे बेस एस्टिमेटर के तौर पे लीनियर रिग्रेशन देना चाहूंगा यस तो चलिए बेस एस्टिमेटर के तौर पे हम लीनियर रिग्रेशन दे देते हैं तो एस्टिमेटर में जाते हैं एस्टिमेटर में जाके हम क्या करते हैं लीनियर रिग्रेसर को कॉल कर देते हैं उसके बाद में गाइज क्या है यहां पर आपके पास नंबर ऑफ एस्टिमेटर देखिए नंबर ऑफ एस्टिमेटर की वैल्यू मैं कर देता हूं 40 एस्टिमेटर मुझे चाहिए उसके बाद देखिए मैं बीज डॉट क्या करता हूं मॉडल को फिट करता हूं और फिट के अंदर x क्या करना है ट्रेन एंड y जो है वो डाटा दे देते हैं फिर उसके बाद बीज डॉट क्या कर रहा है गाइस यहां पर स्कोर चेक कर लेते हैं स्कोर के अंदर गाइज यहां पर x ट्रेन एंड y ट्रेन दे देते हैं डाटा अब देखिए ये क्यों कर रहे हैं क्योंकि हम ओवरफिटिंग को देखना चाहते हैं कि भाई ओवरफिटिंग तो नहीं हो गी हमारा मॉडल राइट तो इसको भी चेक कर लेते हैं राइट बीजी डॉट यहां पर स्कोर देखते हैं स्कोर के अंदर x टेस्ट एंड y टेस्ट दे देते हैं यहां पर एंड मल्टीप्लाई बाय 100 कर लेते हैं स्कोर देखेंगे दैट अ 77 पर एंड 77 पर एक्यूरेसी तो आपके पास ऑलमोस्ट वही है आपके पास यहां पर ठीक है अब देखिए मैं एस्टिमेटर की वैल्यू चेंज कर करता हूं एस्टीमेट की वैल्यू 10 लेता हूं एंड रन करता हूं एक्यूरेसी तो कुछ ज्यादा इंप्रूव नहीं हुई है राइट और फिर से यहां पर रन करें तो अभी भी एक्यूरेसी वही है यहां पर 77 के पास एक्यूरेसी आपका साही है तो ये है बैकिंग मेटा एस्टिमेटर की कहानी जिसके थ्रू आपने एक्यूरेसी निकाली है इसी तरह से आप रैंडम फॉरेस्ट के थ्रू भी एक्यूरेसी निकाल सकते हैं और रैंडम फॉरेस्ट के थ्रू भी आप बेस्ट मॉडल बना सकते हैं तो मैं रैंडम फॉरेस्ट के थ्रू बेस्ट मॉडल बनाने के लिए जा रहा हूं यहां पर तो मैं यहां पे क्या कर रहा हूं आरएफ के नाम से एक वेरिएबल बना देता हूं और रैंडम फॉरेस्ट रिग्रेसर को कॉल कर लेता हूं जहां पे देखिए रैंडम फॉरेस्ट रिग्रेसर के अंदर आपको सिंप सिंपल सा ए नंबर ऑफ एस्टिमेटर देना है यहां पर कि आप कितने नंबर ऑफ एस्टिमेटर देने वाले हैं वैसे तो इसके अंदर बहुत सारे हाइपर पैरामीटर्स हैं लेकिन मैं नंबर ऑफ एस्टिमेटर दूंगा यहां पर 50 उसके बाद आरएफ डॉट क्या कर रहा हूं गाइस यहां पर मैं मॉडल को फिट कर रहा हूं यहां पर और फिट के अंदर मैं क्या कर रहा हूं गाइस यहां पर x ट्रेन एंड y जो ट्रेन है वो डाटा दूंगा यहां पर उसके बाद देखिए आरएफ डॉट मैं कर रहा हूं यहां पर स्कोर दूंगा स्कोर के अंदर x ट्रेन एंड y ट्रेन है वो डटा दूंगा मल्टीप्लाई बाय 100 करेंगे एंड उसके बाद आरएफ डॉट मैं करू यहां पर स्कोर दूंगा स्कोर के अंदर गाइज यहां पर x टेस्ट एंड y टेस्ट देंगे और मल्टीप्लाई बाय 100 करेंगे रन करते हैं देखिए 91 एंड 96 पर एक्यूरेसी दी है 66 एक्यूरेसी दी है जो कि एक बहुत ही आपके पास यहां पर पुर एक्यूरेसी भी है और ओवरफिटिंग मॉडल भी है चलिए एस्टिमेटर की वैल्यू को चेंज करके देखते हैं या एस्टिमेटर की वैल्यू को चेंज करने पर मेरे पास थोड़ा बहुत ओवर फिटिंग से कम हुआ है यहां पर एस्टिमेटर की वैल्यू को थोड़ी बढ़ा के देखते हैं तो अभी भी एक्यूरेसी काफी ज्यादा यहां पर है ठीक है तो ओवरऑल 10 देंगे तो यहां पर एक्यूरेसी लगभग सेम रहेगी मतलब ऑलमोस्ट 90 के आसपास जाएगी तो आप इसका इस्तेमाल यहां पर कर सकते हैं राइट तो यह था आपका बैगिंग रिग्रेसर और रैंडम फॉरेस्ट रिग्रेसर जिसके थ्रू आप अपने मॉडल की एक्यूरेसी को इंप्रूव कर सकते हैं फिलहाल मॉडल की एक्यूरेसी इंप्रूव करना हमारा पॉइंट यहां पर नहीं था हमारा पॉइंट यह था कि आप बैगिंग रिग्रेसर को और रैंडम फॉरेस्ट रिग्रेसर को कैसे इस्तेमाल कर सकते हैं देखिए मॉडल को इंप्रूव करने के लिए बहुत सी चीजें हो सकती हैं जैसे हाइपर पैरामीटर ट्यूनिंग आप कर सकते हैं क्रॉस वैलिडेशन का इस्तेमाल आप कर सकते हैं यह जो ट्रेन स्प्लिटिंग है इसकी वैल्यू को आप चेंज करके देख सकते हैं तो ऐसे बहुत से तरीके हैं जिनके थ्रू आप मॉडल की एक्यूरेसी को इंप्रूव कर सकते हैं लेकिन दैट द पॉइंट इज कि आप किस तरह से बैगिंग मेटा एस्टिमेटर को इस्तेमाल करेंगे एंड रैंडम फॉरेस्ट को इस्तेमाल करेंगे जो कि आज के इस वीडियो के जरिए हमने यहां पर समझा है आने वाले वीडियो के अंदर हम और भी चीजों के बारे में डिस्कस करने वाले हैं और मैं आपके ऐसे टॉपिक्स के बारे में भी डिस्कस करूंगा जिसके थ्रू आप एक्यूरेसी कैसे इंप्रूव कर सकते हैं वो भी हम डिस्कस करेंगे और आज की इस वीडियो के जरिए हम बात करेंगे डीप लर्निंग के बारे में तो देखिए डीप लर्निंग क्या चीज है डीप लर्निंग आपके पास मशीन लर्निंग का एक सब पार्ट है यस काफी लोग बोलते हैं कि डीप लर्निंग एक अलग चीज है यहां पर एक अलग थिंग्स है नहीं डीप लर्निंग मशीन लर्निंग ये डेटा साइंस के ही पार्ट हैं और ये सब पार्ट एआई के हैं तो आर्टिफिशियल इंटेलिजेंस के अंदर मशीन लर्निंग भी आती है डीप लर्निंग भी आती है एंड डाटा साइंस भी आती है अब ये मशीन लर्निंग से कितना अलग है तो देखिए मशीन लर्निंग के अंदर हम बहुत से काम करते थे जैसे आपके पास अन सुपरवाइज मशीन लर्निंग के अंदर हम बेसिकली डाटा को क्लस्टर करते थे यस और रिकमेंडेशन सिस्टम बनाते थे आपके पास यहां पर बात करें तो सुपरवाइज मशीन लर्निंग के अंदर हम प्रोडक्शन करते थे मतलब हम रिग्रेशन एंड क्लासिफिकेशन करते थे राइट तो ये जो आपके पा सिचुएशन होती है इसी सिचुएशन को देखते हुए हम डीप लर्निंग को इस्तेमाल करते हैं डीप लर्निंग आपके पास मशीन लर्निंग का ही सब पार्ट है इसके अंदर रिग्रेशन एंड क्लासिफिकेशन की जो प्रॉब्लम्स होती है वो सॉल्व की जाती है तो यदि मैं एक ओवरऑल स्ट्रक्चर देखूं डीप लर्निंग और मशीन लर्निंग और डाटा इन साइ साइंस का तो वो स्ट्रक्चर्स आपको कुछ यदि आपको पाइथन मशीन लर्निंग डाटा साइंस एंड डेटा एनालिस जसी फीड में अपने आपको को ग्रो करना है तो इसके लिए डब्लू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं इस तरीके से देखने को मिलेगा यस आपके पास सबसे ऊपर आपको क्या मिलेगी आर्टिफिशियल इंटेलिजेंस मिलने वाली है उसी के अंदर आपकी मशीन लर्निंग आती है उसी के अंदर आपकी डीप लर्निंग आती है उसी के अंदर आपके न्यूरल नेटवर्क्स आते हैं अब इन सब में डेटा साइंस कहां पे आती है तो यदि मैं डटा साइंस की बात करूं तो इन सभी को आप ओवरलैपिंग कर लें तो यहां पे आपकी जो डेटा साइंस है यहां पर वो आती है मतलब डेटा साइंस के अंदर की आर्टिफिशियल इंटेलिजेंस मशीन लर्निंग डीप लर्निंग न्यूरल नेटवर्क ये सब कुछ इसी के अंदर आपके पास आते हैं मशीन लर्निंग का ही एक सब पार्ट है आपके पास डीप लर्निंग तो अब ये मशीन लर्निंग से कितना डिफरेंस है यस मशीन लर्निंग से क्या डिफरेंस है यहां पर इसको आप जरा समझेंगे लेकिन उससे पहले मशीन लर्निंग के अंदर आपके पास दो डिफरेंट काम होते थे कौन-कौन से एक तो होता था आपका सुपरवाइज का और एक होता था अन सुपरवाइज का सुपरवाइज के अंदर हम क्या करते थे गाइज यहां पर सुपरवाइज के अंदर हम क्लासिफिकेशन करते थे यहां पर एंड क्या करते थे गाइज यहां पर रिग्रेशन करते थे राइट वहीं पे अन सुपरवाइज के अंदर हम क्या करते थे गाइज यहां पर हम क्लस्टर करते थे एंड हम रिकमेंडेशन सिस्टम बनाते थे यहां पर राइट जबकि डीप लर्निंग के अंदर आप देखेंगे तो डीप लर्निंग के अंदर आपका सुपरवाइज मशीन लर्निंग का जो वर्क होता है बस वही काम आपको देखने को मिलता है मतलब इसी के अंदर आपको क्लासिफिकेशन एंड रिग्रेशन का काम ही देखने को मिलेगा आपको रिकमेंडेशन सिस्टम नहीं मिलेगा आपको क्लस्टरिंग सिस्टम नहीं देखने को मिलेगा आपको यहां प क्या मिलेगा क्लासिफिकेशन एंड रिग्रेशन सिस्टम ही आपको देखने को मिलेंगे यह काम आपके पास किस में होता है डीप लर्निंग में होता है तो डीप लर्निंग और मशीन लर्निंग से अपना डिफर है अब इसे जरा समझते हैं यहां पर तो डीप लर्निंग क्या है गाइस यहां पर डीप लर्निंग आपके पास क्या है कलेक्शंस है क्या है गाइज यहां पर कलेक्शन है और कलेक्शंस किसका है यहां पर कलेक्शंस ऑफ स्टैटिकल टेक्निक्स ऑफ मशीन लर्निंग का है मतलब मशीन लर्निंग की जो टेक्निक थी यहां पर उनका क्या है स्टैटिकल जो मशीन लर्निंग टेक्निक्स थी उनका क्या है कलेक्शंस है डीप लर्निंग राइट और एक्चुअल में डीप लर्निंग के अंदर बात करें तो डीप लर्निंग के अंदर आपके पास आर्टिफिशियल न्यूरल नेटवर्क का इस्तेमाल किया जाता है अब यहां पे मैं आपको पॉइंट ऑफ सिनेरियो को थोड़ा क्लियर करना चाहूंगा कि देखिए मशीन लर्निंग जब हमने इस्तेमाल की थी तो मशीन लर्निंग के अंदर आपने क्या स्टडी की थी बहुत सारी एल्गोरिथम इस्तेमाल की थी मतलब बेसिकली गाइज बात करें वहां पर आपने बहुत सारी स्टैटिकल एनालिसिस की थी यहां पर उसके अंदर आपने लीनियर अलजेब्रा को डिस्कस किया था आपने स्टैटिक्स को डिस्कस किया था और भी बहुत सारी चीजों को डिस्कस किया था राइट वहीं पे मैं बात करना चाहूं किसके बारे में डीप लर्निंग के बारे में बात करना चाहूं तो डीप लर्निंग के अंदर क्या होता है गाइज यहां पर डीप लर्निंग के अंदर आपके न्यूरल नेटवर्क्स बनते हैं मतलब डीप लर्निंग के अंदर आर्टिफिशियल न्यूरल नेटवर्क्स के ऊपर वर्किंग करता है जबकि मशीन लर्निंग की बात करें तो मशीन लर्निंग आपके पास एल्गोरिथम के बेसिस पे वर्क करती है अब देखिए यहां पर न्यूरल नेटवर्क्स और एल्गोरिथम एम्स में क्या डिफरेंस है तो एल्गोरिथम्स क्या होती है गाइज यहां पर एल्गोरिथम्स के अंदर आपका सेट ऑफ फार्मूला होता है जिनका आप इस्तेमाल करते हैं जबकि न्यूरल नेटवर्क्स के अंदर बात करें यहां पर तो न्यूरल नेटवर्क्स के अंदर आपके कनेक्शंस होते हैं जहां पे आप छोटे-छोटे कनेक्शंस बना के एक नेटवर्क तैयार करते हैं और उस नेटवर्क से आपके पास क्या होता है गाइज यहां पर आपका प्रोडक्शन सिस्टम यहां पर बनता है मतलब आप चाहे क्लासिफिकेशन सिस्टम बनाए चाहे आप रिग्रेशन सिस्टम बनाए उसके थ्रू आपके पास डिजाइन होता है आप ये जो एग्जांपल नीचे ये जो डायग्राम देख रहे हैं ये एक न्यूरल नेटवर्क है जहां पे हम इमेज को क्लासिफाई कर रहे हैं यहां पर कि इमेज के अंदर कौन-कौन स चचेरे किस-किस तरीके दिख रहे हैं ये इस तरह से ये काम कर रहा है तो बेसिकली गाइज यदि मैं बात करूं डीप लर्निंग के बारे में तो डीप लर्निंग क्या है एक न्यूरल नेटवर्क्स का कनेक्शंस है अब यहां पे बात करेंगे न्यूरल नेटवर्क क्या है तो आने वाले वीडियो के अंदर आप न्यूरल नेटवर्क को और अच्छे से समझने वाले हैं लेकिन एक मैं इंट्रोडक्शन देना चाहूंगा कि न्यूरल नेटवर्क क्या होता है यहां पर तो बेसिकली जैसे कि हमारे ह्यूमंस के अंदर न्यूरॉन्स होते हैं यहां पर उसी तरह से हम क्या करते हैं एक आर्टिफिशियल न्यूरल नेटवर्क तैयार करते हैं अब ह्यूमंस के अंदर न्यूरॉन्स क्या होता है गाइ यहां पर बात करें तो देखिए आप कभी भी कोई भी चीज को छूते हैं या कभी भी किसी चीज को देखते हैं या फिर कभी भी किसी चीज का टेस्ट लेते हैं यहां पर तो आपके जो न्यूरॉन्स होते हैं वो न्यूरॉन्स क्या करते हैं उस डाटा को कलेक्ट करते हैं मतलब उस डाटा चीजों को सेंस करते हैं एंड सेंस करने के बाद वो जितना भी डेटा कलेक्ट होता है वो सारा कलेक्शन हुआ हुआ डेटा आपके माइंड तक वो पहुंचाते हैं और जैसे ही वो आपके डाटा माइंड तक पहुंच जाता है तो उसके बाद आपके न्यूरॉन्स के थ्रू माइंड को एक सिग्नल पहुंचता है कि ये जो डाटा है ये किस तरह का का रेटा है जैसे कि अभी मैंने अपने हाथ में ये पेन पकड़ रखा है तो मेरे न्यूरॉन्स मुझे सेंस कर रहे हैं कि ये जो पेन है वो प्लास्टिक का है यस ये जो पेन आप देख पा रहे हैं ये पेन किसका है प्लास्टिक का है और ये मेरे माइंड के अंदर जाके क्या हो रहा है सिग्नल पहुंच रहा है सिग्नल पहुंचने के बाद में वहां पे मुझे एक आंसर मिल रहा है कि दैट इज मटेरियल यस यहां पर पहुंचा जा रहा है एक सिग्नल पहुंचा है सिग्नल के अंदर ये बताया जा रहा है कि इस चीज का मटेरियल जो है यहां पर वो किस चीज का है प्लास्टिक का यहां पर देखने को मिल रहा है तो ये जो आपके पास काम करता है हमारे जो ह्यूमन सिस्टम के अंदर यहां पे ये जो न्यूरॉन्स काम करता है सेम टू सेम हमारे पास आर्टिफिशियल न्यूरल नेटवर्क बनाया गया है जो कि ये काम करते हैं जिसके अंदर हमारे पास जितने भी अलग-अलग तरीके के इनपुट्स होते हैं इनपुट्स मतलब हमारे पास जितने भी तरह का डेटा होता है उस डेटा से कलेक्शंस ऑफ डेटा से आपके पास क्या करता है एक मैसेज कन्वे पहुंचाते हैं और उस मैसेज के थ्रू आपके पास क्या करते हैं वापस एक आंसर निकालते हैं कि ये जो प्रोडक्ट है वो क्या है यहां पर तो इस तरीके से क्या कर रहा है गाइ यहां पर हमारे जो आर्टिफिशियल न्यूरल नेटवर्क्स हैं वो काम करते हैं अब ये आर्टिफिशियल न्यूरल नेटवर्क्स लगभग लगभग आपके पास ह्यूमन न्यूरल नेटवर्क्स के सिमिलर होते हैं और आपके पास यहां पर उसी तरह से वर्क करते हैं और हमें एक प्रोडक्शन सिस्टम बना के देते हैं अब हम बात करते हैं कि ये डीप लर्निंग का इस्तेमाल कहां-कहां होता है तो डीप लर्निंग का इस्तेमाल रियल वर्ल्ड के अंदर बहुत सारी जगह पे होता है जैसे कि आप अभी अपने मोबाइल को ओपन करेंगे और मोबाइल को ओपन करने के बाद आप ओके google2 टेक्स्ट का इस्तेमाल करते हैं वो सारा का सारा किससे बना होता है गाइज यहां पर डीप लर्निंग से बना होता है इमेज को क्लिक करने के बाद में इमेज किस चीज की है कि जैसे ये माउस है या फिर ये आपके पास आपके पास फोन है या फिर आपके पास ये आपका स्पैन है इस तरह से इमेज के अंदर आपको यहां पे बताना है कि ये किस चीज का प्रोडक्ट है इस चीज को बताने के लिए भी आप क्या करते हैं डीप लर्निंग का इस्तेमाल करते हैं ऑटोपायलट जो कार होती है यहां पर सेल्फ ड्राइविंग कार जिसे हम बोलते हैं यहां पर यस उसके अंदर भी आपका क्या होता है डीप लर्निंग सिस्टम लगा होता है एंड इवन दैट हमारे पास जो ट्रांसलेटर बने हुए होते हैं वो भी क्या है गाइज यहां पर डीप लर्निंग के मॉडल्स हैं तो डीप लर्निंग आज के टाइम के अंदर बहुत ज्यादा यूज होती है और उसके पीछे रीजन क्या है यहां पर तो वो अब हम जरा समझते हैं कि मशीन लर्निंग को इस्तेमाल ना करते हुए हम डीप लर्निंग को क्यों इस्तेमाल कर रहे हैं पहला चीज यहां पर यह है कि आज के टाइम के अंदर जो हमारा डटा है वो डेटा स्मॉल अमाउंट ऑफ डेटा ना रके बिग अमाउंट ऑफ डेटा आपके पास बन चुका है मतलब बिग डाटा आपके पास बन चुका है और जब भी आप बिग डाटा के ऊपर काम करते हैं तो आपके मशीन लर्निंग जो एल्गोरिथम्स होती है वो प्रॉपर वर्किंग नहीं कर पाती है यस वहां पे आपके पास वेल परफॉर्मेंस नहीं दे पाती है तो फिर उसके लिए हमें कहां आना पड़ता है हम डीप लर्निंग में आते हैं जहां पे हम न्यूरल नेटवर्क्स बनाते हैं और न्यूरल नेटवर्क्स के थ्रू हम यहां पे क्या करते हैं हमारे आंसर्स को निकालते हैं तो बेसिकली सबसे इंपॉर्टेंट चीज क्या है यहां पर कि डीप लर्निंग जो है हमारे पास वो बिग डाटा के ऊपर काम करने के लिए बहुत अच्छी कैपेबल है जबकि मशीन लर्निंग की बात करें तो मशीन लर्निंग इतना वेल परफॉर्म नहीं दे पाती है यहां पर अब बात करें यहां पर तो आपके पास यहां पर हार्डवेयर की बात करें तो हार्डवेयर के अंदर हमारे पास मशीन लर्निंग के कंपैरेटिव डीप लर्निंग की जो हार्डवेयर कंपैरिजन है वो ज्यादा चाहिए गी मतलब डीप लर्निंग को ज्यादा अच्छा हार्डवेयर की जरूरत पड़ती है क्योंकि ये बिग डाटा के ऊपर काम करता है तो इसके लिए गाइज यहां पर इसके अंदर हार्डवेयर की जरूरत है वो बहुत अच्छी की जरूरत पड़ेगी यहां पर उसके बाद यहां पर बात करें तो आपके पास डाटा के बारे में बेसिक अंडरस्टैंडिंग होगी तब भी आप यहां पर इसके अंदर काम कर सकते हैं इसका जो ट्रेनिंग टाइम है वो बहुत ज्यादा मिलने वाला है आपको बहुत ज्यादा ट्रेनिंग टाइम लगेगा क्योंकि डटा आपके पास यहां पर बहुत ज्यादा है तो बिग डाटा के ऊपर काम करने के लिए आपको ज्यादा टाइमिंग की जरूरत पड़ेगी इसके साथ-साथ मैं बात करूं प्रोसेसर टाइम वो प्रोसेसर टाइम आपके पास क्या है यहां पर भी ज्यादा है यहां पर बेसिकली और सबसे इंपॉर्टेंट टेंट चीज यहां पर जो है जो नंबर ऑफ एल्गोरिथम्स है यहां पर वो बहुत ही कम देखने को मिलती है मतलब ज्यादा अच्छी ज्यादा एल्गोरिथम नहीं मिलेगी आपको एक या दो एल्गोरिथम्स ही देखने को मिलेगी और उन एक या दो एल्गोरिथम्स के बेसिस पे ही आप क्या करते हैं पूरी डीप लर्निंग को हैंडल कर लेते हैं और बात करें यहां पर डाटा इंटरफेस के अंदर तो डेटा इंट पेशन के अंदर थोड़ी सी दिक्कत आपको देखने को मिलती है डीप लर्निंग की एक सबसे खासियत चीज ये है कि डीप लर्निंग क्या है डेटा हंगरी होती है मतलब बेसिकली ये बिग डेटा के ऊपर काम करती है जब आप इसे लार्ज अमाउंट ऑफ डेटा देंगे तो ये बेटर परफॉर्मेंस करेगी जब आप इसे स्मॉल अमाउंट ऑफ डेटा देंगे तो ये आपको बेटर परफॉर्मेंस नहीं देने वाली है तो डीप लर्निंग तभी इस्तेमाल करनी चाहिए जब आपके पास बिग डाटा हो अब बिग डाटा कितना होना चाहिए तो ऑलमोस्ट आपके पास यहां पर 50 के से ज्यादा आपके पास यहां पर रोज हो या फिर आपके पास बात करें 10k से ज्यादा रोज हो तब आप यहां पे क्या करें डीप लर्निंग को इस्तेमाल करें अब डीप लर्निंग के अंदर क्या होता है बहुत सारे डिफरेंट डिफरेंट तरीके के न्यूरल नेटवर्क्स होता है अभी जो हमने यहां पे आपने देखा यहां पर ये तो आपके पास क्या था सिंपल सा एक न्यूरॉन्स था यस ये क्या था आपके पास यहां पर एक सिंपल सा न्यूरॉन्स था इस न्यूरॉन्स के बहुत सारे कनेक्शंस मतलब आपके पास ऐसे-ऐसे बहुत सारे न्यूरॉन्स आपस में कनेक्ट होते रहते हैं तो आपके पास क्या बनाते है एक न्यूरल नेटवर्क्स बनाते हैं राइट और उन न्यूरल नेटवर्क्स के थ्रू हम क्या करते हैं हमारा प्रेडिक्शन सिस्टम हमारा रिकमेंडेशन सिस्टम वगैरह बहुत सारी चीजें यहां पर बनाते हैं बेसिकली इन न्यूरल नेटवर्क्स के थ्रू हम क्या करते हैं हमारा प्रेडिक्शन सिस्टम यहां प बनाते हैं चाहे वो रिग्रेशन का हो चाहे वो क्लासिस का हो तो डीप लर्निंग के अंदर आपके पास क्या होता है बहुत सारे न्यूरल नेटवर्क्स होता है क्योंकि इस तरह के न्यूरॉन्स जो है वो आपस में कनेक्ट होके एक बहुत सारे न्यूरॉन लेटो बनाते हैं अब ये न्यूरॉन लेटो कितने टाइप्स के होते हैं क्या-क्या टाइप्स के न्यूरल नेटवर्क हम यूज़ करने वाले हैं एनए क्या होता है सीएनए क्या होता है आगे आने वीडियो के अंदर हम बहुत अच्छे तरीके से डीप ले से स्टडी करने वाले हैं और आज के इस वीडियो के जरिए हम बात करेंगे कि न्यूरॉन्स क्या होते हैं और ये न्यूरल नेटवक्स क्या है तो बेसिकली न्यूरॉन्स क्या होते हैं इसके बारे में हमने पहले भी देख रखा है अब मैं आपको थोड़ा डिटेल के साथ न्यूरॉन्स की कहानी समझाने वाला हूं यहां पर यदि आपको पाइथन मशीन लर्निंग डाटा साइंस एंड डेटा एनालिस जैसी फील्ड में अपने आप को ग्रो करना है तो इसके लिए डब्ल्यू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं कि न्यूरॉन्स किस तरह से काम करते हैं और फिर उसी तरह से हमारा न्यूरल नेटवर्क्स किस तरह से काम करता है मतलब हमारा जो आर्टिफिशियल न्यूरल नेटवर्क हम जिसे बोलते हैं वो किस तरह काम करता है उसको भी हम थोड़ा डिटेल के साथ देखने वाले हैं तो देखिए जब भी हम किसी चीज को छूते हैं या जब भी हम किसी चीज को देखते हैं तो ये जितनी भी चीजें हमारे पाइंट तक पहुंच रही है ये सारी चीजें न्यूरॉन्स के थ्रू पहुंचती है अब ये न्यूरॉन्स के थ्रू किस तरह पहुंचती है क्या प्रोसेसर है उसको जरा समझते हैं यहां पर सपोज मान लीजिए कि मेरे आगे एक कप ऑफ टी है यहां पर और वो बहुत ही ज्यादा हॉट है अब मैं क्या करूंगा उस चीज को टच करूंगा मतलब उस कप ऑफ टी हो रहा हूं टच करने जा रहा हूं जैसे ही मैं उसे टच करूंगा तो मेरे जो हैंड की जो आपके पा स्किन है वो ये सेंस करेगी कि वो जो कप ऑफ टी है आपके पास यहां पर या वो कप ऑफ कॉफी जो आपके पास है वो हॉट है एंड वो जो सिग्नल है यहां पर वो न्यूरॉन्स के थ्रू हमारे माइंड तक पहुंचाएगी अब वो न्यूरॉन्स के थ्रू कैसे माइंड तक पहुंचाती है उसको जरा यहां पर देखें तो क्या होता है कि हमारे पास जो आपके पास हैंड के जो आपके स्किन होती है यहां पर जो हमारे सेंसिंग डिवाइस है यहां पर वो सेंसिंग डिवाइस आपके पास क्या होते है डेंडर से कनेक्टेड होते हैं यस किससे कनेक्टेड है डेंडर से कनेक्टेड है और डेंड से होते हुए ये जितने भी सिग्नल्स है वो कहां जाते हैं न्यूक्लियस सेल्स के पास चले जाते हैं यहां पर ये सेल्स के अंदर सारे डाटा क्या होता है कलेक्टेड हो जाता है एंड कलेक्टेड होने के बाद में ये कहां जाते हैं एग्जॉन के पास जाते हैं और एग्जॉन के पास जाते हुए हमारे पास कहां जाते हैं स्नेप्स के पास जा जाते हैं और ये जो स्नेप्स है ये स्नेप्स हमारे माइंड से कनेक्टेड रहता है यहां पर और वहां पे ले जाके हमारे जो सिग्नल्स है वो पहुंचा देते हैं अब माइंड के अंदर यदि पहले से डाटा स्टोरेज है कि ये जो कप ऑफ टी है यहां पर ये कप ऑफ कॉफी जो है यहां पर हॉट है तो हमारा माइंड तुरंत हमें सिग्नल देता है कि ये हॉट है हमें अपना अपने जो हाथ हैं वो वहां से हटा लेने चाहिए तो हम क्या करते हैं वहां से अपना हाथ हटा लेते हैं यदि हमारे माइंड के अंदर वो डटा फिट है तो यदि हमारे माइंड के अंदर वो डटा फिट नहीं है तो हम उस हाथ को नहीं हटाते हैं बेसिकली राइट तो बेसिकली गाइ यहां पे क्या हो रहा है कि हम डेंप के थ्रू हमारे जो इनपुट सेंसिंग डिवाइस है यहां पर उनसे हम क्या करते हैं डेटा कलेक्ट करते हैं एंड डेटा कलेक्ट करते हुए न्यूक्लियस सेल के थ्रू एग्जॉन के होते हुए स्नेप्स तक पहुंचाते हैं और स्नेप्स हमारे माइंड के साथ कनेक्ट होता है और वहां पे हमारे माइंड के अंदर सिग्नल पहुंचते है और सिग्नल के थ्रू प्रोसेस होके हमें एक आउटपुट जनरेट देखने को मिलता है कि हमें ये हाथ हटाना चाहिए या फिर हमें ये हाथ नहीं हटाना चाहिए तो इस तरह से हमारा जो न्यूरॉन्स है हमारे ह्यूमन बॉडी का जो न्यूरॉन्स है वो यहां पे क्या करता है वर्किंग करता है सेम एज इसी कंसल्स को देखते हुए हमारे जो साइंटिस्ट हैं मतलब हमारे जो इंजीनियर्स हैं यहां पर या फिर साइंटिस्ट दीजिए राइट जिन्होंने इनका इन्वेंशन किया था राइट उन्होंने एक आर्टिफिशियल न्यूरोल नेटवर्क बना लिया इसी चीज के फॉर्मेशन को देखते हुए और इसके थ्रू जो प्रॉब्लम्स थी यहां पर क्लासिफिकेशन एंड रिग्रेशन की उसको सॉल्व किया अब ये कैसे सॉल्व किया जरा इसको देखते हैं यहां पर तो देखिए अब हम बढ़ते हैं हमारे आर्टिफिशियल न्यूरल नेटवर्क्स के अंदर देखिए डेंट के थ्रू हमारे पास जितने भी सिग्नल्स थे वो सारे क्या हो रहे थे कलेक्ट हो रहे थे यस कलेक्ट हो रहे थे हमारे जो इनपुट्स है वो सारे कलेक्ट हो रहे थे फिर सेल्स से होते हुए हमारे पास कहां जा रहे थे एग्जॉन के पास जा रहे थे और सिनेप्सिस के पास आ रहे थे हैं सेम एज हमारे पास यहां पे भी यही होता है हमारे पास जो हमारे इनपुट्स हैं वो सारे के सारे क्या होते हैं कलेक्ट्स होते हैं यहां पर इनपुट्स नट्स के अंदर अब ये इनपुट्स का मतलब क्या है गाइज यहां पर तो मान लीजिए आपके पास कोई टेबल है उस टेबल में x1 एक कॉलम है x2 एक कॉलम है x3 एक कॉलम है एंड आपका y आउटपुट है तो ये x1 x2 x3 जो है हमारे ये आपके पास क्या कहलाएंगे आपके इनपुट्स कहलाएंगे ये सारे के सारे इनपुट्स आपके क्या हो रहा है कलेक्ट हो रहा है और इनपुट कलेक्ट होने के बाद में ये इनके साथ क्या हो रहा है एक वेटेज ऐड किया जा जा रहा है अब ये वेटेज कैसे ऐड किया जा रहा है क्यों ऐड किया जा रहा है इसके बारे में हम डिटेल के साथ देखेंगे लेकिन क्या किया जाता है गाइज यहां पर आपके पा ये जो वेटेज है यस एक वेटेज ऐड किया जाता है सम ऑफ अमाउंट ऑफ डाटा ऐड किया जाता है ताकि इस चीज को बैलेंस कर सकें एंड एक साथ ही हम बायस को ऐड करते हैं फिर जैसे सेल्स के अंदर यस हमारे पास न्यूक्लियस सेल्स के अंदर हमारे पास क्या हो रहा था सारा का सारा डाटा कलेक्ट हो रहा था उसी तरीके से हमारे पास यहां पर एक समेशन होता है जहां पे हम क्या करते हैं हमारा जितना भी डाटा है वो उसको कलेक्ट कर लेते हैं मतलब ये जो आपके पास इनपुट सेल्स आ रहे हैं उसको वेटेज के साथ मल्टीप्लाई करके बायस के साथ ऐड करके हम क्या करते हैं गाइज यहां पर कलेक्शन कर लेते हैं जहां पे हमारा सारा डाटा क्या होता है कलेक्ट हो जाता है मतलब मैं सिंपल सेंटेंस में बोलूं तो आपका x1 w1 + x2 w2 प्लस आपके पास x3 w3 ये सारा हो गया आपके पास यहां पर मल्टीप्लाई एंड समेशन प्लस एक बायस ऐड कर दिया जाता है जो कि इस चीज को आपके पास क्या करता है मैनेज करने के लिए काम आता है मतलब आपके पास न्यूरॉन्स को सेट करने के लिए काम में लिया जाता है तो बेसिकली आप क्या करते हैं यहां पर ये सारी चीजें ऐड करते हैं ऐड करने के बाद में जितना भी डाटा है जैसे आप यहां पे क्या कर रहे थे एकॉन के थ्रू पास करा रहे थे स्नेप्स के पास वैसे ही ये जितना भी डाटा है एक्टिवेशन फंक्शन के थ्रू यस एक्टिवेशन फंक्शन के थ्रू हम पास करा देते कहां पे आउटपुट के पास तो एक्टिवेशन फंक्शन क्या करता है कि ये जो भी आपका आउटपुट आ रहा है ये आपने जो भी यहां पे कैलकुलेशन की है जो भी आपने सॉल्यूशन किया है यहां पर ये जितना भी कैलकुलेशंस है इस कैलकुलेशन के डाटा को कलेक्ट करता है एंड कलेक्ट करके एक स सर्टेन रेंज के अंदर कन्वर्ट कर देता है यदि आपका डाटा क्लासिफिकेशन का है तो उसे जीरो या वन के अंदर कन्वर्ट करता है यदि आपका डाटा रिग्रेशन का है तो रिग्रेशन एनालिसिस के अकॉर्डिंग आपका आंसर दे देता है तो एक्टिवेशन फंक्शन क्या करता है आपके डाटा को कन्वर्जन करता है आपके डिजायर आउटपुट के अंदर एंड देन ये आपके पास क्या करता है आपके आउटपुट यहां पर दिखा देता है मतलब जो भी आपका आउटपुट है वो आपको दिखा देता है तो इस तरह से हमारा न्यूल नेटवर्क काम करता है जैसे कि हमारा यहां पर न्यूरॉन्स काम कर रहा था वैसे ही सेम टू सेम आपके पास क्या करता है गाइ यहां पर न्यूर नेटवर्क्स काम करता है राइट अब ये न्यूरल नेटवर्क्स जो आप देख रहे हैं देर इ कॉल्ड ऑफ सिंगल लेयर प्रेसेप्टल इसे हम क्या बोलते हैं गाइज यहां पर सिंगल लेयर प्रेसेप्टल कहते हैं लेकिन आज के टाइम के अंदर हम सिंगल ले परसेप्ट्रॉन का इस्तेमाल नहीं करते हैं मतलब बहुत ही कम यहां पे यूज़ करते हैं यहां पर बेसिकली सिंगल लेर परसेप्ट्रॉन का क्योंकि सिंगल लेयर प्रिसेप्ट से हम जो हमारे डिजायर आउटपुट है वो नहीं गेट कर सकते तो उसके लिए हम क्या करते हैं मल्टी लेयर न्यूरल नेटवर्क का इस्तेमाल करते हैं या मल्टी लेयर परसेप्ट्रॉन का करते हैं ये जो मल्टी लेयर परसेप्ट्रॉन होते हैं यहां पर इनको हम न्यूरल नेट नेस के कैटेगरी में डालते हैं और ये बहुत सारे तरीके के होते हैं अब यहां पे बात करें कि कौन-कौन से तरीके के डीप लर्निंग के न्यूरल नेटवर्क्स होते हैं यहां पे गाइस तो बेसिकली गाइ बात करें तो ये बहुत सारे तरीके होता है सबसे पहले सबसे बेसिस बात करूं तो यहां पे सबसे पहला होता है परसेप्ट्रॉन होता है फिर आपका फीड फॉरवर्ड नेटवर्क्स होता है अच्छा फीड पाउड नेटवर्क और परसेप्ट्रॉन क्या होता है दोनों सेम ही होता है यहां पर फिर यही नेटवर्क्स आपके पास मल्टीपल हो जाता है तो मल्टी लेयर परसेप्ट्रॉन हो जाता है यहां पर मल्टी लेयर परसेप्ट्रॉन को गाइज यहां पर एन ए भी बोला जाता है मतलब आर्टिफिशियल न्यूरल नेटवर्क्स भी बोला जाता है यहां पर फिर यहां पर पर रेडियल बेस नूरल नेटवर्क भी होता है अच्छा कन्वेंशनल बेज न्यूरल नेटवर्क भी होता है कन्वेंशनल बेस न्यूरल नेटवर्क आपका मेजर्ली उस वक्त यूज किया जाता है जब आप यहां पर इमेज डाटा के ऊपर काम कर रहे हैं मतलब आपके जो डाटा का सिग्नेचर है यहां पर या फि मैं बात करूं डटा का टाइप जो है यहां पर वो इमेज है यहां पर बहुत सारी कलेक्शन ऑफ इमेज है और उस कलेक्शंस ऑफ इमेज के ऊपर आप काम करना चाहते हैं तो कन्वेंशनल न्यूरल नेटवर्क का आप इस्तेमाल करते हैं अब बात करते हैं रिक्रूटेड न्यूरल नेटवर्क के ऊपर बात कर रहे हैं गाइ यहां पर तो रटल न्यूरल नेटवर्क आपके पास कब का क्या जाता है जब आप टैक्स से रिलेटेड काम करने जा रहे हैं मतलब सिंपल सा एग्जांपल मैं आप लोगों को दूं तो आप सब लोग google-my नेटवर्क्स का भी इस्तेमाल होता है तो ये इतने टाइप्स के आपके पास क्या है न्यूरल नेटवर्क्स है इसके अलावा भी और भी टाइप के न्यूरल नेटवर्क्स होते हैं यहां पर लेकिन ये कुछ मेजर न्यूरल नेटवर्क है जिनका का इस्तेमाल डीप लर्निंग के अंदर किया जाता है आने वाले वीडियो के अंदर हम इन न्यूरल नेटवर्क्स के बारे में वन बाय वन इन सभी न्यूरल नेटवर्क के ब में डिस्कस करेंगे और प्रैक्टिकली हम इन न्यूरल नेटवर्क्स को अप्लाई करके भी देखेंगे कि यदि हमारे पास कोई डाटा आता है तो उसके ऊपर ये न्यूरल नेटवर्क कैसे वर्क करते हैं और आज के इस वीडियो के जरिए हम बात करने वाले हैं प्रिसेप्ट के बारे में यस आप इसे सिंगल लेयर न्यूल नेटो भी बोल सकते हैं या फिर सिंगल लेयर प्रिसेप्ट भी बोल सकते हैं यहां पर दैट इज अ सिंगल आर्टिफिशियल न्यूरल नेटवर्क या फिर इसे हम बेस न्यूरल नेटवर्क्स भी बोल सकते हैं यहां पर देखिए हमने बहुत सारे आर्टिफिशियल न्यूरल नेटवर्क के बारे में देखा था लास्ट वीडियो लेक्चर के अंदर जहां पे हमने टाइप्स ऑफ न्यूरल नेटवर्क के बारे में डिस्कस किया था उन सारे टाइप्स ऑफ न्यूरल नेटवर्क्स के अंदर जो सबसे बेस न्यूरल नेटवर्क होता है जिसके अंदर के थ्रू ही हमारे सारे न्यूरल नेटवर्क्स रेडी होते हैं यहां पर उन सारे न्यूरल नेटवर्क्स के अंदर जो सबसे बेस न्यूरल नेटवर्क होता है वो हमारे पास क्या होता है हमारा सिंगल लेयर प्रिसेप्ट होता है मतलब हमारा जो सिंगल लेयर प्रिसेप्ट है दैट इज अ बेस न्यूरल नेटवर्क अब इस बेस न्यूरल नेटवर्क के जरिए ही आपके पास आर्टिफिशियल न्यूरल नेटवर्क बनता है मतलब एए बनता है जिसे हम मल्टीलेयर न्यूरल नेटवर्क बोलते हैं इसी के थ्रू ही आपके पास क्या बनता है cnn's न्यूरल नेटवर्क्स आपको डिस्कस करना चाहिए तो आज के इस वीडियो के जरिए हम इसे ही देखने वाले हैं कि ये बेस न्यूरोल नेटवर्क क्या होता है और ये कैसे काम करता है तो चलिए अब जरा इसे समझते हैं तो देखिए बेस न्यूरल नेटवर्क को आपको देखना है तो ये बेस न्यूरल नेटवर्क आपके पास कुछ इस तरीके से होता है यहां पर अब ये कैसे काम करता है इसको जरा समझते हैं यहां पर तो देखिए मेरे पास एक डेटा सेट है जैसे कि आप यहां देख रहे हैं और इस डेटा सेट को जब मैंने प्लॉट किया है यहां पर ये प्लॉटिंग कुछ इस तरह से हो रहा है यहां पर अब हम क्या चाहते हैं कि यहां पर यदि मैं कोई नया डाटा लेके आऊं लेट्स से हमारे पास ये जो ग्रीन कलर का डाटा है वो कुछ यहां पे आ रहा है तो अब ये ग्रीन कलर का जो डाटा आप यहां पर देख रहे हैं ये ग्रीन कलर का डाटा जो है यहां पर ये ब्लू कलर में आना चाहिए रेड कलर में आना चाहिए इस चीज को फाइंड आउट करने के लिए ही हम क्या करते हैं आर्टिफिशियल न्यूरल नेटवर्क का इस्तेमाल करते हैं अब इस आर् आर्टिफिशियल नूरल नेटवर्क के अंदर बात करें तो इस सिंगल ए प्र सेप्टन का जो स्ट्रक्चर होता है वो कुछ आपके पास इस तरह से होता है जो कि हमने न्यूरॉन्स के अंदर भी समझा था यहां पर या फिर न्यूरल टव के अंदर भी समझा था अब इसके अंदर क्या होता है ये कैसे फंक्शनैलिटी वर्क करता है इसको जरा समझते हैं और इसके अंदर फीड फॉरवर्ड नेटवर्क क्या होता है वो भी हम यहां पर डिस्कस करने वाले हैं तो देखिए सबसे पहले क्या होता है कि जो भी आपका डेटा सेट है लेट्स सपोज आपका डेटा सेट है उसके अंदर x1 एक कॉलम है x2 एक कॉलम है x3 एक कॉलम है और x4 एक कॉलम है और इसके करेस्पॉन्डिंग्ली y आपके पास क्या है एक आउटपुट है अब यहां पे आपके पास क्या है कुछ-कुछ आपके पास डाटा पड़ा है एंड उसके रिगार्डिंग आपके आउटपुट पड़ा है जैसे 01 01 इस तरह से पड़ा है आपके पास यहां पर राइट तो ये जो आपके आउटपुट का जो पहली रो जो होती है आपके पास यहां पर ये एज ए इनपुट के तौर पे आपको यहां पर देनी पड़ती है जैसे कि मैंने यहां पर दे दिया कि x1 आपके पास दे दिया x2 का आपका डाटा दे दिया x3 का डाटा दे दिया x4 का डाटा आपके पास दे दिया ये जब सारा डाटा आपके पास जाता है तो इसको हम एक टर्म से मल्टीप्लाई करते हैं दैट द टर्म्स ऑफ वेटेज ये वेटेज क्या कम क्या काम आता है ये वेटेज आपके पास ये जो वा आउटपुट है इसको मैनेज करने के लिए काम आता है मतलब सिंपल सा ये है कि आप इस डाटा से आप अपना आउटपुट जो है वो 01 के फॉर्मेट में डायरेक्टली नहीं निकाल पाते हैं तो इस चीज को मैनेज करने के लिए हम इस वेटेज का यूज़ करते हैं इस वेटेज के थ्रू हमारे पास क्या होता है हमारा जो ये डाटा है हमारे पास जो आउटपुट है इस डाटा के थ्रू जो हमारा आउटपुट है वो मैनेज होता है अब ये जितना भी आपके डाटा आ रखा है इसको हम क्या करते हैं आपके पास मल्टीप्लाई करके सम करते हैं मतलब आपके पास यहां पे जो आपका डाटा है यस आपका जो ये डाटा आ रहा है x1 * आपके पास w1 ये मल्टीप्लाई होता है तो जैसे x1 * w1 किया प्लस आपके पास x2 * w2 किया प्लस आपके पास x3 * w3 किया यहां पर एंड आगे चलते हैं हम यहां पर यस आगे चलते हैं यहां पर + x4 * w4 किया यहां पर ये सारा डाटा क्या हो रहा है यहां पर ऐड हो रहा है ऐड होने के बाद प्लस मैं यहां पे क्या कर रहा हूं एक एक्स्ट्रा टर्म ऐड किया जाता है दैट कॉल ऑफ बायस यस हम यहां पर क्या करते हैं एक एक्ट्रा टर्म को क्या करते हैं ऐड करते हैं टस कॉल ऑफ बायस ये भी आपके पास क्या करता है डाटा मैनेज करने के लिए काम में ले जाता है अच्छा ये जो आप इक्वेशन देख रहे हैं ये इक्वेशन आपके पास कुछ-कुछ हद तक आपके पास जानी पहचानी होगी यदि आपने मशीन लर्निंग को बहुत अ तरीके से डिस्कस किया होगा तो मशीन लर्निंग के अंदर यदि मैं बात करूं सिंपल लीनियर रिग्रेशन की इक्वेशन के बारे में तो वो इक्वेशन होती है y = mx3 यस ये इक्वेशन हमारे पास होती है सिंपल लीनियर रिग्रेशन की इसके अंदर जो इक्वेशन है इसके अंदर यदि इस इक्वेशन को यदि हम यहां पर मल्टीपल डाटा के ऊपर बना लें तो ये इक्वेशन कन्वर्ट हो जाती है y = m1 x1 + यहां पे m2 x2 + m2 x2 प्लस यहां पर m3 x3 प्लस आपके पास c के अंदर कन्वर्ट हो जाती है वहां पे ये जो m था ये क्या था स्लोप ऑफ द कर्व था एंड c जो था वो आपके पास इंटरसेप्ट था मतलब लाइन का इंटरसेप्ट था अब यहां पे बात करें अकॉर्डिंग टू इज दिस डाटा तो वो जो m है वो कन्वर्ट हो चुका है किसके अंदर w के अंदर और वो जो w है वो यहां पर ले चुका है वेटेज की बारी तो बेसिकली गाइज यहां पे बात करें तो ये आपके पास क्या हो ग है वेटेज हो गए है वेटेज के साथ आप क्या कर रहे हैं आप अपने डाटा इनपुट को मल्टीप्लाई कर रहे हैं और उसके बाद क्या कर रहे हैं आप यहां पर बायस के साथ ऐड कर देते हैं अब ये जो आपने बायस के साथ ऐड करने के बाद में जो आपका डाटा आया यहां पर इसको आप क्या करते हैं एक एक्टिवेशन फंक्शन से पास करते हैं अ ये एक्टिवेशन फंक्शन क्या काम आता है यहां पर गाइस तो देखिए आपके पास ये जो y आउटपुट आया है यहां पर ये वा आउटपुट क्या होगा एक नंबर होगा मतलब एक रेंज का एक नंबर आपको देखने को मिलेगा मतलब आपके पास माइनस से लेके प्लस के बीच में आपको एक नंबर देखने को मिलेगा अब अकॉर्डिंग टू योर आउटपुट आपका आउटपुट यदि क्लासिफिकेशन इन नेचर के अंदर है तो आप क्या चाहेंगे आपका आउटपुट जीरो या वन के फॉर्मेट में मिले आपका आंसर यदि आपका आउटपुट रिग्रेशन के फॉर्मेट में है तो आप जैसा आंसर आया वैसा ही आप चाहते हैं यहां पर एंड यदि आपके क्लासिफिकेशन में भी मल्टी क्लास क्लासिफिकेशन है तब भी आप अपना आउटपुट कुछ और चाहते हैं ओके बेसिकली आपके पास आपका जो डाटा है यहां पर यस बेसिकली आपके पास जो आपका डाटा है यहां पर वो डाटा आप अलग-अलग डिजायर आउटपुट में जा हैं अब आपके पास जो अलग-अलग जो डिजायर आउटपुट है यहां पर उसके करेस्पॉन्डिंग्ली फंक्शन अब ये एक्टिवेशन फंक्शन डिफरेंट डिफरेंट टाइप का हो सकता है डिफरेंट डिफरेंट आउटपुट के बेसिस पे अब आपका जो भी ये आपका जो डाटा है यहां पर यस आपका जो भी ये डाटा है इसको आप क्या करते हैं एक एक्टिवेशन फंक्शन से पास करते हैं एक्टिवेशन फंक्शन क्या करता है कि आपके पास जो इस इक्वेशन का जो आउटपुट आया है यहां पर इसको क्या करता है चेंजेज करता है अकॉर्डिंग टू योर डाटा अब जैसे ही आउटपुट चेंज करेगा तो आपको एक y आउटपुट यहां पर देखने को मिल जाएगा ये y आउटपुट आपके पास जो भी आपने डटा दिया होगा उसके अकॉर्डिंग एक प्रेडिक्शन आउटपुट होगा अब यहां पे कांसेप्ट आता है कि यदि ये वाई आउटपुट आपका जो डिजायर आउटपुट है वो नहीं आया तो हमें क्या करना होगा तो इसके लिए हम इस्तेमाल करते हैं बैक प्रोपो केशन का बैक प्रोपो केशन के जरिए हम क्या करते हैं कि हम ड एंड ड मतलब वेटेज की एंड बायस की वैल्यू को क्या करते हैं चेंजेज करते हैं वेटेज और बायस की वैल्यू को जब हम चेंजेज करते हैं तो उससे हमारा जो डिजर आउटपुट है वो चेंज होने लग जाता है और उससे हमारा जो आउटपुट है वो जो हमारा डिजर आउटपुट है उसमें पहुंच जाता है अब एक्चुअल में ये क्या काम करता है तो आपके पास यदि आपका डाटा इस तरह से पड़ा है यहां पर तो ये क्या करता है इस तरह से एक सेपरेशन लाइन बनाने का काम करता है राइट आपके पास जो क्लासिफिकेशन है उसके अंदर क्या करता है एक सेपरेशन लाइन बनाने का काम करता है ताकि यदि आपके पास कोई नया डाटा है तो वो नया डाटा किस रेंज के अर आ रहा है यहां पर वो आपको पता चलल सके और उसका क्या नेचर होना चाहिए मतलब वो ब्लू कलर का होना चाहिए या रेड कलर का होना चाहिए ये चीज आपको पता लग सके तो बेसिकली सिंगल लेयर प्र सेप्टन के अंदर क्या हो रहा है कि आपके सिंपल से जितने भी इनपुट्स हैं उनको वेटेज के साथ मल्टीप्लाई करा जा रहा है फिर उसके साथ बायस के साथ ऐड किया जा रहा है एक इक्वेशन बनाई जा रही है फिर उस इक्वेशन को हम क्या करते हैं अलग-अलग डिफरेंट डिफरेंट टाइप के एक्टिवेशन फंक्शन से पास कराते हैं अकॉर्डिंग टू आवर आउटपुट डिजायर आउटपुट देन जो भी आउटपुट आता है हम उसे गेट करते हैं राइट यदि मैं यहां पे इस इक्वेशन की बात करूं तो ये इक्वेशन कैसी होती है यहां पर तो ये इक्वेशन आपके पास होती है गाइज यहां पर आपके पास wt2 यस ये आपके पास होती है यहां पे टी और x क्या चीज है गाइ यहां पर तो टी एक मैट्रिक्स है यहां पर जो कि आपकी जो x मैट्रिक्स है उसके साथ मल्टीप्लाई हो रही है प्लस b वाली जो मैट्रिक्स है वो यहां पर ऐड होती है राइट इस तरह से क्या बनती है गाइज यहां पर आपके पास सिंगल लेयर प्रिसेप्ट का आपकी एल्गोरिथम्स बनती है जिसके थ्रू आप अपना डिजायर आउटपुट गेट करते हैं तो यदि हम सिंगल लेयर प्रस प्टोन की बात करें तो इसका यूज ज्यादातर नहीं किया जाता है रीजन सिंपल है यहां पर कि आज के टाइम के अंदर जो आपका डाटा है वो बहुत ही ज्यादा कॉम्प्लेक्टेड पे काम कर रहे होते हैं तो कॉम्प्लेक्शन पटन अच्छे तरीके से रिजल्ट नहीं दे पाता है जिसकी वजह से हम आज के टाइम के अंदर सिंगल लेर प्र सेप्टन का इस्तेमाल नहीं करते हैं हम इसके लिए मल्टी लेयर प्रस पटन का इस्तेमाल करते हैं लेकिन आपको एक बेस मॉडल जरूर पता होना चाहिए कि कि बेसिकली सिंगल लेयर परसेप्ट्रॉन कैसे वर्क करता है इसी के थ्रू आप मल्टी लेयर परसेप्ट्रॉन को देख पाएंगे एंड देन फर्द आप आगे काम कर पाएंगे तो आई थिंक आई होप सो समझ में आया होगा कि सिंगल प्रेसटन कैसे काम करता है अब इसके अंदर कुछ नई-नई टर्म्स है जैसे कि एक्टिवेशन फंक्शन कितने टाइप के एक्टिवेशन फंक्शन होता है किस समय कौन सा यूज होता है दैट अ पॉइंट ठीक है और उसके बाद में यदि हमारे पास एक रियल वर्ल्ड डाटा है तो उसके ऊपर हम सिंगल ड प्र सेप्टन को कैसे इस्तेमाल कर सकते हैं वो सारी चीजें हम आने वाले वीडियो के अंदर डिस्कस करने वा वाले हैं और आज के इस वीडियो के अंदर हम बात करेंगे सिंगल लब प्रस अपटन के बारे में देखिए इसके लिए जो रिक्वायर्ड डटा सेट है पहले मैं आपको दिखाता हूं देन उसके बाद में हम आगे बढ़ेंगे और जहां पे हम सिंगल लेयर परसेप्ट को प्रैक्टिकली लगाएंगे यस यूजिंग अ साकल एंड लाइब्रेरी हम क्या करेंगे सिंगल ए प्रेसटन को यूज करेंगे यदि आपको पाइथन मशीन लर्निंग डटा साइंस एंड डेटा एनालिसिस फील्ड में अपने आप को ग्रो करना है तो इसके लिए डब्लू कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जवाइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो चलिए जरा इसे देखते हैं यहां पर तो मैं आ चुका हूं फोल्डर के अंदर फोल्डर के अंदर देखिए मेरा प्लेसमेंट सीएसवी के तौर पे मेरा एक डाटा है यहां पर जिसके अंदर सीजीपीए और स्कोर दे रखा है उसके बेसिस पे हमें बताना है कि किसी पर्सन का प्लेसमेंट हुआ है या नहीं हुआ है अब इसके लिए आप चाहें तो अ बहुत सारी एल्गोरिथम्स है मशीन लर्निंग की वो अप्लाई कर सकते हैं लेकिन हम मशीन लर्निंग के एल्गोरिथम को अप्लाई ना करते हुए हम यहां पर सिंगल लेयर पसटन को यूज़ करेंगे और उसके थ्रू हम ये देखेंगे कि इसका डिसीजन रीजन किस तरह से बनता है राइट तो चलिए अब जरा चलते हैं यहां पर तो मैं आ चुका हूं यहां पर जुपिटर नोटबुक के अंदर जहां पे मैं एक नई फाइल बनाने जा रहा हूं यहां पर और ये जो मेरा प्लेसमेंट वाला डाटा है इसके ऊपर मैं करूंगा यहां पर प्रस अपटन को अप्लाई करूंगा इसके लिए जो मेरी रिक्वायर्ड लाइब्रेरी है मैं उसे इंपोर्ट कर लेता हूं जैसे पांडा है हमारी सबसे पहले रिक्वायर्ड लाइब्रेरी तो े हम इंपोर्ट करते हैं उसके बाद में हम यहां पर इंपोर्ट करते हैं किसे मैट पॉलिप को क्योंकि हम ग्राफ बनाने वाले हैं तो मै पलि ड पवा प्लॉट को हम लेने वाले हैं यहां पर एलियास ऑफ पलटी रखेंगे यहां पर उसके बाद में मैं यहां पर इंपोर्ट करूंगा किसे इंपोर्ट करना है गाइज यहां पर सी बन को एलियाज ऑफ एसएनएस रखने वाले हैं यहां पर अच्छा इसके अलावा मुझे डिसीजन रीजन बनाना पड़ेगा तो उसके लिए मैं जाऊंगा यहां पर एमएल एक्सटेंट मॉड्यूल के पास एमएल एक्सटें के अंदर जाने के बाद डॉट मैं कहां जाऊंगा यहां पर प्लॉटिंग में जाऊंगा यहां पर जहां से हम इसके ग्राफ को प्लॉट कर पाएंगे तो एमल एक के अंदर जाके प्लॉटिंग पे जाना है एंड प्लॉटिंग में जाने के बाद में मुझे क्या करना है प्लॉट डिसीजन रीजन को करना है तो मैं यहां पे क्या करूंगा इंपोर्ट करूंगा और इंपोर्ट किसे करना है गाइज यहां पर प्लॉट डिसीजन रीजन को राइट तो यहां पे हमें क्या करना है इंपोर्ट करना है किसे प्लॉट डिसीजन रीजन को ठीक है तो ये हमने ले लिया यहां पर अब हम क्या कर रहे हैं गाइ यहां पर हम डेटा सेट नाम से एक वेरिएबल बना रहे हैं जहां पे पडी डरी सीएसवी के हेल्प से हमारा जो डेटा है उसे हम लोड कर रहे हैं और डाटा का नाम क्या है गाइज यहां पर डाटा का नाम है हमारा प्लेसमेंट ड सीएवी तो मैं इसे लोड कर रहा हूं उसके बाद मैं अपना जो डेटा साइट है उसे लूंगा और डॉट हैड लगाते हुए इसके तीन डाटा को देखूंगा तो देखिए डॉट तीन लगा के डाटा को देखा यहां पर तो आपका देखिए सीजेपी है स्कोर है और प्लेस है हम देखिए क्या करेंगे सीजेपी और स्कोर के बेसस पे प्लेसमेंट को चेक करेंगे कि इसका हम प्रोडक्शन मॉडल कैसे बना सकते हैं विद द यूजिंग ऑफ प्रेसटन चलिए पहले यहां पर देखते हैं कि ये डाटा कैसा दिखाई देता है राइट डाटा को देखने के लिए मैं यहां पे क्या करूंगा ग्राफ बनाऊंगा ग्राफ बनाने के लिए हम यहां पर स्केटर प्लॉट का इस्तेमाल करेंगे स्केटर प्लॉट में x एक्सिस के अंदर बात करें यस स्केटर प्लॉट के अंदर यदि मैं यहां पर x एक्सेस की बात करूं यहां पर तो x एक्सेस के अंदर हम क्या लेने वाले हैं सीजी पे लेने वाले हैं एंड y एक्सिस के अंदर हम क्या लेने वाले हैं गाइज यहां पर स्कोर लेने वाले हैं राइट तो मैंने x एक्सिस और y एक्सिस के अंदर डाटा ले लिया यहां पर उसके बाद में हमारे पास क्या है यहां पे गाइज डाटा की बात करें तो जो डेटा हमारा आया है वो कहां से आया है डेटा सेट से आया है उसके बाद में नेक्स्ट चीज हो गया यहां पर हमारा ह्यू पैरामीटर और ू पैरामीटर में हम क्या लेने वाले हैं गाइज यहां पर प्लेस लेने वाले हैं राइट अब इस ग्राफ को देखना है तो मुझे क्या करना पड़ेगा पीएटी डॉट यहां पर शो फंक्शन को कॉल करना है जिसके थ्रू हम हमारे ग्राफ को देख पाएंगे तो हमारा ग्राफ आ चुका है अब यदि मेरे को यहां पर इस ग्राफ को छोटा करना है तो क्योंकि छोटा इसलिए करना है क्योंकि हमारा ग्राफ प्रॉपर एक स्क्रीन के अंदर नहीं आ रहा है यहां पर तो मुझे इसको छोटा करना पड़ेगा छोटा करने के लिए मैं फिगर का इस्तेमाल करूंगा फिगर के अंदर मैं क्या करने वाला हूं गाइ यहां पर फिक्स साइज का इस्तेमाल करूंगा फिक्स साइज के अंदर मैं 43 का एक छोटा सा ग्राफ बनाऊंगा जिसके थ्रू हम यहां पे देखेंगे कि हमारा जो डाटा है वो लीनियर सेपरेबल है यहां पर मैं एक लाइन बना सकता हूं जिसके थ्रू मेरा जो ग्राफ है वो लीनियर सेपरेबल हो जाएगा अब जो हमारा प्रेसेप्टल है वो किस तरह से इसको सेपरेबल करता है यहां पर किस तरह से सेपरेट करता है उसको अब जरा देखते हैं यहां पर तो चलिए पहले हमारे जो डाटा है उसको इनपुट और आउटपुट में अलग-अलग कर लेते हैं तो उसके लिए मैं क्या कर रहा हूं गाइज यहां पर x ले रहा हूं यहां पर x के अंदर क्या करूंगा डेटा सेट लूंगा डॉट मैं आलग लूंगा जिसके अंदर सारी नंबर ऑफ रो लूंगा सारे नंबर ऑफ कॉलम्स लेंगे लेकिन -1 करके जो आपका प्लेड वाला कॉलम है उसे हम लीव कर देंगे चलिए उसके बाद में गाइज यहां पर बात करें y एक्सेस के बारे में तो y एक्सेस के तौर पे मैं डेटा सेट लूंगा और यहां पे जाके मेरा जो प्लेस्ट वाला कॉलम है उसे मैं लेने वाला हूं तो ये मेरा x एक्सिस और y एक्सिस का डाटा आ चुका है अब इसके इसके बाद में मेरे पास एक्स्ट्राऑर्डिनरी और कोई डाटा पड़ा नहीं है यहां पर तो इसके लिए मुझे क्या करना है इसी डाटा में से कुछ टेस्टिंग का डाटा निकालना पड़ेगा कि मेरा मॉडल कितने परसेंट एक्यूरेसी के साथ चल रहा है तो इसके लिए मैं कर रहा हूं यहां पर ट्रेन टेस्ट स्प्लिटिंग कर रहा हूं मेरे डाटा को कैसे करेंगे तो मैं जाऊंगा फ्रॉम साइकल लन के पास जाऊंगा गाइज यहां पर डॉट मैं जा रहा हूं यहां पर मॉडल सिलेक्शन के पास यहां पर जिसके थ्रू हम हमारे डाटा को दो पार्ट के अंदर तोड़ने वाले हैं ट्रेन और टेस्ट के अंदर इसके लिए हम क्या करेंगे गाइज यहां पर ट्रेंट स्प्लिटिंग को कॉल करेंगे अब यहां पर मैं x क्या करने वाला हूं गाइ यहां पर ट्रेन के नाम से एक पैरामीटर बना देता हूं यहां पर फिर x टेस्ट के नाम से पैरामीटर बनाता है y मैं क्या कर रहा हूं गाइ यहां पर ट्रेन के नाम से एक पैरामीटर बना रहा हूं ठीक है और क्या कर रहा हूं यहां पर y टेस्ट के नाम से एक पैरामीटर बना रहा हूं जहां पे ट्रेन टेस्ट स्लिटिंग करेंगे और इसके अंदर x y डाटा डालेंगे और हमारा जो टेस्ट साइज है वो हम देखेंगे टेस्ट साइज क्या देने वाले हैं गाइज यहां पर 0.22 और रैंडम स्टेट की बात करें यहां पर तो रैंडम स्टेट इज इक्वल टू 42 देने वाले हैं चलिए इसे रन करते हैं यहां पर अब नेक्स्ट क्या होगा गाइज यहां पर हमारा टा जो है वो ट्रेन टस्ट पटिंग में हो चुका है अब मेरा काम यहां पे ये होगा कि हमारा जो मॉडल बने अब मॉडल बनाने के लिए हम क्या करेंगे प्रेसेप्टल को कॉल करेंगे इसके लिए क्या कर रहा हूं गाइज यहां पर फ्रॉम मैं जाऊंगा यहां पर साइकिल लन के अंदर साइकिल लन के अंदर जाने के बाद आपको लीनियर मॉडल में जाना है लीनियर मॉडल के अंदर आपको मिल जाएगा परसेप्ट यस क्या मिलेगा परसेप्ट मिलेगा यहां से आप परसेप्ट का मॉडल बना सकते हैं अब प्रिसेप्ट के लिए मैं प नाम से एक बराबर बना रहा हूं और प्रिसेप्ट को क्या कर रहा हूं कॉल करूंगा अब प्र सेप्टन को कॉल करने के बाद में प डॉट क्या करना है गाइज यहां पर मॉडल को फिट करना है फिट के अंदर मैं क्या कर रहा हूं गाइज यहां पर x ट्रेन एंड y ट्रेन पास करा दूंगा रन करते हैं मेरा मॉडल जो है यहां पर ट्रेड हो चुका है अब मॉडल की हम क्या कर रहे हैं गाइज यहां पर एक्यूरेसी चेक करते हैं कि कितने परसेंट एक्यूरेसी है क्या मेरा मॉडल ओवर फिटेड हुआ है या नहीं हुआ है ये भी हमें देखना है तो इसके लिए मैं प डॉट क्या करूंगा गाइज यहां पर स्कोर चेक करूंगा स्कोर के अंदर यदि मैं यहां पर x ट्रेन एंड y ट्रेन डालू यहां पर और मल्टीप्लाई बाय 100 करूंगा यहां पर पड क्या करूंगा गाइज यहां पर स्कोर चेक करूंगा जिसके अंदर x टेस्ट एंड y टेस्ट डालने वाला हूं और इसको भी क्या करने वाला हूं गाइ यहां पर मल्टीप्लाई बा 100 करूंगा रन करते हैं तो देखिए आपकी जो ट्रेनिंग एक्यूरेसी वो कम है और टेस्टिंग एक्यूरेसी ज्यादा है इसका मतलब कहीं ना कहीं प्रॉब्लम हुई है तो हम क्या कर रहे हैं हमारे रैंडम स्टेट की वैल्यू को चेंज करते हैं रैंडम स्टेट की वैल्यू को 10 करता हूं यहां पर और 10 के हिसाब से ट्रेन करूं तो देखिए हमारे पास 77 आ रहा 75 आरहा है इसका मतलब मॉडल ओवर फिटिंग तो हुआ है लेकिन ठीक है हमारा मॉडल यहां पे सही आया है अब मुझे यहां पर देखना है कि मेरा मॉडल जो है वो किस तरह से लाइन बना रहा है मतलब यहां पर ये किस तरीके से डिसीजन रीजन बना रहा है ये चीज हमें यहां पर चेक करनी है इसके लिए हमने यहां पे यूज़ किया था प्लॉट डिसीजन रीजन को तो मैं बस वही प्लॉट डिसीजन रीजन यूज़ कर रहा हूं यहां पर अब मुझे यहां पे x एक्सेस का डाटा चाहिए और वो भी किस फॉर्मेट में एरे में तो मैं यहां पर 2 मैं यहां पे नपाई का कॉल करूंगा राइट उसी तरीके से मैं यहां पे y डॉट यहां पर क्या कर रहा हूं 2 नपाई को कॉल करूंगा उसके बाद मेरे पास है यहां पर सीएलएफ मैं सीए को कॉल कर रहा हूं और सीएलएफ के तौर पे मैं प को कॉल करूंगा इसके ग्राफ को देखने के लिए मैं पटी शो फंक्शन को कॉल करूंगा और रन करूंगा इसने मुझे क्या कर रखा है यहां पर डिसीजन रीजन बना के दे दिया है अब देखिए ये जो डिसीजन रीजन है ये काफी बड़ा है तो इसको पहले छोटा करते हैं पीएटी डॉट किसके थ्रू फिगर के थ्रू छोटा करते हैं तो पीएटी डॉट यहां पर मैं फिगर को कॉल कर रहा हूं फिगर के अंदर मैं फिक्स साइज को कॉल कर रहा हूं और इसके अंदर 43 के थ्रू इस फिगर को छोटा कर रहा हूं अभी देखिए ये डिसीजन रीजन की जो लाइन बनी है यहां पर वो परफेक्ट नहीं बनी है अब आप चाहे तो इसके जो हाइपर पैरामीटर हैं उन्हें आप चेंज ज कर सकते हैं जैसे देखिए पेनल्टी है अल्फा है l1 रेशियो है मैक्स नंबर ऑफ इटरेशन है टोटल शफल्स वगैरह और भी बहुत कुछ दे रखा है जैसे देखिए अल्फा की वैल्यू आपके पास क्या दे रखी है 0.01 दे रखी है हम चाहे तो इस अल्फा की वैल्यू को चेंजेज कर सकते हैं जैसे 0.01 दे रखी है तो मैं इसको 0.01 कर देता हूं अब ये 0.01 के ऊपर हमारा जो मॉडल है वो ट्रेन किस तरह से हुआ वो देख लेते हैं तो ये वही है हमारे पास ज्यादा अच्छा ट्रेन नहीं हुआ यहां पर मैं यदि अल्फा की वैल्यू को वन कर दूं तो फिर चेक करते हैं कितना ट्रेंड हुआ है यहां पर तो अभी भी एक्यूरेसी वही के वही है राइट अभी हम चाहे तो यहां पर पेनल्टी को चेंज कर सकते हैं ए1 रेश को चेंज कर सकते हैं और भी बहुत सारी चीजों को चेंज कर सकते हैं लेकिन यदि हम बात करें प्रेसेप्टल के बारे में तो गाइ प्रिसेप्ट हमारे पास क्या सिंगल लेयर प्रिसेप्ट होता है वो यहां पर परफेक्टली वर्क नहीं करता कभी भी आपके पास परफेक्टली वर्क नहीं करता परफेक्टली सेपरेशन नहीं करता है राइट तो इसी के लिए हम क्या करते हैं मल्टी लेयर प्रिसेप्ट का यूज करते हैं जिसे आर्टिफिशियल न्यूरल नेटवर्क्स भी कहते हैं राइट तो आने वाले वीडियो के अंदर हम क्या करेंगे आर्टिफिशियल न्यूरल नेटवर्क को समझेंगे चलिए मैं आपको थोड़ा प्रेसेप्टल के बारे में एक और चीज दिखा दूं यहां पर थोड़ा सा विजुलाइजेशन आपको दिखाऊं यहां पर तो देखिए प्रस अपटन को यदि आपको और अच्छे से विजुलाइजेशन करना है तो आप यह playground.in f.g. इनपुट फीचर कौन-कौन से लेने हैं यहां पर और इनपुट फीचर लेने के बाद में आप अपने बीच में न्यूरॉन्स रख सकते हैं और उसके बाद काम कर सकते हैं अब आप अपना मॉडल चलाएंगे तो ये किस तरह से सेपरेशन हो रहा है वो आपको देखने को मिल जाएगा ये कब हो रहा है जब आपका लीनियर सेपरेबल डाटा हो यहां पर जब हमारा नॉन लीनियर सेपरेबल डाटा हो जैसे कि कुछ इस तरह से या जैसा कि कुछ इस तरह से जैसा कि कुछ इस तरह से अब यहां पर हम प्रे सेप्टन चलाते हैं तो ये लीनियर सेपरेबल डाटा नहीं कर पाता है तो इसके लिए हमें क्या करना पड़ेगा हमें नंबर ऑफ न्यूरॉन्स को बढ़ाना पड़ेगा हमें क्या करना पड़ेगा नंबर ऑफ न्यूरॉन्स को बढ़ाना पड़ेगा ताकि ये अच्छे तरीके से क्या करें सेपरेबल करें जैसे देखिए मैंने यहां पे नंबर ऑफ़ न्यूरॉन्स बढ़ा दिए यहां पर ताकि ये अच्छे से सेपरेबल करें तो देखिए आपके पास यहां पे बढ़ रहे हैं जैसे मैं कुछ और न्यूरॉन्स को यहां पे और इकट्ठा कर लेता हूं फिर मैं रन करता हूं यहां पर तो देखिए ये कोशिश कर रहा है आपके पास यहां पर डाटा को सही तरीके से सेपरेशन करने की राइट तो बेसिकली जब आप सिंगल लेयर प्रस अपटन का इस्तेमाल करते हैं तो सिंगल लेयर प्रस अपटन आपको एक सिंगल लाइन देता है जो कि हर किसी डाटा के लिए कैपेबल नहीं हो पाता है जैसे कि इस डेटा के लिए देखें तो ये आपके पास क्या कर रहा है मिस क्लासिफिकेशन बहुत ज्यादा कर रहा है यहां पर तो जब ये मिस क्लासिफिकेशन करता है तो गाइज यहां पर आपको परफेक्ट आंसर देखने को नहीं मिलता है तो फिर इस सिचुएशन के अंदर हमें क्या करना पड़ता है हमें जाना पड़ता है मल्टीलेयर प्रस अपटन के ऊपर जिसे हम आर्टिफिशियल नेटवर्क भी बोलते है एन जिसे बोलते हैं यहां पर वहां पे जाके हमें वर्क करना पड़ता है और वहीं से हम क्या करते हैं डाटा को सेपरेट करना स्टार्ट करते हैं और आज की इस वीडियो के जरिए हम बात करने वाले हैं मल्टी लेयर प्रिसेप्ट के बारे में देखिए इससे पहले हमने सिंगल लेयर प्रिसेप्ट के बारे में बात किया था तो आज की इस वीडियो के अंदर हम कंपेयर करेंगे कि सिंगल लेयर प्रिसेप्ट को हमने क्यों रिजेक्ट करना है और मल्टी लेयर परसेप्ट्रॉन को क्यों इस्तेमाल करते हैं इसके बारे में देखेंगे और मल्टी लयर परसेप्ट्रॉन कैसे बनता है यहां पर उसके बारे में भी हम डिस्कस करने वाले हैं जब हमारे पास एक नॉन लीनियर सेपरेबल डाटा है जैसे कि हमारे पास ये दे रखा है यहां पर एक डेटा सेट दे रखा है इस डेटा सेट के अंदर हमारा x1 हमारे पास क्या है एक इनपुट है x2 हमारा एक और दूसरा इनपुट है जिसके बेसिस पे हमें क्या करना है आउटपुट यहां पर हमें क्या करना है क्लासिफाई करना है जो कि आपके पास रेड और ग्रीन के अंदर है अब ये जो आपके पास देखेंगे तो ये क्या है एक नॉन लीनियर सेपरेबल डेटा यस और जब हमारे पास नॉन लीनियर सेपरेबल डाटा आता है तो उसके अंदर आपका जो सिंगल लेयर परसेप्ट है यस जो आपका सिंगल लेयर परसेप्ट है यहां पर वो सिंगल लेयर परसेप्ट्रॉन यहां पर बेटर वर्क नहीं करता यस यहां पर जैसे कि मैं इसका एक एग्जांपल दूं आप लोगों को तो मैं यहां पर देखिए एक इसका डुप्लीकेट बना लेता हूं राइट और डुप्लीकेट बनाने के बाद में अब इसे समझते हैं यहां पर हां बनाया इसने डुप्लीकेट ओके तो जब अ भी हमारे पास यहां पर नॉन लिनियर डेटा आता है तो उसके ऊपर हमारा जो सिंगल लेयर प्र सेप्टन है वो सही तरीके से वर्क नहीं करता है तो जब ये सही तरीके से वर्क नहीं करता है तो हमारे पास क्या करता है हमें रॉन्ग प्रेडिक्शन देता है कैसे देखिए सिंगल लेयर प्रेसटन क्या करेगा इस तरह से हमारे पास एक लाइन बनाएगा जो कि आपके पास क्या है एक रॉन्ग प्रेडिक्शन लाइन है यस ये हमारे पास क्या है एक रॉन्ग प्रेडिक्शन लाइन है मतलब नॉन सेपरेट रॉन्ग आपके पास यहां पर सेपरेबल लाइन यहां पर है तो जब भी हमारे पास सिंगल ए प्र सेप्टन का इस्तेमाल करते हैं तो सिंगल ए प्र सेप्टन हमारे पास क्या करता है यहां पर हमें रॉन्ग रिजल्ट यहां पर देता है काफी बार हमारे पास जब हम नॉन लीनियर सेपरेबल डाटा हो तब हम रॉन्ग रिजल ता है तो उस केसेस में हम कहां करते हैं मूव यहां पर हम मूव करते हैं मल्टी लेयर परसेप्ट्रॉन के अ मल्टी लेयर प्रिसेप्ट के अंदर हम क्या करते हैं कि बहुत सारे सिंगल लेयर न्यूरल नेटवर्क को ऐड करके एक मल्टी लेयर न्यूरल नेटवर्क बनाते हैं जिसके थ्रू हम क्या करते हैं कि जब हमारे पास नॉन लीनियर सेपरेबल डाटा आ जाए यहां पर तब भी हम क्या कर सके उसके ऊपर बेटर रिजल्ट लेके आ सके तो उसके लिए हम क्या इस्तेमाल करते हैं मल्टी लेयर प्रस अपटन का इस्तेमाल करते हैं अब ये मल्टी लेयर प्रस एप्टन दिखता कैसा है यहां पर तो मल्टीलेयर प्र सेप्टन कुछ इस तरह का दिखता है अब ये कैसे बनता है यहां पर तो जरा उसको समझते हैं तो देखिए जब हम यहां पर हमारा इस तरह से नॉन लीनियर सेपरेबल डाटा यूज करते हैं तब हम क्या करते हम सिंगल आपके पास लेयर परसेप्ट का इस्तेमाल कर ते हैं अब सिंगल लेयर परसेप्ट के अंदर क्या होता है गाइज यहां पर आपके पास सबसे पहले क्या आता है आपके इनपुट्स आते हैं जैसे आप आपका x1 एक इनपुट हो गया आपके पास x2 एक इनपुट हो गया ये दोनों क्या करता है गाइज यहां पर आपके पास क्या करते हैं वेटेज के साथ मल्टीप्लाई होता है जैसे w1 आपका एक वेटेज है w2 आपका एक वेटेज है अब ये वेटेज के साथ मल्टीप्लाई होने के बाद क्या करते हैं यहां पर एक बायस के साथ क्या करते हैं ऐड करते हैं यहां पर मतलब यहां पे आपका क्या होगा सबका समेशन होगा समेशन होने के बाद में क्या होता है गाइज यहां पर यहां पर एक फंक्शन लगता है दैट कॉल्ड ऑफ एक्टिवेशन फंक्शन और उसके बाद आपका वाहेड प्रोडक्शन आता है जो कि आपका क्या करता है एक सिंगल लाइन देता है लेकिन अब हमें यहां पे क्या करना है कि भाई हमारे पास नॉन लीनियर सेपरेबल डेटा है तो नॉन लीनियर सेपरेबल डटा होने की वजह से गाइज यहां पर आपका सिंगल परसेप्ट्रॉन वर्किंग नहीं करेगा तो इसके लिए हम क्या करेंगे ऐसे-ऐसे मल्टीपल परसेप्ट लगाएंगे मतलब यहां पर सिंपल सा यहां पर ये काम है कि जैसे ये हमारे पास यहां पर नॉन लीनियर सेपरेबल डाटा है तो हमारे पास क्या हुआ कि हमारे पास एक लाइन ने हमें यहां पर परफेक्ट सेपरेबल ले करके नहीं दिया तो हमने क्या किया गाइज यहां पर हमने दूसरी एक सेपरेबल लाइन और बना ली हमने क्या किया गाइज यहां पर तीसरी एक और सेपरेबल लाइन और बना ली फिर हमने क्या किया गाइज यहां पर एक और लाइन यहां पर बना ली मतलब तीन चार यहां पर आपके पास क्या किए आपके पास सेपरेबल लाइन यहां पर क्रिएट कर ली बहुत सारे मल्टीपल लेयर से अब जब हमने यहां पे क्या किया इसका कॉमन पॉइंट निकाला जैसे हमने यहां पर एक और सेपरेबल लाइन बना ली तो अब जब हमने यहां पे इनका कॉमन रिजल्ट निकाला तो वो एक परफेक्ट सेपरेबल लाइन बन गई मतलब हमने क्या किया गाइज यहां पर पहले हमने क्या किया एक सिंगल न्यूरल नेटवर्क का इस्तेमाल करने की जगह हमने क्या किया और बहुत सारे न्यूरल नेटवर्क मतलब हमारे पास सिंगल लेयर प्र सेप्टन का इस्तेमाल कर दिया जैसे x1 एक और ले लिया यहां पर x2 और ले लिया यहां पर फिर हमने क्या किया गाइज यहां पर इनको फिर से w1 और w2 से मल्टीप्लाई कर दिया यहां पर अच्छा ये जो w1 है और ये जो w2 है यहां पर ये इन दोनों से डिफरेंस है मतलब ये जो नेटवर्क्स है आपके पास यहां पर ये नेटवर्क वन है यहां पर और ये नेटवर्क टू है ये दोनों नेटवर्क्स आपके पास क्या है अलग-अलग है फिर से हमने क्या किया यहां पर समेशन किया समेशन करके हमने बायस कर दिया बायस करके फिर से फंक्शन लगा के आपके पास क्या गया वा हेड का प्रोडक्शन निकाल दिया लेकिन हमारे पास यहां पे तो आउटपुट क्या है ू ही है लेकिन ये हमें क्या करेगा फोर अलग-अलग आउटपुट देगा तो हमने क्या किया गाइज यहां पर हमने यहां पे क्या किया इन सारे न्यूरल नेटवर्क के अंदर मतलब हमने क्या किया बहुत सारे न्यूरल नेटवर्क को आपस में ऐड करके क्या किया गाइज यहां पर इन सभी को वापस एक सिंगल नेटवर्क के साथ कनेक्ट कर लिया मतलब इनके जो आउटपुट है यहां पर इनको वापस एक न्यूडल नेटवर्क के साथ कनेक्ट करके बायस के साथ ऐड करके मतलब इनके अंदर भी क्या किया हमने यहां पर ड और ड को मल्टीप्लाई करके बायस को ऐड करके हमने क्या किया एक फंक्शन से पास करा दिया और उसके बाद हमारा जो y आउटपुट है वो हमने निकाल दिया तो बेसिकली हो क्या रहा है यहां पर कि हमारे पास बहुत सारे सिंगल लेयर जो प्रोसप टॉन थे उन सभी को क्या किया आपस में मिक्स किया एंड मिक्स करके एक न्यूरल नेटवर्क डिजाइन कर दिया जो कि कुछ इस तरह से दिखता है अब यहां पे डिपेंडेंट रहता है यहां पर कि आप यहां पर जो ये अगला नेटवर्क कनेक्ट कर रहे हैं ये अगला नेटवर्क आप एक ही कनेक्ट कर रहे हैं या फिर दो कनेक्ट कर रहे हैं तीन कनेक्ट कर रहे हैं दैट्ची मतलब ये सारा का सारा जो आपके पास है आपके ऊपर ही डिपेंड करता है तो इस तरह से आपके पास क्या करता है यहां पर मल्टी लेयर न्यूरल नेटवर्क काम करता है अब आप बोलेंगे कि सर मल्टी लेयर न्यूरल नेटवर्क की जो यहां पे इमेज है वो कुछ इस तरह से दिखती है जिसके अंदर आपके पास जो पहली लेयर होती है गाइज यहां पर वो आपके पास कैस की होती है इनपुट लेयर होती है इसके साथ-साथ जो आपके पास यह बीच वाली लेयर होती है इसे आप हिडन लेयर बोलते हैं यहां पर और जो आपके पास सबसे लास्ट वाली लेयर होती है वो आपकी आउटपुट लेयर होती है अब आपकी आउटपुट लेयर डिपेंड करती है कि आपके पास आउटपुट कितने बाहर आने चाहिए मतलब आपके पास सिंगल आउटपुट है तो एक ही नोड रहेगा यहां पर बहुत सारे मल्टीपल आउटपुट है यहां पर तो आपके पास मल्टीपल नोड्स यहां पर रहने वाले हैं पर और ये जो नेटवर्क डिजाइन देख रहा है ये आपका टोटली डिफरेंस है तो बेसिकली ये दोनों आपस में कैसे कनेक्टेड होंगे तो बहुत ही सिंपल तरीका है यहां पर इन दोनों को आपस में कनेक्ट करने का तो बहुत ही सिंपल तरीका कैसे यहां पर देखिए मैं इस ने नेटवर्क से आपका जो आर्टिफिशियल न्यूरोल नेटवर्क जो कि आपको दिखाई देता है वो मैं बनाने जा रहा हूं कैसे बनाते हैं हम यहां पर तो देखिए ये आपका x1 आ गया यहां पर और ये आपका x2 आ गया अब यहां पे मैं क्या कर रहा हूं यहां पर y1 हैट आपका ला रहा हूं यहां पर और ये आपका पास क्या आ गया y2 हैट आपका पास आ गया मतलब पहले वाले का आपका यहां पर आउटपुट एंड दूसरे वाले का आउटपुट ठीक है हमने क्या किया देखिए गाइज यहां पर x1 को इससे कनेक्ट कर लिया और x2 को इससे कनेक्ट कर लिया फिर वापस देखिए x1 को इससे कनेक्ट कर लिया और x2 को इससे कनेक्ट कर लिया और ये सब आपस में आगे जाते हुए आपके पास क्या कर रहे हैं गा यहां पर ये इसके साथ कनेक्ट हो रहे हैं और आपके पास यहां पर वाय प्रोडक्शन आपके पास यहां पर गेट मिल रहा है राइट तो इस तरह से आपके पास क्या मिलता है आपको एक कॉम्प्लेक्शन रिजन मिलता है लेकिन जब आप इसे एक्सपेंड करेंगे तो एक्सपेंड करने का जो रिजल्ट है वो आपके पास कुछ इस तरह से दिखाई देता है अब यहां पे बात करें कि सर देखिए वेटेज की वैल्यू क्या होती है तो देखिए यहां पे आप क्या कर सकते हैं वेटेज को ऐड कर सकते हैं और इसी के अंदर आपके पास क्या होता है बायस ऐड होता है सबमिशन ऐड होता है और इसी के अंदर आपके पास आपके एक्टिवेशन फंक्शन भी लगे हुए होते हैं अब इन सब के अंदर यहां पे बात करें तो ये जो आपकी लेयर हो होती है जिसके अंदर आपका डटा इनपुट के तौर पे जाता है ये आपका पा क्या कहलाता है गाइज यहां पर इनपुट लेयर कहलाता है यहां पर और ये जो आपका डाटा कहलाता है यहां पर इसे हम यहां पर हमारा फर्स्ट आउटपुट लेयर या फिर जनरली आप इसे क्या बोलते हैं यहां पर हिडन लेयर बोलते हैं यस क्या बोलते हैं यहां पर हिडन लेयर बोलते हैं और ये जो आपका यहां पे फाइनल होता है दैट इज कॉल ऑफ यहां पर आउटपुट आपके पास लेयर होती है यस ये क्या होती है गाइज यहां पर आउटपुट लेयर होती है तो आपके किसी भी न्यूरल नेटवर्क के अंदर आपके पास क्या होती है इनपुट लेयर होती है हिडन लेयर होती है एंड आउटपुट लेयर होती है अब जितने ज्यादा आप यहां पे कट्स लगाते हैं जैसे कि जितने ज्यादा आप यहां पर जितने ज्यादा न्यूरल नेटवर्क का इस्तेमाल करते हैं उतने ही ज्यादा आपके पास क्या होती है आपकी हिडन लेयर बढ़ती रहती है आप चाहे तो एक हिडन लेयर लगा सकते हैं आप चाहे तो मल्टीपल हिडन लेयर लगा सकते हैं अकॉर्डिंग टू योर डेटा आपके डेटा के ऊपर डिपेंड रहता है कि आप कितनी नंबर ऑफ हिडन लेयर यहां पर लगाना चाहते हैं जितनी ज्यादा आप हिडन लेयर लगाएंगे उतना ज्यादा आपको बेस्ट रिजल्ट आपको देखने को मिलता है तो बेसिकली मल्टी लेयर परसेप्ट के अंदर क्या होता है कि जो आपके छोटे-छोटे न्यूरल नेटवर्क्स होते हैं जो आपके छोटे-छोटे आपके प्रिसेप्ट होते हैं उन परसेप्ट्रॉन को आपस में कनेक्ट करा जाता है यहां पर और कनेक्ट करके आपके पास क्या करते हैं आप एक फाइनल रिजल्ट पे पहुंचते हैं जो कि आपके पास य कंप्लीट स्ट्रक्चर होता है दैट इज कॉल्ड ऑफ आपके पास मल्टीलेयर प्रस अपटन अब मैं बात करूं यहां पर कि इसके अंदर आपके पास यहां पे नेटवर्क के अंदर इक्वेशन क्या बनेगी तो इक्वेशन आपकी वही बनने वाली है जो आपके पास यहां पर आपके सिंगल लेय न्यू नेटवक में बन रही थी कौन सी इक्वेशन यहां पर तो देखिए आपके पास यहां पर पहले वाई हेड की इक्वेशन क्या बन रही थी गाइ यहां पर वाई हेड की जो इक्वेशन बन रही थी वो कैसे बन रही थी आपके पास यहां पर यहां पर आपका एक एक्टिवेशन फंक्शन एक्टिवेशन फंक्शन के साथ आप क्या कर रहे थे गाइ यहां पर एक्टिवेशन फंक्शन के साथ यहां पर w1 * आपके पास x1 जो कि एक डॉट प्रोडक्ट होता है यहां पर ये जो इंटू होता है ये क्या होता है डॉट प्रोडक्ट होता है w t * x आपके पास हो सकते है प्लस एक बायस टर्म आपके ड हो जाती है इधर बात करें यहां पर तो इसके अंदर भी क्या आएगा यहां पर सिगमा डटी आपके पास टी * x प्लस आपके पास क्या बन जाएगा y बन जाएगा अब जो ये आपके पास y आउटपुट आए हैं ये वा आउटपुट क्या होंगे इस न्यूरल नेटवर्क के लिए इनपुट्स का रूल करेंगे ये जो वा आउटपुट आए हैं ये जो वा आउटपुट पुट ये क्या करेंगे इस न्यूरल नेटवर्क के लिए इनपुट्स का रोल करने वाले हैं तो गाइज यहां पे इसके लिए क्या बनेगा इसके लिए आपके पास क्या बनेगा वापस वही बन जाएगा w t आपके पास x प्लस आपके पास क्या बनेगा 22 बन जाएगा तो ये आपके पास यहां पर इस तरह से वर्क करने वाला है तो बेसिकली गाइज यहां पे बात करें तो मल्टी लेयर प्लस ऑफ्टन में क्या हो रहा है कि जो आपका सिंगल लेयर प्स ऑफ्टन की जो इक्वेशन है वही आपके पास आ रही है यहां पर लेकिन जैसे-जैसे आगे हिडन लेयर के ऊपर बढ़ते जा रहे हैं वैसे क्या हो रहा है कि जो पुराने वाला का जो आउटपुट है वही आपके पास अगले वाले का क्या बनता है इनपुट बनता है अब य यहां पे एक कांसेप्ट आता है कि जो पुराने वाला का इनपुट है वो हमारे पास उसके अंदर हमने एक्टिवेशन फंक्शन लगा दिया सिग्मो इड तो वहां पे हमें बाइनरी आउटपुट मिलेगा तो फिर उस केसेस में तो हमारा जो आउटपुट आगे जाएगा वो बाइनरी फॉर्मेट में जाएगा तो फिर हमें हमारा रिजल्ट कैसे मिलेगा यहां पर तो इस वक्त हम क्या करते हैं कि जो आपके पास हिडन लेयर होते हैं इन हिडन लेयर के अंदर हमारा जो एक्टिवेशन फंक्शन होता है उसे हम क्या करते हैं चेंज करते हैं मतलब यहां पर हम जो है सिगमॉड एक्टिवेशन फंक्शन का इस्तेमाल नहीं करते हैं रीजन बहुत क्लियर है क्योंकि इस वक्त आपका जो सिगमॉड एक्टिवेशन फंक्शन है वो आपको क्या देता है रिजल्ट के तौर पे जीरो या वन आपको रिटर्न करके देता है तो जब आपको ये जीरो या वन रिटर्न करके देगा जब आगे से आगे आपके जो ये आउटपुट है वो आगे इनपुट के तौर पे कनेक्टेड होंगे तब आपके पास जो आपका रिजल्ट है वो आपको बेटर नहीं मिल पाएगा तो उस वक्त हम क्या करते हैं कि जो हिडन लेयर होते हैं उस हिडन लेयर के एक्टिवेशन फंक्शन को चेंज करा जाता है अब ये एक्टिवेशन फंक्शन क्या होते हैं कितने तरीके होते हैं यहां पर और किस समय कौन सा एक्टिवेशन फंक्शन यूज करना चाहिए इसके बारे में हम जानेंगे डिटेल के साथ हमारी अगली वीडियो के अंदर तो फिलहाल आज की वीडियो के लिए बस हमने हमने इतना ही देखा यहां पर कि मल्टी लेयर प्र सेप्टन क्या होता है सिंगल लेयर प्र सेप्टन से कितना डिफरेंस है और जब कि आपके पास नॉन लीनियर सेपरेबल डेटा आ जाए तब आप क्या इस्तेमाल करेंगे मल्टी लेप टन का इस्तेमाल करेंगे और आज की इस वीडियो के जरिए हम बात करेंगे फॉरवर्ड एंड बैकवर्ड प्रोपो केशन के बारे में देखिए सबसे पहले हम बात करेंगे यहां पर फॉरवर्ड प्रोपो केशन के बारे में देन सेकंड हम यहां पर बात करेंगे बैकवर्ड प्रोपेगेशन के बारे में तो चलिए जानते हैं यहां पर ये कैसे वर्क करते हैं यदि आपको पाइथन मशीन लर्निंग डेटा साइंस एंड डेटा एनालिस जैसी फील्ड में अपने आपको को ग्रो करना है तो इसके लिए डब्लू कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो देखिए जब भी आप किसी न्यूरल नेटवर्क के ऊपर काम करते हैं तो उस न्यूरल नेटवर्क के अंदर सबसे पहले आपके पास क्या होती है इनपुट लेयर होती है उसके बाद आपके पास क्या होती है हिडन लेयर होती है ये हिडन लेयर एक से ज्यादा भी हो सकती है उसके बाद में आपके पास आती है आपकी आउटपुट लेयर अब इस हिडन लेयर के अंदर नंबर ऑफ नोड्स कितने हैं वो डिपेंड करते हैं आपके ऊपर कि आप कितने नोड्स लेकर अपने मॉडल को ट्रेन करना चाहते हैं मतलब आप अपने न्यूरल नेटवर्क को ट्रेन करना चाहते हैं दैट डिपेंड ऑन यू अब मैं बात करूं यहां पर कि ये तो बहुत ही कॉम्प्लेक्शन नेटवर्क है यदि मैं यहां पर इसे एक सिंपल न्यूरल नेटवर्क के अंदर लेके जाऊं यहां पर कॉम्प्लेक्टेड प्र सेप्टन है इसको हम यहां पर क्या बोलते हैं मल्टी लेयर प्रस पटन या फिर एनएन नेटवर्क्स भी बोला जाता है यहां पर ये बहुत ही कॉम्प्लेक्शन है यदि मैं इसको सिंपलीफाई करके एक सिंपल न्यूरल नेटवर्क में लाऊ मतलब आपके पास यहां पर एक सिंगल लेयर न्यूरल नेटवक में लाए यहां पर राइट उसके ऊपर काम करें तो आप यहां पर बेटर समझ पाएंगे कि किस-किस तरह से आपके पास यहां पर फॉरवर्ड प्रोपेगेशन वर्क करता है देखिए यदि हम बात करें सिंगल लेयर प्रेसेप्टल के बारे में तो उसके अंदर होता क्या है कि आपके पास यहां पर नंबर ऑफ नोड्स होते हैं जो कि ये नंबर ऑफ नोड्स क्या होते हैं आपके पास इनपुट नट्स होते हैं यस ये आपके पास क्या होता है इनपुट नोट्स होते हैं जैसे x1 आपका एक इनपुट हो गया x2 आपका एक इनपुट हो गया x3 आपका एक इनपुट हो गया और x4 आपका इनपुट हो गया ये सारे इनपुट जो होते हैं यहां पर ये क्या करते हैं आपका सम वेटेज से आपके पास क्या होते हैं मल्टीप्ला होते हैं यस आपके पास क्या होता है ये न्यूरल नेटवर्क ये जितने भी नोट्स है आपके पास यहां पर ये जितने भी इनपुट नोट्स हैं यहां पर ये क्या करते हैं कुछ वेटेज से मल्टीप्लाई होते हैं अब ये जो वेटेज की वैल्यू होती है गाइज यहां पर ये स्टार्टिंग के अंदर जस्ट स्टार्टिंग के अंदर रैंडम कुछ भी रख दी जाती है ये आप अपने हिसाब से इसे एडजस्टमेंट कर सकते हैं इसे हम वेट इनिश इइ जशन टेक्निक बोलते हैं जिसके अंदर हमें क्या करना पड़ता है हमें इनिश इज मतलब इनिशियल स्टेज के अंदर हमें कुछ वेटेज की वैल्यू सेल्फ देनी पड़ती है राइट तो फॉरवर्ड प्रोपेगेशन के अंदर आप क्या करते हैं कि सबसे पहले आपका जो भी आपका नेटवर्क ट्रेंड होर होता है उस नेटवर्क ट्रेंड के अंदर आप क्या करते हैं आप अपने वेटेज की वैल्यू को कुछ असाइन करते हैं जैसे समथिंग यहां पर बात करें तो 1.2.3 इस तरह से आप दे सकते हैं यहां पर एंड उसके बाद में आप क्या कर सकते हैं गाइ यहां पर अपने बायस की वैल्यू को एडजस्ट करते हैं मतलब बायस की वैल्यू को देते हैं अब ये जितना भी डाटा होता है ये जितना भी डाटा होता है ये आपस में क्या होता है मल्टीप्लाई होता है और मल्टीप्लाई होके आपके पास क्या होता है बायस के साथ क्या होता है सम करता है मतलब यहां पे आपके पास क्या लगता है समेशन लगता है ये चीज आप अच्छे से समझ चुके होंगे कब जब आपने यहां पर सिंपल न्यूरल नेटवर्क पढ़ा होगा या फिर आप आपने परसेप्ट्रॉन के बारे में बात करा होगा या सिंगल लेयर परसेप्ट के ऊपर बात की होगी तब आपने इसे डिटेल के साथ देखा होगा इस वक्त क्या होता है गाइज यहां पर कि जो भी आपके इनपुट्स होते हैं वो क्या होता है बायस से मल्टीप्लाई होते हैं और वेटेज के साथ एडिशन होते हैं राइट उसके बाद ये जो भी आउटपुट होता है इस आउटपुट को हम क्या करते हैं एक एक्टिवेशन फंक्शन से पास करते हैं अब ये एक्टिवेशन फंक्शन डिपेंड करता है कि आपका डिजायर आउटपुट क्या है जैसे डिजायर आउटपुट यदि आपका क्लासिफिकेशन इन नेचर का है तो हम जनरली सॉफ्ट मैक्स या फिर आपके पास यहां पर सिगमा एक्टिवेशन फंक्शन को चूज करना है यदि आपका जो यहां पर डिजायर्ड जो आउटपुट है यहां पर वो रिग्रेशन का है तो हम यहां पर लीनियर एक्टिवेशन फंक्शन का इस्तेमाल करते हैं राइट जैसे हम नोट्स की बात करें हिडन नोड्स की बात करें यहां पर हिडन लेयर की बात करें तो इनके लो एक्टिवेशन फंक्शन यूज होता है तो अलग-अलग सिनेरियो के अंदर आपके पास क्या होता है अलग-अलग एक्टिवेशन फंक्शन यूज होता है ये एक्टिवेशन फंक्शन आपके पास क्या करता है आपका आउटपुट आपको लाके देता है मतलब आपको वाई हैट लाके देता है अब ये आपके पास क्या कर लाता है आपका फॉरवर्ड प्रोपेगेशन कहलाता है मतलब आपने अपना इनपुट दिया उसके साथ वेटेज आपका मल्टीप्लाई हुआ बायस के साथ क्या हुआ आपका हुआ उसके बाद आपने एक एक्टिवेशन फंक्शन से पास किया और आपका जो डिजायर आउटपुट है वो आपको y मिला यदि मैं इक्वेशन के टर्म्स में यदि मैं इसकी बात करूं कि इक्वेशन के टर्म में क्या बनेगा यहां पर तो यहां पे इक्वेशन के टर्म के अंदर वा हैड की जो वैल्यू बनती है यस इस वा हैड की वैल्यू को मैं यहां पे लिख रहा हूं तो ये जो वा हैड की जो वैल्यू लिखती बनती है यहां पर ये आपके पास बनता है एक एक्टिवेशन फंक्शन अब इसमें एक्टिवेशन फंक्शन को क्या कर रहा हूं यहां पर सिग्मा के तौर प दिखा रहा हूं यहां पर तो ये आपके पास एक्टिवेशन फंक्शन है इस एक्टिवेशन फंक्शन के साथ में आपको क्या करना है ड ट्रांसपोर्ट करना है यस w का क्या करना है ट्रांस सपोज करना है यहां पर और इसके साथ आपको क्या करना है डॉट प्रोडक्ट करना है किसका x का x कौन सा x1 x2 x3 x4 यस इनका आपको क्या करना है ट्रांसपोजर आना है प्लस इसके साथ आपको क्या करना है यहां पर बा की वैल्यू को ऐड करना है तब जाके आपके पास यहां पर आपका जो डिजायर आउटपुट है फ आपको मिलेगा राइट तो गाइज होता क्या है सबसे पहले आपके इनपुट्स आपके जो भी है यहां पर वो आपके पास कलेक्ट होते हैं उसके बाद वेटेज से क्या होता है मल्टीप्लाई होता है अब यहां पे देखिए मैंने यहां पे डॉट प्रोडक्ट लगाया क्यों डॉट प्रोडक्ट लगाया क्योंकि हमारा जितना भी डाटा होता है यहां पर ये सारा का सारा जो डाटा होता है गाइज यहां पर ये किस फॉर्मेट में होता है मैट्रिक्स फॉर्मेट के अंदर होता है यस हमारा जो डाटा है यहां पर वो सारा का सारा क्या होता है मैट्रिक्स फॉर्मेट में होता है और मैट्रिक्स के अंदर हमें क्या करना पड़ता है डॉट प्रोडक्ट करना होता है तो इसलिए मैंने डॉट प्रोडक्ट किया यहां पर देन उसके बाद में आपके पा क्या करना है आपको बायस की वैल्यू को क्या करना है यहां पर ऐड करना है और उसके बाद जो भी आपका डिजर आउटपुट है उसे हमें क्या करना है एक एक्टिवेशन फंक्शन से पास कराना है जो कि आपका जो आउटपुट है एक गिवन रेंज के अंदर आके दे देगा या फिर आपके पास यहां पर जो आपका आंसर है वो जीरो या वन की फॉर्मेट में लाके देगा तो ये जो प्रोसीजर होता है दैट ट इज कॉल्ड फॉरवर्ड प्रोपेगेशन अब इसको फॉरवर्ड प्रोपेगेशन क्यों बोला जा रहा है क्योंकि इसके अंदर जो आपका काम हो रहा है यहां पर वो पीछे से आगे की तरफ यहां पर रहा है मतलब एक फॉरवर्ड डायरेक्शन के अंदर हम क्या कर रहे हैं यहां पर आगे से आगे मूव कर रहे हैं अब यहां पे एक बहुत बड़ा क्वेश्चन ये आता है कि ये जो वेटेज और बायस की वैल्यू जो हम यहां पर रख रहे हैं मतलब इनिश आइज कर रहे हैं यहां पर हम खुद रैंडम देखिए आपके पास यहां पर स्टार्टिंग के अंदर यदि आप नहीं देते हैं तो आपके पास क्या होता है आपके सिस्टम के अंदर आपकी जो वैल्यू होती है वो डिसाइड हो रही होती है वन व आपके पा से डिसाइड हो रखी होती है यहां पर प व किसके अंदर वन आपका डिसाइड हो रख है वो उसको लेके काम करता है लेकिन यदि आप चाहते हैं मतलब आप इनके वेटेज की वैल्यू को अपने हिसाब से चेंजेज कर सकते हैं इसको हम आगे चलते हुए पढ़ेंगे किसके अंदर वेट इनिन टेक्निक के अंदर यस वेट इशन इनिश इइ जशन टेक्नीक होती है जहां पे हम इनिशियल वेट को इनिशियल वेट का मतलब क्या है जब हमारा न्यूरल नेटवर्क जब हमारा ट्रेंड हो रहा होता है उस समय हम हमारे वेट को क्या कर सकते हैं गाइज यहां पर हमारे वेट को चेंजेज कर सकते हैं ताकि हमारा जो यहां पे न्यूरल नेटवर्क है वो अ अच्छे से ट्रेड हो सके और अच्छे से वर्किंग कर सके तो बेसिकली यहां पर क्या कर रहे हैं हम गाइज यहां पर इनिश आइज वेट दे रहे हैं अब जब हम यहां पर इनिश आइज वेट्स दे रहे होते हैं यहां पर तो ये जरूरी नहीं है कि आपका जो y आउटपुट है और जो आपका डिजायर आउटपुट है वो सेम हो राइट जैसे कि आप एग्जांपल लेते हैं यहां पर जैसे कि मैं बात करूं यहां पर कि मेरे जो वाहेड की वैल्यू है यहां पर वो आ रही है आपका समथिंग यहां पर 2 3 4 और फाइव और आपकी जो y की वैल्यू है जो ओरिजिनल y की मैं बात करूं यहां पर वो वैल्यू आपके पास आ रही है यहां पर 3 4 5 6 इसका मतलब क्या हुआ गाइज यहां पर कि आपका जो इयर आउटपुट है और जो आपका वा प्रिडिक्ट है मतलब जो प्रेडिक्शन आउटपुट है और जो ओरिजनल आउटपुट है इसके बीच में क्या आया गाइज यहां पर डिफरेंस आया अब इस डिफरेंस को हमें क्या करना है मिनिमम करना है क्यों मिनिमम करना है क्योंकि गाइज ये जो डिफरेंस है ये जितना ज्यादा होगा गाइज यहां पर उसके हिसाब से आपका जो लॉसेस है वो उतना ही ज्यादा बढ़ता रहेगा राइट तो हमें क्या करना है गाइज यहां पर कि ये जो y प्रेडिक्शन है और y ओरिजिनल के बीच का जो डिफरेंस है जिसे हम यहां पर लॉस कहते हैं लॉस को हम क्या करना पड़ता है गाइज यहां पर मिनिमम करना पड़ता है अब इस लॉस को मिनिमम करने के लिए हम जो टेक्निक इस्तेमाल करते हैं दैट इज कॉल ऑफ यहां पर ग्रेडिएंट डिसेंट यस हम क्या करते हैं यहां पर ग्रेडिएंट डिसेंट टेक्निक का इस्तेमाल करते हैं जिसके थ्रू हम क्या करते हैं लॉस को मिनिमम करते हैं और लॉस को मिनिमम करने के बाद में ये जो वेटेज की वैल्यू दिख रहे हैं यहां पर ये जो w1 w2 w3 या w4 जो वेटेज की वैल्यू दिख रहे हैं और जो बायस की वैल्यू दिख रहे हैं यहां पर इनको हम एडजस्टमेंट करते हैं तो मतलब पॉइंट ऑफ यहां पे बात करू चाहूं यहां पर तो क्या है यहां पर कि देखिए आप जब यहां पर स्टार्टिंग के अंदर वेट ले रहे हैं यहां पर उन वेटेज और बायस की वैल्यू की वजह से आपके पास आपका डिजायर आउटपुट कभी नहीं आता है यस आप जो डिजायर आउटपुट चाहते हैं वो आपको कभी नहीं देखने को मिलता है तो यदि आप अपना डिजायर आउटपुट चाहते हैं आप अपना चाहते हैं कि भाई आपको जो है लॉस कम मिले आपके पास यहां पे एक्यूरेसी बहुत ज्यादा हाई हो तो आपको क्या करना पड़ता है वेटेज और बायस की वैल्यू को अपडेट करना पड़ता है और इस वेटेज और बायस की वैल्यू को अपडेट करने के जो प्रोसीजर को हम क्या बोलते हैं गाइज यहां पर बैक प्रोपो केशन बोलते हैं तो बैक प्रोपो कोई बड़ी टेक्निक नहीं है बैड प्रपोजिशन क्या है यहां पर कि आपका जब न्यूरल नेटवर्क ट्रेंड हो जाता है उस समय जो आप वेटेज की वैल्यू आप पहले लाइज करके रखते हैं वो आपके पास एक्यूरेट नहीं होती है काफी केसेस में हो सकती है काफी केसेस में नहीं होती है तो जब वो नहीं होती है तो हमें क्या करना पड़ता है हमें हमारे आउटपुट के हमारे डिजायर आउटपुट के अकॉर्डिंग हमें क्या करना पड़ता है वेटेज ऑफ वायस की वैल्यू को अपडेट करना पड़ता है इस अपडेट करने की जो प्रोसेसर इस अपडेशन प्रोसेसर को हम क्या बोलते हैं गाइ यहां पर बैकवर्ड प्रोपेगेशन बोलते हैं अब ये बैक प्रोपो केशन क्या होता है यहां पर तो बैक प्रोपो केशन क्या है एक आपका प्रोसेसर है यस बैक प्रोपो केशन क्या है यहां पर एक आपका प्रोसेसर है जिसके थ्रू आप क्या करते हैं आपके न्यूरल नेटवर्क को अच्छे से ट्रेन करते हैं जिसके थ्रू आपके पास यहां पर बेयस बायस और आपके जो वेटेज की जो वैल्यू है यहां पर वो आप क्या करते हैं अपडेट करते हैं और बेस्ट लाने की कोशिश करते हैं अब ये बेस्ट लाने का प्रोसीजर क्या है क्या स्टेप्स हमें फॉलो करने पड़ेंगे उसको जरा थोड़ा डिटेल के साथ देखते हैं देखिए अभी मैं बात करना चाहूं यहां पर तो सबसे पहले आपने क्या किया आपने अपने वेटेज को इनिश लाइज कर दिया यहां पर स्टार्टिंग के अंदर फिर आपको क्या करना है आपको वाहेड की वैल्यू निकालनी है अब आपने क्या किया वेटेज की वैल्यू इनिश इइ की जैसे क्या करा हमने यहां पर हमारा जो न्यूरल नेटवर्क है यस ये हमारा न्यूरल नेटवर्क है इस न्यूरल नेटवर्क के अंदर आपने क्या किया अपने अपने वेटेज यहां पे दिए जैसे मैंने यहां पर क्या किया मेरे न्यूरल नेटवर्क लिया यहां पर अब इसके अंदर x1 आपका इनपुट हो गया x2 आपका इनपुट हो गया x3 आपका इनपुट हो गया और x4 आपका इनपुट हो गया इसके अंदर आपने क्या किया वेटेज की वैल्यू को अपडेट किया वेट वन वेट टू वेट थ्री और वेट फोर ये आपने स्लाइस किया इनिश इइ करने के बाद में आपने इसको समेशन किया समेशन किसके साथ किया गाइज यहां पर बा के साथ समेशन किया और उसके साथ आपने क्या किया y आउटपुट आपने निकाला अब यह क्या किया आपने एक्टिवेशन फंक्शन से होते हुए आपने क्या किया y आउटपुट आपने यहां पर निकाला अब गाइज यहां पे बात करें तो आपने इनिश इज़ कुछ किया होगा यहां पर जैसे w1 की वैल्यू आपने वन रखी होगी w2 की वैल्यू आपने वन रखी होगी w3 की वैल्यू आपने वन रखी होगी w4 की वैल्यू भी आपने वन रखी होगी और बा इस की वैल्यू आपने ज़ीरो रख दी होगी राइट इस तरह से आपने क्या किया सबको इनिश इज़ किया इनिश इइ करने के बाद में अब आपका स्टेप आता है कि आपने y हैट निकाला अब लेट्स सपोज आपका जो वा हेट है गाइ यहां पर वो आपके पास कुछ इस तरह से निकल के आया 2 3 4 5 एंड 6 अब यदि मैं y ओरिजिनल की बात करूं मतलब y हमारे पास जो ओरिजिनल डाटा है उससे यदि मैं कंपेयर करके चलूं यहां पर तो वो कंपैरिजन आपके पास इस तरह से आ रहा है वन 2 3 4 और फ अब देखिए यहां पर y हैट और y के बीच में आपके पास क्या आ रही है यहां पर आपका डिफरेंस आ रहा है अब इस डिफरेंस को देखने के लिए हम क्या यूज करते हैं लॉस को इस्तेमाल करते हैं राइट तो गाइज यहां पर बात करें तो आपके पास लॉस क्या होगा गाइज यहां पर लॉस आपके पास होगा यहां पर कि आपके पास जो वा ओरिजिनल है यस जो आपका वा ओरिजिनल है आपके पास यहां पर उसमें से आपको सबट करना है यहां पर किसे आपके पास वा पीआरडी को जिसे हम वाई हैड भी बोलते हैं राइट हमें क्या करना है गाइज यहां पर लॉस को सबट करना है इसी चीज के लिए हमने क्या कर रहे थे लॉस के फंक्शन को डिस्कस किया था हमने लॉस के फंक्शन को डिस्कस किया था लास्ट वाले वीडियो के अंदर जहां पे हमने डिफरेंट डिफरेंट टाइप के लॉस के फंक्शंस को देखे थे तो ये लॉस के फंक्शन करते क्या है ये लॉस के फंक्शन क्या करते है गाइज यहां पर आपके पास जो वेटेज ऑफ आय की वैल्यूज है यहां पर इन्हें अपडेट करने में आपकी हेल्प करते हैं इन्हें क्या करते हैं गाइस यहां पर इन्हें अपडेट करने में आपकी क्या करते हैं हेल्प करते हैं ये क्या करते हैं कि आपके पास यहां पर पहले लॉस को निकालते हैं अब हमारा डिजड आउटपुट क्या है हमें लॉस कम मिले हमें एक्यूरेसी अच्छी मिले जिसकी वजह से वेटेज ऑफ वायस की वैल्यू क्या हो यहां पर और अच्छी से हमें यहां पर मिल राइट तो बेसिकली हमें क्या मिला यहां पर लॉस मिला और लॉस क्या है यहां पर y ओरिजिनल माइनस y पीआरडी अब अकॉर्डिंग टू आपके पास डिजायर आउटपुट यदि आप रिग्रेशन एनालिसिस कर रहे हैं तो इसके अंदर आप क्या करते हैं यहां पर मीन स्क्वा स् एरर लॉस के ऊप बात कर रहे हैं मीन एब्सलूट लॉस के बारे में बात करते हैं और आपके पास आरएमएस लॉस के बारे में बात करते हैं यदि आपके पास बात करें इसके अलावा हिंज लॉस के ऊपर भी बात करते हैं यहां पे गाइज यदि आप बात करें क्लासिफिकेशन के अंदर तो क्लासिफिकेशन के अंदर भी हमारे पास बहुत सारे लॉस होते हैं जैसे लॉग लॉस होता है आपके पास यहां पर राइट तो ऐसे आपके पास डिफरेंट डिफरेंट टाइप के क्या होते हैं गाइज यहां पर लॉसेस होते हैं इन लॉसेस की वैल्यू को हम क्या करते हैं फाइंड आउट करते हैं इस लॉसे इस लॉसेस की वैल्यू को हम क्या करते हैं निकालते हैं यहां पर बेसिकली लॉस फंक्शन के थ्रू अब हमारे पास लॉस आ जाता है तो उसके थ्रू हम कैसे वेटेज की वैल्यू को अपडेट करते हैं यूजिंग अ बैक प्रोपेगेशन अब ये बैक प्रोपेगेशन कैसे लगता है यहां पर जरा समझते हैं यहां पर तो ये जो बैक प्रोपेगेशन है गाइ यहां पर ये क्या इस्तेमाल करता है ये इस्तेमाल करता है गाइस यहां पर ग्रेडियंट आपके पास डिसेंट का यस ग्रेडिएंट डिसेंट जो टेक्निक है यहां पर जिसके थ्रू आप क्या करते हैं पीछे जाते हैं पीछे जाने का मतलब क्या है गाइस यहां पर आप यहां पर पीछे जाएंगे जिसे हम बैकवर्ड बोलेंगे पीछे जाने के तरीके को हम क्या बोलते हैं बैकवर्ड बोलते हैं और पीछे जाके ये जो वेटेज आप देख रहे हैं ये जो बायस आप देख रहे हैं इनकी वैल्यू को अपडेट करते हैं कैसे करते हैं अब जरा समझते हैं यहां पर देखिए तो गाइ यहां पे बात करें तो ये फॉर्मूला क्या होगा तो दिस यूज ऑफ ग्रेडिएंट डिसेंट फॉर्मूला और ये ग्रेडिएंट डिसेंट फॉर्मूला कैसे काम करता है तो देखिए आपके पास जो w है यदि आपको इसकी नई वैल्यू निकालनी है तो इसके लिए आपको क्या करना पड़ेगा कि जो w की ओल्ड वैल्यू मतलब जो पुरानी वैल्यू है इसमें से आपको सबस्टैक करना पड़ेगा कि किससे सबस्टैक करना है लैडा अब ये लैडा क्या है गाइज यहां पर इट्स कॉल ऑफ लर्निंग रेट इट्स कॉल्ड ऑफ आपके पास क्या आता है गाइ यहां पर लर्निंग रेट कहलाता है तो आपको लर्निंग रेट से सबस्टैक करना है और उसके बाद में आपको लगाना है dl8 करना है किससे विद रिस्पेक्ट ऑफ w से यस विद रिस्पेक्ट ऑफ w से करना है अब बात करते हैं कि लॉस की वैल्यू क्या रही होगी तो यदि मैं लॉस फंक्शन की बात करूं अब यहां पे लॉस अकेला काम तो नहीं करेगा हमें बात करनी पड़ेगी किसके बारे में कॉस्ट के बारे में क्योंकि हमें एंटायस मैं ये कांसेप्ट मान के चलू कि ये रिग्रेशन एनालिसिस है यस हमारा यहां पे क्या है रिग्रेशन एनालिसिस है यहां पर रिग्रेशन के ऊपर हम बात कर रहे हैं बेसिकली तो इसके ऊपर जो लॉस मैं यहां पे लगा रहा हूं दैट अ मीन स्क्वायर लॉस यस यहां पे जो हम लॉस के ऊपर बात कर रहे हैं कौन सा है मीन स्क्वायर लॉस है तो यदि मैं मीन स्क्वायर लॉस के बारे में बात करूं तो वो लॉस का फॉर्मूला क्या होगा गाइज यहां पर 1 अप n समेशन ऑफ y माइनस आपके कहेगा y हैड का होल स्क्वा राइट ये होने वाला है अब यदि मैं y हेड की वैल्यू को यदि मैं वापस अपडेट करूं तो वो क्या होगा गाइज यहां पर तो ये होगा w1 x1 माइनस ऑफ w2 x2 अभी मैं दो ही इनपुट ले रहा हूं यहां पर और माइनस ऑफ बायस का होल स्क्वायर बन जाएगा दैट इज़ अवर लॉस फंक्शन अब हमें क्या रखना है dl1 पर विद रिस्पेक्ट ऑफ़ w अब w कौन सा है w1 है या w2 तो फ़िलहाल के लिए मैं w1 की बात कर रहा हूं यहां पर यस यह फंक्शन किसके लिए निकाला है w1 के लिए निकाला है तो मैं w1 लूंगा यहां पर ओके उसके बाद में यह w1 का फॉर्मूला क्या बनेगा तो 1 / n बन जाएगा यहां पर समेशन ऑफ़ यहां पे बनेगा y - w1 x1 - ऑफ यहां पे w2 x2 फिर - ऑफ y का होल स्क्वा फिर आपके पास क्या होगा - ऑफ x1 ये आपका dl1 w बन जाएगा अब ये लर्निंग रेट क्या है यस ये लर्निंग रेट क्या है तो इसको समझने के लिए पहले हमें लॉस फंक्शन के बारे में देखना पड़ेगा कि ये लॉस फंक्शन कैसा दिखाई देता है तो यदि मैं लॉस फंक्शन का कर्वेचर बनाऊं तो यदि मैं लॉस फंक्शन का कर्वेचर बनाऊं विद रिस्पेक्ट ऑफ किसके x के य विद रिस्पेक्ट ऑफ़ किसके x के तो मैं x1 के करेस्पॉन्डिंग्ली ग्राफ बनाऊं तो ये जो लॉस का ग्राफ बनेगा गाइज यहां पर वो कुछ इस तरह से बनेगा यस ये जो लॉस का ग्राफ बनेगा वो कुछ इस तरह से बनेगा अब इसमें क्या हुआ हमने क्या किया हमारी इनिला इज कुछ डब् रखा था इलाइनर क्या रखा था कुछ डब्लू रखा था तो जो इनिश इइ जशन में डबल रखा था वो क्या था हमारे पास यहां पे क रहा होगा हो सकता है यहां पे भी रहा होगा राइट हमें कहीं पे भी रहा होगा अब हमें क्या करना है गाइज यहां पर हमें w1 की वैल्यू यस मैंने गलती से लिख दिया यहां पर x1 हमें w1 निकालना है ओके तो हमें क्या करना है w1 की वैल्यू निकालनी है कब जब हमारा लॉस मिनिमम हो कब निकालना हमारे पास यहां पर लॉस मिनिमम क्यों जब हमारे पास लॉस मिनिमम होगा तो जो w1 की वैल्यू मिलेगी वो बहुत ही ज्यादा क्या मिलेगी गाइ यहां पर एक्यूरेट मिलेगी उससे हमें क्या मिलेगा बेटर प्रोडक्शन मिलेगा तो हमें क्या करना है हमें हमारे लॉस को क्या करना है मिनिमम करना है लॉस को क्या करना है मिनिमम करना है अच्छा लॉस को मिनिमम करना है तो इस कर्वेचर के अंदर लॉस मिनिमम की वैल्यू की बात करूं तो वो कहां मिलेगी तो लॉस मिनिमम की वैल्यू हमें यहां पर देखने को मिलेगी और इसके करेस्पॉन्डिंग्ली तो हम यहां पर बैठे हैं हमें यहां पे जाना है तो यहां से यहां आने के लिए हमें किसका इस्तेमाल करना पड़ेगा इस ग्रेडियंट फॉर्मूले का इस्तेमाल करना पड़ेगा क्या करना पड़ेगा इस ग्रेडन फॉर्मूले का इस्तेमाल करना पड़ेगा जिसके थ्रू हम इस पॉइंट से इस पॉइंट के अंदर पहुंच पाएंगे अदर वाइज यहां तक नहीं पहुंच सकते राइट तो अब हमें क्या करना है इस पॉइंट से इस पॉइंट तक पहुंचना है तो इस पॉइंट से इस पॉइंट तक पहुंचने के चलने के तरीके होते हैं मतलब हमें कैसे चलना है इसके लिए हम क्या करते हैं मेथड को स्टा स्टार्ट करते हैं तो गाइ ये जो चलने का तरीका है पहला तरीका का तरीका क्या है गाइज यहां पर कि मैं इस तरह से चल जाऊं या तो फिर या तो मैं इस तरह से चल जाऊं इसमें एक प्रॉब्लम है क्या प्रॉब्लम है इसमें कि यदि मैं इस तरह से चल जाऊं तो कभी भी मैं अपने मिनिमम पॉइंट्स को कभी भी अचीव नहीं कर पाऊंगा रीजन क्यों क्योंकि देखिए जब मैं अगला स्टेप यहां पे चलना होंगा तब मैं यहां से यहां यहां से यहां करते हुए बाहर चला जाऊंगा तो बेसिकली इसमें एक बहुत बड़ी प्रॉब्लम है कि हम कभी भी हमारे मिनिमम पॉइंट को कभी भी अचीव नहीं कर पाएंगे तो अब यहां पे अल्टरनेटिव ऑप्शंस क्या है अल्टरनेटिव ऑप्शंस है कि हम यहां पे क्या करें हमारे जो स्टेप्स हैं उन्हें छोटे-छोटे से स्टार्ट करें यस हमारे जो स्टेप्स है उन्हें क्या करें हम यहां पर छोटे-छोटे छोटे छोटे स्टेप्स से स्टार्ट करें और फिर हमारे जो मिनिमम पॉइंट है वहां पर पहुंच जाए अब ये जो छोटे-छोटे चलने का तरीका होता है जो छोटे-छोटे चलने का तरीका को बनाता है यहां पर वो कौन बनाता है हमारा ये लर्निंग रेट बनाता है तो लर्निंग रेट के कांसेप्ट के ऊपर बात करें तो लर्निंग रेट क्या करता है गाइस यहां पर हमें हमारे चलने के तरीके को बताता है कि हमें किस तरीके से चलना है अब हमने क्या निकाला हमारा लॉस निकाला लॉस निकालने के बाद में हमने उसको डिफरेंशिएबल डिफरेंशिएबल ली w की जैसे पुरानी वाली वैल्यू क्या थी वन थी 1 माइनस अब ये लर्निंग रेट कितनी होनी चाहिए तो लर्निंग रेट डिपेंड करती है आप क्या लेना चाहते हैं आप अपने स्टेप को छोटा करना चाहते हैं तो इसकी वैल्यू 0.001 भी ले सकते हैं आप एवरेज रखना चाहते हैं तो 0.01 ले सकते हैं तो लर्निंग रेट जो होती है गाइज यहां पर वो क्या होती है यहां पर 0.1 से लगाकर आप 0.001 से भी आप ले सकते हैं यहां पर राइट ये अपने अकॉर्डिंग यहां पर अपने हिसाब से लर्निंग रेट डिसाइड कर सकते हैं उसके बाद आपको करना है लॉस का डिफरेंस ट करना है यस लॉस का जैसे डिफरेंशिएबल की न्यू वैल्यू मिल जाएगी और इस न्यू वैल्यू को लेके आप काम कर सकते हैं राइट तो ये आपका मेथड हुआ जहां पे आपने क्या किया सिंगल लेयर यस अभी हमने बात की है किसके बारे में सिंगल लेयर पसटन के ऊपर बात की है सिंगल लेयर प्र सेप्टन के ऊपर ही हमने काम किया है राइट यदि हमारा मल्टीलेयर प्र सेप्टन बन जाए तो वहां पे हमारा डल कैसे अपडेट होगा किस तरह से डब्लू काम करेगा उसको जरा समझते हैं तो देखिए ये फॉर्मूला आपका एज इट इज रहेगा फॉर्मूले के अंदर कोई चेंजेज नहीं होगा यहां पर मल्टीलेयर परसेप्ट्रॉन के अंदर आपके पास कुछ कहानी आपकी चेंज हो जाएगी कैसे चेंज होगी जरा यहां पर देखें तो जरा इसको समझते हैं कि मल्टी लाइप प्रस अप्टन में क्या होगा यहां पर किस तरह से आपके पास वेटेज की वैल्यू अपडेट होगी कब हम यहां पर एक्चुअल प्रोसेस में पहुंच पाएंगे ये बलैक प्रपोजिशन कैसे काम करता है वो देखेंगे अब यहां पर तो चलिए जरा अब यहां पर समझते हैं कि किस तरह से काम होता है तो फिलहाल मैं यहां पर ज्यादा मॉडल को कॉम्प्लिकेट नहीं करूंगा मैं दो इनपुट के ऊपर ही काम करूंगा ताकि आप अच्छे से समझ पाए किस तरह से काम होता है तो मैंने यहां पे क्या किया दो इनपुट लिए हैं और दो इनपुट के ऊपर दो मैंने हिडन लेयर यहां पे डिसाइड की है और एक आउटपुट मैंने डिसाइड किया है दैट इज़ अ मल्टी लेयर प्लस अपटन जिसे आप आर्टिफिशियल न्यूल नेटवर्क भी बोलते हैं राइट अब क्या होगा ये आपका इससे कनेक्टेड होगा एंड देन ये इससे कनेक्टेड होगा ये इससे कनेक्ट हो जाएगा ये इससे कनेक्टेड हो जाएगा और ये दोनों आपके पास इससे कनेक्ट हो जाएंगे और यहां से आपका y आउटपुट मिल जाएगा मतलब y प्रोडक्शन मिल जाएगा अब देखिए क्या होगा गाइज यहां पर x1 आपका यहां पे कनेक्टेड होगा एंड यहां पे मैं बात करूं तो आपका x2 यहां पे कनेक्ट हो जाएगा अब देखिए इसको मैं मान लेता हूं w1 मान लेता हूं इसको मैं w2 मान लेता हूं इसको मैं w3 मान लेता हूं एंड इसको मैं w4 मान लेता हूं अब जब ये आपस में जाएंगे तो यहां पे आपको क्या मिलेगा य यहां पे आपको आउटपुट मिलेगा और ये आउटपुट क्या मिलेगा गाइज यहां पर आउटपुट वन एंड देन आउटपुट टू यस ये आपको मिलेगा और ये क्या करेगा गाइ यहां पर w5 एंड w6 से कनेक्टेड होते हुए y आउटपुट निकालेंगे अब हमें क्या करना है बैकवर्ड प्रोपो केशन करना है तो जस्ट सपोज w5 को अपेट करने गया तो w5 को अपडेट कैसे करेंगे यहां पर तो w5 जो होगा यहां पर न्यू यस w5 जो न्यू होगा गाइज यहां पर वो क्या होगा कि w5 जो हमारा ओल्ड होगा उसमें से सबट क्ट करेंगे किसे गाइज यहां पर सबस्टैक करना है पहले तो हमें लर्निंग रेट से मल्टीप्लाई करना है उसके बाद dl5 करना है राइट अब यहां पे लॉस का फंक्शन की इक्वेशन क्या बनेगी यस ये जो लॉस के फंक्शन की इक्वेशन है यहां पर वो क्या बनने वाली है जरा अब उसके ऊपर डिस्कस करते हैं तो देखिए हमारे पास l की वैल्यू क्या बनने वाली है यहां पे गाइ उसकी बात करें यहां पर तो देखिए ये जो लॉस की फंक्शन है यहां पर ठीक है वो क्या बनेगा गाइज यहां पर तो ये 1 / n बनेगा यहां पर समेशन ऑफ आएगा यहां पर आपके पास क्या आएगा सबसे पहले ये y आएगा यस y ओरिजिनल आएगा अब y हैड की बारी है अब इस y हैड के बारे में बात करें यहां पर तो ये y हैड क्या बनेगा गाइज यहां पर ये वाई हेड बनेगा आपके पास यहां पर य इस वाई हेड के बारे में बात करें तो ये क्या बनेगा आपके पास एक एक्टिवेशन फंक्शन आएगा उसके बाद में एक्टिवेशन फंक्शन कब काम आता है बाहर आउटपुट के लिए काम आता है तो फिलहाल के लिए अभी यहां पे एक्टिवेशन फंक्शन हम हटा रहा हूं यहां पर अब देखिए इसका इनपुट क्या है गाइज यहां पर o1 इसका इनपुट है और ये किसके साथ मल्टीप्लाई हो रहा है w5 के साथ ठीक है किसके साथ मल्टीप्लाई हो रहा है w5 के साथ प्लस यहां पे क्या है गाइज यहां पर o2 इसका मल्टीप्लिकेशन है यहां पर और ये किसके साथ कनेक्ट हो रहा है w6 के साथ कनेक्ट हो रहा है अब देखिए o1 आउटपुट क्या है अब के डिजर इनपुट ही है यहां पर लेकिन ये किससे आए हैं यहां पर ये आए हैं आपके x1 x2 से तो अब मुझे o1 और o2 की वैल्यू निकालनी पड़ेगी तो यदि मैं y हेड की बात करूं यस किसकी बात करूं y हेड की बात करूं तो y हेड की इक्वेशन क्या हो जाएगी तो देखिए ये जो o1 है इस o1 की इक्वेशन क्या होगी गाइज यहां पर o1 की इक्वेशन होगी w x1 * w1 ठीक है उसके बाद में क्या होगा गाइज यहां पर आपके पास देखिए x2 * w2 यस क्या होगा यहां पर प्लस आपके पास x2 * w2 प्लस यहां पर प्लस यहां पर इसके अंदर भी क्या आएगा गाइज यहां पर बास आएगा यस इसके अंदर क्या आएगा बा आएगा बा b1 कर देता हूं यहां पर इसका बायस मैं b1 कर देता हूं अच्छा इसके अंदर बा नहीं लगाया यहां पर b1 b2 एंड b3 कर देते हैं राइट तो b3 आ गया ये किसका आया गाइज यहां पर ये o1 की वैल्यू आई है इस o1 की वैल्यू को हमें मल्टीप्लाई करना पड़ेगा किससे w5 से मल्टीप्लाई करना पड़ेगा प्लस उसके बाद में अब बारी है किसकी गाइज यहां पर o2 की o2 की बात करें यहां पर तो o2 के लिए क्या केसेस आएगा गाइज यहां पर o2 के लिए यदि मैं बात करूं तो आपके पास क्या आएगा आपका x1 आएगा x1 किस से मल्टीप्लाई होगा गाइज यहां पर w3 से मल्टीप्लाई होगा देखिए ये रहा w3 लिखा यहां पर तो ये देखिए x1 * क्या आएगा w3 प्लस यहां पे आपके पास क्या आएगा x2 * w4 आ जाएगा यहां पर प्लस आपके पास बायस टू ऐड हो जाएगा यहां पर अब इसके साथ क्या मल्टीप्लाई होगा यहां पर w6 हो जाएगा और प्लस आपका जनरल जो बायस है वो आपके पास आएगा तो आपने o1 o2 और बायस तीनों की वैल्यू निकाल ली है यहां पर अब आपके पास ये आपके पास क्या आई y प्रोडक्शन की वैल्यू आई है ये y प्रोडक्शन की वैल्यू यहां रखनी है ये y प्रोडक्शन की वैल्यू क्या रखनी है यहां रखनी है तो ये आपका लॉस का फंक्शन बन जाएगा अब हमें क्या करना है गाइज यहां पर इसे पूरा ओपन करना है और w5 यस w5 को अपडेट करना है तो w5 के करेस्पॉन्डिंग्ली को क्या करेंगे अपडेट करेंगे जैसे-जैसे हम इसे अपडेट करेंगे तो उससे हमारे पास क्या होगा हमारा जो फाइनल आउटपुट है वो हमें यहां पर देखने को मिल जाएगा और हमारे पास जो लॉस है वो मिनिमम हो जाएगा और हमें क्या मिलेगी यहां पर गाइज यहां पर हमें हमारे जो डब्लू और बायस की जो ऑप्टिमम सॉल्यूशन है यहां पर वो हमें देखने को मिल जाएगी इस प्रोसीजर को हम बैकवर्ड प्रोपेगेशन बोलते हैं बैकवर्ड प्रोपेगेशन के अंदर हम क्या कर रहे हैं गाइज यहां पर पीछे जाके यस बैक जाके हम क्या कर रहे हैं कि ये जो डबल और वेटेज की जो वैल्यू है यहां पर इन्हें यहां पर क्या कर रहे हैं अपडेट कर रहे हैं तो दैट इज कॉल ऑफ यहां पर बैकवर्ड प्रोपेगेशन और इसके लिए हम क्या करते हैं गाइज यहां पर हम इस प्रोसेसर के लिए हम हम क्या यूज़ कर रहे हैं हम यूज कर रहे हैं यहां पर ग्रेडिएंट डिसेंट को यस किसे यूज कर रहे हैं यहां पर ग्रेडिएंट डिसेंट को यूज़ कर रहे हैं ग्रेडिएंट डिसेंट की हेल्प से हम क्या करते हैं हमारे जो आपके पास जो वेटेज है वाय की वैल्यू को क्या करते हैं अपडेट करते हैं तो गाइज ये पूरा प्रोसेसर रता है इधर अ मैथमेटिकल प्रोसेस जिसके थ्रू हम वेटेज और वाय की वैल्यू को अपडेट करते हैं और आज के इस वीडियो के जरिए हम बात करेंगे एक्टिवेशन फंक्शन के बारे में तो चलिए जानते हैं एक्टिवेशन फंक्शन क्या होता है और इसे कहां यूज किया जाता है और कितने तरीके क्या होता है यहां पर देखिए जब हमने यहां पर सिंगल लेयर परसेप्ट को समझा था तो सिंगल लेयर परसेप्ट के अंदर हमने क्या देखा था कि सबसे पहले हमारे पास जो भी हमारा इनपुट डटा होता है मतलब जो भी हमारा डेटा सेट होता है उस डटा के अंदर जो भी हमारे इनपुट फीचर्स होते हैं यहां पर वो सारे इनपुट्स क्या होते हैं वेटेज के साथ आपके पास क्या होता है मल्टीप्लाई हो जाते हैं और उसके बाद आपके पास क्या होता है बायस के साथ जाके क्या होता है सबमिशन हो जाते है अब ये जो बायस के साथ सबमिशन होने के बाद में जो आपका आउटपुट है वो आगे जाता है यहां पर तो आगे जाते वक्त हमारे पास डिपेंडेंसी रहती है कि हमारा जो आउटपुट निकलने वाला है वो आपके पास क्या है बाइनरी है या या फिर लीनियर है यस या फिर बाइनरी या फिर मैं बोल सकता हूं यहां पर रिग्रेशन है यस रिग्रेशन मतलब आपके पास कंटीन्यूअस है यहां पर तो उसके ऊपर डिपेंड करता है कि आपके पास आउटपुट क्या है अब देखिए यहां तक जो आपका आउटपुट निकल के आता है ये आपके पास क्या होता है एक नंबर होता है जो कि रेंज होती है और ये रेंज आपके पास क्या होती है यहां पर माइनस इनफिनिटी टू इनफिनिटी के बीच में होती है राइट अब आपके पास कुछ भी नंबर हो सकता है अब आपके पास जो आपका डिजायर आउटपुट है वो बाइनरी आपके पास है तब आपको क्या करना पड़ता है कि ये जो भी रिजल्ट है उस रिजल्ट को एक फंक्शन से पास कराना पड़ता है और दैट फंक्शन इज कॉल्ड ऑफ एक्टिवेशन फंक्शन यस आपको एक फंक्शन से पास कराना पड़ता है इस आउटपुट को ताकि आप अपने डिजायर्ड आउटपुट को क्या कर सके गेट कर सके इसके साथ-साथ जब आप यहां पर मल्टी लेयर प्रिसेप्ट के अंदर वर्क करते हैं तो मल्टी लेयर प्रिसेप्टर में क्या होता है कि बहुत सारे सिंगल लेयर जो न्यूरल नेटवर्क होते हैं या सिंगल लेयर जो प्रेसटन होते हैं वो आपस में कनेक्टेड होते हैं तो वो क्या करते हैं अपना जो आउटपुट है वो अगले न्यूरल नेटवर्क को देते हैं अगला न्यूरल नेटवर्क उसके अगले न्यूल नेटवक को देता है अपना आउटपुट तो बेसिकली ये जो आउटपुट है वो आगे से आगे क्या होता है आपका ट्रांसफर होता है तो इस ट्रांसफर के दौरान आपके पास क्या करना पड़ता है आपके जो आउटपुट है इस आउटपुट को एक रेंज के अंदर कन्वर्ट करना होता है या फिर इस आउटपुट को एक आपके पास क्या करना पड़ता है आपका चेंजेज करना होता है राइट तो उसके लिए आप क्या करते हैं एक्टिवेशन फंक्शन का इस्तेमाल करते हैं जैसे आपका जो आउटपुट है वो माइनस इनफिनिटी टू इनफिनिटी के बीच में आ गया लेकिन अब आप चाहते हैं कि आपका जो आउटपुट है वो बाइनरी में आए या तो जीरो आए या फिर वन आए तो फिर उसके लिए आपको क्या करना पड़ेगा उसके लिए फिर आपको एक्टिवेशन फंक्शन को चूज करना पड़ेगा एक्टिवेशन फंक्शन के थ्रू आप यहां पे क्या कर सकते हैं उसको आउटपुट को चेंजेज कर सकते हैं तो बेसिकली आपके पास यहां पर न्यूरल नेटवर्क के अंदर एक्टिवेशन फंक्शन बहुत ही ज्यादा जरूरी है अब हम बात करते हैं कि एक्टिवेशन फंक्शन जो होता है वो कितने तरीके होता है तो बेसिकली एक्टिवेशन फंक्शन के अंदर बात करें तो आपके पास बाइनरी होता है लीनियर होता है आपके पास यहां पर और नॉन लीनियर आपके पास फंक्शन होता है ये तीन तरह के एक्टिवेशन फंक्शन होते हैं देखिए जनरली जो हम जो एक्टिवेशन फंक्शन जो इस्तेमाल करते हैं वो हमारे सारे के सारे कैसे होने चाहिए नॉन लीनियर होनी चाहिए क्योंकि जब हम रियल वर्ल्ड डाटा के ऊपर काम करते हैं तो उसके अंदर हमें बहुत रेयर चांसेस होते हैं कि हमारा जो डेटा सेट है वो लीनियर की को फॉलो करें तो जब हमारा डटा लीनियर को फॉलो नहीं कर रहा होता है तो उस वक्त हमें यहां पर नॉन लीनियर आपके पास एक्टिवेशन फंक्शन की जरूरत पड़ती है तो बस हमें इनकी ही सबसे ज्यादा जरूरत पड़ती है तो इनके बारे में आज हम थोड़ा और डिटेल के साथ जानेंगे चलिए अभी हम जानते हैं कि एक्टिवेशन फंक्शन कैसे काम करते हैं और इनके मैथमेटिकल फॉर्मूले क्या है यहां पर जरा इनको देखते हैं देखिए सबसे पहले मैं बात करूं यहां पर बाइनरी स्टेप फंक्शन के बारे में तो बाइनरी स्टेप फंक्शन आपका बहुत ही सिंपल एक्टिवेशन फंक्शन होता है ये एक्टिवेशन फंक्शन कैसे काम करता है कि जो भी आपका y हेट आ रहा है यहां पर y हेट कैसे आ रहा है यहां पर आपका x1 w1 प्लस यहां पर x2 आपके पास w2 आ रहा है यहां पर प्लस आपका बा आ रहा है जैसे ये आपके पास आ रहा है तो ये जो y आपके पास आ रहा है इस y को चेक करता है इस y को चेक करके क्या करता है गाइज यहां पर इस y को चेक करके यहां पर लाता है कि ये ग्रेटर दन 0 है या फिर लेस दन ़ है यदि आपके पास यहां पर जो वैल्यू है लेस दन 0 है यहां पर तो उसे रो कर देता है और यदि आपके पास ग्र दन इक्वल टू 0 है यहां पर तो आपके पास क्या करता है वन कर देता है बस इतना ही इसका काम है यहां पर कि आपके पास जो भी आपका आउटपुट आ रहा है यहां पर उस आउटपुट को चेक करता है कि वो आपके पास यहां पर पॉजिटिव है या नेगेटिव है पॉजिटिव है तो आपके पास वन कर देगा और नेगेटिव है तो उस जगह पे क्या कर देता है गाइज यहां पर जीरो कर देता है उसे यहां पर तो इस तरह से आपके पास क्या काम करता है ये बाइनरी स्टेप फंक्शन आपके पास यहां पे वर्क करता है बाइनरी स्टेप फंक्शन का यदि आप ग्राफ देखेंगे तो वो कुछ इस तरीके से आपको नजर आता है चलिए अब हम बात करते हैं यहां पर लीनियर एक्टिवेशन फंक्शन के बारे में देखिए लीनियर एक्टिवेशन फंक्शन कब आपको इस्तेमाल करना चाहिए यस जब आपका जो आउटपुट है वो रिग्रेशन हो तो रिग्रेशन के अंदर आपके पास क्या होता है कि आपका जो भी आउटपुट है वो आउटपुट के तौर पे आपको वापस दिखाना होता है यहां पर तो उस वक्त आपके आउटपुट के अंदर कोई भी चेंजेज नहीं करना होता है अब जब आपके पास आउटपुट के अंदर कोई भी चेंजेज नहीं करना होता है तो उस वक्त आपको कौन से एक्टिवेशन फंक्शन की जरूरत पड़ेगी तो वहां पे आप लीनियर एक्टिवेशन फंक्शन को फॉलो कर सकते हैं लीनियर एक्टिवेशन फंक्शन कैसा होता है गाइज यहां पर वो फंक्शन होता है y = आपके पास x होता है मतलब आप x के अंदर जो भी वैल्यू रखेंगे y आपको दोबारा वही वैल्यू रिटर्न कर देगा मतलब y की वैल्यू के अंदर कोई चेंजेज आपको नहीं देखने को मिलेगा तो बेसिकली गाइज लीनियर एक्टिवेशन फंक्शन की अर बात करें यहां पर तो ये कब काम आता है जब आपके जो आउटपुट है डिजर आउटपुट है वो लीनियर आपको रखना हो तब आप क्या करें हैं इसका इस्तेमाल कर सकते हैं लेकिन जब हम आपके रियल वर्ल्ड डाटा के ऊपर काम करते हैं तो रियल वर्ल्ड डाटा के अंदर क्या होता है गाइज यहां पर कि जो आपके पास यहां पे इनपुट्स लेयर होते हैं इस इनपुट्स लेयर के बाद में आपके पास जो हिडन लेयर होती है वो हिडन लेयर जाके आपके पास और हिडन लेयर से कनेक्टेड होती है एंड देन आपके पास क्या होती है आउटपुट्स के साथ कनेक्टेड होता है तो इस वक्त जब आपके पास इंटरनली जब आपके पास यहां पे वर्किंग चल रहा होता है इसके साथ-साथ जब आप यहां पे बाहर अपने आउट पुट के ऊपर जा रहे होते हैं तब आपका जो डाटा होता है वो नॉन लीनियर हो सकता है इसके साथ-साथ क्लासिफिकेशन इन नेचर का हो सकता है तो देन उस वक्त हम यहां पर कौन से एक्टिवेशन फंक्शन का इस्तेमाल करेंगे तो वहां पे हम जो एक्टिवेशन फंक्शन इस्तेमाल करते हैं वो होता है हमारा नॉन लीनियर एक्टिवेशन फंक्शन जो कि बहुत ही ज्यादा इंपॉर्टेंट होता है यहां पर अब इस नॉन लीनियर एक्टिवेशन फंक्शन के अंदर कौन-कौन से एक्टिवेशन फंक्शन आते हैं तो उसके अंदर हमारे पास जो पहला आता है दैट इज अ सिगमॉड एक्टिवेशन फंक्शन जो कि लॉजिस्टिक एक्टिवेशन फंक्शन भी कहलाता है यहां पर उसके बाद आता है आपका t आता है फिर आपका रेलो आता है फिर आपका सॉफ्ट मैक्स फंक्शन आता है तो ये आपके पास क्या है चार तरीके के एक्टिवेशन फंक्शन होते हैं जो कि नॉन लीनियर एक्टिवेशन फंक्शन है नॉन लीनियर जब आपके पास डाटा आता है तो उनके अंदर क्लासिफाई करने के लिए काम में ले जाता है अब ये कब और कौन सा किस वक्त यूज करना चाहिए वो अब जरा थोड़ा डिटेल के साथ देखते हैं तो देखिए सबसे पहले मैं बात करूंगा यहां पर सिग्मो इड फंक्शन के बारे में ये होता है हमारा सिग्मो इड फंक्शन की इक्वेशन यहां पर इस सिगम फंक्शन को आपने पहले भी यूज किया है कब यूज किया है जब आपने लॉजिस्टिक रिग्रेशन पढ़ा होगा तो देखिए गाइज लॉजिस्टिक रिग्रेशन के अंदर हमने क्या देखा गाइज यहां पर कि हमारा जो आउटपुट होता है वो क्या होता है ज़ीरो होता है या वन होता है मतलब हमारा जब भी आउटपुट बाइनरी केसेस के अंदर हमारे पास निकलना आ जाए तब हम क्या करते हैं यहां पर सिग्मो इड फंक्शन को इस्तेमाल करते हैं तो देखिए जब भी आपका जो आउटपुट है डिजायर आउटपुट जो है गाइज यहां पर वो कैसा हो जाए गाइज यहां पर बाइनरी हो जाए यस कैसा हो जाए बाइनरी बाइनरी का मतलब आपका जो आउटपुट है वह रो या वन के अंदर आपको देखने को मिले तो आपको कौन सा एक्टिवेशन फंक्शन इस्तेमाल करना है दैट इज सिगमॉड एक्टिवेशन फंक्शन आपको इस्तेमाल करना है राइट इसका कर्व जो आप देखेंगे तो ये कर्व जो होता है गाइज यहां पर ये आपके पा क्या करता है रो से लेके वन के बीच में ही आपके पास लाई करता है मतलब इसका कर्वेचर आपको रो से लेके वन के बीच में ही देखने को मिलेगा अब इस एक्टिवेशन फंक्शन की आपके पास क्या बेनिफिट है तो देखिए इस एक्टिवेशन फंक्शन के बेनिफिट्स की बात करें तो दैट इज अ डिफरेंशिएबल एक्टिवेशन फंक्शन देखिए हमें एक्टिवेशन फंक्शन ऐसे ढूंढने चाहिए जो कि डिफरेंशिएबल हो यस हमें डिफरेंशिएबल एक्टिवेशन फंक्शन ने चाहिए जिसके थ्रू हम आगे क्या कर सके हम ग्रेडिएंट डिस्टेंस के अंदर यूज़ कर सक यदि हमारे पास नॉन डिफरेंशिएबल एक्टिवेशन फंक्शन होगा तो हम उसे ग्रेडियंट डिसेंट के अंदर यूज नहीं कर पाएंगे और जब हम उसे ग्रेडिएंट डिसेंट के अंदर यूज़ नहीं कर पाते हैं तो हम हमारे जो आपके पास वेटेज है उन वेटेज की वैल्यू को अपडेट नहीं कर पाते हैं तो बेसिकली वेटेज की वैल्यू को अपडेट करने के लिए हमें क्या चाहिए गाइज यहां पर हमें आपके पास डिफरेंशिएबल एक्टिवेशन फंक्शन चाहिए और जो हमारा ये जो सिग्मो इड फंक्शन है ये आपके पास क्या है एक डिफरेंशिएबल एक्टिवेशन फंक्शन है इसे हम क्या कर सकते हैं गाइज यहां पर हम इसका यूज कर सकते हैं कब यूज़ कर सकते हैं गाइज यहां पर गेड एंड डिस्टेंट के अंदर यूज़ कर सकते हैं इसके साथ-साथ जब भी हमारा जो आउटपुट है जो हमारा डिजायर आउटपुट है वो बाइनरी में हो तब भी हम इसका यूज़ कर सकते हैं अब इसके अंदर जो सबसे बड़ी प्रॉब्लम है वो ये है कि ये जो एक्टिवेशन फंक्शन है वो जीरो सेंटर्ड नहीं है अब जीरो सेंटर्ड का मतलब क्या है यहां पर जब आप यहां पर इसकी एरर निकालते हैं तो इसका एरर का जो मीन होता है वो जीरो कभी भी नहीं आता मतलब ये जीरो सेंटर्ड आपके पास यहां पर एक्टिवेशन फंक्शन नहीं है यहां पर अब जीरो सेंटर एक्टिवेशन फंक्शन नहीं होने की वजह से क्या होगा यहां पर तो जीरो सेंटर एक्टिवेशन फंक्शन नहीं होने की वजह से इसके अंदर आपके पास क्या होता है गाइ यहां पर आपके पास वर्नेस ग्रेडिएंट डिसेंट की प्रॉब्लम आती है अब ये वनिस ग्रेडिएंट डिसेंट क्या होती है यहां पर तो इसको आने वाले वीडियो के अंदर हम और ज्यादा डिटेल के साथ देखने वाले हैं तो बेसिकली लॉजिस्टिक एक्टिवेशन फंक्शन या सिगमॉड एक्टिवेशन फंक्शन का इस्तेमाल बाइनरी के अंदर आप कर सकते हैं इसके साथ-साथ ये डिफरेंशिएबल है तो इसका यूज आप ग्रीड डिस्टन के अंदर भी कर सकते हैं चलिए अगले एक्टिवेशन फंक्शन के अंदर बात करते हैं तो अगला एक्टिवेशन फंक्शन है नच एक्टिवेशन फंक्शन यस नच एक्टिवेशन फंक्शन आपके पास यूज़ किया जाता है जब आप यहां पर आरएनए नेटवर्क के ऊपर काम करेंगे मतलब रिक्रूटर न्यूरल नेटवर्क के ऊपर काम करेंगे तब आप 10 एक्टिवेशन फंक्शन का इस्तेमाल करेंगे इसके पीछे रीजन ये है कि इसका जो आउटपुट है वो -1 से लेके वन के बीच में लाई करता है एंड देन ये आपका जो एक्टिवेशन फंक्शन है वो डिफरेंशिएबल भी है इसके साथ-साथ ये जीरो सेंटर्ड भी है मतलब यहां पे वर्नेस गडि डिसन की जो प्रॉब्लम है गाइज यहां पर वो आपको नहीं देखने को मिलती है तो बेसिकली नच एक्टिवेशन फंक्शन जो है गाइज यहां पर इसका इस्तेमाल हम कहां करने वाले हैं आरएनएन नेटवर्क्स के अंदर करने वाले हैं लेकिन अब यहां पे पॉइंट आता है कि हमारे आउटपुट यदि हमारा जो डिजायर आउटपुट है वो बाइनरी ना हो के कैटेगरी कल हो जाए कैटेगरी कल का मतलब क्या है गाइज यहां पर आपका जो आउटपुट है वो आपके पास बहुत सारी कैटेगरी के अंदर है जैसे कैट आपके पास हो गया डॉग आपके पास हो गया काउ आपके पास हो गया तब आपको क्या करना है तो देखिए जब आप सिगमॉड फंक्शन का इस्तेमाल करते हैं तो या फिर जब आप t का एक्टिवेशन फंक्शन का इस्तेमाल करते हैं तो वहां पे जो डिजल आउटपुट होता है वो आपके पास क्या होता है बाइनरी के अंदर काम करता है लेकिन आपके पास यहां पर एक से ज्यादा आउटपुट हो जाए तब आपको क्या करना है तब आपको क्या करना है सॉफ्टमेट एक्टिवेशन फंक्शन का इस्तेमाल करना है ये भी आपके पास क्या है डिफरेंशिएबल है यहां पर और ये कब काम आता है गाइज यहां पर ये उस वक्त काम आता है जब आपके जो आउटपुट है वो आपके पास क्या दो से ज्यादा आउटपुट आपके पास निकलना जाए तब आपके पास क्या करता है सॉफ्टवेयर फंक्शन यहां पे वर्क करता है तो उस वक्त आपको क्या करना है सॉफ्टवेयर एक्टिवेशन फंक्शन को इस्तेमाल करना है चलिए अब हमारे पास रह गया हमारे हिडन लेयर के अंदर क्या यूज़ कर सकते हैं देखिए हिडन लेयर के अंदर आप लीनियर एक्टिवेशन फंक्शन को इस्तेमाल नहीं कर सकते रीजन बहुत सिंपल सा यहां पर है क्योंकि जब आप लीनियर एक्टिवेशन फंक्शन का इस्तेमाल करते हैं तो आपको वनिस ग्रेडन डिसेंट प्रॉब्लम देखने को मिलती है मतलब आप आगे से आगे डाटा ट्रांसफर करते हैं तब आपके पास क्या आती है वनिस ग्रेड डिसेंट प्रॉब्लम आ जाती है तो फिर उसको रोकने के लिए हम क्या करते हैं यहां पर रिलो एक्टिवेशन फंक्शन का इस्तेमाल करते हैं रिलो एक्टिवेशन फंक्शन जो है गाइज यहां पर ये लीनियर फंक्शन से डिफरेंस है राइट लीनियर एक्टिवेशन फंक्शन से बहुत ज्यादा डिफरेंशिएबल बोला है गाइ यहां पर वो क्या होता है मैक्स 0x होता है जबकि लीनियर फंक्शन का यदि आप बात करेंगे तो वो क्या होता है fxxx.pro यहां पे बात करें क्या ये डिफरेंशिएबल है तो यस ये डिफरेंशिएबल है आप इसको डिफरेंशिएबल डिफरेंशिएबल जनरली हिडन लेयर्स के अंदर किया जाता है तो एक समरी बात करें यहां पर कि कौन सा एक्टिवेशन कब इस्तेमाल करना है तो देखिए जब आप रिग्रेशन एनालिसिस के अंदर वर्क कर रहे हैं तब आप लीनियर एक्टिवेशन फंक्शन का इस्तेमाल करेंगे जब आप बाइनरी क्लासेस में काम कर रहे हैं तब आप सिगमॉड फंक्शन का इस्तेमाल करेंगे जब आप मल्टी क्लास की बात कर रहे हैं तब आप यहां पे सॉफ्टवे का इस्तेमाल करेंगे जब आप मल्टी लेवल की बात कर ें हैं तब आप क्या करेंगे सिगमॉड एक्टिवेशन फंक्शन का इस्तेमाल करेंगे करेंगे इसके साथ-साथ जब आप कन्वेंशनल न्यूरल नेटवर्क की बात कर ें हैं तब आप क्या करेंगे लो का इस्तेमाल करेंगे और हिडन लेयर जो हमारी होती है यस हिडन लेयर जो होती है उस हिडन लेयर के अंदर भी आप रलो का इस्तेमाल कर सकते हैं उसके बाद रिक्रूट ल नेटवर्क की बात करें तो रिक्रूट नेटवर्क के अंदर हिडन लेयर के अंदर आप t का इस्तेमाल कर सकते हैं और सिग्मो इड एक्टिवेशन फंक्शन का भी इस्तेमाल कर सकते हैं यहां पर तो ये अलग-अलग न्यूरल नेटवर्क के अंदर आप अलग-अलग डिफरेंट डिफरेंट टाइप्स के एक्टिवेशन फंक्शन को इस्तेमाल करके अपना जो डिजायर्ड आउटपुट है वो लेके आ सकते हैं और आज के इस वीडियो के जरिए हम बात करेंगे लॉस फंक्शन के बारे में तो देखिए लॉस फंक्शन होता क्या है यहां पर और ये क्यों निकाला जाता है यहां पर यस ये क्यों यहां पर लाया गया है यहां पर इसके बारे में जरा जानते हैं देखिए जब भी आप कोई डीप लर्निंग न्यूरल नेटवर्क का इस्तेमाल कर रहे हैं या फिर जब आपने मशीन लर्निंग पढ़ी होगी तो मशीन लर्निंग के अंदर जब भी आप कोई एल्गोरिथम का इस्तेमाल करते हैं वो एल्गोरिथम कितना स्कोर करती है स्कोर का मतलब कितना एक्यूरेसी के साथ आंसर देती है तो वो तो होता है हमारा पास एक्यूरेसी स्कोर मतलब कितना अच्छा रिजल्ट देती है दैट इ एक्यूरेसी स्कोर इसके साथ-साथ हमारी जो एल्गोरिथम है वो कितने गलत प्रोडक्शन करती है या फिर कितना गलत आंसर देती है इस चीज को मेजर करने के लिए हम यहां पे यूज करते हैं लॉस फंक्शन का तो बेसिक लॉस फंक्शन का मतलब ये होता है कि हमारे पास जो हमारा आंसर आ रहा है चाहे वो मशीन लर्निंग के कांसेप्ट में हो चाहे वो डीप लर्निंग के कांसेप्ट में हो कि जो भी हम जो यहां पर इनपुट दे रहे हैं उस इनपुट के बेसिस पे जो हमारा आउटपुट निकल के आ रहा है वो हमारे ओरिजिनल आउटपुट से कितना डिफरेंस आ रहा है यहां पर जो आंसर निकल के आता है दैट इज अ कॉल ऑफ लॉस और उस चीज को निकालने के लिए हम जिस फंक्शन का इस्तेमाल करते हैं दैट इज अ लॉस फंक्शन यदि आपको पाइथन मशीन लर्निंग डेटा साइंस एंड डेटा एनालिस जैसी फील्ड में अपने आपको को ग्रो करना है तो इसके लिए डब्ल्यू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जवाइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं जैसे लॉस फंक्शन की बात करें तो लॉस फंक्शन का मतलब क्या हुआ यहां पर तो लॉस फंक्शन का बेसिक मतलब ये हुआ कि हमारे पास जो भी हमारा ओरिजिनल डाटा है यहां पर उसमें से जो हमारा प्रिडिक्टेड डाटा है यस जो हमारा प्रिडिक्टेड डाटा है इसको हम यहां पर सबट क्ट कर दें तो ये जो हमें रिजल्ट मिलता है गाइज यहां पर यस दैट इज कॉल्ड ऑफ़ लॉस और इसको हम जब फंक्शंस के थ्रू यहां पे निकालते हैं यहां पर तो दैट इज कॉल्ड ऑफ लॉस फंक्शन अब गाइज यहां पर लॉस फंक्शन की जरूरत क्यों पड़ती है तो देखिए जब भी आप मशीन लर्निंग के अंदर काम कर रहे हैं तो वहां पे आप इस्तेमाल करते हैं एल्गोरिथम का उस एल्गोरिथम के अंदर आपके पास एल्गोरिथम के क्या होते हैं कुछ पैरामीटर्स होते हैं जैसे एग्जांपल के तौर पे आप सिंपल लीनियर रिग्रेशन का इस्तेमाल कर रहे हैं तो सिंपल लीनियर रिग्रेशन के अंदर आपकी जो इक्वेशन होती है वो होती है y = mx3 तो यहां पे जो मॉडल के पैरामीटर्स होते हैं वो क्या होते है m और c होते हैं इसी तरह से जब आप डीप लर्निंग में काम कर रहे होता है तो डीप लर्निंग के अंदर होता है आपका न्यूरल नेटवर्क और इस न्यूरल नेटवर्क के अंदर जब आप यहां पर एल्गोरिथम की बात कर रहे हैं इस न्यूरल नेटवर्क की एल्गोरिथम की बात करते हैं या इस न्यूरल नेटवर्क की इक्वेशन की बात करते हैं तो वो क्या होता है यहां पर y हैट इक्वल टू तो वो इक्वेशन होती है w1 x1 प्लस यहां पे w2 x2 प्लस एंड सो ऑन करते हुए आपके पास बायस बी राइट ये इक्वेशन होती है इसके अंदर आपके पास यहां पर w1 w2 और बायस ये आपके पास क्या होते हैं इसके पैरामीटर्स होते हैं इन पैरामीटर्स की हमें क्या चाहिए वैल्यू चाहिए अब वैल्यू कौन सी वाली चाहिए यहां पर जिसके ऊपर हमारे जो लॉसेस है वो मिनिमाइज आ सके तो बेसिकली हम क्या करते हैं कि हमारे पास मशीन लर्निंग के अंदर जो हमारा पैरामीटर्स होते हैं और डीप लर्निंग के अंदर जो हम न्यूरल नेटवर्क इस्तेमाल कर रहे होते हैं उन न्यूरल नेटवर्क के जो पैरामीटर्स होते हैं हैं उन पैरामीटर्स को निकालने के लिए मतलब वो आपके पास यहां पर पैरामीटर बेस्ट पैरामीटर्स फाइंड आउट करने के लिए हम क्या करते हैं लॉस फंक्शन का इस्तेमाल करते हैं मतलब आपके पास जितना कम लॉस होगा यहां पर उतने ही बेस्ट पैरामीटर्स हमें यहां पर देखने को मिलेंगे तो बेसिकली लॉस फंक्शन का इस्तेमाल किस चीज के लिए किया जाता है लॉस फंक्शन का इस्तेमाल आपके पास किसी भी पैरामीटर्स को बेस्ट निकालने के लिए मतलब आपके पास यहां पे क्या है पैरामीटर की बेस्ट वैल्यू फाइंड आउट करने के लिए हम क्या करते हैं लॉस फंक्शन का इस्तेमाल करते हैं अब यहां पे दो टर्म्स लॉजी आती है पहली टर्म्स लॉजी आती है आपके पास यहां पर लॉस फंक्शन दूसरी पैरामीटर्स आता है आपके पास यहां पर कॉस्ट फंक्शन तो लॉस फंक्शन एंड कॉस्ट फंक्शन में क्या डिफरेंशियल यहां पर क्या है यहां पर कि लॉस फंक्शन और कॉस्ट फंक्शन में क्या डिफरेंशिएबल ज्यादा डिफरेंशिएबल इसे सेम मानते हैं लेकिन ये दोनों चीजें सेम टर्म लॉजी नहीं है दोनों के अंदर बहुत ही बड़ा मेजर डिफरेंस है क्या डिफरेंस है यहां पर जरा बात करें तो देखिए इसको समझने के लिए मैं एग्जांपल के तौर पे एक डाटा ले रहा हूं जैसे मान लीजिए मेरे पास x1 एक कॉलम है यहां पर यस x2 एक कॉलम है यहां पर और इसके करेस्पॉन्डिंग्ली आउटपुट है राइट अब मान लीजिए y की वैल्यू आपके पास 2 3 4 5 आ रही है यहां पर और वाहेड की वैल्यू 3 4 5 और 6 आ रही है यहां पर अब मैं बात करता हूं यहां पर लॉस के बारे में तो लॉस की जो वैल्यू होगी वो क्या होगी गाइज यहां पर आपके पास 3 - 2 होगी मतलब आप क्या कर रहे हैं केवल और केवल जब आप यहां पर सिंगल डाटा पैरामीटर्स के ऊपर आप यहां पर एरर फाइंड आउट कर रहे हैं या फिर सिंगल डाटा पैरामीटर के ऊपर जब आप यहां पर लॉस फाइंड आउट करते हैं तो वो आपके पास क्या कहलाता है गाइज यहां पर लॉस कहलाता है बेसिकली सिंपल लॉस कहलाता है और उसका जो फंक्शन होता है गाइज यहां पर वो फंक्शन क्या होता है यहां पर अकॉर्डिंग टू आप यहां पर कौन सी एल्गोरिथम इस्तेमाल कर रहे हैं अकॉर्डिंग टू कौन सा न्यूल नेटवर्क इस्तेमाल कर रहे हैं उसके ऊपर होता है लेकिन बेसिक मैं बात करूं यहां पर वो क्या होता है y - y हैट का होल स्क्वायर होता है यहां पर इस बेसिक लॉस फंक्शन का हम इस्तेमाल करते हैं राइट लेकिन हम यहां पर हर बार एक-एक लाइन के ऊपर मतलब आपके पास एक-एक आपकी जो रो है उनके ऊपर लॉस फाइंड आउट नहीं करते हैं तो क्या करते हैं हम यहां पर सभी जो आपके पास लाइंस है यहां पर जभी सभी जो डाटा है यहां पर उन सभी के ऊपर हम क्या करते हैं लॉस फाइंड आउट करते हैं अब सभी डाटा के ऊपर जब हम लॉस फाइंड आउट करते हैं तो उनका हमें क्या चाहिए हमें यहां पर एवरेज चाहिए मतलब बेसिकली बात करूं यहां पे गाइ तो हमें उनका मीन यहां पे फाइंड आउट करना होता है तो जब हम यहां पर हमारे पास जितने भी डेटा पॉइंट्स हैं उन डेटा पॉइंट्स के मीन को फाइंड आउट करते हैं तो वो जो आपके पास डाटा जो आंसर निकलता है या फिर उससे जो फार्मूला आपका जनरेट होता है यहां पर तो वो आपके पास क्या होता है कॉस्ट फंक्शन होता है और उससे जो वैल्यू निकलती है यहां पर वो क्या होती है गाइ यहां पर कॉस्ट वैल्यू होती है मतलब मैं बेसिकली गाइज मैं बात करूं कि यहां पर मैंने क्या किया सभी का लॉस निकाल लिया जैसे l1 इसका लॉस निकाल लिया l2 निकाल दिया l3 निकाल दिया l4 निकाल दिया राइट ये निकालने के बाद में हमने क्या किया मीन निकाल दिया इसका मतलब हमने क्या की इसकी एवरेज वैल्यू फाइंड आउट कर ली दैट इज कॉल ऑफ कॉस्ट और इसके लिए जो रिगार्डिंग हमने फंक्शन यूज़ किया यहां पर दैट इज कॉल्ड ऑफ कॉस्ट फंक्शन तो बेसिकली हम यहां पर पहले हम ये चीज क्लियर कर लेते हैं कि लॉस्ट टर कॉस्ट में क्या डिफरेंस देता है तो लॉस आपके पास क्या है गाइज यहां पर केवल सिंगल डेटा पॉइंट के ऊपर हम जो एरर फाइंड आउट करते हैं दैट इज कॉल ऑफ लॉस और जब हम यहां पर एंटाइपो फाइंड आउट करके उसका मीन निकालते हैं दैट इज कॉल ऑफ कॉस्ट और अब आगे जितनी भी चीजें हमारे पास आने वाली है जितने भी फंक्शंस हम पढ़ने वाले हैं उन सभी के अंदर हम क्या करने वाले हैं एवरेज को देखने वाले हैं मतलब हम वहां पे एवरेज की बात करेंगे ठीक है तो वो हमारे कैसे होंगे कॉस्ट फंक्शन होंगे तो बेसिकली लॉस फंक्शन और कॉस्ट फंक्शन के अंदर बहुत बड़ा मेजर डिफरेंस है राइट तो चलिए अब यहां पर समझते हैं कि डीप लर्निंग के अंदर कौन-कौन से लॉस फंक्शन हमें देखने को मिलते हैं तो चलिए अब यहां पर देखें तो देखिए लॉस फंक्शन क्या होता है तो लॉस फंक्शन क्या करता है आपके मॉडल के इवोल्यूशंस को वाइड करता है मतलब बेसिकली आपका मॉडल कितनी अच्छी तरीके से वर्क कर रहा है कितनी एरर यहां पे कर रहा है इस चीज को फाइंड आउट करने के लिए हम क्या करते हैं लॉस फंक्शन का इस्तेमाल करते हैं अब जरा बात करें गाइज यहां पर तो हमारे पास कितने टाइप्स के लॉस पंक्चर होते हैं तो बेसिकली हमने क्या किया हमारे डटा को तीन चार पार्ट के अंदर डिवाइड कर रखा है पहला जो हमारा पार्ट है यहां पर डीप लर्निंग के अंदर वो है हमारा रिग्रेशन मॉडल यस जब हम बात कर रहे हैं यहां पर कि हमारा जो पहला मॉडल कौन सा है वो हमारा रिग्रेशन मॉडल है रिग्रेशन मॉडल के अंदर हमें कौन से मिलते हैं लॉस यहां पर तो मीन स्क्वायर एरर मिलता है मीन एब्सलूट एरर मिलता है और कौन सा मिलता है हब लॉस मिलता है इसके साथ-साथ यदि मैं बात करूं क्लासिफिकेशन के बारे में तो क्लासिफिकेशन के अंदर हमने बाइनरी मिलाया यहां पर बाइनरी के साथ-साथ हमें कैटेगरी कल मिलता है इसके साथ-साथ हमारे पास ऑटो इनकोडर के अंदर के एल डायवर्जन लॉस मिलता है यहां पर एंड यहां पर गेन जो हमारा नेटवर्क है यहां पर उसके अंदर हमें डिस्क्रिमिनेटर लॉस मिलता है मिन मैक्स गेन मिलता है यहां पर ऑब्जेक्ट डिटेक्शन के अंदर हमें फोकल लस मिलता है यहां पर और वर्ड इमेजेस सिस्टम जिसे हम एनएलपी के थ्रू वर्क करते हैं यहां पर उसके अंदर आपका क्या मिलता है ट्रिपलेट लॉ मिलता है अब ये इतने सारे हमारे पास क्या होते हैं लॉस के फंक्शन होते हैं अकॉर्डिंग टू न्यूरल नेटवर्क हमारे पास बहुत सारे तरह के न्यूरल नेटवर्क होते हैं जैसे एनए हो गया उसके बाद हमारा सीएनए हो गया यहां पर उसके बाद हमारा आरएनएन हो गया इसके अंदर हमारे हिडन लेयर्स हो गए तो बहुत सारी जगह होती है यहां पर हमारे पास बहुत सारी जगह पर बहुत अलग-अलग टाइप के लॉस फंक्शंस यहां पर वर्क करते हैं तो बस हम उन्हीं के बारे में जान रहे हैं यहां पर तो बेसिकली अभी मैं आपको थोड़ा और डिटेल के साथ एक्सप्लेन करने जा रहा हूं कि रिग्रेशन लॉस के अंदर मीन स्क्वायर एरर का भी यूज़ करना चाहिए मीन एब्सलूट एरर का भी यूज करना चाहिए आपके पास हब लॉस का भी यूज करना चाहिए इसके साथ-साथ क्लासिफिकेशन के अंदर बात करें बाइनर कॉस्ट एंट्रोपिक यूज करना चाहिए कैटेगरी कॉस्ट एंट्रोपय करना चाहिए इसके बारे में अब हम डिटेल के साथ देखने वाले हैं इसके साथ-साथ ये जो लॉस पंक्चर होते हैं ये आपके पास क्या करते हैं बैक प्रोपेगेशन में बहुत यूज आते हैं जब भी आप न्यूरल नेटवक को ट्रेन कर रहे होते हैं तो न्यूरल नेटवर्क को ट्रेन करते वक्त आपको बैक प्रोपेगेशन का यूज करना पड़ता है जिसके थ्रू आपके पास वेटेज और बायस की व वैल्यू क्या होती है अपडेट होती है मतलब वेटेज और बायस की वैल्यू क्या होती है आपके पास यहां पर बेस्ट वैल्यू आपको फाइंड आउट होती है तो ये बेस्ट वैल्यू को निकालने के लिए हमें किसकी जरूरत पड़ती है लॉस फंक्शन की जरूरत पड़ती है विदाउट एनी लॉस फंक्शन आप इस चीज को नहीं निकाल सकते तो इन चीजों के लिए हमें क्या चाहिए लॉस फंक्शन चाहिए तो बस हम उसी की बात को जान रहे हैं यहां पर कि किस समय कौन-कौन से लॉस फंक्शन हम यूज करते हैं चलिए अभी हम बात करते हैं यहां पर सबसे पहले यहां पर रिग्रेशन लॉस के बारे में रिग्रेशन लॉस के अंदर जो सबसे पॉपुलर जो सबसे बेस्ट लॉ फंक्शन है दैट इज अ मीन स्क्वायर लॉस यस ये कौन सा है यहां पर मीन स्क्वायर लॉस है इसको काफी लोग स्क्वायर लॉस भी बोलते हैं देयर इज अ l2 लॉस यहां पर बोला जाता है यहां पर इस लॉस का फंक्शन का फार्मूला क्या है यहां पर गाइ कि जो भी आपका ओरिजिनल वैल्यू आ रही है उसमें से आप क्या करें प्रिडिक्टेड वैल्यू को क्या करें सबस्टैक कर ले सबस्टैक करने के बाद आपको क्या करना है स्क्वायर करना है और स्क्वायर करने के बाद उसका क्या करना है मीन निकाल देना है तो दैट इज अ मीन स्क्वायर एरर लॉस ठीक है तो ये क्या कर रहा है मीन स्क्वायर एरर लॉस बोलता है यहां पर इसे अब ये मीन स्क्वायर एरर लॉस हमें कब यूज़ करना पड़ता है तो ज ली ये जो लॉस है यहां पर वो आपके पास ऑलमोस्ट सारी जगह यूज़ होता है यहां पर जब भी आप लीनियर रिग्रेशन का इस्तेमाल कर रहे हैं या फिर जब भी आप डीप लर्निंग के अंदर रिग्रेशन एनालिसिस का इस्तेमाल करेंगे तब भी आप इस रिग्रेशन लॉस के अंदर आप मीन स्क्वायर एल लॉस का इस्तेमाल करेंगे और इसके पीछे रीजन क्या है यहां पर क्योंकि ये जो लॉस है यहां पर ये डिफरेंशिएबल है अब ये डिफरेंशिएबल है तो इसका यूज क्यों किया जा रहा है डिफरेंशिएबल है तो कहां डिफरेंशिएबल यूज होता है तो देखिए जब भी आप बैक प्रोपेगेशन का इस्तेमाल करते हैं तो बैक प्रोपेगेशन के अंदर जो आपका वेट अपडेट करने का जो फॉर्मूला होता है यहां पर मतलब जिसे हम यहां पर ग्रेडिएंट डिसेंट फॉर्मूला बोलते हैं यहां पर तो ग्रेडिएंट डिसेंट का फॉर्मूला क्या होता है गाइज यहां पर तो ग्रेडिएंट डिसेंट का फार्मूला होता है w न्यू यस w न्यू इक्वल्स टू क्या होता है गाइज यहां पर ड ओल्ड माइनस आपके पास क्या होता है लैडा इट्स कॉल्ड ऑफ लर्निंग रेट और उसके बाद क्या होता है dl4 होता है जो कि बैक प्रोपो केशन में लगता है अब ये जो फॉर्मूला आपका लग रहा है इसके अंदर आपके पास क्या होता है आपका dl2 होता है मतलब ये आपका होता है लॉस का डिफरेंशिएबल होता है तो देखिए ये जो डटा आपके पास दिख रहा है ये क्या है आपके पास यहां पर स्क्वायर है यहां पर तो बेसिकली स्क्वायर जो होता है आपका यहां पर डिफरेंशिएबल होता है यहां पर क्यों होता है यहां पर रीजन बहुत सिंपल है क्योंकि इसके अंदर हमें कोई भी शार पॉइंट नहीं देखने को मिलता है मतलब आपके पास क्या है ये प्रॉपर्ली डिफरेंशिएबल है और जब आप इसे प्लॉटिंग करेंगे ना तो आपको कैसा मिलेगा गाइज यहां पर आपको एक पैराबोलिक कर्वेचर मिलेगा और इस पैराबोलिक कर्वेचर के अंदर हमें ये जो सबसे मिनिमम पॉइंट है ये निकालने में बहुत ज्यादा आसानी रहेगी तो बेसिकली आपके पास जब भी आप यहां पर वेटेज को अपडेट करते हैं या फिर जब आप वेटेज की वैल्यू को फाइंड आउट करते हैं तब आप क्या करते हैं मीन स्क्वायर एरर लॉस का इस्तेमाल करते हैं अब पॉइंट यहां पे ये आता है कि कब आपको इसका इस्तेमाल नहीं करना है तो देखिए जब आपके डाटा के अंदर बहुत सारे आउटलायर है यस बहुत सारे आउटलायर है यहां पर तब आप इसका इस्तेमाल बिल्कुल ना करें क्यों नहीं करना यहां पर सिंपल सा रीजन ये है क्योंकि देखिए इसके अंदर जो आपके पास लॉस के अंदर जो टर्म लॉजी यूज हो रही है वो आपके स्क्वायरिंग की हो रही है तो ये क्या करेगा गाइज यहां पर जैसे आपके पास मान लीजिए कि आपके पास यहां पे डेटा है ठीक है उस डटा के अंदर यदि आपके पास एरर है एरर आपके पास यहां पर मिनिमम आई जैसे वन आई आपके एरर ट आई एरर 3i एरर तो ठीक है लेकिन जैसे आपके पास आउटलायर होगा तो आउटलायर में एरर ज्यादा आएगी यहां पर तो जब आपके पास आउटलायर में ज्यादा आएगी तो वो स्क्वायर करेंगे तो वो टर्म्स और ज्यादा बढ़ जाएगी जिसकी वजह से आपके पास क्या होगा आपकी जो लाइन के अंदर जो शिफ्टिंग है वो बहुत ज्यादा आपके पास देखने को मिलेगी तो बेसिकली गाइज यदि आपके सिस्टम के अंदर आउटलायर है यदि आपके सिस्टम के अंदर क्या है यहां पर आउटलायर प्रेजेंट है तो आप यहां पर मीन स्क्वायर एरर लॉस का इस्तेमाल ना करें क्योंकि उस वक्त ये आपके पास क्या करेगा आपके सिस्टम के अंदर रॉन्ग प्रेडिक्शन करना स्टार्ट कर देगा क्योंकि आपके पास जो आपकी प्रेडिक्शन लाइन है या फिर आपके जो प्रेडिक्शन आउटपुट है यहां पर वो आउटलायर की तरफ टिल्ड कर देगा बहुत ज्यादा जिसकी वजह से आपके पास क्या होगा यहां पे गाइ आप यहां पर बेटर रिजल्ट नहीं देख पाएंगे तो फिर इसका अल्टरनेटिव क्या है तो इसका अल्टरनेटिव आता है गाइज यहां पर मीन एब्सलूट एरर यस मीन एब्सलूट एरर का इस्तेमाल करें जब भी आपके डेटा सेट के अंदर आपके क्या है आउटलायर प्रेजेंट हो तब आप क्या करें मीन एब्सलूट एरर का इस्तेमाल करें अब मीन एब्सलूट एरर के अंदर क्या करते हैं गाइ यहां पर कि जो भी आपकी एरर है y - y हैड जो आपकी एरर है यहां पर इसका आप क्या करते हो गाइज यहां पर मॉड्यूस लेते हो क्या ले लेते हैं यहां पर मॉडल अस यहां पर कंसीडर कर लेते हैं मॉड्यूस का मतलब क्या होता है गाइज यहां पर मॉड्यूस का मतलब सिंपल सा ये है कि इस मॉड्यूस के अंदर जब भी आपकी कोई पॉजिटिव वैल्यू आएगी तो वो तो एज इट इज रिटर्न कर देगी लेकिन जब भी आपकी नेगेटिव वैल्यू आती है गाइस यहां पर तो ये उसे क्या करती है पॉजिटिव में रिटर्न करती है किसमें रिटर्न करती है पॉजिटिव में आपके पास यहां पर ट रिटर्न करके दे देती है तो बेसिक गाइज यहां पे बात करें तो मॉड्यूस का मतलब क्या हुआ गाइज यहां पर y - y हाट आपके पास आ गया तो इसका आपने क्या किया मॉडल किया मतलब आपके नेगेटिव वैल्यू को भी क्या कर देगा ये पॉजिटिव रिटर्न कर देगा उसके बाद आपको क्या करना है यहां पर मीन ले लेना है देखिए इसका यूज जनरली ज्यादातर नहीं किया जाता है ठीक है क्यों नहीं किया जाता है क्योंकि जब आप इस मोड का ग्राफ बनाते हैं यहां पर तो ये ग्राफ क्या होता है यहां पर ये ग्राफ आपका नॉन डिफरेंशिएबल होता है रीजन इसका सिंपल से ये है क्योंकि ये आपके पास क्या करता है एक शार्प कॉर्नर पॉइंट देता है यस ये आपके पास क्या है एक शार्प कॉर्नर पॉइंट देता है क्यों देता है क्योंकि जब आप यहां पर इसे नेगेटिव वैल्यू डाल रहे हैं तब तो ये पॉजिटिव रिजल्ट दे रहा है यहां पर जब आप यहां पर पॉजिटिव रिजल्ट डाल रहे हैं तब b आपका क्या कर रहा है पॉजिटिव रिजल्ट दे रहा है राइट तो जब भी आपका पास क्या कर रहा है यहां पर पॉजिटिव रिजल्ट दे रहा है चलिए इसको थोड़ा और अच्छे से सिंपलीफाई करने के लिए मैं इस ग्राफ को क्या करता हूं इधर बना लेता हूं और जब आप इसमें जीरो देते हैं यहां पर तो जीरो पे ये क्या देता है रिजल्ट आपको जीरो ही देता है तो बेसिकली ये जीरो नंबर पॉइंट पे आपका क्या करता है यहां पर आपके पास ये शार्प पॉइंट आपको देता है इस वजह से आपके पास क्या है ये आपके पास नॉन डिफरेंशिएबल आपके पास क्या है इक्वेशन है या फिर नॉन डिफरेंशिएबल आपके पास क्या है यहां पर लॉस है लेकिन इसका इस्तेमाल उस वक्त करना है जब आपके सिस्टम में आउटलायर बहुत सारे हो और आउटलायर आपको कंसीडर करने हो यहां पर तब आप क्या करेंगे इसका इस्तेमाल आप करेंगे लेकिन अब इसके अंदर आती है कि इसके अंदर हम प्रेडिक्शन वैल्यू कहां से निकालेंगे जब हमारे पास यहां पर ये डिफरेंशिएबल नहीं है तो फिर हम ग्रेड एेंट डिसेंट का यू इस्तेमाल कैसे करेंगे तो ग्रेडन डिसेंट क्या करता है गाइ यहां पर कि ये एग्जैक्ट पॉइंट पे तो रिजल्ट नहीं निकालता है मतलब आप इसके अंदर आपको एग्जैक्ट आंसर नहीं मिलेगा इसके अंदर आपको क्या मिलेगा इस तरफ आपका आंसर मिलेगा मतलब ऊपर ऊपर तक आपके थोड़े-थोड़े आंसर्स आपको यहां पर देखने को मिलेंगे तो बेसिकली मीन एब्सलूट एरर जो आपके पास है यहां पे गाइ वो आपके पास क्या है आपके पास एक नॉन डिफरेंशिएबल है यहां पर और इसका जो रिजल्ट है यहां पर वो एग्जैक्ट ना मिलते हुए आपको कुछ लसम आईडिया के हिसाब से आपको देखने को मिलता है तो बेसिकली आपके पास मीन एब्सलूट डर कब मिलना है जब आपके सिस्टम के अंदर आउटलायर प्रेजेंट हो अब आता है यहां पर हब लॉस अब ये हब लॉस कब काम करता है तो बेसिकली हब लॉस के बारे में बात करें यहां पर तो आपके पास मान लीजिए सपोज करें आपके पास एक ऐसा डाटा है जिसके अंदर 30 पर आपके पास क्या है आउटलायर है यस 30 पर ऑफ योर डेटा यस 30 पर ऑफ योर डेटा आपके पास किसमें है यहां पर आउटलायर के अंदर है और रिमेनिंग 70 जो डटा है यहां पर आपके पास नॉर्मल डेटा के तौर पे है तो अब इसके अंदर यहां पे क्या है आपका डाटा कितना है 30 टू 35 पर यदि आपके पास आउटलायर में है तो वो डटा आउटलायर नहीं कहलाएंगे उस डेटा के अंदर जो आपका डाटा पड़ा है यहां पर वो आउटलायर डटा नहीं कहलाते हैं तो फिर अब यहां पे क्या करें तो उस सिचुएशन के अंदर वो डेटा आपके पास एक कंसीडरेबल डेटा है बस आपके पास डेटा क्या है उस डाटा से थोड़ा सा दूर किसी रेंज के अंदर जा चुका है यहां पर तो ऐसे सिचुएशन के अंदर हमें क्या करना है गाइज यहां पर हमें यूज करना है हब लॉस जब आपके पास आउटलायर जो है एक 2 पर ना होते हुए आपके पास क्या हो जाए 30 40 पर मतलब आपके पास यहां पर 1/2 पर ऑफ डटा आपके पास क्या हो जाए यहां पर आउटलायर में कन्वर्ट हो जाए तो यू गो टू अ हर्ड लॉस यस हर्ड लॉस आपके इस्तेमाल करना है अब हर्ड लॉस कैसे इस्तेमाल करना है गाइज यहां पर तो हब लॉस के अंदर दो आपकी सिचुएशन आपके पास होती है यहां पर हब लॉस जो होता है गाइज यहां पर एक पैरामीटर पे काम करता है दैट द कॉल्ड ऑफ हाइपर पैरामीटर यस ये हाइपर पैरामीटर की वैल्यू ट्र ट्यून होती है यहां पर और ये हाइपर पैरामीटर क्या है यहां पर ये आपके पास क्या है हब लॉस फंक्शन का एक ट्रांजिशंस है क्या है यहां पर ह लॉक ट्रांज अ लॉक पॉइंट का यहां पर क्या है एक ट्रांजैक्शंस है यहां पर इस वैल्यू के डेल्टा के ठीक है ये क्या करता है गाइज यहां पर जब ये वैल्यू एक हाइपर पैरामीटर से कम आती है मतलब आपके लॉस की वैल्यू किसी हाइपर पैरामीटर से कम आ जाती है तब तो ये आपके क्या करता है बेसिकली मीन स्क्वायर लॉस की तरह काम करता है लेकिन जब एक हाइपर पैरामीटर की वैल्यू जो होती है उससे लॉस की वैल्यू ज्यादा आ जाती है यस लॉस की वैल्यू क्या होती है उससे भी ज्यादा आ जाती है तब आपके पास क्या करता है बेसिकली गाइज आपके पास यहां पर नॉर्मली वर्क करता है मतलब आपके पास हड लॉस नॉर्मली वर्क करता है तो बेसिकली गाइज यहां पर बात करें तो रिग्रेशन के अंदर हमें तीन तरह के लॉस देखने को मिलते हैं कौन-कौन से लॉस हमारे पास है यहां पर सबसे पहला लॉस है यहां पर मीन स्क्वायर एरर लॉस यहां पर राइट ये कभी यूज़ करना है नॉर्मल केसेस के अंदर यूज़ करना है लेकिन जब आपके सिस्टम में आउटलायर हो और आउटलायर आपको कंसीडर करने हो यहां पर तो आप यहां पे कौन सा यूज़ करेंगे मीन एब्सलूट लॉस का इस्तेमाल करेंगे लेकिन जब आपके सिस्टम के अंदर आपके पास 30 टू 40 पर डाटा आउटलायर में प्रेजेंट हो तब उस केस में आप क्या करेंगे हब लॉस का इस्तेमाल करेंगे तो ये किसके थे रिग्रेशन एनालिसिस के लॉस थे अब बात करते हैं यहां पर क्लासि एनालिसिस के लॉस के बारे में देखिए तो अब हम जानते हैं यहां पर पहला लॉस के बारे में दैट इज अ बाइनरी क्रॉस एंट्रोपिक बारे में जानते हैं तो देखिए बाइनरी क्रॉस एंट्रोपय लॉस है यहां पर ये कब इस्तेमाल किया जाता है इसे हम लॉग लॉस भी बोलते हैं इसका जो फार्मूला है गाइज यहां पर ये आपके पास होता है लॉग लॉस का फॉर्मूला इसके अंदर लॉग का इस्तेमाल किया जाता है इसलिए हम इसे लॉग लॉस भी बोलते हैं यहां पर ठीक है ये कब इस्तेमाल किया जाता है ये आपके पास उस वक्त इस्तेमाल किया जाता है जब आपके पास कोई भी आपका डेटा सेट यस किसकी बात कर रहे हैं यहां पर डटा सेट के अंदर बात कर रहे हैं डेटा सेट का यदि आपके पास यहां पर आउटपुट जो है यहां पर वो किसके अंदर हो यहां पर बाइनरी फॉर्मेट के अंदर हो किसके फॉर्मेट में हो बाइनरी फॉर्मेट के अंदर बाइनरी फॉर्मेट का मतलब क्या है यहां पे गाइज रो या वन के फॉर्मेट में हो या फिर कैट एंड डॉग के फॉर्मेट में हो आपका जो रिजल्ट है यहां पर वो दो ही रिजल्ट के अंदर मिल रहा है दो ही रिजल्ट का मतलब क्या है गाइज यहां पर आपके पास जीरो या वन मिल रहा है कैट एंड डॉग मिल रहा है या फिर कोई भी दो नंबर मिल रहे हैं यहां पर उस वक्त आपके पास क्या करते हैं लॉग लॉस का इस्तेमाल किया जाता है तो जब भी आपके डाटा का रिजल्ट जाहु हो बाइनरी फॉर्मेट में हो तब आपका ये वाला जो फॉर्मूला है वो इस्तेमाल किया जाता है अब ये फॉर्मूला कैसे वर्क करता है जरा उससे डिटेल के साथ समझते हैं देखिए आपका जो आउटपुट है वो किसमें है बाइनरी फॉर्मेट में बाइनरी फॉर्मेट का मतलब क्या है यहां पर रो या वन के फॉर्मेट में है यहां पर तो देखिए जब आपके जो आउटपुट की वैल्यू है यस जब आपके पास जो आपका आउटपुट जो है यहां पर उस आउटपुट की वैल्यू जीरो होती है तब आपके पास ये लॉस का फार्मूला कैसे वर्क करता है तो ये लॉस का फॉर्मूला हो जाता है 1 / n यस 1 / n समेशन ऑफ आपके पास क्या आ जाएगा गाइज यहां पर i = 1 2n आ जाएगा यहां पर और उसके बाद देखिए क्या फार्मूला बन जाएगा यहां पर आपके पास लॉग ऑफ यस लॉग ऑफ 1 - y हैट आपके पास बन जाएगा मतलब देखिए क्या हो रहा है गाइज यहां पर देखिए इसमें रो आ जाएगा तो 0 * लॉग के साथ मल्टीप्लाई हो के क्या बनेगा जीरो बन जाएगा यहां पर बेसिकली लेकिन इस केसेस में 1 - 0 हो के क्या बनेगा वन बनेगा तो ये आपका जो पीछे वाला जो मेथड है यहां पर ये यूज करेगा मतलब जो पीछे वाला जो रिजल्ट है यहां पर वो वर्किंग में आएगा लेकिन जब भी आपका जो आका आउटपुट है यहां पर वो आपके पा क्या हो जाएगा गाइज यहां पर वन हो जाए तो उस केसेस में ये जो फॉर्मूला है वो चेंजेज होके क्या बनेगा 1 / n समेशन ऑफ i = 1 2n की बात करेंगे यहां पर और ये फार्मूला क्या बन जाएगा गाइज यहां पर y आपके पास y की वैल्यू तो वन हो गई यहां पर देन आपके पास क्या रिजल्ट बनेगा लॉग ऑफ वा हैट आपके पास बन जाएगा मतलब आपके पास देखिए ये 1 - 1 - 1 = 0 हो जाएगा रो इस पूरे टर्म से मल्टीप्लाई होके रो बन जाएगा तो पीछे कौन सी टर्म्स लॉजी र गई पीछे आपकी ये वाले टर्म्स लॉजी रह गई है गाइ यहां पर तो बेसिकली ये वाला फर्मूला बन जाएगा तो बाइनरी कॉस एंट्रोपिक लॉस है यहां पर ये दो तरीके से वर्क करता है कैसे आपके पास आउटपुट पे डिपेंड करता है आउटपुट इज इक्वल टू 0 रहेगा तो कुछ और रिजल्ट आएगा आउटपुट इज इक्वल टू 1 रहेगा तब आपके पास क्या करेगा कुछ और रिजल्ट आपको देखने को मिलेगा तो ये कब काम आता है जब आपके क्लासिफिकेशन के अंदर आपके जो डाटा है यहां पर उसका जो आउटपुट है वो बाइनरी हो लेकिन अब आपका आउटपुट जो है वो बाइनरी ना होते हुए आपके पास क्या हो जाए कैटेगरी कल में हो जाए कैटेगरी कल का मतलब क्या है बहुत सारे हो जाए जैसे कैट डॉग काउ इस तरह से आपके पास आ जाए तब आप क्या करेंगे तो उसके लिए हम यूज करते हैं कैटेगरी कल क्रॉस एंट्रोपय उसके लिए हम क्या करते हैं कैटेगरी कल क्रॉस एंट्रोपय कैटेगरी कॉस्ट एंटॉप कैसे वर्क करता है तो बेसिकली यहां पे जो अभी आपका डाटा है समेशन करके उन सबका यूज किया जाता है अब ये कैसे यूज किया जाता है गाइज यहां पे जरा बात करें तब हम क्या करते हैं कैटेगरी क्रॉस एंट्रिप का इस्तेमाल करते हैं अब ये कैटेगरी क्रॉस एंट्रेप कैसे काम करता है जैसे लेट्स सपोज आपके पास जो आपका आउटपुट है वो इस तरह से आ रहा है यहां पर कैट आ रहा है यहां पर आपके पास यहां पर डॉग आ रहा है यहां पर देन आपके पास क्या आ रहा है यहां पर काउ आ रहा है राइट इस तरह से रिजल्ट आ रहा है तो ये क्या करेगा यहां पर गाइस - y और ये y आउटपुट किसका हो जाएगा गाइज यहां पर कैट का हो जाएगा और ये किसका आ जाएगा लॉग ऑफ आपके पास क्या आएगा y हैट आपके पास हो जाएगा किसका कैट का आ जाएगा उसके बाद यहां पर माइनस आ जाएगा क्योंकि देखिए इसके बाद आपका माइनस टर्म लगा हुआ है तो एक काम करते हैं यहां पर इसको माइनस को बाहर निकाल देते हैं एक बार के लिए यस माइनस को बाहर निकाल देते हैं और अंदर ही अंदर चलते हैं देन प्लस आएगा यहां पर और प्लस आके क्या मिलेगा गाइज यहां पर आपका क्या मिलेगा वा ऑफ डॉग मिलेगा यहां पर लॉग ऑफ आपके पास क्या मिलेगा वा ऑफ हैट आपके पास क्या मिलेगा डॉग मिलेगा एंड उसके बाद प्लस ऑफ आपके पास क्या मिलेगा यहां पर वा हैट ऑफ काउ मिलेगा काउ के अंदर आपको क्या मिलेगा लॉग ऑफ आपके पास क्या मिलेगा वा हैट ऑफ यहां पर काउ मिलने वाला है राइट तो ये जो फार्मूला है आपके पास कुछ इस तरह से वर्क करेगा यहां पर कब जब आपके पास कैटेगरी कल क्रॉस एंट्रोपय अंदर हो तब अब देखिए कैटेगरी क्रॉस एंट्रोपय पर ये इंटरनली कैसे वर्क करता है तो इंटरनली क्या करता है गाइज यहां पर आपके पास जो आपका कैटेगरी कल डाटा है जस कैटेगरी मतलब आपके पास एक से ज्यादा यहां पर डाटा यहां पर जैसे कि आपके पास आ गया यहां पर कैट आ गया फिर आपका डॉग हो गया यहां पर फिर आपका यहां पर काउ हो गया तो ये क्या करता है कि आपके पास जो आपका आउटपुट है उसकी वन हॉट इनकोडिंग कर लेता है मतलब आपके पास क्या करता है गाइज यहां पर कैट अलग कर देता है फिर उसके बाद डॉग अलग कर लेता है यहां पर एंड देन आपके पास यहां पर काव अलग कर देता है राइट फिर उसके बाद क्या करता है यहां पर जैसे वन है मतलब आ रहा हो तो वन कर देता है देन बाकी ज रिमेनिंग 0 0 1 0 देन 0 0 एंड वन इस तरह से आपके पास क्या करता है आपके आउटपुट की वन हॉट एन कोडिंग कर देता है अब यहां पे एक पॉइंट आता है कि जब आपके पास यहां पर कैटेगरी जो है आपके डाटा के अंदर वो बहुत ज्यादा हो जैसे अभी दो-तीन कैटेगरी है तब तो आपके पास यहां पर क्या करें कैटेगरी क्रॉस एंट्रोपिक का इस्तेमाल कर रहे हैं लेकिन जब आपके पास यहां पर तीन चार से ज्यादा आपके पास कैटेगरी आ जाए जैसे 10 कैटेगरी आ जाए 20 कैटेगरी आ जाए तो उस वक्त कैटेगरी क्रॉस एंट्रोपिक का इस्तेमाल हम नहीं करते हैं क्योंकि उस समय हम यहां पर वन हट एन कोडिंग करेंगे तो वन हट इनकोडिंग की जो वैल्यू होगी जो डेटा पैरामीटर होंगे वो बहुत ज्यादा बन जाएंगे तो फिर उस वक्त हम क्या करेंगे यस उस वक्त हम यहां पे इस्तेमाल करते हैं स्पर्स कैटिक कॉस्ट एंट्रोपिक कॉस्ट एंट्रो प्री के अंदर क्या होता है कि गाइ आपका जो आपका आउटपुट है उस आउटपुट को हम क्या करते हैं वन हॉट इनकोडिंग की जगह लेबल इनकोडिंग करते हैं लेबल इनकोडिंग का मतलब क्या है 1 2 3 4 यहां पर इस तरह से हम क्या करते हैं रिजल्ट के तौर पे देते हैं तो बेसिकली जब भी आपके जो आउटपुट है यदि आपका आउटपुट यहां पर तीन चार यहां पर हो कैटेगरी के अंदर तीन-चार कैटेगरी के अंदर आउटपुट हो तो यू गो टू अ कैटेगरी कॉस एंटॉप लेकिन जब आपके पास आपका जो आउटपुट है वो बहुत ज्यादा हो यहां पर बहुत ज्यादा टर्म्स के अंदर हो देन यू गो टू अ स्पर्स कैटेगरी क्रॉस यहां पर स्पर्स कैटेगरी कॉस्ट एंट्रोपिक इस्तेमाल करते हुए आपको आगे बढ़ना है क्योंकि इसके अंदर आपके जो डेटा पॉइंट है उसकी लेबल एन कोडिंग होती है लेबल एन कोडिंग का मतलब क्या है गाइ यहां पर 1 2 3 4 इस तरह से नंबर दिए जाते हैं आपके डटा पॉइंट को और फिर आपके पा क्या होता है प्रेडिक्शन इस्तेमाल होता है यहां पर तो इस तरीके से आप क्या करते हैं क्लासिफिकेशन में तीन लॉस का इस्तेमाल करते हैं और वो तीन लॉस कौन-कौन से हैं बाइनरी कॉस्ट एंट्रोपिक अब इस्तेमाल करना है जब आपके डेटा पॉइंट के अंदर आउटपुट के अंदर जो भी आपका डाटा है यहां पर वो बाइनरी फॉर्मेट के अंदर हो मतलब 01 के अंदर हो और यहां पर कैटेगरी क्रॉस एंट्री का इस्तेमाल कब करना है जब आपके पास यहां पर डिफरेंट डिफरेंट आउटपुट हो मतलब आपके पास दो से ज्यादा यहां पर आउटपुट हो लेकिन पांच छ से कम आपके पास आउटपुट हो तब आप क्या करेंगे कैटलर कॉस्ट एंटर भी का इस्तेमाल करेंगे लेकिन जब आप नंबर ऑफ आउटपुट यहां पर बहुत ही ज्यादा आपके पास हो जाए आपके पास फाइव टू ज्यादा आपके पास यहां पर आउटपुट हो जाए तब यू गो टू अ स्पर्स कैटलर क्रॉस एंट्रोपय इस तरह के आपके पास क्या होता है कैल्सिफिक के अंदर लॉस होता है और रिग्रेशन के अंदर लॉस होते हैं इन्हीं लॉस का इस्तेमाल आगे चलते हुए हम कहां पे करने वाले हैं हम बैक प्रोपो केशन में करने वाले हैं इसके साथ-साथ जब हम आर्टिफिशियल न्यूरल नेटवर्क बनाएंगे यहां पर तब भी हम इसी का इस्तेमाल करने वाले हैं तो राइट गाइज आई थिंक आप सभी को क्लियर हो गया होगा कि लॉस क्या होते हैं और कितने टाइप के लॉस डीप लर्निंग के अंदर इस्तेमाल किया जाते हैं आगे चलते हुए हम और भी तरह-तरह के यहां पर न्यूरल नेटवक के बारे में बात करेंगे और उनके अंदर आपके पास लगाए जाने वाले लॉसेस के बारे में बात करेंगे और आज के इस वीडियो के जरिए हम बात करेंगे ऑप्टिमाइजर के बारे में कि ऑप्टिमाइजर क्या होते हैं और कैसे वर्क करते हैं देखिए जब भी हम हमारे न्यूरल नेटवक को ट्रेन कर रहे होता हैं तो सबसे पहले आपका फॉरवर्ड प्रोपेगेशन वर्क करता है जिसके अंदर आप कुछ वेटेज की जो वैल्यू है उनसे इनिश इइ करते हैं और इनिश इइ करके आप यहां पे क्या करते हैं अपना जो भी वायर प्रिडिक्शन का जो फंक्शन है यस जो न्यूल नेट को ट्रेन करने के बाद जो वायर प्रिडिक्शन का जो फंक्शंस आपके पास निकला है यहां पर उसे आप बनाते हैं अब ये जो वाय प्रोडक्शन करता है यहां पर यह आपके पास जो आपका डिजायर आउटपुट होता है उससे मैच नहीं हो रहा होता है या फिर मैं बेसिक बात करूं यहां पर तो उसके अंदर लॉस बहुत ज्यादा हो र होते हैं तो अब आप क्या करते हैं लॉस को मिनिमम करने की कोशिश करते हैं अब इस लॉस को मिनिमम करने के लिए आप क्या करते हैं गाइज यहां पर अपने वेटेज और बायस की वैल्यू को अपडेट करते हैं अब वेटेज और बायस की वैल्यू को अपडेट करने के लिए आप यहां पे इस्तेमाल करते हैं बैक प्रोपेगेशन का और इस बैक प्रोपेगेशन के अंदर आपके पास जो इस्तेमाल होती है गाइज यहां पर दैट इज अ ग्रेडिएंट डिसेंट यस क्या इस्तेमाल होता है यहां पर ग्रेडिएंट आपके पास डिसेंट का यूज़ होता है इस ग्रेडन डिसेंट की हेल्प से आप क्या करते हैं यहां पर आपका जो वेटेज है और जो बायस है इनकी वैल्यू को क्या करते हैं हम अपडेट करते हैं और हम न्यू वेटेज और बायस की वैल्यू को क्या करते हैं फाइंड आउट करते हैं यहां पर राइट अब इस न्यू और वेटेज की वैल्यू को वाइंड आउट करने के लिए हम गेड इन डिसेंट का यूज़ करते हैं गेड इन डिसेंट जो आपके पास वर्क करता है वो लॉस के बेसिस पे करता है और लॉस को क्या करता है वो मिनिमम करता है अब देखिए जनरली जब हम यहां पर लॉस के फंक्शंस की बात करते हैं यहां पर तो लॉस का जो फंक्शन होता है यहां पर वो कैसा होता है वो आपका लगभग पैराबोलिक शेप के अंदर दिख रहा है यस कैसा दिखता है गाइज यहां पर यस मैं एग्जांपल के ऊपर बात करूं तो आपके कैसा दिखता है यहां पर इस तरीके शेप के अंदर दिखता है राइट दैट कॉल्ड ऑ पैराबोलिक शेप और ये पैराबोलिक शेप क्या करता है गाइज यहां पर आपको बेस्ट यहां पर वैल्यू फाइंड आउट करता है डब् की कैसे मिनिमम लॉस लाके मतलब आपके पास क्या करता है गाइज यहां पर इस ग्राफ का आपके पास जो ग्लोबल मिनीमा है यस अब मैंने यहां पे ग्लोबल आपके पास क्या किया मिनीमा यस ग्लोबल मिनीमा का जो पॉइंट है उसे फाइंड आउट करके आपके पास काम करता है तो क्या करता है गाइज यहां पर अब मैं इसे ग्लोबल मिनीमा नहीं बोलूंगा केवल एक ही पॉइंट है यहां पर मिनिम तो मैं यहां पर क्या करूंगा मिनिमम जो वैल्यू है उसे फाइंड आउट करता है लेकिन कभी-कभी क्या होता है कि हमारा जो डेटा सेट है वो कुछ इस तरह से होता है और कुछ लॉस फंक्शन ऐसे होते हैं यहां पर जिसकी वजह से हमारा जो यहां पे जो फंक्शन है यस ये जो लॉस और आपके पास किसी वैल्यू का जैसे हम w की वैल्यू फाइंड कर रहे हैं या फिर हम y की वैल्यू को फाइंड आउट कर रहे हैं इस वक्त जो हमारा लॉस और आपके पास यहां पर जो फंक्शन होता है गाइज यहां पर किसका किसका यहां पर लॉस ऑन वेटेज एंड बायस का जो फंक्शन होता है यस किसका मैं बात कर रहा हूं यहां पर लॉस एंड वेटेज का जो बा का फंक्शन होता है वो आपके पास क्या होता है यहां पर इस तरह के कर्वेचर में ले जाता है जहां पे हमारे पास बहुत सारे मिनिमम पॉइंट्स होते हैं अब इन मिनिमम पॉइंट के अंदर कुछ पॉइंट्स आपके पास क्या होता है लोकल मिनिम होते हैं यहां पर और आपका यहां पे जो मेन पॉइंट होता है वो आपका पास क्या होता है ग्लोबल मिनीमा होता है यस क्या होता है गाइज यहां पर ग्लोबल मिनीमा होता है तो अब यहां पे ग्रेडिएंट डिसेंट के अंदर क्या प्रॉब्लम है ग्रेडिएंट डिसन जब टेक्निक को हम इस्तेमाल करते हैं तो वो क्या करते हैं गाइज यहां पर आपके पास स्टेप बाय स्टेप आपके पास क्या करती है वेटेज और वायर्स की वैल्यू को अपडेट कर रही होती है वो भी आपके पास कैसे वो भी आपके पास सिंगल आपके पास लर्निंग रेट केल से जो हमने लैडा पड़ा था देखिए वेटेज की वैल्यू को अपडेट करने का फॉर्मूला हमने क्या देखा था वेटेज इक्वल्स टू मतलब मैं यहां पे न्यू वेटेज की बात करूं यहां पर तो वो क्या आएगा ओल्ड वेटेज - लडा / dl8 ज की वैल्यू को अपडेट करने का जो तरीका है ग्रेड एट डिसन टेक्निक यहां पर इस ग्रेडन डिसन टेक्निक के अंदर जो आपका लैडा है जो लर्निंग रेट है आपके पास यहां पर वो एक सिंगल लर्निंग रेट के हेल्प से क्या होता है ट्रेन कर रहा होता है अब जब ये सिंगल लर्निंग रेट के हिसाब से अपना ट्रेन कर रहा होता है तो यहां पर एक बहुत बड़ी प्रॉब्लम में फस जाता है और वो प्रॉब्लम कौन सी है कि मान लीजिए आपका डाटा पॉइंट यहां कहीं आपने पिक अप किया अब ये क्या कर रहा है वेटेज और बायस की वैल्यू को अपडेट करते करते आपके पास यहां वाले पॉइंट प पहुंच गया और इट्स कॉल्ड ऑफ लोकल मिनीमा यस इट्स कॉल्ड ऑफ लोकल मिनीमा तो वो लोकल मिनीमा के अंदर आके क्या होता है फर्स जाता है और आपका जो ओरिजिनल आउटपुट है वो आपको कभी अचीव नहीं होता है मतलब आपके पास लॉस जो है गाइज यहां पर वो एक समान रहता है भले आप उसे कितनी बार भी ट्रेनिंग कर ले आपका जो लॉस है वो आपके पास एक समान रहता है अब ये जो हम लोकल मिनीमा के अ अंदर फस चुके हैं यहां पर इससे बाहर निकालने की जो टेक्निक है इससे आपके पास यहां पे बाहर करना की जो टेक्निक है यहां पर दैट इज कॉल्ड ऑफ ऑप्टिमाइजर यस ऑप्टिमाइजर आपके पास यहां पर हेल्प करता है किस तरह के हेल्प करता है गाइज यहां पर कि आपके पास जब कभी भी आपका डेटा और लॉस का फंक्शन के बीच में आप ग्राफ बना रहे होते हैं या डेटा और लॉस का जो फंक्शन आप यूज़ कर रहे होते हैं वो आपके पास कभी-कभी क्या होता है आपके पास इस तरह के कर्वेचर्स में आ जाता है जहां पे बहुत सारे मिनिमम पॉइंट्स होता है और उनके अंदर एक आपके पास क्या होता है ग्लोबल मिनिमम पॉइंट होता है और आप कभी भी उस ग्लोबल मिनिम पॉइंट के पर अचीव नहीं कर पाते हैं तो उस मिनिमम पॉइंट से बाहर निकालने का जो काम करता है दैट इज अ ऑप्टिमाइजर यस यहां पे आपका इस पॉइंट से बाहर निकालने का जो काम करता है वो होता है ऑप्टिमाइजर तो ऑप्टिमाइजर क्या है गाइज यहां पर ऑप्टिमाइजर क्या है आपके पास एक तरह के एल्गोरिथम्स है क्या है यहां पर एल्गोरिथम्स है या फिर आप बोल सकते हैं मेथड है जो कि क्या करता है यूज टू चेंज द एट्रिल यहां हमें क्या करता है एट्रिल करता है चेंज करता है किसकी न्यूरल नेटवर्क की कैसे यहां पर सच एज यहां पे वेटेज हो गया और लर्निंग रेट हो गया टू रिड्यूस द लॉसेस हमें लॉसेस को रिड्यूस करने के लिए क्या करता है हेल्प करता है तो मेजर्ली ऑप्टिमाइजर उस वक्त काम में ले जाता है जब हमारे पास यहां पे इस तरह के कर्वेचर आता है जहां पे हमें बहुत सारे लोकल मिनीमा मिलते हैं और एक ग्लोबल मिनीमा मिलता है यहां पर और उस ग्लोबल मिनीमा को कभी भी हम अचीव नहीं कर पाते हैं तो उसको अचीव कराने के लिए हमारे पास क्या करता है ऑप्टिमाइजर हेल्प करता है अब ये ऑप्टिमाइजर कैसे-कैसे हेल्प करता है गाइज यहां पर तो इसके अंदर बहुत सारी चीजें होती है जैसे कि आपका जो वेटेज की वैल्यू को आप अपडेट कर रहे हैं यहां पर ये वेटेज की वैल्यू को अपडेट कर करते वक्त आप क्या इस्तेमाल कर रहे हैं आप यहां पर लॉस का फंक्शन का इस्तेमाल कर रहे हैं जो कि डब्लू से डिवाइड हो रहा है इसके साथ-साथ लर्निंग रेट का इस्तेमाल कर रहे हैं अब हमें क्या करना है यहां पर कि गाइस जब हम यहां पर चल रहे होते हैं जब हम यहां पर चल रहे होते हैं तो हमारे पास क्या होता है एक सिंगल कांस्टेंट आपका लर्निंग रेट चल रहा होता है मतलब आपका लर्निंग रेट की जो वैल्यू होती है गाइज यहां पर वो फिक्स रहती है और उस लर्निंग रेट की वैल्यू को फिक्स रहने के लिए फिक्स रहने की वजह से हम लोकल मिनिमम में जाके फंस जाते हैं अब हमें क्या करना है इस लर्निंग रेट की जो वैल्यू है इसे क्या करनी है अपडेट करनी है ताकि इस लोकल मिनि के पॉइंट से हम क्या करें बाहर निकल सकें राइट तो मेन काम क्या है गाइज यहां पर ऑप्टिमाइजर का कि हमें लोकल मिनिम में जो हम फस चुके हैं उससे बाहर निकालने का काम करता है इसके लिए ये क्या करते हैं कि जो हमारा लर्निंग रेट है इस लर्निंग रेट की वैल्यू को अलग-अलग करते हैं यस लर्निंग रेट की वैल्यू को वैरी करते हैं अब डिपेंडेंस रहता है कि आपके पास लर्निंग रेट की वैल्यू को किस तरह से अपडेट करना है जैसे एग्जांपल के तौर पे यदि मुझे यहां से यहां जाना है राइट यहां से यहां जाना है तो पहले मैंने क्या किया यहां पर यहां से यहां पे एक लर्निंग रेट पे आ गया लेकिन उसके बाद में मैंने क्या कि अपनी लर्निंग रेट को चेंज किया अकॉर्डिंग टू अवर डाटा तो फिर मैंने क्या किया यहां पर लर्निंग रेट को चेंज करते करते यहां पर पहुंचा तो बेसिकली यहां पर स्टेप क्या हो रहा है कि भाई आपको यहां पर हर एक हमारे वेटेज के ऊपर आपकी लर्निंग रेट जो है यहां पर डिफरेंट डिफरेंट होनी चाहिए तभी हम उस लोकल मिनीमा से क्या निकल सकते हैं बाहर निकल सकते हैं और ग्लोबल मिनीमा को अचीव कर सकते हैं इसके लिए हम यहां पर डिफरेंट डिफरेंट टाइप के ऑप्टिमाइजर को इस्तेमाल करते हैं अब ये डिफरेंट डिफरेंट टाइप के ऑप्टिमाइजर क्या है कैसे होते हैं जरा इनको समझते हैं तो हमारे पास कुल मिला के कुछ इतने इतने सारे आपके पास ऑप्टिमाइजर है जैसे कि हमारे पास क्या है आपके पास ग्रेडिएंट डिसेंट ऑप्टिमाइजर है उसके बाद च कोस्टिक ग्रेडिएंट डिसेंट ऑप्टिमाइजर है उसके बाद च कोस्टिक ग्रेडिएंट डिसेंट विद मोमेंटम ऑप्टिमाइजर है मिनी बैज ग्रेड एंड डिसेंट ऑप्टिमाइजर है एड ग्राड ऑप्टिमाइजर है आरएमएस प्रॉप आपके पास ऑप्टिमाइजर है एड डेल्टा ऑप्टिमाइजर है एंड एडम ऑप्टिमाइजर है तो ये कुछ ऑप्टिमाइजर होते हैं जिनकी हेल्प से हम हमारे जो लोकल मिनीमा के अंदर जो हमारा पॉइंट फस चुका है लोकल मिनीमा के अंदर हमारा न्यूरल नेटवर्क चुका है उसको बाहर निकालकर ग्लोबल मिनीमा को अचीव कराने में ये आपकी हेल्प करते हैं इनके अंदर जो आज के टाइम के जो सबसे फेमस जो टेक्निक है यहां पर जो हम आज के टाइम के अंदर हर जगह इस्तेमाल करते हैं दैट इज कॉल ऑफ एडम ऑप्टिमाइजर तो आने वाले वीडियो के अंदर हम यही समझेंगे कि जितने भी ऑप्टिमाइजर हैं ये कैसे वर्क करते हैं यहां पर और किस तरह से आपको लोकल मिनीमा से बाहर निकाल कर ग्लोबल मिनीमा तक पहुंचाते हैं राइट तो बेसिकली ऑप्टिमाइजर टेक्निक क्या है गाइज यहां पर आपकी जो ऑप्टिमम वैल्यू है यहां पर ऑप्टिमम वैल्यू का मतलब क्या है लॉस को मिनिमम करके जो आपकी ऑप्टिमम सॉल्यूशन मिलती है वेटेज एंड वाइज की यस उसको फाइंड आउट करने में आपकी हेल्प करते हैं तो आई थिंक आई होप सो समझ में आया होगा कि ऑप्टिमाइजर कैसे वर्क करता है और आज की इस वीडियो के जरिए हम बात करेंगे मल्टीलेयर प्र सेप्टन के बारे में इसके प्रैक्टिकल के बारे में तो चलिए अब जरा इसे शुरू करते हैं और देखते हैं कि कैसे प्रैक्टिकल होता है यहां पर यदि आपको पाइथन मशीन लर्निंग डाटा साइंस एंड डेटा एनालिसिस फील्ड में अपने आपको को ग्रो करना है तो इसके लिए लए कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो इसके लिए हमें एक डेटा सेट की जरूरत पड़ेगी तो देखिए मैंने एक डेटा सेट ले रखा है ट इज अ चुरून मॉडल के नाम से यहां पर डेटा सेट है जिसके अंदर क्या है कि कोई भी बैंक के अंदर जो कस्टमर है उस बैंक के कस्टमर का क्या क्रेडिट स्कोर रहा है यहां पर उसकी एज क्या है यहां पर उसका टर्नर क्या है यहां पर उसका बैलेंस कितना था मला अकाउंट बैलेंस में कितना था यहां पर उसके बाद नंबर ऑफ प्रोडक्ट्स उसने कितने ले रखे हैं अ उसके पास कोई क्रेडिट कार्ड था या नहीं था यस वो एक एक्टिव मेंबर था या नहीं था और उसकी जो एस्टिमेटर है वो कितनी थी और उसके ऊपर उस पर्सन ने हमारी बैंक को लीव किया है या नहीं किया है उसके रिगार्डिंग ये डाटा है तो मतलब बेसिकली बात गाइज यहां पर बात करें तो आपके पास क्या है ये एक बैंक का डाटा है जिसके ऊपर कोई पर्सन यहां पर बैंक को छोड़ के गया है या नहीं गया है उसका यहां पर डाटा दे रखा है अब यहां पे पर्टिकुलर कुछ डाटा के ऊपर आपके पास किसी पर्सन का यहां पर बैंक का छोड़ना या नहीं छोड़ना हमें यहां पर प्रेडिक्शन करना है यहां पर तो इसके लिए हम यहां पर इस्तेमाल कर रहे हैं मल्टी लेयर प्रेस पटन का मतलब बेसिकली गाइज मैं यहां पे बात करना चाहूं तो आर्टिफिशियल न्यूरल नेटवर्क का इस्तेमाल कर रहे हैं अब ये आर्टिफिशियल न्यूरल नेटवर्क कैसे वर्क करता है जरा आप इससे थोड़ा डिटेल के साथ समझते हैं तो इसके लिए आपको चलना है यहां पर इसके लिए हम चल रहे हैं यहां पर जुपिटर नोटबुक के अंदर और जहां पे जाके हम पहले सबसे पहले हमारी जो जुपिटर नोटबुक की जो नोटबुक है वो बना लेते हैं यहां पर और सबसे पहले जो रिक्वायर्ड लाइब्रेरी है सबसे इंपॉर्टेंट जो रिक्वायर्ड लाइब्रेरी है जिसके थ्रू हमारा डटा लोड होगा जिसके थ्रू हमारे ग्राफ्स बनेंगे वो पहले मैं यहां पे लोड कर लेता हूं तो उसके लिए मैं यहां पे क्या कर रहा हूं यहां पे गाइ इंपोर्ट कर रहा हूं पांडा को एस ऑफ पीडी जिसके के थ्रू हम यहां पे क्या करेंगे हमारे डटा को लोड करेंगे सबसे पहले हमारा जो डाटा है उसे लोड कर लेते हैं लोड करने के लिए पीडी डट यहां पर _ सीएवी का इस्तेमाल करूंगा जिसके अंदर जो हमारा चूरन मॉडल है उस डाटा को हम लोड कर लेंगे अब मैं क्या कर रहा हूं गाइज यहां पर डाटा को देख लेते हैं हैड लगा के इसके तीन डाटा को तो हमारे पास जो हमारा डाटा है वो हमें दिखाई देने लग गया है अब सबसे पहले हमारे डाटा के अंदर हमें क्या करना है नल वैल्यू को फाइंड आउट करना है यदि हमारे पास डाटा के अंदर नल वैल्यू है तो उसे हम फिल करेंगे नर वैल्यू नहीं है तो हम यहां पर आगे के प्रोसेस को फर्द स्टार्ट करेंगे तो चेक करते हैं इसके कोई नल वैल्यू प्रेजेंट है या नहीं है तो डटा सेट के अंदर जाके मैं यहां पे जाके इज नल को कॉल करूंगा यहां पर यस क्या करने वाले हैं यहां पर इज नल को कॉल करने वाले हैं इस नल के बाद में डॉट सम लगा के उसे रन करेंगे तो देखिए फिलहाल अभी यहां पर कोई भी नल वैल्यू प्रेजेंट नहीं है तो इसका मतलब हम आगे फर्द वर्किंग कर सकते हैं अब यहां पर नल वैल्यू नहीं है तो अब हम क्या करेंगे हमारे डेटा सेट को इनपुट और आउटपुट के अंदर अलग करेंगे एंड देन उसके बाद में हमारे जो डाटा है उसकी हम स्केलिंग करने वाले हैं तो चलिए यहां पर इनपुट और आउटपुट को अलग-अलग करते हैं तो उसके लिए मैं डेटा सेट के पास जाऊंगा और उस इसके बाद में इनपुट आउटपुट को अलग-अलग करने के लिए उसके लिए मैं यहां पे इनपुट अंडर डटा के नाम से एक वेरिएबल बना लेता हूं उसके लिए हम क्या कर रहे हैं डेटा सेट को कॉल करते हैं आई लॉक लेके आपके पास यहां पर सारा डाटा कंसीडर करते हैं यस सारी रो कंसीडर करते हैं और आपके पास जो इनपुट के अंदर जो हमारा एक्साइटेड वाला कॉलम है यहां पर इसे हम छोड़ देते हैं इसी तरह से मैं यहां पे आउटपुट अंडरस्कोर डाटा ले लेता हूं यहां पर जिसके अंदर हम क्या करेंगे गाइज यहां पर हमारा जो डेटा सेट है वो कंसीडर करेंगे आई लॉक लेंगे और सारी नंबर ऑफ रोज हमें यहां पर लेनी है और यहां पे -1 हमें लास्ट में छोड़ देना है राइट तो ये हमारा इनपुट आउटपुट डटा आ गया लेकिन हमें इनपुट जो डाटा हमारा है इसकी स्केलिंग करनी है स्केलिंग करने के लिए मैं फिर से ऊपर जाऊंगा यहां पर और क्या करूंगा गाइस यहां पर इंपोर्ट करूंगा इंपोर्ट किसे करेंगे यहां पर हम इंपोर्ट करेंगे साइक लन को साइक लन के बाद में हम यहां पे कॉल करेंगे किसे यहां पे गाइस आपके पास प्री प्रोसेसिंग को अ मैं एक काम करता हूं यहां पर फ्रॉम से इसे इंपोर्ट कर लेता हूं राइट तो देखिए मैं यहां पे क रहा हूं फ्रॉम लगा रहा हूं फ्रॉम के बाद में मैं साइकल लान पे जाऊंगा डॉट यहां पर हम प्री प्रोसेसिंग को कॉल करेंगे अब देखिए प्री प्रोसेसिंग हमारे पास दो बार आ गया तो मैं एक बार ये जो साइक लान से यहां पर हटा देता हूं यहां पर उसके बाद में गाइज यहां पर मैं इंपोर्ट कर रहा हूं इंपोर्ट किसे कर रहे हैं यहां पर तो हम यहां पर इंपोर्ट करेंगे स्टैंडर्ड स्केलर को तो मैं स्टैंडर्ड स्केलर को कॉल कर रहा हूं जिसके थ्रू हम स्केलिंग करेंगे आ जाइए अब हम स्केलिंग करने वाले हैं हमारे डाटा को कैसे करेंगे स्केलिंग यहां पर तो उसके लिए मैं यहां पर एसएस के नाम से एक वेरिएबल बना रता हूं और स्टैंडर्ड स्केलर को कॉल कर देता हूं उसके बाद एसएस डॉट यहां पे क्या करेंगे हम हमारे डाटा को फिट करेंगे एंड फिट की जगह मैं यहां पे क्या कर रहा हूं फिट ट्रांसफॉर्म करूंगा डायरेक्टली फिट ट्रांसफॉर्म कर सकते हैं आप अपने डाटा को जिसके अंदर हमारा जो इनपुट है उसे हम यहां पर लगा देंगे तो हमारा जो डाटा है यहां पर वो आपका स्केलिंग हो चुका है अब उसके बाद में इसको वापस डटा फ्रेम में कन्वर्ट कर लेते हैं डटा फ्रेम में कन्वर्ट करने के लिए मैं वापस यहां पर पहले तो इसको इनपुट अंडर डाटा में प्लेस करूंगा डेटा फ्रेम में कन्वर्ट करने के लिए पडी डटा फ्रेम को कॉल करूंगा यहां पर जिसके अंदर ये हमारा डाटा हो जाएगा और हमारे कॉलम की बात बात करें यहां पर तो कॉलम्स इक्वल्स टू क्या करेंगे गाइ यहां पर इनपुट अंडरस्कोर डाटा को लेके डॉट कॉलम को कॉल कर देते हैं राइट कॉलम्स को कॉल कर देते हैं और रन कर देते हैं तो हमारा जो इनपुट डाटा है वो आ चु चुका है और वो भी किस फॉर्मेट के अंदर स्केलिंग हु है डाटा के अंदर तो देखिए हमारा डाटा क्या हो चुका है यहां पर स्केलिंग हो चुका है अब यहां पे पॉइंट ये आता कि स्केलिंग करने की क्या जरूरत थी तो इसका जवाब आने वाले वीडियो के अंदर आपको पता चल जाएगा कि हमारा जो डाटा हमें मिलता है यहां पर उसको स्केलिंग क्यों करनी है यहां पर जब भी आप आर्टिफिशियल न्यूल नेटवर्क में काम कर रहे हैं जब भी आप यहां पर डीप लर्निंग में काम कर रहे हैं तब आपको एक चीज का स्पेशली ध्यान रखना है कि आपका डाटा जो है वो स्केलिंग हुआ हुआ रहना चाहिए विदाउट स्केलिंग डाटा आपको नहीं कंसीडर करना चाहिए स्केलिंग हुआ हुआ डाटा के ऊपर ही आपको वर्क करना चाहिए चलिए आगे बढ़ते हैं यहां पर आगे बढ़ के अब हम क्या करते हैं हमारा आर्टिफिशियल न्यूरल नेटवर्क बनाते हैं कैसे बनाएंगे तो उसके लिए हमें जरूरत पड़ेगी टेंसर फ्लो की एंड उसके साथ-साथ हमें जरूरत पड़ेगी केरा की ये दो मॉड्यूल आपके सिस्टम के अंदर क्या करना है इंस्टॉल कर लेना है यहां पर उसके बाद आप आगे वर्किंग कर पाएंगे तो चलिए यहां पर स्टार्ट करते हैं तो सबसे पहले मैं क्या करूंगा यहां पर इंपोर्ट करूंगा इंपोर्ट कैसे करूंगा गाइज यहां पर टेंसर फ्लो को तो मैं यहां पे इंपोर्ट कर लेता हूं टेंसर फ्लो को टेंसर फ्लो इंपोर्ट होने के बाद में अब आपको क्या करना है यहां पर फ्रॉम आपको जाना है केरा के अंदर केरा के अंदर जाने के बाद में आप आपको यहां पे चूज करना है लेयर्स को लेयर्स के अंदर आप जाके क्या करेंगे इंपोर्ट करेंगे और इंपोर्ट किसे करना है गाइ यहां पर डेंस लेयर को इंपोर्ट करना है उसके बाद यहां पे फॉर्म केरा के अंदर जाना है यहां पे फिर से केरा के अंदर जाने के बाद में आपको कॉल करना है मॉडल को मॉडल के अंदर जाके कॉल इंपोर्ट करना है यहां पर यस इंपोर्ट किसे करने हैं यहां पर सीक्वेंस को यस आपको सीक्वेंशियल को कॉल करना है दैट्ची जें आपके पास क्या करेंगी आपके पास आर्टिफिशियल न्यू नेटवर्क बनाने में आपके हेल्प करेेगी चलिए अब थोड़ा आगे बढ़ते हैं यहां पर अब हमारा जो नेटवर्क्स है वो बनाना स्टार्ट करते हैं तो मैं देखिए ए के नाम से हमारा नेटवर्क बना रहा हूं यहां पर सबसे पहले मैं यहां पर क्या करूंगा सीक्वेंशियल को यहां पे कॉल करूंगा और उसे रन कर दूंगा उसके बाद में आपको क्या करना है ए ए डॉट यहां पर ऐड करना है और ऐड किसे करना है गाइज यहां पर ऐड आपको यहां पर करना है डेंस लेयर को इस डेंस लेयर के अंदर बहुत सारी चीजें आएगी जैसे आपके पास नंबर ऑफ यूनिट्स आपके जाएगी एक्टिवेशन फंक्शन जाएगा यहां पर उसके बाद यहां पर बाय लाइजर जाएगा कर्नल इंटरनल इं सलाइज जाएगा और भी बहुत सारी चीजें जाने वाली है तो चलिए एक-एक करके यहां पर इराइज करते हैं सबसे पहले है आपके पास कि जो पहली आपकी डेंस लेयर बनने वाली है मतलब पहली जो आपकी लेयर बनने वाली है पहली जो हिडन लेयर बनने वाली है उसके अंदर नंबर ऑफ नोड्स कितने होने चाहिए ये हमें आइडेंटिफिकेशन को कॉल कर दूंगा तो देखिए इनपुट नोट कितने है गाइस यहां पर इनपुट नोट हमारे एट है हम यहां पर एट नोट देने वाले हैं तो मैं एक काम करने वाला हूं गाइस यहां पर एट से थोड़ा कम मैं यहां पर सिख सकूंगा क्योंकि यहां पे जो मैं पैटर्न बनाने जा रहा हूं दैट इ अ रिकल पैटन तो मैं यहां पे रिकल पैटर्न बनाने जा रहा हूं उसके बाद में यहां पर इनपुट अंडरस्कोर यहां पे डायमेंशन देंगे यस इनपुट अंडरस्कोर डायमेंशन देंगे इनपुट डायमेंशन कितनी है एट आने वाली है और यहां पर एक्टिवेशन फंक्शन े एक्टिवेशन फंक्शन के अंदर मैं रलो का इस्तेमाल करने वाला हूं अब रलो क्यों इस्तेमाल करना है इसके बारे में हम पहले से ही जान चुके हैं उसके बाद में हमारे पास एक लेयर बनने के बाद में मैं यहां पे दूसरी लेयर और बनाऊंगा तीसरी लेयर और बनाऊंगा और चौथी लेयर बनाऊंगा देखिए जो पहली लेयर है उसमें सिक्स नोड होने वाले हैं दूसरी लेयर के अंदर हम यहां पर फोर नोड लेने वाले हैं और अब मुझे यहां पर इनपुट डायमेंशन की जरूरत नहीं रहेगी क्योंकि एक बार ही आपको इनपुट डायमेंशन देनी है जब आप यहां पर पहली बार वर्क कर रहे हैं तब उसके बाद जो अगले लेयर के अंदर जो नोट रखने वाला हूं मैं टू रखने वाला हूं यहां पर और एक्टिवेशन फंक्शन रिलो रखने वाला हूं उसके बाद जो लास्ट नोड है मैं यहां पे वन रखूंगा रीजन क्यों क्योंकि हमारा जो आउटपुट है वो रो या वन के फॉर्मेट में आने वाला है तो रो और वन के फॉर्मेट में आने के लिए हमारे पास आउटपुट क्या होना चाहिए सिंगल आउटपुट होना चाहिए इसलिए मैंने यहां पर ये वन रखा है उसके बाद में हमारा जो नेक्स्ट टारगेट है दैट इज कॉल्ड ऑफ एक्टिवेशन फंक्शन तो लास्ट वाले का एक्टिवेशन फंक्शन मैं चेंज करूंगा और यहां पर मैं सिगमॉड एक्टिवेशन फंक्शन को इस्तेमाल कर रहा हूं सिगमॉड एक्टिवेशन फंक्शन इसलिए क्योंकि जो हमारा आउटपुट है वो कैसा है बाइनरी फॉर्मेट के अंदर है इसलिए हम यहां पर सिगम एक्टिवेशन फंक्शन को इस्तेमाल कर रहे हैं चलिए ये हमारा ए का नेटवर्क हमारा तैयार हो चुका है उसके बाद में ए डॉट आपको क्या करना है यहां पे गाइस कंपाइल करना है यहां पर कंपाइल करने के वक्त आपको क्या-क्या चीजें लगानी है तो कंपाइल के अंदर भी आपके पास क्या-क्या आता है ऑप्टिमाइजर आता है लॉस आता है और मैट्रिसेज आती है चलिए सबसे पहले बात करते हैं ऑप्टिमाइजर के लिए तो देखिए जब आप ऑप्टिमाइजर लगा होते हैं यहां पर तो इस वक्त सबसे जो अच्छा ऑप्टिमाइजर है दैट इज द एडम ऑप्टिमाइजर तो आपको एडम ऑप्टिमाइजर लगाना है यहां पर उसके बाद में नेक्स्ट जो टारगेट आपके पास आता है गाइज यहां पर लॉसेस तो देखिए लॉसेस के तौर पे आप यहां पे बाइनरी क्रॉस एंट्रोपिक जो आपका डिजायर आउटपुट है वो कैसा है बाइनरी फॉर्मेट में है इसलिए आपको बाइनरी क्रॉस एंट्रोपय गाना है तो मैं यहां पे क्या लगा रहा हूं बाइनरी अंडरस्कोर मैं यहां पे क्रॉस एंट्रोपिया रहा हूं यहां पर और मैट्रेस के अंदर की बात करें यहां पर तो मैट्रेस के अंदर आपको एक्यूरेसी आपको लगानी है यहां पर ठीक है तो मैंने एक्यूरेसी लगा दिया है अब हमारे मॉडल को कंपाइल करते हैं कंपाइल करने के बाद में अब हमारे मॉडल को क्या करना है फिट करना है फिट करने के लिए एंड डॉट यहां पर क्या करेंगे गाइज यहां पर फिट को कॉल करेंगे और फिट के अंदर जाने के बाद में मुझे क्या कॉल करना है यहां पर x ट्रेन और y ट्रेन लगाना है देखिए हमने यहां पर हमारे डाटा को अभी ट्रेन और टेस्ट के अंदर स्प्लिटिंग नहीं किया है तो पहले हम क्या करते हैं हमारे डाटा को ट्रेन और टेस्ट के अंदर स्प्लिटिंग करते हैं उसके लिए जो रिक्वायर्ड लाइब्रेरी है उसे कॉल करते हैं यहां पर तो मैं फ्रॉम फिर से साइकल लान के अंदर जाऊंगा डॉट यहां पर क्या करने वाला हूं मॉडल सिलेक्शन को कॉल करने वाला हूं मॉडल सिलेक्शन के अंदर जाने के बाद इंपोर्ट करूंगा और इंपोर्ट किसे कर रहे हैं गाइज यहां पर ट्रेन और टेस्ट स्प्लिटिंग को चलिए आ जाते हैं यहां पर और अब ये जो ट्रेन ऑ टेस्ट स्लेडिंग है ये हमें चार डाटा देगा कौन-कौन से x यहां पर ट्रेन देने वाला है x अंड यहां पर टेस्ट देने वाला है y अंडर यहां पर ट्रेन देने वाला है और y अंडर आपके पास यहां पर टेस्ट देने वाला है और ये जो ट्रेन टेस्ट स्लिटिंग है इसे हम कॉल कर देंगे यहां पर हमारे पास जो डाटा है वो इनपुट अंडर डटा एंड आउटपुट अंडरस्कोर डाटा के तौर पे जाएगा उसके बाद बाद में हमारे पास जो हमारा डाटा है इसको हमें स्प्लिट करना है मतलब आपके पास ट्रेनिंग और टेस्टिंग साइज देनी है तो मैं यहां पर टेस्ट साइज दे देता हूं टेस्ट साइज मैंने 0.20 दे दिया यहां पर उसके बाद गाइज यहां पर हमें रेंडम स्टेट देना है रैंडम स्टेट की वैल्यू मैं 42 यहां पर रख रहा हूं चलिए अब हमारे पास यहां पर हमारा जो डाटा वो ट्रेन ट स्प्लिटिंग के अंदर अलग-अलग हो चुका है तो चलिए अब फिट के अंदर क्या करते हैं गाइज यहां पर x ट्रेन देते हैं और क्या देना है यहां पे गाइज y ट्रेन देना है उसके बाद जो नेक्स्ट चीज है यहां पर वो होती है हमारी बैच साइज यस बैच साइज हमें कितनी देनी है वो हमें बताना पड़ेगा तो गाइज यहां पर बेस्ट साइज की तौर पे मैं यहां पे देखूंगा यहां पर पहले तो देखूंगा हमारा डटा कितना है तो बेसिकली हमें यहां पे क्या करना है जो हमारा ट्रेनिंग डाटा है उसको हमें चेक करना पड़ेगा तो इसके लिए मैं यहां पर चेक करूंगा कि हमारा ट्रेनिंग डाटा कितने में डिवाइड हुआ है तो देखिए x 10 को लेना है फिर से कॉल करना है और डॉट यहां पर मैं शेप को कॉल करूंगा शेप के अंदर हमें पता चला कि इसके अंदर 8000 रो है तो देखिए 8000 रो है तो इसका मतलब क्या होगा कि मैं यहां पर 100 100 के यहां पे बैचेज बनाने वाला हूं राइट उसके बाद में क्या है गाइज यहां पर उसके बाद है हमारे पास इपोज इपोज मतलब कितनी बार हमें यहां पर ये रूल को चलाना है यहां पर तो इसके लिए मैं यहां पर क्या करने वाला हूं 10 इपोच को यहां पर अप्लाई करूंगा उसके बाद देखिए नीचे आपके पास क्या है वेर बॉस है उसके बाद कॉल बैक वगैरह यहां पर है ये आने वाले वीडियो के अंदर हम डिटेल के साथ समझेंगे कि इनको कब और कहां इस्तेमाल करना है चलिए अभी हम इसे क्या करते हैं फिलहाल रन करते हैं तो देखिए हमारे जो बैचेज हैं वो बनना स्टार्ट हो चुके हैं और एक छोटी सी मिस्टेक की वजह से ये अटक चुका है ओके चलिए एक छोटी सी गलती की वजह से हमारा मॉडल रुक चुका था लेकिन हमने फिर से ट्रेन कर दिया है और ट्रेन करने के बाद देखिए हमारे मॉडल की जो एक्यूरेसी है वो अब हम क्या करते हैं हमारे डाटा के अंदर देखते हैं कि हमारे मॉडल की एक्चुअल एक्यूरेसी कितनी है और इसके साथ-साथ हम यहां पे देखते हैं कि हमारा मॉडल का प्रेडिक्शन मॉडल कैसे बना है तो देखिए एक्यूरेसी यहां पर आप डायरेक्टली नहीं दे सकते उसके लिए हमें यहां पर साइकल लर्न को इस्तेमाल करना पड़ेगा और साइकल लर्न के थ्रू हमें एक्यूरेसी को कॉल करना पड़ेगा उसके लिए मैं फ्रॉम फिर से साइकन के अंदर जाऊंगा यहां पर डॉट यहां पर किसके अंदर जाएंगे मैट्रेस के पास जाएंगे और मैट्रेस के अंदर जाने के बाद इंपोर्ट करेंगे यहां पर किसे इंपोर्ट करेंगे यहां पर एक्यूरेसी स्कोर को तो मैं यहां पर एक्यूरेसी स्कोर को कॉल कर रहा हूं उसके बाद में देखिए ये जो एक्यूरेसी स्कोर फोर है हमारा यहां पर इसको जब हम कॉल कर रहे हैं तो ये हमें क्या पूछता है यहां पर एक तो y ट्रू वैल्यू पूछता है एक y पीआरडी वैल्यू पूछता है तो पहले हमें क्या करना पड़ेगा y की प्रेडिक्शन वैल्यू निकालनी पड़ेगी y की प्रेडिक्शन वैल्यू निकालने के लिए ए डॉट यहां पे क्या करेंगे प्रिडिक्ट फंक्शन का कॉल करेंगे प्रिडिक्ट फंक्शन के अंदर मैं यहां पे क्या करूंगा x अंड जो टेस्ट है यहां पर वो पास कराऊंगा जैसे ही मैं x टेस्ट पास करा रहा हूं मुझे यहां पर कुछ ना कुछ आउटपुट देखने को मिल रहा है अब ये जो आउटपुट है ये हमें किसके तौर पर मिल रहा है ये हमें जो आउटपुट देखने को मिल रहा है ये हमें यहां पर नंबर्स के फॉर्मेट में मिल रहा है ना कि हमें जीरो और वन के फॉर्मेट में मिल रहा है मतलब बाइनरी में नहीं मिल रहे मुझे कंटीन्यूअस डटा में अंदर मिल र है अब ये जो आप देख रहे हैं यहां पर ये जीरो और वन के बीच में हमें आउटपुट देखने को मिलाहा है तो अब हमें क्या करना है यहां पर ये जो पेडिक फंक्शन मिला है इसके ऊपर हम क्या करेंगे कंडीशन लगाएंगे कि आपके पास ये जो डाटा है ये फ से ग्रेटर देन है या प फ से लेस देन है ये हमें यहां पर चेक करना है तो चलिए इस आउटपुट को हम क्या करते हैं किसी में सेव कर लेते हैं जस्ट लाइक मैं पी आर के अंदर यहां पे क्या करता हूं पीआरडी के अंदर इसे सेव कर लेता हूं राइट अभी देखिए यहां पर मैं पीआरडी को यदि मैं रन करूं तो यहां पे मुझे ये डाटा देखने को मिलता है अब मुझे क्या करना है इसका एक-एक डाटा लेके आना है मतलब मुझे इसको इटरेट करना है देखिए इसको इटरेट करते हैं यहां पर और फिर हम यहां पे क्या करेंगे सेव करेंगे 01 के तौर पे तो मैं यहां पे फो लूप चलाऊंगा फॉर आई इन क्या कर रहे हैं गाइज यहां पर रेंज का इस्तेमाल कर रहे हैं फॉर आई इन यहां पे क्या कर रहे हैं पीआरडी का इस्तेमाल कर रहे हैं यहां पर और उसके बाद मैं क्या कर रहा हूं गाइज यहां पर प्रिंट ऑफ आई कर रहा हूं तो देखिए हमारे पास हर एक डाटा मिलने लग गया है यहां पर अब इसके अंदर ये जो डेटा आ रहा है ये लिस्ट के तौर पे आ रहा है तो मैं यहां पे स्क्वायर ब्रैकेट ऑफ 0 कर देता हूं यहां पर तो मुझे मेरा ओरिजिनल डाटा देखने को मिल गया अब मुझे यहां पे क्या करना है सेव करना है रो और वन के तौर पे तो मैं यहां पे क्या कर रहा हूं पी आरडी अंडर डाटा के नाम से एक वेरिएबल बना देता हूं और इसको लिस्ट के अंदर सेव कर लेता हूं अब मैं यहां पे क्या कर रहा हूं कंडीशन स्टेटमेंट लगा रहा हूं यहां पर क्या कंडीशन स्टेटमेंट लगा रहा हूं इफ आपकी जो वैल्यू है यहां पर वैल्यू मतलब i स् ऑ 0 की जो डाटा यहां पर वो आपके पास ग्रेटर दन 0.5 आ जाए यहां पर तो अब हमें क्या करना है गाइस यहां पर हमें ये जो पीआरडी है यस पीआरडी डॉट यहां पीआरडी अ जो डटा है यहां पर इसके अंदर क्या करना है गाइज यहां पर अपेंड करना है और अपेंड क्या करना है गाइज यहां पर अपेंड हमें करना है यहां पर ग्रेटर दन 0.5 के ऊपर हमें वन अपेंड करना है और नहीं तो हमें यहां पर एल्स अपेंड करना है और एल्स में हमें क्या करना है पीआरडी अर जो डटा हमारे पास है यहां पर इसके अंदर हम क्या करेंगे यहां पर अपेंड करेंगे और अपेंड क्या करेंगे गाइज यहां पर जीरो मतलब ग्रेटर दन 0.5 पे हम वन अपेंड करेंगे और लेस दन 0.5 के अ पर क्या करेंगे जीरो पन करेंगे चलिए रन करते हैं हमारा डटा यहां पे आ चुका है अभी देखिए अब हम क्या कर रहे हैं गाइज यहां पर यहां पर पीआरडी अको जो डेटा है यहां पर उसे रन करते हैं तो हमारे पास देखिए डाटा 0 और 0.5 के बीच में हमारा जो डाटा आ चुका है और ये ऑलमोस्ट सारा डाटा क्या आ रहा है जीरो ही आ रहा है यहां पर यस ऑलमोस्ट सारा डाटा हमारे पास क्या आ रहा है रो ही आ रहा है कोई बात नहीं अभी हम उसे चेक कर लेंगे कि हमारा मॉडल एक्यूरेसी कितनी है देखिए अभी हमारे पास क्या है y ट्रू है y ट्रू के अंदर हमारे पास क्या है y आपके पास टेस्ट है यहां पर और आपके पास y ट्रू के अंदर बात करें तो वो आपके पास क्या है यहां पर पीआरडी डाटा के तौर पे तो मैं यहां पर पीआरडी अ डाटा के तौर पे दे दूं तो देखिए हमारे पास जो रिजल्ट निकल के आया गाइज यहां पर वो 80 पर एक्यूरेसी के साथ निकल के आया है मतलब हमारा जो मॉडल है यहां पर वो 80 पर एक्यूरेसी के साथ वर्क कर रहा है अब इसी के साथ-साथ मुझे यहां पे क्या करना है ये आपके पास यहां पे किसकी है टेस्टिंग की एक्यूरेसी है मुझे मेरे मॉडल की ट्र ट्रेनिंग की एक्यूरेसी भी देखनी है ट्रेनिंग की एक्यूरेसी देखने के लिए मैं y अंडरस्कोर क्या करूंगा ट्रेन लगाऊंगा लेकिन यहां पर मुझे क्या करना है वा पीआरडी डाटा देना है यहां पर किसका देना है हमें गाइ यहां पर ये हमें देना है y आपके पास यहां पर जो आपके पास x ट्रेन गया है उसका अब x ट्रेन गया है उसका हमें देना है यहां पर तो मुझे फिर से ये वाला जो काम है वो मुझे दोबारा फिर से लगाना पड़ेगा तो फिलहाल इसको मैं यहां पे क्या करता हूं ऊपर रख देता हूं यहां पर और एक बार और मैं यहां पे अप्लाई कर लेता हूं और देखता हूं हमारा मॉडल ओवरफिटिंग तो नहीं हुआ है इस ओवरफिटिंग को चेक करना पड़ेगा और ओवरफिटिंग को चेक करने के लिए गा यहां पर मैं पीआरडी वन कर रहा हूं और डटा वन कर रहा हूं और यहां पे भी पीआरडी व डटा वन और डटा वन का इस्तेमाल करूंगा उसके बाद में ये x अंड टेस्ट है इसको हटा के मैं x ट्रेन लगा दूंगा रन करेंगे हमारा जो ट्रेनिंग डाटा है वो हमारे पास आ चुका है किसके अंदर हमारे पास पीआरडी अ डटा व के अंदर चलिए पीआरडी अ डटा व दे के रन करते हैं यहां पर तो हमारे मॉडल की एक्यूरेसी कितनी आ रही है यहां पर 79 आ रही है और यहां पे कितनी आ रही है 80 आ रही है तो कहीं ना कहीं कुछ ना कुछ आपके पास क्या हो रही है मिस्टेक हो रही है इसको हमें देखना पड़ेगा इसको देखने के लिए हम क्या करेंगे जो हमारे नंबर ऑफ पपोज है इसको हम बढ़ाएंगे नंबर ऑफ पपोज को मैं कर देता हूं यहां से 50 ताकि हमारा जो मॉडल है वो और भी अच्छे तरीके से ट्रेड हो सके चलिए एक बार हम क्या करते हैं यहां पे गाइस ऊपर से वापस एन के मॉडल को स्टार्ट करते हैं हम सीक्वेंशियल से स्टार्ट करते हैं फिर उसके बाद यहां पे कंपाइल करते हैं मॉडल को फिर हम हमारे मॉडल को फिट करते हैं फिट के वक्त ये 50 बार क्या होगा ट्रेंड होगा और देखिए मैंने क्या किया यहां पर 100 आपके पास यहां पे डाटा बनाया है मतलब बेसिकली गाइज यहां पर जो आपके पास 800 आपके पास यहां 8000 जो आपका डाटा है इसके मैंने क्या किया है 100 100 ट के पैकेज बनाए हैं मतलब एक पैकेज आपके पास कितने का होने वाला है 80 का आपके पास यहां पे होने वाला है वो मैंने यहां पे बनाया है तो देखिए आपके पास जो मॉडल है वो यहां पर ट्रेड हो रहा है और ये 50 टाइम हमारा मॉडल ट्रेन हो चुका है अब देखिए मैं हमारी ट्रेनिंग की एक्यूरेसी देखना चाहूंगा उसके बाद हमारी जो टेस्टिंग एक्यूरेसी है वो भी मैं यहां पे देखना चाहूंगा इसके लिए मैं साइकल एन को कॉल करता हूं एक्यूरेसी स्कोर को कॉल करता हूं एक्यूरेसी स्कोर जो टेस्टिंग का है वो कितना आ रहा है 85 आ रहा है और यदि मैं ट्रेनिंग का देखूं तो आपके पास 84.5 आ रहा है लगभग आपके पास यहां पर ओवर फिटिंग का सिनेरियो खत्म हो चुका है तो गाइ इस तरह से हमारा जो मॉडल है वो ट्रेड हो चुका है अब यदि हमारे पास कोई नया डाटा आता है तो उसके ऊपर ये हमारा मॉडल कैसे वर्क करेगा उसके लिए हम कैसे काम करेंगे तो यदि आपके पास कोई नया डाटा आता है उसके ऊपर हम कैसे काम करेंगे तो देखिए सबसे पहले मैं यहां पे आ जाता हूं और आपको बताता हूं कि नए डाटा के ऊपर हमारा मॉडल कैसे काम करेगा तो देखिए सबसे पहले आप नीचे आ जाइए नीचे आने के बाद में यहां पे रन कर लीजिए अब आपको क्या चाहिए पीआरडी डाटा चाहिए तो देखिए मैं यहां पे क्या कर रहा हूं पीआरडी अंडर जो डाटा है यहां पर वो लगा देता हूं अब जो भी नया डाटा आएगा वो कहां देना है आपको x टेस्ट कर अने देना है जैसे कि x टेस्ट के अंदर यदि मैं कोई नया डाटा डालता हूं जैसे एग्जांपल के तौर पे हम ऊपर चलते हैं और कोई भी डाटा उठा के लाते हैं ठीक है और डाटा कहां से लाना है x टेस्ट चलाना है लेट्स सपोज x टेस्ट चलाना है राइट तो मैं यहां पे चलता हूं और ये जो x टेस्ट है इसे रन कर देता हूं अब ये जो हमारा पहला नंबर ऑफ डाटा है यहां पर मैं इसे यहां पे क्या कर रहा हूं गाइस कॉपी कर लेता हूं और कॉपी करके जाके यहां पे चेक करता हूं कि जो मेरा पहला डाटा है उसका रिजल्ट क्या निकलता है क्या मेरा डाटा का पहला रिजल्ट जो है वो सही निकलता है या गलत निकलता है चलिए इसको समझने के लिए मैंने अपना डाटा ले लिया है और जो भी हमने डाटा लिया है यहां पर इसको टू डायमेंशन के अंदर कर देते हैं पहले तो जितने भी हमारे स्पेसेस हैं उनको मैं कॉमा से सेपरेट कर देता हूं क्योंकि हमारा जो डाटा होता है वो सारा कैसा होता है कॉमा सेपरेटेड होता है तो मैं यहां पे कॉमा सेपरेटेड कर देता हूं हमारा जितना भी डटा है उसको और फिर चेक करते हैं इसका रिजल्ट क्या निकल के आ रहा है राइट तो मैं यहां पे क्या कर रहा हूं हमारा जितना भी डाटा है उनको कॉमा सेपरेटेड यहां पे बना रहा हूं ताकि हमारा जो ओरिजिनल डाटा होता है वो भी आपके पास क्या होता है इस तरह से कॉमा सेपरेटेड ही हमें देखने को मिलता है चलिए अब हम इसे रन करते हैं और प्रेडिक्शन वैल्यू क्या आई है यहां पर जीरो आई है चलिए y टेस्ट की एक्चुअल वैल्यू देख लेते हैं कि y टेस्ट हमें क्या रिजल्ट दे रहा है तो y टेस्ट हमारा पहले रिजल्ट का आंसर क्या दे रहा है रो ही दे रहा है तो इसका मतलब क्या हुआ गाइज यहां पर जो हमारा एए नेटवर्क बना है वो बहुत ही सही बना है यहां पर अब जरा थोड़ा सा ऊपर चलके देख लेते हैं ये क्या चीज है तो देखिए ट द फर्स्ट हिडन लेयर है हमारी उसके बाद ये हमारी सेकंड हिडन लेयर है ये हमारी थर्ड हिडन लेयर है और ये हमारी फाइनल लेयर है जिसके अंदर हमारा सिंगल आउटपुट यहां पर निकल के आ रहा है उसके बाद हमने हमारे मॉडल को क्या किया है कंपाइल किया है कंपाइल करने का मतलब क्या है उसे रन किया है और उसके बाद हमने हमारे मॉडल को क्या फिट किया है फिट का मतलब क्या है कि जो भी हमारा डाटा है उसके ऊपर हमारा मॉडल हमने क्या किया ट्रेन किया ट्रेन करने के बाद में हमने हमारे मॉडल की क्या निकाली है गाइज यहां पर एक्यूरेसी निकाली है एक्यूरेसी के लिए हमने क्या किया है यहां पर पेडिट फंक्शन का इस्तेमाल किया है और एक्यूरेसी के लिए हमने क्या किया है साइकिल न का इस्तेमाल करते हुए आपके पास एक्यूरेसी स्कोर को कॉल करके हमने यहां पे एक्यूरेसी निकाली है और फिर उसके बाद कोई भी नया डेटा आ जाए तो उसके ऊपर हम इस तरीके से प्रेडिक्शन कर सकते हैं तो आई थिंक आई होप सो समझ में आ गया होगा यहां पर कि किस तरीके से हम ए ए का मॉडल बना सकते लेकिन फिलहाल अभी यह एन का मॉडल अच्छे तरीके से ट्रेंड नहीं हुआ यहां पर यस इसके अंदर बहुत सारी मिस्टेक है हम इस मॉडल को और अच्छे तरीके से इंप्रूव कर सकते हैं इस इंप्रूव को लाने के लिए हमें कुछ स्टेप्स को फॉलो करना पड़ेगा अब वो स्टेप्स कौन-कौन से हैं तो वह हम जानेंगे हमारे अगले वीडियो के अंदर और हम एक-एक वीडियो यहां पर बनाने वाले हैं जिसके अंदर इंप्रूवमेंट के जितने भी टेक्निक है उनको हम डिटेल के साथ देखने वाले हैं और आज के इस वीडियो के जरिए हम बात करेंगे कि हम हमारे न्यूरल नेटवर्क को कैसे इंप्रूव कर सकते हैं तो पहले ये जानते हैं कि हमारे न्यूरल नेटवर्क के अंदर क्या-क्या प्रॉब्लम्स हो सकती है और किस-किस तरीके से उस प्रॉब्लम को दूर कर सकते हैं देखिए सबसे पहले जब आप अपने न्यूरल नेटवर्क को ट्रेन करते हैं तो न्यूरल नेटवक को आप बेसिक तरीके से ट्रेंड करते हैं जिसकी वजह से आप अपनी एक्यूरेसी को कभी अचीव नहीं कर पाते मतलब आपको बेस्ट एक्यूरेसी कभी नहीं मिल पाती है तो इस एक्यूरेसी को दूर करने के लिए हम यहां पर हाइपर पैरामीटर को ट्रेन कर सकते हैं मतलब हाइपर पैरामीटर की ट्यूनिंग कर सकते हैं बेसिकली हमारे पास बहुत सारे तरीके के हाइपो पैरामीटर्स होते हैं उन हाइपो पैरामीटर को टन करके हम हमारे मॉडल की एक्यूरेसी को इंप्रूव कर सकते हैं अब मैं बात करना चाहूंगा कि ये हाइपो पैरामीटर कौन-कौन से होते हैं यहां पर तो देखिए जब भी आप किसी न्यूरल नेटवर्क को ट्रेन करते हैं तो उसके अंदर आपने बेसिकली कुछ-कुछ चीजें देखी थी जैसे एग्जांपल के तौर पर मैं बात करूं सबसे पहले आपके पास क्या होती है नंबर ऑफ आपके पास क्या होती है गाइज यहां पर हिडन लेयर यस नंबर ऑफ के पास क्या होती है हिडन लेयर होती है यहां पर तो आप अपने नंबर ऑफ डन लेयर को कम या ज्यादा करके आप इस्तेमाल कर सकते हैं राइट आपके पास नंबर ऑफ हिडन लेयर जितनी ज्यादा होगी आपके मॉडल की कॉम्प्लेक्शन उतनी ज्यादा बढ़ती रहेगी जितनी कम होगी यहां पर उतने कम वो प्रिमिटिव ले पाएगा तो आपको एक एक्यूरेट मतलब आपके पा से मिडल एक आपके पास यहां पर रेंज पकड़नी पड़ेगी जितने नंबर ऑफ हिडन लेयर्स के ऊपर काम करना पड़ेगा तो नंबर ऑफ हिडन लेयर आप यहां पर बढ़ा के या कम करके आपके पास यहां पर अपने मॉडल की एक्यूरेसी को अचीव कर सकते हैं सेकंड चीज नंबर ऑफ हिडन लेयर के बाद में आता है गाइज यहां पर नंबर ऑफ आपके पास यहां पर नोड यस नंबर ऑफ नोड का मतलब आपके पास क्या है एक लेयर के अंदर कितने नंबर ऑफ नोड होने चाहिए यहां पर देखिए जनरली क्या देखा गया है यहां पर कि यदि आप एक लेयर के अंदर बहुत सारे नोट डालते हैं और उसके बाद सिंगल लेयर रखे यहां पर जैसे एग्जांपल के तौर पे आपके पास दो इन तीन इनपुट है और उसके बाद में आपने यहां पे क्या कर दिया चार आपने इनपुट ले लिया फिर उसके बाद आपने फिर दो ले लिया फिर वन ले लिया इस तरह का आपने एक पैटर्न डिजाइन किया आपने न्यूरल नेटवर्क के साथ में तब आपके पास आपके मॉडल की एक्यूरेसी आने के चांसेस कम रहते हैं तो जनरली यहां पे क्या ा गया है कि आपके पास जो पिरामिड शेप होता है उसमें एक्यूरेसी आपके पास ज्यादा अच्छी आती है यहां पर तो आपको क्या करना चाहिए नंबर ऑफ नोड्स को कम या ज्यादा करना चाहिए कम या ज्यादा करते रहना चाहिए चेंज करना चाहिए जिसकी वजह से आपके के पास क्या होती है आपकी मॉडल की एक्यूरेसी और ज्यादा अच्छी होती है राइट चलिए नंबर ऑफ नोड और नंबर ऑफ हिडन लेयर के बाद में जो हमारी नेक्स्ट चीज आती है गाइज यहां पर हमारा एक्टिवेशन फंक्शन यस एक्टिवेशन फंक्शन यस हमें यहां पर हमारे जो एक्टिवेशन फंक्शन है उसे यहां पर चेंज करके देखना चाहिए कि हमारे मॉडल की एक्यूरेसी आ रही है या नहीं आ रही क्योंकि वो भी एक हमारे पास क्या होता है एक हाइपर पैरामीटर होता है तो नंबर ऑफ एक्टिवेशन को भी हमें चेंज करना चाहिए अब देखिए जनरली हमें यहां पर देखा गया है कि जब हम हिडन लेयर का इस्तेमाल करते हैं तब हम रिलो एक्टिवेशन फंक्शन का इस्तेमाल करते हैं और जब हम यहां पर आउटपुट लेते हैं तो आउटपुट के ऊपर डिपेंड करता है कि हमारा आउटपुट पुट क्या आने वाला है हमारे पास क्लासिफिकेशन है या फिर रिग्रेशन है उसके हिसाब से हम क्या करते हैं हमारे जो एक्टिवेशन फंक्शन है उसे हम यहां पर चेंज करते हैं और उसके हिसाब से हम क्या करते हैं हमारा आउटपुट यहां पर गेट करते हैं तो बेसिकली एक्टिवेशन फंक्शंस भी आपके पास यहां पे हाइपर पैरामीटर है उसके बाद में आपके पास आता है गाइज यहां पर आपका लॉस फंक्शन यस आप अपना जो लॉस फंक्शन आप डिसाइड करने जा रहे हैं यहां पर वो लॉस फंक्शन भी बहुत डिपेंडेंसी रहती है देखिए आपके पास जो आपका आउटपुट है उसके हिसाब से आपको अपना लॉस फंक्शन चेंज करना पड़ेगा देखिए लॉस फंक्शन से रिगार्डिंग हमने पहले भी बात कर रखी है यहां पर तो हम क्या कर रहे हैं हमारा लॉस फंक्शन चूज करते हैं कि हमारा डिजर आउटपुट क्या है उसके अकॉर्डिंग हमारा जो लॉस फंक्शन क्या चूज होना चाहिए लॉस फंक्शन के बाद में गाइस जो आपके पास आता है नेक्स्ट यहां पर दैट इज अ कॉल ऑफ ऑप्टिमाइजर यस आपको ऑप्टिमाइजर चूज करना पड़ेगा अलग-अलग डिफरेंट डिफरेंट टाइप के ऑप्टिमाइजर होते हैं उनमें से आपके पास आपके न्यूरोल नेटवर्क के ऊपर बेस्ट ऑप्टिमाइजर कौन सा है यहां पर उसे आप यहां पर चेंज करके काम में ले सकते हैं फिलहाल अभी के टाइम के अंदर बात करें तो एडम ऑप्टिमाइजर आपको बेस्ट सॉल्यूशन देता है तो बेसिकली आप एडम का इस्तेमाल कर सकते हैं लेकिन डिपेंड ऑन योर डेटा सेट आप यहां पर अपने अपने ऑप्टिमाइजर की वैल्यू को चेंज कर के भी आप यहां पर एक्यूरेसी को और अच्छी गेन कर सकते हैं उसके बाद में जो गाइज यहां पर नेक्स्ट अब बात करते हैं यहां पर तो नेक्स्ट जो आपके पास आती है गाइज यहां पर वो होती है बैच साइज यस आप यहां पर अपनी जो बैच साइज है यस उसे भी आप यहां पर अपने अकॉर्डिंग चेंज करके अपने जो मॉडल है उसकी एक्यूरेसी को इंप्रूव कर सकते हैं बेस्ट साइज के बाद में आता है नंबर ऑफ पपोज यस नंबर ऑफ पपोज के अंदर भी आपके पास क्या होता है गाइज यहां पर आपके मॉडल के अंदर इंप्रूवमेंट देखने को मिलती है उसके बाद में आपके पास आता है गाइ यहां पर लर्निंग रेट यस आपके जो लास्ट है यहां पर दैट इज कॉल्ड ऑफ लर्निंग आपके पास रेट आपको देखने को मिलती है लर्निंग रेट की वैल्यू को चेंज करके आप अपने बेस्ट ऑप्टिमम सॉल्यूशन तक पहुंच सकते हैं तो ये थे बहुत सारे हाइपर पैरामीटर इन हाइपर पैरामेट्रिक की ट्यूनिंग करके आप अपने क्या कर सकते हैं मॉडल को इंप्रूव कर सकते हैं उसके बाद में हमने यहां पे क्या देखा था कि जब भी आप अपने न्यूरोल नेटवर्क को ट्रेन कर रहे हो है तो न्यूरल नेटवर्क को ट्रेन करते वक्त आपके सामने दो प्रॉब्लम आती है क्या प्रॉब्लम आती है पहली होती है वार्निशिंग गेनिंग प्रॉब्लम यहां पर दूसरी होती है एक्सप्लोडिंग गेनिंग प्रॉब्लम ये कब आती है जब आप बैक प्रोपो केशन यहां पे ले रहे होते हैं तो बैक प्रोपो केशन के वक्त आपको वनिस ग्रेड इ डिशन एंड एक्सप्लोडिंग गेटन की प्रॉब्लम देखने को मिलती है तो आप इसे भी यहां पर चेंजेज कर सकते हो मतलब इसको भी आप इंप्रूव कर सकते हैं इसको इंप्रूव करने के लिए आप यहां पर क्या कर सकते हैं डिफरेंट डिफरेंट ऑप्टिमाइजर को चेंज कर सकते हैं यस ऑप्टिमाइजर चेंज कर सकते हैं यहां पर इसके साथ-साथ जो आपके पास इनिश इइ जशन आपने वेट रखा था यस आपने क्या किया था यहां पर इनिश इजेशन जो आपने यहां पर वेट रखा था यस उस इनिश जशन वेट की वैल्यू को आप क्या कर सकते हैं चेंज कर सकते हैं इसके साथ-साथ आप क्या कर सकते हैं गाइज यहां पर अपने बैच को नॉर्मलाइज कर सकते हैं यस बैच नॉर्मलाइजेशन का इस्तेमाल करते हुए भी काम में ले सकते हैं तो आप यहां पर बैच नॉर्मलाइजेशन का यूज करते हु भी आप इस प्रॉब्लम को दूर कर सकते हैं उसके बाद में गाइज यहां पर है कि जब भी आप अपने मॉडल को ट्रेन कर रहे हो जब न्यूरल नेटवर्क को ट्रेन कर रहे होते हैं न्यूरल नेटवर्क को ट्रेन करते वक्त आपको बहुत ज्यादा लार्ज अमाउंट में डाटा चाहिए होता है यदि आपके लार्ज अमाउंट ऑफ डेटा नहीं है तो आपको डेटा क्रिएशन करना पड़ता है और डेटा क्रिएशन करने के लिए आप ट्रांसफॉर्म लर्निंग का इस्तेमाल कर सकते हैं यस डेटा यदि आपको क्रिएशन करना है तो यहां पर ट्रांसफर या ट्रांसफर आपके पास क्या होगा लर्निंग का इस्तेमाल करते हुए आप आप यहां पर आगे बढ़ सकते हैं इसके अंदर अब कभी-कभी क्या होता है गाइस यहां पर आपके डाटा के अंदर आपके जो डाटा के अंदर क्या होता है स्लो ट्रेनिंग हो रही होती है राइट आपका जो ट्रेनिंग है वो बहुत स्लो हो रही होती है तो इस स्लो ट्रेनिंग से भी आप यहां पर दूर हो सकते हैं यहां पर डिफरेंट डिफरेंट तरीके से उसके बाद में क्या क्या आता है यहां पर ओवर फिटिंग आपके इस मॉडल के अंदर देखने को मिल जाती है इस ओवर फिटिंग से दूर होने के लिए आप यहां पे क्या कर सकते हैं l1 एंड l2 यस रेगुलराइजेशन टेक्निक का इस्तेमाल कर सकते हैं यहां पर ए1 एलटू रेगुलराइजेशन के बाद में आप यहां पे क्या कर सकते हैं अर्ली स्टॉप कर सकते हैं ठीक है क्या कर सकते हैं गाइज यहां पर आप यहां पर अर्ली यस अर्ली स्टॉपिंग का भी इस्तेमाल आप यहां पर कर सकते हैं और इसके साथ-साथ ओवरफिटिंग को दूर करने के लिए आप यहां पर बैच नॉर्मलाइजेशन का भी इस्तेमाल कर सकते हैं तो ये कुछ तरीके हैं यहां पर जिसके अंदर क्या होता है कि आपके मॉडल को आप इंप्रूव कर सकते हैं तो मेजर्ली पहले तो हाइपर पैरामीटर ट्यूनिंग होती है इन हाइपर पैरामीटर ट्यूनिंग के हिसाब से आपके पास क्या होता है आपकी एक्यूरेसी इंप्रूव हो जाती है यदि आपकी मॉडल के अंदर हाइपर पैरामीटर ट्यूनिंग की वजह से भी आपके एक्यूरेसी ना बड़े तो आप वनिस ग्रेडन डिसेंट पे जाइए वनि ग डिसेंट के अलावा स्लो हो रही है उसे चेक कीजिए आपके मॉडल के अंदर ओवर फटिंग हो रही है उसे आप चेक कीजिए देन लास्ट ऑफ लीस्ट आपके पास डाटा ही आपके पास कम है तो आप डटा को और ज्यादा बढ़ाने की कोशिश कीजिए इन सारी चीजों से आप क्या कर सकते हैं आप अपने मॉडल को बहुत ही अच्छे से इंप्रूव कर सकते हैं तो जो मैंने आपको टेक्नीक बताई थी हाइपर पैरामीटर की वो आपके सामने यह रही यह सारी टेक्निक को इस्तेमाल करते हुए आप क्या कर सकते हैं गाइस यहां पर अपने मॉडल को इंप्रूव कर सकते हैं और आज के इस वीडियो के जरिए हम बात करेंगे ओवर फिटिंग के बारे में और वो भी न्यूरल नेटवर्क के अंदर तो आप देखिए न्यूरल नेटवर्क के अंदर ओवरफिटिंग को हम कैसे आइडेंटिफिकेशन कर रहे हैं तो ट्रेन करते वक्त आपके पास आपको मिलता है एक ट्रेनिंग डाटा यदि आपको पाइथन मशीन लर्निंग डेटा साइंस एंड डेटा एनालिस जसी फील्ड में अपने आपको को ग्रो करना है तो इसके लिए डब्ल्यू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू ए फ्री क्लासेस ले सकते हैं राइट जब भी आप किसी मॉडल को ट्रेन करर चाहे वो आर्टिफिशियल न्यूरल नेटवर्क की बात करें या चाहे आप मशीन लर्निंग के अंदर बात करें यस आपको अपना मॉडल क्या करना है आपको ट्रेन करना है यहां पर तो इसके लिए दो तरह का डाटा चाहिए यहां पर सबसे पहले आपको चाहिए यहां पर ट्रेनिंग डाटा राइट क्या चाहिए आपको ट्रेनिंग डाटा चाहिए दूसरा चाहिए आपको टेस्टिंग डाटा तो देखिए ट्रेनिंग डाटा के ऊपर आप क्या करते हैं अपना मॉडल ट्रेन करते हैं और मॉडल ट्रेन करने के बाद आपको एक बड़े एक फंक्शन देखने को मिलता है अब इस पडि फंक्शन के अंदर आप क्या देते हैं यहां पर आप अपना टेस्टिंग डाटा देते हैं जिसके थ्रू आप के पास जो मॉडल है वो टेस्ट होता है और फिर कोई आपके पास टेस्टिंग डेटा देते हैं और टेस्टिंग डेटा देने पर आपको आंसर देता है यहां पर राइट अब आपको कैसे पता चलेगा कि हमारा मॉडल ओवर फिटिंग हुआ है या अंडर फिटिंग हुआ है या बेस्ट फिटिंग हुआ है तो इस चीज को पता लगाने के लिए हम क्या कर रहे हैं एक एग्जांपल मैं आप लोगों को बता रहा हूं जैसे यदि आपने पास आपका कोई डाटा है राइट उसके अंदर दो डाटा आपने कन्वर्ट किया आपने एक ट्रेनिंग डाटा लिया यहां पर यस एक ट्रेनिंग डाटा लिया और दूसरा आपने यहां पर टेस्टिंग डाटा लिया यहां पर अब मान लीजिए कि जब आपने अपने ट्रेनिंग डटा से मॉडल को ट्रेन किया यहां पर ट्रेन करने के बाद में वापस दोबारा उसी डाटा का आपको क्या करना है प्रेडिक्शन निकालना है राइट उसी डाटा का क्या करना है प्रेडिक्शन निकालना है प्रेडिक्शन निकालने का मतलब क्या है गाइज यहां पर उसी डाटा का स्कोर निकालना है मतलब एक्यूरेसी निकालनी है उसी डाटा की ऊपर तो उसकी एक्यूरेसी कितनी है उस मॉडल के ऊपर यदि आपके पास आपके डाटा के अंदर यदि आपकी ट्रेनिंग की एक्यूरेसी यस ट्रेनिंग की एक्यूरेसी आपके पास ग्रेटर दन आ जाए किसके आपके पास यहां पर टेस्टिंग की एक्यूरेसी से इट्स मीन दैट हमारा मॉडल क्या हो चुका है ओवर फिटिंग हो चुका है हमारा ये जो मॉडल है गाइज यहां पर वो क्या है यहां पर ओवर फिटिंग हो चुका है तो अब क्या करें यहां पर इसे बचाना चाहिए ओवर फिटिंग से और ओवर फिटिंग से बचाने के लिए हमारे पास बहुत सारे और भी तरह की टेक्निक्स होती है राइट अब मैं बात करूं यहां पर ओवर फिटिंग से अलावा बेस्ट फिटिंग का मतलब क्या होता है बेस्ट फिटिंग का मतलब होता है कि जो आपका ट्रेनिंग डटा है यहां पर वो ऑलमोस्ट इक्वल्स टू हो जाए मैं एगजैक्टली इक्वल्स टू नहीं बात करूंगा यहां पर क्या कर रहा हूं यहां पर ऑलमोस्ट इक्वल्स टू हो जाए मतलब आपके पास फ का डिफरेंस आपको दिने को मिल जाए ट्रेनिंग एंड टेस्टिंग एक्यूरेसी के अंदर तो इसका मतलब आपके पास मॉडल जो है आपका बेस्ट फिटिंग यहां पर लेकिन यदि आपके पास ये दोनों की दोनों एक्यूरेसी बहुत ज्यादा कम हो जाए यहां पर तो इसका मतलब क्या है गाइज यहां पर ये दोनों अंडर फिटिंग पे है तो बेसिकली हमें यहां पे क्या करना है हमारे मॉडल को ओवरफिटिंग से बचाना है अब ओवरफिटिंग से बचाने का रीजन सिंपल सा ये है कि जब भी हमारा मॉडल ओवरफिटिंग हो जाएगा मतलब वो क्या कर रहा है कि जो भी आपने ट्रेनिंग डाटा दिया है यहां पर उसके ऊपर क्या करेगा प्रॉपर्ली मेमराइज कर लेगा और जब वो प्रॉपर्ली मेमराइज कर देगा तो गाइज यहां पर जब वो प्रेडिक्शन करने चलेगा नए डाटा के ऊपर तो वो आपको रॉन्ग प्रेडिक्शन देगा कैसे जरा एग्जांपल के तौर पे समझते हैं इस ओवरफिटिंग के सिनेरियो को मान लीजिए कि आपके पास क्या है आपका ये डेटा सेट है अब ये डेटा सेट कैसा है जरा समझिए यहां पर तो देखिए मैं यहां पे क्या कर रहा हूं एक एग्जांपल के तौर पे मैं अपना ट्रेनिंग डाटा दे रहा हूं ठीक है मैं क्या कर रहा हूं यहां पर कुछ ट्रेनिंग डाटा बना रहा हूं और ट्रेनिंग जो डाटा है यहां पर वो कुछ इस तरह से है कि कुछ आपके लाल पॉइंट्स पड़े हैं यहां पर यस कुछ आपके क्या है यहां पर रेड पॉइंट्स यहां पर पड़े हैं यहां पर एंड आपके पास बात करें यहां पर तो कुछ आपके पास ब्लू पॉइंट्स भी पड़े हैं यस आपके पास क्या है यहां पर गाइज इस तरह से आपके पास क्या है कुछ आपके पास यहां पर पर्पल कलर्स के पॉइंट्स भी यहां पर डिस्ट्रीब्यूटर पड़ा है अब यहां पर यदि आपका डाटा ओवर फिटेड है तो आपके पास ये कर्वेचर एक डिजाइन करेगा मतलब इसको पार्टीशन करने के लिए कर्वेचर डिजाइन करेगा और वो कर्वेचर्स आपके पास कुछ इस तरह का हो सकता है कैसे देखिए वो क्या कर रहा है यहां पर एगजैक्टली आपके पास क्या कर रहा है इस कर्वेचर्स को प्रिडिक्ट मतलब डिफरेंशिएबल बनाएगा अब यदि आपको इस तरह का कर्वेचर देखने को मिल जाए मतलब आपको हर एक पॉइंट के ऊपर अच्छे से पार्टिसिपेंट करने वाला क लेक्चर मिल जाए आपके पास यहां पर इसका मतलब आपका जो मॉडल है वो ओवर फिटेड हो चुका है यस अब आपका मॉडल क्या हो चुका है यहां पर ओवर फिटिंग हो चुका है यहां पर अब ओवरफिटिंग होने के बाद क्या होगा गाइज यहां पर ये किसका है यहां पर ये आपका ट्रेनिंग डटा यस ये आपके पास क्या है गाइज यहां पर ये आपका एक ट्रेनिंग डाटा है और उस ट्रेनिंग डाटा के ऊपर आपका मॉडल जो हो रहा है वो ट्रेड हो रहा है और ट्रेन करके इस तरह से आपके पास क्या कर रहा है एक प्रोडक्शन बाउंड्री बना रहा है मतलब एक डिसीजन बाउंड्रीज बना रहा है जिसके थ्रू आपके जो दोनों डाटा है वो आपके डिफरेंशिएबल आपके पास ट्रेनिंग डाटा नहीं ये काम किया यहां पर अब ये ट्रेनिंग डाटा ओवरफिटिंग है कैसे पता चला यहां पर क्योंकि वो हर एक पॉइंट पे प्रेस साइजल वर्क कर रहा है हर एक पॉइंट पे क्या कर रहा है प्रेस साइली वर्क कर रहा है और उसके ऊपर क्या कर रहा है अच्छे से ट्रेंड हो रहा है मतलब आप इस तरह से इस तरह से मान लीजिए कि वो हर एक पॉइंट को रट रहा है मेमराइज कर रहा है यहां पर कि यस इसका आंसर ये आना चाहिए इसका आंसर ये आना चाहिए इसका आंसर ये आना चाहिए इस तरह का आंसर ये आना चाहिए यस गाइ क्या होगा यहां पर अब यदि आपके पास कोई नया डटा आता है लेट्स सपोज आपके पास कोई नया डटा आता है और हम उसमें बोलते हैं कि अब इसमें प्रोडक्शन बाउंड्रीज डिजाइन कीजिए यस ये कुछ रेड पॉइंट्स आ रहे हैं और यहां पे आपके पास कुछ ब्लू पॉइंट्स आ रहे हैं अब आपके पास डिसीजन बाउंड यहां पर बनाइए यस अब आप यहां पे क्या कीजिए इसके अंदर आपका डिसीजन बाउंड्रीज बनाइए तो वो क्या करेगा गाइज यहां पर वो आपके पास यस जैसे ये डिसीजन बाउंड्रीज थी वैसी की वैसी ये डिसीजन बाउंड्रीज यहां पे बनाएगा और आपका रॉन्ग प्रेडिक्शन करना स्टार्ट कर देगा यस क्या करेगा यहां पर रॉन्ग प्रेडिक्शन करना स्टार्ट कर देगा राइट तो बेसिकली गाइज क्या हो रहा है तो ओवरफिटिंग का मतलब क्या हो रहा है गाइस यहां पर कि आप जो ट्रेनिंग डाटा दे रहे हैं उस ट्रेनिंग डाटा को वो अच्छे तरीके से मेमराइज कर रहा है ना कि उसके कांसेप्ट को समझ रहा है ना कि उसके फीचर की अंडरस्टैंडिंग कर रहा है यहां पर राइट उसको क्या कर रहा है याद कर रहा है यहां पर और इसकी वजह से जब कोई नया डाटा आता है आपके पास यहां पर यस उस समय आपके पास क्या होता है रॉन्ग प्रेडिक्शन स्टार्ट होने ल जाता है यहां पर तो इस प्रोसीजर को हम क्या बोलते हैं गाइज यहां पर ओवरफिटिंग कहते हैं राइट ओवरफिटिंग कहते हैं अब ये ओवरफिटिंग की पहचान हम कैसे करेंगे तो बहुत ही सिंपल है यहां पर आपको क्या करना है गाइज यहां पर सिंपल सी ट्रेनिंग की आपको एक्यूरेसी निकालनी है यहां पर और आपको क्या करना है यहां पर आपकी टेस्टिंग की एक्यूरेसी भी आपको यहां पर फाइंड आउट करनी है अब इसका गैप जो यहां पर है वो बहुत ज्यादा मिले मतलब आपके ट्रेनिंग की एक्यूरेसी ज्यादा मिले टेस्टिंग के कंपेरटिवली इसका मतलब आपका मॉडल यहां पर क्या हो चुका है ओवर फिटेड हो चुका है अब आपको इसे यहां पर सही करना पड़ेगा चलिए आइडेंटिफिकेशन को हमसे दूर करना है यहां पर राइट तो इसके लिए मैं इसको क्या कर रहा हूं यहां पर कीप रख रहा हूं एंड उसके बाद मैं ले चलता हूं आपको जुपिटर नोटबुक के ऊपर जहां पे हम ये समझेंगे कि ये मॉडल हमारा ओवर फिटेड हुआ है या नहीं हुआ है अब देखिए इसके लिए हमने पहले से मॉडल बना रखा है अब ये पहले से मॉडल कब बनाया था जब हमने पहले यूज़ किया था याद होगा आप लोगों को हमने इससे पहले मॉडल बनाना सीखा था बस उसी की मॉडल की मैं बात कर रहा हूं यहां पर राइट चलिए अभी देखिए यहां पर मुझे क्या-क्या करना है हम रिक्वायर्ड मॉडल को इंपोर्ट कर लेते हैं यहां पर उसके बाद हम यहां पर क्या करते हैं हमारे डेटा सेट को लोड करते हैं फिर हेड लगा के कुछ डटा को देखते हैं यहां पर फिर हमारे डटा के अंदर इनपुट और आउटपुट डाटा को अलग-अलग करते हैं यहां पर स्टैंडर्ड स्केलर को कॉल करते हैं देखिए स्केलिंग करना बहुत ज्यादा जरूरी है यदि आपने अपने डाटा के अंदर स्केलिंग नहीं की है तो आपके मॉडल की एक्यूरेसी कम हो जाती है राइट चलिए इनपुट आउटपुट डाटा को अलग-अलग कर लेते हैं यहां पर यस ये हमारा डाटा को स्केलिंग करके इनपुट आउटपुट डाटा को मैंने क्या किया अलग-अलग कर लिया यहां पर और यह मैं हटा देता हूं अब मुझे क्या करना है गाइज यहां पर टेंसर फ्लो को कॉल करना है जो कि हमारा एन का नेटवर्क बनाएगा जो हमारा आर्टिफिशियल न्यूर नेटवर्क का नेटवर्क डिज़ाइन करेगा यहां पर राइट उसको मैंने यहां पे इंपोर्ट किया फिर उसके बाद केरा को कॉल किया है जहां पे हमने सीक्वेंशियल और डेंसिल लेयर को कॉल किया यहां पर फिर सीक्वेंशियल को कॉल किया है और यहां पर मैंने एन का नेटवर्क बना लिया है उसके बाद मैंने क्या किया मॉडल को कंपाइल किया है और मॉडल को फिट कर दिया है यहां पर चलिए मॉडल हमारा फिट हो जाता है फिट होने के बाद ही हम क्या करेंगे हमारे मॉडल की एक्यूरेसी को पता लगाएंगे यहां पर चलिए एक्यूरेसी कैसे पता लगाएंगे उसको को भी हम देखेंगे अभी चलिए हमारा मॉडल पहले 50 टाइम इसे प्रिंट टेस्ट कर लेते हैं अब देखिए हमारा मॉडल की एक्यूरेसी आ चुकी है यहां पर मॉडल की एक्यूरेसी के अंदर मैंने क्या किया यहां पर टेस्टिंग डाटा की एक्यूरेसी निकाली है और मैंने क्या किया ट्रेनिंग डेटा की एक्यूरेसी निकाली है चलिए पहले मैं यहां पर ट्रेनिंग डाटा की एक्यूरेसी निकालता हूं टेस्टिंग डेटा की एक्यूरेसी निकालता हूं यहां पर और यहां पे मुझे पीआरडी डाटा निकालना है बेसिकली पहले हमें क्या करना है पीआरडी डाटा निकालना है अब ये पीआरडी डाटा कैसे निकलेगा यहां पर मतलब प्रेडिक्शन कैसे निकलेगा यहां पर जरा उसको समझ लेते हैं यहां पर यस प्रोडक्शन डाटा कैसे निकलने वाला है जरा उसको समझते हैं यहां पर कि प्रोडक्शन डाटा का काम कैसे होगा ओके प्रेडिक्शन डटा कैसे निकलेगा गाइज यहां पर तो ये देखिए मैंने यहां पर प्रेडिक्शन डाटा का कोड लिख रखा है यहां पर राइट एक कोड मैं और लिख लेता हूं यहां पर प्रेडिक्शन डाटा का राइट कंट्रोल जड कर लेते हैं पहले तो इसके यहां पर ओके एंड यहां पर ये रहा हमारे पास प्रोडक्शन डाटा का कोड यहां पे आसा गया पीआरडी डाटा का हमारे पास कोड आ चुका है यहां पर राइट ये पीआरडी डाटा का आपको कोड लिखना है यहां पर और इस पीआरडी डाटा का कोड क्या है गाइज यहां पर कि जो भी आपका एए का नेटवर्क आया यस उसे आप क्या करेंगे प्रेडिक्शन में डालेंगे जहां पे आप क्या डालेंगे एक्स एंडस को टेस्ट डालेंगे और उस एक्स एंड्रस को टेस्ट के बेसिस पे आपका पीआरडी डाटा आपके सामने यहां पे आ जाएगा चलिए फिलहाल मैं इसे रन कर लेता हूं यहां पर हमारा रन हो चुका है यहां पर फिर हम क्या कर रहे हैं हमारे एक्यूरेसी को रन करते हैं और प्रेडिक्शन डाटा की एक्यूरेसी को निकालते हैं अब उसके साथ-साथ हमें यहां पे क्या करना है ट्रेनिंग डाटा की एक्यूरेसी भी निकालनी है इसके लिए हमें फिर से क्या चाहिए गाइज यहां पर पीआरडी डाटा चाहिए अब ये पीआरडी डाटा कैसे लाएंगे यहां पर तो देखिए ये वाला जो कोड है यहां पर सेम एज कोड मैं क्या कर रहा हूं यहां पर वापस लिख रहा हूं यहां पर और इस जगह पर x अंड इस जगह पर x टेस्ट की जगह मैं यहां पे क्या डाल रहा हूं x ट्रेन डा रहा हूं पीआरडी की जगह पीआरडी वन कर देता हूं यहां पर पीआरडी डाटा वन कर देता हूं पीआरडी डाटा वन कर देता हूं पीआरडी डाटा वन करके पीआरडी डटा वन कर देता हूं राइट यही सेम कोड मैं वापस लिख रहा हूं पीआरडी डटा वन के लिए और इसे हम क्या करते हैं रन कर देते हैं और उसके बाद मैं फिर से से रन कर देता हूं यहां पर तो अभी क्या आ रहा है यहां पर एक्यूरेसी स्कोर हो गया है एक्यूरेसी स्कोर की जगह चलिए एक्यूरेसी स्कोर कर देते हैं देखिए आपके पास ट्रेनिंग और टेस्टिंग की एक्यूरेसी के अंदर डिफरेंस कितना आ रहा है ट्रेनिंग एंड टेस्टिंग की एक्यूरेसी के अंदर डिफरेंस देखेंगे तो आपके पास क्या आ रहा है केवल और केवल यहां पे पॉइंट वन कार है इसका मतलब क्या हुआ गाइज यहां पर हमारा मॉडल ओवर फिटेड नहीं हुआ है हमारा मॉडल क्या हुआ है यहां पर ओवर फिटिंग नहीं हुआ जो कि हमें यहां पर देखने को मिल रहा है राइट तो हमारा मॉडल यहां पे ओवर फिटिंग नहीं हुआ है गाइ यहां पर बेसिकली यदि हमारा मॉडल ओवर फिटेड होता तो यहां पे ट्रेनिंग और टेस्टिंग की एक्यूरेसी में बहुत ज्यादा गैप आपको देखने को मिलता है चलिए मैं कैसे ही करके इसके अंदर ट्रेनिंग और टेस्टिंग की एक्यूरेसी में थोड़ा गैप लाने की कोशिश करता हूं मैं यहां पर रैंडम स्टेट की वैल्यू को थोड़ा चेंज करके देखता हूं शायद उसकी वजह से हमारे पास यहां पे एक्यूरेसी स्कोर में कुछ अंतर देखने को मिल जाए राइट चलिए चेक कर लेते हैं एक बार इससे भी राइट मैंने इसको 50 टाइम ट्रेन कर लिया है और मॉडल की एक्यूरेसी और ज्यादा अच्छी इंप्रूव हो गई है बल्कि यहां पर देखिए एक्यूरेसी स्कोर देखेंगे आप यहां पर तो एक्यूरेसी स्कोर और ज्यादा इंप्रूव यहां पर देखने को मिल रहा है राइट चलिए तो अभी थोड़ा सा इसे और ज्यादा ट्रेड होने देते हैं आा आ जाते हैं यहां पर नीचे और फिर से रन करते हैं और फिर से रन करते हैं फिर से रन करते हैं फिर से रन कर लेते हैं देखिए अभी हमारे मॉडल के अंदर एक्यूरेसी स्कोर देखेंगे आप यहां पर तो ये क्या बन रहा है ओवर फिटेड बन रहा है कैसे बनना है यहां पर देखिए 84 है और यहां पे क्या है 85 है ट्रेनिंग के अंदर एक्यूरेसी ज्यादा है टेस्टिंग के कंपैरेटिव 1 पर ज्यादा है लेकिन ये 1 पर ज्यादा बहुत होता है यहां पर इसका मतलब हमारा मॉडल क्या है यहां पर ओवर फिटेड है अब इस ओवर फिटिंग मॉडल को को कैसे यहां पर सही करना है ओवर फिटिंग से कैसे बचना है इसके कुछ कांसेप्ट होते हैं राइट इसके कांसेप्ट क्या है यहां पर सबसे पहला यहां पर आप क्या करें क्रॉस वैलिडेशन करें ट्रेनिंग के अंदर मोर डटा लाए यहां पर रिमूव फीचर्स फीचर्स को कुछ रिमूव करके कर सकते हैं यहां पर अर्ली स्टॉपिंग कर सकते हैं रेगुलराइजेशन कर सकते हैं असेंबल लर्निंग का इस्तेमाल कर सकते हैं और हाइपर पैरामीटर ट्यूनिंग कर सकते हैं तो ये कुछ तरीके हैं जिसकी हेल्प से आप क्या कर सकते हैं यहां पर जो ओवर फिटिंग है उसे आप कम कर सकते हैं राइट चलिए अब इसमें से देखिए क्रॉस वैलिडेशन तो हम नहीं कर रहे हैं अभी फिलहाल यहां पर ंग के अंदर हमारे पास और डाटा नहीं है यहां पर रिमूव फीचर हम फीचर को अभी रिमूव करना नहीं चाहते हैं अभी हम जो कांसेप्ट समझ रहे हैं दैट इज द कॉल ऑफ अर्ली स्टॉपिंग राइट अभी हम कांसेप्ट क्या समझ यहां पर अर्ली स्टॉपिंग का कांसेप्ट समझ र है कि अर्ली स्टॉपिंग की हेल्प से हम कैसे ओवरफिटिंग से बच सकते हैं अर्ली स्टॉपिंग की हेल्प से हम कैसे ओवरफिटिंग से बच सकते हैं वो चीज हम यहां पर अब देखने वाले हैं चलिए अब मैं क्या करने वाला हूं गाइज यहां पर अर्ली स्टॉपिंग कर रहा हूं अब अर्ली स्टॉपिंग कैसे काम करता है पहले उसको जरा समझ लेते हैं यहां पर तो देखिए मैं अर्ली स्टॉपिंग करने से पहले मैं अर्ली स्टॉपिंग कैसे काम करता है वो आपको समझाऊं यहां पर देखिए अर्ली स्टॉपिंग कैसे होता है जैसे मान लीजिए कि आप आपके पास क्या हो रहा है आप यहां पर नंबर ऑफ टाइम यहां पर उसे ट्रेनिंग कर रहे हैं नंबर ऑफ टाइम क्या कर रहे हैं यहां पर ट्रेनिंग कर रहे हैं यहां पर मतलब नंबर ऑफ नोड यहां पर चेंज कर रहे हैं तो उससे होता क्या है कि जब आपके पास मॉडल ट्रेड होता है तो मॉडल ट्रेड होते वक्त आपके पास कुछ ट्रेनिंग की एक्यूरेसी कुछ इस तरह से आती है मान लीजिए आपके पास क्या होती है ट्रेनिंग की एक्यूरेसी कुछ यहां पे इस तरह से जस्ट अब मैं थोड़ा चेंज करूंगा यहां पर ट्रेनिंग की एक्यूरेसी आपके पास कुछ इस तरह से आती है राइट ये आप क्या क्या आई यहां पर ट्रेनिंग की एक्यूरेसी आई यहां पर राइट फिर से आपने अपना मॉडल ट्रेन किया और मॉडल ट्रेन करने के बाद में अब आपके पास क्या आएगी आपके पास गाइज यहां पर टेस्टिंग की एक्यूरेसी आएगी और टेस्टिंग की एक्यूरेसी आपके पास कुछ इस तरह आ जाती है राइट क्या आ जाती है टेस्टिंग एक्यूरेसी कुछ इस तरह से आ जाती है तो ट्रेनिंग की एक्यूरेसी और टेस्टिंग की एक्यूरेसी के अंदर आप देखेंगे तो बहुत बड़ा एक डिफरेंस आपको देखने को मिल जाता है ये डिफरेंस ही आपके पास क्या करता है ओवर फिटिंग का सिनेरियो रता है अब इस कर्वेचर के अंदर यदि आप गौर से देखेंगे तो गौर से देखने पर हमें क्या पता चला गाइ यहां पर कि यहां से यहां तक का जो एरिया था हमारे पास यहां पर इसके बीच तक हमारे पास क्या था यहां पर एक्यूरेसी लगभग क्या थी बराबर थी लेकिन उसके बाद में हमारी मॉडल की एक्यूरेसी क्या होई यहां पर आपका उसमें ज्यादा डिफरेंस देखने को मिला चलिए इसको मैं थोड़ा प्र प्रैक्टिकली थोड़ा दिखाना चाहूंगा ग्राफिकल तौर पे अब प्रैक्टिकली कैसे देखेंगे तो उसके लिए सबसे पहले जो हमारी रिक्वायर्ड लाइब्रेरी है यस उसको जरूरत पड़ेगी जस्ट लाइक इंपोर्ट करेंगे यहां पर मैट पल लिप जिसके थ्रू हम यहां पे ग्राफ बनाएंगे और हम हमारे ओवर फिटिंग को समझाए पहचानेंगे तो मैट पल लिप पे जाना है यहां पर पलट एलस पीएटी कर देते हैं यहां पर चलिए इसे मैं रन कर देता हूं अब आ जाते हैं नीचे देखिए जब आप अपना मॉडल को ट्रेन कर रहे होते हैं यहां पर ए मॉडल को तो एंड टन को ट्रेन करते वक्त जो ये आपका एनएन है यस जो आपका ये एएन है यहां पर इसी ए में आपको यहां पे जाना है ए के पास जाने के बाद में आपको यहां पे क्या मिलेगा आपको हिस्ट्री मिलेगा इस हिस्ट्री के अंदर जाके फिर से आपको क्या करना है हिस्ट्री को कॉल करना है और रन कर देना है यहां पर राइट हिस्ट्री को कॉल करके क्या करना है रन कर देना है यहां पर राइट हिस्ट्री को कॉल करके आपको क्या करना है रन करना है ब्लैंक डिस्ट क्यों आ रही है हिस्ट्री को के पास जाना है यहां पर हिस्ट्री के पास जाके अब आपको क्या करना है गाइज यहां पर एएन पे पास जाना है और आपको हिस्ट्री पे कॉल करना है और फिर आप जाके हिस्ट्री पे कॉल करेंगे तो आपको हिस्ट्री मिल जाएगी अब हिस्ट्री के अंदर देखिए आपके पास यहां पर लॉस मिल रहा है यहां पर आपको लॉस के साथ-साथ देखिए आपको एक्यूरेसी मिल रहा है यहां पर इसके साथ-साथ थोड़ा सा नीचे आएंगे आपके पास यहां पर तो एक्यूरेसी भी आपको मिल रहा है अब इस एक्यूरेसी में आपको ट्रेनिंग की एक्यूरेसी नहीं मिल रही आपको केवल किसकी मिल रही है यहां पर कि सॉरी इस एक्यूरेसी के अंदर आपको क्या मिल रहा है केवल और केवल ट्रेनिंग की एक्यूरेसी मिल रही है टेस्टिंग की एक्यूरेसी नहीं मिल रही है अब आपको टेस्टिंग की एक्यूरेसी भी चाहिए तो पहले हमें टेस्टिंग की एक्यूरेसी लानी पड़ेगी कैसे लाएंगे यहां पर तो देखिए इसके अंदर जाएंगे इसके अंदर जाने के बाद में आपको मिलेगा वैलिडेशन डाटा यस आपको क्या मिलेगा वैलिडेशन डाटा मिलेगा इस वैलिडेशन डटा के अंदर आपको डेटा रखना है यहां पर अब ये वैलिडेशन डेटा में क्या डटा रखना है जरा देखें यहां पर तो वैलिडेशन डटा में आपको अपना डाटा रखना है कैसे एक टपल के तौर पे जहां पे आपको वैलिडेशन डाटा रखना है जहां पे आप यहां पे क्या रखेंगे x अंड आपका टेस्ट रखेंगे और y अंडर आपको क्या रखना है टेस्ट रखना है तो आपको क्या मिलेगा एक वैलिडेशन एक्यूरेसी भी आपको एक साथ मिलती रहेगी मतलब आपको टेस्टिंग की एक्यूरेसी भी आपको साथ में मिलती रहेगी तो आपको क्या करना है गाइज यहां पर सबसे पहले यदि आपको ओवर फिटिंग को पहचानना है तो आपको वैलिडेशन डाटा देना पड़ेगा और वैलिडेशन डाटा में आपको अपना टेस्टिंग का डाटा जरूर देना है राइट विदाउट गोइंग अ टेस्टिंग डाटा आप आगे नहीं बढ़ सकते अब चलिए मैं यहां पे वापस जा हिस्ट्री को रन करता हूं यहां पर तो देखिए लॉस मिलता है फिर उसके बाद देखिए गाइज एक्यूरेसी मिलता है एक्यूरेसी की जह नीचे आते हैं यहां पे तो आपको क्या मिलता है यहां पर वेल लॉस मिलता है वेल लॉस का मतलब क्या है यहां पर वैलिडेशन डेटा का लॉस मिलता है और इसके साथ-साथ वैलिडेशन डेटा की आपको क्या मिलती है एक्यूरेसी देखने को मिल जाती है राइट तो आपको ये दोनों चीजें देखने को मिल गई यहां पर और ये दोनों चीजें किसमें है डिक्शनरी में है अब यदि मुझे यहां पर एक्यूरेसी निकालनी है क्या निकालनी है एक्यूरेसी निकालनी है तो मैं रन करूंगा मुझे मेरी एक्यूरेसी देखने को मिल जाएगी अब ये एक्यूरेसी किसकी है गाइज यहां पर ये हमारे मॉडल के ट्रेनिंग की एक्यूरेसी है तो यदि मैं यहां पर कॉल करूं किसको कॉल कर रहा हूं यहां पर गाइस यहां पर ट्रेनिंग को कॉल करता हूं यहां पर तो ये ट्रेनिंग के क्या है गाइस यहां पर एक्यूरेसी है यस ये किसकी एक्यूरेसी है गाइस यहां पर ट्रेनिंग की एक्यूरेसी है इसी तरीके से मुझे मेरी टेस्टिंग की एक्यूरेसी भी निकालनी है तो मैं क्या करूंगा यहां पर इसे पेस्ट कर दूंगा ताकि मैं ओवर फिटिंग को पहचान सकूं राइट तो अभी मैं क्या कर रहा हूं गाइ यहां पर हमारे पास क्या कर रहा हूं टेस्ट अंडरस्कोर क्या कर रहे हैं यहां पर एक्यूरेसी निकाल रहे हैं यस टेस्ट अंडरस्कोर क्या कर रहे हैं गाइज यहां पर एक्यूरेसी निकाल रहे हैं और इस इसके लिए हम क्या करेंगे गाइ यहां पर वैलिडेशन एक्यूरेसी को कॉल करेंगे तो हमारे ट्रेनिंग और टेस्टिंग दोनों की एक्यूरेसी आ चुकी है अब हमें क्या करना है गाइ यहां पर अब हमें इसको प्लॉट करना है और प्लॉट करके देखना है यहां पर कि किस तरह से ग्राफ नजर आता है यहां पर अब ये डाटा है कितना पहले हमें ये देखना पड़ेगा कि इसके अंदर डाटा कितना आया है यहां पर तो मैं पहले इसकी क्या करूंगा लेंथ निकालूं लेंथ करने के लिए मैं क्या करूंगा यहां पर आपके पास टेस्ट एक्यूरेसी को कॉल कर देता हूं यहां पर रन करता हूं 50 लाथ है यहां पर चलिए अब ग्राफ बनाते हैं यहां पर कैसे बनाएंगे पीएटी डॉट आप यहां पे प्लॉट बनाइए पीएटी डॉट क्या प्लॉट बनाते हैं प्लॉट के अंदर एक्स एक्सेस का डाटा चाहिए एक्स एक्सेस का डाटा चाहिए तो मैं आ फॉर आई एन क्या करेंगे यहां पर रेंज को अप्लाई करेंगे और वन बार ट्रेनिंग करने से लेके आपका 51 टाइम हमारा क्या हो रहा ट्रेनिंग हो रहा है उसके बाद में हम यहां पे क्या कर रहे हैं ट्रेनिंग की जो हमारी एक्यूरेसी है यहां पर वो कॉल कर रहे हैं यहां पर सेम एज हम क्या कर रहे हैं गाइ यहां पर कॉल करेंगे आपका किसकी टेस्टिंग की एक्यूरेसी की तो यहां पर हमने ट्रेनिंग एकसी लगाई और फिर मैं यहां पे क्या लगा रहा हूं टेस्टिंग एक्यूसी लगा रहा हूं इसके साथ-साथ मैं कलर इक्वल्स टू क्या करूंगा गाइज यहां पर रेड कलर डाल रहा हूं यहां पर राइट और इस ग्राफ को देखने के लिए मैं क्या कर रहा हूं पीएटी ड शो फंक्शन को कॉल कर रहा हूं चलिए देखिए हमारा ग्राफ आ रहा है और ग्राफ देखिए स्टार्टिंग से देखिए 79.8 से चल रहा है यहां पर ये 79.9 पे चल रहा है यहां पर और लगभग लगभग ये चल रहा है यहां पर दोनों के बीच में गैप नजर आ रहा है यहां पर दोनों पासपास नजर कहीं नहीं आ रहे देखिए रो से लेकर 50 तक के बीच में एक सिंगल लाइन नजर आ रही है यहां पर कोई भी आपके पास यहां पर डिफरेंस नहीं नजर आ रहा इसका मतलब क्या हुआ कहीं ना कहीं ये ओवर फिटेड हुआ होगा राइट कहीं ना कहीं क्या हो रहा है ओवर टंग हुआ होगा चलिए एक बार देख लेते हैं यहां पर क्या एक्यूरेसी स्कोर आ रहा है यहां पर दोनों का वो भी चेक कर लेते हैं यहां पर तो एक्यूरेसी स्कोर देखिए 78 और 79 आ रहा है दोनों के बीच में आपको गैप नजर जरूर आ रहा है राइट अब इसमें हम अर्ली स्टॉपिंग कैसे करेंगे उसका अ इस्तेमा जानते हैं यहां पर देखिए जब आप अपना मॉडल ट्रेन कर रहे हैं यहां पर मॉडल ट्रेन करते वक्त आपके पास इसके अंदर एक पैरामीटर होता है और वो पैरामीटर्स क्या होता है गाइज यहां पर दैट अ कॉल बैक यस आपको यहां पे क्या करना है कॉलबैक का इस्तेमाल करना है यह कॉलबैक क्या करेगा गाइज यहां पर आपके मॉडल की एक्यूरेसी को इंप्रूव करेगा कैसे करेगा अब जरा समझते हैं यहां पर तो देखिए आपको जब यहां पे ओपन करेंगे आपको मिलेगा एक कॉलबैक्स पैरामीटर इस कॉलबैक्स पैरामीटर को आपको देना है जहां पे ये आपके मॉडल की एक्यूरेसी आपके पा से इंप्रूव करेगा कैसे ये ओवर फिटिंग जहां पे भी हो रगी वहां पे ये स्टॉप कर देगा कैसे जरा समझते हैं यहां पे इसके लिए क्या करना है गाइज यहां पर आपको फ्रॉम केरा के अंदर जाना है केरा के अंदर जाने के बाद में अब आपको यहां पे क्या करना है यहां पर आपको कॉल करना है कॉल बैक्स को किसको करेंगे कॉल बैक्स को कॉल करेंगे और इंपोर्ट करेंगे और इंपोर्ट क्या करना है गाइज यहां पर अर्ली स्टॉपिंग को यस आप किसे इंपोर्ट करेंगे अर्ली स्टॉपिंग को इंपोर्ट करेंगे अब यहां पे ये कॉल बैक्स जो इस्तेमाल किया यहां पर इसके अंदर जाके क्या करना है गाइज यहां पर अर्ली स्टॉपिंग को सिंपल सा कॉल कर देना है ठीक है अब इसे क्या करें यहां पर सिंपल सा रन करें जहां पे भी इसको लगता होगा ये वहां पे इसे रोक देगा जहां पे भी इसको लगेगा कि यहां से मॉडल की एक्यूरेसी के अंदर आपका फर्क आने लग गया है उसे ये क्या करेगा स्टॉप कर देगा चलिए अब यहां पर अप इसे रन करते हैं और इसे रन करते हैं गाइज यहां पर तो ये केवल और केवल कितने टाइम रन हुआ है यहां पर केवल 1 टूथ थ्री टाइम्स ही रन हुआ है यहां पर तो मैं यहां पे क्या करता हूं चेंज करके फोर कर देता हूं नीचे आता हूं चेंज करके क्या करता हूं फोर कर देता हूं और रन करते हैं यहां पर तो देखिए अब ये कॉल बैक्स और अर्ली स्टॉपिंग कर क्या रहा है ये कॉल बैक्स और अर्ली स्टॉपिंग क्या कर रहा है आपके मॉडल को इन डेप्थ ट्रेन नहीं होने दे रहे जहां पे भी उसे लगता है यहां पर थ्री पॉइंट्स के बाद में यस थ्री पॉइंट्स के बाद में जहां पे भी उसे लगता है कि नहीं यहां पर जाके हमारा मॉडल ओवर फिटेड हो रहा है यहां पर मॉडल की एक्यूरेसी इंप्रूव नहीं हो रही है यहां पर बेसिकली एक ही एक्यूरेसी पे है यहां पर तो फिर उस समय ये क्या करेगा वहीं पे ये मॉडल को स्टॉप कर देगा यस दैट इज कॉल्ड ऑफ अर्ली स्टॉपिंग मतलब आपके मॉडल को इंटरनली पूरा ट्रेड नहीं होने देता है इंटरनली पूरा ट्रेंड होने नहीं देता है उसको पहले ही स्टॉप कर देता है ताकि आपका मॉडल ओवरफिटिंग से बच सके तो दैट द यूजिंग ऑफ कॉलबैक राइट अब यहां पे कॉलबैक के बाद में जो नेक्स्ट हमारे पास आता है यहां पर जो लिस्ट ऑफ आपके पास यहां पर ओवर फीडिंग को दूर कर सकता है वो है आपका रेगुलेशन यस वो क्या है यहां पर रेगुलेशन कि रेगुलेशन का कैसे इस्तेमाल कर सकते हैं तो जरा समझते हैं रेगुलेशन कैसे इस्तेमाल किया जाता है देखिए जब आप अपने हिडन लेयर को इस्तेमाल कर रहे होते हैं इसी हिडन लेयर के अंदर आपके पास रेगुलराइजेशन टेक्निक को आप इस्तेमाल कर सकते हैं जिसके थ्रू आपका मॉडल क्या होगा गाइज यहां पर इंप्रूव हो जाएगा अब कैसे होगा यहां पर तो देखिए ये एक्टिवेशन फंक्शन है यहां पर इस एक्टिवेशन फंक्शन के अंदर आप यहां पर ट्रैक करेंगे तो आपको यहां पर रेगुलराइजेशन मिल जाएगा देखिए आपके पास यहां पर कर्नल रेगुलराइजेशन के नाम से यहां पर जिसे आप रेगुलेशन लगा सकते हैं यस अब इसमें कैसे लगाया जाएगा यहां पर तो पहले आप कर्नल रेगुलराइजेशन को कॉल कर दीजिए यस पहले क्या करें कर्नल रेगुलराइजेशन को कॉल कर सकते हैं जहां पे भी रेगुलेशन लगाना है यस रेगुलराइजेशन टेक्निक के अंदर आप यहां पर ए1 रेगुलेशन लगा सकते हैं एलटू रेगुलेशन लगा सकते हैं l1 एंड ए2 रेगुलेशन लगा सकते हैं अब ये ए1 रेगुलेशन एलटू रेगुलेशन क्या होते हैं यहां पर तो इसको मैंने इन डेप्थ तरीके से सिखाया था कब जब हमने मशीन लर्निंग को स्टडी किया था यस जब हमने मशीन लर्निंग पढ़ा था तो वहां पे जब हम सिंपल लीनियर रिग्रेशन को पढ़ रहे थे उसी वक्त मैंने रेगुलराइजेशन टेक्निक को भी डिस्कस किया जहां पे मैंने l1 एंड l2 रेगुलराइजेशन को डिटेल के साथ आपको एक्सप्लेन किया था कि किस तरह से l1 रेगुलेशन वर्क करता है किस तरह से l2 रेगुलेशन वर्क करता है ठीक है तो चलिए अभी यहां पर इसे लगाने की बारी है कैसे लगाएंगे जरा समझते हैं यहां पर देखिए आपके पास लेयर है लेयर के अंदर आपके पास क्या है गाइस यहां पर डेंस लेयर है इस डेंस लेयर के अंदर आपके पास रेगुलराइजेशन भी आएगा यहां पर चलिए केरा में जाना है यहां पर केरा में जाने के बाद आपको रेगुलराइजर को कॉल करना है रेगुलराइजर को कॉल करने के बाद आप इंपोर्ट कर सकते हैं यहां पर l1 रेगुलेशन मिल जाएगा l2 रेगुलेशन मिल जाएगा l1 और l2 रेगुलेशन दोनों मिल जाएगा तो फिलहाल के लिए मैं यहां पर l2 लगा रहा हूं अब l2 कैसे लगाएंगे गाइस यहां पर तो आपको यहां पर l2 लगाना है l2 लगाने के बाद में इसके अंदर आपको देना है अल्फा पैरामीटर यस क्या देंगे आप यहां पर अल्फा प पैरामीटर देंगे तो पहले तो मैं यहां पे l2 रेगुलराइजेशन लगाता हूं यहां पर राइट क्या लगाता हूं l2 रेगुलराइजेशन लगाता हूं उसके बाद मैं इसको ओपन करता हूं तो आपको अल्फा मिल जाएगा क्योंकि l2 रेगुलेशन है यहां पर इट्स कॉल ऑफ आपके पास इट्स अ हाइपर पैरामीटर यस ये हाइपर पैरामीटर मिल जाएगा इस हाइपर पैरामीटर की वैल्यू क्या है 0.01 है यहां पर अभी फिलहाल के लिए और इसे हम रन कर देते हैं चलिए इसे रन करते हैं और मॉडल को फिट करते हैं देखते हैं यहां पर मॉडल कितनी बार ट्रेंड हो रहा है यहां पर तो देखिए आपके पास दो तीन चार बार ट्रेंड हो रहा है यहां पर और मॉडल की एक्यूरेसी में फर्क भी आ रहा है यहां पर राइट हमने यहां पे अर्ली स्टॉपिंग भी लगा रखी है और ये 14 पे जाके अली स्टॉपिंग रुकी है चलिए एक बार देखते हैं ट्रेनिंग और टेस्टिंग की एक्यूरेसी के अंदर कितना आपके पास यहां पे मॉडल ट्रेंड हुआ है यहां पर मॉडल आपका ट्रेंड हुआ है यहां पर 14 टाइम यस कितनी बार हुआ है 14 टाइम ट्रेड हुआ है यहां पर तो मैं बेसिकली यहां पर 15 कर दूंगा और इसके अंदर भी क्या कर दूंगा गाइज यहां पर आपका 15 कर दूंगा रन करते हैं तो देखिए आपके पास यहां पे एक्यूरेसी में कोई ज्यादा डिफरेंस तो देखने को नहीं मिला बट आपके रेगुलराइजेशन से आपके पास क्या हुई मॉडल की एक्यूरेसी आपके थोड़ी इंप्रूव हुई है मतलब मॉडल थोड़ा और ज्यादा ट्रेंड आपके पास यहां पे हुआ है राइट चलिए यही आपके पास यहां पर रेगुलराइजेशन टेक्नीक आप चाहे तो दूसरी जो हिडन लेयर है वहां पे भी अप्लाई कर सकते हैं और यही टेक्निक आप तीसरी में भी कर सकते हैं चलिए इसे रन कर लेते हैं फिर इसे रन करते हैं और फिर इसे रन करते हैं तो देखिए हमारे मॉडल की एक्यूरेसी कुछ ज्यादा तो बढ़ नहीं रही है राइट हमारे पास वही 79.8 पे ही अटक गई है यहां पर एक्यूरेसी और पहले भी यही थी एक्यूरेसी अभी भी वही एक्यूरेसी है ज्यादा एक्यूरेसी आपके पास यहां पर इंप्रूव नहीं हुई है हां हालांकि ये जो मॉडल जो है ट्रेन वो ज्यादा टाइम हो रहा है यहां पर ये 22 टाइम हो रहा है ये 23 टाइम्स हो रहा है पहले 15 टाइम पहले सिर्फ 14 टाइम था अब यहां पे क्या हो रहा है 24 टाइम्स हमारा मॉडल जो है वो ट्रेंड हो चुका है 24 टाइम्स हमारा मॉडल क्या हुआ है ट्रेंड हो चुका है चलिए रन करते हैं यहां पर ओके अ मुझे पहले तो इसे रन करना पड़ेगा फिर इसे रन करते हैं तो 24 टाइम्स हमारा मॉडल यहां पे टड हो चुका है लेकिन बट मॉडल की एक्यूरेसी में इतना कुछ ज्यादा फर्क यहां पर देखने को नहीं मिल रहा है हां यदि आप ये टेक्निक का इस्तेमाल करते हैं रेगुलराइजेशन टेक्निक का इस्तेमाल करते हैं या फिर अर्ली स्टॉपिंग टेक्निक का इस्तेमाल करते हैं तो आपके मॉडल की एक्यूरेसी इंप्रूव होने के चांसेस ज्यादा हो जाते हैं लेकिन फिलहाल इसके अंदर नहीं हो रहा है तो इसके अंदर और भी बहुत सारे रीजन हो सकते हैं जैसे कि मेरे पास अगला जो रीजन है यहां पर वो है यहां पर असेंबल असेंबल का इस्तेमाल कर सकते हैं या फिर हाइपर पैरामीटर ट्यूनिंग ट्स अ वेरी वेरी इंपोर्टेंट पॉइंट हाइपर पैरामीटर ट्यूनिंग करने से भी हमारे मॉडल की एक्यूरेसी बढ़ती है और बढ़ती नहीं है बहुत ज्यादा बढ़ती है यहां पर हाइपर पैरामीटर ट्यूनिंग करने से राइट और ओवर फिटिंग को दूर भी करती है तो ये हाइपर पैरामीटर ट्यूनिंग कैसे होती है हमारे किसी भी मॉडल के ऊपर इसको हम डिटेल के साथ समझेंगे कब हमारे आने वाले वीडियो के अंदर तो फिलहाल आज की वीडियो के लिए क्या कर रहे हैं बस इतना ही रख रहे हैं इसके अंदर ओवर फिटिंग के अंदर हमने दो मेथड को समझा यहां पर और वो दो मेथड कौन-कौन से हैं यहां पर अर्ली स्टॉपिंग है और रेगुलराइजेशन टेक्निक को समझा यहां पर और आज के इस वीडियो के जरिए हम बात करेंगे यहां पर किसके बारे में बैच नॉर्मलाइजेशन के बारे में अब देखिए बैच नॉर्मलाइजेशन टेक्निक किस तरह से वर्क करती है चलिए जरा अब इसे देखते हैं कि कैसे वर्क करती है तो देखिए जब भी आप आर्टिफिशियल न्यूरल नेट बनाते हैं तो वो आपके पास कुछ इस तरह से दिखते हैं जैसे कि मैंने यहां पर एक आर्टिफिशियल न्यूरल ट बना रहा हूं जिसके अंदर आपके पास क्या होती है सब आपके जितने भी इनपुट्स होते हैं वो आपके पास इस तरह से कनेक्टेड रहते हैं जैसे कि ये आपस में कनेक्टेड है यहां पर एंड ये सब इनपुट्स जो होते हैं वो आपके पास एक आउटपुट लेयर y से आपके पास कनेक्टेड होता है अब ये इनपुट आपके पास x1 x2 एंड x3 आपके पास यहां पर कनेक्टेड रहते हैं और इसके करेस्पॉन्डिंग्ली इस्तेमाल करते हैं तो उसमें आपके पास क्या होता है ये पीछे जाके आपके वेटेज और बायस की वैल्यू को क्या करते हैं अपडेट करते हैं अब क्या होता है गाइज यहां पर कि जब आप पीछे जाके वेटेज और बायस की वैल्यू को अपडेट करते हैं तो होता क्या है कि ये जो पीछे जा की वेटेज और बायस की वैल्यू जो होती है कभी-कभी आपके पास क्या हो जाती है बहुत ही ज्यादा लोअर हो जाती है यस मतलब आपके पास बिल्कुल चेंजेज नहीं होती है या फिर कभी-कभी जाके क्या हो जाती है बहुत ही ज्यादा आपके पास क्या हो जाती है हाई हो जाती है यहां पर अब बहुत ज्यादा लोअर कैसे हो सकती है जैसे कि ये पीछे जा रही है यहां पर और जैसे कि मान लीजिए 0.1 0.1 एंड 0.1 इस तरह से अपडेट हो रही है राइट तो आपका जो वैल्यू अपडेशन जो आपको मिली यहां पर वो क्या मिली आपको गाइज यहां पर 00 आपके पास यहां पर वन आपको अपडेशन मिला है यस प 00 आपके पास क्या मिला है आपको यहां पर वन का अपडेशन आपको मिला यहां पर कुछ इस तरह से छोटे अपडेट हो रते हैं तो गाइस होता क्या है यहां पर कि आपको इस तरह की प्रॉब्लम देखने को मिलती है और ये प्रॉब्लम आपके पास किस तरह से आती है कि जब भी आपके पास यहां पर पीछे वेटेज और वायस की वैल्यू आपके चल रही होती है राइट तो ये आपके पास क्या होती है नॉर्मलाइज नहीं हो रख होती है यस ये आपके पास नॉर्मलाइजेशन नहीं हो रखी होती है और आप यहां पे क्या करते हैं रिलो एक्टिवेशन फंक्शन का भी इस्तेमाल करते हैं तो लो एक्टिवेशन फंक्शन का इस्तेमाल यदि आप देखेंगे तो उसके अंदर क्या होता है कि आपके पास जो भी आपकी वैल्यू होती है यस जो भी आपकी वैल्यू यहां पे आती है यहां पर एक्टिवेशन फंक्शन के थ्रू तो वो क्या होती है गाइज यहां पर मैक्स ऑफ आपके पास रो से लगाकर आपके पास क्या होती है यस आपके पास x की वैल्यू प होती है मतलब आपकी जो भी वैल्यू होगी उसके अकॉर्डिंग होगी आपके पास वैल्यू तो गाइज आपके पास वनिस गेड एंड डिसन जो प्रॉब्लम है यहां पर वो हमें यहां पर देखने को मिल जाती है कि जब भी आप बैकवर्ड प्रोपो केशन की तरफ चलते हैं तो आपके पास वेटेज और वायस की वैल्यू यहां पर इतनी अच्छी तरीके से अपडेट नहीं हो पाती है और जिसकी वजह से हमारे पास क्या होती है प्रॉब्लम आ जाती है वहीं पे अब हमारे पास इस प्रॉब्लम को दूर करने के लिए हम इस्तेमाल करते हैं बैच नॉर्मलाइजेशन का देखिए बैच नॉर्मलाइजेशन टेक्निक क्या है यहां पर देखिए अभी तक हमने क्या देखा एक नॉर्मलाइजेशन टेक्निक को देखा था यस अभी तक हमने जो भी पढ़ा था मशीन लर्निंग के अंदर उसमें केवल और केवल नॉर्मलाइजेशन टेक्नीक को पढ़ाए और नॉर्मलाइजेशन टेक्निक क्या करती है कि जो भी आपका इनपुट होता है यस जो भी आपका क्या है यहां पर इनपुट पार्ट है यहां पर इस इनपुट पार्ट को अंदर क्या करती है नॉर्मलाइज करती है लेकिन व्हाट अबाउट द हमारे पास हिडन लेयर यस हमारे हिडन लेयर के जो इनपुट्स बनते हैं जो कि आपके पास क्या होंगे इसके आउटपुट जो होंगे मतलब यहां पे ये जो आपके पास लेयर्स के अंदर जो नोट्स पड़े हैं यहां पर इनके जो आउटपुट होंगे जो आपके पास यहां पर किससे कनेक्टेड होंगे हमारे हिडन लेयर के नोड से कनेक्टेड होंगे तो इसके बारे में क्या है तो इसके बारे में यहां पर हमारा जो डाटा होता है वो नॉर्मलाइज होके नहीं आता है मतलब यदि हमारे पास कोई डटा जैसा भी है यहां पर जैसे कि मैं बात करूं यहां पर कि हमारा डाटा y इक्वल टू आपके पास यहां पे कुछ आया जैसे 28 आया तो एज इट इज 28 आपके पास कनेक्ट हो जाता है यदि पास मान लीजिए y = 0.028 आया यहां पर तो तो वही आपके पास डायरेक्टली चला जाता है तो बेसिकली हमारा जो डाटा होता है यहां पर जो कि हमारे पास इस नोड के ऊपर आता है वो हमारा नॉर्मलाइज होके नहीं आता है और जब वो नॉर्मलाइज देके वो नहीं आता है तो हमारे पास यहां पर जब हम बैक प्रोपो केशन में यूज करेंगे डाटा हमारा पास तो वही का वही यहां पर कनेक्टेड हो जाता है तो बेसिकली यहां पे प्रॉब्लम क्या हो रही है ये जो आप हिडन लेयर देख रहे हैं यहां पर यस हिडन लेयर के अंदर जो डटा हमारे पास आ रहा होता है वो हमारे पास नॉर्मलाइज होके नहीं आ रहा होता है तो इन हिडन लेयर के अंदर जो हमारा डाटा आ रहा होता है यहां पर इन्हें यदि हमें नॉर्मलाइज करना है तो उसके लिए हमें इस्तेमाल करना पड़ेगा बैच नॉर्मलाइजेशन का यस यहां पे हम क्या करेंगे बैच नॉर्मलाइजेशन टेक्निक का इस्तेमाल करते हुए हम क्या करने वाले हैं गाइज यहां पर कि जो हमारी वर्नेस गेटन डिन जो प्रॉब्लम है यहां पर इसे हम रिजॉल्व करेंगे तो बैच नॉर्मलाइजेशन यदि आप लोगों से कोई पूछे तो आपको सिंपल जवाब देना है कि जो हमारे हिडन लेयर के अंदर जो हमारे इनपुट जो हिडन लेयर के अंदर जो नोड्स है हमारे पास उनके लिए जो डाटा इनपुट्स आ रहा होता है वो नॉर्मलाइजेशन नहीं हो रखा है जिसकी वजह से हमें वनिस गन डिस्टेंट प्रॉब्लम देखने को मिलती है अब हमें इस प्रॉब्लम को दूर करना है तो हमें यहां पे क्या करना पड़ेगा बैच नॉर्मलाइजेशन लगाना पड़ेगा मतलब जो हमारे इनपुट लेयर है इस इनपुट लेयर के अंदर जो डाटा आ रहा होता है यहां पर इन्हें हम क्या करेंगे नॉर्मलाइज करेंगे तो उसके लिए हम क्या करेंगे गाइज यहां पर यूज़ करेंगे बैच नॉर्मलाइजेशन का अब ये बैच नॉर्मलाइजेशन टेक्निक कैसे यूज़ होती है इसको जरा थोड़ा डिटेल के साथ देखते हैं तो देखिए इससे पहले वाले वीडियो के अंदर हमने क्या कर रखा है यहां पर इस तरह का हमने एक मॉडल बना रखा है एन का यस जहां पे हमने क्या कर रखा है कुछ-कुछ हमारे पास यहां पे लेयर्स ऐड कर रखी हैं इस लेयर के अंदर मैंने अलग-अलग अलग तरह की लेयर ऐड की है यहां पर और उसके बाद हमने एक प्रोडक्शन मॉडल बना रखा है फिर हमने एक्यूरेसी भी देख रखी है राइट तो चलिए अब मैं क्या कर रहा हूं यहां इस मॉडल को क्या कर देते हैं रन कर देते हैं और उसके बाद में हम देखते हैं कि हमारे पास जो यहां पर ये जो ए का नेटवर्क है ये हमें किस तरह की एक्यूरेसी दे रहा है पहले हम ये नोट डाउन कर लेते हैं तो मैंने यहां पे रन कर दिया रन करने के बाद ये जो हमारी इंपॉर्टेंट जो हमारे यहां पे मॉड्यूल है वो लोड हो रहे हैं यहां पर एंड देन हमारा डाटा लोड हो चुका है डाटा लोड होने के बाद में अब हमारा ट्रेंसर फ्लो जो है वो लोड हो रहा है यहां पर हरा ट्रेंसर फ्लो यहां पर इंपोर्ट हो रहा है यहां पर उस केरा इंपोर्ट हो रहा है और उसके बाद हमने कुछ लेयर्स ऐड की थी वो यहां पे इंपोर्ट हो रही है और देखिए यहां पे मैंने अर्ली स्टॉपिंग भी लगा रखा है वैलिडेशन टेस्ट भी लगा रखा है बैच साइज भी कर रखी है यहां पर उसके अकॉर्डिंग हमारा जो डाटा है वो हमारे पास आ चुका है अब यहां पर चले एक्यूरेसी के बारे में तो देखिए ट्रेनिंग और टेस्टिंग एक्यूरेसी आप देखेंगे तो आपके पास यहां पे कितनी आ रही है टेस्टिंग एक्यूरेसी 78 आ रही है और ट्रेनिंग एक्यूरेसी 79 पर आ रही है राइट फिलहाल ये ओवरफिटिंग इतनी ज्यादा तो नहीं है यहां पर लेकिन यदि हमारा डाटा ओवर फिटिंग हो जाए तो हम क्या कर सकते हैं बैच नॉर्मलाइजेशन का इस्तेमाल कर सकते हैं अब ये बैच नॉर्मलाइजेशन टेक्निक कैसे इस्तेमाल करेंगे उसको जरा देखते हैं तो फिलहाल के लिए मैं कह रहा हूं कुछ जो लेयर्स हैं वो हटा देता हूं क्योंकि ये कुछ एक्स्ट्राऑर्डिनरी लेयर्स हैं जिनकी हमें जरूरत फिलहाल नहीं है तो मैं यहां लगा रहा हूं अब मुझे क्या करना है नॉर्मलाइजेशन लगाना है बैच नॉर्मलाइजेशन लगाना है तो दैट इज अ लेयर ये क्या है हमारे पास यहां पे गाइज लेयर है यहां पर तो मैं यहां पर लेयर का इस्तेमाल करूंगा अब यहां पर लेयर कैसे लगाएंगे तो बहुत ही सिंपल तरीका है यहां पर आपको क्या करना है गाइज यहां पर बैच नॉर्मलाइजेशन को कॉल करना है यस बैच नॉर्मलाइजेशन को कॉल करना है और ये बैच नॉर्मलाइजेशन जो टेक्निक है यहां पर ये आपकी ऐड करनी है कैसे ऐड करेंगे तो देखिए एन के अंदर जो हमारा पहला नोड आ रहा है देखिए ये हमारा नोड का डाटा आ रहा है यहां पर और जिसके अंदर हमारे एट इनपुट लेयर्स हैं और जो कि सिक्स के अंदर कनेक्टेड हो रहा है अब इसके साथ हमें क्या करना है गाइज यहां पर डॉट ऐड करना है यहां पर जो हमारा आउटपुट निकल के आएगा वो ऐड करना है और इसके अंदर ऐड क्या करना है गाइज यहां पर बैच नॉर्मलाइजेशन टेक्निक को इस्तेमाल करना है तो मैंने यहां पर बैच नॉर्मलाइजेशन टेक्निक इस्तेमाल की है अब यही जो टेक्निक है मैं यहां प भी नीचे वाले में भी लेयर के अंदर इस्तेमाल कर सकता हूं और ये वाली जो टेक्निक है यहां पे भी मैं इस्तेमाल करूंगा लेकिन आउटपुट लेयर के अंदर नहीं करनी है आउटपुट लेयर जो हमारा डटा आ रहा है वो जीरो और वन के फॉर्मेट में ही चाहिए तो इसलिए मैंने इसको वैसा का वैसा रखा है हमारे जो यहां पे वर्श गेड डिस्टन की जो प्रॉब्लम है ये उसे दूर कर देगा और हमारी एक्यूरेसी को क्या करेगा इंप्रूव कर देगा चलिए यहां पर चेक कर लेते हैं हमारा मॉडल कैसे ट्रेंड हुआ है यहां पर ओके तो ये मैंने फिर से मॉडल ट्रेंड किया है यहां पर और यहां पर मैं एक्यूरेसी को देखूं यहां पर तो एक्यूरेसी अभी वही के वही है मतलब एक्यूरेसी में कुछ ज्यादा फर्क यहां पर देखने को नहीं मिला है चलिए एक काम करते हैं नो यहां पर थोड़ा सा चेंज करते हैं मतलब हमारे पास ये जो इनपुट्स लेयर है इनको भी हम चेंज कर सकते हैं बैच नॉर्मलाइजेशन के साथ-साथ देखिए एट है मैंने सिक्स किया सिक्स के बाद में मैं यहां पे क्या कर रहा हूं गाइ यहां पर फोर कर रहा हूं और फोर के बाद में यहां पे थ्री की जगह मैं टू कर रहा हूं मतलब मैं एक पिरामिड शेप बनाने की कोशिश कर रहा हूं यहां पर एंड पिरामिड शीट के थ्रू मैं यहां पे अपना मॉडल ट्रेन कर रहा हूं राइट तो हमारा जो वनस गेट डिसेंट की जो प्रॉब्लम है गाइज यहां पर वो इस बैच नॉर्मलाइजेशन टेक्निक के थ्रू यहां पर रिमूव हो जाएगी चलिए अभी देखिए नंबर ऑफ इपोच मैंने क्या रख रखा है वन रख रखा है इस नंबर ऑफ इपोच को मैं थोड़ा चेंज करता हूं और नंबर ऑफ इपोज इज इक्वल टू मैं 40 कर देता हूं राइट नंबर ऑफ इपोज इज इक्वल टू क्या करता हूं 40 कर देते हैं और चेक करते हैं कि 40 पोच के अंदर कितना हमारा ट्रेंड हो रहा है और एक्यूरेसी में कितना फर्क आ रहा है वो भी हम देख लेंगे चलिए हमारे पास 40 इ पोच के अंदर आपके पास क्या हुआ है 10 इपोच ही हमारे ट्रेंड हो पाए हैं यहां पर क्योंकि उसके बाद जो हमारे पास डाटा है उसके अंदर ज्यादातर आपके पास वेरिएशन नहीं देखने को मिला है इसलिए हमारे पास क्या हुआ गाइज यहां पर आपके पास यहां पर केवल और केवल 10 पोच ट्रेंड हुए हैं एक्यूरेसी के अंदर देखें एक्यूरेसी अभी भी वही है यहां पर कुछ ज्यादा फर्क यहां पर देखने को नहीं मिला है लेकिन जनरली हमारे पास यहां पे क्या होता है कि ये जो बैच नॉर्मलाइजेशन टेक्निक है इसको जब आप इस्तेमाल करते हैं तो आपकी वार्निश ग्रेडन डिसन जो प्रॉब्लम है यहां पर वो दूर हो जाती है है तो बैच नॉर्मलाइजेशन टेक्निक एक सिंपल टेक्निक है जो कि आपके पास इनपुट हिडन लेयर है यस इनपुट हिडन लेयर का मतलब यहां पे है कि जो हिडन लेयर के जो इनपुट्स है यहां पर इनको क्या करता है इनके डाटा को नॉर्मलाइज करके आपको आगे देता है यहां पर ताकि जो वनिस गेड इन डिसन की जो प्रॉब्लम है गाइज यहां पर वो यहां पर रिमूव हो सके और आज के इस वीडियो के जरिए हम बात करेंगे ड्रॉप आउट्टन करता है उससे पहले हम थोड़ा सा ओवरफिटिंग क्या होता है फिटिंग क्या होता है और बेस्ट फिटिंग क्या होता है इसको जरा समझ लेते हैं तो देखिए यदि आपको पाइथन मशीन लर्निंग डेटा साइंस एंड डेटा एनालिसी फीड में अपने आपको को ग्रो करना है तो इसके लिए ् कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं यहां पर मैंने रिग्रेशन एनालिसिस और क्लासिफिकेशन एनालिसिस के अकॉर्डिंग ओवरफिटिंग और अंडरफिटिंग को थोड़ा एक्सप्लेन किया यहां पर देखिए अंडरफिटिंग उस वक्त होता है जब हमारे पास जो हमारा ट्रेनिंग डाटा है यहां पर वो ट्रेनिंग डाटा आपके पास प्रॉपर्ली पूरी तरह से डाटा को ट्रेन नहीं कर पाता है और एक सिंपल सी लाइन क्रिएट करके दे देता है जिसकी वजह से आपके पास क्या होता है आपका डाटा जो है वो अंडरफिटिंग हो जाता है अब इसमें प्रॉब्लम क्या है यहां पर कि यदि हमारे पास कोई नया डाटा आता है तो नए डाटा के अकॉर्डिंग वो प्रेडिक्शन नहीं कर पाता है जस्ट सपोज मान लीजिए कि मेरे पास यहां पर ये आपकी एक्स एक्सिस है और यहां पर मेरा वा एक्सिस है यहां पर राइट तो यदि मेरे पास यहां पे कोई नया डाटा आया इस एक्स एक्सिस के अकॉर्डिंग नया डटा आया यहां पर तो डेटा के अकॉर्डिंग हमारा डेटा यहां होना चाहिए था बट हमारे पास ये प्रेडिक्शन लाइन के अकॉर्डिंग क्या होता गाइज यहां पर ये टा यहां पे हमारे पास रिजल्ट के तौर पे दिखाने लग जाता है तो दैट इज कॉल ऑफ अंडर फिटिंग और यदि मैं बेस्ट फिटिंग का सिनेरियो यदि मैं यहां पे बात करूं तो बेस्ट फिटिंग क्या होगा यहां पर कि इसके मिडल में से एक लाइन जानी चाहिए अब मैं बात करता हूं जो मोस्ट इंपॉर्टेंट चीज है यहां पर गाइ वो है हमारा ओवर फिटिंग सिनेरियो और ओवरफिटिंग सिनेरियो के अंदर क्या होता है गाइज यहां पर कि हमारा जो डेटा होता है यस इस डाटा को ये क्या करता है हमारे पास प्रॉपर्ली पूरा आपके पास क्या करता है ट्रेन करता है प्रॉपर्ली पूरा ट्रेन करने का मतलब क्या है गाइ यहां पर हर एक पॉइंट को क्या करता है वो यहां पर मेमराइज करने की कोशिश करता है जिसकी वजह से ये क्या बन जाता है ओवर फिटेड बन जाता है अब इसमें प्रॉब्लम क्या है यहां पर कि कोई भी हमारे पास जब भी न्यू डाटा हमारे पास आएगा तो वो उसके ऊपर क्या करेगा बेस्ट रिजल्ट यहां पर नहीं निकाल के दिखा एस पर जैसे कि अंडरफिटिंग में काम करता है राइट अब मैं बात करता हूं यहां पर क्लासिफिकेशन के अंदर क्या होता है बेस्ट लाइन की बात करें तो ये इस तरह बनता है और ओवर फिटिंग की बात करें तो ओवरफिटिंग के अंदर क्या होता है कि गाइज यहां पे कि आपका जो भी आपका डाटा है यस जो भी आपका डाटा है यहां पर इस डाटा के अंदर क्या करता है गाइज यहां पर वो परफेक्टली ट्रेन होने की कोशिश करता है मतलब आपके पास यहां पर जितने छोटे-छोटे मिनिम मम पॉइंट्स हैं यहां पर उनके ऊपर भी वो क्या करता है अच्छे से स्प्लिट मार के कोट करने की कोशिश करता है जिसकी वजह से हमारा जो डाटा होता है वो ओवर फिटेड हमारे पास हो जाता है अब ये ओवर फिटेड का सिनेरियो कहां प्रॉब्लम करता है लेट्स सपोज यहां पे तो क्या है हमारा ट्रेनिंग डटा लेकिन हमारे पास हमारा जो टेस्टिंग डाटा है वो कुछ इस तरह से आ गया यस हमारा जो टेस्टिंग डाटा है यहां पर वो कुछ इस तरह से आ गया यहां पर राइट ये हमारा कुछ टेस्टिंग डाटा यहां पे कुछ ब्लू कलर के पॉइंट्स है यहां पर और हमारे पास क्या है कुछ यहां पर रेड कलर के पॉइंट्स भी हमारे पास यहां पर दिखाई दे रहे हैं तो हमारे कुछ इस तरह से आ गया तो ये ओवरफिटिंग होने की वजह से ये क्या करेगा कि जैसे ये लाइन बन रखी है प्रेडिक्शन लाइन बन की ये इसी तरह से क्या करेगा एक प्रेडिक्शन लाइन बना देगा इसमें भी राइट एक क्या करेगा प्रेडिक्शन लाइन बना देगा और जिसकी वजह से हमारे पास क्या होगा हमारे गलत रिजल्ट निकलना शुरू हो जाएंगे जैसे कि ये बनाया मैंने यहां पर अब ये गलत रिजल्ट निकालना शुरू हो गया है क्योंकि लाइन के उस तरफ जो हमारे पास डाटा है वो कैसा होना चाहिए रेड कलर का होना चाहिए जबकि यहां पे सारा डाटा कैसा कर रहा है यहां पर ब्लू कलर का पड़ा है यहां पर जिसकी वजह से हमारे पास क्या हुआ है ये सही तरीके से प्रेडिक्शन नहीं हो पा रहा है राइट सही तरीके से ये क्लास भी नहीं कर पा रहा है तो दैट इज अ ओवरफिटिंग सिनेरियो अब इस ओवरफिटिंग की सिनेरियो को बचने के लिए हम क्या इस्तेमाल कर सकते हैं ड्रॉप आउट लेयर का इस्तेमाल कर सकते हैं ड्रॉपआउट लेयर के जरिए हम क्या कर सकते हैं इसे ओवरफिटिंग से बचा सकते हैं अब ये ड्रॉपआउट लेयर कैसे काम करती है जरा इसको समझते हैं यहां पर देखिए जब भी हम हमारे न्यूरल नेटवर्क को ट्रेन करते हैं तो न्यूरल नेटवर्क में क्या होता है कि हमारा स्टैंडर्ड न्यूरल नेटवर्क जो होता है वो कुछ इस तरह से बनता है जहां पे हमारे पास क्या होता है हमारे सबसे पहले हमारे पास जो भी हमारे इनपुट लेयर होती है वो आपके पास काम आती है यहां पर फिर उसके बाद आपके पास क्या होती है गाइज यहां पर हमारी हिडन लेयर लेयर आती है फिर हमारी दूसरी आपकी जितनी भी आपको हिडन लेयर लगानी है वो हिडन लेयर लगा सकते हैं यहां पर राइट क्या लगा सकते हैं हिडन लेयर लगा सकते हैं यहां पर और देन उसके बाद में हमारे जो आउटपुट लेयर है वो हमें देखने को मिलती है लेकिन ड्रॉपआउट लेयर के अंदर क्या किया जाता है गाइज यहां पर कि हमारे जो हिडन लेयर है यहां पर इन हिडन लेयर के अंदर जो भी हमारी हिडन लेयर है अ ये भी हमारी हिडन लेयर ही है यहां पर राइट इन हिडन लेयर के अंदर हम क्या करते हैं हमारे कुछ नोड्स को ड्रॉप आउट कर देते हैं अब ये ड्रॉप आउट करने का रीजन क्या है यहां पर बहुत ही सिंपल सा रीजन है कि जब भी हम हमारे न्यूरल नेटवर्क लेते हैं मतलब हमारा बेसिक नेटवर्क नेटवक लेते हैं यहां पर तो बेसिक न्यूरल नेटवर्क के अंदर होता क्या है यहां पर कि जो भी हमारे नोट्स हैं यहां पर जस्ट सपोज ये हमारा नोट्स है राइट जस्ट सपोज करते हैं यहां पर कि ये हमारा क्या है नोड्स है यहां पर तो गाइ यहां पर ये जो ओवर फिटिंग का आप सिनेरियो देख रहे हैं जिसके अंदर क्या हो रहा है अबके पास बहुत ही अच्छे तरीके से रेंड हो रहा है इसके अंदर होता क्या है कि आपका जो भी आपके नोट्स है जैसे मान लीजिए ये एक नोट्स हो गया राइट एक आपका ये एक नोट्स हो गया यहां पे आपका तो ये क्या करते हैं ये आपके पास क्या होता है बहुत ही ज्यादा अच्छे तरीके से ट्रेड हो जाते हैं मतलब आपके पास यहां पे ये जो नोट्स हैं यहां पर ये अच्छे तरीके से ट्रेंड नहीं हो पाते हैं और जितना भी हमारा इनपुट डाटा है वो सारा का सारा जो डाटा है यहां पर वो इनको ही मिल जाता है और बाकी जो नोड्स है यहां पर इनको अच्छी तरीके से डाटा नहीं मिल पाता है यस काफी केसेस में ये होता है काफी केसेस में ये होता है कि आपके पास यहां पर क्या होता है कि किसी पर्टिकुलर एक नोड के अंदर ही सारे इनपुट्स जो होते हैं यहां पर वो अच्छे तरीके से आपके पास डाटा दे देते हैं या फिर आपके पास कुछ जो है यहां पर अच्छे जो डाटा है यहां पर वही इसी के पास जाते हैं वो अच्छे से उसको ट्रेन नहीं कर पाते हैं ऐसा जनरली न्यूरल नेटवर्क के अंदर देखा जाता है यहां पर यस न्यूरल नेटवर्क के अंदर क्या देखा जाता है कि आप किसी भी नोड्स को ले लीजिए कुछ आपके पास इनपुट नोड्स जो होते हैं यहां पर वो यहां पर अच्छे से ट्रेन कर जाते हैं यहां पर और कुछ नोड्स जो होते हैं वो अच्छे से ट्रेन नहीं कर पाते जिसकी वजह से हमारे पास क्या होता है कि कुछ हिडन लेयर के जो नोड्स होते हैं वो अच्छे से ट्रेंड हो जाते हैं और कुछ आपका जो नोट्स होते हैं वो अच्छे से ट्रेंड नहीं हो पाते हैं जिसकी वजह से हमारे पास क्या होता है कि हमारा जो मॉडल है यहां पर यस हमारा जो मॉडल है यहां पर वो डाटा के ऊपर आपके पास क्या करता है प्रेस साइज ली आपके पास क्या करता है उन को पार्टीशन करने के लिए लग जाता है जिसकी वजह से हमारे पास यहां पे क्या होती है ओवर फिटिंग के सिनेरियो देखने लग जाते हैं वापस समझिए यहां पर क्या प्रॉब्लम हो रही थी यहां पर यस इस न्यूरल नेटवर्क के अंदर क्या प्रॉब्लम होती है इस न्यूरोल नेटवर्क के अंदर एक ही बहुत ही सबसे बड़ी प्रॉब्लम ये ये है कि कुछ हमारे पास इनपुट्स जो होते हैं वो हमारे हिडन लेयर के जो नोड्स होते हैं यहां पर उनको बहुत ही प्रेस साइली क्या कर जाते हैं ट्रेन कर जाते हैं और कुछ जो इनपुट नोड्स होते हैं वो अच्छे से ट्रेन नहीं कर पाते हैं राइट जिसकी वजह से कुछ हिडन लेयर के जो नोट्स होते हैं यहां पर वो बहुत ही परफेक्टली वर्क कर जाते हैं जिसकी वजह से वो डाटा को प्रस साइली आपके पास क्या करते हैं आपके सेपरेट कर जाते हैं जिसकी वजह से हमें हमारे डाटा के अंदर ओवरफिटिंग का सिनेरियो देखने को मिल जाता है अब इस ओवरफिटिंग की वजह से हमारे पास हमारे जो मॉडल है यहां पर उसके अंदर एक्यूरेसी अच्छे से नहीं मिल पाती है तो अब इस एक्यूरेसी को कैसे इंप्रूव किया जा सके तो इसका जो सबसे बेस्ट सॉल्यूशन होता है वो होता है ड्रॉपआउट लेयर अब ड्रॉपआउट लेयर के अंदर क्या होता है गाइज यहां पर ड्रॉपआउट लेयर के अंदर आपको ये डिसाइड करना होता है कि आपको कितने परसेंट नोट यहां पर ड्रॉप आउट करना है जैसे मैंने बोला यहां पर कि मेरे 20 पर जो नोट्स हैं यहां पर वो ड्रॉप आउटस हो जाना चाहिए इसका मतलब क्या हुआ कि आपके पास जो भी आपकी इनपुट्स ले रहे है या अी आप जिसमें भी ड्रॉपआउट लगाना चाहते हैं उसमें आप लगा सकते हैं तो जो भी आपकी लेयर है यहां पर उसके अंदर आपके पास क्या करेंगे कि जितने भी नंबर ऑफ नोट्स है यहां पर उनमें से जो 20 पर नोट्स हैं वो आपके पास वर्किंग नहीं करेंगे लेकिन ये किस तरह से वर्किंग नहीं करेंगे जैसे मान लीजिए कि आपके पास नंबर ऑफ जो इपोच है यस नंबर ऑफ जो इपोच है यहां पर आपने मान लिया पांच इपोच है तो फर्स्ट आपका जब इपोच चलेगा यहां पर उसके अंदर रैंडम आपका जो आपके 20 पर जो नोट्स है यहां पर वो ड्रॉप आउट कर जाएंगे ड्रॉप आउट करने का मतलब है कि वो आपके पास एज अ इनपुट लेयर के तौर पे पार्टिसिपेंट नहीं करने वाले हैं राइट एज इनपुट लेयर की तरह क्या करेंगे पार्टिसिपेंट नहीं करेंगे और जो रिमेनिंग नोट्स हैं वो अच्छे से ट्रेड हो जाएंगे देन जब आपके पास यहां पर सेकंड आपके पास ो चलेगा तो फिर से आपके पास क्या करेगा रैंडम आपके पास क्या करेंगे आपके जो 20 पर नोट्स हैं वो आपके पास इनपुट लेयर की तरह पार्टिसिपेंट नहीं करेंगे और जो रिमेनिंग जो नोट्स है यहां पर वो एज अ इनपुट लेयर की तरह पार्टिसिपेंट करके ट्रेन हो जाएंगे इससे क्या हमारा मॉडल इंप्रूव हो जाएगा बिल्कुल आपका मॉडल इंप्रूव हो जाएगा कैसे जैसे मान लीजिए कि ये जो दो नोट्स हैं यहां पर ये दो नोट्स आपके पास क्या कर रहे हैं इस नोड को बहुत ही अच्छे तरीके से ट्रेन कर रहे हैं जिसकी वजह से आपके पास क्या हो रहा है यहां पर आपका मॉडल ओवर फिटेड हो रहा है लेकिन जब आपने यहां पे ड्रॉप आउट लगा रखा है यहां पर तो ड्रॉपआउट लगाने के अंदर कोई एक ऐसी आपके पास इपोच जाएगा जिसके अंदर ये जो दो नोट्स हैं यहां पर ये आपके पास वर्किंग नहीं करेंगे तो जो रिमेनिंग जो नोट्स हैं यहां पर वो अच्छे तरीके से एज अ इनपुट के तौर पे वर्क करेंगे जिसकी वजह से ये जो नोट्स हैं यहां पर इन नोट्स के ऊपर भी अच्छे से ट्रेंड हो पाएगा और इन नोट्स के ऊपर आपके पास ज्यादा डिपेंडेंट नहीं हो पाएगा तो हमारा जो मॉडल है वो ओवर फिटिंग के सिनेरियो से क्या होगा बच जाएगा तो बेसिकली गाइज यहां पे क्या हो रहा है कि जब भी आप यहां पर क्या कर रहे हैं आपके पास आपको लगता है कि आपका डाटा ओवर फिटेड होने जा रहा है तो आप ड्रॉपआउट का इस्तेमाल कर सकते हैं ड्रॉप आउट के अंदर जितने परसेंट आप देता देंगे उतने परसेंट के हिसाब से आपके जो भी आपका इनपुट लेयर नोट्स है यहां पर उनमें से रैंडम यस मैं यहां पे एक वर्ड बोल रहा हूं रैंडम आपके पास क्या होगा आपके जो नोट्स हैं वो आपके पास क्या हो जाएंगे ड्रॉप आउट हो जाएंगे ड्रॉप आउट होने का मतलब है यहां पर कि वो वर्किंग में नहीं आने वाले लेकिन यहां पे डिपेंड करेगा नंबर ऑफ इपोच के ऊपर जैसे-जैसे नंबर ऑफ इपोच आके बढ़ेंगे उनमें से आपके पास क्या होंगे कुछ-कुछ नोट्स आपके पास रैंडम आपके पास क्या होंगे आपके पास ड्रॉप आउट होते रहेंगे और आपका मॉडल यहां पर ट्रेंड हो जाएगा जिसकी वजह से आपके पास क्या होगा आपका जो मॉडल है वो ओवरफिटिंग से बच जाएगा इसका एक बेस्ट एग्जांपल ये है कि रैंडम फॉरेस्ट आपने सब लोगों ने पढ़ा होगा यस जब आपने मशीन लर्निंग डिस्कस की होगी तब आपने यहां पर रैंडम फॉरेस्ट भी पढ़ा होगा रैंडम फॉरेस्ट के अंदर भी सेम वर्किंग होता है कि आपका जो भी आपका डेटा सेट होता है उस डेटा सेट को क्या करते हैं डिफरेंट डिफरेंट पार्ट के अंदर सबसेट के अंदर तोड़ देते हैं फिर क्या करते हैं गाइ यहां पर कि जो डिफरेंट डिफरेंट पार्ट के सबसेट के अंदर हमने जो डाटा तोड़ा यहां पर उसके अंदर क्या करते हैं वो रैंडम रेटा होते हैं और हर वक्त हमारे जो मॉडल है यहां पर उसे हम क्या करते हैं ट्रेड करते रहते हैं यस क्या करते हैं यहां पर ट्रेड करते रहते हैं जिसकी वजह से हमारे पास जो हमारा मॉडल है यहां पर वो बहुत ही अच्छे तरीके से ट्रेंड हो जाता है राइट तो सेम एज हमारे पास यहां पे भी यही काम करता है ड्रॉप आउट लेयर के अंदर राइट तो फिलहाल अब यहां पर इसे समझते हैं कि ये ड्रॉपआउट लेयर कैसे काम करता है थोड़ा प्रैक्टिकली समझते हैं जिसके थ्रू हमारा मॉडल जो है वो ओवरफिटिंग के सिनेरियो से बच पाएगा चलिए तो देखिए यहां पे हमने हमारा जो मॉडल है पहले बना रखा था वही हमने वापस इस्तेमाल किया यहां पर देखिए पहले जो हमारी एक्यूरेसी थी वो हमारे पास कितनी आ रही है और 79.8 1 आ रही है यहां पर लेकिन हम यहां पे क्या करेंगे ड्रॉप आउट लेयर का इस्तेमाल करेंगे जिससे हमारे मॉडल की एक्यूरेसी के अंदर इंप्रूवमेंट आएगा और इसके साथ-साथ ओवरफिटिंग का जो सिनेरियो है वो भी दूर हो जाएगा तो चलिए अब इसे रन करते हैं यहां पर और चेक करते हैं कैसे वर्क करेगा तो सबसे पहले जो हमारी रिक्वायर्ड लाइब्रेरी है उसे हम क्या कर रहे हैं इंपोर्ट कर रहे हैं उसके बाद हमारा जो डेटा सेट है उसे लोड करते हैं यहां पर राइट उसके बाद हम टेंसर फ्लो को लोड करते हैं एंड देन बैच नॉर्मलाइजेशन को यहां पर लोड करते हैं यहां पर उसके बाद ए के मॉडल को लोड करते हैं और उसके बाद हमने हमारे मॉडल को आउट के यहां पर राइट और चेक करते हैं कि हमारे मॉडल की एक्यूरेसी कितनी होती है अभी मैंने कोई ड्रॉप आउट लेयर का इस्तेमाल नहीं किया है फिलहाल यहां पर राइट और कोई ड्रॉपआउट लेयर का इस्तेमाल करे बिना ही हम यहां पर हमारे मॉडल की एक्यूरेसी देखें तो हमारा मॉडल जो है यहां पर 40 टाइम ट्रेंड हो चुका है यहां पर और एक्यूरेसी देखने पर हमें क्या मिल रही है यहां पर 84 जो है हमारी वो ट्रेनिंग की एक्यूरेसी देखने को मिल ही है और जो टेस्टिंग ट्रेनिंग की एक्यूरेसी देखेंगे तो 85 है यहां पर और टेस्टिंग की एक्यूरेसी देखेंगे तो आपके पास कहती है 84.5 आपके पास एक्यूरेसी दिख रही है राइट अब हम लगाते हैं हमारा ड्रॉप आउट लेयर जिससे हम हमारी मॉडल की एक्यूरेसी को इंप्रूव कर सके तो अब ये ड्रॉप आउट लेयर कैसे लगता है यहां पर तो इसके लिए आपको क्या करना पड़ेगा गाइज यहां पर केरा के अंदर जाना पड़ेगा यहां पे इंपोर्ट करना पड़ेगा डेंस लेयर को डेंस लेयर के अंदर जाके आपको यहां पे कॉल करना है किसे ड्रॉप आउट लेयर को यस आपको कैसे कॉल करना है ड्रॉप आउट लेयर को कॉल करना है ये क्या करेगा आपके इनपुट्स लेयर के अंदर जो आपके नोट्स आ रहे हैं यहां पर उन नोट्स को हम क्या करेंगे ड्रॉप आउट करेंगे आप यहां पे क्या कर सकते हैं हिडन लेयर के अंदर भी इसे लगा सकते हैं तो चलिए इसे लगाते हैं यहां पर तो देखिए मैं यहां पे क्या कर रहा हूं कि हमारे जो ये नोट्स आ रहे हैं दो नोट्स आ रहे हैं यहां पर इसके अंदर फोर नोट्स आ रहे हैं इसके अंदर हमारे पास कितने आ रहे हैं सिक्स नोट्स आ रहे हैं तो सबसे पहले मैं यहां पे क्या कर रहा हूं ड्रॉप आउट लेर लगाता हूं ड्रॉप आउट लेयर लगाने के लिए आप ए एंड डॉट यहां पर क्या कर सकते हैं ऐड को कॉल कर सकते हैं यस ए एंड डॉट क्या करेंगे यहां पर ऐड को कॉल करेंगे यहां पर ताकि हम क्या कर सके नोड को लगा सक तो मैंने ऐड को लगाया ऐड को लगाने के बाद में मैं यहां पे क्या कर रहा हूं ड्रॉपआउट को कॉल कर रहा हूं अब ड्रॉपआउट को कॉल करने के बाद में मुझे कितने परसेंट ड्रॉप आउट करना है वो मुझे बताना पड़ेगा तो जैसा कि मैं यहां पर 0.5 मतलब मैं % ड्रॉप आउट कर रहा हूं यहां पर लेयर को राइट सेम एज मैं यहां पे क्या कर रहा हूं इसके अंदर भी ड्रॉप आउट कर रहा हूं और सेम एज मैं क्या कर रहा हूं यहां पर इसके अंदर भी ड्रॉप आउट कर रहा हूं अब आउटपुट लेयर के अंदर ड्रॉप आउट मत कर दीजिएगा क्योंकि द आउटपुट लेयर आपके पास एक है तो एक ही रहेगा चलिए अब हम इसे क्या करते हैं रन करते हैं फिर हमारे मॉडल को कंपाइल करते हैं और मॉडल को फिट करते हैं और देखते हैं हमारी एक्यूरेसी के अंदर कितना इंप्रूवमेंट आया है और हम लॉसेस से कितना बच पा रहे हैं यहां पर तो यहां पर एक्यूरेसी आप देखेंगे तो एक्यूरेसी अभी हमारे पास फिक्स चल रही है एक्यूरेसी के अंदर कोई भी फिलहाल अभी कोई चेंजेज नहीं देखने को मिला यहां पर ड्रॉप आउट लेयर लगाने ने के बाद भी राइट और अभी हम यहां पर फिट प्रिडिक्ट लगाएंगे और फिट प्रिडिक्ट लगाने के बाद में अब मैं यहां पे हमारी एक्यूरेसी को है उसको चेक करूंगा और चेक करने के बाद देखूंगा यहां पर कि हमारे आपके पास ओवर फिटिंग से दूर हुआ है या नहीं हुआ है तो फिलहाल देखिए ओवर फिटिंग से हमारा मॉडल नहीं दूर हुआ है यहां पर राइट तो अभी मैं क्या रहा हूं ड्रॉप आउट लेयर को थोड़ा सा चेंज करेंगे जैसे कि मैं यहां पे क्या कर रहा हूं इस ड्रॉप आउट लेयर को एक बार के लिए हटा देता हूं यहां पर और इस ड्रॉप आउट लेयर को भी हटा देता हूं और इस जो ड्रॉप आउट ले र है इसमें 30 पर ही ड्रॉप आउट करने वाला हूं यहां पर अच्छा हमने यहां पे एक मिस्टेक कर दी है ड डॉट डेंस के अंदर मैंने यहां पर एक ब्रैकेट को हटा दिया चलिए इसे रन कर देते हैं यहां पर फिर से रन करते हैं और फिर से रन करते हैं राइट और हमारा मॉडर ट्रेन करते हैं और चेक करते हैं कि आपका जो ड्रॉप आउट है क्या वो एक्यूरेसी को इंप्रूव कर रहा है या नहीं कर रहा है राइट जनरली आपका जो आपका डाटा है वो बहुत ही ज्यादा ओवर फिटेड मिल जाए लेकिन अभी हमारे पास जो हमारा डाटा है वो इतना ज्यादा ओवर फिटेड नहीं है देखिए यहां पर फिलहाल राइट तो इस वजह से हमें ड्रॉपआउट लगाने की इतनी ज्यादा जरूरत नहीं है क्योंकि हमारे पास मॉडल इतना ओवर फिटेड नहीं है यहां पर यस बिना हमारे पास यहां पर ड्रॉप आउट ले लगाए भी हम यहां पर हमारे मॉडल की जो एक्यूरेसी है अच्छी तरीके से गेट कर सकते हैं मतलब अच्छी गेट कर सकते हैं यहां पर राइट इस पर्टिकुलर डेट के अंदर तो ऐसा जरूरी नहीं है कि आपको हर बार ड्रॉपआउट लगाना ही लगाना है यहां पर जब आपका मॉडल अच्छी एक्यूरेसी फिलहाल ऐसे ही दे दे मतलब आपके पास बिना ड्रॉपआउट लगाही दे दे यहां पर बिना ड्रॉपआउट लगाए भी आप मॉडल की अच्छी एक्यूरेसी गेट कर सकते हैं लेकिन यदि आपको लगे कभी कि आपका जो मॉडल है वो ओवर फिटेड हो रहा है यहां पर तब आपको क्या करना है ड्रॉप आउट लेयर का इस्तेमाल करना है और ड्रॉप आउट लेयर का इस्तेमाल करते हुए आप अपने मॉडल को इंप्रूवमेंट कर सकते हैं उसके लिए आपको क्या करना पड़ेगा गाइ यहां पर उसके लिए आपको केरा में जाना पड़ेगा लेयर्स में जाना पड़ेगा और वहां से आपको ड्रॉप आउट को कॉल करना पड़ेगा फिर आप यहां पर एक लेयर को ऐड कर सकते हैं जहां पे आप ड्रॉप आउट लिख के जितने परसेंट का आपको ड्रॉप आउट देना है वो आप ड्रॉप आउट दे सकते हैं ड्रॉप आउट का मेन काम क्या होता है कि जो भी आपके इनपुट्स नोड होते हैं चाहे वो आपके हिडन लेयर के इनपुट्स नोड बने यहां पर या हिडन लेयर अगले हिडन लेयर के इनपुट न बढे इनके अंदर हमारे पास क्या होता है मॉडल बहुत ज्यादा ओवर फिटेड होने लग जाता है तो इस ओवर फिटिंग से बचने के लिए यस इस ओवर फिटिंग से बचने के लिए हम क्या करते हैं यहां पर हमारे डाटा के अंदर कुछ नोट्स को हम ड्रॉप आउट कर देते हैं मतलब हटा देते हैं जिसकी वजह से हमारा जो यहां पे मॉडल है वो ओटिंग से बच जाता है राइट तो इस तरह से आप क्या कर सकते हैं ड्रॉप आउट का इस्तेमाल कर सकते हैं अपने मॉडल की एक्यूरेसी को इंप्रूव करने के लिए और ओवरफिटिंग से बचाने के लिए और आज की इस वीडियो के जरिए हम बात करेंगे वर्ज ग्रेड एंड डिजइन प्रॉब्लम के बारे में तो चलिए जरा इसे समझते हैं यहां पर देखिए जब भी आप डीप न्यूरल नेटवर्क को ट्रेन कर रहे होते हैं तब आप यहां पे अपना डिजायर आउटपुट काने के लिए आप बैक प्रोपो केशन का इस्तेमाल करते हैं जिसके थ्रू आपके पास वेटेज और बायर्स की वैल्यू अपडेट होती है अब विटेज और बायस की वैल्यू को जब आप अपडेट करते हैं विद द हेल्प ऑफ यहां पर ग्रेडिएंट लर्निंग के हेल्प से मतलब ग्रेडिएंट डिसेंट की हेल्प से तो उस समय आपने यहां पर एक चीज नोटिस की होगी कि आपका जो वेटेज की वैल्यू है व ज्यादा अपडेट नहीं नहीं होती है बहुत ही माइन्यूट सा चेंजेज देखने को मिलता है इस चेंजेज की वजह से आप अपने डिजायर आउटपुट तक नहीं पहुंच पाते हैं चाहे आप जितने भी आप नंबर ऑफ इपोच को लगा दीजिए तब भी आप अपने डिजायर आउटपुट तक नहीं पहुंच पाते हैं इस प्रॉब्लम को वनिस गेडियन डिजइन प्रॉब्लम बोलते हैं इसका मतलब एक सिंपल वे में बोलूं यहां पर कि मान लीजिए कि आप क्या कर रहे हैं यहां पर वेटेज को अपडेट करने जा रहे हैं अब वेटेज के अपडेट के अंदर आपके पास कुछ इस तरीके से वेटेज अपडेट हो रहा है 0.1 0.1 0.1 यस इस तरह से आपका क्या हो रहा है आपका वेटेज अपडेट हो रहा है यहां पर तो जब आप यहां पर इसे चेक करेंगे तो आपका वेटेज के अंदर क्या हो रहा है पॉइंट पंट 0.001 का अपडेशन हो रहा है यहां पर जिसकी वजह से आपके वेटेज के अंदर कुछ ज्यादा चेंजेज मेजर चेंजेज नहीं देखने को मिलता है अब जब आपके वेटेज के अंदर ज्यादा चेंजेज नहीं देखने को मिलता है इस प्रॉब्लम को हम वर्स केडिन डिजइन प्रॉब्लम बोलते हैं और इस वजह से आप कभी भी अपने न्यूल नेट को अच्छे से ट्रेन नहीं कर पाते हैं आप अपना डिजायर आउटपुट जो है वो कभी भी गेट नहीं कर पाते हैं तो फिर अब हम किस तरह से यहां पर इसे सॉल्व कर सकते हैं प्लस इसके साथ-साथ ये इसके आने का रीजन क्या है यहां पर इसको थोड़ा डिटेल के साथ समझते हैं देखिए वनिज ग्रेडन डिजइन का मतलब क्या होता है गाइज यहां पर कि जैसे ये हमारा न्यूरल नेटवर्क है इस न्यूरल नेटवर्क में हमें हमारा डिजर आउटपुट y चाहिए राइट मतलब मुझे y पेडक चाहिए यहां पर और y पेडक की जो वैल्यू है यहां पर वो हमारे पास जो हमारे ओरिजिनल वाय है उसके इक्विवेलेंट नहीं आ रही है मतलब आपके पास यहां पर लॉसेस की जो वैल्यू है वो बहुत ज्यादा है अब इसके लिए हम क्या करते हैं बैक प्रोपेगेशन का इस्तेमाल करते हैं बैक प्रोपेगेशन करने के लिए हम किसका इस्तेमाल करते हैं ग्रेडिएंट डिसेंट का इस्तेमाल करते हैं इसका मतलब क्या हुआ गाइज यहां पर कि यदि मुझे वेटेज की वैल्यू अपडेट करनी है यदि मुझे वेटेज न्यू लाना है तो मुझे क्या करना पड़ेगा गाइज यहां पर वेटेज ओल्ड को लेना पड़ेगा माइनस लर्निंग रेट को लगाना पड़ेगा और लॉस को यहां पर डिफरेंशिएबल के राइट अब जब आप यहां पे बैक प्रोपो केशन करते हुए यहां पर अपडेट करने जाते हैं तो इस अपडेशन के अंदर आपका बहुत ही माइन्यूट सा अपडेट होता है माइनर से अपडेट होने का मतलब क्या है 001 का अपडेशन होता है जैसे एग्जांपल के तौर पे यदि मैं बात करूं तो आपके पास j डबल ओल्ड था वो मान लीजिए आपके पास 2.09 से इस तरह का था आपके पास यहां पर और जो डब् न्यू निकल के आपके पास आया वो आपके पास कुछ निकल के आया 0.97 आपके पास 9 निकल के आ गया अब यहां पे अपडेशन देखेंगे तो 0.009 का अपडेशन है यहां पर और ये अपडेशन बहुत ही माइनर सा होता है जिसकी वजह से आप अपने डिजायर आउटपुट तक नहीं पहुंच पाते कभी भी तो अब इस प्रॉब्लम को हम क्या बोलते हैं वनिस ग्रेड एंड डिसेंट प्रॉब्लम बोलते हैं अब इस वनिस ग्रेड एंड डिसेंट प्रॉब्लम आने के पीछे क्या रीजन हो सकते हैं उसको जरा समझते हैं देखिए वनज गेटन डिसेंट आने के आपके पास दो रीजन हो सकते हैं मेजर पहला मेजर रीजन आपके पास ये हो सकता है कि आप यहां पर डीप न्यूरल नेटवर्क को ले रहे हैं यहां पर यस डीप न्यूरल नेटवर्क ले रहे हैं यहां पर डीप न्यूरल नेटवर्क का मतलब क्या है यहां पर कि आप यहां पर नंबर ऑफ हिडन लेयर जो है यहां पर नंबर ऑफ आपके पास जितने भी हिडन लेयर यहां पर है यहां पर वो बहुत ही ज्यादा रख रहे हैं बहुत ही ज्यादा मतलब आपके पास नंबर ऑफ हिडन लेयर यहां पर 10 से 15 यहां पर रख रहे हैं इसकी वजह से आपको वनिस ग्रेडन डिसेंट प्रॉब्लम देखने को मिल जाती है लेकिन अब पॉइंट यहां पे भी ये आता है कि मान लीजिए हमारे पास कोई एक ऐसा डाटा आया जिसके अंदर नंबर ऑफ फीचर बहुत सारे हैं इसके साथ-साथ उसी के अंदर नंबर ऑफ आपके पास यहां पर इंपॉर्टेंट जो डेटा है यहां पर वो भी बहुत ज्यादा है तब हमारे पास उसके इंपॉर्टेंट फीचर को गेट करने के लिए हमें डीप न्यूरल नेटवर्क की जरूरत पड़ती है तो क्या डीप न्यूरल नेटवर्क एक परफेक्ट पॉइंट है बिल्कुल नहीं डीप न्यूरल नेटवर्क एक परफेक्ट पॉइंट नहीं है हालांकि डीप न्यूरल नेटवर्क की वजह से आपको वर्नेस गन डिसेंट प्रॉब्लम देखने को मिल जाती है लेकिन सेकंड चीज यहां पे आती है कि यदि आप अपने जो एक्टिवेशन फंक्शन है अब ये एक्टिवेशन फंक्शन कौन सा है तो हिडन लेयर के एक्टिवेशन फंक्शन की बात करें यदि हिडन लेयर के एक्टिवेशन फंक्शन के अंदर यदि आप इस्तेमाल कर रहे हैं सिग्मो इड फंक्शन का या फिर आप इस्तेमाल कर रहे हैं यहां पर t एच एक्टिवेशन फंक्शन का तो आपको यहां पर वार्निश गेड इंडिसन प्रॉब्लम देखने को जरूर मिलती है क्योंकि ये दोनों जो एक्टिवेशन फंक्शन है ये अपना जो आउटपुट है वो आपके पास क्या करते हैं जीरो से लेके वन की रेंज में देता है स्पेशली मैं सिगमॉड एक्टिवेशन फंक्शन की बात करूंगा कि ये अपना जो आउटपुट है वो जीरो से लेके वन की रेंज में देते हैं मतलब आपके पास जो रिजल्ट होता है वो रो या वन की रेंज में आता है जिसकी वजह से आउटपुट जो होता है यहां पे गाइ वो बहुत ही ज्यादा छोटा हो जाता है तो यदि आप हिडन लेयर के तौर पे सिगमॉड एक्टिवेशन फंक्शन 10 एक्टिवेशन फंक्शन का इस्तेमाल कर रहे हैं तो आपको डेफिनेटली यहां पर आपको वर्नेस गेड एन डिसेंट प्रॉब्लम देखने को मिल जाती है तो गाइज यहां पर वनिस ग्रेडन डिसेंट आने के दो मेजर रिज है यहां पे पहला यदि आपने नंबर ऑफ डन लेयर बहुत ज्यादा बढ़ा दिया है तब आपको वनिस ग्रेडन डिसेंट प्रॉब्लम देखने को मिलेगी सेकंड आपके पास क्या होती है गाइज यहां पर यदि आप एक्टिवेशन फंक्शन के तौर पे कौन सा हिडन लेयर एक्टिवेशन फंक्शन के तौर पे सिगमॉड या आपके पास 10h का इस्तेमाल कर रहे हैं तो आपको ये प्रॉब्लम देखने को मिल जाएगी अब पॉइंट यहां पे ये आता है कि इसको रिमूव कैसे किया जा सकता है तो इसको रिमूव करने के बहुत से आपके पास तरीके हैं पहला तरीका आपके पास यह है कि आप हिडन लेयर पे सिग्मो इड एक्टिवेशन फंक्शन और t एक्टिवेशन फंक्शन का इस्तेमाल ना करें इसकी जगह आपको इस्तेमाल करना चाहिए यहां पर रिलो एक्टिवेशन फंक्शन को यस डीलो एक्टिवेशन फंक्शन को इस्तेमाल करना चाहिए जो कि रो टू मैक्स के बीच में आपके पास होता है मतलब आप का जो भी डाटा होगा वो जीरो से लेके मैक्स के बीच के रेंज के अंदर आपको देखने को मिलेगा तो आपका पहला आपका यहां पर तरीका है कि आप क्या करें यूजिंग आपके पास रिलो एक्टिवेशन फंक्शन का इस्तेमाल करें सेकंड आपके पास यहां पे जो आप वेटेज ले रहे हैं यहां पर मतलब डब्लू जो आप पहला ले रहे हैं यहां पर उस वेट का इनिश इजेशन सेल्फ करें मतलब आपके पास यहां पर वेट इजेस्टस आपको करना चाहिए सेकंड के बाद में थर्ड इंपॉर्टेंट चीज है यहां पर कि आप यहां पर इस्तेमाल करें बैच नॉर्मलाइजेशन का यस ये बैच नॉर्मलाइजेशन टेक्निक क्या होती है तो गाइज जो भी आप आपके हिडन लेयर से अगले नोड्स के ऊपर जो आपका इनपुट जाता है मतलब देखिए ये आपकी हिडन लेयर है इस हिडन लेयर से आपके पास यहां पे आपका इनपुट जा रहा है तो वो जो आपका डाटा जा रहा है उसको हमें क्या करना चाहिए स्केलिंग करके देना चाहिए दैट इज कॉल्ड ऑ बैच नॉर्मलाइजेशन टेक्निक तो आपको बैच नॉर्मलाइजेशन टेक्निक का इस्तेमाल करना चाहिए देखिए मैं आपको कुछ टेक्निक बता देता हूं यहां पर तो सॉल्यूशन क्या है यहां पर प्रॉपर पहले वेट इजेशन कीजिए यहां पर नॉन सैचुरेटेड एक्टिवेशन फंक्शन का इस्तेमाल कीजिए नॉन सैचुरेटेड एक्टिवेशन मतलब आपके पास यहां पर है रिलो एक्टिवेशन फंक्शन का इस्तेमाल कीजिए बैच नॉर्मलाइजेशन का इस्तेमाल कीजिए बैच नॉर्मलाइजेशन टेक्निक का मतलब यहां पर है गाइ यहां पर बेसिकली कि आपको क्या करना है यहां पर कि आपके जो हिडन लेयर के जो नोड्स है यहां पर उनके अंदर जो डाटा आ रहा है यहां पर उसे भी आपको स्केलिंग करनी चाहिए थर्ड के बाद में फोर्थ जो चीज है यहां पर वो आपके पास है ग्रेडन क्लिपिंग करनी चाहिए तो ये चार तरीके हैं आपके पास यहां पर जिसके थ्रू आप वनिस ग्रेडिएंट डिसेंट प्रॉब्लम से बच सकते हैं अब यहां पर जरा समझते हैं यदि हमारे न्यूल नेट के अंदर वनिस ग्रेडन डिसेंट प्रॉब्लम आ गई है तो हम उसे कैसे पहचानेंगे तो चलिए उसके पहचानने का तरीका मैं आप लोगों को बता देता हूं तो देखिए मैंने यहां पर हमारा एक मॉडल बना रखा है मैं पहले मॉडल को ओपन करके दिखा देता हूं आप लोगों को तो देखिए ये हमारा मॉडल बना रखा है जिसके ऊपर हम बहुत ही पहले से काम कर रहे हैं यहां पर अब यदि आपको आपके मॉडल के अंदर आपकी जो एक्यूरेसी है या फिर आपका जो लॉस है उस लॉस के अंदर कोई भी आपको वेरिएंट नहीं देखने को मिले मतलब आपका लॉस जो है यहां पर वो कंटीन्यूअसली आपके पास यहां पर सेम आता रहे जैसे देखिए यहां पर मैंने अपना मॉडल ट्रेन किया और मॉडल ट्रेन करने के अंदर देखिए मुझे लॉस के अंदर क्या देखने को मिला वेरिएंट देखने को मिला देखिए लॉस हमारे पास क्या हो रहा है लगातार लगातार आपके पास क्या हो रहा है कम होता जा रहा है यहां पर आप चेक करेंगे नाना यहां पर तो आपका जो लॉस है यहां पर वो लगातार कम होता जा रहा है इसका मतलब इसके अंदर वनिस गडि डिसन प्रॉब्लम नहीं है यदि ये जो लॉस है यहां पर ये लॉस आपका चेंजेज नहीं हो रहा है आपका लॉस जो है वो कंटीन्यूअसली सेम आता जा रहा है इसका मतलब आपके न्यूरल नेटवर्क के अंदर वनिस ग्रेडिएंट डिसेंट प्रॉब्लम आ चुकी है अब इसको दूर करने के लिए आप बैच नॉर्मलाइजेशन का इस्तेमाल कर सकते हैं या फिर वेट लाइजेशन टेक्निक का इस्तेमाल करके आप इसे कर सकते हैं हैं तो आई थिंक आई होप सो समझ में आया होगा कि वनिस ग्रेडिएंट डिसेंट प्रॉब्लम क्यों आती है और इस वनिस ग्रेडन डिसेंट प्रॉब्लम की वजह से आप अपने न्यूरल नेटवर्क को अच्छे से ट्रेन नहीं कर पाते हैं इवन दैट आपके पास नंबर ऑफ इपोच आप बढ़ाने पर भी आपका जो न्यूरल नेटवक है वो अच्छे से ट्रेड नहीं हो पाता है जिसकी वजह से आप यहां पर अपने जो डिजायर आउटपुट है वहां तक नहीं पहुंच पाते हैं तो इसी के लिए आपको क्या करना चाहिए आपको वर्नेस गेड एन डिसन प्रॉब्लम से दूर होने के लिए इन सारी टेक्निक का इस्तेमाल करना चाहिए और आज के इस वीडियो के जरिए हम बात करेंगे हाइपर पैरामीटर ट्यूनिंग के बारे में इससे पहले हाइपर पैरामीटर ट्यूनिंग करने से पहले हम यहां पर यह देखते हैं कि हमारे पास यहां पर हाइपर पैरामीटर्स कौन-कौन से हैं मतलब जिनको चेंजेज करने से हमारे पास हमारे मॉडल के अंदर इंप्रूवमेंट आती है ये चीजें देखते हैं तो चलिए अब जरा इसे थोड़ा डिटेल के साथ देखते हैं यदि आपको पाइथन मशीन लर्निंग डाटा साइंस एंड डेटा एनालिस जैसी फील्ड में अपने आप को ग्रो करना है तो इसके लिए डब्लू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो देखिए ये हमारा a9 का मॉडल बना हुआ था जैसे कि हमने स्टार्टिंग में बनाया था और लास्ट वाली वीडियो के अंदर हमने अर्ली स्टॉपिंग के बारे में समझा था इसके साथ-साथ हमने एलटू रगुला इजेशन को भी यहां पर लगाया यहां पर हमने एलटू रेगुलेशन को भी समझा था और इसे हमने ट्रेन किया था और ट्रेन करने के बाद देखा था कि हमारा मॉडलर ओवर फिटिंग हो रहा है अंडरफिटिंग हो रहा है या बेस्ट फिटिंग हो रहा है ये सारी चीजें देखी थी लेकिन इस मॉडल के थ्रू हमने ये देखा था कि हमारे पास एक्यूरेसी के अंदर कोई भी इंप्रूवमेंट नहीं आ रहा मतलब आपका स्टार्टिंग से लेकर एंडिंग तक हमारी जो एक्यूरेसी है वो एक जैसी लगातार रह रही है यहां पर इसकी वजह से हमारे पास हमारा जो मॉडल है वो अच्छे तरीके से ट्रेड नहीं हो पा रहा है तो अब हमें क्या करना पड़ेगा यहां पर हाइपर पैरामीटर ट्यूनिंग करनी पड़ेगी हाइपर पैरामीटर ट्यूनिंग मतलब इसके अंदर कुछ ए ए के मॉडल के अंदर कुछ चीजों के अंदर चेंजेज करना पड़ेगा अब वो चेंजेज करने के पैरामीटर्स क्या-क्या है जरा उसको समझते हैं तो सबसे पहले हम क्या करते हैं यहां पर हमारी जो रिक्वायर्ड लाइब्रेरी है उसे हम इंपोर्ट करते हैं और उसके बाद हम क्या करते हैं यहां पर हमारी जो सीएसपी फाइल उसे लोड करते हैं फिर डाटा सेट को देखते हैं फिर हमारे पास इनपुट आउटपुट को अलग-अलग करते हैं एंड देन स्टैंडर्ड स्केलर करते हैं और यहां पर आ जाते हैं ट्रेन और टेस्टक स्प्लिटिंग के अंदर ट्रेन टेस्ट स्प्लिटिंग के अंदर आने के बाद में अब हमारा जो टेंसर फ्लो मॉडल है इस टेंसर फ्लो को यहां पर इंपोर्ट करते हैं और उसके बाद जो यहां पर लेयर्स हैं और जो हमारे रेगुलराइजेशन है अर्ली स्टॉपिंग एंड सीक्वेंशियल है इनको भी हम क्या करते हैं इंपोर्ट करते हैं और उसके बाद एन का एक सीक्वेंशियल ैयार कर देते हैं अब देखिए इसके अंदर जो हाइपर पैरामीटर जो टर्म्स है यहां पर इनके अंदर सबसे पहली जो टर्म्स आती है यहां पर नंबर ऑफ हिडन लेयर यस आप यहां पर नंबर ऑफ हिडन लेयर्स को बढ़ा सकते हैं घटा सकते हैं अपनी इच्छा से यहां पर रख सकते हैं देखिए आईडियली जो चीज देखे गई यहां पर कि जो आपकी हिडन लेयर की जो पैटर्स होते हैं वो आपको एक पिरामिड शेप के अंदर रखने चाहिए मतलब सबसे पहले सबसे ज्यादा उसके बाद उससे कम फिर उससे कम फिर उससे कम और फिर सिंगल पैरामीटर राइट इस तरह से एक यरार की बना रखनी चाहिए मतलब आपके पास एक पिरामिड शेप बनाए रखनी चाहिए जिससे हमारे मॉडल की एक्यूरेसी अच्छी आ सके तो बेसिकली गाइज यहां पे क्या करना है कि हमें हमारे मॉडल के अंदर यस हमारा ये जो मॉडल है यहां पर इसके अंदर हमें यहां पर कोशिश करनी है कि आपके पास यहां पर हायरा की बने राइट कभी-कभी इस हराकी के अंदर भी अच्छा रिजल्ट नहीं आता है तो हमने यहां पर सीक्वेंशियल को लिया यहां पर सीक्वेंशियल के बाद में जो सबसे पहला हमारा हाइपो पैरामीटर है यहां पर दैट इज अ नंबर ऑफ हिडन लेयर देखिए नंबर ऑफ हिडन लेयर जो है यहां पर वो आप कितनी भी रख सकते हैं यहां पर लेकिन आपको ना तो ज्यादा हिडन लेयर एक्स्ट्रा रखनी है ना ही आपको हिडन लेयर कम रखनी है अब देखिए हिडन लेयर को यदि आप बढ़ाते हैं तो उससे क्या फायदा होता है देखिए हिडन लेयर को यदि आप बढ़ाते हैं तो जो भी आपका स्ट्रक्चर है आपका जो भी स्ट्रक्चर है डेटा स्ट्रक्चर है यहां पर या फिर आपका जो भी पैटर्स है उसके अंदर हर एक एजेस को हर एक एजेस को मतलब हर एक पॉइंट के ऊपर वो अच्छे से ट्रेड होता है तो यदि आप नंबर ऑफ हिडन लेयर को इंक्रीज करते हैं तो वो अच्छे से हर एक चीजेस के ऊपर अच्छे से ट्रेंड होता है मतलब हर एक डेटा पॉइंट के ऊपर वो अच्छे से ट्रेंड होता रहता है राइट अब यहां पे पॉइंट आता है कि बेसिकली यदि आपने नंबर ऑफ हिडन लेयर कम रखी तो बेसिकली आपके पास यहां पर वो बिल्कुल भी यहां पर अच्छी तरीके से ट्रेंड नहीं हो पाएगा जैसे एग्जांपल के तौर पे मैं बात करूं कि मान लीजिए हमारे पास कोई फेसेस है मान लीजिए मेरे पास ये कोई आपके पास फेस है यहां पर जैसे कि ये मेरा फेस है अब इस फेस को मुझे क्या करना है यहां पर इसे लर्न करना मतलब स्पेस को यहां पर मुझे यहां पर क्या करना है इसको ट्रेन करना है अब ट्रेन करने पर क्या हुआ कि गाइ यहां पर यदि आपने नंबर ऑफ डन लेयर कम रखी है तो वो क्या कर पाएगा कि ये जो आपके पास यहां पे जो एजेस हैं उन्हें अच्छे तरीके से ट्रेंड नहीं कर पाएगा उनके अच्छे-अच्छे से प्रिमिटिव फीचर्स नहीं ले पाएगा तो बेसिकली नंबर ऑफ फिडेन लेयर आपको क्या करनी चाहिए यहां पर थोड़ी सी ज्यादा लेनी चाहिए सेकंड चीज ये आता है कि इतनी भी ज्यादा नहीं लेनी चाहिए जा कि हमारे पास मॉडल जो है वो ओवर फिटेड हो जा यस आपको यहां पर ओवरफिटिंग का सिनेरियो भी बचाना है यहां पर उसके लिए नंबर ऑफ डन लेयर को आप एक्स एक्स्ट्रा ऑर्डिनरी ना ले राइट आपको एक लिमिटेड आपको रखनी है यहां पर हिडन लेयर को राइट एक लिमिटेड हिडन लेयर रखनी है और इतनी भी नहीं रखनी है कि आपके पास बहुत ही कम हो तो चलिए यहां पर देखिए हिडन लेयर अभी मेरे पास क्या है यहां पर बेसिकली आपके पास चार हिडन लेयर मैंने यहां पर रखी है जिसमें दे एक आउटपुट लेयर हो गई यहां पर और तीन मेजर हमारे पास यहां पर क्या है हिडन लेयर है अच्छा इसके ऊपर यदि मैं मॉडल की एक्यूरेसी को पता करूं तो मॉडल की एक्यूरेसी कितनी आ रही है तो यदि मॉडल की एक्यूरेसी देखें तो 78 और 79 हमारे पास आ रही है और जो कि बहुत ही ज्यादा कम है यहां पर राइट बहुत ही ज्यादा कम है यहां पर बेसिकली तो अब ये जो एक्यूरेसी है हमारे पास बहुत कम है यहां पर तो इसकी एक्यूरेसी को बढ़ाने के लिए मुझे क्या करना पड़ेगा मेरी हिडन लेयर को बढ़ाना पड़ेगा अब हिडन लेयर को कैसे बढ़ा सकते हैं तो देखिए हमारे पास इनपुट लेयर कितने है एट है एट के बाद मैंने क्या रखा सिक्स रखा सिक्स के बाद में मैं क्या कर रहा हूं गाइज यहां पर एक और यहां पर हिडन लेयर को ऐड कर रहा हूं यस एक और हिडन लेयर को ऐड कर रहा हूं और वो हिडन लेयर किस नंबर पे आएगी गाइज यहां पर फाइव नंबर पे आएगी फाइव के बाद फोर आ गई फोर के बाद में मैं एक और हिडन लेयर लगा रहा हूं यहां पर यस गाइ और वो फोर के बाद अपने अगली जो हिडन लेयर आएगी वो पॉइंट आएगी थ्री पे फिर 3 2 1 करके मैंने हिडन लेयर इस तरह से ट्रेंड की है चलिए अब यहां पर क्या करते हैं हमारा मॉडल ट्रेंड करते हैं इसके ऊपर हमारा मॉडल किस तरह से ट्रेंड होगा कितनी एक्यूरेसी आएगी उसको भी जरा चेक कर लेते हैं ओके तो देखिए हमारे पास अच्छी तरह से मॉडल ट्रेंड हो चुका है यहां पर और अभी देखिए यहां पर मैं फिर से इसे रन करता हूं यहां पर फिर से इसे रन करता हूं फिलहाल देखिए हमारे जो एक्यूरेसी है वो कितनी थी पहले 78 थी मैं पहले वाली जो एक्यूरेसी है उसे नोट डाउन कर लेता हूं यहां पे कहीं पे ताकि आपको एक्यूरेसी के अंदर पता चल सके कि कितना फर्क हमें यहां पे आया यदि हमारे पास डन लेया जो बेसिक थी उसके ऊपर चेक करें तो हमारे पास जो एक्यूरेसी थी वो ये आई है और अब जो यहां पे पे कंसेप्ट चल रहा है उसके हिसाब से मैं एक्यूरेसी देखूं ठीक है तो अब देखिए एक्यूरेसी में अंदर फर्क आया यहां पर 81 आ गया है और आपके पास क्या हो गया गाइज यहां पर 79 आ गया है तो एक्यूरेसी के अंदर काफी फर्क आया है यहां पर और एक्यूरेसी आपके पास इंप्रूव हुई है सेकंड नंबर पे आपका जो हाइपर पैरामीटर ट्यूनिंग का पॉइंट आता है वो आता है हमारे पास नंबर ऑफ नोट्स अब देखिए नंबर ऑफ नट्स के अंदर मैंने यहां पे जो पैटर्न बनाने की कोशिश की है यहां पर वो हमारे पास एक पिरामिड शेप है मतलब सबसे पहले यहां पर एट इनपुट लेयर हो गई यहां पर उसके बाद सिक्स आपके पास हो गई यहां पर उसके बाद फाइव हो गई है उसके बाद फोर हो गई है उसके बाद थ्री हो गई है इसके बाद टू हो गई है एंड दन वन हो गई है तो मैंने यहां पे जो पैटर्न बनाने की कोशिश की है वो कैसी है पिरामिड शेप की है आप अपने हिसाब से यहां पर पैटर्न बना सकते हैं यहां पर लेकिन आपको ज्यादातर ध्यान रखना है कि आपका जो पैटर्न हो वो आपके पास मॉडल की एक्यूरेसी को इंप्रूव करता हो ऐसा ना हो कि आप कुछ भी रैंडम पैटर्न बनाए देखिए जनरली ये देखा गया है कि पिरामिड शेप का जो पैटर्न होता है वो आपको अच्छी एक्यूरेसी निकाल के देता है तो जैसा कि मैंने यहां पर पिरामिड शेप का पैटर्न बनाया तो इससे देखिए हमारी अच्छी एक्यूरेसी आई है यहां पर लेकिन मैं चाहूं तो इस पिरामिड शेप के प पैरामीटर को चेंज कर सकता हूं और मैं चेक कर सकता हूं कि मेरी एक्यूरेसी किस तरह से बढ़ रही है जैसे देखिए यहां पर मैंने देखिए पहले मैं क्या किया दो फ ले लिया यहां पर फिर मैंने क्या किया गाइ यहां पर 2 थ ले लिया अब इसके ऊपर मैं एक बार अपना मॉडल ट्रेंड करके देखूं कि इसके ऊपर हमारी एक्यूरेसी का मॉडल किस तरह से आ रहा है देखिए आपके पास एक्यूरेसी जो है वो 79.8 पे अटक गई है यहां पर ओके 79.8 है यहां पर एक्यूरेसी अभी भी 79.8 है ठीक है और यहां पर आपके पास देखेंगे तो आपके पास 35 तक आपका जो मॉडल है वो ट्रेड हुआ है यहां पर चलिए अब रन करते हैं यहां पर फिर से रन करते हैं यहां पर एंड फिर से रन करते हैं और फिर से रन करते हैं एंड देन फिर से रन करते हैं तो मॉडल के अंदर देखिए आपका जो ओवर फिटिंग है वो आपका कम हो गया है यहां पर आपके पास देखिए पुरानी वाली जो आपके पास यहां पर है एक्यूरेसी वही वापस आपके पास आ चुकी है तो मॉडल की एक्यूरेसी आप यहां पर बढ़ा सकते हैं कैसे नंबर ऑफ हिडन लेयर को बढ़ा के नंबर ऑफ नोड्स को चेंज करके सेकंड चीज आता है यहां पे गाइस आपके पास यहां पे नंबर ऑफ इपोच यस नंबर ऑफ इपोच को कम या ज्यादा करके भी आपके पास एक्यूरेसी इंप्रूव की जाती है इवन दैट बैच की साइज को भी आप चेंजेज करके एक्यूरेसी इंप्रूव कर सकते हैं अब बैच की साइजेस के अंदर क्या डिफरेंस है यहां पर जरा समझिए देखिए यदि मैं यहां पे बात करूं कि मेरे डेटा सेट के अंदर टोटल पॉइंट कितने है एक्स स्ट्रन के अंदर आपके पास टोटल नंबर ऑफ आपके पास नंबर्स कितने हैं यहां पर नंबर ऑफ डेटा पॉइंट कितने हैं तो यदि वो आपको देखना है तो वो आप देख सकते हैं एक्स डॉट शेप के हिसाब से एक् डॉट शेप के अंदर देखेंगे तो टोटल आपके पास कितने है 8000 आपके पास क्या है डेटा पॉइंट है अब 8000 डेटा पॉइंट है यहां पर तो इस 8000 डेटा पॉइंट के अंदर आप किस तरह से ट्रेंड कर सकते हैं देखिए समझिए यहां पर आपके पास जब आपके बैस्ट साइज रखते हैं तो बैच साइज आपके पास ग्रेडिएंट डिसन की तरह वर्क करती है ये जो बेस्ट साइज है यहां पर ये किसकी तरह वर्क करती है ये ग्रेडिएंट डिसेंट की तरह वर्क करती है अब ग्रेडिएंट डिसेंट आपके पास क्या होता है तीन तरह का होता है जिस इसके अंदर आपके पास फर्स्ट होता है बैच गेड एन डिसेंट दूसरा होता है मिनी बैच गेड एन डिसेंट और तीसरा होता है चकट गेड एंड डिसेंट अभी जो यहां पे गेड एन डिसेंट लग रहा है वो आपका लग रहा है बैच गेड एन डिसेंट अब आप यहां पर इसे गेड एन डिसेंट को चेंज भी कर सकते हैं कैसे सबसे पहला तरीका आपके पास है यहां पर सबसे पहले बैच गेटन डिसेंट बैच गेड डिस्टेंट में क्या होगा कि जो भी आपका ट्रेनिंग डेटा सेट है यस जो भी आपका ट्रेनिंग डेटा सेट है उसके हिसाब से आप इसे कंप्लीट लगा दीजिए मतलब 8000 है 8000 लगा दीजिए और फिर आप इसे रन कर दीजिए तो गाइ ये आपका पास क्या हो गया बैच ग्रेड एंड डिस्टेंट हो गया और बैच ग्रेड एंड डिस्टेंट के हिसाब से आपके जो एक्यूरेसी आई है वो 79.8 आई है तो ये था आपका बैच गेटन डिसेंट जिसके अंदर हमने क्या किया गाइज यहां पर आपके पास यहां पे जितने भी डेटा पॉइंट थे वो सारे के डाटा पॉइंट आपने बैच साइज में लगा दिए इट्स कॉल्ड ऑफ बैच ग्रेडिएंट डिसेंट राइट यदि आप यहां पर वन लगाते हैं तो ये आपका क्या बनेगा कस्टिक एडेंट से बन जाएगा इसके अंदर आपके पास हर एक डेटा पॉइंट जो है वो आपके पास ट्रेंड होंगे और इसके अंदर आपका टाइम ज्यादा लगेगा लेकिन आपका मॉडल बहुत ज्यादा एक्युरेटली आपके पास क्या होगा ट्रेंड होगा और इसके अंदर जो आपको एक्यूरेसी मिलने वाली है वो काफी हद तक बहुत अच्छी मिलने वाली है यहां पर चाहे वो ट्रेनिंग की एक्यूरेसी हो चाहे वो टेस्टिंग की एक्यूरेसी हो बहुत अच्छी मिलने वाली है लेकिन बट आपके पास इसके अंदर जो टाइमिंग है यहां पर वो बहुत ज्यादा देखने को मिलेगा आपके पास यहां पर किसके अंदर आपके पास च कोस्टिक ग्रेडन डिजइन के अंदर अब बात करते हैं कि यदि हम मिनी बैच गडन डिजइन लगाए तो क्या होगा यहां पर तो देखिए मिनी बैच ग्रेडिएंट डिसेंट जो है आपके पास यहां पर वो बैच ग्रेडिएंट डिसेंट और चटी ग्रेडिएंट डिसेंट का मिक्स अप है राइट इसके अंदर जो टोटल नंबर ऑफ डाटा है यहां पर उसके अंदर आप कितने कितने के बैच बनाना चाहते हैं वो आप डिसाइड करते हैं यहां पर जैसे कि मुझे यहां पर देखिए क्या है यहां पर मेरे डो टा पॉइंट यहां पर 8000 है मैं चाहता हूं यहां पर कि एक बैच 100 का बने यहां पर तो वो बेसिकली मैं बना सकता हूं कैसे यहां पर 100 टा पॉइंट का बनाएंगे तो देखिए आपके पास यहां पे जाएंगे और यहां पे सिंपल सा 100 लिख दीजिए तो देखिए आपके पास यहां पर क्या बन रहा है यहां पर बेसिकली आपके पास 100 का एक बैच बन रहा है तो टोटल कितने हो गए गाइ यहां पर आपके 80 बैच हो गए तो यहां पे देखिए आपके 8080 बैच जो है यहां पर आपके ट्रेंड हो रहे हैं यहां पर इस तरह से यदि आप यहां पर बैच को बढ़ाना चाहते हैं मतलब मैं बैच की साइज जो है यहां पर 200 पॉइंट एक साथ रखना चाहता हूं तो देखिए जैसे ही आप यहां पर 200 यदि आप रखते हैं राइट तो आपके पास यहां पे बैच साइज चेंज होती है तो जैसे ही आप अपने बेच साइज के अंदर 200 300 400 इस तरह से आप डेटा डालते हैं यहां पर तो ये आपके बन जाता है यहां पर मिनी बैच इरिटेशन तो आप अपने बैच साइज को चेंज करते हुए आप अपने मॉडल की एक्यूरेसी को इंप्रूव कर सकते हैं अब यहां पर थर्ड पॉइंट पे आता है आपके पास नंबर ऑफ़ रिपोज देखिए काफी बार क्या होता है आपके पास यहां पर नंबर ऑफ रिपोज बहुत कम देते हैं जिसके ऊपर आपका मॉडल जो है वो अच्छे तरीके से ट्रेन नहीं हो पाता है वो अच्छे तरीके से जो उसके फीचर्स होते हैं वो उनको गेट नहीं कर पाता है तो फिर इसके लिए सबसे बेस्ट तरीका है कि आप नंबर ऑफ इपोज की जो वैल्यू है उसे इंक्रीज करें यस नंबर ऑफ आपके पास यहां पे इपोज जो है उसे इंक्रीज करें जितने ज्यादा आप यहां पर नंबर ऑफ इपोज करेंगे यहां पर आपके पास मॉडल के ट्रेन होने की आपके चांसेस है उतनी ज्यादा होती रहेगी लेकिन एक प्रॉब्लम ये है कि यदि आपने नंबर ऑफ रिपोज की वैल्यू बहुत ही ज्यादा कर दी तो उससे आपका मॉडल ओवर फिटेड हो जाता है यस उससे क्या होगा गाइज यहां पर आपका मॉडल जो है यहां पर वो ओवर फिटेड होने के चांसेस ज्यादा रह जाती है यहां पर तो उस वजह से आपके पास आपको डाटा के अंदर एरर देख देखने को मिलेगी मतलब आपके जो आंसर्स है वो आपको रॉन्ग प्रेडिक्शन होने लग जाएंगे अब इसके लिए जो सबसे सही तरीका है वो आपके पास क्या है अर्ली स्टॉपिंग अर्ली स्टॉपिंग का इस्तेमाल कर सकते हैं यहां पर इससे क्या होगा कि जब भी आपका जो डाटा सेट है वो आपके पास ओवर फिटिंग की तरफ बढ़ रहा होगा तो ये आपके जो ओवर फिटिंग है उसे रोक देगा लेकिन ऐसा भी ना करें कि आपके पास नंबर ऑफ इपोज की वैल्यू कम ही करते हैं जैसे मैं नंबर ऑफ इपोज जो है यहां पर एक ही रख दूं यस क्या रखूं यहां पर एक ही नंबर ऑफ इपोज र के रन करूं तो ये दैट इज अ नॉट अ गुड पार्ट इससे आपकी मॉडल की एक्यूरेसी अच्छी नहीं होने वाली है तो गाइज यहां पर ये कुछ हाइपर पैरामीटर थे उसके बाद में हमारे पास कुछ ऑप्टिमाइजर हो है आप ऑप्टिमाइजर की वैल्यू को चेंज करके आपके यहां से काम ले सकते हैं अब ऑप्टिमाइजर की वैल्यू कैसे चेंज होती है जैसे फिलहाल अभी एडम ऑप्टिमाइजर है इसके अलावा आरएमएस प्रो ऑप्टिमाइजर भी होता है यहां पर इसके अलावा एड डेल्टा होता है एड ग्राड होता है इस तरह के ऑप्टिमाइजर को आप इस्तेमाल करके आप अपने मॉडल की एक्यूरेसी को इंप्रूव कर सकते हैं राइट तो ये कुछ आपके पास क्या थे आपका हाइपर पैरामीटर थे जिनकी वजह से आप अपने मॉडल की एक्यूरेसी को इंप्रूव कर सकते हैं और आज के इस वीडियो के जरिए हम बात करेंगे कलेशन न्यूरल नेटवर्क के बारे में जिसे हम सीएनए नेटवर्क भी बोलते हैं और बेसिकली यह कब काम आता है जब आपको डायरेक्ट इमेजेस का क्लासिफिकेशन करना हो मतलब आप इमेजेस को देकर आप यह पूछना चाहते हैं कि ये कैट की इमेज है ये डॉग की इमेज है तो उसके लिए हम इस नेटवर्क का इस्तेमाल करते हैं तो बेसिकली ये नेटवर्क कैसे काम करता है आज के इस वीडियो के जरिए समझेंगे और इस नेटवर्क के अंदर हमें कौन-कौन से लेयर्स की जरूरत पड़ती है इसको भी हम यहां पर डिटेल के साथ देखने वाले हैं तो चलिए जरा अब इसे समझते हैं यहां पर तो देखिए सीएनए क्या है आर्टिफिशियल न्यूरल नेटवर्क का ही एक पार्ट है जिसका पूरा नाम कलेशन न्यूरल नेटवर्क है ये बेसिकली इमेज क्लासिफिकेशन के लिए बनाया गया यहां पर मतलब आप अपनी इमेज को देखकर ये पूछ सकते हैं कि ये किसकी इमेज है यहां पर लेकिन इससे पहले आपको उन इमेजेस के ऊपर ट्रेंड करना पड़ेगा अपने मॉडल को मतलब अपने मॉडल को समझाना पड़ेगा यहां पर कि ये जो इमेजेस है ये कैट की है डॉग की है या काउ की है बफेलो की जिसकी भी आपके पास है यहां पर ये समझाना पड़ेगा मतलब हमें पहले मॉडल को ट्रेड करना पड़ेगा पड़ेगा फिर हम एज पर टेस्टिंग के लिए हम उसे इमेज देंगे तो वो इमेजेस को रीड करते हुए हमें ये रिजल्ट देगा कि ये इमेज किस चीज की है तो इस चीज के लिए हम यहां पर इस्तेमाल कर रहे हैं कलेशन न्यूरल नेटवर्क का लेकिन क्वेश्चन यहां पे ये उठता है कि क्या केवल कलेशन न्यूरल नेटवर्क के थ्रू ही हम इमेज का क्लासिफिकेशन कर सकते हैं क्या हम एनए नेटवर्क के थ्रू नहीं कर सकते क्या बिल्कुल आप एनएन नेटवर्क के थ्रू इमेज का क्लासिफिकेशन कर सकते हैं लेकिन अब आपको यहां पर एक पॉइंट उठा लेना पड़ेगा कि जो भी आप इमेज ले रहे हैं उस उस इमेजेस को हमें नंबर्स में कन्वर्ट करना पड़ेगा पहले देन उसके बाद में हम उन नंबर्स को लेते हुए हम हमारा एन का नेटवर्क डिजाइन कर सकते हैं तो यदि आप हमारे जो नेटवर्क है यहां पर एरन का नेटवर्क है उसके अंदर इमेज लेना चाहते हैं तो उसको पहले नंबर्स में हमें कन्वर्ट करना पड़ेगा और आप सभी को पता है कि हम जो भी इमेजेस देखते हैं यहां पर वो इमेजेस एज ए बाइनरी फॉर्मेट के अंदर हमारे पासस होती है मतलब एज अ नंबर फॉर्मेट के अंदर हमें देखने को मिल जाती है यहां पर और वो नंबर फॉर्मेट आपके पास यहां पर जीरो से लगाकर 250 55 के बीच में एक रेंज के अंदर आपको देखने को मिलता है जिसके थ्रू आपकी इमेज बनती है आगे चलते हुए हम इस इमेजेस के बारे में समझेंगे भी कि इमेजेस कैसे होती है और किस तरह से बनती है राइट लेकिन हम यदि आर्टिफिशियल न्यूरल नेटवर्क के अंदर यदि काम करना चाहे तो हम हमारी इमेजेस को पहले नंबर में कन्वर्ट करेंगे देन फर्द फिर हम यहां पे क्या कर सकते हैं आर्टिफिशियल न्यूरल नेटवर्क का इस्तेमाल कर सकते हैं लेकिन इसके अंदर जो आपके मॉडल की जो एक्यूरेसी है वो बहुत ही कम आने वाली है उसकी जगह पर हम इस्तेमाल करते हैं हमारे कलेशन नेटवर्क का ये कलेशन नेटवर्क जो होती है हमारी आइज के जैसे के जैसे वर्क करती है आइज के जैसे वर्क करने का मतलब क्या है देखिए हमारी जो आइज होती है ह्यूमन आइज होती है ये क्या करती है किसी भी इमेजेस को पहले रीड आउट करती है और रीड आउट करके क्या करती है यहां पर उसकी जो इमेजेस है उसकी इमेजेस का जो इमेज है मतलब आपके पास ये इमेज का जो इमेज है यहां पर वो हमारे आइस के जो इनर पार्ट है वहां पे ये बनाती है फिर ये कुछ फिल्टर्स से होते हुए कुछ एजेस से डिटेक्शन करते हुए ये क्या करती है गाइज यहां पर हमारे ह्यूमन माइंड तक पहुंचाती है और यदि हमारे ह्यूमन माइंड के अंदर उस इमेजेस से पहले से ही आपका स्ट्रक्चर बना हुआ है यहां पर और उसका नाम डिसाइड है तो हमें यह पता चल जाता है कि ये इमेजेस किसकी है जस्ट लाइक एग्जांपल के तौर पे यदि मैं आप लोगों के सामने यह मैं दिखाना चाहूं तो आप यहां पर इस मॉडल को देखते हुए ये बोल सकते हैं कि यह क्या है एक माउस है अब माउस का स्ट्रक्चर आपने पहले भी बहुत सारा देख रखा है यहां पर इसी की हेल्प से आपने इस माउस के स्ट्रक्चर को पहचान लिया है और आपने बता दिया है सेम एज इसी कांसेप्ट को इस्तेमाल करते हुए हमारे पास जो आर्टिफिशियल न्यूरल नेटवर्क के जो इंजीनियर्स हैं जो हमारे पास साइंटिस्ट हैं उन्होंने कन्वेंशनल ननल नेटवर्क का डिजाइन किया इस कन्वेंशनल न्यूरल नेटवर्क के जरिए हम क्या करते हैं डायरेक्टली इमेजेस लेते हुए हम उसका प्रेडिक्शन करते हैं कि ये जो इमेजेस है वो किस चीज की है यहां पर मतलब क्लासिफाई करना स्टार्ट कर देते हैं राइट तो ये भी क्या है आपके पास यहां पर डीप न्यूरल नेटवर्क का ही पार्ट है यहां पर अब मेन इंपॉर्टेंट पार्ट ये आती है कि ये काम कैसे करती है मतलब ये कन्वेंशनल न नेट काम कैसे करता है तो देखिए कन्वेंशनल न्यूरो नेटर के अंदर जब भी आपको ये अपनी इमेजेस देते हैं ये इमेजेस सबसे पहले जाती है अपने कलेशन लेयर के अंदर ये कलेशन लेयर क्या करती है है गाइज यहां पर कि आपकी जो भी इमेजेस हैं उस इमेजेस के अंदर जो भी आपके इंपॉर्टेंट फीचर्स है यहां पर या जो इंपॉर्टेंट फीचर के जो आपके एजेस है यहां पर एजेस का मतलब मैं बेसिकली बात करूं तो जैसे कि ये हमारी इमेजेस है इस इमेज के अंदर जो हमारी इंपॉर्टेंट फीचर का जो एजेस है वो क्या-क्या है गाइज यहां पर ये वाला एज हो गया यहां पर हमारा ये वाला एज हो गया ये वाला एक एज हो गया इसके बाद में देखिए यहां पर ये वाला एक एज हो गया यहां पर ये एक एज हो गया यहां पर तो जितने भी एजेस है यहां पर उन एजेस को डिटेक्ट करती है ताकि आपकी जो इमेज है उसे अच्छे तरीके से रीड किया जा सके तो देखिए सबसे पहला काम क्या होता है यहां पर कि आपकी जो भी इमेजेस है उस इमेजेस के अंदर जितने भी एजेस है यहां पर उन्हें आपके पास क्या किया जाता है फाइंड आउट किया जाता है विद द हेल्प ऑफ किससे कलेशन लेयर के हेल्प से अब कन्वेंशन लेयर्स की जो आपके पास डाटा आता है यहां पर वो डाटा काफी हैवी डाटा होता है उसको आप डायरेक्टली आप इस्तेमाल नहीं कर सकते किसके लिए प्रेडिक्शन के लिए और ना ही आप आगे लेयर के अंदर इस्तेमाल कर सकते हैं क्योंकि दैट वेरी वेरी लार्ज अमाउंट ऑफ डाटा अब लार्ज अमाउंट ऑफ डेटा क्यों बोल रहा हूं यहां पर लेट्स सपोज एग्जांपल के तौर पर बात करते हैं यहां पर कि आपके पास एक इमेज है जो यहां पर 1024 * 1024 की एक इमेजेस है राइट अब यहां पर ये क्या है इतनी पिक्सेल की आपके एक इमेजेस है अब ये क्या लिखा है मैंने पिक्सेल लिखा है आपकी जो भी इमेजेस होती है वो आपके छोटे-छोटे पिक्सल्स के अंदर डिवाइड होती है मतलब आप जब भी अपने इमेजेस को जूम करके देखेंगे तो आपको छोटे-छोटे छोटे-छोटे बॉक्स दिखेंगे और वो कलर बॉक्सेस आपके पास क्या कहलाता हैं यहां पर पिक्सेल कहलाते हैं मतलब एक इमेजेस के अंदर 1 आपके पास यहां पर पिक्सल्स आपके पास होंगे वर्टिकली एंड हॉरिजॉन्टल उसके बाद में आपकी जो एक इमेज है वो आपके पास बन के निकल के आती है अब कनोलेशन लेयर के अंदर जो आपकी इमेजेस तैयार होती है यहां पर वो काफी हैवी इमेजेस होती है और उसकी हैवी इमेजेस को यदि हमने डायरेक्टली यूज कर लेते हैं तो हमारा सिस्टम जो है वो क्रैश कर जाता है तो फिर इसका एक अल्टरनेटिव है यहां पर कि हम हमारी इमेजेस का जो यहां पर निकला है कन्वेंशनल के जो हमारी इमेज निकली है यहां पर उसको हम क्या करते हैं कंप्रेस करते हैं और उस कंप्रेस करने के लिए हम इस्तेमाल करते हैं हमारी पलिंग लेयर का ये पलिंग लेयर जो है यहां पर वो बार-बार यूज किया जाती है मतलब कन्वे लेयर पूलिंग लेयर कन्वे लेयर पलिंग लेयर इनको बार-बार बार-बार इस्तेमाल किया जाता है ताकि हमारे जो इमेजेस के अंदर जो आपके पास इंपॉर्टेंट फीचर्स है यहां पर वो अच्छे तरीके से गैट करले जाए अब इसके बाद में पलिंग लेयर के बाद में हमारे इस नेटवर्क को हम कनेक्ट कर देते हैं फुली कनोलेशन के साथ या फिर हमारे पास इस डाटा को हम भेज देते हैं फुली कनोलेशन के पास अब ये फुली कलेशन लेयर क्या होती है गाइज यहां पर फुली कलेशन लेयर के यदि मैं बात करूं यहां पर तो दैट इज अ एनएन नेटवर्क यस आप कहां पहुंचा देते हैं गाइज यहां पर एनएन नेटवर्क को पहुंचा देते हैं मतलब आपके पास इसके आगे मतलब आपके पास जो भी आपकी इमेजेस आई इसको हमने कलेशन लेर के पास पहुंचाया उसके बाद हमने पूलिंग के लास पहुंचाया फिर वापस कलेशन के पास पहुंचाया फिर वापस पुलिंग के पास पहुंचाया ऐसे आप जितने प्रोसेस करना चाहे उतने प्रोसेस कर सकते हैं देन उसके बाद जो आपका डाटा बचा फाइनली उसको ले जाके हमने दे दिया फुली कन्वेंशनल लेयर को फुली कन्वेंशनल लेयर का मतलब है गाइ यहां पर हमारे एनए के नेटवर्क को ताकि वो यहां से एक प्रेडिक्शन सिस्टम बना सके मतलब आपके पास एक क्लासिफिकेशन सिस्टम बना सके कि ये जो आपके पास गिवन इमेज है यह कार की इमेज है या डॉग की इमेज है या काउ की इमेज है ये पहचान सके तो गाइ कन्वेंशनल न्यूरल नेटवर्क और आर्टिस न्यूरल नेटवर्क में एक मेजर डिफरेंस है कि आर्टिल न्यूरल नेटवर्क के अंदर हमारे पास जो डेटा डायरेक्टली आता है वो टेबुलर फॉर्मेट के अंदर होता है नंबर फॉर्मेट के अंदर देखने को मिलता है लेकिन कन्वेंशनल न्यूल नेटवर्क के अंदर जो हमारा डाटा यहां पर आता है वो हमारा इमेजेस होता है और इस इमेजेस नेटवर्क के डाटा को हम क्या करते हैं नंबर डाटा में कन्वर्ट करते हैं विद द हेल्प ऑफ देन फिल कन्वेंशन लेयर देन पुलिंग लेयर एंड उसके बाद फुल्ली कन्वेंशन लेयर की हेल्प से देन उसके बाद में इस डाटा को हम क्या करते हैं पास ऑन कराते हैं हमारे आर्टिफिशियल न्यूरल नेटवर्क को जिसके थ्रू हम हमारा प्रोडक्शन सिस्टम तैयार करते हैं अब बात करते हैं यहां पे कि ये जो इमेजेस होती है इमेजेस है क्या यहां पर देखिए जब भी आप किसी कलर इमेजेस की बात करते हैं यहां पर यस आप किसकी बात कर रहे हैं गाइज यहां पर आप किसी भी कलर इमेजेस की बात करते हैं तो उस कलर इमेजेस के अंदर हमारे पास तीन कलर चैनल होते हैं और वो कलर चैनल होते हैं आरजी बी अब ये आरजीबी कलर चैनल का मतलब क्या है रेड ग्रीन एंड ब्लू कलर आपको चैनल देखने को मिलते हैं अब यहां पे आपने जो भी अपनी इमेजेस बोली है जैसे आपनी इमेजेस है यहां पर 1024 * 1024 यहां पर तो ये 1024 * 1024 के आपके पास तीन कलर चैनल मिलेंगे वो 0 से 255 के बीच में होती है यस ये जो रेंज आपको देखने को मिलेगी ये हमेशा रो से लेक 255 के बीच में देखने को मिलती है और इन केस हम यहां पे ब्लैक एंड वाइट इमेजेस की बात करें तो वहां पे हमारे पास एक ही कलर चैनल होता है यस ब्लैक एंड वाइट इमेज के अंदर हमारे पास क्या होता है एक ही कलर चैनल आपके पास मिलता है और उसके अंदर डायरेक्टली आपको कलर मिलता है यहां पर 255 के बीच में रो से लेकर 255 के बीच में हमें एक ही कलर चेंज अंदर देखने को मिलता है तो देखिए गाइस यहां पर जो भी आप इमेजेस इस्तेमाल कर रहे हैं उस इमेजेस के अंदर पहली तो चीज क्या है आपकी जो इमेजेस है वो इतने पिक्सल्स के अंदर होती है इवन दैट आपके यहां पर कलर चैनल इमेज का इस्तेमाल कर रहे हैं मतलब रंगीन इमेजेस का इस्तेमाल कर रहे हैं यहां पे कलरफुल इमेज का इस्तेमाल कर रहे हैं तो उसके अंदर आपके जो पिक्सेल की क्वांटिटी होती है वो इस तरह से बढ़ जाती है जैसे 1024 * 1024 यस 1024 * 1024 * 3 थ्री इसलिए किया यहां पर क्योंकि तीन कलर चला रहे हैं यहां पर r g एंड बी रेड ग्रीन एंड ब्लू ये तीन कलर चैनल देखने को हमें मिलते हैं यहां पर तो गाइज ये जो आपकी इमेजेस होती है वो इमेजेस कुछ इस तरह की होती है अब ये जो हैवी इमेजेस होती है इनके डायरेक्टली वर्क नहीं किया जा सकता तो फिर इसके लिए हम कन्वेंशनल लेयर पुलिंग लेयर कन्वेंशन लेयर पुलिंग लेयर से होते हुए हम क्या करते हैं इमेज क्लासिफिकेशन सिस्टम यहां पर तैयार करते हैं तो गाइज कन्वेंशन ले नेटवर्क के अंदर हम क्या कर रहे हैं गाइज यहां पर इमेज का क्लासिफिकेशन कर रहे हैं ना कि हमारे पास जो टेबुलर डेटा आ रहा है जिसके अंदर हमारा सारा डाटा न्यूमेरिकल फॉर्मेट में है उसके थ्रू नहीं हम यहां पर हमारी इमेजेस को लेते हुए उसके अंदर हम इस तरह से तैयार करते हैं अब यदि मैं फाइनलाइज लिखूं यहां पर कि कि हमें करना क्या होता है तो सबसे पहले हमारी इमेजेस होती है उसको कन्वेंशन लेयर से पास कराना है फिर हमें मैक्स पूलिंग से पास कराना है फिर हमें फ्लैटरिंग से पास करना है फ्लैट इन क्या करेगा गाइज यहां पर कि देखिए आपके पास जो भी आपका न्यूरल नेटवर्क होगा आर्टिफिशियल न्यूरल नेटवर्क होगा वो कुछ इस तरह से आपके पास होगा लेकिन आपके पास जो कलर चैनल इमेज होगी वो आपको एक एज ए मैट्रिक्स फॉर्मेट में आपको देखने को मिल जाएगी तो ये जो मैट्रिक्स फॉर्मेट में आपको जो इमेजेस देखने को मिल रही है इस मैट्रिक्स फॉर्मेट की इमेजेस को हमें क्या करना है यहां पर एक सिंपल नेटवर्क के अंदर मतलब सिंपल एक रो के अंदर कन्वर्ट कर होना है तो उसके लिए हम क्या इस्तेमाल कर रहे हैं फ्लेटन का इस्तेमाल कर रहे हैं और इस फ्लेटन के बाद में फुली कन्वेंशन लेयर का इस्तेमाल करते हुए हम हमारी इमेज का प्रोडक्शन करते हैं और आज के इस वीडियो के जरिए हम बात करेंगे आपके पास तीन मेजर पॉइंट के बारे में जिसके अंदर फर्स्ट है कलेशन दूसरा है आपका पूलिंग और थर्ड है आपका फ्लेटन इन तीनों टॉपिक के बारे में बात करने वाले हैं जो कि एक आपके पास कन्वेंशनल न्यूरल नेटवर्क जिसे हम सीएनएन नेटवर्क बोलते हैं उसके अंदर बहुत ही ज्यादा इंपॉर्टेंट चीज होती है तो चलिए अब इसे वन बाय वन समझते हैं ये कैसे काम करता है और किस तरह से काम करता है देखिए यदि आपको पाइथन मशीन लर्निंग डेटा साइंस एंड डेटा एनालिस जसी फील्ड में अपने आपको को ग्रो करना है तो इसके लिए लए कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं जब भी आप कभी भी अपने इमेजेस के ऊपर काम कर रहे हैं और इमेजेस के अंदर यदि आपको क्या करना है क्लासिफिकेशन के ऊपर काम करना है यस इमेज का क्या करना है क्लासिफिकेशन के ऊपर काम करना है आपको यहां पर तो आप क्या इस्तेमाल करते हैं सीएनए इस्तेमाल करते हैं अब ये सीएनए का जो आर्किटेक्चर होता है यहां पर उसके अंदर क्या होता है कि जो भी आपकी इमेजेस हैं ये इमेज आप किसे देते हैं यहां पर आप इसे देते हैं सबसे पहले कलेशन लेयर को यस किसे देते है कलेशन लेयर को देते हैं कलेशन लेयर जो है यहां पर ये आपको किसको दी जाती है यहां पर इस लेयर को हम पूलिंग के अंदर डाल देते हैं राइट अब ये प्रोसीजर आप दो-तीन बार अप्लाई कर सकते हैं और उसके बाद जो आपका डाटा होता है वो पहले क्या होता है आपका फ्लेटन होता है और फ्लेटन के बाद में आपका जो भी डाटा होता है वो ए नेटवर्क के अंदर चला जाता है अब ये जो इमेज है इस इमेज को कलेशन लेयर में देते हैं तो कलेशन लेयर के थ्रू क्या काम होता है और कैसे काम होता है ये समझेंगे फिर ये जो कलेशन का डाटा है ये पूलिंग के अंदर जाता है तो इसमें क्या प्रॉब्लम होती है और कैसे काम होता है ये समझने वाले हैं एंड देन लास्ट ऑफ लीस्ट फ्लटर कैसे काम करता है इसको हम समझने वांगे और हमारे पास यहां पे आपके पास फुली कन्वेंशन लेयर ये कैसी होती है यहां पर इसे हम यहां पर देखेंगे तो चलिए इसको वन बाय वन जरा समझते हैं यहां पर तो देखिए सबसे पहले मैं यहां पे बात करने वाला हूं और ये बात है आपके पास यहां पर कनोलेशन लेयर के बारे में कि कलेशन लेयर क्या होता है देखिए कन्वेंशनल लेयर क्या है आपके पास एक मैथमेटिकल फार्मूला है यहां पर यस और ये मैथमेटिकल फॉर्मूला क्या ता है गाइज यहां पर ये मैथमेटिकल फार्मूला कुछ इस तरह से दिखता है यहां पर ये आपके पास मल्टीप्लिकेशन नहीं होता है बेसिकली आपके पास क्या है इंटिग है आपके पास दो डाटा के बीच में अब बेसिकली इसका काम क्या है इसका काम होता है कि आपके पास जो भी आपकी इमेजेस हैं उस इमेजेस के अंदर के फीचर्स को निकालना अब इमेज के अंदर के फीचर्स को निकालने का मतलब क्या है यहां पर जरा समझे मान लीजिए कि मेरे पास एक इमेज है राइट मेरे पास क्या है एक इमेज है और ये इमेज कुछ इस तरह से दिखती है यहां पर मतलब एक आपके पास मैंने पर्सन की इमेज बना रखी है अब आप बोलेंगे सर पर्सन ऐसा कैसे दिखता है तो आप मिनी मिशिया खेलते हैं या कोई भी गेम खेलते हैं तो उनके अंदर आपके पास कुछ पर्सन ऐसे ही बने हुए होते हैं राइट तो मान लीजिए ये क्या है एक पर्सन की इमेजेस है जो कि आप यहां पर देख रहे हैं यहां पर अब इस इमेजेस से मुझे क्या करना है इसके इंपॉर्टेंट फीचर्स निकालना है अब ये कलरफुल इमेजेस हो सकती है यहां पर और ब्लैक एंड वाइट इमेजेस भी हो सकती है लेकिन इसके अंदर के फीचर निकालने है अब फीचर निकालने का मतलब क्या होता है गाइज यहां पर फीचर निकालने का मतलब होता है इसके अंदर के जितने भी एजेस होते हैं यस कितने क्या हो है यहां पर जितने भी आपके इसके एज है यहां पर उन एजेस को डिटेक्ट करना है हमें यहां पर अब कलेशन लेयर के जरिए हम क्या करते हैं कि इस इमेजेस के अंदर आपके पास बहुत सारे पॉइंट्स हो सकते हैं मतलब ये कलर इमेज है तो यहां पे भी आपके डिफरेंट डिफरेंट कलर्स हो सकते हैं यहां पर इसके अंदर डिफरेंट डिफरेंट कलर्स हो सकते हैं लेकिन इस इमेजेस के अंदर के जो एजेस है यहां पर वो एजेस कौन-कौन से होंगे गाइज यहां पर वो एजेस आपके पास यही होंगे जैसे ये आपके पास हो गया ये एक एज हो गया ये एक आपका एज हो गया ये एक एज हो गया तो ये आपके पास क्या हैं इस इमेजेस के एजेस कहलाते हैं राइट अब हमें क्या करना है कलेशन लेयर के थ्रू क्या होता है कि हमारी जो इंपॉर्टेंट इमेज है यस हम जो भी इंपॉर्टेंट इमेज ले रहे हैं यहां पर उस इंपॉर्टेंट इमेज के अंदर बैकग्राउंड के अंदर कुछ भी हो सकता है राइट बैकग्राउंड के अंदर आपके पास यहां पर स्नरी हो सकती है आपके पास बादल हो सकते हैं जमीन हो सकती है कुछ भी हो सकता है एनीथिंग एल्स कुछ भी हो सकता है लेकिन हमारा मेन टारगेट क्या है यहां पर ये पर्सन है और ये पर्सन की जो इमेजेस है यहां पर इसको हमें एक्सट्रैक्ट करना है मतलब इसके जो एजेस है इमेजेस के जो एजेस होते हैं वही हमारे इंपॉर्टेंट वीच होते हैं तो गाइस इसमें से जो एजेस है ये एजेस करना डिटेक्ट करना ही हमारा इंपॉर्टेंट फीचर होता है तो बेसिकली इसके लिए हम क्या करते हैं कन्न लेयर का इस्तेमाल करते हैं कन्वर्शन लेयर क्या करता है यहां पर कि इस इमेजेस के एजेस को गेट करता है अब ये इमेजेस के एजेस को कैसे गेट करता है इसको जरा समझते हैं मान लीजिए अभी जो मैंने आपको इमेज बताई थी वो इमेज कुछ इस तरह से है मतलब आपके पास ये इनपुट डाटा इस तरह से है अब ये इनपुट डाटा के तौर पे क्या है हमारी इमेजेस है यहां पर यस ये हमारी क्या है यहां पर इमेज है यहां पर राइट ये हमारी इमेज है अब इस इमेज के साथ मैं क्या कर रहा हूं यहां पर कन्वेंशन लेयर के लिए मतलब कन्वेंशन लेन बनाने के लिए मुझे क्या करना पड़ता है गाइज यहां पर एक कर्नल को ऐड करना पड़ता है मतलब एक कर्नल लगाना पड़ता है अब यह कर्नल किसी भी तरह का हो सकता है दैट इज द कॉल्ड ऑफ़ मैट्रिक्स इस न्यूमेरिकल नंबर आपके पास मैट्रिक्स होती है जो कि क्या करती है इस इमेज के साथ कन्वेट होके हमें क्या करती है हमें हमारे फीचर देती है राइट क्या देती है यहां पर हमें हमारे फीचर्स देती है अब ये फीचर्स हमें कैसे देती है यूजिंग दिस कर्नल अब यह कर्नल आपके पास एक से ज्यादा भी हो सकते हैं डिपेंड ऑन आपके इमेज की क्वालिटी के ऊपर आपकी इमेज की क्वालिटी कैसी है उस के हिसाब से आप क्या कर सकते हैं नंबर ऑफ कर्नल्स दे सकते हैं जिसकी हेल्प से आपके पास जो अच्छे फीचर्स हैं यहां पर अच्छी तरीके से एजेस जो है यहां पर वो कैट हो सके अब मेन पॉइंट आता है कनोलेशन होता कैसे है यहां पर तो देखिए गाइ ये जो आपकी मैट्रिक्स है यस ये जो आपकी मैट्रिक्स है जैसे आप कर्नल मैट्रिक्स आप बोल रहे हैं यहां पर तो इस कर्नल मैट्रिक्स का यूज करके आप यहां पर इस कर्नल मैट्रिक्स के साथ यहां पर क्या कर सकते हैं कलेट करा सकते हैं जब आप इसके साथ कलेट कराएंगे तो कनट कराने के बाद में आपके पास क्या होगा गाइज यहां पर ये रिजल्ट आएगा आप जैसे मैंने यहां पे एक रिजल्ट का एग्जांपल दे रखा है है जैसे देखिए क्या होता है गाइज यहां पर ये वन जो है इस वन के साथ क्या हो रहा है मल्टीप्लाई होता है आंसर आपका वन आ रहा है यहां पर रो जीरो के साथ मल्टीप्लाई होके आपका आंसर रो आ रहा है यहां पर इस रो के साथ वन मल्टीप्लाई होके आंसर क्या आ रहा है रो आ रहा है यहां पर फिर वन आपके रो के साथ मल्टीप्लाई होके आपके पास क्या आ रहा है रो आ रहा है वन आपके पास यहां पे वन से मल्टीप्लाई होके वन आ रहा है फिर रो से मल्टीप्लाई होके आपके पास क्या आ रहा है रो आ रहा है यहां पर वन वन से मल्टीप्लाई होके आपके पास क्या आ रहा है वन आ रहा है ऐसे करके आपके पास क्या बन रहा है यहां पे आपके कन्वर्शन हो रही है ऐसे करके क्या हो रहा है गाइज यहां पे कन्न हो रही है और उसके बाद में आपके जितना भी रिजल्ट आ रहा है वो उसका ऐड होके आपके पास यहां पे पहुंचा दिया जा रहा है अभी तो ये आपके पास क्या हुआ एक बार कलेट हुआ देखिए कलेशन कैसे होता है सबसे पहले इसका इस वाली इमेजेस के साथ कलेट होगा फिर वापस इसका इस वाली इमेज के साथ कलेट होगा इसका इस वाली इमेजेस के साथ कलेट होगा ऐसे करके आपका जो कनोलेशन प्रोसीजर है वो आपके पास चलता रहता है फिर एज इट इज नीचे भी आएगा एज इट इज नीचे आएगा ऐसे करके आपकी जो भी इमेजेस है उस इमेज से आपके फीचर्स को गेट कर लि जाएगा मतलब आपके जो भी एजेस है उन्हें गेट कर लि जाएगा अबी कैसे हो होता है यहां पर तो इसको थोड़ा सा एक लाइव डेमोंस्ट्रेट देखते हैं यहां पर यस मेरे पास एक लाइव डेमोंस्ट्रेट है राइट एक वेबसाइट है जिसके अंदर मैं आपको ये दिखाना चाहूंगा कि ये कैसे कन्वर्ट होता है यहां पर राइट जिसके थ्रू आपको एक बेटर आईडिया लग जाएगा कि कन्वर्शन कैसे वर्क करता है ओके आ जाइए यहां पर ये एक मेरे पास एक वेबसाइट है दैट इज अ डीप लिजर्ड वेबसाइट जहां पे आप कनोलेशन को बहुत अच्छी तरीके से समझ सकते हैं कि कनोलेशन कैसे हो रहा है अब देखिए कनोलेशन करने से पहले आपके पास यहां पे देखिए कनोलेशन का ऑपरेशंस आपके पास बताया गया है यहां पर ठीक है अब कनोलेशन ऑपरेशन के लिए हम क्या कर रहे हैं सबसे पहले हमारा नंबर चूज कर रहे कि हम हमें कौन से नंबर पे काम करना है तो मैं कह रहा हूं यहां पर मुझे टू नंबर चाहिए अब देखिए टू को हैंड रिटन के अंदर देखा जाए तो ऐसा लगता है और दैट्ची नंबर यहां पर राइट उसके बाद में देखिए ये हमारे पास विंडो डाटा है ये विंडो डटा का मतलब क्या है ये जो हमारा पहला डाटा है ये हमें दे रखा है यहां पर जिसके अंदर 00 दे रखा है यहां पर और एक हमारे पास क्या बना रखी है एक फिल्टर मैट्रिक्स बना रखी है राइट ये फिल्टर मैट्रिक्स आप अपने अकॉर्डिंग यहां पर चेंज कर सकते हैं वैसे तो ये फिल्टर मैट्रिक्स जो आप देख रहे हैं यहां पर दैट कॉल ऑफ कर्नल जैसे हमने यहां पे कर्नल बोला था यहां पर राइट ये जो कर्नल मैट्रिक्स देख रहे हैं यहां पर ये कर्नल अपने आप चेंज हो जाती है राइट अकॉर्डिंग टू योर डटा आपके पा स्कल अपने आप चेंज होता है जो कि आपके इमेजेस के फीचर को कैट कर लेता है राइट अब देखिए इसका आउटपुट क्या आ रहा है यहां पर ज़ीरो आ रहा है कैसे आ रहा है यहां पर देखिए 0 * -1 होगा तो -1 अगल आएगा ये भी -1 हो जाएगा ये भी -1 हो जाएगा यहां पे + 1 होगा यहां + 1 होगा यहां + 1 होगा देन उसके बाद 0 * 0 0 करके आउटपुट विल बी ज़ीरो यस आउटपुट क्या आ रहा है यहां पर ज़ीरो आ रहा है इस तरह से आप क्या सो रहा है अब देखिए मैं इसे कलेट करने जा रहा हूं और कनोलेशन का रिजल्ट आप देखेंगे तो इसके जो एजेस हैं इसके जो मेन एजेस हैं वही एजेस हमें यहां पे गेट होंगे बाकी के जो बैकग्राउंड है वो हमें यहां पर गेट नहीं होने वाला है अब देखिए कैसे होने वाला है तो मैं इसे थोड़ा सा प्ले कर देता हूं यहां पर तो देखिए आपके इमेज जो है यहां पर उसमें से देखिए एजेस गेट होना स्टार्ट हो गया है अब देखिए यहां पर आपका जो एजेस है वो एकदम लाइट है तो यहां पे भी आपको एकदम लाइट एजेस मिला यहां पर अब देखिए बीच वाला जो एरिया है वो थोड़ा सा डार्क्स एरिया मतलब आपके पास यहां पे आपकी जो इमेज है वो काफी गहरी आपके पास है तो देखिए यहां पे भी वो आपका जो इमेजेस का एरिया जो है आपके पास वो काफी गहरा आया है यहां पर उसके बाद नीचे जाके देखेंगे तो आपके पास ये जो इमेजेस हैं इसके अंदर के जो डाटा है यहां पे वो आपके काफी कम आए है अब जैसे देखिए यहां पे जो आप देखेंगे जस्ट यहां पे पे देखेंगे तो आपकी इमेज देखिए यहां पे इमेज आपके पास काफी गहरी है यहां पर मतलब जो नंबर्स है वो काफी गहरा है तो देखिए आपके जो इमेजेस का कलर भी है वो काफी गहरा यहां पर नजर आ रहा है तो बेसिकली दैट इज अ कलेशन प्रोसेस जो कि आपके पास इमेज बाय इमेज होता है यहां पर राइट मैं फिर से आपके पास प्ले करके दिखा रहा हूं देखिए ये आपके इस तरह से चल रहा है आपका कलेशन लेयर राइट जैसे-जैसे ये आगे बढ़ रहा है कलेशन लेयर चलता रहता है चलता रहता है चलता रहता है और इस तरह से आपके पास ये पूरा काम होता है यहां पर राइट तो दैट इज अ कलेशन यहां पर जिससे कलेशन के थ्रू आपके जो इमेजेस हैं उसमें से हमने क्या निकाले इंपॉर्टेंट फीचर्स निकाले अब इंपॉर्टेंट फीचर निका ने के बाद में ये क्या कहलाता है गाइज यहां पर दैट इज अ कॉल ऑफ फीचर मैप ये क्या लाता है गाइज यहां पर दैट इज कॉल ऑफ आपके पास फीचर मैप आपके पास कहलाता है यहां पर या फिर आप इसे कनोलेशन फीचर भी बोल सकते हैं राइट अब कनोलेशन फीचर आने के बाद में अब आपके पास जो आपका नेक्स्ट लेयर ले जा है दैट इज कॉल ऑफ पलिंग लेयर अब यहां पे पॉइंट आता है कि व्हाई पुलिंग लेयर क्या जरूरत है पूलिंग लेयर की तो गाइ इसके पीछे दो मेजर इंपॉर्टेंट रीजन है पहला इंपॉर्टेंट रीजन है यहां पर कि आपके पास जो आपका डाटा है जो आपके पास जो आपकी इमेज यहां पर ले रहे हैं यहां पर कंसीडरेशन कर रहे हैं यहां पर आप जो इमेज कंसीडरेशन कर रहे हैं यहां पर ये जो इमेजेस है यहां पर इस इमेजेस की जो साइज है यहां पर वो काफी बल्की हो जाएगी राइट इमेजेस की साइज काफी बल्की हो जाएगी और इस बल्की साइज की जो इमेजेस हैं इसे आप डायरेक्टली यूज नहीं कर सकते किस जगह पे यूज नहीं कर सकते आप डायरेक्टली नेटवर्क के अंदर यूज नहीं कर सकते रीजन बहुत सिंपल सा है यहां पर क्योंकि यदि आप इस बल्की इमेजेस को यूज करेंगे तो आपके लिए एक हैवी सिस्टम की जरूरत पड़ेगी अब इतना ज्यादा हैवी सिस्टम आप लोगों के पास कंबल नहीं होता यहां पर तो फिर इसके लिए हमें क्या करना पड़ता है पलिंग लेयर को इस्तेमाल करना पड़ता है ये पलिंग लेयर क्या कर करता है कि आपकी इमेजेस की साइज के अंदर से जो आपके इंपॉर्टेंट फीचर होता है यहां पर ये उसी को गेट करता है बाकी सबको क्या करता है रिड्यूस कर सकता है इसके साथ-साथ आपकी इमेजेस के अंदर एनहांस करने का काम करता है एनहांस करने का मतलब क्या है देखिए कनोलेशन लेयर जब आप यहां पे इस्तेमाल करते हैं तो काफी ऐसी चीजें होती है जो आपके पास यहां पर जो काफी एजेस होती है वो आपके पास नहीं आ पाती है राइट काफी जगह आपके पास क्या होती है काफी एजेस आपके पास नहीं गेट हो पाती है तो ये आपकी इमेजेस के अंदर क्या करता है उसे एनहांस करता है एनहांस करने का मतलब क्या है यहां पर उसके अंदर जो एजेस है उसे और ज्यादा यहां पर डार्कनेस करने की कोशिश करता है ताकि जो एजेस आपके गायब हो चुके हैं वो भी आपके पास यहां पर गैट हो सके तो पहली मेजर प्रॉब्लम है कि आपकी इमेजेस की साइज जो है वो काफी बल्की हो जाती है अब इतनी बल्की साइज को इमेज को आप डायरेक्टली कंसीडरेशन नहीं कर सकते जस्ट एग्जांपल के तौर पे मैं बात करूं कि मेरे पास एक 250 * 250 की इमेजेस हैं राइट ये इतने फीचर्स तो आपके पास हो गई है इतने फीचर मतलब इतने पिक्सेल की तो आपकी इमेजेस है ही है इतने आपके पास यहां पर फीचर बने मतलब x एक्सेस के अंदर इतने फीचर आने वाला है इसके साथ-साथ आपने कलेशन लगाया यहां पर और प्लस आपके पास कलर इमेजेस है यहां पर तो जैसे मान लीजिए आपने 10 कलेशन लगाया और प्लस आपकी कलर इमेजेस है तो इन सबको मल्टीप्लाई कर दीजिए इतने आपके पास क्या बनेंगे आपके पॉइंट्स बनने वाले हैं मतलब इतने एक्स एक्सिस के कॉलम बनने वाले हैं ये एक्स एक्सिस के कॉलम बहुत ही ज्यादा होते हैं इसके ऊपर आप डायरेक्टली वर्क नहीं कर पाएंगे तो पॉइंट इज दैट यदि आप यदि आप यहां पर बिना पुलिंग लेयर के आगे बढ़ते हैं यहां पर तो ये आपके पास क्या होता है आपकी मेमोरी साइज को बहुत ज्यादा कंज्यूम करता है तो इसके लिए हम क्या करते हैं पूल करते हैं अब पूलिंग के अंदर यहां पर बहुत सारी तरह की पूलिंग होती है यस कौन-कौन सी होती है यहां पर पूलिंग के अंदर आपके पास यहां पर पूलिंग होती है मैक्स पूलिंग और दूसरी होती है गाइज यहां पर एवरेज पुलिंग यस दो तरह के आपकी पुलिंग है यहां पर पहली मैक्स पुलिंग है दूसरी एवरेज पुलिंग होती है इन दोनों पुलिंग में से कोई भी आप एक पुलिंग ले सकते हैं अब ये पुलिंग क्या काम करती है कूलिंग कैसे काम करती है तो देखिए जो सबसे पहले आपका फीचर मैप आ रखा है फीचर मैप कहां से आया था ये कन्वेंशन लेयर से आपका फीचर मैप आया इस कन्वेंशनल लेर के जो फीचर मैप है इसके साथ क्या करती है यहां पर अब ये पूलिंग आप अपने हिसाब से ले सकते हैं जैसे कि मैं यहां पे जो पुलिंग ले ले रहा हूं यहां पर ये कितने की ले रहा हूं यहां पर टू क्रॉस टू की पुलिंग ले ले रहा हूं कितने क्रॉस की टू क्रॉस टू की पलिंग ले ले रहा हूं राइट अब टू कॉस टू की पुलिंग लेयर का मतलब क्या है कि इनमें से ये जो डटा मैंने लिया है यहां पर इसमें से जो सबसे मैक्सिमम आपका डाटा है यहां पर वो मैंने कंसीडर कर लिया मैक्सिमम यहां पे क्या है वन है वन को मैंने यहां पर क्या किया है कंसीडरेशन कर लिया है उसके बाद फिर इसमें से मैंने मैक्स कंसीडरेशन कर लिया है तो ऐसे करके मेरे पास क्या बन गया एक पूलिंग फीचर मैप बनके आ चुका है चलिए इसका भी एक लाइव डेमोंस्ट्रेट देखते हैं ताकि आप लोगों को थोड़ा और आईडिया हो सके कि किस तरह से काम करता है तो देखिए मेरे पास इसकी भी वेबसाइट का है यहां पर तो देखिए मैं पलिंग का डेमो आपको दिखाना जा रहा हूं कि पूलिंग कैसे काम करता है यहां पर तो जैसे मेरा ये डाटा है यहां पर अब पलिंग मुझे करना है यहां पर तो मैं पुलिंग करने जा रहा हूं अब आप अपने हिसाब से नंबर ले सकते हैं जैसे कि मैं टू नंबर्स का ही वापस क्या करूंगा पूल करूंगा और उसके बाद देखिए मैं प्ले कर रहा हूं तो देखिए पूलिंग के बाद में मेरा जो नंबर है वो कुछ इस तरीके से दिख रहा है राइट जैसे आप देख पा रहे हैं यहां पर तो देखिए जो इंपॉर्टेंट फीचर जैसे अब देखिए यहां से आपके पास मैक्स पूलिंग लगाया गया है तो जो सबसे मैक्सिमम डाटा है वो हमें मिल गया है यहां पर तो आप क्या देखिए आपकी इमेज देखिए इमेज के पिक्सेल कितने बड़े हैं कितनी बड़ी इमेज है यहां पर और पलिंग करने के बाद देख लीजिए आपके पास जो आपकी इमेज जो निकल के आई है वो काफी छोटी हो चुकी है राइट आपकी इमेजेस के जो पिक्सल्स हैं यहां पर वो काफी छोटे हो चुके हैं अब आप इसे यहां पर काम कर सकते हैं लेकिन एक चीज का ध्यान रखिएगा पुलिंग करने से पहले और पुलिंग करने के बाद में आपके जो इमेज है उसके पिक्सल्स आपके छोटे हुए हैं मतलब आपके पास यहां पर पिक्सल मतलब इमेज की साइज छोटी हुई है रिड्यूस हुई है यहां पर लेकिन अंदर के जो फीचर्स हैं यहां पर वो नहीं खत्म हुए हैं देखिए अभी भी फीचर वही है अभी भी आप इस इमेजेस को देखेंगे ना यहां पर तब भी आपको टू दिखेगा और इस इमेजेस को भी देखेंगे तब भी आपके पास टू ही दिखने वाला है आपके पास इमेजेस के अंदर कोई चेंजेज नहीं आया है हालांकि इमेजेस छोटी हो गई है यहां पर ताकि आप इसके ऊपर क्या कर सके डीप लर्निंग का काम आसानी से कर सके लेकिन पॉइंट यह है यहां पर कि इसके अंदर जो काम है यहां पर वो क्या हो रहा है आपके इमेजेस को रिड्यूस कर रहा है अब ये आप प्रोसीजर जो है काफी बार अपना सकते हैं पलिंग आपके पास वापस यहां पर कलेशन पोलिंग कलेशन ताकि जो इमेजेस है उस इमेजेस को आप क्या कर सके रिड्यूस कर सके ताकि आपका जो सिस्टम है वो कैपेबल हो सके किस चीज के लिए यहां पर आपके पास आपके वर्किंग के लिए राइट अब पुलिंग होने के बाद में नेक्स्ट जो लास्ट वर्किंग होता है यहां पर दैट इज कॉल ऑफ फ्लेटन फ्लेटन क्या करता है गाइज यहां पर कि जो भी आपका पल मैप का जो डटा आ रखा है वो डटा कुछ इस तरह से नजर आएगा अब ये डाटा आपके पास कैसा है यहां पर देस अ टू डायमेंशन स्ट्रक्चर ऑफ डाटा लेकिन जब भी हम हमारे डाटा के अंदर इनपुट देते हैं तो हमारे पास क्या होता है एक x एक्सेस की रो होती है और उसके करेस्पॉन्डिंग्ली अभी तक आपने n के अंदर देखा था तो n n के अंदर क्या होता है गाइस यहां पर x1 एक फीचर होता है x2 एक फीचर होता है x3 एक फीचर होता है x4 एक फीचर होता है इसके करेस्पॉन्डिंग्ली कन्वर्जन करेंगे विद द हेल्प ऑफ फ्लेटन और विद द हेल्प ऑफ फलटन कैसे कन्वर्जन होता है जरा समझ लेते हैं यहां पर तो देखिए आपके पास देखिए x1 आ गया यहां पर जस्ट x2 आपके पास आ गया x3 आपके पास आ गया x4 आपके पास आ गया x5 आपके पास आ गया x6 आपके पास हो गया x7 आपके पास हो गया x8 आपके पास हो गया और x9 आपके पास हो गया एंड इसके करेस्पॉन्डिंग्ली स्ट्रक्चर डेटा सेट है ये टूडी स्ट्रक्चर डेटा सेट जो है आपके पास यहां पर इसको क्या करता है वन डायमेंशन स्ट्रक्चर डेटा सेट कन्वर्जन करता है कैसे गाइज यहां पर वन वन फिर आपका रो फिर फोर फिर टू फिर वन फिर रो फिर टू एंड देन फिर लास्ट में वन इस तरह से आपके पास क्या होगा आपका जो डाटा स्ट्रक्चर है यहां पर जो 2d डाटा स्ट्रक्चर था उसको हमने वडी डाटा स्ट्रक्चर के अंदर कन्वर्जन कर लिया है एंड देन आउटपुट की बात की जाए यहां पर तो आउटपुट आपका कुछ भी हो सकता है जैसे लाइक कैट डॉग काउ जो भी आपको देना है वो आपके पास यहां पर हो सकता है तो गाइस इस तरह से आप क्या करते हैं फलटन का इस्तेमाल करते हैं अब आपकी जो इमेज थी हमने उस इमेजेस इस को कैसे कन्वर्ट कर दिया यहां पर टेबुलर डाटा के अंदर कन्वर्ट कर दिया अब ये जो टेबुलर डाटा आपको दिख रहा है यहां पर यस इट्स अ टेबुलर डाटा इस टेबुलर डेटा को हम किसमें पास कर देते हैं फुली कन्वेंशन लेयर के अंदर पास कर देते हैं फुली कन्वेंशन लेयर को यदि आपको समझना है तो दैट इज अ काइंड ऑफ ए ए यस आर्टिफिशियल न्यूरल नेटवर्क जो कि हमने इस्तेमाल किया था जिसके अंदर सबसे पहले क्या आता है गाइज हमारे इनपुट फीचर आते हैं यहां पर उसके बाद हमारे हिडन लेयर आपके पास आती है यस उसके बाद क्या आती है गाइज यहां पर आपकी हिडन लेयर आती है उसके बाद फिर से आपके क्या आ है हिडन लेयर आती है एंड देन आपके पास हिडन लेयर आती है अब अकॉर्डिंग टू आउटपुट यदि आउटपुट आपका यहां पर बाइनरी है तो सिंगल आउटपुट होगा यदि आपका जो आउटपुट है वो बाइनरी नहीं है तो आपके पास मल्टीपल आउटपुट्स निकल के आएंगे तो ये आपका क्या होगा आउटपुट फीचर आपके पास हो जाएगा इसमें आप अपना इन एंड का नेटवर्क्स यहां पर डेफिनेटली तैयार कर सकते हैं तो गाइ यहां पे हमने क्या देखा कि हमारे पास जब भी हम इमेजेस के थ्रू यदि प्रोडक्शन करने जा रहे हैं क्लासिफिकेशन करने जा रहे हैं तो उसके अंदर हमें इस नेटवर्क की जरूरत पड़ती है जिसके अंदर सबसे पहला हमारा कलेशन होता है जहां से हम क्या करते हैं इंपॉर्टेंट जो एजेस हैं वो गेट करते हैं उसके बाद हम हमारे डाटा को रिड्यूस करने के लिए पूल का इस्तेमाल करते हैं एंड देन लास्ट ऑफ लीस्ट हम क्या करते हैं फ्लेटन का इस्तेमाल करते हैं अब ये जो फ्लेटन से थ्रू डाटा जो आ रखा है यहां पर इसको हम क्या करते हैं फुली कनेशन लेयर हम जो आर्टिफिशियल न्यूरल नेटवर्क है उसे पास करवा देते हैं ताकि हम हमारे जो डाटा है उससे हमारा प्रेडिक्शन मॉडल बना सक तो ये पूरा जो प्रोसेस होता है गाइज यहां पर ये होता है सीएनए के नेटवर्क का अब ये जो फुली कन्वे लेर जो एन का इस्तेमाल कर रहे हैं इसके अंदर वो सारे कांसेप्ट सब लगे गे जो हमने एए के अंदर यूज किए थे कौन-कौन से कांसेप्ट यूज़ किए थे गाइ यहां पर तो वहां पे हमने यूज़ किया था बैकवर्ड प्रोपोर्शन फॉरवर्ड प्रोपेगेशन इसके साथ-साथ हमने यूज़ किया था इसके मॉडल इंप्रूवमेंट के कांसेप्ट तो वो सारी की सारी जो चीजें हैं यहां पर वो यूज होती है और आज के इस वीडियो के जरिए हम बात करेंगे कन्वर्शन न्यूरल नेटवक के बारे में जिसे आप सीएनएन नेटवर्क से भी जानते हैं अब ये सीएनएन नेटवर्क का प्रैक्टिकल इंप्लीमेंटेशन कैसे होने वाला है जरा उसे यहां पर देखते हैं यदि आपको न मशीन लर्निंग डेटा साइंस एंड डेटा एनालिस ज फील्ड में अपने आपको को ग्रो करना है तो इसके लिए डब्लू एस कपटेक के ऑनलाइन एंड ऑफलाइन बने बैच के अंदर जॉइन करके आप अपनी स्किल को इंप्रूव कर सकते हैं इसके लिए दिए गए कांटेक्ट नंबर पे कॉल करके आप हमारी टू डेमो फ्री क्लासेस ले सकते हैं तो मैं ले चलता हूं पहले आपको डेटा सेट दिखा देता हूं तो हम चलते हैं डेटा सेट के अंदर तो देखिए मैं यहां पर अपना डेटा सेट खोलता हूं जो कि सीएनए के नाम से मेरे पास है अब इस डेटा सेट के अंदर देखिए आपके पास कुछ टेस्टिंग डाटा है यहां पर टेस्टिंग डाटा के अंदर मैंने कैट की कुछ बहुत सारी इमेजेस ले रखी हैं कुछ नहीं बहुत सारी इमेजेस ऑलमोस्ट मेरे पास क्या है 1000 इमेजेस है ओके इसी तरह से मैंने 1000 इमेजेस यहां पर किसकी भी ले रखी है यहां पर डॉग की भी 1000 इमेजेस ले रखी है अब ये तो हो गया हमारा टेस्टिंग डाटा इसी तरह से हमारे पास क्या है ट्रेनिंग डाटा भी है अब ट्रेनिंग डाटा को जब आप देखेंगे तो यहां पर देखिए आपके पास क्या है कैट का डाटा है यहां पर जिसके अंदर कैट की बहुत सारी इमेजेस है अराउंड 4000 आपके पास इमेजेस है इसी तरह से यदि मैं बात करूं आपके पास डॉक की इमेजेस के ऊपर तो देखिए आप डॉक की इमेजेस को देखेंगे तो इसके अंदर भी अराउंड 4000 डॉक की इमेजेस है आपके पास है राइट अब हमें क्या करना है इन इमेजेस को लेके प्रिडिक्शन करना है यहां पर कि यदि मैं ये इमेज दूं तो यह इमेज डॉक की है या कैट की है यह हमें पहचान सके राइट तो हमें एक प्रोडक्शन मॉडल बनाना है यहां पर बेसिकली इन इमेजेस के ऊपर तो पहला चीज क्या होती है कि यदि मैं इस इमेजेस के ऊपर काम कर रहा हूं तो इस इमेजेस को मुझे टेक्स्ट के अंदर कन्वर्ट करना होता है और इस टेक्स्ट के अंदर कन्वर्ट करने के लिए टेक्स्ट का मतलब यहां पर है बेसिकली टेबुलर फॉर्मेट डेटा के अंदर कन्वर्ट करने के लिए मुझे यहां पर सीएनए नेटवर्क की जरूरत पड़ती है चलिए अब सीएनए नेटवर्क यहां पे यूज करते हैं सीएनए नेटवर्क कैसे काम करेगा तो इसके लिए मैं ले चलता हूं आपको पटर नोटबुक के ऊपर और यहां पर मैं अपना कोड लिखने वाला हूं कि यहां पे किस तरह से रहने वाला है तो सबसे पहले हम हमारे डेटा सेट को लोड करने से पहले हम यहां पे क्या करेंगे हम एक अपना सीएनएन नेटवर्क तैयार कर लेंगे एंड देन सीएनएन नेटवर्क तैयार करने के बाद में हम क्या करने वाले हैं यहां पर अपना डाटा लोड करेंगे और इसके अंदर डाटा ट्रांसफर करेंगे राइट तो ये हमारा टारगेट रहने वाला है तो इसके लिए सबसे पहले जो रिक्वायर्ड लाइब्रेरी है उसे हम यहां पे इंपोर्ट कर लेते हैं जस्ट लाइक इंपोर्ट क्या करना है यहां पर सबसे पहले मुझे यहां पर ट्रांसफर फ्लो को इंपोर्ट करना है जिसके थ्रू हम हमारी इमेजेस के ऊपर काम कर पाएंगे और हम हमारा आर्टिफिशियल न्यूरल नेटवर्क एंड सीएनएल नेटवर्क बना पाएंगे तो सबसे फर्स्ट चीज है दैट इज अ टेंसर फ्लो राइट टेंसर फ्लो लोड करने के बाद में मुझे यहां पे क्या करना है केरा को यूज़ करना है और केरा के जरिए हमें कुछ-कुछ लेयर्स को ऐड करना है अब टेंसर फ्लो लोड होने में काफी टाइम लगता है क्योंकि इट्स अ वेरी ह्यूज आपके पास अमाउंट ऑफ ल मॉड्यूल यस ये एक बहुत बड़ा मॉड्यूल है तो इसको लोड होने के लिए थोड़ा टाइम लगेगा तो इसके लिए थोड़ा वेट करते हैं ओके चलिए यहां पर सबसे पहले इंपोर्ट करते हैं और इंपोर्ट किसे करना है गाइज यहां पर हम इंपोर्ट करेंगे सबसे पहले टेंसर फ्लो को चलिए ट्रेंसर फ्लो को लोड करते हैं और टेंस फलो को लोड होने में काफी टाइम लगेगा रीजन क्यों क्योंकि ये एक बहुत बड़ा मॉड्यूल है जिसके जरिए हम यहां पर हमारा न्यूरॉन नेटवर्क को तैयार करेंगे तो इसके लिए थोड़ा टाइम लगेगा तो इसके लिए थोड़ा सा वेट करते हैं चलिए ये लोड हो चुका है इसके बाद में हम चलते हैं किसके अंदर केरा के अंदर चलते हैं केरा के अंदर जाने के बाद हम यहां पर इंपोर्ट करेंगे और क्या इंपोर्ट करना है गाइज यहां पर केरा के अंदर हमें लेयर को इंपोर्ट करना था राइट तो केरा के अंदर जाएंगे डॉट यहां पर लेयर्स को इंपोर्ट करेंगे इंपोर्ट करने वाले हैं लेयर्स के अंदर कौन-कौन सी लेयर्स इंपोर्ट करनी है यहां पर सबसे पहले जो लेयर्स है हमारी दैट इज अ डेंस लेयर यस डेंस लेयर को इंपोर्ट करना है डेंस लेयर के बाद में हमें यहां पर सीएनएन नेटवर्क बनाना है तो सीएनएन नेटवर्क बनाने के लिए हमें कलेशन लेयर की जरूरत पड़ेगी यहां पर तो इसके लिए मैं क्या कर रहा हूं कलेशन 2d का इस्तेमाल करूंगा राइट कन्वर्शन 2d के बाद में मुझे पूलिंग की जरूरत पड़ेगी तो इसके लिए मैक्स पूलिंग का इस्तेमाल करूंगा अब मैक्स पूलिंग के अंदर कौन सा इस्तेमाल करना है गाइज यहां पर मैक्स पलिंग आपको 2d का इस्तेमाल करना है राइट ये दो चीजों की जरूरत पड़ने वाली है उसके बाद में यहां पर चलते हैं फ्रॉम फिर से चलते हैं यहां पर केरा के अंदर केरा के अंदर जाने के बाद हमें यहां पर बनाना है हमारा मॉडल और मॉडल बनाने के लिए हम यहां पर इंपोर्ट कर े और इंपोर्ट कैसे करना है गाइज यहां पर सीक्वेंशियल मॉडल को इंपोर्ट करना है तो ये हमारे पास कुछ डिटेल्स की जरूरत पड़ेगी चलिए अब हमें क्या करना है गाइ यहां पर अब हमें यहां पे हमारा सबसे पहले सीएनए का नेटवर्क बनाना है सीएनए का नेटवर्क बनाने के लिए मैं सीएनए के नाम से एक वेरिएबल बना लेता हूं सीएनए के नाम से वेरिएबल बनाने के बाद यहां पे हमारी जो सीक्वेंशियल लेयर है यहां पर सबसे पहले उससे स्टार्ट कर लेता हूं सीक्वेंशियल लेयर के स्टार्ट करने के बाद में अब हमें हमारा सीएन का नेटवर्क्स तैयार करना है क्या करना है सीएनए का नेटवर्क तैयार करना है तो चलिए सीएन का नेटवर्क तैयार करते हैं तो उसके लिए क्या करेंगे ऐड करेंगे हम लेयर्स को अब इसके अंदर कौन-कौन सी लेयर्स ऐड करनी है तो सबसे पहले जब आपने सीएनएन पढ़ा होगा तो सीएनएन के अंदर सबसे पहला काम होता है गाइज यहां पर सबसे पहला आपके पास क्या होता है कलेशन होता है कलेशन के बाद में आपकी पूलिंग लगती है फिर से आपका कलेशन होता है फिर पूलिंग होती है फिर कलेशन होता है फिर पुलिंग होती है इस तरह से आपका जो वर्किंग है वो चलता रहता है मतलब फर्स्ट कलेशन देन पुलिंग देन कलेशन देन पुलिंग उसके बाद फ्लेटन फ्लेटन के बाद में आपका दूसरा काम चलता है अच्छा हमें फ्लेटन लेयर भी लेनी थी तो मैंने फ्लेटन यहां पे यूज़ नहीं किया है तो चलिए वो फ्लटर लेयर भी यहां पर ले लेते हैं चलिए अभी यहां पे चलते हैं कलेशन लेयर के पास सबसे पहले कलेशन 2d को इंपोर्ट करते हैं राइट तो मैंने कलेशन 2d यहां पे इंपोर्ट किया जैसे ही कलेशन प्रोड इंपोर्ट करते हैं तो कलेशन लेयर के अंदर सबसे पहले पूछा जाता है आप फिल्टर कितना स्टार्ट करने वाले हैं देखिए जब आपने कलेशन लेयर को समझा था तो मैंने आपको बताया था कलेशन लेयर क्या करती है एजेस डिटेक्ट करती है अब इन एजेस के अंदर हम एजेस के लिए कितने फिल्टर यूज़ करना चाहते हैं वो हमें यहां पर चूज करना पड़ेगा उसके साथ-साथ वो फिल्टर की साइज क्या रहने वाली है जैसे देखिए हमने जब प्रक थ्योरी पार्ट बढ़ा था तो हमने फिल्टर की साइज यहां पे ली थी 3 3 की आपके पास ली थी 3 क3 की ली थी यहां पर तो वही आपको यहां पर देखनी पड़ेगी इसके साथ-साथ यहां पर एक्टिवेशन फंक्शन क्या रहने वाला है यहां पर और जो हम इनपुट लेने वाले हैं हमारी इमेज यहां पर उस इनपुट इमेज की शेप क्या रहने वाली है साइज़ क्या रहने वाली है यह भी हमें यहां पर बताना पड़ेगा चलिए अब वन बाय वन इन सारी चीज़ों को बताते हैं सबसे पहले बात आती है फिल्टर यस कितने नंबर ऑफ फिल्टर चाहिए आपको यहां पे बताना पड़ेगा तो अराउंड मैं 32 फिल्टर्स यहां पे स्टार्टिंग में लूंगा यहां पर उसके बाद में मेरे पास क्या है यहां पर हमारे पास जो डाटा है मतलब आपके पास फिल्टर की साइज़ है वो मुझे देनी है अच्छा देखिए फिल्टर की जो जो साइज है यहां पर एज अ टपल फॉर्मेट में आएगी देखिए कैसे पता चला यहां पर एज अ टपल फॉर्मेट जाएगी तो देखिए आप फिल्टर के अंदर आएंगे कर्नल अ कर्नल साइज की बा बात करते हैं यहां पर कर्नल साइज इज अ 2d इंटी जर फॉर्मेट में जाती है आपके पास यहां पर और ये आपको एज अ टपल फॉर्मेट के अंदर देनी है राइट किस फॉर्मेट में देनी है आपको एज ए टपल फॉर्मेट के अंदर आपको यहां पे पास करवानी है राइट तो वही मैंने पास की है यहां पर कर्नल साइज और कर्नल साइज जो यहां पर वो मैंने ली है 33 की यहां पे ले ली राइट उसके बाद में गाइज यहां पे आते हैं इनपुट अंडरस्कोर जो यहां पर शेप है यहां पर वो लेने वाले हैं कि भाई हमा इनपुट साइज क्या रहने वाली है हमारे डाटा की वो हमें देनी पड़ेगी तो देखिए हमारी जो इमेजेस है यहां पर वो काफी बड़ी है राइट हमारी इमेजेस काफी बड़ी है इमेजेस बड़ी होने का मतलब क्या है गाइज यहां पर जैसे यदि मैं इस इमेजेस की बात करूं तो इस इमेजेस का पिक्सेल देख लेते हैं एक बार के लिए मैं क्या कर रहा हूं इसके ऊपर राइट क्लिक करके इसका एक बार पिक्सेल चेक करूं यहां पर राइट तो पिक्सल चेक करने के लिए हम इसकी प्रॉपर्टी में जाएंगे प्रॉपर्टी में जाने के बाद यदि आप यहां पे देखेंगे तो आपकी इसकी डिटेल्स मिल जाएगी डिटेल्स के अंदर आपकी इमेजेस जो है वो काफी बड़ी-बड़ी इमेजेस है हम चाहते हैं कि हमारी जो इमेजेस है वो छोटी आए और इसके साथ-साथ कलर इमेजेस के अंदर आए तो बेसिकली गाइज मैं यहां पे क्या करने वाला हूं कि मेरी जितनी भी इमेजेस होगी वो क्या होगी 64 64 पिक्सल्स की होगी और थ्री करना च में चलेगी यस थ्री कलर चैनल का मतलब है यहां पर आपके पास आरजीबी कलर चैनल के फॉर्मेट में रहनी चाहिए राइट ये हमने यहां पर लिखा अब उसके बाद में गाइस क्या है हमारा एक्टिवेशन फंक्शन एक्टिवेशन फंक्शन के तौर पे हम यहां पर भी रलो का इस्तेमाल करेंगे आर एलय रलो ले लेता हूं यहां पर तो ये हमारा पहला कलेशन लेयर हो गया उसके बाद में हम क्या करें गाइ यहां पर कूलिंग को राइट किसे ऐड करना है गाइ यहां पर मैक्स कूलिंग को तो मैं मैक्स कलिंग 2d को इस्तेमाल कर रहा हूं यहां पर इसके अंदर आपको सबसे पहले देना है आपकी पूल साइज पूल साइज आपके पास कितनी होनी चाहिए तो देखिए पूल साइज जितनी है हम उतनी ही पूल साइज देंगे इसके अंदर कोई छेड़छाड़ नहीं करने वाले है इसके अंदर कोई भी आपका एक्टिवेशन फंक्शन नहीं अप्लाई होगा राइट अब ये जो लेयर है यहां पर ये हमें दो बार यूज करनी है यस आप अपनी इच्छा अनुसार कितनी बार भी ले सकते हैं जैसे देखिए 32 उसके बाद में मैं यहां पे कर रहा हूं आपका 16 यस 32 के बाद में मैं 16 ले रहा हूं और ये जो इनपुट शेप है ये मैं एक बार के लिए हटा देता हूं क्यों र है क्योंकि देखिए एक बार इनपुट शेप आने के बाद में बार-बार इनपुट शेप नहीं दी जाती है राइट तो मैंने यहां पे क्या किया इसको दो बार लगा दिया दो बार लगाने के बाद में अब हमारा जो डाटा है यहां पर वो सीएन डॉट ऐड होते हुए अब क्या होगा फ्लटर होगा देखिए पहले कलेशन हुआ फिर आपके पास पूलिंग हुआ फिर कलेशन हुआ फिर पूलिंग हुआ अब बारी है किसकी फ्लेटन की तो मेरा जो डाटा है गाइज यहां पर मुझे क्या करना है यहां पर फ्लेटन करना है ओके तो अभी हमें यहां पे क्या करना है फ्लेटन लेयर को ऐड करना है फ्लटर लेयर को ऐड करने के बाद अब जो हमारा डाटा आ गया है यहां पर इस डटा के ऊपर अब हमें क्या करना है सीएनए की जगह cnn's लेयर को ऐड करते हैं अब डेंस लेयर के अंदर हमें क्या करना होता है गाइज यहां पर सबसे पहले नंबर ऑफ यूनिट्स नंबर ऑफ नट्स कितने लगा रहे हैं वो आपको बताना बता है एक्टिवेशन फंक्शन कौन सा लगा रहे हैं वो आपको बताना पड़ता है फिर आप यहां पे बहुत सारी चीजें हैं जो आप इसके हाइपर पैरामीटर ट्यूनिंग के लिए इस्तेमाल कर करते हैं फिलहाल के लिए मैं ऐसा कुछ भी नहीं कर रहा हूं नंबर ऑफ़ नोट्स लगा रहा हूं यहां पर 64 नोट्स यहां पर इस्तेमाल कर रहे हैं यहां पर ओके उसके बाद में नेक्स्ट जो चीज़ होती है गाइज यहां पर एक्टिवेशन फंक्शन के बारे में एक्टिवेशन फंक्शन के तौर पे आप यहां पर आरई एल यू रल ही इस्तेमाल करेंगे यस आप यहां पर क्या करेंगे आरई एल यू रल ही इस्तेमाल करना है राइट अब ये जो लेयर्स लग रही है यहां पर ये मैं बहुत सारी लगाने वाला हूं यस चलिए अभी देखिए यहां पर सबसे पहले 64 64 के बाद में मैं रार की बनाने के लिए इसके अंदर क्या दूंगा 34 दूंगा या 32 ले लेता हूं यहां पर यस कितना देते हैं यहां पर अ 32 का कर देता हैं यहां पर 32 के बाद में अब यहां पर मैं 16 कर देता हूं और 16 के बाद में मैं एट कर देता हूं और एट के बाद में गाइज यहां पर फोर कर देते हैं और फोर के बाद में अब मैं यहां पर इसका आउटपुट डिसाइड कर लेता हूं राइट अब जरूरी नहीं है कि जो मैंने नेटवर्क बनाया है वो उसी के हिसाब से आप भी नेटवर्क बनाएं नहीं आप अपने हिसाब से इसका नेटवर्क तैयार कर सकते हैं अब देखिए ये जो आउटपुट है ये आउटपुट आपके पास जो भी आ रहा है यहां पर दैट इज द बाइनरी आउटपुट यस ये कैसा है बाइनरी आउटपुट है जिसके अंदर आप कैट और डॉग दो ही क्लासिफाई कर रहे हैं बेसिकली तो इसके लिए आपको ये रिलो हटाना पड़ेगा और रिलो हटा के यहां पर क्या लगाना पड़ेगा सिगमॉड को लगाना पड़ेगा ठीक है सिगमॉड को यहां पर लगाना पड़ेगा ये आपका क्या तैयार हो गया आपका एनन का नेटवर्क तैयार हो गया ऊपर ले कशन फिर मैक्स पूलिंग फिर फ्लेटन फ्लेटन के बाद में फुली कंडक्शन लेयर जिसे आप इनन का नेटवर्क बोल रहे हैं इसके बाद में अब आपके मॉडल के कंपाइल के बारी है तो मैं सीनन डॉट अब क्या करूंगा यहां पर आपका मॉडल को कंपाइल करूंगा कंपाइल के अंदर सबसे पहले आपके पास क्या आता है गाइस यहां पर लॉस के तौर पे आप क्या इस्तेमाल करते हैं बाइनरी क्रॉस एंट्रोपय करते हैं तो ये बाइनरी क्रॉस एंट्रोपय यहां पर आपको इस तरह से लिखनी है राइट उसके बाद में गाइज यहां पे क्या है आपका ऑप्टिमाइजर है यहां पर तो मैं ऑप्टिमाइजर लगा देता हूं और ऑप्टिमाइजर के र पे एडम ऑप्टिमाइजर आपको लगाना है यहां पर राइट इसके बाद में अब आ जाते हैं यहां पर ये कंपाइल मॉडल तैयार होने के बाद में अब आता है cnn.com नहीं आएगा तो फिट भी हमें यहां पर चेंजेज करना पड़ेगा तो अब ये फिट आएगा कैसे कैसे काम करेगा तो इस चीज के लिए आपको कोड ज्यादा याद रखने की जरूरत नहीं है आप जा सकते हैं केरा के अंदर यस कहां जाएंगे यहां पर केरा पाइथन में जाएंगे केरा का मॉड्यूल आपके पास ओपन हो जाएगा यहां पर अब केरा पाइथन के अंदर जाने के बाद में आप इसका डॉक्यूमेंटेशन को ओपन कर दें डॉक्यूमेंटेशन के अंदर जैसे ही आप यहां पर इसके सेकंड डॉक्यूमेंटेशन पे पहुंचेंगे तो आप इसके ऊप पहले ऐसे क्लिक कर लें क्लिक करने के बाद आप थोड़ा सा नीचे आए यहां पर तो आपको इमेज प्रोसेसिंग से रिलेटेड चीजें मिल जाएगी देखिए यहां पर सीक्वेंशियल प्रोसेसिंग भी है टेक्स्ट प्रोसेसिंग भी है और इमेज प्रोसेसिंग भी है फिलहाल हमें इमेज प्रोसेसिंग पे काम करना है इमेज प्रोसेसिंग पे आने के बाद में अभी आपको क्या लिख रहा है इमेज डाटा जनरेटर यहां से आप अपना डेटा जनरेट भी कर सकते हैं इमेज का वो आपके लिखा हुआ है हम इमेज डेटा जनरेटिंग नहीं करना चाहते हैं बेसिकली हम बेसिकली इमेज को यूज करना चाहते हैं तो इसके अंदर देखिए फॉलो x एंड y भी मिलेगा एंड फॉलो फ्रॉम द डायरेक्टरी भी आपको मिलने वाला है फिलहाल हम डायरेक्टरी पे काम कर रहे हैं डायरेक्ट्रीएंट्री कोड लिखा हु है बहुत बड़ा ये कोड आपको यूज़ करना है यहां पर तो ठीक है मैं इसे कॉपी कर लेता हूं इस कोड को पहले और यहां पे ले जाके पेस्ट कर लेता हूं अब इसके अंदर हमें क्या करना है इमेज डेटा जनरेटर को पहले कॉल करना पड़ेगा इमेज डेटा जनरेटर कॉल करने के बाद ही हम इसे यूज़ कर पाएंगे तो देखिए इमेज डेटा जनरेटर कॉल करने के लिए आप ऊपर चलेंगे तो देखिए केरा में जाके प्री प्रोसेसिंग प्रोडक्ट प्रोसेसिंग में इमेज और फिर आपको इमेज डाटा जनरेटर मिल जाएगा तो अब हमें क्या करना है एक और लाइब्रेरी को इंपोर्ट करना है यहां पर कैसे देखिए फ्रॉम केरा में जाएंगे केरा में जाने के बाद मैं प्री प्रोसेसिंग में जाने के बाद डॉट मैं किस में जाऊंगा इमेजेस के पास जाऊंगा यहां पर इमेजेस के अंदर जाने के बाद अब देखिए दो-दो बार आ चुका है तो फिलहाल के लिए मैं एक को यहां से हटा देता हूं राइट इमेज के अंदर आने के बाद आप यहां पे क्या करेंगे इंपोर्ट करेंगे और इंपोर्ट क्या करना है गाइज यहां पर इमेज डटा जनरेटर राइट ये इमेज डाटा जनरेट करेगा यहां पर अब ये इमेज डेटा जनरेट आ गया जहां पे हमारा ट्रेनिंग डेटा जनरेटर आ गया और दूसरा टेस्टिंग डेटा जनरेटर आ गया उसके बाद देखिए ट्रेनिंग डेटा जनरेटर आ गया और उसके बाद वैलिडेशन डेटा जनरेटर है इस वैलिडेशन डेटा जनरेटर को आप यहां पे क्या करें ट्रेनिंग की जगह टेस्टिंग डेटा बना दें मतलब वैलिडेशन की जगह आप यहां पे क्या करें टेस्ट डेटा जनरेटर बना दें राइट उसके बाद में देखिए ये व टेस्ट डेटा जनरेटर यहां पे भी यूज़ हो रहा है तो फिलहाल के लिए मैं यहां पे ये भी हटा देता हूं और टेस्ट डाटा जनरेटर कर देता हूं ठीक है तो ये मैंने कुछ काम कर दिया यहां पर अब देखिए ट्रेनिंग डेटा जनरेटर भी आ गया सैंपल साइज वगैरह सब आपको पूछा जा रहा है आपके पास मॉडल भी यूज किया जा रहा है तो ये सारी चीजें हम वन बाय वन यूज करेंगे अभी यहां पर राइट इससे पहले मैं थोड़ा सा सेट कर लेता हूं इन सारी चीजों को और मैं आपको बताता हूं इस कोड के अंदर कौन सी चीजें कहां पे और किस जगह पे रखनी है है चलिए एज फिलहाल तो अभी हम क्या करते हैं ऊपर चलते हैं वापस और यह हमारा इमेज डाटा जनरेटर है जहां पे हमें कुछ भी चीज छेड़छाड़ नहीं करनी है यहां पर ये हमारी इमेजेस से रिलेटेड चीजें है कि इमेज की रिसाइट है इमेज की री स्केलिंग करनी है जूम करना है उससे रिकॉर्डिंग हमके चीजें बता रखी है अब बातें करते हैं ट्रेन डाटा जनरेटर के बारे में ट्रेन डेटा जनरेटर के अंदर सबसे पहले ट्रेन डेटा आपको यहां पे डालना पड़ेगा मतलब आपके डाटा का आपको एड्रेस डालना पड़ेगा अब ये एड्रेस आएगा कैसे तो देखिए ट्रेनिंग डाटा का एड्रेस कहां पर है ये रहा हमारा ट्रेनिंग डाटा का एड्रेस इसके ऊपर आपको क्लिक करना है क्लिक करने के बाद में आपको कॉपी ऐसे पात कर देना है यहां पर यहां पे आ जाइए और यह जो भी डाटा लिखा है यहां पर इसके जगह जाके पेस्ट कर दीजिए आपका डाटा का एड्रेस आपके पास आ गया है लेकिन इसके आगे आर लगाना ना भूले दैट कॉल ऑफ रिलेटिव एड्रेस इसी तरह से हमें टेस्टिंग का भी डाटा का एड्रेस लाना है तो मैं टेस्टिंग डाटा के ऊप जाके क्लिक करूंगा और कॉपी एज पाथ के ऊप जाके क्लिक कर दूंगा और ये जो डाटा है यहां पर इसकी जगह जाके पेस्ट कर देंगे देन इसके जग जाके आर रिलेटिव पार्ट लगा देंगे अब देखिए टारगेट साइज यहां पे देखिए 150 150 जबकि हमने ऊपर जब इस्तेमाल किया था तब हमने 60 64 64 का इस्तेमाल किया था मतलब हमें टारगेट साइज को चेंज करना पड़ेगा यहां पर चलिए टारगेट साइज को 64 बना लेते हैं यहां पर यस टारगेट साइज को क्या करते हैं गाइ यहां पर 64 बना देते हैं यहां पे भी टारगेट साइज को चेंज करके 64 बना लेते हैं यहां पर और ये जो टारगेट साइज लिखी है इसको भी चेंज करके 64 बना देते हैं तो मैंने यहां पे कुछ चीजें चेंजेज कर दी है यहां पर अब बात करते हैं ये मॉडल डट फिट के अंदर मॉडल के नाम हमारे पास क्या है यहां पर सीएए हो चुका है यहां पर अब बात करते हैं ये सैंपल साइज वगैरह के लिए देखिए सैंपल पर रिपोर्ट जो है यहां पर वो तो एज इट इज है यहां पर इसके अंदर काफी चीजें आपके पास क्या हो गई चेंज हो गई है काफी चीजें आपके पास क्या हो गई चेंज हो गई जैसे एनबी पोच यहां पर चेंज हो गई यहां पर यस एनबी वैलिडेशन सैंपल डाटा भी आपका यहां पर चेंजेज हो चुका है तो ये जितनी भी चीजें चेंजेज हुई है ये हमें लगाना पड़ेगा देखिए सबसे पहले यहां पर सैंपल पर इपोज की जगह यहां पर स्टेप पर इपोच आ चुका है तो मैं सैंपल पर इपोज की जगह क्या कर देता हूं यहां पर आपके पास स्टेप पर इपोज कर देता हूं और यहां पर एनबी इपोच की जगह देखिए यहां पर अब नया नाम आ चुका है दैट इज अ इपोच बिकॉज यहां पे क्या हो रखा है केरा लाइब्रेरी ने अपने कुछ डाटा को अपडेट कर दिया वैलिडेशन डाटा एज इट इज है एबड सैंपल वैल्यू के बारे बात करें यहां पर तो ये रहा वैलिडेशन स्टेप्स आपके पास दे रखा है और भी बहुत सारी चीजें दे रखी है फिलहाल के लिए मैं इसे यहां पर इस हाइपर पैरामीटर को हटा दे रहा हूं राइट इस हाइपर पैरामीटर को हम हटा देते हैं अब देखिए ये क्या कर रहा है यहां पर स्टेप पर पोच में मेरी 2000 इमेजेस ट्रेन करेगा वो भी 50 बार तो मैं 50 बार ट्रेन नहीं करूंगा मैं इसको केवल पांच बार ही ट्रेन करूंगा मैं कम टाइम के लिए ट्रेन करूंगा और मेरी कम इमेजेस को ट्रेन करने वाला हूं यहां पर ऑलमोस्ट 200 इमेजेस को ही ट्रेन कर रहा हूं रीजन बहुत ही क्लियर है यहां पर रीजन इसलिए यहां पर ये कर रहे हैं यहां पर बिकॉज़ देखिए इस डाटा को ट्रेंड होने में बहुत ज्यादा टाइम लगेगा तो इसी चीज के लिए क्या कर रहा हूं मैं यहां पर चीजों को थोड़ा सा चेंजेज कर रहा हूं मतलब इपोच को कम कर रहा हूं ताकि ये थोड़ा सा इजी और फास्टेस्ट वे में काम हो सके राइट चलिए अब इसे रन कर देते हैं यहां पर और हमारी जो मॉडल है वो ट्रेंड होना स्टार्ट हो चुका है अब ये एक ही पोच के अंदर क्या कर रहा है गाइज यहां पर 200 इमेजेस को ट्रेन कर रहा है अभी भी 200 इमेजेस काफी ज्यादा है तो मैं फिलहाल के लिए इसको स्टॉप कर दूंगा रीजन बहुत ज्यादा टाइम लग जाएगा यहां पर और हम आगे के प्रोसीजर को नहीं समझ पाएंगे तो मैं एक इपोज के अंदर केवल और केवल 20 इमेजेस को ही ट्रेन करूंगा राइट फिलहाल मेरी एक्यूरेसी कम आने वाली है लेकिन यदि आप इसे प्रैक्टिस तौर पे यूज़ कर रहे हैं तो आप इसे अच्छे से पूरे डटा केप ट्रेन कीजिए ताकि आपको अच्छी एक्यूरेसी मिल सके राइट चलिए अब इसे मैं रन करता हूं यहां पर 20 पोच को मुझे ट्रेन करना है पांच बार तो ये हमारा ट्रेड हो रहा है राइट अभी लॉसेस काफी ज्यादा है यहां पर राइट लेकिन ये ट्रेंड होने जा रहा है यहां पर और देखिए हमारे पास दूसरा ही पोच स्टार्ट हो गया पहला ही पोच होने के बाद में हमारा दूसरा पोच स्टार्ट हो गया दूसरे के बाद तीसरा इपोच होगा ऐसे करते-करते नंबर ऑफ इपोच होते रहेंगे और हमारा मॉडल यहां पर ट्रेंड हो जाएगा हमारा मॉडल यहां पे ट्रेंड हो चुका है लेकिन अभी हमारा मॉडल के देखिए लॉस की बात करें तो लॉस काफी है यहां पर 69 पर लॉस यहां पर है और ये बहुत ज्यादा लॉस है यहां पर फिलहाल लेकिन ये होने के पीछे रीजन बहुत सिंपल सा है यहां पर क्योंकि हमने स्टेप पर इपोज कम लिए यहां पर नंबर ऑफ इपोज कम लिए यहां पर सब कुछ क्राइटेरिया बहुत ही कम ले रखा है यहां पर इसलिए ये होना तो वाजिब था बट अभी मैं आपको यहां पर सिर्फ प्रैक्टिस कैसे कर सकते हैं कोड कैसे लिख सकते है वो मैं आपको समझाने जा रहा हूं इस वजह से मैं यहां पर कम ट्रेनिंग कर रहा हूं चलिए अब हमारे पास है टेस्टिंग की बारी टेस्टिंग की है टेस्टिंग के अंदर क्या कैसे करेंगे कोई नई इमेज आएगी तो कैसे वर्क करेंगे उसकी बारी है यहां पर तो आ जाते हैं उसके कोड के लिए तो उसके लिए हम चलेंगे यहां पर फ्रॉम किसके अंदर आपके पास यहां पर केरा के अंदर जाएंगे सबसे पहले केरा के अंदर जाने के बाद मैं प्री प्रोसेसिंग में जाऊंगा प्री प्रोसेसिंग के अंदर जाने के बाद मैं यहां पर इंपोर्ट करने वाला हूं यहां पर कैसे इंपोर्ट करेंगे गाइज यहां पर हम इंपोर्ट करेंगे इमेजेस को राइट किसे इपोर्ट करेंगे इमेजेस को इंपोर्ट करेंगे इमेजेस को इंपोर्ट करने के बाद मेरी जो इमेज है उसे मैं लोड करने वाला हूं उसके लिए मैं इमेजेस के पास जाऊंगा और डॉट यहां पर मैं क्या करूंगा हमारी इमेज को लोड करूंगा इमेज डायरेक्टरी के जनरेटर को नहीं करूंगा यहां पर लोड इमेज का यूज़ करूंगा यहां पर लोड इमेज इसके अंदर मुझे मेरी क्या करनी है इमेज डालनी है कौन सी जिसकी मुझे टेस्टिंग करनी है जस्ट लाइक मुझे इसकी टेस्टिंग करनी है तो मैं इसके ऊपर जाके क्लिक करूंगा एंड कॉपी एज ए पाथ कर इसका पाथ लेके आ जाऊंगा एंड देन मैं यहां पे इसे पेस्ट कर दूंगा राइट ओके मेरे पास पहले से डबल कोड है तो इसको हटा के यहां पे पेस्ट कर देंगे राइट इसके आगे r लगा देते हैं ताकि रिलेटिव पाथ बन सके एंड देन अब मुझे क्या करना है गाइज यहां पर इसके अंदर मेरी जो इमेजेस है उस इमेज का मुझे साइज भी देनी पड़ेगी कि इमेज के टारगेट साइज क्या है यहां पर तो देन मुझे मेरी टारगेट साइज देनी है और टारगेट साइज अभी नन नहीं है नन अभी चेंज हो गई है यहां पर और वो हो गई है 6464 बिट्स क्यों क्योंकि देखिए हम जोब ऊपर से काम करते आ रहे हैं तो हमने 6464 बिट्स की ही इमेज ली है राइट तो ये हमारी इमेज यहां पर लोड हो गई है इमेज लोड होने के बाद में अब इसे हमें क्या करना है एरे में कन्वर्ट करना है एरे में कन्वर्ट करने के लिए मैं यहां पे वापस इसी इमेज के अंदर लोड कर रहा हूं उसके लिए मैं करूंगा यहां पर इमेज को कॉल करूंगा और इमेज को कॉल करने के बाद में इमेज टू एरे का फंक्शन का इस्तेमाल करूंगा राइट इमेज टू एरे क्या करेगा मेरी जो इमेज है उसे एरे में कन्वर्ट कर देगा अभी मैं आपको यदि मेरी इमेज दिखाऊं यहां पर तो ये इमेज कुछ इस तरीके से दिख रही है दैट इज अ एरर लाइक शेप यस ये कैसे दिख रही है गाइज यहां पर एरे लक शेप में दिख रही है मतलब मेरी जो भी इमेज है वो उसमें एरे बन चुका है अब इसके अंदर क्या करना है हमारा यहां पे काम होगा तो चलिए इसके लिए हम क्या करेंगे गाइज यहां पर इसके लिए हमें यूज़ करना पड़ेगा नपाई का तो मैं यहां पे क्या कर रहा हूं यहां पर इंपोर्ट कर रहा हूं किसे नपाई एलियाज ऑफ एनपी को राइट चलिए इसे रन कर लेते हैं अब आते हैं यहां पर और अब हमारा जो रिजल्ट है उसको निकालने जा रहे हैं लेकिन उससे पहले हम हमारी इमेज को थोड़ा सा फ्लड एन कर लेते हैं यहां पर उसके लिए मैं क्या कर रहा हूं यहां पर एक्सपेंड यस क्या यूज कर रहा हूं गाइज यहां पर एक्सपेंड डायमेंशन का यूज करूंगा जिसके अंदर जो हमारी इमेज है यहां पर उसे मैं पास करवा दूंगा तो हमारी स्पेंट डायमेंशन आ गई है लेकिन यहां पर मैं एक चीज देना भूल गया एक्सेस देना भूल गया तो मैं एक्सेस इ 0 पास करवा देता हूं राइट अब हमारी इमेज आ चुकी है इस इमेज को अब हमें क्या करना है प्रेडिक्शन मॉडल में डालना है कैसे डालेंगे यहां पर तो ये cnn.com ंड 5 से लेस दन जाएगी राइट तो देखिए ये वैल्यू क्या है यहां पर 5 से कम है तो मैं यहां पे एक कंडीशन लिखूंगा ये जो डेटा सेव हो रहा है इसके अंदर मैं p के अंदर सेव कर लेता हूं राइट फिर मैं यहां पे कंडीशन लिखूंगा यहां पर इफ आपकी जो इमेज है इमेज मतलब आपका जो रिजल्ट आया p देन स्क्वा बकेट ऑफ 0 देन स्क्वायर बकेट 0 इज इक्वल्स टू इक्वल टू लेन 0.5 हो यहां पर तब आपको क्या करना है यहां पर आपको बताना है प्रिंट कर देना है कि दैट इज अ क्या है यहां पर डॉग है राइट इसी तरह से मैं यहां पे एल्स डालूं यहां पर तो एल्स में आप क्या करोगे प्रिंट कर दोगे यहां पर और वो प्रिंट क्या करोगे गाइज यहां पर कैट है राइट तो अभी क्या दिखा रहा है डॉग आ रहा है अब मैं यहां पर अपने इमेजेस को थोड़ा सा चेंज करता हूं जस्ट सपोज मैं ये इमेज लेके आता हूं कैट की और पूछता हूं ये किसकी इमेजेस है यहां पर तो फिलहाल ये डॉग की ही बताएगा रीजन बहुत सिंपल है क्योंकि हमारा मॉडल अच्छे से ट्रेंड नहीं हो पाया यहां पर लेकिन यदि थोड़ा सा भी अच्छा से ट्रेंड हुआ होगा तो ये रिजल्ट में तो कुछ ना कुछ चेंजेज दिखाने वालाला है फिलहाल डॉगी दिखा रहा है यहां पर रीजन सिंपल सा है क्योंकि हमने हमारा मॉडल जो है अच्छी तरह से ट्रेड नहीं कर रहा है और लॉसेस भी काफी अच्छे हैं यहां पर राइट लेकिन यदि आप यहां पर इसे बहुत सारे नंबर ऑफ इपोच देते हैं यहां पर और ज्यादा स्टेप्स पर यहां पर इमेजेस को ट्रेन करवाते हैं यहां पर तो बेसिकली 100% ये बहुत अच्छे तरीके से काम करता है और बहुत अच्छे रिजल्ट भी निकाल के देता है आपको यहां पर तो ये था हमारा सीएनए का नेटवर्क यस सीएनएन का नेटवर्क कैसे यूज करना है वो आप लोगों को समझ में आ गया होगा किस तरह से हमें कन्वर्शन लगाना है कि पुडिंग लगाना है राइट किस तरह से फ्लटर लगाना है डेंस लेयर कैसे लगानी है कंपाइल कैसे करना है ट्रेनिंग एंड टेस्टिंग जो इमेज आ रही है उसे कैसे यूज करना है वो प्रॉपर वन बाय वन स्टेप बाय स्टेप मैंने आप सभी लोगों के सामने यहां पे डिक्लेयर कर दिया