Transcript for:
Understanding Random Forest Algorithm

हेलो हेलो गाइस वेलकम टू माय YouTube चैनल हम लोग रेंडम फॉरेस्ट पढ़ रहे थे और हमने लास्ट वीडियो में हाई पर पैरामीटर्स के बारे में पढ़ा अब हम लोग इस वीडियो में एक कोड एग्जांपल के थ्रू समझेंगे कि रेंडम फॉरेस्ट को आप किसी प्रॉब्लम के ऊपर कैसे अप्लाई करते हो गुड पार्ट अबाउट रेंडम फॉरेस्ट एल्गोरिदम एस की स्प्रेड आउट ऑफ द बॉक्स विदाउट एनी हाई पर पैरामीटर ट्यूनिंग भी यह एल्गोरिथम बहुत बढ़िया कौन करता है सुबह काम करेंगे हम लोग हम लोग इस वीडियो में एक डाटा सेट है अ हार्ट डिजीज का डेटा सेट बहुत फेमस है कल से मुझे मिला उसके ऊपर रेंडम बॉयज अप्लाई करेंगे इन थेसे क्लासिफिकेशन प्रॉब्लम ओके खुश सोए कि हम लोग ऊंचे इंपोर्ट्स ले रहे हैं डेटासेट को इंपोर्ट कर लिया और यह मेरा बेटा सेट तो दूसरे डेटासेट अबाउट 2003 पेशेंट्स और उनके बारे में डिटेल्स है ऐज समय कुछ बायलॉजिकल मैट्रिक्स है और फिर बताया जा रहा है कि उनको हार्ट डिजीज है या नहीं है ठीक है और हमें इनपुट के लिए प्रेरित करना है कि पेशेंट को हार्ट डिजीज होगा या नहीं होगा ठीक है तो सबसे पहले मैंने क्या किया मैंने एक सॉइल एक्सट्रेक्ट कर लिया है डेटासेट से लाइक दिस ट्रेन डेसप्लैट कर दिया ट्रेन टेस्ट करने के बाद 242 रोज ट्रेन में चले गए sixty-one रोज टेस्ट में चले गए यहां पर मैंने रेंडम फॉरेस्ट राइट ऑब्जेक्ट बनाया और उसको मॉडल पर ट्रैक करके आपको की निकोला एडम्स कमिंग और टू बी पॉइंट 15 ठीक है अगर आप इसको और दूसरे एल्गोरिदम के साथ कंपेयर Rolex से इस पॉइंट पर अगर मैं श्री राम थे ब्रीड बंबू स्टिक क्लासिफाइड लूर जो कि हमने भी पढ़ा नहीं है बट आप टाइम तरीके से यूज कर सकते हो एसडीएम से अगर मैं एडिसन ले लो और ए लिनियर मॉडल से लॉजिस्टिक रिग्रेशन ले लो टो मेक कंपैरेटिव स्टडी आपको दिखा सकता हूं कि रेंडम फॉरेस्ट कहां पर सेंड करता है को और बढ़ा सकते हैं बताइए कितने मेरा पॉइंट क्लियर हो जाएगा सो इस पॉइंट से लौट आई विल डू इस आई विल क्रिएट इंग्रीडिएंट बूस्टिंग कि क्लासिफाइड का ऑब्जेक्ट आई विल क्रिएट एसवीसी का ऑब्जेक्ट टैबलेट और लॉजिस्टिक रिग्रेशन का ऑब्जेक्ट है और हम क्या कर सकते हैं हम सभी के ऊपर यह सेम को टर्न कर सकते हैं सो आई विल जस्ट ए ड्रीम ओं टाइम्स फोटो कॉपी और यहां पर हम डाल देते हैं ग्रीन बूस्ट लुट इन काउंसिल ग्रैजुएटिंग जो खुद में बहुत अच्छा एल्गोरिदम है उसका एक प्रेशर भी काफी नीचे आ रहा है रेंडम फॉरेस्ट से क्लच सीखिए पीएम का क्या हालत है एसपीएम शायद थोड़ा बेटर फ्रॉम करें का युद्ध में कुछ इवनिंग किया नहीं है सो यू नेवर नो पति और भी ज्यादा खराब है और लिपस्टिक लॉजिस्टिक रिग्रेशन कि क्या हाल है सौगंध जो अलार्म है और यह काफी बढ़िया देर है पॉइंटेड यह तो मोस्ट लाइक्ली डाटा थोड़ा जूनियर होगा इंटरनल शायद इसलिए बट मैं आपको बस यह बताना चाहता हूं कि आप किसी भी प्रॉब्लम में डायरेक्टली स्टेट ऑफ द बॉक्स अगर रेंडम फॉरेस्ट अप्लाई करोगे वह हमेशा टॉप टू थ्री एल्गोरिथम्स में रहता है हमेशा उसका परफॉर्मेंस हमेशा ही बढ़िया रहता है यह डेमनस्ट्रेशन आएगा आपको यह क्लियर दिखा सकता है शो लव और इसलिए यह सिर्फ हमने ट्रेन टैबलेट एक बार किया है तो उस हिसाब से कुर्सी निकला है हमने इसको कॉस्ट रिलेटिड नहीं किया है तो अगर आप क्रॉस वैलिडेट करोगे तो एक ओर से थोड़ा हट जाता है लेकिन उसी की पॉइंट टू हो गया क्योंकि मैंने 10 बार यह सेम काम किया और फिर एवरेज निकाला तो यह थोड़ा ज्यादा एक्यूरेट रिप्रेजेंटेशन है सेम चीज जब आप लॉजिस्टिक रिग्रेशन के साथ करोगे तब भी वह आठवां से नहीं रहेगा वह हट जायेगा का यह लाइक कि यहां पर घाट करके पॉइंट टू हो गया जो कि पहले पॉइंटेड ठाट तो यह ज्ञानपीठ जो क्रॉस वाइब्रेशन लगाने के बाद आप का रिजल्ट आ रहा है और बहुत-बहुत रेंडम फॉरेस्ट एंड लॉजिस्टिक रिग्रेशन मॉडल एस टी नहीं आ रहा है अब आप क्या कर सकते हो कि आप रेंडम फॉरेस्ट का परफॉर्मेंस थोड़ा सा और इंप्रूव कर सकते हो अगर आप उसका हाई पर पैरामीटर ट्यूनिंग करो क्योंकि अलग ही पैरामीटर्स है उनकी वैल्यूज टो एडजेस्ट करने से ऐसा हो सकता है कि आप मॉडल के परफॉर्मेंस को इंप्रूव करता हूं तो मैंने क्या किया मैंने मैथ्स सैंपल बोल के जो है पैरामीटर था कि कितने नंबर और रोज जाएंगे हर पिंपरी के अंदर उसको मैंने ट्यून किया मैंने 75परसेंट रोज है और ऐसा करने से मेरा अ कुर्सी काफी बढ़ गया था पॉइंट माय या गया था यह सब चीजों का मैं रस बारिश रुक-रुककर ओए अगर मैं आप लिखो रेंडम फॉरेस्ट है और यहां पर मैं लिखूं मैक टेंपल यह पॉइंट से 2.5 से पॉइंट टू आ रहा था पहले अब पॉइंट 84 हो गया सो डालनी प्रॉब्लम है कि रेंडम फॉरेस्ट में अराउंड 25 हाई पर पैरामीटर्स है तो मुझे कैसे पता चलेगा कि हर पैरामीटर का सबसे सही वैल्यू क्या होगा तो इसका सलूशन एक ही है और वह हाईट पर पैरामीटर ट्यूनिंग और हाइपर पैरामीटर ट्रिमिंग करने के लिए आपके पास अलग-अलग तरीके होते हैं उनमें से जो सबसे फेमस तरीका है वह ग्रेड थी कि वहां पर आप क्या करते हो आप अपने हर हाई पर पैरामीटर को अलग-अलग वैल्यूज ढेरों जिनके लिए आपको टेस्ट कर मैं सूर्य को मैंने इनवेस्टमेंट अर्जुन कितने डिस्टेंट रिलेटिव्स होंगे उसके लिए मैंने चार अलग बैलेंस दीदी फिर मैंने मैथ्स टीचर सेशन कितने कॉलम्स मिलेंगे हर डिसिडेंट को उसके लिए अलग वैल्यूज देती मैक्सएक्स कितना रहेगा हद रिसेंटली का उसके लिए अलग वृद्धि और फिर मैथ्स सैंपल पेपर रहेगा उसके लिए मैंने अलग वैल्यू दे दी अब होगा क्या कि कि हर पर्टिकुलर कोंबिनेशन के लिए एक रेंडम फॉरेस्ट ट्रेन होगा टोटल कितने कोंबिनेशन स्क्रीन होंगे यू कैन सी फॉर मल्टीप्लायड बाय थ्री मतलब 1212 मल्टीप्लायड बाय 330 6 मल्टीप्लायड बाय थ्री लें 108 कोंबिनेशन शो हम चाहकर है हम 108 डिफरेंट रेंडम फॉरेस्ट ट्रेन करेंगे कि फिल्म Tubelight चीज को ग्रेट सच बोला जाता है क्योंकि यह ग्रेड की तरह अगर आप चार पैरामीटर को तीव्र कर रहे हो तो आप एक four-dimensional ग्रेटर ऑडियंस चैनल टेबल हो और आप उससे बल्कि हर वैल्यू के लिए अपने रेंडम फॉरेस्ट को ट्रेन करोगे तो आप में सबसे पहले यह ट्रेन कर दिया उसके बाद पिछड़ी फॉर्म कर दो पैरामीटर ग्रेट बोलकर यहां पर आप एक्जेक्टली ओं वैल्यू से दहाई पर मीटर का वॉल्यूम दे दो नाम देते हो सॉरी और यहां पर इसका वैल्यू है तो और यह मेरा पैरामीटर ग्रेट ठीक है यह डिक्शनरी अब एक ऑब्जेक्ट बना रहे हैं रेंडम फॉरेस्ट झाल और फिर मैं मॉडल सलेक्शन से ग्रेट सर सी को इंपोर्ट कर रहा हूं यहां पर आपको 4 5 चीज़ें प्रोवाइड करनी है पहला कौन से एल्गोरिदम को आपको रन करना है रेंडम फॉरेस्ट इसको रन करना है ठीक है नेक्स्ट पैरामीटर रेट बताओ क्या-क्या ऑप्शंस के ऊपर ट्रेन करना है वह मैंने बता दिया उसके बाद क्रॉस वैलिडेशन तो मैं बोल रहा हूं कि जो पूरी चीज है जो आप 108 रेंडम फॉरेस्ट को प्रेम करोगे है उसको पांच बार ट्रेन करो हर रेंडम फॉरेस्ट को पांच बार ट्रेन करो फोन चीजें क्योंकि उससे क्या होगा आपका क्रॉस वैलिडेशन हो जाएगा और आपको ए ग्रेट रिजल्ट्स मिलेंगे ठीक है वह इससे आपको आउटपुट दिखेगा ड्यूरिंग थे प्रोसेस ऑरेंज आफ माइनर करने से मेरे मशीन के सारे कोर्स में यूज करूंगा तो इसे थोड़ा फास्ट हो जाएगा क्योंकि आप अगर इतने सारे बॉडी स्ट्रेन कर रहे हो तो प्रोसेस होगा राइड तो अब मैं इस कॉर्ड को रंगे हाथ गिरफ्तार इस लाइन में सबसे इंपोर्टेंट काम होगा मॉडल ट्रेन होगा तो इसको अब जैसी रन करो मेरे को बोल रहा है फिटिंग 543 staff10 ए कैंडिडेट टोटलिंग 540 फ्रूट्स तो इन शॉर्ट 550 डिफरेंट मॉडल स्ट्रेन हो रहे हैं अभी बिहाइंड द सीन अब अगर यह डाटा बहुत बड़ा होता तो बहुत ज्यादा टाइम लगता बट योर डाटा से एक छोटा है इसलिए हो गया और यह आपको हर बार का समरी दिखाई दे रहा है ठीक है यह आपका आउटपुट अगर आपको इससे पता करना है कि बेस्ट पैरामीटर्स क्या है तो आपको लिखना होता है अरे ग्रेट व्यस्त आरंभ और यह आपको 1 समरी में बता देगा मैक्स लेफ्ट नाम रखने के लिए मैक टीचर्स पॉइंट टू रखने के लिए मैक्स M2 उस पॉइंट सेवन 500ml t-20 रखने के लिए t-20 रिसेंटली सपने के लिए और यह आपका फेस को है प्वाइंट्स 83 100 बेस्ट को ठीक है तो डू यू डू द ग्रेट सर स्विच ऑन टॉप आफ रेंडम फॉरेस्ट ठीक है अब एक और चीज होती है इसको बोलते रेंडम सर टीवी ऐक्टर्स को रेंडमाइज्ड सर सीवी बोलते हैं तो इसमें क्या होता है कि यहां पर आपके पास 108 कोंबिनेशन सो गए टाइट अगर यह बहुत बड़ा बेटा सेट हो या फिर आपको और ज्यादा हाई पर पैरामीटर्स को ट्रेन करना हो तो ग्रेट सर सीवी थोड़ा सा स्लो हो जाता है और आपको बहुत टाइम लगता है मॉडल को प्रेम करने में रेंडमाइज्ड सृजन करता है कि वह रैंडमली 108 अगर आपके पास ऑप्शन से तो उसमें से रैंडमली दस-पंद्रह-बीस को सेलेक्ट कर ले काया और अपने हिसाब से रैंडमली को सारी चीज को परफॉर्म करेगा तो यहां पर मैंने क्या किया एक दो और एडिशनल पैरामीटर्स ऐड कर दिए जैसे बूटस्ट्रैप मिनी सैंपल्स प्लेट मेन सैंपल लिए मैं और ज्यादा हाई पर पैरामीटर्स यूज की है है यह मेरा पैरामीटर ग्रेड है थोड़ा स्वाद बढ़ा है मैंने फ्रेंड वाली सब्सिडी को बुलाया यहां पर मैंने सब कुछ सही रखा ए ग्रेटेस्ट और इसको जब ट्रेन किया है तो यह ज्ञानपीठ चीटिंग वाइफ टैंक कैंडीडेट्स इन शॉर्ट इसने क्या-क्या रैंडमली 10 कैंडिडेट्स को उठाया बाकी सब को छोड़ दिया तो दिस प्रोसेस मच फास्टर और दोस्तों आपको बेस्ट रिजल्ट्स नहीं मिलते हैं बट आपको जल्दी आंसर मिल जाता है तो अगर इन सपोर्ट आफ बहुत बड़े डाटा सड़कों पर काम करो जैसे यहां पर नेटवर्क आंसर है सिर्फ पॉइंट आठवन क्लीयरली इससे बेटर है सर छुपे हुए हैं बट हम को निकाल नहीं सकते क्योंकि रेंडमाइज्ड सच में क्या होता है पर रैंडमली सेलेक्ट करते हो ठीक है जिस तो हो सकता है आपको बेस्ट डांसर्स ना मिले तो आपके दिमाग में क्वेश्चन आ रहा हूं फिर मैं राइट मेसर्स पे क्यों यूज करूंगा एंड सर्विस जब भी आप बहुत बड़े डेटासेट क्यू पर काम कर रहे हो और आपको खूब सारे है पैरामीटर को ट्यून करने हैं इन थे केस आफ रेंडमाइज्ड सीधी यूज करोगे क्यों क्योंकि रैंडमली सेलेक्ट करके या आपको अच्छे रिजल्ट दे भी सकता है अगर आप ग्रेड थ्री यूज करके बहुत बड़े डेटासेट क्यों पर तो आपको इतना बढ़िया रिजल्ट हो सकता है मतलब बढ़िया पहले ग्राफ इनफ टाइम तो आपको बढ़िया रिजल्ट मिलेगा लेकिन टाइम बहुत ज्यादा लग जाएगा मतलब बहुत सारा डिपेंडिंग डाटा से इंच तो इन शॉर्ट समरी में ग्रेड सीरियल को तब यूज करना है जब आपके पास कम बेटा है और जो एल्गोरिदम आप यूज कर रहे हैं उसमें कम है पर पैरामीटर सकते हैं बट अगर आपके पास बहुत बड़ा बेटा सेट है और आपके पास है एल्गोरिदम है उसमें भी बहुत ज्यादा हाई पर पैरामीटर्स है तो फिर आपको एडवाइजेज TV यूज करना चाहिए वह आपको नियर टू परफेक्ट रिजल्ट दे देता है कम टाइम में ठीक है तो आई हॉप आपको यह पूरा डिस्कशन समझ में आ थैंक्स वाचिंग