Transcript for:
Introduction to Data Warehouse

है एवरीवन वेलकम तू गेट माचिस आज की इस वीडियो में लेकर आया हूं इंट्रोडक्शन तू डाटा वेयरहाउस और इसको मैं रिलेट करूंगा विद रियल लाइफ एग्जांपल ताकि आपको साड़ी कहानी बहुत अच्छे से समझ आए और क्योंकि ये थोड़ा सा स्टार्टिंग में थियोरेटिकल टॉपिक है तो कहानी ना कहानी स्टूडेंट बर हो जाते हैं तो मैं आपको विद रिलाइफ एग्जांपल इन साड़ी चीजों को बड़े अच्छे ढंग से समझाऊंगा तो चलिए स्टार्ट करते हैं सबसे पहले जो यहां पे वेयरहाउस वेयरहाउस का मतलब क्या होता है वेयर हाउस इस व्हाट एन स्टोरेज एरिया एक स्टोरेज रिपोजिटरी बोल सकते हैं जहां पे मल्टीपल सोर्सेस से डाटा ए के स्टोर किया जाता है एक सेंट्रलाइज्ड एरिया बोल सकते हो वहां पे डाटा मल्टीपल सोर्सेस से आया उसको वहां पे आके डाटा को रखा और फिर उसे डाटा को फरदर उसे किया जा सकता है लेटर ऑन बिजनेस में बिजनेस को बढ़ाने में बिजनेस की ग्रोथ में उसे रा डाटा को प्रोसेस करके उसमें से कुछ यूजफुल इनसाइट्स निकले जा सकते हैं बाय यूजिंग डाटा मीनिंग लेकिन हम तब अप्लाई करेंगे ये साड़ी चीज जब हमारे पास पहले डाटा अवेलेबल हो और उसे डाटा को ह्यूज अमाउंट ऑफ डाटा को स्टोर करने के लिए क्या बनाया जाता है डाटा वेयरहाउस बनाया जाता है मैं एक सिंपल सा एग्जांपल से बताता हूं मैं कुछ दिन पहले पोटैटो के वीर हाउस में किया था आलुओं का जो वेयर हाउस है कोल्ड स्टोरेज भी बोल देते हैं उसको वहां पे होता क्या है मल्टीप्लेक्स लोकेशन से मतलब जो किसान होते हैं वो अलग-अलग जगह से आके 780 किमी का जो पूरा एरिया कर करते हैं वहां से आकर ट्रिलियो में लेक आते हैं पोटैटोज को और वहां पे आके स्टोर करते हैं तो यानी यहां पे भी से ये नाम वही से लिया हुआ है अगर आपने फ्लिपकार्ट अगर आप बड़ी जगह पे रहते हैं अच्छी जगह पे रहते वहां पे आपने में भी फ्लिपकार्ट का ब्लैंक किट का ये कहानी ना कहानी वेयरहाउस देखें होंगे और उन वेयरहाउस में होता क्या है सबसे पहले चीज क्या होती है जिसको बोलते हैं डाटा को सबसे पहले लेकर आना फ्रॉम मल्टीपल सोर्सेस कंपनी के बहुत सारे ऑपरेशन आप कर सकते हो शोरूम हो सकते हैं अलग-अलग जगह पर वहां से साड़ी जगह से डाटा को सबसे पहले लेकर आना जिसको बोलते हैं ईटीएल एक्सट्रैक्ट ट्रांसपोर्टेशन और लोडिंग तो यहां पे सबसे पहले डाटा मल्टीपल सोर्सेस से एक्सट्रैक्ट करके उनको इंटीग्रेटेड करके एक जगह पे लेक आना पड़ता है और वही चीज वहां भी हो रही है किसान जो है वो अपनी ट्रॉली में मल्टीपल जगह से अलग-अलग खेतों से ला रहे हैं क्या आलू लेकर ए रहे हैं और वहां पे आके रख रहे हैं तो ये सबसे पहले कम है और जैसे की अगर हम बात करें हमारे डाटा में अलग-अलग सॉफ्टवेयर्स उसे किया जाते हैं ताकि मल्टीपल जगह से डाटा को कलेक्ट कर सके जैसे एग्जांपल के तोर पे अगर आपसे पूछ ले तो एक होता है आपका ओरेकल कंपनी का डाटा इंटीग्रेटर तो वो डाटा इंटीग्रेटर का परपज ही क्या है मल्टीपल सोर्सेस से मल्टीपल जगह से डाटा को लगा के इंटीग्रेटेड करना ऐसे ही माइक्रोसॉफ्ट का भी अपना माइक्रोसॉफ्ट का भी अपना टूल है से आई एस सीक्वल सर्वर इंटीग्रेशन सर्विसेज तो यह बेसिकली करते क्या मल्टीपल जगह से डाटा को लेक रखते हैं अब डाटा को रख के करना क्या है जैसे आलू आगे साड़ी जगह से आगे रख दें थाउजेंड्स ऑफ टर्न में वहां पे आलू ए गए अब उसके बाद क्या करते हैं उसके बाद उसको थोड़ा सा प्रोसेस करते हैं मतलब जो आलू है उनको वहां से निकलते हैं तो आलू को थोड़ा साफ करते हैं क्लीनिंग करते हैं वही चीज यहां पे की जाति है डाटा अब ए गया उसे डाटा को प्रोसेस करते हैं उसको थोड़ा बहुत क्लीन करते हैं जो रा है जो मीनिंगफुल डाटा नहीं है जो बिल्कुल खत्म है उसको वहां से निकलते हैं वही चीज यहां पे ए जाति है डाटा को प्रोसेस करना और साथ ही साथ जैसे डाटा वेयरहाउस है उसका अपना एक मॉडल है उसमें अलग-अलग जो है वो जैसे स्ट्रक्चर डाटा है तो उसके लिए आरडीबीएमएस के टूल्स उसे किया जाते हैं स्टार और स्नो फ्लिक्स की मैं उसके लिए माइक्रोसॉफ्ट का विजुअल सॉफ्टवेयर है वो उसे किया जाता है सैफ सर्विसेज को उसे किया जाता है ताकि डाटा को प्रॉपर जगह पे रखा जा सके इस के फॉर्मेट में वो इस के फॉर्मेट में डाटा को रख दिया अब उसके बाद जब डाटा मेरे पास यहां पे कलेक्ट हो गया सर कुछ हो गया है उसके बाद उसे डाटा को उसे करना है और उसे डाटा को उसे करने का मतलब क्या है उसे डाटा में से मीनिंगफुल चीज निकालनी है ताकि कंपनी जो है वो अपने बिजनेस को बढ़ाने में बिजनेस इंटेलिजेंस में एनालिटिक्स में उन चीजों को उसे कर सके और उसके लिए जो है वो डाटा को मीन किया जाता है बाय यूजिंग डिफरेंट जैसे पाइथन है आर प्रोग्रामिंग है बहुत सारे टूल्स अवेलेबल है मार्केट में और विजुलाइजर करना है डाटा को तो विजुलाइजर रिपोर्ट्स अगर अच्छे से बनानी है तो जैसे टेबल्स सॉफ्टवेयर है उसके थ्रू हम लोग बना सकते हैं पावर भी है ये माइक्रोसॉफ्ट का उसके थ्रू बना सकते हैं ताकि बिजनेस में ग्रोथ मिल सके डिजीज लिए जा सके कंपनी डिसीजन जो है वो किसी ना किसी बेसिस पे लेती है वो डाटा और उसे डाटा को पहले मीन किया जाता है लेकिन मीन कब करोगे जब आपके पास डाटा ही नहीं है तो डाटा को पहले रखना पड़ता है अब जो बड़ी-बड़ी कंपनी है जैसे माइक्रोसॉफ्ट है गूगल है अमेजॉन है ये कंपनी से क्या करती है अपना फिजिकल स्टोरेज पूरा बनती है जहां पे डाटा को है लेकिन अगर छोटी कंपनी की बात करें तो उनके पास जो है वो इतने बड़े पूरे वेयर हाउस को बनाने का क्योंकि ये इतनी बड़ी बिल्डिंग बनानी है उसमें अलग-अलग टूल्स को रखना जिसे राउटर जाए स्विचस हार्ड डिस्क वगैरा उन सबको रखना भी तो अपने आप में बड़ा मेजर चैलेंज है और फिर उसमें टेंपरेचर को कंट्रोल करना ह्यूमिडिटी ये साड़ी चीज तो वो कहानी ना कहानी छोटे कंपनी क्या है फिर क्लाउड सर्विसेज को उसे कर लेती हैं तो वो भी जैसे गूगल का बिग क्वेरी है तो अलग-अलग जो है वो सॉफ्टवेयर्स को उसे करके भी किया जा सकता है तो ये इंट्रोडक्शन है डाटा वेयरहाउस की अब एटीएम हो गया या कैसे महीने की जाति है कैसे डाटा को मॉडल किया जाता है कैसे हम डिजाइन करते हैं एक डाटा वेयरहाउस को ये साड़ी चीज हम एक-एक करके डिटेल में पढ़ेंगे सो दिस इस जो अबाउट डी इंट्रोडक्शन तू डाटा वेयरहाउस थैंक यू