Azure HDInsight में Apache Spark और Kafka के साथ उन्नत स्ट्रीमिंग डेटा रूपांतरण करें

मॉड्यूल
11 इकाइयाँ

मध्यवर्ती

Data Engineer

Data Scientist

Azure HDInsight

इस मॉड्यूल में, आप सीखते हैं कि Apache Kafka और Apache Spark के साथ Azure HDInsight का उपयोग करके क्लाउड पर रीयल-टाइम स्ट्रीमिंग डेटा एनालिटिक्स पाइपलाइन और एप्लिकेशन कैसे बनाएं।

प्रशिक्षण के उद्देश्य

इस मॉड्यूल के अंत में, आप समझते हैं:

HDInsight के साथ Apache Spark and Kafka का उपयोग कब करें।
स्पार्क संरचित स्ट्रीमिंग।
एक काफ्का और स्पार्क समाधान की वास्तुकला।
HDInsight का प्रावधान कैसे करें, एक काफ्का निर्माता बनाएं, और काफ्का डेटा को ज्यूपिटर नोटबुक में स्ट्रीम करें।
द्वितीयक क्लस्टर के लिए डेटा को दोहराने के लिए कैसे करें।

पूर्वावश्यकताएँ

निम्नलिखित शर्त पूरी की जानी चाहिए:

Azure पोर्टल में सफलतापूर्वक लॉग इन करें।
Azure संग्रहण विकल्पों को समझें.
Azure कंप्यूट विकल्पों को समझें.
Azure पोर्टल में HDInsight क्लस्टर बनाएँ और कॉन्फ़िगर करें.