Azure HDInsight में Apache Spark और Kafka के साथ उन्नत स्ट्रीमिंग डेटा रूपांतरण करें
मध्यवर्ती
Data Engineer
Data Scientist
Azure HDInsight
इस मॉड्यूल में, आप सीखते हैं कि Apache Kafka और Apache Spark के साथ Azure HDInsight का उपयोग करके क्लाउड पर रीयल-टाइम स्ट्रीमिंग डेटा एनालिटिक्स पाइपलाइन और एप्लिकेशन कैसे बनाएं।
प्रशिक्षण के उद्देश्य
इस मॉड्यूल के अंत में, आप समझते हैं:
- HDInsight के साथ Apache Spark and Kafka का उपयोग कब करें।
- स्पार्क संरचित स्ट्रीमिंग।
- एक काफ्का और स्पार्क समाधान की वास्तुकला।
- HDInsight का प्रावधान कैसे करें, एक काफ्का निर्माता बनाएं, और काफ्का डेटा को ज्यूपिटर नोटबुक में स्ट्रीम करें।
- द्वितीयक क्लस्टर के लिए डेटा को दोहराने के लिए कैसे करें।
पूर्वावश्यकताएँ
निम्नलिखित शर्त पूरी की जानी चाहिए:
- Azure पोर्टल में सफलतापूर्वक लॉग इन करें।
- Azure संग्रहण विकल्पों को समझें.
- Azure कंप्यूट विकल्पों को समझें.
- Azure पोर्टल में HDInsight क्लस्टर बनाएँ और कॉन्फ़िगर करें.