Azure HDInsight में Apache Spark और Kafka के साथ उन्नत स्ट्रीमिंग डेटा रूपांतरण करें

मध्यवर्ती
Data Engineer
Data Scientist
Azure HDInsight

इस मॉड्यूल में, आप सीखते हैं कि Apache Kafka और Apache Spark के साथ Azure HDInsight का उपयोग करके क्लाउड पर रीयल-टाइम स्ट्रीमिंग डेटा एनालिटिक्स पाइपलाइन और एप्लिकेशन कैसे बनाएं।

प्रशिक्षण के उद्देश्य

इस मॉड्यूल के अंत में, आप समझते हैं:

  • HDInsight के साथ Apache Spark and Kafka का उपयोग कब करें।
  • स्पार्क संरचित स्ट्रीमिंग।
  • एक काफ्का और स्पार्क समाधान की वास्तुकला।
  • HDInsight का प्रावधान कैसे करें, एक काफ्का निर्माता बनाएं, और काफ्का डेटा को ज्यूपिटर नोटबुक में स्ट्रीम करें।
  • द्वितीयक क्लस्टर के लिए डेटा को दोहराने के लिए कैसे करें।

पूर्वावश्यकताएँ

निम्नलिखित शर्त पूरी की जानी चाहिए:

  • Azure पोर्टल में सफलतापूर्वक लॉग इन करें।
  • Azure संग्रहण विकल्पों को समझें.
  • Azure कंप्यूट विकल्पों को समझें.
  • Azure पोर्टल में HDInsight क्लस्टर बनाएँ और कॉन्फ़िगर करें.