Migrálás az Apache Cassandra felügyelt Azure-példányára az Apache Spark használatával
Cikk
Ahol lehetséges, javasoljuk, hogy az Apache Cassandra natív replikációval migrálja az adatokat a meglévő fürtből az Apache Cassandra Felügyelt Azure-példányába egy hibrid fürt konfigurálásával. Ez a módszer az Apache Cassandra pletykaprotokolljával replikálja az adatokat a forrásadatközpontból az új felügyelt példány adatközpontjába. Előfordulhat azonban, hogy a forrásadatbázis verziója nem kompatibilis, vagy a hibrid fürt beállítása egyébként nem lehetséges.
Ez az oktatóanyag bemutatja, hogyan migrálhatja az adatokat az Apache Cassandra Felügyelt Azure-példányba offline módon a Cassandra Spark Connector és az Azure Databricks for Apache Spark használatával.
Győződjön meg arról, hogy már migrálta a keyspace/table sémát a forrás Cassandra-adatbázisból a cél Cassandra managed Instance-adatbázisba.
Azure Databricks-fürt kiépítése
Javasoljuk, hogy válassza a Databricks 7.5-ös verzióját, amely támogatja a Spark 3.0-t.
Függőségek hozzáadása
Adja hozzá az Apache Spark Cassandra Connector kódtárat a fürthöz, hogy natív és Azure Cosmos DB Cassandra-végpontokhoz is csatlakozzon. A fürtben válassza a Kódtárak>új maven telepítése>lehetőséget, majd adja hozzá com.datastax.spark:spark-cassandra-connector-assembly_2.12:3.0.0 a Maven koordinátáit.
Válassza a Telepítés lehetőséget, majd indítsa újra a fürtöt, amikor a telepítés befejeződött.
Megjegyzés
A Cassandra Connector-kódtár telepítése után indítsa újra a Databricks-fürtöt.
Scala-jegyzetfüzet létrehozása migráláshoz
Scala-jegyzetfüzet létrehozása a Databricksben. Cserélje le a forrás- és cél Cassandra-konfigurációkat a megfelelő hitelesítő adatokra, valamint a forrás- és célkulcsterekre és -táblákra. Ezután futtassa a következő kódot:
Demonstrate understanding of common data engineering tasks to implement and manage data engineering workloads on Microsoft Azure, using a number of Azure services.