Azure Cosmos DB
Azure Cosmos DB is de wereldwijd gedistribueerde database van Microsoft met meerdere modellen. Met Azure Cosmos DB kunt u doorvoer en opslag elastisch en onafhankelijk schalen in een willekeurig aantal geografische regio's van Azure. Het biedt garanties voor doorvoer, latentie, beschikbaarheid en consistentie met uitgebreide service level agreements (SLA's). Azure Cosmos DB biedt API's voor de volgende gegevensmodellen, met SDK's die beschikbaar zijn in meerdere talen:
- SQL-API
- MongoDB-API
- Cassandra-API
- Graph -API (Gremlin)
- Table-API
In dit artikel wordt uitgelegd hoe u gegevens kunt lezen uit en schrijven naar Azure Cosmos DB met behulp van Azure Databricks. Zie Analyse van big data versnellen met behulp van de Apache Spark naar Azure Cosmos DB-connector voor meer actuele informatie over Azure Cosmos DB.
Belangrijk
Deze connector ondersteunt de kern-API (SQL) van Azure Cosmos DB. Gebruik voor de Cosmos DB voor MongoDB-API de MongoDB Spark-connector. Gebruik voor de Cassandra-API van Cosmos DB de Cassandra Spark-connector.
Vereiste bibliotheken maken en koppelen
- Download de nieuwste azure-cosmosdb-spark-bibliotheek voor de versie van Apache Spark die u gebruikt.
- Upload de gedownloade JAR-bestanden naar Databricks volgens de instructies in Een Jar-, Python-ei- of Python-wiel uploaden.
- Installeer de geüploade bibliotheken in uw Databricks-cluster.
De Azure Cosmos DB Spark-connector gebruiken
Het volgende Scala-notebook biedt een eenvoudig voorbeeld van het schrijven van gegevens naar Cosmos DB en het lezen van gegevens uit Cosmos DB. Zie het Azure Cosmos DB Spark Connector-project voor gedetailleerde documentatie.