Compartilhar via


Azure Cosmos DB

Importante

Esta documentação foi desativada e pode não estar atualizada. Consulte o repositório github do conector do Spark do Cosmos DB oficial.

O Azure Cosmos DB é o banco de dados multimodelo da Microsoft distribuído globalmente. O Azure Cosmos DB permite que você dimensione a taxa de transferência e o armazenamento de maneira elástica e independente em qualquer número de regiões geográficas do Azure. Ele oferece garantias de taxa de transferência, disponibilidade, latência e consistência com contratos de nível de serviço (SLAs) abrangentes. O Azure Cosmos DB fornece APIs para os seguintes modelos de dados com SDKs disponíveis em vários idiomas:

  • API do SQL
  • API do MongoDB
  • API Cassandra
  • API do Graph (Gremlin)
  • API de Tabela

Este artigo explica como ler e gravar dados no Azure Cosmos DB usando o Azure Databricks. Para obter as informações mais atualizadas sobre o Azure Cosmos DB, consulte Acelere a análise de big data usando o conector do Apache Spark para o Azure Cosmos DB.

Recursos:

Importante

Este conector dá suporte à API (SQL) de núcleo do Azure Cosmos DB. Para o Cosmos DB para a API do MongoDB, use o conector do Spark do MongoDB. Para o API do Cassandra do Cosmos DB, use o Conector do Spark do Cassandra.

Criar e anexar as bibliotecas necessárias

  1. Baixe a biblioteca azure-cosmosdb-spark mais recente para a versão do Apache Spark que você está executando.
  2. Carregue os arquivos JAR baixados no Databricks. Consulte Bibliotecas.
  3. Instale as bibliotecas carregadas no cluster do Databricks.