Conectar-se a fontes de dados do Azure Databricks
Este artigo fornece links para todas as diferentes fontes de dados no Azure que podem ser conectadas ao Azure Databricks. Siga os exemplos nestes links para extrair dados das fontes de dados do Azure (por exemplo, Armazenamento de Blobs do Azure, Hubs de Eventos do Azure, etc.) em um cluster do Azure Databricks e executar trabalhos analíticos neles.
Pré-requisitos
- Você deve ter um espaço de trabalho do Azure Databricks e um cluster do Spark. Siga as instruções em Começar.
Fontes de dados para o Azure Databricks
A lista a seguir fornece as fontes de dados no Azure que você pode usar com o Azure Databricks. Para obter uma lista completa de fontes de dados que podem ser usadas com o Azure Databricks, consulte Fontes de dados para o Azure Databricks.
-
Este link fornece a API DataFrame para conexão com bancos de dados SQL usando JDBC e como controlar o paralelismo de leituras através da interface JDBC. Este tópico fornece exemplos detalhados usando a API Scala, com exemplos abreviados de Python e Spark SQL no final.
-
Este link fornece exemplos sobre como usar a entidade de serviço Microsoft Entra ID (anteriormente Azure Ative Directory) para autenticar com o Armazenamento Azure Data Lake. Ele também fornece instruções sobre como acessar os dados no Armazenamento do Azure Data Lake a partir do Azure Databricks.
Armazenamento de Blobs do Azure
Este link fornece exemplos sobre como acessar diretamente o Armazenamento de Blobs do Azure a partir do Azure Databricks usando a chave de acesso ou o SAS para um determinado contêiner. O link também fornece informações sobre como acessar o Armazenamento de Blob do Azure a partir do Azure Databricks usando a API RDD.
-
Este link fornece instruções sobre como usar o conector Spark dos Hubs de Eventos do Azure do Azure Databricks para acessar dados nos Hubs de Eventos do Azure.
-
Este link fornece instruções sobre como consultar dados no Azure Synapse.
Próximos passos
Para saber mais sobre fontes de onde você pode importar dados para o Azure Databricks, consulte Fontes de dados para o Azure Databricks.