Identificar cargas de trabalho do Azure Databricks

3 minutos

O Azure Databricks oferece recursos para diversas cargas de trabalho, incluindo aprendizado de máquina e modelos de linguagem grande (LLM), Ciência de Dados, engenharia de dados, BI e armazenamento de dados e processamento de streaming.

Engenharia de Dados

O Azure Databricks fornece recursos para cientistas de dados e engenheiros que precisam colaborar em tarefas complexas de processamento de dados. Ele fornece um ambiente integrado com Apache Spark para processamento de big data em um data lakehouse e oferece suporte a várias linguagens, incluindo Python, R, Scala e SQL. A plataforma facilita a exploração, visualização e desenvolvimento de pipelines de dados.

Aprendizado de Máquina

O Azure Databricks dá suporte à criação, treinamento e implantação de modelos de machine learning em escala. Inclui MLflow, uma plataforma de código aberto para gerenciar o ciclo de vida de ML, incluindo experimentação, reprodutibilidade e implantação. Ele também oferece suporte a várias estruturas de ML, como TensorFlow, PyTorch e Scikit-learn, tornando-o versátil para diferentes tarefas de ML.

SQL

Os analistas de dados que interagem principalmente com dados por meio do SQL podem usar sql warehouses no Azure Databricks. A interface do usuário do Workspace do Azure Databricks fornece um editor de SQL familiar, dashboards e ferramentas de visualização automática para analisar e visualizar dados diretamente no Azure Databricks. Essa carga de trabalho é ideal para executar consultas ad hoc rápidas e criar relatórios a partir de grandes conjuntos de dados.

Observação

Os sql warehouses exigem a camada Premium.

Comentários

Esta página foi útil?