Identyfikowanie usług danych

Ukończone

Microsoft Azure to platforma w chmurze, która obsługuje aplikacje i infrastrukturę IT dla niektórych największych organizacji na świecie. Obejmuje wiele usług obsługujących rozwiązania w chmurze, w tym obciążenia danych transakcyjnych i analitycznych.

Poniżej opisano niektóre z najczęściej używanych usług w chmurze dla danych.

Uwaga

W tym temacie omówiono tylko niektóre z najczęściej używanych usług danych dla nowoczesnych rozwiązań transakcyjnych i analitycznych. Dostępne są również dodatkowe usługi.

Azure SQL

Azure SQL logoAzure SQL jest zbiorczą nazwą rodziny rozwiązań relacyjnych baz danych na podstawie aparatu bazy danych Microsoft SQL Server. Określone usługi Azure SQL obejmują:

  • Azure SQL Database — w pełni zarządzana baza danych typu platforma jako usługa (PaaS) hostowana na platformie Azure
  • Azure SQL Managed Instance — hostowane wystąpienie SQL Server z automatyczną konserwacją, która umożliwia bardziej elastyczną konfigurację niż Azure SQL DB, ale z większą odpowiedzialnością administracyjną za właściciela.
  • Azure SQL maszynę wirtualną — maszynę wirtualną z instalacją SQL Server, umożliwiając maksymalną konfigurację z pełną odpowiedzialnością za zarządzanie.

Administratorzy baz danych zazwyczaj aprowizować systemy baz danych Azure SQL do obsługi aplikacji biznesowych ,które muszą przechowywać dane transakcyjne.

Inżynierowie danych mogą używać systemów baz danych Azure SQL jako źródeł dla potoków danych, które wykonują operacje wyodrębniania, przekształcania i ładowania (ETL) w celu pozyskiwania danych transakcyjnych do systemu analitycznego.

Analitycy danych mogą wysyłać zapytania do Azure SQL baz danych bezpośrednio w celu tworzenia raportów, choć w dużych organizacjach dane są zwykle łączone z danymi z innych źródeł w magazynie danych analitycznych w celu obsługi analizy przedsiębiorstwa.

Usługa Azure Database for open source relacyjnych baz danych

Azure Database for MariaDB, MySQL, and PostreSQL logos Platforma Azure obejmuje usługi zarządzane dla popularnych systemów relacyjnych baz danych typu open source, w tym:

  • Azure Database for MySQL — prosty system zarządzania bazami danych typu open source, który jest powszechnie używany w aplikacjach stosu Linux, Apache, MySQL i PHP (LAMP).

  • Azure Database for MariaDB — nowszy system zarządzania bazami danych utworzony przez oryginalnych deweloperów programu MySQL. Aparat bazy danych był od tego czasu poprawiany i optymalizowany w celu zwiększenia wydajności. Rozwiązanie MariaDB oferuje zgodność z rozwiązaniem Oracle Database (jest to inny popularny system zarządzania bazami danych).

  • Azure Database for PostgreSQL — hybrydowa relacyjna baza danych obiektów. Dane można przechowywać w tabelach relacyjnych, ale baza danych PostgreSQL umożliwia również przechowywanie niestandardowych typów danych z ich własnymi właściwościami nierelacyjnymi.

Podobnie jak w przypadku systemów baz danych Azure SQL, relacyjne bazy danych typu open source są zarządzane przez administratorów baz danych w celu obsługi aplikacji transakcyjnych i udostępniają źródło danych dla inżynierów danych tworzących potoki dla rozwiązań analitycznych i analityków danych tworzących raporty.

Azure Cosmos DB

Azure Cosmos DB logoUsługa Azure Cosmos DB to globalny system baz danych nierelacyjny (NoSQL), który obsługuje wiele interfejsów programowania aplikacji (API), umożliwiając przechowywanie danych i zarządzanie nimi jako dokumenty JSON, pary klucz-wartość, rodziny kolumn i grafy.

W niektórych organizacjach wystąpienia bazy danych Cosmos mogą być aprowizowane i zarządzane przez administratora bazy danych. Jednak często deweloperzy oprogramowania zarządzają magazynem danych NoSQL w ramach ogólnej architektury aplikacji. Inżynierowie danych często muszą zintegrować Cosmos źródła danych z rozwiązaniami analitycznymi przedsiębiorstwa, które obsługują modelowanie i raportowanie przez analityków danych.

Azure Storage

Azure Storage logoAzure Storage to podstawowa usługa platformy Azure, która umożliwia przechowywanie danych w:

  • Kontenery obiektów blob — skalowalny, ekonomiczny magazyn dla plików binarnych.
  • Udziały plików — sieciowe udziały plików, takie jak zwykle w sieciach firmowych.
  • Tabele — magazyn klucz-wartość dla aplikacji, które muszą szybko odczytywać i zapisywać wartości danych.

Inżynierowie danych używają usługi Azure Storage do hostowania magazynów typu data lake — blob Storage z hierarchiczną przestrzenią nazw, która umożliwia organizowanie plików w folderach w rozproszonym systemie plików.

Azure Data Factory

Azure Data Factory logoAzure Data Factory to usługa platformy Azure, która umożliwia definiowanie i planowanie potoków danych w celu transferu i przekształcania danych. Potoki można zintegrować z innymi usługami platformy Azure, umożliwiając pozyskiwanie danych z magazynów danych w chmurze, przetwarzanie danych przy użyciu zasobów obliczeniowych opartych na chmurze i utrwalanie wyników w innym magazynie danych.

Azure Data Factory jest używany przez inżynierów danych do tworzenia rozwiązań wyodrębniania, przekształcania i ładowania (ETL), które wypełniają analityczne magazyny danych danymi z systemów transakcyjnych w całej organizacji.

Azure Synapse Analytics

Azure Synapse Analytics logoAzure Synapse Analytics to kompleksowe, ujednolicone rozwiązanie do analizy danych, które zapewnia jeden interfejs usługi dla wielu możliwości analitycznych, w tym:

  • Pipelines — w oparciu o tę samą technologię co Azure Data Factory.
  • SQL — wysoce skalowalny aparat bazy danych SQL zoptymalizowany pod kątem obciążeń magazynu danych.
  • Apache Spark — rozproszony system przetwarzania danych typu open source, który obsługuje wiele języków programowania i interfejsów API, w tym Java, Scala, Python i SQL.
  • Azure Synapse Data Explorer — rozwiązanie do analizy danych o wysokiej wydajności zoptymalizowane pod kątem wykonywania zapytań dotyczących dzienników i danych telemetrycznych w czasie rzeczywistym przy użyciu język zapytań Kusto (KQL).

Inżynierowie danych mogą używać usługi Azure Synapse Analytics do tworzenia ujednoliconego rozwiązania do analizy danych, które łączy potoki pozyskiwania danych, magazyn danych i magazyn data lake storage za pomocą jednej usługi.

Analitycy danych mogą używać pul SQL i Spark za pośrednictwem interaktywnych notesów do eksplorowania i analizowania danych oraz korzystać z integracji z usługami, takimi jak Azure Machine Learning i Microsoft Power BI, aby tworzyć modele danych i wyodrębniać szczegółowe informacje z danych.

Azure Databricks

Azure Databricks logoAzure Databricks to zintegrowana z platformą Azure wersja popularnej platformy Databricks, która łączy platformę przetwarzania danych Apache Spark z semantykami bazy danych SQL i zintegrowanym interfejsem zarządzania umożliwiającym analizę danych na dużą skalę.

Inżynierowie danych mogą używać istniejących umiejętności Databricks i Spark do tworzenia analitycznych magazynów danych w usłudze Azure Databricks.

Analitycy danych mogą używać natywnej obsługi notesów w usłudze Azure Databricks do wykonywania zapytań i wizualizowania danych w łatwym w użyciu interfejsie internetowym.

Azure HDInsight

Azure HDInsight logo Azure HDInsight to usługa platformy Azure, która udostępnia klastry hostowane na platformie Azure dla popularnych technologii przetwarzania danych big data typu open source typu open source, w tym:

  • Apache Spark — rozproszony system przetwarzania danych obsługujący wiele języków programowania i interfejsów API, w tym Java, Scala, Python i SQL.
  • Apache Hadoop — rozproszony system, który używa zadań MapReduce do wydajnego przetwarzania dużych ilości danych w wielu węzłach klastra. zadania MapReduce można pisać w języku Java lub abstrakcjonować za pomocą interfejsów, takich jak Apache Hive — interfejs API oparty na SQL, który działa na platformie Hadoop.
  • Apache HBase — system typu open source do przechowywania i wykonywania zapytań dotyczących danych NoSQL na dużą skalę.
  • Apache Kafka — broker komunikatów do przetwarzania strumienia danych.
  • Apache Storm — system typu open source do przetwarzania danych w czasie rzeczywistym za pomocą topologii spouts i bolts.

Inżynierowie danych mogą używać usługi Azure HDInsight do obsługi obciążeń analizy danych big data, które zależą od wielu technologii typu open source.

Usługa Azure Stream Analytics

Azure Stream Analytics logo Azure Stream Analytics to aparat przetwarzania strumienia w czasie rzeczywistym, który przechwytuje strumień danych z danych wejściowych, stosuje zapytanie w celu wyodrębniania i manipulowania danymi ze strumienia wejściowego oraz zapisywania wyników w danych wyjściowych na potrzeby analizy lub dalszego przetwarzania.

Inżynierowie danych mogą włączyć usługę Azure Stream Analytics do architektur analizy danych, które przechwytują dane przesyłane strumieniowo do magazynu danych analitycznych lub wizualizacji w czasie rzeczywistym.

Azure Data Explorer

Azure Data Explorer logoAzure Data Explorer to autonomiczna usługa, która oferuje takie samo wydajne wykonywanie zapytań dotyczących dzienników i danych telemetrycznych, co środowisko uruchomieniowe Azure Synapse Data Explorer w usłudze Azure Synapse Analytics.

Analitycy danych mogą używać usługi Azure Data Explorer do wykonywania zapytań i analizowania danych zawierających atrybut znacznika czasu, na przykład zwykle znajduje się w plikach dziennika i danych telemetrycznych internetu rzeczy (IoT).

Microsoft Purview

Azure Purview logo Usługa Microsoft Purview oferuje rozwiązanie do zapewniania ładu i odnajdywania danych dla całego przedsiębiorstwa. Za pomocą usługi Microsoft Purview możesz utworzyć mapę danych i śledzić pochodzenie danych w wielu źródłach danych i systemach, co pozwala znaleźć wiarygodne dane do analizy i raportowania.

Inżynierowie danych mogą używać usługi Microsoft Purview do wymuszania ładu danych w całym przedsiębiorstwie i zapewnienia integralności danych używanych do obsługi obciążeń analitycznych.

Microsoft Power BI

Microsoft Power BI logoMicrosoft Power BI to platforma do modelowania danych analitycznych i raportowania, za pomocą której analitycy danych mogą tworzyć i udostępniać interaktywne wizualizacje danych. Power BI raporty można tworzyć przy użyciu aplikacji Power BI Desktop, a następnie publikować i dostarczać za pośrednictwem internetowych raportów i aplikacji w usługa Power BI, a także w aplikacji mobilnej Power BI.