Kiedy używać usługi Azure Data Factory

Ukończone

W tej lekcji omówimy sposób określania, czy usługa Azure Data Factory jest odpowiednim rozwiązaniem integracji danych dla Twojej organizacji. Ocenimy usługę Azure Data Factory pod kątem następujących kryteriów:

  • Wymagania dotyczące integracji danych
  • Zasoby kodowania
  • Obsługa wielu źródeł danych
  • Infrastruktura bezserwerowa

Kryteria decyzji

Aby określić, czy używać usługi Azure Data Factory, użyj kryteriów opisanych w poniższej tabeli.

Kryterium Analiza
Czy w ogóle potrzebujesz integracji danych? Jeśli Organizacja współpracuje z danymi big data lub jest tradycyjną organizacją magazynowania danych relacyjnych, być może interesuje Cię rozwiązanie integracji danych.
Czy potrzebne są zasoby kodowania? Nie wszyscy, którzy pracują z danymi, są doświadczeni w kodowaniu. Niektórzy mogą preferować pracę z narzędziami graficznymi, które udostępniają wizualizacje, aby ułatwić tworzenie zadań, które będą działać z danymi źródłowymi.
Czy musisz pracować z wieloma źródłami danych? Niektóre organizacje mogą mieć nieprzetworzone dane przechowywane w różnych systemach, zarówno w środowisku lokalnym, jak i w chmurze. Rozwiązanie do analizy danych musi mieć możliwość łatwego łączenia się z wieloma źródłami danych.
Czy można tworzyć i obsługiwać oddzielne składniki integracji danych oraz zarządzać nimi? Bez zarządzanej usługi do analizy danych przedsiębiorstwa muszą tworzyć niestandardowe składniki przenoszenia danych. Alternatywnie mogą tworzyć usługi niestandardowe w celu zintegrowania źródeł danych i przetwarzania. Integracja i konserwacja takich systemów może być kosztowna i trudna. Ponadto nie wszystkie takie systemy będą miały funkcje monitorowania, alertów i kontroli oferowanych przez w pełni zarządzaną usługę.

Stosowanie kryteriów

Zapoznaj się z poniższymi pytaniami podczas rozważania usługi Azure Data Factory jako rozwiązania do integracji danych.

Czy w ogóle potrzebujesz integracji danych?

Jeśli twoja organizacja jest mała i współpracuje z ograniczonymi źródłami danych, usługa integracji danych w ogóle nie jest wymagana. Jeśli jednak organizacja współpracuje z danymi big data lub jest tradycyjną organizacją magazynowania danych relacyjnych, możesz skorzystać z rozwiązania do integracji danych. Rozważ następujące punkty:

  • Organizacje danych big data korzystają z technologii do obsługi dużych ilości różnorodnych danych. W przypadku nich usługa Azure Data Factory umożliwia tworzenie i uruchamianie potoków w chmurze. Te potoki mogą uzyskiwać dostęp zarówno do usług danych w chmurze, jak i lokalnych. Te potoki zwykle współpracują z technologiami, takimi jak Azure Synapse Analytics, Azure Blobs, Azure Data Lake, Azure HDInsight, Azure Databricks i Azure Machine Edukacja.
  • Organizacje magazynowania danych relacyjnych zwykle korzystają z technologii, takich jak SQL Server. Usługa SSIS jest często używana do tworzenia pakietów usług SSIS. W przypadku takich organizacji usługa Azure Data Factory umożliwia uruchamianie pakietów usług SSIS na platformie Azure, umożliwiając im dostęp zarówno do usług danych w chmurze, jak i lokalnych.

Czy potrzebne są zasoby kodowania?

Jeśli twoja organizacja nie ma niezbędnych zasobów kodowania w celu utworzenia wymaganych działań, rozważ usługę Azure Data Factory. Usługa Azure Data Factory udostępnia niski proces kodu/bez kodu do pracy ze źródłami danych i powiązanymi działaniami. Na przykład narzędzie do tworzenia i monitorowania usługi Azure Data Factory umożliwia graficzne tworzenie potoków przez przeciąganie i upuszczanie działań na powierzchni projektowej. Poniższy zrzut ekranu przedstawia interfejs, w którym inżynier danych tworzy potok z kilkoma działaniami:

Screenshot that displays the Azure Data Factory authoring and monitoring tool.

Czy musisz pracować z wieloma źródłami danych?

Jeśli twoja organizacja wymaga dostępu do danych w wielu lokalizacjach i z wielu źródeł, należy rozważyć rozwiązanie integracji danych, które zapewnia tę obsługę. Usługa Azure Data Factory używa łączników do integracji z różnymi źródłami danych. Obecnie jest obsługiwanych ponad 90 źródeł danych. Ponadto usługa Azure Data Factory obsługuje rozszerzalne opcje dotarcia do dodatkowych źródeł danych.

Czy można tworzyć i obsługiwać oddzielne składniki integracji danych oraz zarządzać nimi?

Tworzenie własnego rozwiązania do integracji danych opartego na serwerze i zarządzanie nim może być niezwykle skomplikowane i czasochłonne. Jeśli korzystasz z takiego rozwiązania w centrum danych organizacji, nie musisz brać pod uwagę usługi Azure Data Factory. Istnieją jednak zalety korzystania z w pełni zarządzanego rozwiązania bezserwerowego na potrzeby integracji danych. Najważniejsze korzyści to:

  • Możliwość skalowania zgodnie z potrzebami w celu obsługi dodatkowych obciążeń.
  • Nie trzeba wdrażać, konfigurować i obsługiwać serwerów do hostowania obciążeń integracji danych.

Podsumowanie

Podsumowując, rozważ usługę Azure Data Factory, jeśli spełniasz co najmniej jedno z następujących kryteriów:

  • Inżynierowie danych nie mają czasu niezbędnego do utworzenia kodu w celu wykonywania zadań analizy danych.
  • Istnieje wiele źródeł danych w różnych lokalizacjach.
  • Chcesz skorzystać z w pełni zarządzanego rozwiązania opartego na chmurze.