Udostępnij za pośrednictwem


Zalecenia dotyczące optymalizowania kosztów danych

Dotyczy tego zalecenia z listy kontrolnej optymalizacji kosztów platformy Azure Well-Architected Framework:

CO:10 Optymalizowanie kosztów danych. Wydatki na dane z priorytetem danych. Optymalizacja danych powinna obejmować ulepszenia zarządzania danymi (warstwy i przechowywanie), wolumin, replikację, kopie zapasowe, formaty plików i rozwiązania magazynu.

W tym przewodniku opisano zalecenia dotyczące optymalizowania kosztów danych dla obciążenia. Optymalizacja kosztów danych polega na zminimalizowaniu wydatków związanych z magazynowaniem i zarządzaniem danymi zgodnie z ich istotnością i częstotliwością dostępu. Odpowiednie zarządzanie danymi może znacznie zmniejszyć koszty związane z obciążeniem i dostosować wydatki do narzędzia do zarządzania danymi. Zaniedbanie optymalizacji kosztów danych może prowadzić do zawyżonych wydatków, nieefektywnej alokacji zasobów i strat finansowych z powodu nieprawidłowo wyrównanych rozwiązań magazynu i niepotrzebnego przechowywania danych.

Definicje

Okres Definicja
Zarządzanie cyklem życia danych Proces zarządzania danymi w całym cyklu życia— od tworzenia do usunięcia. Ten proces obejmuje organizowanie, przechowywanie, ochronę i archiwizowanie danych na podstawie ich wartości i wzorców użycia.
Nadmiarowość danych Praktyka przechowywania zduplikowanych kopii danych w wielu systemach magazynowania lub lokalizacjach. Celem nadmiarowości danych jest zwiększenie dostępności danych i odporności na uszkodzenia.
Warstwy danych Strategia magazynowania obejmująca kategoryzowanie danych na podstawie częstotliwości dostępu i przechowywanie ich w odpowiednich warstwach magazynowania.
Zasady przechowywania Czas trwania przechowywania danych przed ich usunięciem. Określa okres, w którym dane muszą zostać zachowane w celu spełnienia wymagań prawnych, regulacyjnych lub biznesowych.

Kluczowe strategie projektowania

W ramach określonego obciążenia optymalizujesz koszty danych, zmniejszając koszty związane z przechowywaniem danych i zarządzaniem nimi. Istnieją różne strategie i najlepsze rozwiązania w celu zminimalizowania kosztów magazynowania i przetwarzania danych. Celem jest dopasowanie kosztów danych do priorytetu danych. Warstwy kosztów należy przypisać do typów danych na podstawie ich ważności lub częstotliwości dostępu.

Podstawowymi sterownikami kosztów danych obciążenia są częstotliwość dostępu, opóźnienie dostępu i ilość miejsca do magazynowania. Poniższe wskazówki zawierają strategie optymalizacji kosztów dla tych czynników kosztów.

Tworzenie spisu danych

Zanim będzie można zoptymalizować koszt danych, należy wygenerować spis danych. Sprawdź dostęp do danych i określ jego znaczenie w obciążeniu i jego operacjach. Zidentyfikuj, do których danych często uzyskuje się dostęp, i do których danych uzyskuje się rzadziej. Następujące akcje spisu mogą pomóc w efektywnym przydzielaniu zasobów magazynu:

  • Zbieranie informacji o dostępie do danych: Przeprowadzanie inspekcji danych w celu zidentyfikowania i wykazu wszystkich magazynów danych. Określ wartość zestawów danych na podstawie ich znaczenia dla operacji biznesowych, zwrotu z inwestycji i częstotliwości użytkowania. Zbierz dzienniki dostępu, metryki użycia lub analizę z rozwiązań magazynu danych.

  • Identyfikowanie typów danych: Kategoryzuj dane na podstawie ich typu, takich jak dane osobowe, dane finansowe, własność intelektualna lub dane operacyjne. Poznaj wrażliwość i ważność każdego typu danych.

  • Identyfikowanie wzorców dostępu: Identyfikowanie wzorców dostępu do danych, takich jak wzorce dziennego, tygodniowego lub miesięcznego użycia. Należy zrozumieć opóźnienia, rozmiary plików i wymagania dotyczące aktualności danych dla tych danych.

Określanie priorytetów danych

Priorytetyzacja danych to proces kategoryzowania i przypisywania poziomów ważności do typów danych na podstawie poufności i istotności. Priorytet danych powinien być zgodny z ważnością środowiska. Na przykład dane produkcyjne są ważniejsze niż dane przedprodukcyjne.

Oceń znaczenie różnych typów danych dla obciążenia, wykonując następujące kroki:

  1. Definiowanie poziomów priorytetu: Ustanów poziomy priorytetów dla danych (takich jak wysokie, średnie i niskie) na podstawie ich wartości dla organizacji, wymagań prawnych i potencjalnego wpływu utraty danych. Celem jest dopasowanie priorytetu danych do odpowiedniego rozwiązania danych.

  2. Przypisywanie etykiet: Etykietuj każdy zestaw danych z jego poufnością i ważnością. Etykiety można stosować na poziomie wiersza, kolumny lub pliku w zależności od struktury danych i użycia. W przypadku baz danych można użyć specjalnego narzędzia do etykietowania i powiązania poufności i ważności danych z określonymi wierszami i kolumnami. Takie podejście zapewnia szczegółową kontrolę nad zarządzaniem danymi i dostępem do danych.

Optymalizowanie zarządzania danymi

Zarządzanie danymi to proces przechowywania, przenoszenia i zabezpieczania danych obciążenia. Optymalizując zarządzanie danymi, można dostosować wydatki do priorytetu danych i uzyskać większą wartość na podstawie danych. Rozważ następujące strategie zarządzania danymi.

Optymalizowanie zarządzania cyklem życia danych

Ważne jest, aby zarządzać danymi w całym cyklu życia. Etapy cyklu życia obejmują tworzenie danych (lub pozyskiwanie), magazyn, użycie, udostępnianie, przechowywanie i usuwanie (usuwanie lub archiwizowanie). Celem zarządzania cyklem życia danych jest zoptymalizowanie rozwiązań do magazynowania danych przy zachowaniu zgodności z odpowiednimi przepisami i zasadami.

Magazyn danych ma trzy krytyczne składniki kosztów:

  • Koszt magazynu: koszt związany z przechowywaniem danych, takich jak za gigabajt.

  • Koszt transakcji: koszty związane z operacjami danych, takimi jak operacje zapisu, operacje odczytu i pobieranie danych (za gigabajt). Odczytywanie i zapisywanie danych może mieć różne koszty.

  • Koszt opóźnienia: koszt związany z szybkością lub opóźnieniem uzyskiwania dostępu do danych.

Poniżej przedstawiono podstawowe zagadnienia związane z zarządzaniem cyklem życia danych:

  • Użyj warstw danych: Celem obsługi warstw danych jest dostosowanie dostępu i przechowywania do najbardziej ekonomicznej warstwy magazynowania. Warstwy magazynowania wahają się od częstego/natychmiastowego dostępu (gorąca) do rzadkiego/opóźnionego dostępu (zimno).

    To kosztuje więcej, aby korzystać z warstwy, która nie jest zgodna z potrzebami dostępu do danych i przechowywania. Na przykład dane, do których aplikacja uzyskuje dostęp, często powinny znajdować się w magazynie w warstwie Gorąca. Dane, do których aplikacja uzyskuje dostęp rzadko, powinny znajdować się w zimnym magazynie. Efektywne zarządzanie tymi aspektami pomaga zapewnić wydajny magazyn danych.

  • Weź pod uwagę wymagania dotyczące zgodności: Implementowanie warstw danych wymaga starannego rozważenia wymagań dotyczących zgodności i zasad ładu danych. Zgodność i wymagania prawne często napędzają dostęp do danych i ich przechowywanie. Ustanów zasady przechowywania danych, aby zapewnić zgodność z wymaganiami prawnymi, regulacyjnymi i biznesowymi.

  • Definiowanie zasad cyklu życia danych. Zasady cyklu życia danych określają, kiedy i jak dane mają być przenoszone między warstwami magazynowania na podstawie wstępnie zdefiniowanych kryteriów. Te zasady zapewniają przechowywanie danych w odpowiedniej warstwie przez wymagany czas trwania. Na przykład zasady mogą określać, że dane muszą być przechowywane w warstwie Gorąca przez 30 dni, w warstwie Chłodna przez 90 dni i w warstwie Archiwum przez jeden rok. Ustaw okres przechowywania na podstawie czynników, takich jak wymagania prawne, przepisy branżowe lub zasady wewnętrzne.

  • Użyj automatyzacji: zasady przechowywania mogą wyzwalać przenoszenie danych między warstwami. Zasady należy zautomatyzować przy użyciu funkcji platformy przed utworzeniem dowolnego rozwiązania niestandardowego.

    Po wygaśnięciu okresu przechowywania dla określonej warstwy zasady mogą automatycznie przenieść dane do następnej niższej warstwy kosztów. Na przykład po zakończeniu okresu przechowywania dla warstwy Gorąca zasady mogą przenieść dane do warstwy Chłodna. Zasady zapewniają ciągłą optymalizację danych na podstawie wzorców dostępu i wymagań dotyczących kosztów.

Kompromis: Zarządzanie zasadami przechowywania danych wymaga ciągłego monitorowania i konserwacji. Może to powodować większe obciążenie dla procesów zarządzania danymi. Może to również mieć wpływ na koszty magazynowania. Dłuższe okresy przechowywania lub użycie wyższej warstwy magazynowania może zwiększyć koszty magazynowania.

Ryzyko: Słaba implementacja zarządzania cyklem życia danych może prowadzić do utraty danych lub ograniczonego dostępu do danych krytycznych. Należy mieć odpowiednie mechanizmy tworzenia kopii zapasowych i odzyskiwania, aby ograniczyć ryzyko utraty danych.

Optymalizowanie segmentacji danych

Optymalizacja segmentacji danych obejmuje strategiczne organizowanie danych w odrębne segmenty i konsolidowanie podobnych typów danych w celu wydajnego przydzielania zasobów magazynu. Umożliwia dostosowanie alokacji zasobów magazynu do priorytetu danych.

Aby efektywnie zoptymalizować segmentację danych, należy kategoryzować dane według typu i wzorca użycia. Następnie należy umieścić segmenty danych na najbardziej efektywnym rozwiązaniu w zależności od ich podobieństw operacyjnych i wymagań. Można na przykład umieścić dane, które wymagają magazynu o wysokiej wydajności na zasobach z krótszym czasem pobierania. Dane archiwalne używają niższego kosztu zasobu z wolniejszym czasem pobierania.

Takie podejście zapewnia, że dane wysokiego zapotrzebowania korzystają z szybszego magazynu w celu uzyskania optymalnej wydajności i mniejszego dostępu do danych korzystają z tańszego magazynu. Podobnie, gdy typy danych współużytkują wzorce użycia, należy grupować je razem na jednym zasobie, aby zmniejszyć obciążenie, uprościć zarządzanie i poprawić obsługę danych.

Minimalizuj transfer danych

Minimalizacja transferu danych odnosi się do zmniejszenia przenoszenia danych między sieciami w celu zmniejszenia kosztów transferu danych. Zmniejsza ilość danych, które obciążenie przenosi i obniża opłaty za użycie sieci. Aby zminimalizować transfer danych, rozważ następujące zalecenia:

  • Użyj odpowiedniej lokalizacji. umieść dane geograficznie bliżej swoich użytkowników. Zbliżenie danych zmniejsza podróże sieciowe, co przyspiesza dostęp i optymalizuje koszty.
  • Użyj buforowania. Rozważ zalety buforowania, aby zminimalizować transfer danych.
  • Użyj sieci dostarczania zawartości. Sieć dostarczania zawartości może przechowywać często odczytywane dane statyczne bliżej użytkowników. Zmniejsza ona ruch danych w sieci i pomaga odciążać użycie przepustowości.

Optymalizowanie zabezpieczeń i zgodności

Niektóre dane produkcyjne wymagają wyższych wymagań dotyczących zabezpieczeń i zgodności. Te środki mogą nakładać dodatkowe koszty związane z ochroną danych, szyfrowaniem, tworzeniem kopii zapasowych, przechowywaniem i inspekcją.

Należy upewnić się, że zmiany w rozwiązaniach do magazynowania danych są zgodne z tymi wymaganiami. Dane, które mają niższe wymagania dotyczące zabezpieczeń i zgodności, często stanowią okazję do optymalizacji kosztów.

Optymalizowanie woluminu danych

Znalezienie strategii zmniejszenia ilości przechowywanych danych może pomóc zmniejszyć koszty. Zmieniając dostępność danych i wdrażając następujące techniki, można skutecznie zoptymalizować ilość przechowywanych danych:

  • Przechwytywanie mniejszej ilości danych: przyjrzyj się bliżej przechwyceniom danych. Ustal, czy którykolwiek z tych elementów jest niepotrzebny dla Twoich celów. Zmodyfikuj proces, ustawienia lub konfiguracje, aby przechwycić tylko podstawowe dane.

  • Kompresja danych: kompresja oszczędza pieniądze, zmniejszając rozmiar danych. Jest to najbardziej skuteczne w scenariuszach typu write-once, read-never lub read-rzadko. Jest bardziej odpowiedni do chłodniejszego przechowywania.

    Kompromis: Kompresja i dekompresja danych zwiększają czas procesora CPU.

  • Usuń niepotrzebne dane: zaimplementuj zasady, aby usprawnić proces przechowywania odpowiednich informacji. Oceń okres przechowywania kopii zapasowych i migawek oraz usuń dane, których już nie potrzebujesz. Może być potrzebny proces, który prowadzi do ewentualnego usunięcia danych, takiego jak pierwsze archiwizowanie danych i włączanie okresu usuwania nietrwałego. Zawsze należy rozważyć możliwość odzyskiwania przed usunięciem danych.

  • Deduplikacja danych: zaimplementuj techniki deduplikacji danych w celu wyeliminowania nadmiarowych danych. Deduplikacja zmniejsza wymagania dotyczące magazynu, zapewniając przechowywanie tylko unikatowych bloków danych, dzięki czemu można zaoszczędzić koszty. Użyj algorytmów tworzenia skrótów i porównania fragmentów danych. Regularnie uruchamiaj procesy deduplikacji, aby zidentyfikować i wyeliminować zduplikowane dane.

  • Optymalizowanie zachowania użytkownika: w obciążeniach, które zbierają dane generowane przez użytkownika, edukują użytkowników o znaczeniu wydajnego przechowywania danych. Zachęcaj ich do regularnego przeglądania i usuwania niepotrzebnych plików i danych. Zaimplementuj limity przydziału magazynu lub modele cenowe, które zniechęcają do nadmiernego przechowywania danych.

Optymalizowanie replikacji danych

Replikacja danych obejmuje tworzenie wielu kopii danych i przechowywanie ich w innych lokalizacjach geograficznych lub strefach w celu uzyskania niezawodności. Replikacja gwarantuje, że jeśli jedna lokalizacja lub strefa wystąpi awaria lub awaria, nadal można uzyskać dostęp do danych z replikowanych kopii w innych lokalizacjach.

Ta nadmiarowość pomaga zwiększyć dostępność i odporność danych. Minimalizuje ryzyko utraty danych i przestojów.

Aby zoptymalizować replikację danych na potrzeby optymalizacji kosztów, należy wziąć pod uwagę następujące wytyczne:

  • Ocena wymagań dotyczących replikacji danych: oceń konkretne potrzeby obciążenia i określ wymagany poziom replikacji danych. Rozważ czynniki, takie jak krytyczne znaczenie danych, cele czasu odzyskiwania (RTO) i cele punktu odzyskiwania (RPO).

  • Wybierz odpowiednią strategię replikacji: wybierz technologię replikacji, która jest zgodna z celami optymalizacji kosztów. Należy wziąć pod uwagę wymagania umowy dotyczącej poziomu usług (SLA) dla obciążenia.

    Oceń opcje, takie jak replikacja synchroniczna, replikacja asynchroniczna lub kombinacja obu tych opcji. Należy podjąć decyzję dotyczącą czynników, takich jak wymagania dotyczące spójności danych i zagadnienia dotyczące przepustowości sieci. Oceń poziom dostępności, który jest potrzebny dla obciążenia, i oceń potrzebę strefowego i regionalnej nadmiarowości.

  • Optymalizowanie przepustowości sieci: minimalizuj użycie przepustowości sieci, implementując techniki kompresji i deduplikacji danych. Te techniki mogą zmniejszyć ilość danych przesyłanych podczas replikacji, co może obniżyć koszty.

  • Monitorowanie i optymalizowanie częstotliwości replikacji: regularne przeglądanie i dostosowywanie częstotliwości replikacji na podstawie zmieniających się potrzeb obciążenia. Precyzyjne dostrajanie częstotliwości replikacji może pomóc w optymalizacji kosztów dzięki zmniejszeniu niepotrzebnych obciążeń związanych z replikacją.

Optymalizowanie kopii zapasowych

Kopia zapasowa to okresowa migawka lub kopia danych, które można tworzyć i przechowywać oddzielnie od magazynu podstawowego. Jeśli wystąpi uszkodzenie danych, przypadkowe usunięcie lub awaria systemu, możesz użyć kopii zapasowych, aby przywrócić dane do poprzedniego stanu.

Poniżej przedstawiono kilka technik optymalizacji kopii zapasowych:

  • Klasyfikacja danych: klasyfikuj dane na podstawie jego znaczenia i priorytetyzacji kopii zapasowej. Klasyfikacja pomaga skoncentrować zasoby na kopii zapasowej danych krytycznych, jednocześnie minimalizując koszty tworzenia kopii zapasowych danych, które są mniej ważne.

  • Przyrostowe kopie zapasowe: Zamiast wykonywać pełne kopie zapasowe za każdym razem, rozważ zaimplementowanie przyrostowych kopii zapasowych. Przyrostowe kopie zapasowe przechwytują tylko zmiany wprowadzone od ostatniej kopii zapasowej, co może zmniejszyć wymagania dotyczące przepustowości magazynu i sieci.

    Kompromis: przyrostowe kopie zapasowe wymagają więcej kroków i czasu na przywrócenie danych. Należy najpierw przywrócić pełną kopię zapasową, a następnie zastosować każdą przyrostową kopię zapasową w sekwencji do momentu osiągnięcia żądanego punktu przywracania.

  • Kompresja kopii zapasowej: włącz kompresję podczas procesu tworzenia kopii zapasowej, aby zmniejszyć rozmiar plików kopii zapasowych. Skompresowane kopie zapasowe wymagają mniejszej ilości miejsca do magazynowania, dzięki czemu można zaoszczędzić koszty.

  • Warstwy magazynowania kopii zapasowych: oceń zasady przechowywania kopii zapasowych i rozważ przeniesienie starszych kopii zapasowych do warstw magazynowania o niższych kosztach, takich jak magazyn zimny lub magazyn archiwum. Przechowywanie rzadziej używanych kopii zapasowych w kosztowych opcjach magazynowania pomaga zoptymalizować koszty.

  • Okres przechowywania kopii zapasowych: przejrzyj i dostosuj okresy przechowywania kopii zapasowych na podstawie wymagań biznesowych i przepisów dotyczących zgodności. Utrzymywanie kopii zapasowych przez dłuższy czas może prowadzić do dodatkowych kosztów magazynowania.

  • Częstotliwość tworzenia kopii zapasowych: analizowanie częstotliwości tworzenia kopii zapasowych dla różnych typów danych. Dostosuj harmonogram tworzenia kopii zapasowych na podstawie częstotliwości zmian danych i znaczenia danych. Te rozwiązania pomagają wyeliminować niepotrzebne kopie zapasowe i zmniejszyć koszty magazynowania.

Optymalizowanie formatów plików

Formaty plików wpływają na optymalizację kosztów przez optymalizowanie wzorców we/wy danych wejściowych i wyjściowych oraz wzorców zapytań dotyczących danych. Niektóre formaty plików są obsługiwane w określonych scenariuszach. Dostosowanie formatu pliku do wymagań dotyczących obciążenia może poprawić wydajność obciążenia.

Poniżej przedstawiono zagadnienia dotyczące typowych formatów:

  • Avro: Format pliku Avro jest dobrym wyborem, gdy masz do czynienia z wzorcami we/wy z dużą ilością zapisu lub gdy wzorce zapytań wymagają pobrania wielu wierszy rekordów w całości. Procesy serializacji i deserializacji Avro są wydajne, dlatego są zgodne z magistralami komunikatów, takimi jak Kafka, tworząc serię zdarzeń i komunikatów w krótkim czasie.

  • Parquet and Optimized Row Columnar (ORC): Formaty plików Parquet i ORC excel w scenariuszach wzorców we/wy do odczytu lub gdy wzorce zapytań koncentrują się na określonych kolumnach rekordów.

    Oba formaty to magazyn kolumnowy, co oznacza, że dane są przechowywane według kolumny, a nie wiersz po wierszu. Magazyn kolumnowy umożliwia lepszą kompresję i wydajne operacje odczytu. Należy pobrać tylko wymagane kolumny, aby uniknąć niepotrzebnych operacji we/wy dla nieistotnych danych.

Optymalizowanie rozwiązań magazynu

Oceń i wybierz najbardziej odpowiednie metody magazynowania i systemy dla danych. Ten wysiłek może obejmować przełączanie baz danych przy użyciu różnych typów magazynu lub dodawanie mechanizmów buforowania. Łatwość zarządzania to kolejny czynnik, który należy wziąć pod uwagę podczas wybierania rozwiązania magazynu.

Dzięki dostosowaniu rozwiązań magazynu do konkretnych potrzeb i cech danych można osiągnąć lepszą efektywność kosztową, spełniając wymagania dotyczące wydajności i skalowalności. Istnieją koszty związane z przełączaniem baz danych lub zamiany usług, ale przechowywanie danych w niewłaściwym rozwiązaniu magazynu może kosztować dodatkowe pieniądze.

Oto kilka przypadków użycia:

  • Przełączanie baz danych: możesz rozważyć przejście do systemu bazy danych, który lepiej odpowiada Twoim potrzebom. Jeśli na przykład używasz relacyjnej bazy danych, możesz zapoznać się z opcją przejścia do bazy danych NoSQL, jeśli dane są bardziej zorientowane na dokument lub wymagają elastycznych schematów.

  • Przenoszenie z relacyjnej bazy danych do magazynu plików prostych: w niektórych przypadkach przechowywanie danych w plikach prostych zamiast tradycyjnej relacyjnej bazy danych może zapewnić korzyści, takie jak prostota i opłacalność. Proste pliki są dobrze odpowiednie dla niektórych typów danych, takich jak pliki dziennika lub dane, które nie wymagają złożonych zapytań. Można na przykład przechowywać obrazy binarne w bazie danych SQL, ale bardziej ekonomiczne jest przechowywanie ich w usłudze magazynu przeznaczonej specjalnie do obsługi danych binarnych.

  • Przenoszenie z infrastruktury jako usługi (IaaS) do platformy jako usługi (PaaS): rozwiązania bazy danych IaaS mogą być czasochłonne i intensywnie obciążające zasoby właściwości, które odwracają uwagę zespołu technicznego od podstawowych zadań. Wzrost ilości danych i wyzwania związane z ręcznym skalowaniem, tworzeniem kopii zapasowych i konserwacją infrastruktury może sprawić, że rozwiązanie PaaS będzie bardziej ekonomiczne i wydajne.

  • Dodawanie pamięci podręcznej: aby zmniejszyć użycie zasobów na głównym serwerze bazy danych, rozważ użycie rozwiązania pamięci podręcznej do buforowania złożonych wyników zapytań. Prawa do serwera bazy danych mogą pomóc w optymalizacji kosztów. W odpowiednich przypadkach użycia rozważ użycie czasu wygaśnięcia (TTL) z zapisanymi w pamięci podręcznej danymi, aby zmniejszyć potrzeby magazynu i zmniejszyć koszty.

  • Magazyny magazynu danych zoptymalizowane pod kątem zapytań i magazynu danych: magazyny zoptymalizowane pod kątem zapytań są przeznaczone do szybkiego pobierania i analizowania danych. Koncentrują się one na szybkim pozyskiwaniu i odczytywaniu danych, ale nie są to częste aktualizacje. Doskonale nadają się do obsługi danych szeregów czasowych i szybkiego dostępu do najnowszych danych, ale nie w przypadku ciężkich zadań transakcyjnych.

    Magazyny danych obsługują duże ilości danych elastycznych, zwłaszcza danych bez struktury lub częściowo ze strukturą. Chociaż magazyny magazynu danych mogą obsługiwać analizę, złożone zadania mogą wymagać wyspecjalizowanych baz danych. Najlepiej jest przechowywać wiele zmiennych danych, takich jak dzienniki lub zawartość wygenerowana przez użytkownika w scenariuszach, takich jak przypadki użycia NoSQL.

Ułatwienia platformy Azure

Tworzenie spisu danych: Microsoft Purview to rodzina rozwiązań do zapewniania ładu, ryzyka i zgodności danych, które mogą pomóc organizacji w zarządzaniu całym zasobem danych i zarządzaniu nimi. Rozwiązania Microsoft Purview zapewniają zintegrowane pokrycie i pomagają rozwiązać ostatnie wzrosty łączności użytkowników zdalnych, fragmentację danych w organizacjach oraz rozmycie tradycyjnych ról zarządzania IT.

Optymalizacja zarządzania danymi: usługa Azure Storage i Azure Data Lake Storage mają różne warstwy dostępu do danych. Oferują one również zasady zarządzania cyklem życia danych , które automatyzują warstwy danych i przechowywanie.

Możesz użyć zasad opartych na regułach, aby przenieść dane obiektów blob do odpowiednich warstw dostępu lub wygasnąć dane na koniec cyklu życia. Te zasady umożliwiają natychmiastowe przejście obiektów blob z chłodnych (lub zimnych) na gorącą, gdy są one dostępne, w celu zoptymalizowania pod kątem wydajności.

Optymalizacja kopii zapasowych: usługa Azure Backup zapewnia wiele możliwości usprawniania tworzenia kopii zapasowych. Oferuje ona funkcje, takie jak natywna kopia zapasowa bazy danych i tworzenie kopii zapasowych magazynu za pomocą migawek dysków. Obsługuje tworzenie kopii zapasowych maszyn wirtualnych, długoterminowe przechowywanie i zarządzanie kopiami zapasowymi.

Oto niektóre funkcje usługi:

  • Monitorowanie: Centrum kopii zapasowych można używać jako jednego okienka szkła do monitorowania zadań i spisu kopii zapasowych na co dzień. Centrum kopii zapasowych udostępnia interfejs do tworzenia kopii zapasowych raportów, które używają dzienników usługi Azure Monitor i skoroszytów platformy Azure.

  • Raporty: Raporty kopii zapasowych oferują następujące możliwości:

    • Przydzielanie i prognozowanie używanego magazynu w chmurze.
    • Przeprowadź inspekcję kopii zapasowych i przywracania.
    • Zidentyfikuj kluczowe trendy na różnych poziomach szczegółowości.
    • Uzyskaj wgląd i wgląd w możliwości optymalizacji kosztów dla kopii zapasowych.
  • Pojemność zarezerwowana: Azure Backup Pojemność zarezerwowana magazynu oferuje rabat na pojemność dla danych kopii zapasowych przechowywanych w warstwie Standardowa magazynu podczas zatwierdzania rezerwacji przez rok lub trzy lata. Rezerwacja zapewnia stałą ilość pojemności magazynu kopii zapasowych dla okresu rezerwacji.

  • Warstwa archiwum: można użyć Azure Backup do przechowywania danych kopii zapasowych, w tym danych kopii zapasowych długoterminowego (LTR), zgodnie z potrzebami przechowywania zdefiniowanymi przez reguły zgodności organizacji. W większości przypadków starsze dane kopii zapasowej są rzadko dostępne i są przechowywane tylko w celu zapewnienia zgodności. Azure Backup obsługuje tworzenie kopii zapasowych punktów LTR w warstwie archiwum, oprócz migawek i warstwy standardowej.

Optymalizacja rozwiązań magazynu: platforma Azure ma wiele rozwiązań magazynu. Oferują one różne funkcje i możliwości, które ułatwiają optymalizowanie kosztów na podstawie określonych wymagań. Platforma Azure ma wskazówki ułatwiające wybór odpowiedniego magazynu danych.

Aby wybrać najbardziej odpowiednie rozwiązanie magazynu i konfigurację, ważne jest, aby ocenić wzorce dostępu do danych, potrzeby przechowywania i wymagania dotyczące wydajności. Regularne monitorowanie i optymalizowanie użycia magazynu przy użyciu narzędzi, takich jak Usługa Azure Advisor, może pomóc w dalszej optymalizacji kosztów.

Lista kontrolna optymalizacji kosztów

Zapoznaj się z pełnym zestawem zaleceń.