Uaktualnianie usługi Azure Blob Storage za pomocą funkcji usługi Azure Data Lake Storage Gen2

Ten artykuł pomaga włączyć hierarchiczną przestrzeń nazw i odblokować funkcje, takie jak zabezpieczenia plików i na poziomie katalogu oraz szybsze operacje. Te możliwości są powszechnie używane przez obciążenia analizy danych big data i są określane zbiorczo jako usługa Azure Data Lake Storage Gen2.

Aby dowiedzieć się więcej o tych możliwościach i ocenić wpływ tego uaktualnienia na obciążenia, aplikacje, koszty, integracje usług, narzędzia, funkcje i dokumentację, zobacz Uaktualnianie usługi Azure Blob Storage przy użyciu funkcji usługi Azure Data Lake Storage Gen2.

Ważne

Uaktualnienie jest jednokierunkowe. Nie ma możliwości przywrócenia konta po wykonaniu uaktualnienia. Zalecamy zweryfikowanie uaktualnienia w środowisku nieprodukcyjnym.

Przygotowanie do uaktualnienia

Aby przygotować się do uaktualnienia konta magazynu do usługi Data Lake Storage Gen2:

Przegląd obsługi funkcji

Konto magazynu może być skonfigurowane do używania funkcji, które nie są jeszcze obsługiwane na kontach z obsługą usługi Data Lake Storage Gen2. Jeśli twoje konto korzysta z takich funkcji, uaktualnienie nie przejdzie przez krok weryfikacji. Zapoznaj się z artykułem Obsługa funkcji usługi Blob Storage w ramach kont usługi Azure Storage, aby zidentyfikować nieobsługiwane funkcje. Jeśli używasz takich funkcji na koncie, wyłącz je przed rozpoczęciem uaktualniania.

Następujące funkcje są obsługiwane w przypadku kont usługi Data Lake Storage Gen2, ale nie są obsługiwane przez proces uaktualniania:

  • Migawki obiektów blob
  • Zakresy szyfrowania
  • Niezmienny magazyn
  • Śledzenie czasu ostatniego dostępu do zarządzania cyklem życia
  • Usuwanie nietrwałe dla obiektów blob
  • Usuwanie nietrwałe dla kontenerów

Jeśli konto magazynu ma włączone takie funkcje, należy je wyłączyć przed wykonaniem uaktualnienia. Jeśli chcesz wznowić korzystanie z funkcji po zakończeniu uaktualniania, włącz je ponownie.

W niektórych przypadkach trzeba będzie poczekać na operacje czyszczenia po wyłączeniu funkcji przed uaktualnieniem. Przykładem jest funkcja usuwania nietrwałego obiektu blob. Należy wyłączyć usuwanie nietrwałe obiektów blob, a następnie zezwolić na wygaśnięcie wszystkich obiektów blob usuwania nietrwałego przed uaktualnieniem konta.

Ważne

Nie można uaktualnić konta magazynu do usługi Data Lake Storage Gen2, która kiedykolwiek miała włączoną funkcję zestawienia zmian. Po prostu wyłączenie zestawienia zmian nie umożliwi przeprowadzenia uaktualnienia. Zamiast tego musisz utworzyć konto z włączoną funkcją hierarchicznej przestrzeni nazw, a następnie przenieść dane na to konto.

Upewnij się, że segmenty każdej ścieżki obiektu blob mają nazwę

Proces migracji tworzy katalog dla każdego segmentu ścieżki obiektu blob. Katalogi usługi Data Lake Storage Gen2 muszą mieć nazwę, aby migracja zakończyła się pomyślnie, każdy segment ścieżki w katalogu wirtualnym musi mieć nazwę. To samo wymaganie dotyczy segmentów, które są nazwane tylko z znakiem spacji. Jeśli jakiekolwiek segmenty ścieżki są nienazwane (//) lub nazwane tylko z znakiem spacji (_), przed kontynuowaniem migracji należy skopiować te obiekty blob do nowej ścieżki zgodnej z tymi wymaganiami dotyczącymi nazewnictwa.

Zapobieganie aktywności zapisu na koncie magazynu

Uaktualnienie może zakończyć się niepowodzeniem, jeśli aplikacja zapisuje dane na koncie magazynu podczas uaktualniania. Aby zapobiec takiemu działaniu zapisu:

  1. Spoczynkuj wszystkie aplikacje lub usługi, które mogą wykonywać operacje zapisu.

  2. Zwalnianie lub przerywanie istniejących dzierżaw w kontenerach i obiektach blob na koncie magazynu.

Po zakończeniu uaktualniania przerwij utworzone dzierżawy, aby wznowić zezwalanie na dostęp do zapisu do kontenerów i obiektów blob.

Ostrzeżenie

Przerwanie aktywnej dzierżawy bez bezproblemowego wyłączania aplikacji lub maszyn wirtualnych, które obecnie uzyskują dostęp do tych zasobów, może mieć nieoczekiwane wyniki. Przed przerwaniem bieżących dzierżaw upewnij się, że wszystkie bieżące działania zapisu są w stanie spoczynku.

Wykonaj uaktualnianie

  1. Zaloguj się w witrynie Azure Portal, aby rozpocząć pracę.

  2. Znajdź konto magazynu i wyświetl omówienie konta.

  3. Wybierz pozycję Migracja usługi Data Lake Gen2.

    Zostanie wyświetlona strona Konfiguracja uaktualniania do konta usługi Storage przy użyciu usługi Azure Data Lake Gen2.

    Configuration page

  4. Rozwiń sekcję Krok 1. Przejrzyj zmiany konta przed uaktualnieniem , a następnie kliknij pozycję Przejrzyj i zaakceptuj zmiany.

  5. Na stronie Przeglądanie zmian konta zaznacz pole wyboru, a następnie kliknij przycisk Zgadzam się na zmiany.

  6. Rozwiń sekcję Krok 2. Zweryfikuj konto przed uaktualnieniem , a następnie kliknij przycisk Rozpocznij walidację.

    Jeśli walidacja nie powiedzie się, na stronie pojawi się błąd. W niektórych przypadkach zostanie wyświetlony link Wyświetl błędy . Jeśli pojawi się ten link, wybierz go.

    View errors link

    Następnie z menu kontekstowego pliku error.json wybierz pozycję Pobierz.

    Error json page

    Otwórz pobrany plik, aby określić, dlaczego konto nie przeszedło kroku weryfikacji. Poniższy kod JSON wskazuje, że na koncie jest włączona niezgodna funkcja. W takim przypadku należy wyłączyć tę funkcję, a następnie ponownie uruchomić proces weryfikacji.

    {
     "startTime": "2021-08-04T18:40:31.8465320Z",
     "id": "45c84a6d-6746-4142-8130-5ae9cfe013a0",
     "incompatibleFeatures": [
         "Blob Delete Retention Enabled"
     ],
     "blobValidationErrors": [],
     "scannedBlobCount": 0,
     "invalidBlobCount": 0,
     "endTime": "2021-08-04T18:40:34.9371480Z"
    }
    
  7. Po pomyślnym zweryfikowaniu konta rozwiń sekcję Krok 3: Uaktualnianie konta , a następnie kliknij przycisk Rozpocznij uaktualnianie.

    Ważne

    Operacje zapisu są wyłączone podczas uaktualniania konta. Operacje odczytu nie są wyłączone, ale zdecydowanie zalecamy wstrzymanie operacji odczytu, ponieważ mogą one zdestabilizować proces uaktualniania.

    Po pomyślnym zakończeniu migracji zostanie wyświetlony komunikat podobny do poniższego.

    Migration completed page

Zatrzymaj uaktualnianie

Przed zakończeniem migracji można zatrzymać migrację.

Aby zatrzymać uaktualnienie przed jego zakończeniem, wybierz pozycję Anuluj uaktualnienie , gdy uaktualnienie jest w toku.

Cancel upgrade

Migrowanie danych, obciążeń i aplikacji

  1. Skonfiguruj usługi w obciążeniach tak, aby wskazywały punkt końcowy usługi Blob Service lub punkt końcowy usługi Data Lake Storage .

    Account endpoints

  2. W przypadku obciążeń hadoop korzystających ze sterownika obiektów blob usługi Windows Azure Storage lub sterownika WASB należy zmodyfikować je tak, aby korzystały ze sterownika systemu plików obiektów blob platformy Azure (ABFS). W przeciwieństwie do sterownika WASB, który wysyła żądania do punktu końcowego usługi Blob Service , sterownik ABFS wysyła żądania do punktu końcowego usługi Data Lake Storage twojego konta.

  3. Przetestuj aplikacje niestandardowe, aby upewnić się, że działają zgodnie z oczekiwaniami przy użyciu uaktualnionego konta.

    Dostęp do wielu protokołów w usłudze Data Lake Storage umożliwia większości aplikacji dalsze korzystanie z interfejsów API obiektów blob bez modyfikacji. Jeśli wystąpią problemy lub chcesz użyć interfejsów API do pracy z operacjami katalogu i listami ACL, rozważ przeniesienie kodu do korzystania z interfejsów API usługi Data Lake Storage Gen2. Zobacz przewodniki dotyczące platform .NET, Java, Python, Node.js i REST.

  4. Przetestuj wszystkie skrypty niestandardowe, aby upewnić się, że działają zgodnie z oczekiwaniami przy użyciu uaktualnionego konta.

    Podobnie jak w przypadku interfejsów API obiektów blob, wiele skryptów prawdopodobnie będzie działać bez konieczności ich modyfikowania. Jednak w razie potrzeby można uaktualnić pliki skryptów, aby używać poleceń cmdlet programu PowerShell usługi Data Lake Storage Gen2 i poleceń interfejsu wiersza polecenia platformy Azure.

Zobacz też

Wprowadzenie do usługi Azure Data Lake Storage Gen2