Azure Data Lake Storage migreren van Gen1 naar Gen2 met behulp van Azure Portal

In dit artikel leest u hoe u de migratie vereenvoudigt met behulp van Azure Portal.

Notitie

Azure Data Lake Storage Gen1 is nu buiten gebruik gesteld. Bekijk hier de aankondiging van de buitengebruikstelling. Data Lake Storage Gen1-resources zijn niet meer toegankelijk. Als u speciale hulp nodig hebt, neem dan contact met ons op.

Hier volgt een video met meer informatie.

     Hoofdstukken:


  • 00.37 - Inleiding

  • 01:16 - Migratie voorbereiden

  • 07:15 - Migratie kopiëren

  • 17:40 - Migratie kopiëren versus voltooien

  • 19:43 - Migratie voltooien

  • 33:15 - Na migratie

Lees voordat u begint de algemene richtlijnen voor migratie van Gen1 naar Gen2 in Azure Data Lake Storage-migratierichtlijnen en -patronen.

Uw account komt mogelijk niet in aanmerking voor migratie op basis van portals op basis van bepaalde beperkingen. Wanneer de knop Gegevens migreren niet is ingeschakeld in Azure Portal voor uw Gen1-account, kunt u een ondersteuningsaanvraag indienen als u een ondersteuningsplan hebt. U kunt ook antwoorden krijgen van community-experts in Microsoft Q&A.

Notitie

Voor eenvoudiger lezen gebruikt dit artikel de term Gen1 om te verwijzen naar Azure Data Lake Storage Gen1 en de term Gen2 om te verwijzen naar Azure Data Lake Storage Gen2.

Stap 1: Een opslagaccount maken met Gen2-mogelijkheden

Azure Data Lake Storage Gen2 is geen toegewezen opslagaccount of servicetype. Het is een set mogelijkheden die u kunt verkrijgen door de hiërarchische naamruimtefunctie van een Azure-opslagaccount in te schakelen. Zie Een opslagaccount maken voor gebruik met Azure Data Lake Storage Gen2 als u een account wilt maken met Gen2.

Zorg ervoor dat u tijdens het maken van het account instellingen configureert met de volgende waarden.

Instelling Weergegeven als
Naam van opslagaccount Elke gewenste naam. Deze naam hoeft niet overeen te komen met de naam van uw Gen1-account en kan zich in elk abonnement van uw keuze bevinden.
Location Dezelfde regio die wordt gebruikt door het Data Lake Storage Gen1-account
Replicatie LRS of ZRS
Minimale TLS-versie 1.0
NFS v3 Uitgeschakeld
Hiërarchische naamruimte Ingeschakeld

Notitie

Met het migratieprogramma in Azure Portal worden accountinstellingen niet verplaatst. Nadat u het account hebt gemaakt, moet u daarom handmatig instellingen configureren, zoals versleuteling, netwerkfirewalls, gegevensbeveiliging.

Belangrijk

Zorg ervoor dat u een nieuw, nieuw opslagaccount gebruikt dat geen gebruiksgeschiedenis heeft. Migreer niet naar een eerder gebruikt account of gebruik een account waarin containers zijn verwijderd om het account leeg te maken.

Stap 2: Roltoewijzingen voor op rollen gebaseerd toegangsbeheer van Azure (Azure RBAC) controleren

Voor Gen2 moet u ervoor zorgen dat de rol Eigenaar van opslagblobgegevens is toegewezen aan uw Microsoft Entra-gebruikersidentiteit binnen het bereik van het opslagaccount, de bovenliggende resourcegroep of het abonnement.

Voor Gen1 moet u ervoor zorgen dat de rol Eigenaar is toegewezen aan uw Microsoft Entra-identiteit in het bereik van het Gen1-account, de bovenliggende resourcegroep of het abonnement.

Stap 3: Azure Data Lake Analytics-workloads migreren

Azure Data Lake Storage Gen2 biedt geen ondersteuning voor Azure Data Lake Analytics. Azure Data Lake Analytics wordt op 29 februari 2024 buiten gebruik gesteld . Als u azure Portal probeert te gebruiken om een Azure Data Lake Storage Gen1-account te migreren dat wordt gebruikt voor Azure Data Lake Analytics, is het mogelijk dat u uw Azure Data Lake Analytics-workloads onderbreekt. U moet eerst uw Azure Data Lake Analytics-workloads migreren naar Azure Synapse Analytics of een ander ondersteund rekenplatform voordat u uw Gen1-account migreert.

Zie Azure Data Lake Analytics beheren met behulp van Azure Portal voor meer informatie.

Stap 4: Het Gen1-account voorbereiden

Bestands- of mapnamen met alleen spaties of tabbladen, eindigend op een ., met een :, of met meerdere opeenvolgende slashes (//) zijn niet compatibel met Gen2. U moet de naam van deze bestanden of mappen wijzigen voordat u migreert.

Voor de betere prestaties kunt u overwegen om de migratie ten minste tien dagen na de laatste verwijderbewerking uit te stellen. In een Gen1-account worden verwijderde bestanden voorlopig verwijderde bestanden en de garbagecollection verwijdert ze pas definitief tot zeven dagen en duurt het enkele extra dagen om het opschonen te verwerken. De tijd die nodig is om op te ruimen, is afhankelijk van het aantal bestanden. Alle bestanden, inclusief voorlopig verwijderde bestanden, worden tijdens de migratie verwerkt. Als u wacht totdat de garbagecollection verwijderde bestanden definitief heeft verwijderd, kan de wachttijd worden verbeterd.

Stap 5: de migratie uitvoeren

Voordat u begint, bekijkt u de twee onderstaande migratieopties en beslist u of u alleen gegevens van Gen1 naar Gen2 wilt kopiëren (aanbevolen) of een volledige migratie wilt uitvoeren.

Optie 1: alleen gegevens kopiëren (aanbevolen). In deze optie worden gegevens gekopieerd van Gen1 naar Gen2. Terwijl de gegevens worden gekopieerd, wordt het Gen1-account alleen-lezen. Nadat de gegevens zijn gekopieerd, zijn zowel de Gen1- als Gen2-accounts toegankelijk. U moet de toepassingen en rekenworkloads echter bijwerken om het nieuwe Gen2-eindpunt te kunnen gebruiken.

Optie 2: Voer een volledige migratie uit. In deze optie worden gegevens gekopieerd van Gen1 naar Gen2. Nadat de gegevens zijn gekopieerd, wordt al het verkeer van het Gen1-account omgeleid naar het Gen2-account. Omgeleide aanvragen gebruiken de Gen1-compatibiliteitslaag om Gen1-API-aanroepen te vertalen naar Gen2-equivalenten. Tijdens de migratie wordt het Gen1-account alleen-lezen. Nadat de migratie is voltooid, is het Gen1-account niet toegankelijk.

Welke optie u ook kiest, nadat u hebt gemigreerd en geverifieerd dat al uw workloads werken zoals verwacht, kunt u het Gen1-account verwijderen.

Optie 1: Gegevens kopiëren van Gen1 naar Gen2

  1. Meld u aan bij Azure Portal om aan de slag te gaan.

  2. Zoek uw Data Lake Storage Gen1-account en geef het accountoverzicht weer.

  3. Selecteer de knop Gegevens migreren.

    Screenshot of the button to migrate.

  4. Selecteer Gegevens kopiëren naar een nieuw Gen2-account.

    Screenshot of the copy data option.

  5. Geef Microsoft toestemming om de gegevensmigratie uit te voeren door het selectievakje in te schakelen. Selecteer vervolgens de knop Toepassen .

    Screenshot of the checkbox to provide consent.

    Er wordt een voortgangsbalk weergegeven, samen met een substatusbericht. U kunt deze indicatoren gebruiken om de voortgang van de migratie te meten. Omdat de tijd die nodig is om elke taak te voltooien, varieert de voortgangsbalk niet met een consistente snelheid. De voortgangsbalk kan bijvoorbeeld snel naar 50 procent gaan, maar het duurt nog iets langer om de resterende 50 procent te voltooien.

    Screenshot of progress bar when migrating data.

    Belangrijk

    Terwijl uw gegevens worden gemigreerd, wordt uw Gen1-account alleen-lezen en is uw Gen2-account uitgeschakeld. Wanneer de migratie is voltooid, kunt u beide accounts lezen en schrijven.

    U kunt de migratie op elk gewenst moment stoppen door de knop Migratie stoppen te selecteren.

    Screenshot of the stop migration option.

Optie 2: Een volledige migratie uitvoeren

  1. Meld u aan bij Azure Portal om aan de slag te gaan.

  2. Zoek uw Data Lake Storage Gen1-account en geef het accountoverzicht weer.

  3. Selecteer de knop Gegevens migreren.

    Screenshot of the migrate button.

  4. Selecteer Migratie naar een nieuw Gen2-account voltooien.

    Screenshot of the complete migration option.

  5. Geef Microsoft toestemming om de gegevensmigratie uit te voeren door het selectievakje in te schakelen. Selecteer vervolgens de knop Toepassen .

    Screenshot of the consent checkbox.

    Er wordt een voortgangsbalk weergegeven, samen met een substatusbericht. U kunt deze indicatoren gebruiken om de voortgang van de migratie te meten. Omdat de tijd die nodig is om elke taak te voltooien, varieert de voortgangsbalk niet met een consistente snelheid. De voortgangsbalk kan bijvoorbeeld snel naar 50 procent gaan, maar het duurt nog iets langer om de resterende 50 procent te voltooien.

    Screenshot of progress bar when performing a complete migration.

    Belangrijk

    Terwijl uw gegevens worden gemigreerd, wordt uw Gen1-account alleen-lezen en is het gen2-account uitgeschakeld.

    Ook, terwijl de Gen1-URI wordt omgeleid, worden beide accounts uitgeschakeld.

    Wanneer de migratie is voltooid, wordt uw Gen1-account uitgeschakeld. De gegevens in uw Gen1-account zijn niet toegankelijk en worden na 30 dagen verwijderd. Uw Gen2-account is beschikbaar voor lees- en schrijfbewerkingen.

    U kunt de migratie op elk gewenst moment stoppen voordat de URI wordt omgeleid door de knop Migratie stoppen te selecteren.

    Screenshot of the migration stop button.

Stap 6: controleren of de migratie is voltooid

Als de migratie is voltooid, wordt er een container met de naam Gen1 gemaakt in het Gen2-account en worden alle gegevens van het Gen1-account gekopieerd naar deze nieuwe Gen1-container . Als u de gegevens wilt vinden op een pad dat op Gen1 bestond, moet u het voorvoegsel gen1/ toevoegen aan hetzelfde pad om deze te openen op Gen2. Een pad met de naam 'FolderRoot/FolderChild/FileName.csv' op Gen1 is bijvoorbeeld beschikbaar op 'gen1/FolderRoot/FolderChild/FileName.csv' op Gen2. Containernamen kunnen niet worden gewijzigd in Gen2, dus deze Gen1-container op Gen2 kan niet worden gewijzigd na de migratie. De gegevens kunnen echter indien nodig worden gekopieerd naar een nieuwe container in Gen2.

Als de migratie niet is voltooid, wordt er een bericht weergegeven waarin staat dat de migratie is vastgelopen vanwege incompatibiliteit. Als u hulp nodig hebt bij de volgende stap, neemt u contact op met Microsoft Ondersteuning. Dit bericht kan worden weergegeven als het gen2-account eerder is gebruikt of wanneer bestanden en mappen in het Gen1-account incompatibele naamconventies gebruiken.

Voordat u contact op neemt met de ondersteuning, moet u ervoor zorgen dat u een nieuw, nieuw opslagaccount gebruikt dat geen gebruiksgeschiedenis heeft. Vermijd migratie naar een eerder gebruikt account of een account waarin containers zijn verwijderd om het account leeg te maken. Zorg ervoor dat u in uw Gen1-account de naam van een bestand of mapnaam wijzigt die alleen spaties of tabbladen bevat, eindigt op een ., een :of meerdere slashes (//).

Stap 7: Workloads en toepassingen migreren

  1. Configureer services in uw workloads om naar uw Gen2-eindpunt te verwijzen. Zie Azure-services die ondersteuning bieden voor Azure Data Lake Storage Gen2 voor koppelingen naar artikelen waarmee u Azure Databricks, HDInsight en andere Azure-services kunt configureren voor het gebruik van Gen2.

  2. Toepassingen bijwerken voor het gebruik van Gen2-API's. Zie de volgende handleidingen:

    Omgeving Artikel
    Azure Storage Explorer Azure Storage Explorer gebruiken voor het beheren van mappen en bestanden in Azure Data Lake Storage Gen2
    .NET .NET gebruiken om mappen en bestanden te beheren in Azure Data Lake Storage Gen2
    Java Java gebruiken om mappen en bestanden te beheren in Azure Data Lake Storage Gen2
    Python Python gebruiken om mappen en bestanden te beheren in Azure Data Lake Storage Gen2
    JavaScript (node.js) JavaScript SDK gebruiken in Node.js voor het beheren van mappen en bestanden in Azure Data Lake Storage Gen2
    REST-API Azure Data Lake Store REST API
  3. Werk scripts bij voor het gebruik van Data Lake Storage Gen2 PowerShell-cmdlets en Azure CLI-opdrachten.

  4. Zoek naar URI-verwijzingen die de tekenreeks adl:// bevatten in codebestanden of in Databricks-notebooks, Apache Hive HQL-bestanden of een ander bestand dat wordt gebruikt als onderdeel van uw workloads. Vervang deze verwijzingen door de gen2-geformatteerde URI van uw nieuwe opslagaccount. Bijvoorbeeld: de Gen1-URI: adl://mydatalakestore.azuredatalakestore.net/mydirectory/myfile kan worden abfss://myfilesystem@mydatalakestore.dfs.core.windows.net/mydirectory/myfile.

Gen1-compatibiliteitslaag

Deze laag probeert tijdens de migratie toepassingscompatibiliteit tussen Gen1 en Gen2 te bieden, zodat toepassingen Gen1-API's kunnen blijven gebruiken om te communiceren met gegevens in het Gen2-account. Deze laag heeft beperkte functionaliteit en het wordt aangeraden om de workloads met testaccounts te valideren als u deze benadering gebruikt als onderdeel van de migratie. De compatibiliteitslaag wordt uitgevoerd op de server, dus er is niets te installeren.

Belangrijk

Microsoft raadt deze mogelijkheid niet aan als vervanging voor het migreren van uw workloads en toepassingen. Ondersteuning voor de Gen1-compatibiliteitslaag eindigt wanneer Gen1 buiten gebruik wordt gesteld op 29 februari 2024.

Als u het minste aantal problemen met de compatibiliteitslaag wilt tegenkomen, moet u ervoor zorgen dat uw Gen1-SDK's de volgende versies (of hoger) gebruiken.

Taal SDK-versie
.NET 2.3.9
Java 1.1.21
Python 0.0.51

De volgende functionaliteit wordt niet ondersteund in de compatibiliteitslaag.

  • ListStatus-API-optie voor ListBefore een vermelding.

  • ListStatus-API met meer dan 4000 bestanden zonder vervolgtoken.

  • Segmentcodering voor toevoegbewerkingen.

  • API-aanroepen die worden gebruikt https://management.azure.com/ als de Microsoft Entra-tokendoelgroep.

  • Bestands- of mapnamen met alleen spaties of tabbladen, eindigend op een ., met een :, of met meerdere opeenvolgende slashes (//).

Veelgestelde vragen

Hoe lang duurt de migratie?

Gegevens en metagegevens worden parallel gemigreerd. De totale tijd die nodig is om een migratie te voltooien, is gelijk aan de laatste van deze twee processen.

In de volgende tabel ziet u de geschatte snelheid van elke migratieverwerkingstaak.

Notitie

Deze schattingen van tijd zijn bij benadering en kunnen variëren. Het kopiëren van een groot aantal kleine bestanden kan bijvoorbeeld de prestaties vertragen.

Verwerkingstaak Snelheid
Gegevens kopiëren 9 TB per uur
Gegevensvalidatie 9 miljoen bestanden of mappen per uur
Metagegevens kopiëren 4 miljoen bestanden of mappen per uur
Verwerking van metagegevens 25 miljoen bestanden of mappen per uur
Aanvullende verwerking van metagegevens (optie voor het kopiëren van gegevens)1 50 miljoen bestanden of mappen per uur

1 De extra verwerkingstijd voor metagegevens is alleen van toepassing als u de optie Gegevens kopiëren naar een nieuw Gen2-account kiest. Deze verwerkingstijd is niet van toepassing als u de optie Volledige migratie naar een nieuw Gen2-account kiest.

Voorbeeld: Een grote hoeveelheid gegevens en metagegevens verwerken

In dit voorbeeld wordt uitgegaan van 300 TB aan gegevens en 200 miljoen gegevens- en metagegevensitems.

Opdracht Geraamde tijd
Gegevens kopiëren 300 TB / 9 TB = 33,33 uur
Gegevens valideren 200 miljoen / 9 miljoen = 22,22 uur
Totale tijd voor gegevensmigratie 33.33 + 22.2 = 55,55 uur
Metagegevens kopiëren 200 miljoen / 4 miljoen = 50 uur
Verwerking van metagegevens 200 miljoen / 25 miljoen = 8 uur
Aanvullende verwerking van metagegevens - optie voor het kopiëren van gegevens alleen 200 miljoen / 50 miljoen = 4 uur
Totale migratietijd voor metagegevens 50 + 8 + 4 = 62 uur
Totale tijd voor het uitvoeren van een alleen-gegevensmigratie 62 uur
Totale tijd voor het uitvoeren van een volledige migratie 62 - 4 = 58 uur
Voorbeeld: Een kleine hoeveelheid gegevens en metagegevens verwerken

In dit voorbeeld wordt ervan uitgegaan dat 2 TB aan gegevens en 56 duizend gegevens- en metagegevensitems.

Opdracht Geraamde tijd
Gegevens kopiëren (2 TB / 9 TB) * 60 minuten = 13,3 minuten
Gegevens valideren (56.000 / 9 miljoen) * 3.600 seconden = 22,4 seconden
Totale tijd voor gegevensmigratie 13,3 minuten + 22,4 seconden = ongeveer 14 minuten
Metagegevens kopiëren (56.000 / 4 miljoen) * 3.600 seconden = ongeveer 51 seconden
Verwerking van metagegevens 56.000/ 25 miljoen = 8 seconden
Aanvullende verwerking van metagegevens - optie voor het kopiëren van gegevens alleen (56.000 / 50 miljoen) * 3.600 seconden = 4 seconden
Totale migratietijd voor metagegevens 51 + 8 + 4 = 63 seconden
Totale tijd voor het uitvoeren van een alleen-gegevensmigratie 14 minuten
Totale tijd voor het uitvoeren van een volledige migratie 14 minuten - 4 seconden = 13 minuten en 56 seconden (ongeveer 14 minuten)

Hoeveel kost de gegevensmigratie?

Er zijn geen kosten verbonden aan het gebruik van het migratiehulpprogramma op basis van de portal, maar u wordt gefactureerd voor het gebruik van Azure Data Lake Gen1- en Gen2-services. Tijdens de gegevensmigratie wordt u gefactureerd voor de gegevensopslag en transacties van het Gen1-account.

Als u na de migratie de optie hebt gekozen waarmee alleen gegevens worden gekopieerd, wordt u gefactureerd voor de gegevensopslag en transacties voor zowel Azure Data Lake Gen1- als Gen2-accounts. Als u wilt voorkomen dat er kosten in rekening worden gebracht voor het Gen1-account, verwijdert u het Gen1-account nadat u uw toepassingen hebt bijgewerkt om naar Gen2 te verwijzen. Als u ervoor kiest om een volledige migratie uit te voeren, wordt u alleen gefactureerd voor de gegevensopslag en transacties van het Gen2-account.

Zorg ervoor dat al uw Azure Data Lake Analytics-accounts worden gemigreerd naar Azure Synapse Analytics of een ander ondersteund rekenplatform. Nadat Azure Data Lake Analytics-accounts zijn gemigreerd, probeert u de toestemming opnieuw. Als u het probleem verder ziet en u een ondersteuningsplan hebt, kunt u een ondersteuningsaanvraag indienen. U kunt ook antwoorden krijgen van community-experts in Microsoft Q&A.

Nadat de migratie is voltooid, kan ik teruggaan naar het gebruik van het Gen1-account?

Als u optie 1 hebt gebruikt : gegevens kopiëren van Gen1 naar Gen2 die hierboven worden vermeld, zijn zowel de Gen1- als Gen2-accounts beschikbaar voor lees- en schrijfbewerkingen na de migratie. Als u echter optie 2 hebt gebruikt : een volledige migratie uitvoeren, wordt teruggaan naar het Gen1-account niet ondersteund. Nadat de migratie is voltooid, zijn de gegevens in uw Gen1-account niet toegankelijk en worden ze na 30 dagen verwijderd. U kunt het Gen1-account blijven weergeven in Azure Portal en wanneer u klaar bent, kunt u het Gen1-account verwijderen.

Ik wil geografisch redundante opslag (GRS) inschakelen voor het Gen2-account. Hoe doe ik dat?

Zodra de migratie is voltooid, kunt u zowel in de opties Gegevens kopiëren als Volledige migratie doorgaan en de redundantieoptie wijzigen in GRS zolang u niet van plan bent de compatibiliteitslaag van de toepassing te gebruiken. De toepassingscompatibiliteit werkt niet voor accounts die gebruikmaken van GRS-redundantie.

Gen1 heeft geen containers en Gen2 heeft deze - wat moet ik verwachten?

Wanneer we de gegevens naar uw Gen2-account kopiëren, maken we automatisch een container met de naam 'Gen1'. In Gen2-containernamen kunnen de naam niet worden gewijzigd en kunnen gegevens na de migratie naar een nieuwe container in Gen2 worden gekopieerd, indien nodig.

Wat moet ik overwegen in termen van migratieprestaties?

Wanneer u de gegevens naar uw Gen2-account kopieert, zijn twee factoren die van invloed kunnen zijn op de prestaties het aantal bestanden en de hoeveelheid metagegevens die u hebt. Veel kleine bestanden kunnen bijvoorbeeld van invloed zijn op de prestaties van de migratie.

Worden WebHDFS-bestandssysteem-API's ondersteund voor gen2-accounts na de migratie?

WebHDFS-bestandssysteem-API's van Gen1 worden ondersteund op Gen2, maar met bepaalde afwijkingen, en alleen beperkte functionaliteit wordt ondersteund via de compatibiliteitslaag. Klanten moeten van plan zijn om gen2-specifieke API's te gebruiken voor betere prestaties en functies.

Wat gebeurt er met mijn Gen1-account na de buitengebruikstellingsdatum?

Het account is niet toegankelijk. U kunt het volgende niet:

  • Het account beheren

  • Toegang tot gegevens in het account

  • Service-updates ontvangen voor Gen1- of Gen1-API's, SDK's of clienthulpprogramma's

  • Online, telefonisch of per e-mail toegang krijgen tot de klantenondersteuning van Gen1

Zie De vereiste actie: overschakelen naar Azure Data Lake Storage Gen2 op 29 februari 2024.

Volgende stappen