Delen via


Azure Blob Storage upgraden met azure Data Lake Storage-mogelijkheden

Dit artikel helpt u bij het inschakelen van een hiërarchische naamruimte en het ontgrendelen van mogelijkheden zoals beveiliging op bestand- en mapniveau en snellere bewerkingen. Deze mogelijkheden worden veel gebruikt door workloads voor big data-analyses en worden gezamenlijk aangeduid als Azure Data Lake Storage.

Zie Azure Blob Storage upgraden met azure Data Lake Storage-mogelijkheden voor meer informatie over deze mogelijkheden en de impact van deze upgrade op workloads, toepassingen, kosten, serviceintegraties, hulpprogramma's, functies en documentatie.

Belangrijk

Een upgrade is definitief. U kunt uw account niet meer terugdraaien nadat u de upgrade hebt uitgevoerd. U wordt aangeraden uw upgrade in een niet-productieomgeving te valideren.

Upgrade voorbereiden

De upgrade van uw opslagaccount naar Data Lake Storage voorbereiden:

Ondersteuning voor functies controleren

Uw opslagaccount is mogelijk geconfigureerd voor het gebruik van functies die nog niet worden ondersteund in accounts met Data Lake Storage. Als uw account dergelijke functies gebruikt, wordt de validatiestap niet door de upgrade uitgevoerd. Raadpleeg het artikel over de ondersteuning van Blob Storage-functies in Azure Storage-accounts om niet-ondersteunde functies te identificeren. Als u dergelijke functies in uw account gebruikt, schakelt u deze uit voordat u begint met de upgrade.

De volgende functies worden ondersteund voor Data Lake Storage-accounts, maar worden niet ondersteund door het upgradeproces:

  • Blob-momentopnamen
  • Versleutelingsbereiken
  • Onveranderbare opslag
  • Laatste toegangstijd bijhouden voor levenscyclusbeheer
  • Blobs voorlopig verwijderen
  • Containers voorlopig verwijderen

Als dergelijke functies zijn ingeschakeld voor uw opslagaccount, moet u deze uitschakelen voordat u de upgrade uitvoert. Als u de functies wilt hervatten nadat de upgrade is voltooid, schakelt u deze opnieuw in.

In sommige gevallen moet u tijd voor opschoningsbewerkingen toestaan nadat een functie is uitgeschakeld voordat een upgrade wordt uitgevoerd. Een voorbeeld hiervan is de functie voor voorlopig verwijderen van blobs. U moet voorlopig verwijderen van blob uitschakelen en vervolgens toestaan dat alle blobs voor voorlopig verwijderen verlopen voordat u het account kunt upgraden.

Belangrijk

U kunt geen opslagaccount upgraden naar Data Lake Storage waarvoor de functie voor de wijzigingenfeed ooit is ingeschakeld. Als u de wijzigingenfeed uitschakelt, kunt u geen upgrade uitvoeren. In plaats daarvan moet u een account maken waarvoor de hiërarchische naamruimtefunctie is ingeschakeld en vervolgens uw gegevens overbrengen naar dat account.

Pagina-blobs verwijderen uit het opslagaccount

U kunt geen opslagaccount upgraden dat pagina-blobs bevat. Zorg ervoor dat u pagina-blobs verwijdert uit het opslagaccount voordat u de upgrade uitvoert.

Zorg ervoor dat de segmenten van elk blobpad de naam hebben

Het migratieproces maakt een map voor elk padsegment van een blob. Data Lake Storage-directory's moeten een naam hebben, zodat de migratie slaagt. Elk padsegment in een virtuele map moet een naam hebben. Dezelfde vereiste geldt voor segmenten die alleen worden genoemd met een spatieteken. Als padsegmenten niet-naamloos zijn (//) of alleen een naam hebben met een spatie (_), moet u deze blobs kopiëren naar een nieuw pad dat compatibel is met deze naamgevingsvereisten voordat u verdergaat met de migratie.

Schrijfactiviteit naar het opslagaccount voorkomen

De upgrade kan mislukken als een toepassing tijdens de upgrade naar het opslagaccount schrijft. Ga als volgende te werk om dergelijke schrijfactiviteit te voorkomen:

  1. Eventuele toepassingen of services die schrijfbewerkingen kunnen uitvoeren, stil te stellen.

  2. Bestaande leases voor containers en blobs vrijgeven of verbreken in het opslagaccount.

Nadat de upgrade is voltooid, verbreekt u de leases die u hebt gemaakt om schrijftoegang tot de containers en blobs toe te staan.

Waarschuwing

Het verbreken van een actieve lease zonder toepassingen of virtuele machines die momenteel toegang hebben tot deze resources, kan onverwachte resultaten opleveren. Zorg ervoor dat u alle huidige schrijfactiviteiten stilleggen voordat u eventuele huidige leases onderbreekt.

De upgrade uitvoeren

  1. Meld u aan bij Azure Portal om aan de slag te gaan.

  2. Zoek uw opslagaccount en geef het accountoverzicht weer.

  3. Selecteer Data Lake Gen2-migratie.

    De configuratiepagina voor de configuratie van de mogelijkheden van Azure Data Lake Gen2 naar een opslagaccount wordt weergegeven.

    Configuratiepagina

  4. Vouw stap 1 uit: Controleer de accountwijzigingen voordat u de sectie bijwerken en klik op Controleren en ga akkoord met wijzigingen.

  5. Schakel op de pagina Accountwijzigingen controleren het selectievakje in en klik vervolgens op Akkoord met wijzigingen.

  6. Vouw stap 2 uit: Valideer het account voordat u een upgrade uitvoert en klik vervolgens op Validatie starten.

    Als de validatie mislukt, wordt er een fout weergegeven op de pagina. In sommige gevallen wordt de koppeling Fouten weergeven weergegeven. Als deze koppeling wordt weergegeven, selecteert u deze.

    Koppeling fouten weergeven

    Selecteer Vervolgens downloaden in het contextmenu van het error.json-bestand.

    Fout json-pagina

    Open het gedownloade bestand om te bepalen waarom het account de validatiestap niet heeft doorstaan. De volgende JSON geeft aan dat een incompatibele functie is ingeschakeld voor het account. In dit geval schakelt u de functie uit en start u het validatieproces opnieuw.

    {
     "startTime": "2021-08-04T18:40:31.8465320Z",
     "id": "45c84a6d-6746-4142-8130-5ae9cfe013a0",
     "incompatibleFeatures": [
         "Blob Delete Retention Enabled"
     ],
     "blobValidationErrors": [],
     "scannedBlobCount": 0,
     "invalidBlobCount": 0,
     "endTime": "2021-08-04T18:40:34.9371480Z"
    }
    
  7. Nadat uw account is gevalideerd, vouwt u stap 3 uit: sectie Account upgraden en klikt u vervolgens op Upgrade starten.

    Belangrijk

    Schrijfbewerkingen worden uitgeschakeld terwijl uw account wordt bijgewerkt. Leesbewerkingen zijn niet uitgeschakeld, maar we raden u ten zeerste aan leesbewerkingen op te schorten, omdat ze het upgradeproces mogelijk stabiliseren.

    Wanneer de migratie is voltooid, wordt er een bericht weergegeven dat er ongeveer als volgt uitziet.

    Pagina Migratie voltooid

De upgrade stoppen

U kunt de migratie stoppen voordat deze is voltooid.

Als u de upgrade wilt stoppen voordat deze is voltooid, selecteert u Upgrade annuleren terwijl de upgrade wordt uitgevoerd.

Upgrade annuleren

Gegevens, workloads en toepassingen migreren

  1. Configureer services in uw workloads om te verwijzen naar het Eindpunt van de Blob-service of het Data Lake-opslageindpunt .

    Accounteindpunten

  2. Voor Hadoop-workloads die gebruikmaken van het Windows Azure Storage Blob-stuurprogramma of WASB-stuurprogramma , moet u deze wijzigen om het ABFS-stuurprogramma (Azure Blob File System) te gebruiken. In tegenstelling tot het WASB-stuurprogramma dat aanvragen indient naar het Blob-service-eindpunt , doet het ABFS-stuurprogramma aanvragen naar het Data Lake Storage-eindpunt van uw account.

  3. Test aangepaste toepassingen om ervoor te zorgen dat ze werken zoals verwacht met uw bijgewerkte account.

    Met toegang tot meerdere protocollen in Data Lake Storage kunnen de meeste toepassingen blob-API's blijven gebruiken zonder dat ze hoeven te worden gewijzigd. Als u problemen ondervindt of als u API's wilt gebruiken om te werken met directorybewerkingen en ACL's, kunt u een deel van uw code verplaatsen om Data Lake Storage-API's te gebruiken. Zie handleidingen voor .NET, Java, Python, Node.js en REST.

  4. Test aangepaste scripts om ervoor te zorgen dat ze werken zoals verwacht met uw bijgewerkte account.

    Net als bij Blob-API's werken veel van uw scripts waarschijnlijk zonder dat u ze hoeft te wijzigen. Indien nodig kunt u echter scriptbestanden upgraden om Data Lake Storage PowerShell-cmdlets en Azure CLI-opdrachten te gebruiken.

Zie ook

Inleiding tot Azure Data Lake Storage