Megosztás a következőn keresztül:


Tároló hitelesítő adatainak létrehozása a Cloudflare R2-hez való csatlakozáshoz

Ez a cikk azt ismerteti, hogyan hozhat létre tároló hitelesítő adatokat a Unity Katalógusban a Cloudflare R2-hez való csatlakozáshoz. A Cloudflare R2 objektumtároló nem jár kimenő költségekkel. Az R2-be megosztott adatok replikálása vagy migrálása lehetővé teszi az adatok felhők és régiók közötti megosztását anélkül, hogy kimenő díjakat vonnak maga után.

Feljegyzés

A Unity Catalog két felhőalapú tárolási lehetőséget támogat az Azure Databrickshez: az Azure Data Lake Storage Gen2-tárolókat és a Cloudflare R2-gyűjtőket. A Cloudflare R2 elsősorban deltamegosztási használati esetekre szolgál, amelyekben el szeretné kerülni a felhőszolgáltatók adatforgalom-díjainak használatát. Az Azure Data Lake Storage Gen2 a legtöbb más használati esethez megfelelő. Lásd: A Delta Sharing kimenő költségeinek monitorozása és kezelése (szolgáltatók esetén), valamint tároló hitelesítő adatainak létrehozása az Azure Data Lake Storage Gen2-hez való csatlakozáshoz.

Ha R2-gyűjtőt szeretne tárolóhelyként használni a Unity Catalog által kezelt adatokhoz, létre kell hoznia egy olyan tároló-hitelesítő adatot, amely engedélyezi az R2-gyűjtőhöz való hozzáférést, és létre kell hoznia egy külső helyet, amely a tároló hitelesítő adataira és a gyűjtő elérési útjára hivatkozik:

  • A tárolási hitelesítő adatok hosszú távú felhőalapú hitelesítő adatokat foglalnak magában, amely hozzáférést biztosít a felhőbeli tárolókhoz.
  • A külső helyek egy tárolási hitelesítő adatokra és egy felhőbeli tárolási útvonalra mutató hivatkozást tartalmaznak.

Ez a cikk a tároló hitelesítő adatainak létrehozását ismerteti.

További információ: Csatlakozás a felhőbeli objektumtárolóhoz a Unity Catalog használatával.

Követelmények

  • A Databricks-munkaterület engedélyezve van a Unity Cataloghoz.

  • Databricks Runtime 14.3 vagy újabb, vagy SQL Warehouse 2024.15 vagy újabb.

    Ha hibaüzenet No FileSystem for scheme "r2”jelenik meg, a számítás valószínűleg nem támogatott verzióban van.

  • Cloudflare-fiók. Lásd: https://dash.cloudflare.com/sign-up.

  • Cloudflare R2 rendszergazdai szerepkör. Tekintse meg a Cloudflare-szerepkörök dokumentációját.

  • CREATE STORAGE CREDENTIAL jogosultságot a munkaterülethez csatolt Unity Catalog metaadattárban. A fiókadminisztrátor és a metaadattár-rendszergazdák alapértelmezés szerint rendelkeznek ezzel a jogosultsággal.

R2-gyűjtő konfigurálása

  1. Hozzon létre egy Cloudflare R2-gyűjtőt.

    Használhatja a Cloudflare irányítópultot vagy a Cloudflare Wrangler eszközt.

    Tekintse meg a Cloudflare R2 "Első lépések" dokumentációját vagy a Wrangler dokumentációját.

  2. Hozzon létre egy R2 API-jogkivonatot, és alkalmazza azt a gyűjtőre.

    Tekintse meg a Cloudflare R2 API hitelesítési dokumentációját.

    Adja meg a következő tokentulajdonságokat:

    • Engedélyek: Objektum olvasása és írása.

      Ez az engedély olvasási és írási hozzáférést biztosít, amely akkor szükséges, ha az R2-tárolót replikációs célként használja, a Cloudflare R2-replikák használata vagy a tároló R2-re való migrálása során.

      Ha csak olvasási hozzáférést szeretne kikényszeríteni az Azure Databricksből az R2-gyűjtőbe, létrehozhat egy jogkivonatot, amely csak olvasási hozzáférést biztosít. Ez azonban szükségtelen lehet, mert a tároló hitelesítő adatait írásvédettként jelölheti meg, és az engedély által biztosított írási hozzáférések figyelmen kívül lesznek hagyva.

    • (Nem kötelező) TTL: A gyűjtőadatoknak az adat címzettekkel való megosztásának időtartama.

    • (Nem kötelező) Ügyfél IP-cím szűrése: Válassza ki, ha korlátozni szeretné a hálózati hozzáférést a megadott címzett IP-címekhez. Ha ez a beállítás engedélyezve van, meg kell adnia a címzettek IP-címét, és engedélyeznie kell a Databricks vezérlősík NAT IP-címét a munkaterület régiójában.

    Lásd az Azure Databricks vezérlősík-címeit.

  3. Másolja ki az R2 API-jogkivonat értékeit:

    • Hozzáférési kulcs azonosítója
    • Titkos hozzáférési kulcs

    Fontos

    A tokenértékek csak egyszer jelennek meg.

  4. Az R2 kezdőlapján nyissa meg a Fiók adatait , és másolja ki az R2-fiók azonosítóját.

A tároló hitelesítő adatainak létrehozása

  1. Az Azure Databricksben jelentkezzen be a munkaterületre.

  2. Kattintson a Katalógus gombra Katalógus ikon .

  3. A Katalógus panel tetején kattintson aHozzáadás vagy plusz ikon Hozzáadás ikonra, és válassza a Menüben a Tárterület-hitelesítő adatok hozzáadása lehetőséget.

    Ez a beállítás nem jelenik meg, ha nem rendelkezik jogosultsággal CREATE STORAGE CREDENTIAL .

    Másik lehetőségként a Gyorselérési lapon kattintson a Külső adatok > gombra, lépjen a Tároló hitelesítő adatai lapra , és válassza a Hitelesítő adatok létrehozása lehetőséget.

  4. Válassza ki a Cloudflare API-jogkivonat hitelesítő adattípusát.

  5. Adja meg a hitelesítő adatok nevét és a következő értékeket, amelyeket az R2-gyűjtő konfigurálásakor másolt:

    • Fiókazonosító
    • Hozzáférési kulcs azonosítója
    • Titkos hozzáférési kulcs
  6. (Nem kötelező) Ha azt szeretné, hogy a felhasználók csak olvasási hozzáféréssel rendelkezzenek a tároló hitelesítő adatait használó külső helyekhez, a Speciális beállításokban válassza a Csak olvasás lehetőséget.

    Ne válassza ezt a beállítást, ha a tároló hitelesítő adataival szeretné elérni a replikációs célként használt R2-tárolót a Cloudflare R2-replikák használata című cikkben leírtak szerint , vagy a tárterületet R2-re migrálni.

    További információ: Tároló hitelesítő adatainak megjelölése írásvédettként.

  7. Kattintson a Létrehozás gombra.

  8. A Tároló hitelesítő adatai párbeszédpanelen másolja ki a külső azonosítót.

  9. (Nem kötelező) A tároló hitelesítő adatainak kötése adott munkaterületekhez.

    Alapértelmezés szerint a tár hitelesítő adatait bármely kiemelt felhasználó használhatja a metaadattárhoz csatolt munkaterületeken. Ha csak bizonyos munkaterületekről szeretné engedélyezni a hozzáférést, lépjen a Munkaterületek lapra, és rendeljen hozzá munkaterületeket. Lásd : (Nem kötelező) Tároló hitelesítő adatainak hozzárendelése adott munkaterületekhez.

Következő lépés: a külső hely létrehozása

Lásd: Külső hely létrehozása a felhőbeli tároló Azure Databrickshez való csatlakoztatásához.