Sdílet prostřednictvím


Vytvoření přihlašovacích údajů úložiště pro připojení ke Cloudflare R2

Tento článek popisuje, jak vytvořit přihlašovací údaje úložiště v katalogu Unity pro připojení ke Cloudflare R2. Za úložiště objektů Cloudflare R2 se neúčtují žádné poplatky za výchozí přenos dat. Replikace nebo migrace dat, která sdílíte do R2, umožňuje sdílet data napříč cloudy a oblastmi bez poplatků za výchozí přenos dat.

Poznámka:

Unity Catalog podporuje dvě možnosti cloudového úložiště pro Azure Databricks: kontejnery Azure Data Lake Storage Gen2 a kontejnery Cloudflare R2. Cloudflare R2 je určen především pro případy použití rozdílového sdílení, ve kterých se chcete vyhnout poplatkům za výchozí přenos dat poskytovatele cloudu. Azure Data Lake Storage Gen2 je vhodný pro většinu ostatních případů použití. Viz Monitorování a správa nákladů na výchozí přenos dat rozdílového sdílení (pro poskytovatele) a vytvoření přihlašovacích údajů úložiště pro připojení k Azure Data Lake Storage Gen2.

Pokud chcete jako umístění úložiště použít kontejner R2 pro data spravovaná katalogem Unity, musíte vytvořit přihlašovací údaje úložiště, které autorizuje přístup k kbelíku R2, a vytvořit externí umístění, které odkazuje na přihlašovací údaje úložiště a cestu kontejneru:

  • Přihlašovací údaje úložiště zapouzdřují dlouhodobé přihlašovací údaje cloudu, které poskytují přístup ke cloudovému úložišti.
  • Externí umístění obsahují odkaz na přihlašovací údaje úložiště a cestu cloudového úložiště.

Tento článek se zaměřuje na vytvoření přihlašovacích údajů úložiště.

Další informace najdete v tématu Správa přístupu ke cloudovému úložišti pomocí katalogu Unity.

Požadavky

  • Pracovní prostor Databricks povolený pro katalog Unity

  • Databricks Runtime 14.3 nebo novější nebo SQL Warehouse 2024.15 nebo vyšší

    Pokud se zobrazí chybová zpráva No FileSystem for scheme "r2”, je váš výpočetní výkon pravděpodobně na nepodporované verzi.

  • Účet Cloudflare. Viz třída https://dash.cloudflare.com/sign-up.

  • Role správce Cloudflare R2 Prohlédnou si dokumentaci k rolím Cloudflare.

  • CREATE STORAGE CREDENTIAL oprávnění k metastoru katalogu Unity připojenému k pracovnímu prostoru. Správci účtů a správci metastoru mají ve výchozím nastavení toto oprávnění.

Konfigurace kbelíku R2

  1. Vytvořte kontejner Cloudflare R2.

    Můžete použít řídicí panel Cloudflare nebo nástroj Cloudflare Wrangler.

    Podívejte se na dokumentaci Začínáme s Cloudflare R2 nebo dokumentaci wrangleru.

  2. Vytvořte token rozhraní API R2 a použijte ho v kontejneru.

    Viz dokumentace k ověřování rozhraní API Cloudflare R2.

    Nastavte následující vlastnosti tokenu:

    • Oprávnění: Čtení a zápis objektu

      Toto oprávnění uděluje přístup pro čtení a zápis, který se vyžaduje při použití úložiště R2 jako cíle replikace, jak je popsáno v tématu Použití replik Cloudflare R2 nebo migrace úložiště na R2.

      Pokud chcete vynutit přístup jen pro čtení z Azure Databricks do kontejneru R2, můžete místo toho vytvořit token, který uděluje přístup jen pro čtení. Může to ale být zbytečné, protože přihlašovací údaje úložiště můžete označit jako jen pro čtení a veškerý přístup k zápisu udělený tímto oprávněním bude ignorován.

    • (Volitelné) TTL: Doba, po kterou chcete data kontejneru sdílet s příjemci dat.

    • (Volitelné) Filtrování IP adres klienta: Vyberte, jestli chcete omezit síťový přístup na zadané IP adresy příjemce. Pokud je tato možnost povolená, musíte zadat IP adresy příjemců a musíte povolit IP adresu řídicí roviny Databricks pro oblast pracovního prostoru.

    Viz adresy řídicí roviny Azure Databricks.

  3. Zkopírujte hodnoty tokenu rozhraní API R2:

    • ID přístupového klíče
    • Tajný přístupový klíč

    Důležité

    Hodnoty tokenů se zobrazují pouze jednou.

  4. Na domovské stránce R2 přejděte na podrobnosti o účtu a zkopírujte ID účtu R2.

Vytvoření přihlašovacích údajů úložiště

  1. V Azure Databricks se přihlaste ke svému pracovnímu prostoru.

  2. Klikněte na Ikona katalogu Katalog.

  3. Na stránce Rychlý přístup klikněte na tlačítko Externí data>, přejděte na kartu Přihlašovací údaje a vyberte Vytvořit přihlašovací údaje.

  4. Vyberte přihlašovací údaje úložiště.

  5. Vyberte typ přihlašovacích údajů tokenu rozhraní API Cloudflare.

  6. Zadejte název přihlašovacích údajů a následující hodnoty, které jste zkopírovali při konfiguraci kontejneru R2:

    • ID účtu
    • ID přístupového klíče
    • Tajný přístupový klíč
  7. (Volitelné) Pokud chcete, aby uživatelé měli přístup jen pro čtení k externím umístěním, která používají toto přihlašovací údaje úložiště, vyberte v rozšířených možnostech možnost Jen pro čtení.

    Tuto možnost nevybírejte, pokud chcete použít přihlašovací údaje úložiště pro přístup k úložišti R2, které používáte jako cíl replikace, jak je popsáno v tématu Použití replik Cloudflare R2 nebo migrace úložiště na R2.

    Další informace najdete v tématu Označení přihlašovacích údajů úložiště jako jen pro čtení.

  8. Klikněte na Vytvořit.

  9. V dialogovém okně Vytvořené přihlašovací údaje úložiště zkopírujte externí ID.

  10. (Volitelné) Svázání přihlašovacích údajů úložiště s konkrétními pracovními prostory

    Ve výchozím nastavení může přihlašovací údaje úložiště používat libovolný privilegovaný uživatel v jakémkoli pracovním prostoru připojeném k metastoru. Pokud chcete povolit přístup jenom z konkrétních pracovních prostorů, přejděte na kartu Pracovní prostory a přiřaďte pracovní prostory. Viz (Volitelné) Přiřazení přihlašovacích údajů úložiště konkrétním pracovním prostorům.

Další krok: Vytvoření externího umístění

Viz Vytvoření externího umístění pro připojení cloudového úložiště k Azure Databricks.