Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
V tomto kurzu nakonfigurujete zrcadlenou databázi Fabric pomocí služby Google BigQuery.
Poznámka:
Tento příklad je specifický pro BigQuery, ale podrobný postup konfigurace zrcadlení pro další zdroje dat, jako je Azure SQL Database nebo Azure Cosmos DB. Další informace najdete v tématu Co je zrcadlení ve Frameworku?
Požadavky
- Vytvořte nebo použijte existující sklad BigQuery. Můžete se připojit k libovolné verzi instance BigQuery v libovolném cloudu, včetně Microsoft Azure.
- Potřebujete existující kapacitu Fabric. Pokud ne, spusťte zkušební verzi Fabric.
Požadavky na oprávnění
Potřebujete uživatelská oprávnění pro vaši databázi BigQuery, která obsahuje následující oprávnění:
bigquery.datasets.createbigquery.tables.listbigquery.tables.createbigquery.tables.exportbigquery.tables.getbigquery.tables.getDatabigquery.tables.updateDatabigquery.routines.getbigquery.routines.listbigquery.jobs.createstorage.buckets.createstorage.buckets.liststorage.objects.createstorage.objects.deletestorage.objects.listiam.serviceAccounts.signBlob
Tyto oprávnění by měly zahrnovat role BigQueryAdmin a StorageAdmin .
Uživatel musí mít přiřazenou alespoň jednu roli, která umožňuje přístup k instanci BigQuery. Zkontrolujte požadavky na síť pro přístup ke zdroji dat BigQuery. Pokud používáte zrcadlení v Google BigQuery pro místní bránu dat (OPDG), musíte mít OPDG verze 3000.286.6 nebo vyšší, aby zrcadlení fungovalo úspěšně.
Pokud chcete kontejnery vytvořit ručně (a tím se vyhnout potřebě udělit oprávnění storage.buckets.create), můžete:
- Přejděte do cloudového úložiště v rámci konzoly Google Console a vyberte kontejnery.
- Vyberte Vytvořit a pojmenujte kontejner v tomto formátu (rozlišují se malá a velká písmena): <projectid>_fabric_staging_bucket
- Ujistěte se, že umístění nebo oblast kontejneru jsou stejné jako projekt GCP, který plánujete zrcadlit.
- Vyberte Vytvořit. Systém zrcadlení automaticky rozpozná kbelík.
V závislosti na vašem případu použití může být vyžadováno více oprávnění. Minimální požadovaná oprávnění jsou určená pro práci s historií změn a zpracováním tabulek s různými velikostmi (tabulky větší než 10 GB). I když nepracujete s tabulkami většími než 10 GB, povolte všechna tato minimální oprávnění k úspěšnému využití zrcadlení.
Další informace o oprávněních najdete v dokumentaci Google BigQuery k požadovaným oprávněním pro streamovaná data, požadovaná oprávnění pro přístup k historii změn a požadovaná oprávnění pro zápis výsledků dotazu.
Důležité
Veškeré podrobné zabezpečení vytvořené ve zdrojovém skladu BigQuery musí být překonfigurováno v zrcadlené databázi v Microsoft Fabric. Další informace najdete v tématu Podrobná oprávnění SQL v Microsoft Fabric.
Vytvoření zrcadlené databáze
V této části vytvoříte novou zrcadlenou databázi ze zrcadlového zdroje dat BigQuery.
Můžete použít existující pracovní prostor (ne Pracovní prostor) nebo vytvořit nový pracovní prostor.
- V pracovním prostoru přejděte do centra Pro vytvoření .
- Po výběru pracovního prostoru, který chcete použít, vyberte Vytvořit.
- Vyberte kartu Replika Google BigQuery.
- Zadejte název nové databáze.
- Vyberte Vytvořit.
Připojení k instanci BigQuery v libovolném cloudu
Poznámka:
Možná budete muset změnit cloudovou bránu firewall, aby se zrcadlení mohlo připojit k instance BigQuery. Podporujeme mirrorování pro Google BigQuery u OPDG verzí 3000.286.6 nebo novějších. Podporujeme také virtuální síť.
V části Nové připojení vyberte BigQuery nebo vyberte existující připojení.
Pokud jste vybrali možnost Nové připojení, zadejte podrobnosti o připojení k databázi BigQuery.
Nastavení připojení Description E-mail účtu služby Pokud máte existující účet služby: E-mail účtu služby a váš stávající klíč najdete v konzole Google BigQuery tak, že přejdete na Účty služeb . Pokud ještě nemáte existující účet služby: Přejděte do části Účty služeb v konzole Google BigQuery a vyberte Vytvořit účet služby. Zadejte název účtu služby (ID účtu služby se automaticky vygeneruje na základě názvu vašeho vstupního účtu služby) a popis účtu služby. Vyberte Hotovo. Zkopírujte a vložte e-mail účtu služby do oddílu s určenými přihlašovacími údaji pro připojení v prostředcích Fabric. Obsah souboru s klíčem JSON účtu služby Na řídicím panelu Účty služby vyberte Akce pro nově vytvořený účet služby. Vyberte Správa klíčů. Pokud už máte klíč pro váš účet služby, stáhněte si jeho obsah souboru klíče JSON.
Pokud ještě nemáte klíč pro váš účet služby, vyberte Přidat klíč a Vytvořit nový klíč. Pak vyberte JSON. Soubor klíče JSON by se měl automaticky stáhnout. Zkopírujte a vložte klíč JSON do oddílu určených přihlašovacích údajů pro připojení na portálu Fabric.Připojení Vytvořte nové připojení. Název připojení Mělo by se vyplnit automaticky. Změňte ho na název, který chcete použít. V rozevíracím seznamu vyberte databázi.
Spusťte proces zrcadlení
Obrazovka Konfigurovat zrcadlení umožňuje ve výchozím nastavení zrcadlit všechna data v databázi.
Zrcadlení všech dat znamená, že se zrcadlí všechny nové tabulky vytvořené po spuštění zrcadlení.
Volitelně můžete zvolit pouze určité objekty, které se mají zrcadlit. Zakažte možnost Zrcadlit všechna data a pak vyberte jednotlivé tabulky z databáze.
V tomto příkladu použijeme možnost Zrcadlit všechna data .
Vyberte Zrcadlo databáze. Zrcadlení začíná.
Počkejte 2 až 5 minut. Pak vyberte Sledovat replikaci a zobrazte stav.
Po několika minutách by se stav měl změnit na Spuštěno, což znamená, že se tabulky synchronizují.
Pokud tabulky a odpovídající stav replikace nevidíte, počkejte několik sekund a aktualizujte panel.
Po dokončení počátečního kopírování tabulek se ve sloupci Poslední aktualizace zobrazí datum.
Teď, když jsou vaše data v provozu, jsou k dispozici různé analytické scénáře v celém systému Fabric.
Důležité
- Zrcadlení pro Google BigQuery má přibližně 15minutové zpoždění v odrazu změn. Jedná se o omezení možností Historie změn Google BigQuery.
- Veškeré podrobné zabezpečení vytvořené ve zdrojové databázi musí být překonfigurováno v zrcadlené databázi v Microsoft Fabric.
Monitorování zrcadlení prostředků infrastruktury
Po nakonfigurování zrcadlení budete přesměrováni na stránku Stav zrcadlení . Tady můžete monitorovat aktuální stav replikace.
Další informace a podrobnosti o stavech replikace naleznete v tématu Sledování replikace zrcadlené databáze v systému Fabric.
Důležité
Pokud ve zdrojových tabulkách v databázi BigQuery nejsou žádné aktualizace, modul replikátoru (modul, který využívá data změn pro Zrcadlení BigQuery), zpomalí a replikuje pouze tabulky každou hodinu. Nebuďte překvapeni, pokud data po počátečním načtení trvají déle, než se očekávalo, zejména pokud ve zdrojových tabulkách nemáte žádné nové aktualizace. Po snímku bude Mirror Engine čekat přibližně 15 minut před načtením změn; důvodem je omezení Google BigQuery, které způsobuje 10minutové zpoždění, aby se zobrazily všechny nové změny. Další informace o zpoždění odrazu změn BigQuery