Možnosti pro získání dat do Fabric Lakehouse
Prostředí pro získání dat zahrnuje všechny uživatelské scénáře pro přenos dat do Lakehouse, jako jsou:
- Připojení k existující SQL Server a kopírování dat do tabulky Delta v lakehouse.
- Nahrávání souborů z počítače.
- Kopírování a slučování více tabulek z jiných alehouses do nové tabulky Delta
- Připojení ke zdroji streamování za účelem umístění dat v lakehouse
- Odkazování na data bez kopírování z jiných interních lakehouse nebo externích zdrojů
Důležité
Microsoft Fabric je v současné době ve verzi PREVIEW. Tyto informace se týkají předběžné verze produktu, který může být před vydáním podstatně změněn. Společnost Microsoft neposkytuje na zde uvedené informace žádné záruky, vyjádřené ani předpokládané.
Různé způsoby načítání dat v Lakehouse
V Microsoft Fabric existuje několik způsobů, jak můžete data do Lakehouse dostat:
- Nahrání souboru z místního počítače
- Spuštění nástroje pro kopírování v kanálech
- Nastavte tok dat.
- Knihovny Apache Sparku v kódu poznámkového bloku
Nahrání místního souboru
Můžete také nahrát data uložená na místním počítači. Můžete to udělat přímo v průzkumníkovi lakehouse.
Nástroj pro kopírování v kanálech
Nástroj kopírování je vysoce škálovatelné Integrace Dat řešení, které umožňuje připojit se k různým zdrojům dat a načíst data buď v původním formátu, nebo je převést na rozdílovou tabulku. Nástroj pro kopírování je součástí aktivit kanálů, které je možné orchestrovat různými způsoby, například plánováním nebo aktivací na základě události. Viz Jak kopírovat data pomocí aktivity kopírování.
Toky dat
Pro uživatele, kteří jsou obeznámeni s toky dat Power BI, je k dispozici stejný nástroj pro ukládání dat v Lakehouse. Můžete k němu rychle získat přístup z možnosti Získat data průzkumníka Lakehouse a získat data z více než 200 konektorů. Viz Vytvoření prvního toku dat pro získání a transformaci dat.
Kód poznámkového bloku
Pomocí dostupných knihoven Sparku se můžete připojit přímo ke zdroji dat, načíst data do datového rámce a pak je uložit do lakehouse. Je to nejotevřenější způsob načítání dat v Lakehouse, který uživatelský kód plně spravuje.
Poznámka
Externí rozdílové tabulky vytvořené pomocí kódu Sparku nebudou koncovému bodu SQL viditelné. Pomocí klávesových zkratek v tabulkovém prostoru můžete zviditelnit externí rozdílové tabulky pro koncový bod SQL.
Důležité informace o volbě přístupu k načítání dat
Případ použití | Doporučení |
---|---|
Nahrání malého souboru z místního počítače | Použití nahrání místního souboru |
Malá data nebo konkrétní konektor | Použití toků dat |
Velký zdroj dat | Použití nástroje kopírování v kanálech |
Komplexní transformace dat | Použití kódu poznámkového bloku |