Získání streamovaných dat do Lakehouse a přístup pomocí koncového bodu SQL
Tento rychlý start vysvětluje, jak vytvořit definici úlohy Sparku, která obsahuje kód Pythonu se strukturovaným streamováním Sparku pro umístění dat v lakehouse a jejich následné poskytování prostřednictvím koncového bodu SQL. Po dokončení tohoto rychlého startu budete mít definici úlohy Sparku, která běží nepřetržitě a koncový bod SQL může zobrazit příchozí data.
Důležité
Microsoft Fabric je ve verzi Preview.
Vytvoření skriptu Pythonu
K získání dat v tabulce Lakehouse použijte následující kód Pythonu, který používá strukturované streamování Sparku.
Uložte skript jako soubor Pythonu (.py) v místním počítači.
Vytvoření lakehouse
Pomocí následujícího postupu vytvořte lakehouse:
V Microsoft Fabric vyberte Datové Inženýrství prostředí Synapse.
Přejděte do požadovaného pracovního prostoru nebo v případě potřeby vytvořte nový.
Pokud chcete vytvořit lakehouse, vyberte ikonu Lakehouse v části Nový v hlavním podokně.
Zadejte název vašeho lakehouse a vyberte Vytvořit.
Vytvoření definice úlohy Sparku
Pomocí následujících kroků vytvořte definici úlohy Sparku:
Ve stejném pracovním prostoru, ve kterém jste vytvořili lakehouse, vyberte v nabídce vlevo ikonu Vytvořit .
V části "Datové Inženýrství" vyberte Definice úlohy Sparku.
Zadejte název definice úlohy Sparku a vyberte Vytvořit.
Vyberte Nahrát a vyberte soubor Pythonu, který jste vytvořili v předchozím kroku.
V části Odkaz na Lakehouse vyberte lakehouse, který jste vytvořili.
Nastavení zásad opakování pro definici úlohy Sparku
Pomocí následujícího postupu nastavte zásadu opakování pro definici úlohy Sparku:
V horní nabídce vyberte ikonu Nastavení .
Otevřete kartu Optimalizace a nastavte aktivační událost zásad opakovánína Zapnuto.
Definujte maximální počet opakovaných pokusů nebo zaškrtněte políčko Povolit neomezené pokusy.
Zadejte čas mezi každým opakovaným pokusem a vyberte Použít.
Spuštění a monitorování definice úlohy Sparku
V horní nabídce vyberte ikonu Spustit .
Ověřte, jestli se definice úlohy Sparku úspěšně odeslala a je spuštěná.
Zobrazení dat pomocí koncového bodu SQL
V zobrazení pracovního prostoru vyberte svůj Lakehouse.
V pravém rohu vyberte Lakehouse a vyberte Koncový bod SQL.
V zobrazení koncového bodu SQL v části Tabulky vyberte tabulku, kterou váš skript používá k získání dat. Potom můžete zobrazit náhled dat z koncového bodu SQL.