Kurz: Použití poznámkového bloku s Apache Sparkem k dotazování databáze KQL

Důležité

Microsoft Fabric je ve verzi Preview.

Poznámkové bloky jsou čitelné dokumenty obsahující popisy a výsledky analýzy dat i spustitelné dokumenty, které je možné spustit za účelem analýzy dat. V tomto článku se dozvíte, jak pomocí poznámkového bloku Microsoft Fabric číst a zapisovat data do databáze KQL pomocí Apache Sparku. Tento kurz používá předem připravené datové sady a poznámkové bloky ve službě Analýzy v reálném čase i v prostředích Datové Inženýrství v Microsoft Fabric. Další informace o poznámkových blocích najdete v tématu Jak používat poznámkové bloky Microsoft Fabric.

Konkrétně se naučíte:

  • Vytvoření databáze KQL
  • Import poznámkového bloku
  • Zápis dat do databáze KQL pomocí Apache Sparku
  • Dotazování dat z databáze KQL

Požadavky

1. Vytvoření databáze KQL

  1. Otevřete přepínač prostředí v dolní části navigačního podokna a vyberte Analýza v reálném čase.

  2. Vyberte dlaždici Databáze KQL (Preview).

    Snímek obrazovky s novou dlaždicí databáze KQL v Real-Time Analytics

  3. Do pole Název databáze KQL zadejte nycGreenTaxi a pak vyberte Vytvořit.

    Databáze KQL se teď vytvořila v kontextu vybraného pracovního prostoru.

  4. Zkopírujte identifikátor URI dotazu z karty podrobností databáze na řídicím panelu databáze a vložte ho někam, například do poznámkového bloku, abyste ho mohli použít v pozdějším kroku.

     Snímek obrazovky s kartou podrobností databáze, která zobrazuje podrobnosti databáze Možnost identifikátoru URI dotazu s názvem Copy URI je zvýrazněná.

2. Stažení poznámkového bloku GreenTaxi pro NYC

Vytvořili jsme ukázkový poznámkový blok, který vás provede všemi kroky potřebnými k načtení dat do databáze pomocí konektoru Spark.

  1. Otevřete úložiště ukázek prostředků infrastruktury na GitHubu a stáhněte si poznámkový blok NYC GreenTaxi KQL.

    Snímek obrazovky s úložištěm GitHub zobrazující poznámkový blok NYC GreenTaxi Možnost Raw je zvýrazněná.

  2. Uložte poznámkový blok místně do zařízení.

    Poznámka

    Poznámkový blok musí být uložený ve .ipynb formátu souboru.

3. Import poznámkového bloku

Zbytek tohoto pracovního postupu se vyskytuje v části Datové Inženýrství produktu a používá poznámkový blok Sparku k načtení a dotazování dat v databázi KQL.

  1. Otevřete přepínač prostředí v dolní části navigačního podokna a vyberte Datové Inženýrství.

  2. Vyberte Importovat poznámkový blok.

    Snímek obrazovky s možnostmi položek v Datové Inženýrství Položka s názvem Importovat poznámkový blok je zvýrazněná.

  3. V okně Stav importu vyberte Nahrát.

    Snímek obrazovky s oknem Stavu importu Tlačítko s názvem Nahrát je zvýrazněné.

  4. Vyberte poznámkový blok NYC GreenTaxi, který jste si stáhli v předchozím kroku.

  5. Po dokončení importu se vraťte do pracovního prostoru a otevřete tento poznámkový blok.

4. Získání dat

Pokud chcete dotazovat databázi pomocí konektoru Spark, musíte kontejneru objektů blob NYC GreenTaxi udělit přístup pro čtení a zápis.

Vyberte tlačítko přehrát a spusťte následující buňky nebo vyberte buňku a stiskněte Shift+Enter. Tento krok opakujte pro každou buňku kódu.

Poznámka

Před spuštěním další buňky počkejte, až se zobrazí značka zaškrtnutí dokončení.

  1. Spuštěním následující buňky povolte přístup ke kontejneru objektů blob NYC GreenTaxi.

    Snímek obrazovky s první buňkou kódu zobrazující informace o přístupu k úložišti

  2. V KustoURI vložte identifikátor URI dotazu , který jste zkopírovali dříve , místo zástupného textu.

  3. Změňte zástupný název databáze na nycGreenTaxi.

  4. Změňte zástupný název tabulky na GreenTaxiData.

    Snímek obrazovky s druhou buňkou kódu zobrazující informace o cílové databázi Identifikátor URI dotazu, název databáze a název tabulky jsou zvýrazněné.

  5. Spusťte buňku.

  6. Spuštěním další buňky zapište data do databáze. Dokončení tohoto kroku může trvat několik minut.

    Snímek obrazovky třetí buňky kódu znázorňující příkaz mapování a příjmu tabulek

Vaše databáze teď obsahuje data v tabulce s názvem GreenTaxiData.

5. Spuštění poznámkového bloku

Spusťte zbývající dvě buňky postupně a dotazujte se na data z tabulky. Výsledky ukazují prvních 20 nejvyšších a nejnižších tarifů taxi a vzdáleností zaznamenaných podle roku.

Snímek obrazovky se čtvrtou a pátou buňkou kódu zobrazující výsledky dotazu

6. Vyčištění prostředků

Vyčistěte vytvořené položky tak, že přejdete do pracovního prostoru, ve kterém byly vytvořeny.

  1. V pracovním prostoru najeďte myší na poznámkový blok, který chcete odstranit, vyberte nabídku Další [...] >Odstranit.

    Snímek obrazovky pracovního prostoru s rozevírací nabídkou poznámkového bloku NYC GreenTaxi Možnost s názvem Odstranit je zvýrazněná.

  2. Vyberte Odstranit. Jakmile poznámkový blok odstraníte, nemůžete ho obnovit.

Další kroky