Megosztás a következőn keresztül:


A feladatböngésző és a Feladat nézet használata az Azure Data Lake Analyticsben

Fontos

Az Azure Data Lake Analytics 2024. február 29-én megszűnt. További információ ezzel a bejelentéssel.

Az adatelemzéshez a szervezet használhatja a Azure Synapse Analyticset vagy a Microsoft Fabricet.

Az Azure Data Lake Analytics szolgáltatás archívuma feladatokat küldött le egy lekérdezéstárban. Ebből a cikkből megtudhatja, hogyan keresheti meg a korábbi feladatadatokat az Azure Data Lake Tools for Visual Studióban a Job Browser és a Job View használatával.

Alapértelmezés szerint a Data Lake Analytics szolgáltatás 30 napig archiválja a feladatokat. A lejárati időszak a Azure Portal konfigurálható a testre szabott lejárati szabályzat konfigurálásával. A feladatadatok nem érhetők el a lejárat után.

Előfeltételek

Lásd: A Data Lake Tools for Visual Studio előfeltételei.

Nyissa meg a feladatböngészőt

Nyissa meg a feladatböngészőt a Server Explorer>Azure> Data Lake Analytics> Jobs használatával a Visual Studióban. A Feladatböngészővel hozzáférhet egy Data Lake Analytics-fiók lekérdezéstárához. A Feladatböngésző bal oldalon megjeleníti a Lekérdezéstárat, az alapszintű feladatadatokat, a jobb oldalon pedig a Feladat nézetet, ahol a részletes feladatadatok láthatók.

Feladatnézet

A Feladat nézet egy feladat részletes adatait jeleníti meg. Egy feladat megnyitásához kattintson duplán egy feladatra a Feladatböngészőben, vagy nyissa meg a Data Lake menüben a Feladatnézet parancsra kattintva. Ekkor megjelenik egy párbeszédpanel, amely a feladat URL-címével van kitöltve.

Data Lake Tools Visual Studio Job Browser

A Feladatnézet a következőket tartalmazza:

  • Feladat összegzése

    Frissítse a Feladat nézetet a feladatok futtatásával kapcsolatos legfrissebb információk megtekintéséhez.

    • Feladat állapota (grafikon):

      A feladat állapota a következő feladatfázisokat vázolja fel:

      Képernyőkép az Azure Data Lake Analytics feladatfázisokról.

      • Előkészítés: Töltse fel a szkriptet a felhőbe, gyűjtse össze és optimalizálja a szkriptet a fordítási szolgáltatással.

      • Várólistán: A feladatok várólistára kerülnek, ha elegendő erőforrásra várnak, vagy a feladatok túllépik a fiókonkénti korlátozásonkénti egyidejű feladatok maximális számát. A prioritási beállítás határozza meg az üzenetsorba helyezett feladatok sorrendjét – minél alacsonyabb a szám, annál magasabb a prioritás.

      • Futtatás: A feladat valójában a Data Lake Analytics fiókjában fut.

      • Véglegesítés: A feladat befejeződik (például a fájl véglegesítése).

        A feladat minden fázisban meghiúsulhat. Például fordítási hibák az Előkészítés fázisban, időtúllépési hibák a Várólistán fázisban, végrehajtási hibák a Futó fázisban stb.

    • Alapvető adatok

      Az alapszintű feladatadatok a Feladat összegzése panel alsó részén láthatók.

      Képernyőkép a feladat összegzéséről, amelyben a leírások szövegmezőkben találhatók.

      • Feladat eredménye: Sikeres vagy sikertelen. A feladat minden fázisban meghiúsulhat.
      • Teljes időtartam: A falióra időpontja (időtartam) a küldési idő és a befejezési idő között.
      • Teljes számítási idő: Az egyes csúcspontok végrehajtási idejének összege, tekintheti úgy, hogy a feladat végrehajtása csak egy csúcsponton történik. A csúcspontokkal kapcsolatos további információkért tekintse meg a Teljes csúcsok című témakört.
      • Küldés/kezdés/befejezés időpontja: Az az idő, amikor a Data Lake Analytics szolgáltatás feladatbeküldést kap/elkezdi futtatni a feladatot/sikeresen befejezi a feladatot.
      • Fordítás/Várólistán/Futtatás: Az előkészítési/várakozási/futási fázisban töltött falióra-idő.
      • Fiók: A feladat futtatásához használt Data Lake Analytics fiók.
      • Szerző: A feladatot beküldő felhasználó lehet valódi személy fiókja vagy rendszerfiókja.
      • Prioritás: A feladat prioritása. Minél alacsonyabb a szám, annál magasabb a prioritás. Ez csak a várólistán lévő feladatok sorrendjét befolyásolja. A magasabb prioritás beállítása nem előz meg feladatokat.
      • Párhuzamosság: Az egyidejű Azure Data Lake Analytics egységek (ADLA-k) kért maximális száma, más néven csúcsok. Jelenleg egy csúcspont egyenlő egy két virtuális maggal és hat GB RAM-mal rendelkező virtuális géppel, bár ez a jövőbeli Data Lake Analytics frissítésekben frissíthető.
      • Bal oldali bájtok: A feladat befejezéséig feldolgozandó bájtok.
      • Olvasási/írási bájtok: A feladat futtatása óta olvasási/írási bájtok.
      • Teljes csúcspontok: A feladat több munkadarabra oszlik, minden munkadarabot csúcspontnak nevezünk. Ez az érték azt írja le, hogy a feladat hány darabból áll. A csúcsok alapszintű folyamategységként is tekinthetők, más néven Azure Data Lake Analytics Unit (ADLAU), és a csúcspontok párhuzamos módon is futtathatók.
      • Kész/Futtatva/Sikertelen: A befejezett/futtatott/sikertelen csúcspontok száma. A csúcspontok a felhasználói kód és a rendszer hibái miatt is meghiúsulhatnak, de a rendszer újrapróbálkozásai néhányszor automatikusan meghiúsultak. Ha a csúcspont az újrapróbálkozás után is meghiúsul, a teljes feladat sikertelen lesz.
  • Feladatdiagram

    Az U-SQL-szkriptek a bemeneti adatok kimeneti adatokká alakításának logikáját képviselik. A szkript az előkészítési fázisban egy fizikai végrehajtási tervre van lefordítva és optimalizálva. A Job Graph a fizikai végrehajtási terv megjelenítése. Az alábbi ábra a folyamatot szemlélteti:

    Az Azure Data Lake Analytics feladatfázisok állapota

    Egy feladat több munkadarabra oszlik. Minden munkadarabot csúcspontnak nevezünk. A csúcspontok Szuper csúcspontként (más néven fázisként) vannak csoportosítva, és Job Graphként vannak vizualizálva. A feladatdiagram zöld szakasztáblái a fázisokat mutatják.

    Egy fázis minden csúcspontja ugyanazt a fajta munkát végzi ugyanazon adatok különböző darabjaival. Ha például van egy egy TB-os adatokat tartalmazó fájlja, és több száz csúcspontot olvas fel, mindegyik egy adattömböt olvas be. Ezek a csúcsok ugyanabban a fázisban vannak csoportosítva, és ugyanazon bemeneti fájl különböző részein végzik ugyanazt a munkát.

    • Szakaszadatok

      Egy adott szakaszban néhány szám megjelenik a plakáton.

      Azure Data Lake Analytics feladatgráf szakasza

      • SV1-kinyerés: Egy szakasz neve egy számmal és a műveleti módszerrel.

      • 84 csúcspont: A csúcspontok teljes száma ebben a szakaszban. Az ábra azt jelzi, hogy hány darab munka van elosztva ebben a szakaszban.

      • 12,90 s/csúcspont: Az ehhez a fázishoz tartozó átlagos csúcspont-végrehajtási idő. Ezt az ábrát a SZUM (minden csúcspont végrehajtási ideje) / (a csúcspontok teljes száma) alapján számítjuk ki. Ez azt jelenti, hogy ha a párhuzamosságban végrehajtott összes csúcspontot hozzárendelné, az egész szakasz 12,90 s-ben fejeződik be. Ez azt is jelenti, hogy ha ebben a fázisban az összes munka sorba kerül, a költség #vertices * AVG idő.

      • 850 895 sor megírva: Ebben a szakaszban megírt teljes sorszám.

      • R/W: Az ebben a szakaszban olvasható/írt adatok mennyisége bájtban.

      • Színek: A fázisban a színek különböző csúcsállapotokat jeleznek.

        • A zöld azt jelzi, hogy a csúcspont sikeres.
        • A narancssárga azt jelzi, hogy a csúcspont újra meg van próbálkozva. Az újrapróbálkozott csúcspont sikertelen volt, de a rendszer automatikusan és sikeresen újrapróbálkozott, és a teljes szakasz sikeresen befejeződött. Ha a csúcspont újrapróbálkozott, de továbbra sem sikerült, a szín pirosra változik, és az egész feladat meghiúsult.
        • A piros azt jelzi, hogy nem sikerült, ami azt jelenti, hogy a rendszer néhányszor újrapróbálkozott egy bizonyos csúcsponttal, de továbbra is sikertelen volt. Ez a forgatókönyv a teljes feladat meghiúsulását okozza.
        • A kék azt jelenti, hogy egy bizonyos csúcspont fut.
        • A fehér azt jelzi, hogy a csúcspont Várakozás. Előfordulhat, hogy a csúcspont az ADLAU elérhetővé válása után várakozik az ütemezésre, vagy a bemenetre vár, mivel előfordulhat, hogy a bemeneti adatok nem állnak készen.

        A szakasz további részleteit úgy találhatja meg, ha az egérmutatót egy állapotra viszi:

        Az Azure Data Lake Analytics feladatgráf fázisának részletei

    • Csúcspontok: Ismerteti a csúcspontok részleteit, például azt, hogy összesen hány csúcspontot hajtottak végre, hány csúcspontot végeztek el, sikertelenek vagy továbbra is futnak/várakoznak stb.

    • Adatolvasási kereszt/pod: A fájlok és az adatok több podban vannak tárolva az elosztott fájlrendszerben. Az itt található érték azt írja le, hogy mennyi adatot olvastak be ugyanabban a podban vagy podköziben.

    • Teljes számítási idő: A fázisban lévő csúcspontok végrehajtási idejének összege, amelyet úgy tekinthet, mint az időtartamot, ha a fázisban lévő összes munkát csak egy csúcsponton hajtja végre.

    • Adatok és sorok írása/olvasása: Azt jelzi, hogy mennyi adatot vagy sort olvastak/írtak vagy kell olvasni.

    • Csúcsok olvasási hibái: Azt ismerteti, hogy hány csúcspont hiúsul meg az adatok olvasása közben.

    • Csúcspontok duplikálása: Ha egy csúcspont túl lassan fut, a rendszer több csúcspontot ütemezhet ugyanarra a munkadarabra. A redundáns csúcsok el lesznek vetve, ha az egyik csúcspont sikeresen befejeződött. A csúcspontok duplikálása a fázisban duplikáltként elvetett csúcsok számát rögzíti.

    • Csúcspontok visszavonása: A csúcspont sikeres volt, de bizonyos okok miatt később újrafuttatják. Ha például az alsó csúcspont elveszíti a köztes bemeneti adatokat, az újrafuttatásra fogja kérni a felső csúcsot.

    • Csúcspontütemezések végrehajtása: A csúcspontok ütemezésének teljes időtartama.

    • Min/Average/Max Csúcsadatok olvasása: Az egyes csúcspontok olvasási adatainak minimális/átlagos/maximális értéke.

    • Időtartam: A fázisok falióra-ideje, az érték megtekintéséhez be kell töltenie a profilt.

    • Feladat visszajátszása

      Data Lake Analytics futtatja a feladatokat, és archiválja a feladatok adatait futtató csúcsokat, például a csúcspontok indításának, leállításának, sikertelennek és az újrapróbálkozás módjának stb. A rendszer automatikusan naplózza az összes információt a lekérdezéstárban, és a feladatprofilban tárolja. A feladatprofilt a "Profil betöltése" funkcióval töltheti le a Feladat nézetben, és a feladatprofil letöltése után megtekintheti a feladatlejátszást.

      A feladatlejátszás a fürtben történt események vizuális megjelenítése. Segít watch feladat végrehajtásának előrehaladását, és vizuálisan észleli a teljesítmény rendellenességeit és szűk keresztmetszeteit nagyon rövid idő alatt (általában 30-nál kevesebb).

    • Feladat hőtérképének megjelenítése

      A feladat hőtérképe a Feladatdiagram Megjelenítés legördülő menüjében választható ki.

      Azure Data Lake Analytics feladatdiagramok heaptérképének megjelenítése

      Megjeleníti egy feladat I/O-, idő- és átviteli sebesség-hőtérképét, amelyen keresztül megtalálhatja, hogy a feladat az idő nagy részét hol tölti, vagy hogy a feladat egy I/O-határfeladat-e stb.

      Példa az Azure Data Lake Analytics feladatgráf-heaptérképre

      • Folyamat: A feladat végrehajtásának folyamata, lásd: Információ a fázisinformációkban.
      • Olvasási/írási adatok: Az egyes szakaszokban beolvasott/írt összes adat hőtérképe.
      • Számítási idő: A SZUM hőtérképe (minden csúcspont végrehajtási ideje), ezt tekintheti úgy, hogy mennyi ideig tartana, ha a fázisban lévő összes munka csak egy csúcsponttal lesz végrehajtva.
      • Átlagos végrehajtási idő csomópontonként: A SZUM hőtérképe (minden csúcspont végrehajtási ideje) / (Csúcsérték száma). Ez azt jelenti, hogy ha a párhuzamosságban végrehajtott összes csúcspontot hozzárendelheti, az egész szakasz ebben az időkeretben lesz végrehajtva.
      • Bemeneti/kimeneti átviteli sebesség: Az egyes fázisok bemeneti/kimeneti átviteli sebességének hőtérképe, ezen keresztül ellenőrizheti, hogy a feladat I/O-hez kötött feladat-e.
  • Metaadat-műveletek

    Az U-SQL-szkriptben elvégezhet néhány metaadat-műveletet, például adatbázist hozhat létre, táblát helyezhet el stb. Ezek a műveletek a metaadat-műveletben jelennek meg a fordítás után. Itt megtalálhatja az állításokat, entitásokat hozhat létre, és elvetheti az entitásokat.

    Azure Data Lake Analytics Job View metaadat-műveletek

  • Állapotelőzmények

    Az Állapotelőzmények vizualizációja a Feladatösszesítésben is látható, de itt talál további részleteket. Megtalálhatja a részletes információkat, például a feladat előkészítésének, várólistára helyezésének, a futtatás megkezdésének és befejezésének állapotát. Azt is megtalálhatja, hogy hányszor állították össze a feladatot (a CcsAttempts: 1), mikor lett ténylegesen elküldve a feladat a fürtnek (a Részletek: Feladat fürtre történő elküldése) stb.

    Azure Data Lake Analytics Feladatnézet állapotelőzményei

  • Diagnosztika

    Az eszköz automatikusan diagnosztizálja a feladatok végrehajtását. Riasztásokat kap, ha hibák vagy teljesítményproblémák merülnek fel a feladatokban. Kérjük, vegye figyelembe, hogy a teljes információ itt való lekéréséhez le kell töltenie a profilt.

    Azure Data Lake Analytics Feladatnézet diagnosztikái

    • Figyelmeztetések: Itt megjelenik egy riasztás fordító figyelmeztetéssel. A riasztás megjelenése után az "x probléma(ok)" hivatkozásra kattintva további részleteket is megadhat.
    • A csúcsok túl hosszú ideig futnak: Ha valamelyik csúcspont elfogy (például 5 óra), itt talál problémákat.
    • Erőforrás-használat: Ha a szükségesnél több párhuzamosságot foglalt le vagy nem, itt talál problémákat. Az Erőforrás-használat lehetőséget választva további részleteket is megtekinthet, és lehetőségelemzési forgatókönyveket hajthat végre a jobb erőforrás-foglalás érdekében (további részletekért lásd ezt az útmutatót).
    • Memóriaellenőrzés: Ha bármely csúcspont 5 GB-nál több memóriát használ, itt talál problémákat. A feladatvégrehajtást a rendszer megölheti, ha több memóriát használ, mint a rendszerkorlátozás.

Feladat részletei

A Feladat részletei a feladat részletes adatait jeleníti meg, beleértve a szkriptet, az erőforrásokat és a csúcspont végrehajtási nézetét.

Azure Data Lake Analytics feladat részletei

  • Script

    A feladat U-SQL-szkriptje a lekérdezéstárban van tárolva. Megtekintheti az eredeti U-SQL-szkriptet, és szükség esetén újra elküldheti.

  • Források

    A lekérdezéstárban tárolt feladatfordítási kimeneteket az Erőforrások területen találja. Itt megtalálhatja például a "algebra.xml" kifejezést, amely a Job Graph, a regisztrált szerelvények stb. megjelenítésére szolgál.

  • Csúcspont végrehajtási nézete

    Csúcsok végrehajtási adatait jeleníti meg. A feladatprofil minden csúcspont végrehajtási naplóját archiválja, például az összes olvasási/írási adatot, a futtatókörnyezetet, az állapotot stb. Ezen a nézetben további részleteket kaphat a feladatok futásáról. További információ: Csúcspont végrehajtási nézet használata a Data Lake Tools for Visual Studióban.

Következő lépések