Diagnostische logboeken en metrische gegevens voor Workflow Orchestration Manager
Notitie
Workflow Orchestration Manager wordt mogelijk gemaakt door Apache Airflow.
In dit artikel worden de volgende stappen beschreven:
- Schakel diagnostische logboeken en metrische gegevens in voor Workflow Orchestration Manager in Azure Data Factory.
- Logboeken en metrische gegevens weergeven.
- Voer een query uit.
- Monitor metrics and set the alert system in directed acyclic graph (DAG) failure.
Vereisten
U hebt een Azure-abonnement nodig. Als u nog geen abonnement op Azure hebt, maakt u een gratis Azure-account voordat u begint.
Diagnostische logboeken en metrische gegevens inschakelen voor Workflow Orchestration Manager
Open uw Data Factory-resource en selecteer diagnostische instellingen in het meest linkse deelvenster. Selecteer vervolgens Diagnostische instelling toevoegen.
Vul de naam van de diagnostische instellingen in. Selecteer de volgende categorieën voor de Airflow-logboeken:
- Uitvoeringslogboeken voor Airflow-taken
- Airflow-werklogboeken
- Logboeken voor DAG-verwerking van airflows
- Airflow scheduler-logboeken
- Weblogboeken van Airflow
- Als u AllMetrics selecteert, worden er verschillende metrische gegevens van Data Factory beschikbaar gesteld om waarschuwingen te bewaken of te genereren. Deze metrische gegevens omvatten de metrische gegevens voor Data Factory-activiteit en de Integration Runtime van Workflow Orchestration Manager, zoals
AirflowIntegrationRuntimeCpuUsage
enAirflowIntegrationRuntimeMemory
.
Schakel onder Doeldetails het selectievakje Verzenden naar Log Analytics-werkruimte in.
Selecteer Opslaan.
Logboeken weergeven
Nadat u diagnostische instellingen hebt toegevoegd, kunt u deze vinden in de sectie Diagnostische instelling . Als u logboeken wilt openen en weergeven, selecteert u de Log Analytics-werkruimte die u hebt geconfigureerd.
Selecteer Logboeken weergeven in de sectie Uw Log Analytics-ervaring maximaliseren.
U wordt omgeleid naar uw Log Analytics-werkruimte, waar u kunt zien dat de tabellen die u hebt geselecteerd, automatisch in de werkruimte zijn geïmporteerd.
Andere nuttige koppelingen voor het schema:
- Naslaginformatie over Azure Monitor-logboeken - ADFAirflowSchedulerLogs | Microsoft Learn
- Naslaginformatie over Azure Monitor-logboeken - ADFAirflowTaskLogs | Microsoft Learn
- Naslaginformatie over Azure Monitor-logboeken - ADFAirflowWebLogs | Microsoft Learn
- Naslaginformatie over Azure Monitor-logboeken - ADFAirflowWorkerLogs | Microsoft Learn
- Naslaginformatie over Azure Monitor-logboeken - AirflowDagProcessingLogs | Microsoft Learn
Een query schrijven
Laten we beginnen met de eenvoudigste query die alle records in
ADFAirflowTaskLogs
retourneert. U kunt dubbelklikken op de tabelnaam om deze toe te voegen aan een queryvenster. U kunt de tabelnaam ook rechtstreeks in het venster invoeren.Als u de zoekresultaten wilt beperken, zoals het filteren ervan op basis van een specifieke taak-id, kunt u de volgende query gebruiken:
ADFAirflowTaskLogs | where DagId == "<your_dag_id>" and TaskId == "<your_task_id>"
Op dezelfde manier kunt u aangepaste query's maken op basis van uw behoeften door alle tabellen te gebruiken die beschikbaar zijn in LogManagement
.
Zie voor meer informatie:
- Log Analytics-zelfstudie
- overzicht van Kusto-querytaal (KQL) - Azure Data Explorer | Microsoft Learn
Metrische gegevens bewaken
Data Factory biedt uitgebreide metrische gegevens voor Airflow-integratieruntimes, zodat u de prestaties van uw Airflow Integration Runtime effectief kunt bewaken en waar nodig waarschuwingsmechanismen kunt opzetten.
Open uw Data Factory-resource.
Selecteer in het meest linkse deelvenster onder de sectie Bewaking de optie Metrische gegevens.
Selecteer de >metrische naamruimte>voor bereik die u wilt bewaken.
Bekijk het diagram met meerdere regels waarmee het CPU-percentage van Integration Runtime en de grootte van de Dag Bag van Integration Runtime worden gevisualiseerd.
U kunt een waarschuwingsregel instellen die wordt geactiveerd wanneer uw metrische gegevens voldoen aan specifieke voorwaarden. Zie Overzicht van Azure Monitor-waarschuwingen voor meer informatie.
Selecteer Opslaan in dashboard nadat de grafiek is voltooid of als de grafiek verdwijnt.
Metrische gegevens van airflow
De volgende tabel bevat de metrische gegevens die beschikbaar zijn voor Workflow Orchestration Manager. De tabelkoppen zijn:
- Metrische waarde: de weergavenaam van metrische gegevens zoals deze wordt weergegeven in Azure Portal.
- Naam in REST API: de naam van de metrische waarde, zoals wordt genoemd in de REST API.
- Beschrijving: Een beschrijving van de metrische waarde.
- Eenheid: maateenheid.
- Aggregatie: het standaardaggregatietype. Geldige waarden zijn Gemiddelde, Minimum, Maximum, Totaal en Aantal.
- Dimensies: Dimensies die beschikbaar zijn voor de metrische waarde.
- Tijdsintervallen: intervallen waarmee de metrische gegevens worden gesampleerd. PT1M geeft bijvoorbeeld aan dat de metrische gegevens elke minuut worden genomen, PT30M om de 30 minuten, PT1H elk uur, enzovoort.
- DS-export: of de metrische waarde kan worden geëxporteerd naar Azure Monitor-logboeken via diagnostische instellingen.
Metric | Naam in REST API | Beschrijving | Eenheid | Statistische functie | Afmetingen | Tijdskorrels | DS-export |
---|---|---|---|---|---|---|---|
Time-outfout voor Taaktime-out voor Airflow Integration Runtime | AirflowIntegrationRuntimeCeleryTaskTimeoutError |
Aantal fouten dat optreedt bij het publiceren van AirflowTaskTimeout een taak naar Celery Broker. |
Tellen | Totaal | IntegrationRuntimeName |
PT1M | Nee |
Airflow Integration Runtime Collect DB Dags | AirflowIntegrationRuntimeCollectDBDags |
Milliseconden die zijn genomen voor het ophalen van alle geserialiseerde DAG's uit de database. | Milliseconden | Gemiddeld | IntegrationRuntimeName |
PT1M | Nee |
Cpu-percentage airflow Integration Runtime | AirflowIntegrationRuntimeCpuPercentage |
CPU-gebruikspercentage van de Airflow Integration Runtime. | Procent | Gemiddeld | IntegrationRuntimeName , ContainerName |
PT1M | Nee |
Geheugengebruik van Airflow Integration Runtime | AirflowIntegrationRuntimeCpuUsage |
Millicores die door Airflow Integration Runtime worden gebruikt, wat aangeeft welke CPU-resources in duizendste van een CPU-kern worden gebruikt. | Millicores | Gemiddeld | IntegrationRuntimeName , ContainerName |
PT1M | Ja |
Grootte airflow Integration Runtime Dag Bag | AirflowIntegrationRuntimeDagBagSize |
Aantal DAG's dat is gevonden toen de planner een scan uitvoerde op basis van de configuratie. | Tellen | Totaal | IntegrationRuntimeName |
PT1M | Nee |
Callback-uitzonderingen voor Airflow Integration Runtime Dag Callback | AirflowIntegrationRuntimeDagCallbackExceptions |
Aantal uitzonderingen dat wordt gegenereerd door DAG-callbacks. Wanneer er uitzonderingen optreden, betekent dit dat DAG-callback niet werkt. | Tellen | Totaal | IntegrationRuntimeName |
PT1M | Nee |
Fout bij vernieuwen van DAG-bestandsvernieuwing in Airflow Integration Runtime | AirflowIntegrationRuntimeDAGFileRefreshError |
Aantal fouten bij het laden van DAG-bestanden. | Tellen | Totaal | IntegrationRuntimeName |
PT1M | Nee |
Fouten bij het importeren van de Airflow Integration Runtime DAG-verwerking | AirflowIntegrationRuntimeDAGProcessingImportErrors |
Aantal fouten bij het parseren van DAG-bestanden. | Tellen | Totaal | IntegrationRuntimeName |
PT1M | Nee |
Laatste duur van DAG-verwerking van Airflow Integration Runtime | AirflowIntegrationRuntimeDAGProcessingLastDuration |
Seconden die nodig zijn om het specifieke DAG-bestand te laden. | Milliseconden | Gemiddeld | IntegrationRuntimeName , DagFile |
PT1M | Nee |
DAG-verwerking van Airflow Integration Runtime afgelopen seconden geleden | AirflowIntegrationRuntimeDAGProcessingLastRunSecondsAgo |
Seconden sinds <dag_file> voor het laatst is verwerkt. | Seconden | Gemiddeld | IntegrationRuntimeName , DagFile |
PT1M | Nee |
Airflow Integration Runtime DAG ProcessingManager Stalls | AirflowIntegrationRuntimeDAGProcessingManagerStalls |
Aantal vastgelopen DagFileProcessorManager . |
Tellen | Totaal | IntegrationRuntimeName |
PT1M | Nee |
DAG-verwerkingsprocessen voor Airflow Integration Runtime | AirflowIntegrationRuntimeDAGProcessingProcesses |
Relatief aantal actieve DAG-parseringsprocessen. (Deze delta is bijvoorbeeld negatief wanneer, sinds de laatste metriek is verzonden, processen zijn voltooid.) | Tellen | Totaal | IntegrationRuntimeName |
PT1M | Nee |
Time-outs voor DAG-verwerkingsprocessor van Airflow Integration Runtime | AirflowIntegrationRuntimeDAGProcessingProcessorTimeouts |
Aantal bestandsprocessors dat is gedood omdat ze te lang duurde. | Seconden | Gemiddeld | IntegrationRuntimeName |
PT1M | Nee |
Dagverwerking van Airflow Integration Runtime totale parseringstijd | AirflowIntegrationRuntimeDAGProcessingTotalParseTime |
Seconden die nodig zijn om DAG-bestanden te scannen en te importeren dag_processing.file_path_queue_size . |
Seconden | Gemiddeld | IntegrationRuntimeName |
PT1M | Nee |
Controle van afhankelijkheid van Airflow Integration Runtime DAG-uitvoering | AirflowIntegrationRuntimeDAGRunDependencyCheck |
Milliseconden die nodig zijn om DAG-afhankelijkheden te controleren. | Milliseconden | Gemiddeld | IntegrationRuntimeName , DagId |
PT1M | Nee |
Duur van DAG-uitvoering van Airflow Integration Runtime mislukt | AirflowIntegrationRuntimeDAGRunDurationFailed |
Seconden die nodig zijn om de DagRun status Mislukt te bereiken. |
Milliseconden | Gemiddeld | IntegrationRuntimeName , DagId |
PT1M | Nee |
Geslaagde duur van DAG-uitvoering van Airflow Integration Runtime | AirflowIntegrationRuntimeDAGRunDurationSuccess |
Seconden die nodig zijn om de DagRun status geslaagd te bereiken. |
Milliseconden | Gemiddeld | IntegrationRuntimeName , DagId |
PT1M | Nee |
Vertraging in de planning van de eerste taakplanning door Airflow Integration Runtime | AirflowIntegrationRuntimeDAGRunFirstTaskSchedulingDelay |
Seconden verstreken tussen de eerste taak start_date en de DagRun verwachte begindatum. |
Milliseconden | Gemiddeld | IntegrationRuntimeName , DagId |
PT1M | Nee |
Vertraging van daguitvoeringsschema voor Airflow Integration Runtime | AirflowIntegrationRuntimeDAGRunScheduleDelay |
Seconden vertraging tussen de geplande DagRun begindatum en de werkelijke DagRun begindatum. |
Milliseconden | Gemiddeld | IntegrationRuntimeName , DagId |
PT1M | Nee |
Open slots voor Airflow Integration Runtime | AirflowIntegrationRuntimeExecutorOpenSlots |
Aantal geopende sleuven op de uitvoerders. | Tellen | Totaal | IntegrationRuntimeName |
PT1M | Nee |
Taken die in de wachtrij zijn geplaatst voor De Uitvoering van Airflow Integration Runtime | AirflowIntegrationRuntimeExecutorQueuedTasks |
Aantal taken in de wachtrij op de uitvoerders. | Tellen | Totaal | IntegrationRuntimeName |
PT1M | Nee |
Uitvoeringstaken voor Airflow Integration Runtime | AirflowIntegrationRuntimeExecutorRunningTasks |
Aantal actieve taken op de uitvoerder. | Tellen | Totaal | IntegrationRuntimeName |
PT1M | Nee |
Einde airflow Integration Runtime-taak | AirflowIntegrationRuntimeJobEnd |
Aantal beëindigde <job_name> taak, bijvoorbeeld SchedulerJob en LocalTaskJob . |
Tellen | Totaal | IntegrationRuntimeName , Job |
PT1M | Nee |
Heartbeatfout voor Airflow Integration Runtime | AirflowIntegrationRuntimeJobHeartbeatFailure |
Aantal mislukte heartbeats voor een <job_name> taak, bijvoorbeeld SchedulerJob en LocalTaskJob . |
Tellen | Totaal | IntegrationRuntimeName , Job |
PT1M | Nee |
Start van Airflow Integration Runtime-taak | AirflowIntegrationRuntimeJobStart |
Aantal gestarte <job_name> taken, bijvoorbeeld SchedulerJob en LocalTaskJob . |
Tellen | Totaal | IntegrationRuntimeName , Job |
PT1M | Nee |
Geheugenpercentage airflow Integration Runtime | AirflowIntegrationRuntimeMemoryPercentage |
Geheugenpercentage dat wordt gebruikt door Airflow Integration Runtime-omgevingen. | Procent | Gemiddeld | IntegrationRuntimeName , ContainerName |
PT1M | Ja |
Aantal Airflow Integration Runtime-knooppunten | AirflowIntegrationRuntimeNodeCount |
Tellen | Gemiddeld | IntegrationRuntimeName , ComputeNodeSize |
PT1M | Ja | |
Operatorfouten van Airflow Integration Runtime | AirflowIntegrationRuntimeOperatorFailures |
Totaal aantal operatorfouten. | Tellen | Totaal | IntegrationRuntimeName , Operator |
PT1M | Nee |
Successen van Airflow Integration Runtime-operator | AirflowIntegrationRuntimeOperatorSuccesses |
Totaal aantal geslaagde operatoren. | Tellen | Totaal | IntegrationRuntimeName , Operator |
PT1M | Nee |
Open sleuven voor Airflow Integration Runtime-pool | AirflowIntegrationRuntimePoolOpenSlots |
Aantal geopende sleuven in de pool. | Tellen | Totaal | IntegrationRuntimeName , Pool |
PT1M | Nee |
In wachtrij geplaatste sleuven voor Airflow Integration Runtime-pool | AirflowIntegrationRuntimePoolQueuedSlots |
Aantal in de wachtrij geplaatste sites in de pool. | Tellen | Totaal | IntegrationRuntimeName , Pool |
PT1M | Nee |
Actieve sleuven voor Airflow Integration Integration Runtime-pool | AirflowIntegrationRuntimePoolRunningSlots |
Aantal actieve sleuven in de pool. | Tellen | Totaal | IntegrationRuntimeName , Pool |
PT1M | Nee |
Airflow Integration Runtime-pool starving-taken | AirflowIntegrationRuntimePoolStarvingTasks |
Aantal verhongerde taken in de groep. | Tellen | Totaal | IntegrationRuntimeName , Pool |
PT1M | Nee |
Kritieke sectie Over airflow Integration Runtime Scheduler bezet | AirflowIntegrationRuntimeSchedulerCriticalSectionBusy |
Het aantal keren dat een scheduler-proces heeft geprobeerd een vergrendeling op de kritieke sectie te krijgen (die nodig is om taken naar de uitvoerder te verzenden) en het proces is vergrendeld door een ander proces. | Tellen | Totaal | IntegrationRuntimeName |
PT1M | Nee |
Kritieke sectieduur van Airflow Integration Runtime Scheduler | AirflowIntegrationRuntimeSchedulerCriticalSectionDuration |
Milliseconden die zijn besteed aan de kritieke sectie van een scheduler-lus. Slechts één scheduler kan deze lus tegelijk invoeren. | Milliseconden | Gemiddeld | IntegrationRuntimeName |
PT1M | Nee |
Airflow Integration Runtime Scheduler mislukte SLA-e-mailpogingen | AirflowIntegrationRuntimeSchedulerFailedSLAEmailAttempts |
Aantal mislukte SLA-pogingen om e-mailmeldingen te missen. | Tellen | Totaal | IntegrationRuntimeName |
PT1M | Nee |
Airflow Integration Runtime Scheduler Heartbeats | AirflowIntegrationRuntimeSchedulerHeartbeat |
Scheduler-heartbeats. | Tellen | Totaal | IntegrationRuntimeName |
PT1M | Nee |
Zwevende taken van Airflow Integration Runtime Scheduler geïmplementeerd | AirflowIntegrationRuntimeSchedulerOrphanedTasksAdopted |
Het aantal zwevende taken dat door de Scheduler is aangenomen. | Tellen | Totaal | IntegrationRuntimeName |
PT1M | Nee |
Zwevende taken van Airflow Integration Runtime Scheduler gewist | AirflowIntegrationRuntimeSchedulerOrphanedTasksCleared |
Het aantal zwevende taken dat door de Scheduler is gewist. | Tellen | Totaal | IntegrationRuntimeName |
PT1M | Nee |
Uitvoerbare taken van Airflow Integration Runtime Scheduler | AirflowIntegrationRuntimeSchedulerTasksExecutable |
Aantal taken dat gereed is voor uitvoering (ingesteld op in wachtrij) met betrekking tot poollimieten, DAG-gelijktijdigheid, uitvoeringsstatus en prioriteit. | Tellen | Totaal | IntegrationRuntimeName |
PT1M | Nee |
Airflow Integration Runtime Scheduler-taken die extern zijn gedood | AirflowIntegrationRuntimeSchedulerTasksKilledExternally |
Het aantal taken dat extern is gedood. | Tellen | Totaal | IntegrationRuntimeName |
PT1M | Nee |
Airflow Integration Runtime Scheduler-taken die worden uitgevoerd | AirflowIntegrationRuntimeSchedulerTasksRunning |
Tellen | Totaal | IntegrationRuntimeName |
PT1M | Nee | |
Airflow Integration Runtime Scheduler Tasks Starving | AirflowIntegrationRuntimeSchedulerTasksStarving |
Aantal taken dat niet kan worden gepland vanwege een open site in de pool. | Tellen | Totaal | IntegrationRuntimeName |
PT1M | Nee |
Met Airflow Integration Runtime gestarte taakexemplaren | AirflowIntegrationRuntimeStartedTaskInstances |
Tellen | Totaal | IntegrationRuntimeName , , DagId TaskId |
PT1M | Nee | |
Airflow Integration Runtime-taakexemplaren gemaakt met operator | AirflowIntegrationRuntimeTaskInstanceCreatedUsingOperator |
Aantal taakexemplaren dat is gemaakt voor een specifieke operator. | Tellen | Totaal | IntegrationRuntimeName , Operator |
PT1M | Nee |
Duur van taakexemplaren van Airflow Integration Runtime | AirflowIntegrationRuntimeTaskInstanceDuration |
Milliseconden | Gemiddeld | IntegrationRuntimeName , , DagId TaskID |
PT1M | Nee | |
Fouten in taakexemplaren van Airflow Integration Runtime | AirflowIntegrationRuntimeTaskInstanceFailures |
Algemene fouten in taakexemplaren. | Tellen | Totaal | IntegrationRuntimeName |
PT1M | Nee |
Airflow Integration Runtime Task Instance voltooid | AirflowIntegrationRuntimeTaskInstanceFinished |
Algemene taakexemplaren zijn voltooid. | Tellen | Totaal | IntegrationRuntimeName , , , DagId TaskId State |
PT1M | Nee |
Taakexemplaren van Airflow Integration Runtime zijn eerder geslaagd | AirflowIntegrationRuntimeTaskInstancePreviouslySucceeded |
Aantal eerder geslaagde taakexemplaren. | Tellen | Totaal | IntegrationRuntimeName |
PT1M | Nee |
Successen van airflow Integration Runtime-taakexemplaren | AirflowIntegrationRuntimeTaskInstanceSuccesses |
Het algehele geslaagde taakexemplaren. | Tellen | Totaal | IntegrationRuntimeName |
PT1M | Nee |
Airflow Integration Runtime-taak verwijderd uit DAG | AirflowIntegrationRuntimeTaskRemovedFromDAG |
Aantal taken dat is verwijderd voor een specifieke DAG. (Dat wil gezegd, de taak bestaat niet meer in DAG.) | Tellen | Totaal | IntegrationRuntimeName , DagId |
PT1M | Nee |
Airflow Integration Runtime-taak hersteld naar DAG | AirflowIntegrationRuntimeTaskRestoredToDAG |
Aantal taken dat is hersteld voor een specifieke DAG. (Dat wil gezegd, een taakexemplaren die eerder de status VERWIJDERD in de database hebben, wordt toegevoegd aan een DAG-bestand.) | Tellen | Totaal | IntegrationRuntimeName , DagId |
PT1M | Nee |
Airflow Integration Runtime activeert geblokkeerde hoofdthread | AirflowIntegrationRuntimeTriggersBlockedMainThread |
Aantal triggers dat de hoofdthread heeft geblokkeerd (waarschijnlijk omdat ze niet volledig asynchroon waren). | Tellen | Totaal | IntegrationRuntimeName |
PT1M | Nee |
Triggers voor Airflow Integration Runtime zijn mislukt | AirflowIntegrationRuntimeTriggersFailed |
Aantal triggers dat is opgetreden voordat ze een gebeurtenis konden activeren. | Tellen | Totaal | IntegrationRuntimeName |
PT1M | Nee |
Airflow Integration Runtime-triggers die worden uitgevoerd | AirflowIntegrationRuntimeTriggersRunning |
Het aantal triggers dat momenteel wordt uitgevoerd voor een triggerer (beschreven door hostnaam). | Tellen | Totaal | IntegrationRuntimeName |
PT1M | Nee |
Airflow Integration Runtime-triggers zijn geslaagd | AirflowIntegrationRuntimeTriggersSucceeded |
Aantal triggers dat ten minste één gebeurtenis heeft geactiveerd. | Tellen | Totaal | IntegrationRuntimeName |
PT1M | Nee |
Zombie-taken van Airflow Integration Runtime gedood | AirflowIntegrationRuntimeZombiesKilled |
Zombie-taken zijn gedood. | Tellen | Totaal | IntegrationRuntimeName |
PT1M | Nee |
Zie Ondersteunde metrische gegevens voor Microsoft.DataFactory/factory's voor meer informatie.
Feedback
https://aka.ms/ContentUserFeedback.
Binnenkort beschikbaar: In de loop van 2024 zullen we GitHub-problemen geleidelijk uitfaseren als het feedbackmechanisme voor inhoud en deze vervangen door een nieuw feedbacksysteem. Zie voor meer informatie:Feedback verzenden en weergeven voor