Een monitor maken met behulp van de Databricks-gebruikersinterface
Belangrijk
Deze functie is beschikbaar als openbare preview.
In dit artikel ziet u hoe u een gegevensmonitor maakt met behulp van de Databricks-gebruikersinterface. U kunt ook de API gebruiken.
Ga als volgt te werk om toegang te krijgen tot de Databricks-gebruikersinterface:
- Klik in de linkerzijbalk van de werkruimte om Catalog Explorer te openen.
- Navigeer naar de tabel die u wilt bewaken.
- Klik op het tabblad Kwaliteit .
- Klik op de knop Aan de slag .
- Kies in Monitor maken de opties die u wilt instellen voor het beeldscherm.
Profileren
Selecteer in het menu Profieltype het type monitor dat u wilt maken. De profieltypen worden weergegeven in de tabel.
Profieltype | Beschrijving |
---|---|
Tijdreeksprofiel | Een tabel met waarden die in de loop van de tijd worden gemeten. Deze tabel bevat een tijdstempelkolom. |
Deductieprofiel | Een tabel met voorspelde waarden die worden uitgevoerd door een machine learning-classificatie of regressiemodel. Deze tabel bevat een tijdstempel, een model-id, modelinvoer (functies), een kolom met modelvoorspellingen en optionele kolommen met unieke observatie-id's en grondwaarlabels. Het kan ook metagegevens bevatten, zoals demografische informatie, die niet wordt gebruikt als invoer voor het model, maar kan nuttig zijn voor eerlijkheids- en vooroordelenonderzoeken of andere controle. |
Momentopnameprofiel | Elke door Delta beheerde tabel, externe tabel, weergave, gerealiseerde weergave of streamingtabel. |
Als u selecteert TimeSeries
of Inference
, zijn aanvullende parameters vereist en worden deze beschreven in de volgende secties.
Notitie
- Wanneer u voor het eerst een tijdreeks- of deductieprofiel maakt, analyseert de monitor alleen gegevens van de 30 dagen voorafgaand aan het maken ervan. Nadat de monitor is gemaakt, worden alle nieuwe gegevens verwerkt.
- Monitors die zijn gedefinieerd voor gerealiseerde weergaven en streamingtabellen bieden geen ondersteuning voor incrementele verwerking.
TimeSeries
Profiel
Voor een TimeSeries
profiel moet u de volgende selecties maken:
- Geef de granulaties van metrische gegevens op die bepalen hoe de gegevens in vensters in de tijd moeten worden gepartitioneert.
- Geef de kolom Timestamp op, de kolom in de tabel die de tijdstempel bevat. Het gegevenstype van de tijdstempelkolom moet ofwel
TIMESTAMP
een type zijn dat kan worden geconverteerd naar tijdstempels met behulp van deto_timestamp
functie PySpark.
Inference
Profiel
Voor een Inference
profiel moet u naast de granulariteiten en de tijdstempel de volgende selecties maken:
- Selecteer het probleemtype, classificatie of regressie.
- Geef de kolom Voorspelling op, de kolom met de voorspelde waarden van het model.
- Geef desgewenst de kolom Label op, de kolom met de grondwaar voor modelvoorspellingen.
- Geef de kolom Model-id op, de kolom met de id van het model dat wordt gebruikt voor voorspelling.
Schema
Als u een monitor wilt instellen die op geplande basis moet worden uitgevoerd, selecteert u Vernieuwen volgens schema en selecteert u de frequentie en tijd waarop de monitor moet worden uitgevoerd. Als u niet wilt dat de monitor automatisch wordt uitgevoerd, selecteert u Vernieuwen handmatig. Als u Handmatig vernieuwen selecteert, kunt u de metrische gegevens later vernieuwen op het tabblad Kwaliteit.
Meldingen
Als u e-mailmeldingen voor een monitor wilt instellen, voert u de e-mail in die moet worden gewaarschuwd en selecteert u de meldingen die u wilt inschakelen. Maximaal 5 e-mailberichten worden ondersteund per gebeurtenistype voor meldingen.
Algemeen
In de sectie Algemeen moet u één vereiste instelling en enkele extra configuratieopties opgeven:
- U moet het Unity Catalog-schema opgeven waarin de metrische tabellen die door de monitor zijn gemaakt, worden opgeslagen. De locatie moet de indeling {catalog} hebben. {schema}.
U kunt ook de volgende instellingen opgeven:
Assets-map. Voer het absolute pad naar de bestaande map in om bewakingsassets op te slaan, zoals het gegenereerde dashboard. Assets worden standaard opgeslagen in de standaardmap: "/Users/{user_name}/databricks_lakehouse_monitoring/{table_name}". Als u een andere locatie in dit veld invoert, worden assets gemaakt onder '/{table_name}' in de map die u opgeeft. Deze map kan zich overal in de werkruimte bevinden. Voor monitors die zijn bedoeld om te worden gedeeld binnen een organisatie, kunt u een pad in de map /Gedeeld/gebruiken.
Dit veld kan niet leeg blijven.
Naam van de basislijntabel voor Unity Catalog. Naam van een tabel of weergave die basislijngegevens bevat voor vergelijking. Zie de primaire invoertabel en basislijntabel voor meer informatie over basislijntabellen.
Metrische segmenteringsexpressies. Met segmentexpressies kunt u subsets van de tabel definiëren die naast de tabel als geheel moeten worden bewaakt. Als u een segmenteringsexpressie wilt maken, klikt u op Expressie toevoegen en voert u de definitie van de expressie in. Met de expressie
"col_2 > 10"
worden bijvoorbeeld twee segmenten gegenereerd: één voorcol_2 > 10
en één voorcol_2 <= 10
. In een ander voorbeeld genereert de expressie"col_1"
één segment voor elke unieke waarde incol_1
. De gegevens worden afzonderlijk gegroepeerd op elke expressie, wat resulteert in een afzonderlijk segment voor elk predicaat en de bijbehorende aanvullingen.Aangepaste metrische gegevens. Aangepaste metrische gegevens worden weergegeven in de metrische tabellen, zoals ingebouwde metrische gegevens. Zie Aangepaste metrische gegevens gebruiken met Databricks Lakehouse Monitoring voor meer informatie. Als u een aangepaste metrische waarde wilt configureren, klikt u op Aangepaste metrische gegevens toevoegen.
- Voer een naam in voor de aangepaste metrische gegevens.
- Selecteer het aangepaste type metrische waarde, een van
Aggregate
,Derived
ofDrift
. Zie Typen aangepaste metrische gegevens voor definities. - Selecteer in de vervolgkeuzelijst in invoerkolommen de kolommen waar u de metrische waarde op wilt toepassen.
- Selecteer in het veld Uitvoertype het Spark-gegevenstype van de metrische waarde.
- Voer in het veld Definitie SQL-code in waarmee de aangepaste metrische gegevens worden gedefinieerd.
Monitorinstellingen bewerken in de gebruikersinterface
Nadat u een monitor hebt gemaakt, kunt u wijzigingen aanbrengen in de instellingen van de monitor door te klikken op de knop Monitorconfiguratie bewerken op het tabblad Kwaliteit .
Resultaten vernieuwen en weergeven in de gebruikersinterface
Als u de monitor handmatig wilt uitvoeren, klikt u op Metrische gegevens vernieuwen.
Zie Metrische tabellen bewaken voor informatie over de statistieken die zijn opgeslagen in metrische tabellen bewaken. Metrische tabellen zijn Unity Catalog-tabellen. U kunt query's uitvoeren in notebooks of in de SQL-queryverkenner en deze weergeven in Catalog Explorer.
Toegang beheren om uitvoer te bewaken
De metrische tabellen en het dashboard die door een monitor zijn gemaakt, zijn eigendom van de gebruiker die de monitor heeft gemaakt. U kunt Unity Catalog-bevoegdheden gebruiken om de toegang tot metrische tabellen te beheren. Als u dashboards in een werkruimte wilt delen, klikt u op de knop Delen in de rechterbovenhoek van het dashboard.
Een monitor verwijderen uit de gebruikersinterface
Als u een monitor uit de gebruikersinterface wilt verwijderen, klikt u op het menu Voor het vernieuwen van metrische gegevens naast de knop Metrische gegevens vernieuwen en selecteert u Monitor verwijderen.
Feedback
https://aka.ms/ContentUserFeedback.
Binnenkort beschikbaar: In de loop van 2024 zullen we GitHub-problemen geleidelijk uitfaseren als het feedbackmechanisme voor inhoud en deze vervangen door een nieuw feedbacksysteem. Zie voor meer informatie:Feedback verzenden en weergeven voor