Delta Live Tables API-útmutató
Fontos
A cikk tartalma ki lett állítva, és lehet, hogy nem frissül. Tekintse meg a Delta Live-táblákat a Databricks REST API-referenciajában.
A Delta Live Tables API lehetővé teszi a folyamatok részleteinek létrehozását, szerkesztését, törlését, elindítását és megtekintését.
Fontos
A Databricks REST API-k eléréséhez hitelesítenie kell.
Folyamat létrehozása
Végpont | HTTP-metódus |
---|---|
2.0/pipelines |
POST |
Létrehoz egy új Delta Live Tables-folyamatot.
Példa
Ez a példa létrehoz egy új aktivált folyamatot.
Kérés
curl --netrc -X POST \
https://<databricks-instance>/api/2.0/pipelines \
--data @pipeline-settings.json
pipeline-settings.json
:
{
"name": "Wikipedia pipeline (SQL)",
"storage": "/Users/username/data",
"clusters": [
{
"label": "default",
"autoscale": {
"min_workers": 1,
"max_workers": 5,
"mode": "ENHANCED"
}
}
],
"libraries": [
{
"notebook": {
"path": "/Users/username/DLT Notebooks/Delta Live Tables quickstart (SQL)"
}
}
],
"continuous": false
}
Csere:
<databricks-instance>
például az Azure Databricks-munkaterület nevéveladb-1234567890123456.7.azuredatabricks.net
.
Ez a példa egy .netrc-fájlt használ.
Válasz
{
"pipeline_id": "a12cd3e4-0ab1-1abc-1a2b-1a2bcd3e4fg5"
}
Kérelemstruktúra
Lásd: Folyamat Gépház.
Válaszstruktúra
Mező neve | Típus | Leírás |
---|---|---|
pipeline_id | STRING |
Az újonnan létrehozott folyamat egyedi azonosítója. |
Folyamat szerkesztése
Végpont | HTTP-metódus |
---|---|
2.0/pipelines/{pipeline_id} |
PUT |
Frissítések meglévő folyamat beállításait.
Példa
Ez a példa egy paramétert target
ad hozzá a folyamathoz azonosítóval a12cd3e4-0ab1-1abc-1a2b-1a2bcd3e4fg5
:
Kérés
curl --netrc -X PUT \
https://<databricks-instance>/api/2.0/pipelines/a12cd3e4-0ab1-1abc-1a2b-1a2bcd3e4fg5 \
--data @pipeline-settings.json
pipeline-settings.json
{
"id": "a12cd3e4-0ab1-1abc-1a2b-1a2bcd3e4fg5",
"name": "Wikipedia pipeline (SQL)",
"storage": "/Users/username/data",
"clusters": [
{
"label": "default",
"autoscale": {
"min_workers": 1,
"max_workers": 5,
"mode": "ENHANCED"
}
}
],
"libraries": [
{
"notebook": {
"path": "/Users/username/DLT Notebooks/Delta Live Tables quickstart (SQL)"
}
}
],
"target": "wikipedia_quickstart_data",
"continuous": false
}
Csere:
<databricks-instance>
például az Azure Databricks-munkaterület nevéveladb-1234567890123456.7.azuredatabricks.net
.
Ez a példa egy .netrc-fájlt használ.
Kérelemstruktúra
Lásd: Folyamat Gépház.
Folyamat törlése
Végpont | HTTP-metódus |
---|---|
2.0/pipelines/{pipeline_id} |
DELETE |
Töröl egy folyamatot a Delta Live Tables rendszerből.
Példa
Ez a példa törli a folyamatot azonosítóval a12cd3e4-0ab1-1abc-1a2b-1a2bcd3e4fg5
:
Kérés
curl --netrc -X DELETE \
https://<databricks-instance>/api/2.0/pipelines/a12cd3e4-0ab1-1abc-1a2b-1a2bcd3e4fg5
Csere:
<databricks-instance>
például az Azure Databricks-munkaterület nevéveladb-1234567890123456.7.azuredatabricks.net
.
Ez a példa egy .netrc-fájlt használ.
Folyamatfrissítés indítása
Végpont | HTTP-metódus |
---|---|
2.0/pipelines/{pipeline_id}/updates |
POST |
Elindítja a folyamat frissítését. A teljes folyamatdiagram frissítését vagy adott táblák szelektív frissítését is elindíthatja.
Példák
Teljes frissítés indítása
Ez a példa elindít egy frissítést a folyamat teljes frissítésével, azonosítóval a12cd3e4-0ab1-1abc-1a2b-1a2bcd3e4fg5
:
Kérés
curl --netrc -X POST \
https://<databricks-instance>/api/2.0/pipelines/a12cd3e4-0ab1-1abc-1a2b-1a2bcd3e4fg5/updates \
--data '{ "full_refresh": "true" }'
Csere:
<databricks-instance>
például az Azure Databricks-munkaterület nevéveladb-1234567890123456.7.azuredatabricks.net
.
Ez a példa egy .netrc-fájlt használ.
Válasz
{
"update_id": "a1b23c4d-5e6f-78gh-91i2-3j4k5lm67no8",
"request_id": "a1b23c4d-5e6f-78gh-91i2-3j4k5lm67no8"
}
A kijelölt táblák frissítésének indítása
Ez a példa elindít egy frissítést, amely frissíti a sales_orders_cleaned
folyamat és sales_order_in_chicago
a táblák azonosítóját a12cd3e4-0ab1-1abc-1a2b-1a2bcd3e4fg5
:
Kérés
curl --netrc -X POST \
https://<databricks-instance>/api/2.0/pipelines/a12cd3e4-0ab1-1abc-1a2b-1a2bcd3e4fg5/updates \
--data '{ "refresh_selection": ["sales_orders_cleaned", "sales_order_in_chicago"] }'
Csere:
<databricks-instance>
például az Azure Databricks-munkaterület nevéveladb-1234567890123456.7.azuredatabricks.net
.
Ez a példa egy .netrc-fájlt használ.
Válasz
{
"update_id": "a1b23c4d-5e6f-78gh-91i2-3j4k5lm67no8",
"request_id": "a1b23c4d-5e6f-78gh-91i2-3j4k5lm67no8"
}
A kijelölt táblák teljes frissítésének indítása
Ez a példa elindítja a táblák és a sales_orders_cleaned
táblák frissítését, valamint a folyamat tábláinak sales_orders_raw
customers
teljes frissítését azonosítóvala12cd3e4-0ab1-1abc-1a2b-1a2bcd3e4fg5
sales_order_in_chicago
.
Kérés
curl --netrc -X POST \
https://<databricks-instance>/api/2.0/pipelines/a12cd3e4-0ab1-1abc-1a2b-1a2bcd3e4fg5/updates \
--data '{ "refresh_selection": ["sales_orders_cleaned", "sales_order_in_chicago"], "full_refresh_selection": ["customers", "sales_orders_raw"] }'
Csere:
<databricks-instance>
például az Azure Databricks-munkaterület nevéveladb-1234567890123456.7.azuredatabricks.net
.
Ez a példa egy .netrc-fájlt használ.
Válasz
{
"update_id": "a1b23c4d-5e6f-78gh-91i2-3j4k5lm67no8",
"request_id": "a1b23c4d-5e6f-78gh-91i2-3j4k5lm67no8"
}
Kérelemstruktúra
Mező neve | Típus | Leírás |
---|---|---|
full_refresh |
BOOLEAN |
Az összes adat újrafeldolgozása. Ha true a Delta Live Tables rendszer alaphelyzetbe állítja az összes visszaállítható táblát a folyamat futtatása előtt.A mező nem kötelező. Az alapértelmezett érték false .A rendszer hibát ad vissza, ha full_refesh igaz, vagy refresh_selection full_refresh_selection be van állítva. |
refresh_selection |
Egy tömb a STRING |
A frissíteni kívánt táblák listája. Használatrefresh_selection a kijelölt táblakészlet frissítésének elindításához a folyamatgráfban.A mező nem kötelező. Ha mindkettő refresh_selection Ésfull_refresh_selection üresek, a teljes folyamatdiagram frissül.Hiba jelenik meg, ha: * full_refesh igaz ésrefresh_selection be van állítva.* A megadott táblák közül legalább egy nem létezik a folyamatgráfban. |
full_refresh_selection |
Egy tömb a STRING |
A teljes frissítéssel frissítendő táblák listája. A kijelölt táblakészlet frissítésének elindítására használható full_refresh_selection . A megadott táblák állapotai alaphelyzetbe állnak, mielőtt a Delta Live Tables rendszer elindítja a frissítést.A mező nem kötelező. Ha mindkettő refresh_selection Ésfull_refresh_selection üresek, a teljes folyamatdiagram frissül.Hiba jelenik meg, ha: * full_refesh igaz ésrefresh_selection be van állítva.* A megadott táblák közül legalább egy nem létezik a folyamatgráfban. * A megadott táblák közül legalább egy nem állítható alaphelyzetbe. |
Válaszstruktúra
Mező neve | Típus | Leírás |
---|---|---|
update_id |
STRING |
Az újonnan létrehozott frissítés egyedi azonosítója. |
request_id |
STRING |
A frissítést kezdeményező kérés egyedi azonosítója. |
Folyamatfrissítési kérelem állapotának lekérése
Végpont | HTTP-metódus |
---|---|
2.0/pipelines/{pipeline_id}/requests/{request_id} |
GET |
Lekéri a folyamatfrissítés állapotát és adatait, amely request_id
a folyamatfrissítést request_id
kezdeményező kérés egyedi azonosítója. Ha a frissítés újrapróbálkozott vagy újraindult, az új frissítés örökli a request_id.
Példa
Az azonosítóval a12cd3e4-0ab1-1abc-1a2b-1a2bcd3e4fg5
rendelkező folyamat esetében ez a példa a kérelemazonosítóhoz a83d9f7c-d798-4fd5-aa39-301b6e6f4429
társított frissítés állapotát és adatait adja vissza:
Kérés
curl --netrc -X GET \
https://<databricks-instance>/api/2.0/pipelines/a12cd3e4-0ab1-1abc-1a2b-1a2bcd3e4fg5/requests/a83d9f7c-d798-4fd5-aa39-301b6e6f4429
Csere:
<databricks-instance>
például az Azure Databricks-munkaterület nevéveladb-1234567890123456.7.azuredatabricks.net
.
Ez a példa egy .netrc-fájlt használ.
Válasz
{
"status": "TERMINATED",
"latest_update":{
"pipeline_id": "a12cd3e4-0ab1-1abc-1a2b-1a2bcd3e4fg5",
"update_id": "90da8183-89de-4715-b5a9-c243e67f0093",
"config":{
"id": "aae89b88-e97e-40c4-8e1a-1b7ac76657e8",
"name": "Retail sales (SQL)",
"storage": "/Users/username/data",
"configuration":{
"pipelines.numStreamRetryAttempts": "5"
},
"clusters":[
{
"label": "default",
"autoscale":{
"min_workers": 1,
"max_workers": 5,
"mode": "ENHANCED"
}
}
],
"libraries":[
{
"notebook":{
"path": "/Users/username/DLT Notebooks/Delta Live Tables quickstart (SQL)"
}
}
],
"continuous": false,
"development": true,
"photon": true,
"edition": "advanced",
"channel": "CURRENT"
},
"cause": "API_CALL",
"state": "COMPLETED",
"cluster_id": "1234-567891-abcde123",
"creation_time": 1664304117145,
"full_refresh": false,
"request_id": "a83d9f7c-d798-4fd5-aa39-301b6e6f4429"
}
}
Válaszstruktúra
Mező neve | Típus | Leírás |
---|---|---|
status |
STRING |
A folyamatfrissítési kérelem állapota. A következők egyike: * ACTIVE : A kérés frissítése aktívan fut, vagy újrapróbálkozhat egy új frissítésben.* TERMINATED : A kérés le van állítva, és nem lesz újrapróbálkozott vagy újraindul. |
pipeline_id |
STRING |
A folyamat egyedi azonosítója. |
update_id |
STRING |
A frissítés egyedi azonosítója. |
config |
Folyamat Gépház | A folyamat beállításai. |
cause |
STRING |
A frissítés eseményindítója. Az egyik,API_CALL RETRY_ON_FAILURE , SERVICE_UPGRADE , SCHEMA_CHANGE JOB_TASK USER_ACTION vagy . |
state |
STRING |
A frissítés állapota. Az egyik,QUEUED CREATED WAITING_FOR_RESOURCES , INITIALIZING , RESETTING SETTING_UP_TABLES , RUNNING , STOPPING , COMPLETED FAILED CANCELED vagy . |
cluster_id |
STRING |
A frissítést futtató fürt azonosítója. |
creation_time |
INT64 |
A frissítés létrehozásának időbélyege. |
full_refresh |
BOOLEAN |
Azt jelzi, hogy ez a frissítés alaphelyzetbe állítja-e az összes táblát a futtatás előtt |
refresh_selection |
Egy tömb a STRING |
A teljes frissítés nélkül frissítendő táblák listája. |
full_refresh_selection |
Egy tömb a STRING |
A teljes frissítéssel frissítendő táblák listája. |
request_id |
STRING |
A frissítést kezdeményező kérés egyedi azonosítója. Ez a frissítési kérelem által visszaadott érték. Ha a frissítés újrapróbálkozott vagy újraindult, az új frissítés örökli a request_id. A update_id különbség azonban más lesz. |
Aktív folyamat frissítésének leállítása
Végpont | HTTP-metódus |
---|---|
2.0/pipelines/{pipeline_id}/stop |
POST |
Leállítja az aktív folyamatfrissítéseket. Ha nem fut frissítés, ez a kérés nem működik.
Folyamatos folyamat esetén a folyamat végrehajtása szünetel. A jelenleg feldolgozás alatt álló táblák frissítése befejeződött, de az alsóbb rétegbeli táblák nem frissülnek. A következő folyamatfrissítés során a Delta Live Tables végrehajtja azon táblák kijelölt frissítését, amelyek nem fejeztek be feldolgozást, és folytatja a fennmaradó folyamat DAG feldolgozását.
Egy aktivált folyamat esetében a folyamat végrehajtása le van állítva. A jelenleg feldolgozás alatt álló táblák frissítése befejeződött, de az alsóbb rétegbeli táblák nem frissülnek. A következő folyamatfrissítés során a Delta Live Tables az összes táblát frissíti.
Példa
Ez a példa leállítja a folyamat frissítését azonosítóval a12cd3e4-0ab1-1abc-1a2b-1a2bcd3e4fg5
:
Kérés
curl --netrc -X POST \
https://<databricks-instance>/api/2.0/pipelines/a12cd3e4-0ab1-1abc-1a2b-1a2bcd3e4fg5/stop
Csere:
<databricks-instance>
például az Azure Databricks-munkaterület nevéveladb-1234567890123456.7.azuredatabricks.net
.
Ez a példa egy .netrc-fájlt használ.
Folyamatesemények listázása
Végpont | HTTP-metódus |
---|---|
2.0/pipelines/{pipeline_id}/events |
GET |
Egy folyamat eseményeit kéri le.
Példa
Ez a példa legfeljebb 5 eseményt kér le a folyamathoz azonosítóval a12cd3e4-0ab1-1abc-1a2b-1a2bcd3e4fg5
.
Kérés
curl --netrc -X GET \
https://<databricks-instance>/api/2.0/pipelines/a12cd3e4-0ab1-1abc-1a2b-1a2bcd3e4fg5/events?max_results=5
Csere:
<databricks-instance>
például az Azure Databricks-munkaterület nevéveladb-1234567890123456.7.azuredatabricks.net
.
Ez a példa egy .netrc-fájlt használ.
Kérelemstruktúra
Mező neve | Típus | Leírás |
---|---|---|
page_token |
STRING |
Az előző hívás által visszaadott lap jogkivonata. Ez a mező kölcsönösen kizárja a kérés összes mezőjét, kivéve max_results. A rendszer hibát ad vissza, ha a mező beállításakor a max_results kívül más mezők is be vannak állítva. A mező nem kötelező. |
max_results |
INT32 |
Az egy oldalon visszaadandó bejegyzések maximális száma. A rendszer akkor is kevesebb eseményt ad vissza, mint max_results a válaszban szereplő események, még akkor is, ha több esemény áll rendelkezésre.A mező nem kötelező. Az alapértelmezett érték 25. A maximális érték 100. A függvény hibát ad vissza, ha a max_results nagyobb, mint 100. |
order_by |
STRING |
Az eredmények időbélyege szerinti rendezési sorrendet jelző sztring, például ["timestamp asc"] .A rendezési sorrend növekvő vagy csökkenő lehet. Alapértelmezés szerint az események időbélyeg szerint csökkenő sorrendben jelennek meg. A mező nem kötelező. |
filter |
STRING |
Az eredmények egy részhalmazának kiválasztására vonatkozó feltételek SQL-szerű szintaxissal kifejezve. A támogatott szűrők a következők: * level='INFO' (vagy WARN ERROR )* level in ('INFO', 'WARN') * id='[event-id]' * timestamp > 'TIMESTAMP' (vagy >= ,< ,<= ,)= Az összetett kifejezések támogatottak, például: level in ('ERROR', 'WARN') AND timestamp> '2021-07-22T06:37:33.083Z' A mező nem kötelező. |
Válaszstruktúra
Mező neve | Típus | Leírás |
---|---|---|
events |
Folyamatesemények tömbje. | A kérelem feltételeinek megfelelő események listája. |
next_page_token |
STRING |
Ha jelen van, egy jogkivonat az események következő oldalának lekéréséhez. |
prev_page_token |
STRING |
Ha jelen van, egy jogkivonat, amely lekéri az előző eseményoldalt. |
Folyamat részleteinek lekérése
Végpont | HTTP-metódus |
---|---|
2.0/pipelines/{pipeline_id} |
GET |
Lekéri a folyamat részleteit, beleértve a folyamat beállításait és a legutóbbi frissítéseket.
Példa
Ez a példa beolvasja a folyamat részleteit az azonosítóval a12cd3e4-0ab1-1abc-1a2b-1a2bcd3e4fg5
:
Kérés
curl --netrc -X GET \
https://<databricks-instance>/api/2.0/pipelines/a12cd3e4-0ab1-1abc-1a2b-1a2bcd3e4fg5
Csere:
<databricks-instance>
például az Azure Databricks-munkaterület nevéveladb-1234567890123456.7.azuredatabricks.net
.
Ez a példa egy .netrc-fájlt használ.
Válasz
{
"pipeline_id": "a12cd3e4-0ab1-1abc-1a2b-1a2bcd3e4fg5",
"spec": {
"id": "a12cd3e4-0ab1-1abc-1a2b-1a2bcd3e4fg5",
"name": "Wikipedia pipeline (SQL)",
"storage": "/Users/username/data",
"clusters": [
{
"label": "default",
"autoscale": {
"min_workers": 1,
"max_workers": 5,
"mode": "ENHANCED"
}
}
],
"libraries": [
{
"notebook": {
"path": "/Users/username/DLT Notebooks/Delta Live Tables quickstart (SQL)"
}
}
],
"target": "wikipedia_quickstart_data",
"continuous": false
},
"state": "IDLE",
"cluster_id": "1234-567891-abcde123",
"name": "Wikipedia pipeline (SQL)",
"creator_user_name": "username",
"latest_updates": [
{
"update_id": "8a0b6d02-fbd0-11eb-9a03-0242ac130003",
"state": "COMPLETED",
"creation_time": "2021-08-13T00:37:30.279Z"
},
{
"update_id": "a72c08ba-fbd0-11eb-9a03-0242ac130003",
"state": "CANCELED",
"creation_time": "2021-08-13T00:35:51.902Z"
},
{
"update_id": "ac37d924-fbd0-11eb-9a03-0242ac130003",
"state": "FAILED",
"creation_time": "2021-08-13T00:33:38.565Z"
}
],
"run_as_user_name": "username"
}
Válaszstruktúra
Mező neve | Típus | Leírás |
---|---|---|
pipeline_id |
STRING |
A folyamat egyedi azonosítója. |
spec |
Folyamat Gépház | A folyamat beállításai. |
state |
STRING |
A folyamat állapota. Az egyik vagy IDLE RUNNING a másik.Ha az állapot = RUNNING , akkor legalább egy aktív frissítés van. |
cluster_id |
STRING |
A folyamatot futtató fürt azonosítója. |
name |
STRING |
A folyamat felhasználóbarát neve. |
creator_user_name |
STRING |
A folyamat létrehozójának felhasználóneve. |
latest_updates |
Az UpdateStateInfo tömbje | A folyamat legújabb frissítéseinek állapota, elsőként a legújabb frissítéssel rendezve. |
run_as_user_name |
STRING |
A folyamat által futtatott felhasználónév. |
Frissítés részleteinek lekérése
Végpont | HTTP-metódus |
---|---|
2.0/pipelines/{pipeline_id}/updates/{update_id} |
GET |
Lekéri a folyamatfrissítés részleteit.
Példa
Ez a példa beolvasja a folyamat frissítésének 9a84f906-fc51-11eb-9a03-0242ac130003
részleteit az azonosítóval a12cd3e4-0ab1-1abc-1a2b-1a2bcd3e4fg5
:
Kérés
curl --netrc -X GET \
https://<databricks-instance>/api/2.0/pipelines/a12cd3e4-0ab1-1abc-1a2b-1a2bcd3e4fg5/updates/9a84f906-fc51-11eb-9a03-0242ac130003
Csere:
<databricks-instance>
például az Azure Databricks-munkaterület nevéveladb-1234567890123456.7.azuredatabricks.net
.
Ez a példa egy .netrc-fájlt használ.
Válasz
{
"update": {
"pipeline_id": "a12cd3e4-0ab1-1abc-1a2b-1a2bcd3e4fg5",
"update_id": "9a84f906-fc51-11eb-9a03-0242ac130003",
"config": {
"id": "a12cd3e4-0ab1-1abc-1a2b-1a2bcd3e4fg5",
"name": "Wikipedia pipeline (SQL)",
"storage": "/Users/username/data",
"configuration": {
"pipelines.numStreamRetryAttempts": "5"
},
"clusters": [
{
"label": "default",
"autoscale": {
"min_workers": 1,
"max_workers": 5,
"mode": "ENHANCED"
}
}
],
"libraries": [
{
"notebook": {
"path": "/Users/username/DLT Notebooks/Delta Live Tables quickstart (SQL)"
}
}
],
"target": "wikipedia_quickstart_data",
"continuous": false,
"development": false
},
"cause": "API_CALL",
"state": "COMPLETED",
"creation_time": 1628815050279,
"full_refresh": true,
"request_id": "a83d9f7c-d798-4fd5-aa39-301b6e6f4429"
}
}
Válaszstruktúra
Mező neve | Típus | Leírás |
---|---|---|
pipeline_id |
STRING |
A folyamat egyedi azonosítója. |
update_id |
STRING |
A frissítés egyedi azonosítója. |
config |
Folyamat Gépház | A folyamat beállításai. |
cause |
STRING |
A frissítés eseményindítója. Az egyik,API_CALL RETRY_ON_FAILURE , SERVICE_UPGRADE . |
state |
STRING |
A frissítés állapota. Az egyik,QUEUED CREATED WAITING_FOR_RESOURCES , INITIALIZING , RESETTING SETTING_UP_TABLES , RUNNING , STOPPING , COMPLETED FAILED CANCELED vagy . |
cluster_id |
STRING |
A folyamatot futtató fürt azonosítója. |
creation_time |
INT64 |
A frissítés létrehozásának időbélyege. |
full_refresh |
BOOLEAN |
Hogy ez teljes frissítés volt-e. Ha igaz, a frissítés futtatása előtt az összes folyamattábla alaphelyzetbe lett állítva. |
Folyamatok listázása
Végpont | HTTP-metódus |
---|---|
2.0/pipelines/ |
GET |
Felsorolja a Delta Live Tables rendszerben definiált folyamatokat.
Példa
Ez a példa azoknak a folyamatoknak a részleteit kéri le, ahol a név tartalmazza a következőt quickstart
:
Kérés
curl --netrc -X GET \
https://<databricks-instance>/api/2.0/pipelines?filter=name%20LIKE%20%27%25quickstart%25%27
Csere:
<databricks-instance>
például az Azure Databricks-munkaterület nevéveladb-1234567890123456.7.azuredatabricks.net
.
Ez a példa egy .netrc-fájlt használ.
Válasz
{
"statuses": [
{
"pipeline_id": "e0f01758-fc61-11eb-9a03-0242ac130003",
"state": "IDLE",
"name": "DLT quickstart (Python)",
"latest_updates": [
{
"update_id": "ee9ae73e-fc61-11eb-9a03-0242ac130003",
"state": "COMPLETED",
"creation_time": "2021-08-13T00:34:21.871Z"
}
],
"creator_user_name": "username"
},
{
"pipeline_id": "f4c82f5e-fc61-11eb-9a03-0242ac130003",
"state": "IDLE",
"name": "My DLT quickstart example",
"creator_user_name": "username"
}
],
"next_page_token": "eyJ...==",
"prev_page_token": "eyJ..x9"
}
Kérelemstruktúra
Mező neve | Típus | Leírás |
---|---|---|
page_token |
STRING |
Az előző hívás által visszaadott lap jogkivonata. A mező nem kötelező. |
max_results |
INT32 |
Az egy oldalon visszaadandó bejegyzések maximális száma. A rendszer akkor is kevesebb eseményt ad vissza, mint max_results a válaszban szereplő események, még akkor is, ha több esemény áll rendelkezésre.A mező nem kötelező. Az alapértelmezett érték 25. A maximális érték 100. A függvény hibát ad vissza, ha a max_results nagyobb, mint 100. |
order_by |
Egy tömb a STRING |
Az eredmények sorrendjét meghatározó sztringek listája, például["name asc"] . A támogatott order_by mezők a következők:id name . Az alapértelmezett érték id asc .A mező nem kötelező. |
filter |
STRING |
Válasszon ki egy részhalmazt az eredményekből a megadott feltételek alapján. A támogatott szűrők a következők: "notebook='<path>'" a megadott jegyzetfüzet elérési útjára hivatkozó folyamatok kiválasztásához.name LIKE '[pattern]' a megfelelő nevű folyamatok kiválasztásához pattern . A helyettesítő karakterek támogatottak, például:name LIKE '%shopping%' Az összetett szűrők nem támogatottak. A mező nem kötelező. |
Válaszstruktúra
Adatstruktúrák
Ebben a szakaszban:
- ABFSSStorageInfo
- ClusterLogConf
- DbfsStorageInfo
- FileStorageInfo
- InitScriptInfo
- KeyValue
- NotebookLibrary
- PipelinesAutoScale
- PipelineLibrary
- PipelinesNewCluster
- Folyamat Gépház
- PipelineStateInfo
- UpdateStateInfo
- WorkspaceStorageInfo
ABFSSStorageInfo
Az Azure Data Lake Storage (ADLS) tárolási adatai.
Mező neve | Típus | Leírás |
---|---|---|
destination |
STRING |
Fájl célhelye. Példa: abfss://... |
ClusterLogConf
A fürtnapló elérési útja.
Mező neve | Típus | Leírás |
---|---|---|
dbfs |
DbfsStorageInfo | A fürtnapló DBFS-helye. Meg kell adni a célhelyet. Például:{ "dbfs" : { "destination" : "dbfs:/home/cluster_log" } } |
DbfsStorageInfo
A DBFS tárolási adatai.
Mező neve | Típus | Leírás |
---|---|---|
destination |
STRING |
DBFS-célhely. Példa: dbfs:/my/path |
FileStorageInfo
Fájltárolási információk.
Feljegyzés
Ez a helytípus csak a Databricks Container Services használatával beállított fürtök esetében érhető el.
Mező neve | Típus | Leírás |
---|---|---|
destination |
STRING |
Fájl célhelye. Példa: file:/my/file.sh |
InitScriptInfo
Init-szkript elérési útja.
Az init-szkriptek Databricks Container Services szolgáltatással való használatára vonatkozó utasításokért lásd: Init-szkript használata.
Feljegyzés
A fájltároló típusa (mező neve: file
) csak a Databricks Container Services használatával beállított fürtök esetében érhető el. Lásd: FileStorageInfo.
Mező neve | Típus | Leírás |
---|---|---|
workspace VAGYdbfs (elavult)VAGY abfss |
WorkspaceStorageInfo DbfsStorageInfo (elavult) ABFSSStorageInfo |
Az init-szkript munkaterületi helye. Meg kell adni a célhelyet. Például:{ "workspace" : { "destination" : "/Users/someone@domain.com/init_script.sh" } } (Elavult) Az init szkript DBFS-helye. Meg kell adni a célhelyet. Például: { "dbfs" : { "destination" : "dbfs:/home/init_script" } } Az Init-szkript Azure Data Lake Storage (ADLS) helye. Meg kell adni a célhelyet. Például: { "abfss": { "destination" : "abfss://..." } } |
KeyValue
A konfigurációs paramétereket meghatározó kulcs-érték pár.
Mező neve | Típus | Leírás |
---|---|---|
key |
STRING |
A konfigurációs tulajdonság neve. |
value |
STRING |
A konfigurációs tulajdonság értéke. |
NotebookLibrary
Folyamatkódot tartalmazó jegyzetfüzet specifikációja.
Mező neve | Típus | Leírás |
---|---|---|
path |
STRING |
A jegyzetfüzet abszolút elérési útja. Ez a mező kötelező. |
PipelinesAutoScale
Automatikus skálázási fürtöt meghatározó attribútumok.
Mező neve | Típus | Leírás |
---|---|---|
min_workers |
INT32 |
Azoknak a dolgozóknak a minimális száma, akikre a fürt kihasználatlan állapotban leskálázható. A fürt kezdeti számú feldolgozója is lesz a létrehozás után. |
max_workers |
INT32 |
Azoknak a dolgozóknak a maximális száma, akikre a fürt túlterhelt állapotban felskálázható. max_workers szigorúan nagyobbnak kell lennie, mint min_workers. |
mode |
STRING |
A fürt automatikus skálázási módja: * ENHANCED továbbfejlesztett automatikus skálázás használatához.* LEGACY a fürt automatikus skálázási funkciójának használatához. |
PipelineLibrary
A folyamatfüggőségek specifikációja.
Mező neve | Típus | Leírás |
---|---|---|
notebook |
NotebookLibrary | A Delta Live Tables-adatkészleteket meghatározó jegyzetfüzet elérési útja. Az elérési útnak a Databricks-munkaterületen kell lennie, például:{ "notebook" : { "path" : "/my-pipeline-notebook-path" } } . |
PipelinesNewCluster
Folyamatfürt-specifikáció.
A Delta Live Tables rendszer a következő attribútumokat állítja be. Ezeket az attribútumokat a felhasználók nem konfigurálhatják:
spark_version
Mező neve | Típus | Leírás |
---|---|---|
label |
STRING |
A fürt specifikációjának címkéje, vagydefault az alapértelmezett fürt konfigurálásához, vagymaintenance a karbantartási fürt konfigurálásához.A mező nem kötelező. Az alapértelmezett érték default . |
spark_conf |
KeyValue | Nem kötelező, felhasználó által megadott Spark-konfigurációs kulcs-érték párokat tartalmazó objektum. További JVM-beállítások sztringjét is átadhatja az illesztőprogramnak és a végrehajtóknak aspark.driver.extraJavaOptions és spark.executor.extraJavaOptions más néven.Példa Spark confs: {"spark.speculation": true, "spark.streaming.ui.retainedBatches": 5} vagy{"spark.driver.extraJavaOptions": "-verbose:gc -XX:+PrintGCDetails"} |
node_type_id |
STRING |
Ez a mező egyetlen értéken keresztül kódolja a fürt összes Spark-csomópontja számára elérhető erőforrásokat. A Spark-csomópontok például kiéphetők és optimalizálhatók memória- vagy számítási feladatokhoz. Az elérhető csomóponttípusok listája lekérhető a Clusters API-hívással . |
driver_node_type_id |
STRING |
A Spark-illesztőprogram csomóponttípusa. Ez a mező nem kötelező; ha nincs megadva, az illesztőcsomópont típusa ugyanazzal az értékkel lesz beállítva, mint a node_type_id fent definiált. |
ssh_public_keys |
Egy tömb a STRING |
Nyilvános SSH-kulcs tartalma, amely a fürt minden Spark-csomópontjára fel lesz adva. A megfelelő titkos kulcsokkal bejelentkezhet a porton 2200 lévő felhasználónévvelubuntu . Legfeljebb 10 kulcs adható meg. |
custom_tags |
KeyValue | A fürterőforrások címkéinek készletét tartalmazó objektum. A Databricks a default_tags mellett az összes fürterőforrást is címkéz. Megjegyzés: * A címkék nem támogatottak az olyan örökölt csomóponttípusokon, mint a számításra optimalizált és a memóriaoptimalizált * Az Azure Databricks legfeljebb 45 egyéni címkét engedélyez. |
cluster_log_conf |
ClusterLogConf | A Spark-naplók hosszú távú tárolási célhelyre történő kézbesítésének konfigurációja. Egyetlen fürthöz csak egy cél adható meg. Ha ez a konfiguráció meg van adva, a naplók minden5 mins . Az illesztőprogram-naplók <destination>/<cluster-ID>/driver célja , míg a végrehajtói naplók célhelye.<destination>/<cluster-ID>/executor |
spark_env_vars |
KeyValue | Nem kötelező, felhasználó által megadott környezeti változókulcs-érték párokat tartalmazó objektum. Az űrlap kulcs-érték párjai (X,Y) a következőképpen lesznek exportálva (azazexport X='Y' ), miközben elindítja a vezetőt és a dolgozókat.További készlet SPARK_DAEMON_JAVA_OPTS megadásához a Databricks azt javasolja, hogy $SPARK_DAEMON_JAVA_OPTS fűzze hozzá őket az alábbi példában látható módon. Ez biztosítja, hogy az Azure Databricks által felügyelt összes alapértelmezett környezeti változó is szerepel benne.Példa Spark-környezeti változókra: {"SPARK_WORKER_MEMORY": "28000m", "SPARK_LOCAL_DIRS": "/local_disk0"} vagy{"SPARK_DAEMON_JAVA_OPTS": "$SPARK_DAEMON_JAVA_OPTS -Dspark.shuffle.service.enabled=true"} |
init_scripts |
Az InitScriptInfo tömbje | Init-szkriptek tárolásának konfigurációja. Tetszőleges számú célhely megadható. A szkriptek egymás után, a megadott sorrendben lesznek végrehajtva. Ha cluster_log_conf meg van adva, a rendszer init szkriptnaplókat küld a következő címre:<destination>/<cluster-ID>/init_scripts . |
instance_pool_id |
STRING |
Annak a példánykészletnek az opcionális azonosítója, amelyhez a fürt tartozik. Lásd: Készletkonfigurációs referencia. |
driver_instance_pool_id |
STRING |
Az illesztőprogram-csomóponthoz használandó példánykészlet opcionális azonosítója. Meg kell adnia azt is, hogyinstance_pool_id . Lásd: Példánykészletek API. |
policy_id |
STRING |
Fürtházirend-azonosító. |
num_workers OR autoscale |
INT32 VAGY InitScriptInfo |
Ha num_workers, a fürthöz tartozó munkavégző csomópontok száma. A fürtök egyetlen Spark-illesztőprogramot és num_workers végrehajtókat num_workers + 1 Spark-csomóponthoz. Egy fürt tulajdonságainak olvasásakor ez a mező a feldolgozók kívánt számát tükrözi, nem pedig a tényleges feldolgozók számát. Ha például egy fürtöt 5-ről 10-re méreteznek át, ez a mező a 10 feldolgozó célméretének megfelelően frissül, míg a végrehajtókban felsorolt feldolgozók fokozatosan 5-ről 10-re nőnek az új csomópontok kiépítésekor. Automatikus skálázás esetén a fürtök terhelés alapján automatikusan fel- és leskálázásához szükséges paraméterek. A mező nem kötelező. |
apply_policy_default_values |
BOOLEAN |
A hiányzó fürtattribútumok házirend alapértelmezett értékeinek használata. |
Folyamat Gépház
A folyamattelepítés beállításai.
Mező neve | Típus | Leírás |
---|---|---|
id |
STRING |
A folyamat egyedi azonosítója. Az azonosítót a Delta Live Tables rendszer hozza létre, és nem adható meg folyamat létrehozásakor. |
name |
STRING |
A folyamat felhasználóbarát neve. A mező nem kötelező. Alapértelmezés szerint a folyamat nevének egyedinek kell lennie. Ismétlődő név használatához állítsa be allow_duplicate_names true a folyamatkonfigurációban megadott nevet. |
storage |
STRING |
A folyamat által létrehozott ellenőrzőpontok és táblák tárolására szolgáló DBFS-címtár elérési útja. A mező nem kötelező. A rendszer alapértelmezett helyet használ, ha ez a mező üres. |
configuration |
Térkép: STRING:STRING |
A folyamatot futtató fürt Spark-konfigurációjához hozzáadandó kulcs-érték párok listája. A mező nem kötelező. Az elemeket kulcs:érték párként kell formázni. |
clusters |
A PipelinesNewCluster tömbje | A folyamat futtatásához szükséges fürtök specifikációinak tömbje. A mező nem kötelező. Ha ez nincs megadva, a rendszer kiválasztja a folyamat alapértelmezett fürtkonfigurációját. |
libraries |
PipelineLibrary tömb | A folyamatkódot és a folyamat futtatásához szükséges függőségeket tartalmazó jegyzetfüzetek. |
target |
STRING |
Adatbázisnév a folyamat kimeneti adatainak megőrzéséhez. További információt a Delta Live Tables adatainak közzététele a Hive metaadattárban című témakörben talál. |
continuous |
BOOLEAN |
Akár folyamatos folyamatról van szó. A mező nem kötelező. Az alapértelmezett érték false . |
development |
BOOLEAN |
A folyamat fejlesztési módban való futtatása. A mező nem kötelező. Az alapértelmezett érték false . |
photon |
BOOLEAN |
Azt jelzi, hogy a fotongyorsítás engedélyezve van-e ehhez a folyamathoz. A mező nem kötelező. Az alapértelmezett érték false . |
channel |
STRING |
A Delta Live Tables kiadási csatornája, amely megadja a folyamathoz használandó futtatókörnyezeti verziót. A támogatott értékek a következők: * preview a folyamat teszteléséhez a Delta Live Tables futtatókörnyezetének közelgő módosításaival.* current a Delta Live Tables aktuális futtatókörnyezeti verziójának használatához.A mező nem kötelező. Az alapértelmezett érték current . |
edition |
STRING |
A Folyamat futtatásához a Delta Live Tables termékkiadása: * CORE támogatja a streamelési számítási feladatokat.* PRO támogatja a streamelési számítási feladatokat is, és támogatja a módosítási adatrögzítés (CDC) feldolgozását.* ADVANCED támogatja a kiadás összes funkcióját, és támogatja azokat a PRO számítási feladatokat, amelyekhez Delta Live Tables-elvárások szükségesek az adatminőségi korlátozások kikényszerítéséhez.A mező nem kötelező. Az alapértelmezett érték advanced . |
PipelineStateInfo
A folyamat állapota, a legújabb frissítések állapota és a társított erőforrásokra vonatkozó információk.
UpdateStateInfo
A folyamatfrissítés aktuális állapota.
Mező neve | Típus | Leírás |
---|---|---|
update_id |
STRING |
A frissítés egyedi azonosítója. |
state |
STRING |
A frissítés állapota. Az egyik QUEUED , CREATED WAITING_FOR_RESOURCES , INITIALIZING , RESETTING SETTING_UP_TABLES , RUNNING , STOPPING , COMPLETED FAILED CANCELED vagy . |
creation_time |
STRING |
Időbélyeg a frissítés létrehozásakor. |
WorkspaceStorageInfo
Munkaterület tárolási adatai.
Mező neve | Típus | Leírás |
---|---|---|
destination |
STRING |
Fájl célhelye. Példa: /Users/someone@domain.com/init_script.sh |
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: