Jegyzékalapú betöltési fogalmak

A jegyzékalapú fájlbetöltés hatékony mechanizmust biztosít a végfelhasználóknak és a rendszereknek az Azure Data Manager for Energy-példányban található adathalmazok metaadatainak betöltéséhez. Ezt a metaadatokat a rendszer indexeli, és lehetővé teszi a végfelhasználó számára az adathalmazok keresését.

A jegyzékalapú fájlbetöltés olyan átlátszatlan betöltési művelet, amely nem elemzi vagy nem értelmezi a fájl tartalmát. Létrehoz egy metaadatrekordot a jegyzék alapján, és kereshetővé teszi a rekordot.

Mi az a jegyzék?

A jegyzék egy JSON-dokumentum, amely előre meghatározott struktúrával rendelkezik a "kind" néven definiált entitások rögzítéséhez, azaz sémákként regisztrálva a sémaszolgáltatás – jól ismert séma (WKS) definícióiban.

Itt talál egy példajegyzék json-dokumentumot.

A jegyzékséma tárolókkal rendelkezik az alábbi OSDU-csoporttípusokhoz®:

  • ReferenceData (nulla vagy több) – Más (fő vagy tranzakciós) adatmezők által használandó megengedett értékek halmaza. Ilyenek például a mértékegység (láb), a pénznem stb.
  • MasterData (nulla vagy több) – Több rendszerben, alkalmazásban és/vagy folyamatban használt alapszintű üzleti adatok egyetlen forrása. Ilyenek például a Wells és a Wellbores
  • WorkProduct (WP) (egy – a WorkProductComponents betöltésekor jelen kell lennie) – A munkamenet-határ vagy gyűjtemény (projekt, tanulmány) olyan entitásokat foglal magában, amelyeket együtt kell feldolgozni. Példaként egy vagy több naplógyűjtemény betöltését is elvégezheti.
  • WorkProductComponents (WPC) (nulla vagy több – adathalmazok betöltésekor jelen kell lennie) – Egy munkahelyi termék részeként átvitt üzletiadat-tartalom begépelt, legkisebb, egymástól függetlenül használható egysége (az együtt betöltött dolgok gyűjteménye). Minden munkatermék-összetevő (WPC) általában referenciaadatokat használ, néhány főadathoz tartozik, és megőrzi az adathalmazokra mutató hivatkozást. Példa: Kútnaplók, hibák, dokumentumok
  • Az adatkészleteknek (nulla vagy több - a WorkProduct és a WorkProductComponent rekord betöltésekor) jelen kell lenniük. Minden munkatermék-összetevő (WPC) egy vagy több adattárolóból, úgynevezett adatkészletből áll.

A jegyzékadatok egy adott sorrendben töltődnek be:

  1. A "ReferenceData" tömb (ha fel van töltve).
  2. A "MasterData" tömb (ha fel van töltve).
  3. Az "Adatok" struktúrát a rendszer utoljára dolgozza fel (ha fel van töltve). Az "Adatok" tulajdonságon belül a feldolgozás a következő sorrendben történik:
    1. az "Adathalmazok" tömb
    2. a "WorkProductComponents" tömb
    3. a "WorkProduct".

Minden tömb rendezve van. ha vannak egymástól függő elemek, a függő elemeket a kapcsolati célok mögé kell helyezni, például egy master-data Well rekordot a "MasterData" tömbben kell elhelyezni a kútfúrások előtt.

Jegyzékalapú fájlbetöltési munkafolyamat

Az Azure Data Manager for Energy-példány beépített támogatással rendelkezik a Jegyzékalapú fájlbetöltési munkafolyamathoz. Osdu_ingest Az Airflow DAG előre konfigurálva van a példányban.

Jegyzékalapú fájlbetöltési munkafolyamat összetevői

A Jegyzékalapú fájlbetöltési munkafolyamat a következő összetevőkből áll:

  • Munkafolyamat-szolgáltatás – Az Airflow munkafolyamat-motor tetején futó burkolószolgáltatás.
  • Airflow motor – Egy munkafolyamat-vezénylési motor, amely DAG-ként (irányított Aciklikus grafikonok) regisztrált munkafolyamatokat hajt végre. Az Airflow az OSDU-közösség® által kiválasztott munkafolyamat-motor a betöltési munkafolyamatok vezényléséhez és futtatásához. Az Airflow nem érhető el közvetlenül, ehelyett a funkciók a munkafolyamat-szolgáltatáson keresztül érhetők el.
  • Storage Service – A jegyzék metaadat-rekordjainak adatplatformba való mentésére szolgáló szolgáltatás.
  • Sémaszolgáltatás – Az OSDU® által definiált sémákat az adatplatformon kezelő szolgáltatás. A jegyzékalapú fájlbetöltés során sémákra hivatkozunk.
  • Jogosultságok szolgáltatás – Hozzáférési csoportokat kezelő szolgáltatás. Ezt a szolgáltatást a betöltési engedélyek ellenőrzése során használja a rendszer. Ezt a szolgáltatást a metaadatrekord lekérése során is használják az "olvasási" írások ellenőrzéséhez.
  • Jogi szolgáltatás – Egy szolgáltatás, amely jogi címkéken keresztül ellenőrzi a megfelelőséget.
  • A Keresési szolgáltatás a hivatkozási integritás ellenőrzésére szolgál a jegyzékbetöltési folyamat során.

Előfeltételek

A Jegyzékalapú fájlbetöltési munkafolyamat futtatása előtt az ügyfeleknek gondoskodniuk kell arról, hogy a munkafolyamatot futtató felhasználói fiókok hozzáférjenek az alapvető szolgáltatásokhoz (Keresés, Tárolás, Séma, Jogosultság és Jogi) és Munkafolyamat-szolgáltatáshoz (részletekért lásd a jogosultsági szerepköröket ). Az Azure Data Manager energiapéldány-kiépítésének részeként az OSDU® standard sémái és a kapcsolódó referenciaadatok előre betöltődnek. Az ügyfeleknek gondoskodniuk kell arról, hogy a jegyzékek betöltéséhez használt felhasználói fiók szerepel-e a megfelelő tulajdonosok és megtekintők ACL-jei között. Az ügyfeleknek gondoskodniuk kell arról, hogy a jegyzékek megfelelő jogi címkékkel, tulajdonosokkal és megtekintőkkel legyenek konfigurálva, ACL-eket, referenciaadatokat stb.

Munkafolyamat-sorozat

Az alábbi ábra a Jegyzékalapú fájlbetöltési munkafolyamatot mutatja be: Képernyőkép a jegyzékbetöltési sorozatról.

A felhasználó elküldi a jegyzékfájlt a Workflow Service jegyzékbetöltési munkafolyamat neve ("Osdu_ingest") használatával. Ha a kérés megfelelő, és a felhasználó jogosult a munkafolyamat futtatására, a munkafolyamat-szolgáltatás betölti a jegyzékfájlt, és elindítja a jegyzékbetöltési munkafolyamatot.

A munkafolyamat-szolgáltatás egy jegyzéksorozatot syntax validation hajt végre, például a jegyzékstruktúrát és az attribútumérvényesítést a megadott sémának megfelelően, és ellenőrzi a kötelező sémaattribútumokat. A rendszer ezután a munkatermék-összetevők és az adatkészletek között hajt referential integrity validation végre műveleteket. Például, hogy a hivatkozott szülőadatok léteznek-e.

Miután az érvényesítés sikeres volt, a rendszer feldolgozza a tartalmat a tárolóba úgy, hogy minden érvényes entitást beír az adatplatformba a Storage Service API használatával.

Az OSDU® a The Open Group védjegye.

Következő lépések