Megosztás a következőn keresztül:


A DICOM-adatok használatának első lépései az elemzési számítási feladatokban

Ez a cikk bemutatja, hogyan kezdheti el a DICOM-adatok® használatát elemzési számítási feladatokban az Azure Data Factory és a Microsoft Fabric használatával.

Előfeltételek

Első lépésként hajtsa végre az alábbi lépéseket:

  • Hozzon létre egy tárfiókot az Azure Data Lake Storage Gen2 képességeivel egy hierarchikus névtér engedélyezésével:
    • Hozzon létre egy tárolót a DICOM-metaadatok tárolásához, például elnevezve dicom.
  • Telepítse a DICOM szolgáltatás egy példányát.
    • (Nem kötelező) Helyezze üzembe a DICOM szolgáltatást a Data Lake Storage-tal a DICOM-fájlokhoz való közvetlen hozzáférés engedélyezéséhez.
  • Data Factory-példány létrehozása:
  • Hozzon létre egy tóházat a Fabricben.
  • Szerepkör-hozzárendelések hozzáadása a Data Factory rendszer által hozzárendelt felügyelt identitásához a DICOM szolgáltatáshoz és a Data Lake Storage Gen2-tárfiókhoz:
    • Adja hozzá a DICOM adatolvasó szerepkört, hogy engedélyt adjon a DICOM szolgáltatásnak.
    • Adja hozzá a Storage Blob Data Contributor szerepkört, hogy engedélyt adjon a Data Lake Storage Gen2-fióknak.

Data Factory-folyamat konfigurálása a DICOM szolgáltatáshoz

Ebben a példában egy Data Factory-folyamatot használunk a példányok, adatsorok és tanulmányok DICOM-attribútumainak delta táblaformátumú tárfiókba való írására.

Az Azure Portalon nyissa meg a Data Factory-példányt, és a kezdéshez válassza a Launch studio (Stúdió indítása) lehetőséget.

Képernyőkép az Azure PortalOn a Stúdió indítása gombról.

Társított szolgáltatások létrehozása

A Data Factory-folyamatok adatforrásokból olvasnak, és adatgyűjtőkbe írnak, amelyek általában más Azure-szolgáltatások. Ezek a kapcsolatok más szolgáltatásokkal társított szolgáltatásokként vannak kezelve.

A példában szereplő folyamat adatokat olvas be egy DICOM-szolgáltatásból, és a kimenetét egy tárfiókba írja, így mindkettőhöz létre kell hozni egy társított szolgáltatást.

Társított szolgáltatás létrehozása a DICOM szolgáltatáshoz

  1. Az Azure Data Factory Studióban válassza a Bal oldali menü Kezelés elemét. A Kapcsolatok területen válassza a Csatolt szolgáltatások lehetőséget, majd az Új lehetőséget.

    Képernyőkép a Csatolt szolgáltatások képernyőről a Data Factoryben.

  2. Az Új társított szolgáltatás panelen keresse meg a REST-et. Jelölje ki a REST csempét, majd válassza a Folytatás lehetőséget.

    Képernyőkép az Új társított szolgáltatás panelről, amelyen a REST csempe van kijelölve.

  3. Adja meg a társított szolgáltatás nevét és leírását .

    Képernyőkép az Új társított szolgáltatás panelről a DICOM szolgáltatás részleteivel.

  4. Az Alap URL-cím mezőben adja meg a DICOM szolgáltatás szolgáltatás URL-címét. A munkaterületen contosohealth elnevezett contosoclinic DICOM-szolgáltatás például rendelkezik a szolgáltatás URL-címévelhttps://contosohealth-contosoclinic.dicom.azurehealthcareapis.com.

  5. A hitelesítés típusához válassza a rendszer által hozzárendelt felügyelt identitást.

  6. Az AAD-erőforráshoz írja be a következőthttps://dicom.healthcareapis.azure.com: . Ez az URL-cím megegyezik az összes DICOM-szolgáltatáspéldány esetében.

  7. Miután kitöltötte a szükséges mezőket, válassza a Kapcsolat tesztelése lehetőséget az identitás szerepköreinek megfelelő konfigurálásához.

  8. Ha a kapcsolati teszt sikeres, válassza a Létrehozás lehetőséget.

Társított szolgáltatás létrehozása az Azure Data Lake Storage Gen2-hez

  1. A Data Factory Studióban válassza a Bal oldali menü Kezelés elemét. A Kapcsolatok területen válassza a Csatolt szolgáltatások lehetőséget, majd az Új lehetőséget.

  2. Az Új társított szolgáltatás panelen keresse meg az Azure Data Lake Storage Gen2-t. Válassza az Azure Data Lake Storage Gen2 csempét, majd a Folytatás lehetőséget.

    Képernyőkép az Új társított szolgáltatás panelről, amelyen az Azure Data Lake Storage Gen2 csempe van kiválasztva.

  3. Adja meg a társított szolgáltatás nevét és leírását .

    Képernyőkép az Új társított szolgáltatás panelről a Data Lake Storage Gen2 részleteivel.

  4. A hitelesítés típusához válassza a rendszer által hozzárendelt felügyelt identitást.

  5. Adja meg a tárfiók adatait a tárfiók URL-címének manuális megadásával. Az Azure-előfizetést és a tárfiókot a legördülő menüből is kiválaszthatja.

  6. Miután kitöltötte a szükséges mezőket, válassza a Kapcsolat tesztelése lehetőséget az identitás szerepköreinek megfelelő konfigurálásához.

  7. Ha a kapcsolati teszt sikeres, válassza a Létrehozás lehetőséget.

Folyamat létrehozása DICOM-adatokhoz

A Data Factory-folyamatok olyan tevékenységek gyűjteményei, amelyek egy feladatot hajtanak végre, például DICOM-metaadatok másolása Delta-táblákba. Ez a szakasz egy olyan folyamat létrehozását ismerteti, amely rendszeresen szinkronizálja a DICOM-adatokat a Delta-táblákkal, amikor az adatokat hozzáadják, frissítik és törölik egy DICOM-szolgáltatásból.

  1. A bal oldali menüben válassza a Szerző lehetőséget. A Gyári erőforrások panelen válassza a pluszjelet (+) egy új erőforrás hozzáadásához. Válassza a Folyamat lehetőséget, majd válassza a Sablongyűjtemény lehetőséget a menüből.

    Képernyőkép a Folyamat területen kijelölt sablongyűjteményről.

  2. A Sablontárban keresse meg a DICOM-t. Válassza a DiCOM Metaadatok másolása az ADLS Gen2-be a Delta Format csempén, majd válassza a Folytatás lehetőséget.

    Képernyőkép a sablongyűjteményben kiválasztott DICOM-sablonról.

  3. A Bemenetek szakaszban válassza ki a DICOM szolgáltatáshoz és a Data Lake Storage Gen2-fiókhoz korábban létrehozott társított szolgáltatásokat.

    Képernyőkép a Bemenetek szakaszról, amelyen a csatolt szolgáltatások ki van választva.

  4. Válassza a Sablon használata lehetőséget az új folyamat létrehozásához.

Folyamat létrehozása DICOM-adatokhoz

Ha a DICOM szolgáltatást az Azure Data Lake Storage-nal hozta létre, a sablongyűjtemény sablonjának használata helyett egy egyéni sablont kell használnia, hogy új fileName paramétert tartalmazzon a metaadat-folyamatba. A folyamat konfigurálásához kövesse az alábbi lépéseket.

  1. Töltse le a sablont a GitHubról. A sablonfájl tömörített (tömörített) mappa. Nem kell kibontania a fájlokat, mert már tömörített formában vannak feltöltve.

  2. Az Azure Data Factoryben válassza a Bal oldali menü Szerző elemét . A Gyári erőforrások panelen válassza a pluszjelet (+) egy új erőforrás hozzáadásához. Válassza a Folyamat lehetőséget, majd válassza az Importálás folyamatsablonból lehetőséget.

  3. A Megnyitás ablakban válassza ki a letöltött sablont. Válassza a Megnyitás lehetőséget.

  4. A Bemenetek szakaszban válassza ki a DICOM szolgáltatáshoz és az Azure Data Lake Storage Gen2-fiókhoz létrehozott társított szolgáltatásokat.

    Képernyőkép a Bemenetek szakaszról, amelyen a társított szolgáltatások ki van jelölve.

  5. Válassza a Sablon használata lehetőséget az új folyamat létrehozásához.

Folyamat ütemezése

A folyamatokat eseményindítók ütemezik. Különböző típusú triggerek léteznek. Az ütemezési eseményindítók lehetővé teszik, hogy a folyamatok a nap meghatározott időszakaiban, például óránként vagy minden nap éjfélkor fussanak. A manuális triggerek igény szerint aktiválják a folyamatokat, ami azt jelenti, hogy mindig futnak, amikor csak szeretné.

Ebben a példában egy ugróablak-eseményindítót használunk a folyamat rendszeres futtatásához egy kezdőpont és egy rendszeres időintervallum alapján. Az eseményindítókról további információt az Azure Data Factory vagy az Azure Synapse Analytics folyamatvégrehajtási és eseményindítói című témakörben talál.

Új átfedésmentes ablak eseményindító létrehozása

  1. A bal oldali menüben válassza a Szerző lehetőséget. Válassza ki a DICOM szolgáltatás folyamatát, és válassza az Eseményindító hozzáadása és az Új/Szerkesztés lehetőséget a menüsávon.

    Képernyőkép a Data Factory Studio folyamatnézetéről a kiválasztott menüsávOn az Eseményindító hozzáadása gombbal.

  2. Az Eseményindítók hozzáadása panelen válassza az Eseményindító kiválasztása legördülő menüt, majd az Új lehetőséget.

  3. Adja meg az eseményindító nevét és leírását .

    Képernyőkép az Új eseményindító panelről a Név, Leírás, Típus, Dátum és Ismétlődés mezővel.

  4. Típusként válassza a Átfedés ablak lehetőséget.

  5. Ha óránként futó folyamatot szeretne konfigurálni, állítsa az ismétlődés 1 óra értékre.

  6. Bontsa ki a Speciális szakaszt, és adjon meg 15 perces késleltetést. Ez a beállítás lehetővé teszi, hogy az egy óra végén függőben lévő műveletek befejeződjenek a feldolgozás előtt.

  7. A táblák konzisztenciájának biztosításához állítsa a maximális egyidejűséget 1-re.

  8. Az OK gombra kattintva folytathatja az eseményindító-futtatási paraméterek konfigurálását.

Eseményindító futtatási paramétereinek konfigurálása

Az eseményindítók határozzák meg, hogy mikor fut egy folyamat. Emellett olyan paramétereket is tartalmaznak, amelyeket a rendszer átad a folyamat végrehajtásának. A DICOM metaadatok másolása a Delta-sablonban az alábbi táblázatban ismertetett paramétereket határozza meg. Ha a konfiguráció során nem ad meg értéket, a rendszer a felsorolt alapértelmezett értéket használja az egyes paraméterekhez.

Paraméter neve Leírás Alapértelmezett érték
BatchSize A változáscsatornából egyszerre beolvasandó módosítások maximális száma (legfeljebb 200) 200
apiVersion Az Azure DICOM szolgáltatás API-verziója (legalább 2) 2
StartTime A DICOM-módosítások befogadó kezdési ideje 0001-01-01T00:00:00Z
EndTime A DICOM-módosítások kizárólagos befejezési ideje 9999-12-31T23:59:59Z
ContainerName Az eredményként kapott Delta-táblák tárolóneve dicom
InstanceTablePath A tárolón belüli DICOM SOP-példányok Delta táblájának elérési útja instance
SeriesTablePath A tárolón belüli DICOM-sorozat Delta tábláját tartalmazó elérési út series
StudyTablePath A tárolón belüli DICOM-vizsgálatokHoz tartozó Delta táblát tartalmazó elérési út study
RetentionHours A Delta-táblákban lévő adatok maximális megőrzési ideje órákban 720
  1. Az Eseményindító futtatási paraméterei panelen adja meg azt a ContainerName értéket, amely megfelel az előfeltételekben létrehozott tároló nevének.

    Képernyőkép az Eseményindító futtatási paraméterei panelről, amelyen be van írva a StartTime és az EndTime érték.

  2. StartTime esetén használja a rendszerváltozót@formatDateTime(trigger().outputs.windowStartTime).

  3. EndTime esetén használja a rendszerváltozót@formatDateTime(trigger().outputs.windowEndTime).

    Feljegyzés

    A rendszerváltozókat csak a bukóablak-eseményindítók támogatják:

    • @trigger().outputs.windowStartTime és
    • @trigger().outputs.windowEndTime.

    Az ütemezési eseményindítók különböző rendszerváltozókat használnak:

    • @trigger().scheduledTime és
    • @trigger().startTime.

    További információ az eseményindítók típusairól.

  4. Válassza a Mentés lehetőséget az új eseményindító létrehozásához. A Közzététel lehetőséget választva elindíthatja az eseményindítót a megadott ütemezés szerint.

    Képernyőkép a főmenüsáv Közzététel gombjáról.

Az eseményindító közzététele után manuálisan is aktiválható az Eseményindító most lehetőséggel. Ha a kezdési időpont a múltban egy értékre lett beállítva, a folyamat azonnal elindul.

Folyamatfuttatások monitorozása

A Monitor lapon figyelheti az aktivált futtatásokat és a hozzájuk tartozó folyamatfuttatásokat. Itt tallózhat, hogy mikor futottak az egyes folyamatok, és mennyi ideig tartott a futtatás. Az esetlegesen felmerülő problémákat is elháríthatja.

Képernyőkép a Monitor nézetről a folyamatfuttatások listájával.

Microsoft Fabric

A Fabric egy teljes körű elemzési megoldás, amely a Microsoft OneLake-ra támaszkodik. A Fabric lakehouse használatával egyetlen helyen kezelheti, strukturálhatja és elemezheti az adatokat a OneLake-ben. A OneLake-en kívüli, a Data Lake Storage Gen2-be írt adatok billentyűparancsokkal csatlakoztathatók a OneLake-hez, hogy kihasználhassák a Fabric eszközkészletének előnyeit.

Parancsikonok létrehozása metaadattáblákhoz

  1. Nyissa meg az előfeltételekben létrehozott tóházat. Explorer nézetben válassza a Három pont menüt (...) a Táblák mappa mellett.

  2. Válassza az Új parancsikont a DICOM-elemzési adatokat tartalmazó tárfiók új parancsikonjának létrehozásához.

    Képernyőkép az Új parancsikon lehetőségről Az Explorer nézetben.

  3. Válassza ki az Azure Data Lake Storage Gen2-t a parancsikon forrásaként.

    Képernyőkép az Új parancsikon nézetről az Azure Data Lake Storage Gen2 csempével.

  4. A Kapcsolat beállításai csoportban adja meg a Csatolt szolgáltatások szakaszban használt URL-címet.

    Képernyőkép az Azure Data Lake Storage Gen2-fiók kapcsolati beállításairól.

  5. Válasszon ki egy meglévő kapcsolatot, vagy hozzon létre egy új kapcsolatot a használni kívánt hitelesítési típus kiválasztásával.

    Feljegyzés

    A Data Lake Storage Gen2 és a Fabric között többféleképpen is hitelesíthet. Használhat szervezeti fiókot vagy szolgáltatásnevet. Nem javasoljuk a fiókkulcsok vagy a közös hozzáférésű jogosultságkód-jogkivonatok használatát.

  6. Válassza a Tovább lehetőséget.

  7. Adjon meg egy parancsikonnevet , amely a Data Factory-folyamat által létrehozott adatokat jelöli. A Delta-tábla esetében instance például a parancsikon nevének valószínűleg példánynak kell lennie.

  8. Adja meg a paraméternek megfelelő alelérési útvonalat a ContainerName futtatási paraméterek konfigurációjából, valamint a parancsikon táblájának nevét. Használja például /dicom/instance a Delta táblát a tárolóban lévő dicom elérési úttalinstance.

  9. A parancsikon létrehozásához válassza a Létrehozás lehetőséget.

  10. Ismételje meg a 2–9. lépést a fennmaradó billentyűparancsok hozzáadásához a tárfiók többi Delta-táblájába (például series és study).

A billentyűparancsok létrehozása után bontsa ki a táblázatot az oszlopok nevének és típusának megjelenítéséhez.

Az Explorer nézetben felsorolt táblázatoszlopokat ábrázoló képernyőkép.

Parancsikonok létrehozása fájlokhoz

Ha DICOM szolgáltatást használ a Data Lake Storage szolgáltatással, létrehozhat egy parancsikont is a data lake-ben tárolt DICOM-fájladatokhoz.

  1. Nyissa meg az előfeltételekben létrehozott tóházat. Explorer nézetben válassza a Fájlok mappa melletti három pont menüt (...).

  2. Válassza az Új parancsikont a DICOM-adatokat tartalmazó tárfiók új parancsikonjának létrehozásához.

    Képernyőkép a Fájlok menü Új parancsikon lehetőségéről Az Explorer nézetben.

  3. Válassza ki az Azure Data Lake Storage Gen2-t a parancsikon forrásaként.

    Képernyőkép az Új parancsikon nézetről az Azure Data Lake Storage Gen2 csempével.

  4. A Kapcsolat beállításai csoportban adja meg a Csatolt szolgáltatások szakaszban használt URL-címet.

    Képernyőkép az Azure Data Lake Storage Gen2-fiók kapcsolati beállításairól.

  5. Válasszon ki egy meglévő kapcsolatot, vagy hozzon létre egy új kapcsolatot a használni kívánt hitelesítési típus kiválasztásával.

  6. Válassza a Tovább lehetőséget.

  7. Adjon meg egy parancsikonnevet , amely leírja a DICOM-adatokat. Például contoso-dicom-files.

  8. Adja meg a DICOM szolgáltatás által használt tároló és mappa nevével egyező alelérési útvonalat . Ha például a gyökérmappára szeretne hivatkozni, az alelérési útvonal a /dicom/AHDS lesz. A gyökérmappa mindig AHDSmegtalálható, de szükség esetén egy adott munkaterület vagy DICOM szolgáltatáspéldány gyermekmappáira is hivatkozhat.

  9. A parancsikon létrehozásához válassza a Létrehozás lehetőséget.

Képernyőkép a DICOM-fájlokra mutató parancsikonról.

Jegyzetfüzetek futtatása

Miután létrehozta a táblákat a lakehouse-ban, lekérdezheti őket Fabric-jegyzetfüzetekből. Jegyzetfüzeteket közvetlenül a lakehouse-ból is létrehozhat, ha a menüsávOn a Jegyzetfüzet megnyitása lehetőséget választja.

A jegyzetfüzet oldalán a tóház tartalma a bal oldalon tekinthető meg, beleértve az újonnan hozzáadott táblákat is. A lap tetején válassza ki a jegyzetfüzet nyelvét. A nyelv az egyes cellákhoz is konfigurálható. Az alábbi példa a Spark SQL-t használja.

Táblák lekérdezése a Spark SQL használatával

A cellaszerkesztőben adjon meg egy Spark SQL-lekérdezést utasításként SELECT .

SELECT * from instance

Ez a lekérdezés a tábla összes tartalmát kiválasztja instance . Ha elkészült, válassza a Futtatás elemet a lekérdezés futtatásához.

Képernyőkép egy spark SQL-lekérdezésmintával rendelkező jegyzetfüzetről.

Néhány másodperc múlva a lekérdezés eredményei megjelennek a cella alatti táblázatban, ahogyan az alábbi példa is mutatja. Az idő hosszabb lehet, ha ez a Spark-lekérdezés az első a munkamenetben, mert a Spark-környezetet inicializálni kell.

Képernyőkép egy jegyzetfüzetről, amelyen egy Spark SQL-lekérdezés és -eredmények minta láthatóak.

DICOM-fájladatok elérése jegyzetfüzetekben

Ha sablonnal hozta létre a folyamatot, és a DICOM-fájladatokra mutató parancsikont hozott létre, a filePath tábla oszlopával korrelálhatja a instance példány metaadatait a fájladatokkal.

SELECT sopInstanceUid, filePath from instance

Képernyőkép egy spark SQL-minta lekérdezéssel és a filePathot tartalmazó találatokkal rendelkező jegyzetfüzetről.

Összegzés

Ebben a cikkben megtanulta, hogyan:

  • Data Factory-sablonok használatával hozzon létre egy folyamatot a DICOM szolgáltatásból egy Data Lake Storage Gen2-fiókba.
  • Konfiguráljon egy eseményindítót a DICOM-metaadatok óránkénti kinyeréséhez.
  • Parancsikonokkal csatlakoztathatja egy tárfiók DICOM-adatait egy Fabric lakehouse-hoz.
  • Jegyzetfüzetek használatával lekérdezheti a dicom-adatokat a lakehouse-ban.

Következő lépések

Feljegyzés

A DICOM® az Országos Elektromos Gyártók Országos Szövetségének bejegyzett védjegye az orvosi információk digitális kommunikációjával kapcsolatos szabványügyi kiadványaihoz.