Konsorsium data kesehatan di Azure

Azure Data Factory
Azure Data Lake Storage
Azure Data Share
Azure Databricks
Azure SQL Database

Solusi untuk konsorsium data ini menggunakan komponen Azure. Ini memenuhi tujuan ini:

  • Menyediakan cara bagi beberapa organisasi untuk berbagi data.
  • Memusatkan upaya orkestrasi data.
  • Memastikan keamanan data.
  • Menjamin privasi pasien.
  • Mendukung interoperabilitas data.
  • Tawarkan opsi penyesuaian untuk memenuhi persyaratan organisasi tertentu.

Arsitektur

Architecture diagram showing how members of a consortium share data.

Unduh file Visio arsitektur ini.

Aliran data

  1. Data mentah berasal dari sumber lokal dan pihak ketiga. Anggota konsorsium memuat data ini ke salah satu layanan penyimpanan ini di Azure Data Share:

  2. Konsorsium meminta anggota untuk berbagi data. Sebagai produsen data, anggota dapat berbagi snapshot atau menggunakan berbagi di tempat.

  3. Sebagai konsumen data, konsorsium menerima data anggota bersama. Data ini memasukkan Data Lake Storage di Data Share konsorsium untuk transformasi lebih lanjut.

  4. Azure Data Factory dan Azure Databricks membersihkan data anggota dan mengubahnya menjadi format umum.

  5. Konsorsium menggabungkan data anggota dan menyimpannya dalam layanan. Struktur dan volume data menentukan jenis layanan penyimpanan yang paling cocok. Beberapa kemungkinan mencakup:

    • Azure Synapse Analytics
    • Database Azure SQL
    • Azure Data Lake Storage
    • Azure Data Explorer
  6. Sebagai produsen berbagi data, konsorsium mengundang anggota untuk menerima data. Anggota dapat menerima data snapshot atau data berbagi di tempat.

  7. Sebagai konsumen data, anggota menerima data bersama. Data memasuki penyimpanan data anggota untuk penelitian dan analisis.

Di seluruh sistem:

Komponen

Solusi ini menggunakan komponen-komponen berikut:

Platform perawatan kesehatan

  • Electronic Health Records (EHRs) adalah versi digital dari informasi real-time pada pasien.

  • Fast Healthcare Interoperability Resources (FHIR) adalah standar untuk pertukaran data kesehatan yang diterbitkan oleh Health Level Seven International (HL7).

  • Internet of Medical Things (IoMT) adalah kumpulan perangkat medis dan aplikasi yang terhubung ke sistem TI melalui jaringan komputer online.

  • Data genomik memberikan informasi tentang bagaimana gen berinteraksi satu sama lain dan lingkungan.

  • Data pencitraan mencakup gambar yang dihasilkan radiologi, pencitraan kardiologi, radioterapi, dan perangkat lainnya.

  • Manajemen hubungan pelanggan (CRM), penagihan, dan sistem pihak ketiga memberikan data pada pasien.

Komponen Azure

  • Azure Data Share menyediakan cara bagi beberapa organisasi untuk berbagi data dengan aman. Dengan layanan ini, penyedia data tetap mengendalikan data yang mereka bagikan. Sangat mudah untuk mengelola dan memantau siapa yang berbagi data apa pada jam berapa. Data Share juga memudahkan untuk memperkaya analisis dan skenario AI dengan menggabungkan data dari anggota yang berbeda.

  • Azure Synapse Analytics adalah layanan analitik untuk gudang data dan sistem big data. Dengan produk ini, Anda dapat meminta data dengan sumber daya tanpa server, sesuai permintaan atau dengan yang disediakan. Azure Synapse Analytics bekerja dengan baik dengan volume data terstruktur yang tinggi.

  • Azure SQL Database adalah mesin database platform as a service (PaaS) yang dikelola sepenuhnya. Dengan fitur otomatis yang didukung AI, SQL Database menangani fungsi manajemen basis data seperti peningkatan, patching, pencadangan, dan pemantauan. Layanan ini sangat cocok untuk data terstruktur.

  • Data Lake Storage adalah data lake yang dapat diskalakan dan aman untuk beban kerja analitik performa tinggi. Layanan ini dapat mengelola beberapa petabyte informasi sambil mempertahankan ratusan gigabit throughput. Data Lake Storage menyediakan cara untuk menyimpan data terstruktur dan tidak terstruktur dari beberapa anggota dalam satu lokasi.

  • Azure Data Explorer adalah layanan analitik data yang cepat dan dikelola penuh. Anda dapat menggunakan layanan ini untuk analisis real time pada volume data yang besar. Azure Penjelajah Data dapat menangani beragam aliran data dari aplikasi, situs web, perangkat IoT, dan sumber lainnya. Azure Data Explorer sangat cocok untuk berbagi telemetri streaming dan data log di tempat.

  • Azure Data Factory adalah layanan integrasi data hibrid. Anda dapat menggunakan solusi tanpa server yang dikelola sepenuhnya ini untuk integrasi data dan alur kerja transformasi. Data Factory menawarkan UI bebas kode dan panel pemantauan yang mudah digunakan. Dalam solusi ini, alur Data Factory menyerap data dari pembagian data anggota yang berbeda.

  • Azure Databricks adalah platform analisis data. Berdasarkan sistem pemrosesan terdistribusi Apache Spark terbaru, Azure Databricks mendukung integrasi tanpa batas dengan pustaka sumber terbuka. Solusi ini menggunakan buku catatan Azure Databricks untuk mengubah semua data anggota menjadi format umum.

  • ID Microsoft Entra adalah layanan manajemen identitas dan akses berbasis cloud multi-penyewa.

  • Azure Key Vault menyimpan dan mengontrol akses ke rahasia sistem, seperti kunci API, kata sandi, sertifikat, dan kunci kriptografi dengan aman. Layanan cloud ini juga mengelola sertifikat keamanan.

  • Azure Pipelines otomatis membuat dan menguji proyek kode. Layanan Azure DevOps ini menggabungkan continuous integration (CI) dan continuous delivery (CD). Dengan menggunakan praktik ini, Azure Pipelines terus-menerus dan secara konsisten menguji dan membuat kode serta mengirimkannya ke target apa pun.

  • Microsoft Defender untuk Cloud menyediakan manajemen keamanan terpadu dan perlindungan ancaman tingkat lanjut di seluruh beban kerja cloud hybrid.

Alternatif

Dengan Azure Data Share, banyak alternatif ada untuk penyimpanan data. Pilihan layanan Anda tergantung pada metode berbagi Anda dan volume serta jenis data Anda:

  • Untuk berbagi snapshot data batch, gunakan salah satu layanan ini:

    • Azure Synapse Analytics
    • Microsoft Azure SQL Database
    • Azure Data Lake Storage
    • Penyimpanan Blob Azure

    Untuk informasi tentang menggabungkan berbagai jenis data, lihat Arsitektur gudang data modern.

  • Untuk berbagi telemetri streaming dan data log di tempat, gunakan Azure Data Explorer. Untuk informasi selengkapnya tentang menganalisis data dari berbagai sumber, lihat Analitik interaktif Azure Data Explorer.

  • Beberapa himpunan data besar atau non-relasional. Beberapa tidak berisi data dalam format standar. Untuk jenis himpunan data ini, Blob Storage atau Azure Data Lake Storage bekerja lebih baik daripada Azure Synapse Analytics dan SQL Database untuk bertukar data dengan Data Share. Untuk informasi selengkapnya tentang menyimpan data medis secara efisien, lihat Solusi penyimpanan data medis.

Jika Data Share bukan pilihan, pertimbangkan Jaringan Privat Maya (VPN) sebagai gantinya. Anda dapat menggunakan VPN situs-ke-situs untuk mentransfer data antara penyimpanan data anggota dan konsorsium.

Detail skenario

Uji klinis tradisional bisa rumit, memakan waktu, dan mahal. Untuk mengatasi masalah ini, semakin banyak organisasi perawatan kesehatan bermitra untuk membangun konsorsium data untuk melakukan uji klinis.

Konsorsium data menguntungkan perawatan kesehatan dalam banyak cara:

  • Membuat data penelitian tersedia.
  • Menyediakan aliran pendapatan baru.
  • Mengarah pada keputusan peraturan yang hemat biaya dengan menyediakan akses cepat ke data.
  • Menjaga pasien lebih aman dan sehat dengan mempercepat inovasi.

Kemungkinan kasus penggunaan

Banyak jenis profesional kesehatan dapat memperoleh manfaat dari solusi ini:

  • Organisasi yang menggunakan data observasional dunia nyata seperti hasil pasien untuk menentukan perawatan.
  • Dokter yang mengkhususkan diri dalam pengobatan pribadi atau presisi.
  • Penyedia telemedicine yang membutuhkan akses mudah ke data pasien.
  • Peneliti yang bekerja dengan data genomik.

Pertimbangan

Pertimbangan ini mengimplementasikan pilar Azure Well-Architected Framework, yang merupakan serangkaian tenet panduan yang dapat digunakan untuk meningkatkan kualitas beban kerja. Untuk informasi selengkapnya, lihat Microsoft Azure Well-Architected Framework.

Teknologi dalam solusi ini memenuhi sebagian besar persyaratan perusahaan untuk keamanan, skalabilitas, dan ketersediaan.

Keamanan

Keamanan memberikan jaminan terhadap serangan yang disukai dan penyalahgunaan data dan sistem berharga Anda. Untuk informasi selengkapnya, lihat Gambaran Umum pilar keamanan.

Karena sensitivitas informasi medis, beberapa komponen berperan dalam mengamankan data:

  • Fitur keamanan di Azure Data Share melindungi data dengan cara ini:

    • Mengenkripsi data tidak aktif, di mana penyimpanan data yang mendasarinya mendukung enkripsi saat istirahat.
    • Mengenkripsi data saat transit dengan menggunakan Transport Layer Security (TLS) 1.2.
    • Mengenkripsi metadata tentang berbagi data tidak aktif dan saat transit.
    • Tidak menyimpan konten berbagi data pelanggan.
  • Azure Synapse Analytics menawarkan model keamanan yang komprehensif. Anda dapat menggunakan kontrol berbutir halus untuk mengamankan data Anda di setiap tingkat, dari sel tunggal ke seluruh database.

  • SQL Database menggunakan pendekatan berlapis untuk melindungi data pelanggan. Strategi ini mencakup bidang-bidang ini:

    • Keamanan jaringan
    • Manajemen akses
    • Perlindungan terhadap ancaman
    • Perlindungan informasi
  • Data Lake Storage menyediakan kontrol akses. Model ini mendukung jenis kontrol ini:

    • Kontrol akses berbasis peran Azure (RBAC)
    • Daftar kontrol akses Antarmuka Sistem Operasi Portabel (POSIX) (ACL)
  • Azure Data Explorer melindungi data dengan cara ini:

    • Menggunakan identitas yang dikelola ID Microsoft Entra untuk sumber daya Azure.
    • Menggunakan RBAC untuk memisahkan tugas dan membatasi akses.
    • Memblokir lalu lintas yang berasal dari segmen jaringan di luar Azure Data Explorer.
    • Melindungi data dan membantu Anda memenuhi komitmen dengan menggunakan Azure Disk Encryption. Layanan ini menyediakan enkripsi volume untuk disk data mesin virtual dan OS. Azure Disk Encryption juga terintegrasi dengan Key Vault, yang mengenkripsi rahasia dengan kunci yang dikelola Microsoft atau kunci yang dikelola pelanggan.

Ketersediaan

Solusi ini menggunakan penyebaran satu wilayah. Beberapa skenario memerlukan penyebaran multi bagian untuk ketersediaan tinggi, pemulihan bencana, atau kedekatan. Untuk kasus tersebut, layanan berikut menawarkan wilayah Azure yang dipasangkan untuk ketersediaan tinggi:

Pengoptimalan biaya

Optimalisasi biaya adalah tentang mencari cara untuk mengurangi pengeluaran yang tidak perlu dan meningkatkan efisiensi operasional. Untuk informasi selengkapnya, lihat Gambaran umum pilar pengoptimalan biaya.

Harga untuk solusi ini tergantung pada beberapa faktor:

  • Layanan yang Anda pilih
  • Kapasitas sistem dan throughput Anda
  • Transformasi yang Anda gunakan pada data
  • Tingkat kelangsungan bisnis Anda
  • Tingkat pemulihan bencana Anda

Untuk informasi selengkapnya, lihat Detail Harga.

Kontributor

Artikel ini dikelola oleh Microsoft. Ini awalnya ditulis oleh kontributor berikut.

Penulis utama:

Untuk melihat profil LinkedIn non-publik, masuk ke LinkedIn.

Langkah berikutnya

Tentukan cara menyesuaikan solusi dengan mengklarifikasi poin-poin ini:

  • Sumber data yang tersedia
  • Lokasi setiap sumber data
  • keanggotaan layanan Azure dapat digunakan untuk menerima data sumber
  • Anggota data dapat berbagi dengan konsorsium
  • Bagaimana anggota dapat berbagi data: Dalam batch sebagai snapshot atau sebagai aliran data dengan berbagi di tempat
  • Layanan Azure mana yang dapat digunakan konsorsium untuk menerima data bersama
  • Format data anggota dan apakah perlu dibersihkan atau diubah
  • Anggota data dapat berbagi dengan konsorsium

Dokumentasi produk: