Bagikan melalui


Memilih teknologi pemrosesan bahasa yang ditargetkan Azure AI

Layanan Azure AI membantu pengembang dan organisasi dengan cepat membuat aplikasi cerdas, mutakhir, siap pasar, dan bertanggung jawab dengan API dan model yang siap pakai dan bawaan serta dapat disesuaikan.

Artikel ini membahas layanan Azure AI yang menawarkan kemampuan pemrosesan bahasa yang ditargetkan seperti pemrosesan bahasa alami (NLP), analitik teks, pemahaman bahasa, terjemahan, dan ekstraksi data dokumen. Bahasa Azure AI adalah salah satu kategori terluas dalam layanan Azure AI. Anda dapat menggunakan API dalam beban kerja Anda untuk menggabungkan fitur bahasa seperti pengenalan entitas bernama, analisis sentimen, deteksi bahasa, dan ringkasan teks.

Layanan

Layanan berikut ini menyediakan kemampuan pemrosesan bahasa yang ditargetkan untuk layanan Azure AI:

  • Bahasa Azure AI menyediakan pemrosesan bahasa alami untuk analisis teks.

    • Gunakan layanan Bahasa Azure AI saat Anda perlu bekerja dengan dokumen terstruktur atau tidak terstruktur untuk berbagai tugas terkait bahasa yang dijelaskan.
    • Jangan gunakan Layanan bahasa jika Anda perlu mencari dokumen dengan obrolan, memeriksanya untuk keamanan konten, atau menerjemahkannya.
  • Penerjemah Azure AI adalah layanan terjemahan mesin. Ini dapat melakukan terjemahan teks real-time, terjemahan dokumen batch dan file tunggal, dan terjemahan kustom yang memungkinkan Anda menggabungkan terminologi khusus atau bahasa khusus industri untuk skenario Anda. Ini mendukung banyak bahasa.

    • Gunakan layanan Penerjemah saat Anda perlu melakukan terjemahan secara khusus. Meskipun Anda dapat menggunakan model bahasa dasar tujuan umum lainnya untuk melakukan terjemahan, menggunakan penerjemah untuk tujuan khususnya dapat terbukti lebih efektif dan dapat lebih hemat biaya dengan menggunakan model terjemahan yang ditargetkan.
    • Jangan gunakan layanan Penerjemah jika Anda perlu berinteraksi dengan obrolan, untuk menganalisis konten untuk sentimen, atau untuk con mode tenda ration. Untuk analisis sentimen, gunakan layanan Bahasa sebagai gantinya. Untuk con mode tenda ration, gunakan layanan Content Safety.
  • Azure AI Document Intelligence adalah layanan yang dapat mengonversi gambar langsung menjadi bentuk elektronik. Anda dapat menentukan bidang yang diharapkan lalu mencari gambar yang Anda sediakan untuk menangkap bidang tersebut tanpa intervensi manusia. Layanan ini menghosting banyak model bawaan, dan juga memungkinkan Anda untuk membangun model formulir kustom Anda sendiri.

    • Gunakan layanan Kecerdasan Dokumen saat Anda mengetahui dengan tepat bidang mana yang perlu Anda ekstrak dari dokumen yang dipindai untuk mengisi formulir elektronik dengan tepat.
    • Gunakan Kecerdasan Dokumen untuk mengidentifikasi struktur utama (header, footer, pemisah bab, dan sebagainya) dalam berbagai korpus dokumen untuk berinteraksi lebih terprogram dengan dokumen, seperti dalam implementasi pembuatan tertambung pengambilan (RAG).
    • Jangan gunakan layanan Kecerdasan Dokumen sebagai API pencarian real time.

Azure AI Language

Bahasa Azure AI adalah layanan berbasis cloud yang menyediakan fitur Natural Language Processing (NLP) untuk memahami dan menganalisis teks. Gunakan layanan ini untuk membantu membangun aplikasi cerdas menggunakan Language Studio, API REST, dan pustaka klien berbasis web.

Kemampuan

Tabel berikut ini menyediakan daftar kemampuan yang tersedia di layanan Azure AI Language.

Kemampuan Deskripsi
Jawaban atas pertanyaan kustom Menemukan jawaban yang paling tepat untuk input dari pengguna Anda, dan umumnya digunakan untuk membangun aplikasi klien percakapan, seperti aplikasi media sosial, bot obrolan, dan aplikasi desktop yang mendukung ucapan.
Klasifikasi teks kustom Gunakan untuk membangun model AI kustom untuk mengklasifikasikan dokumen teks yang tidak terstruktur ke dalam kelas kustom yang Anda tentukan.
Pemahaman bahasa percakapan (CLU) Gunakan untuk membangun model pemahaman bahasa alami kustom untuk memprediksi niat keseluruhan ucapan masuk dan mengekstrak informasi penting darinya.
Penautan entitas Memisahkan identitas entitas (kata atau frasa) yang ditemukan dalam teks yang tidak terstruktur dan mengembalikan tautan ke Wikipedia.
Deteksi bahasa Mendeteksi bahasa tempat dokumen ditulis, dan mengembalikan kode bahasa untuk berbagai bahasa, varian, dialek, dan beberapa bahasa regional/budaya.
Ekstraksi frasa kunci Mengevaluasi dan mengembalikan konsep utama dalam teks yang tidak terstruktur, dan mengembalikannya sebagai daftar.
Pengenalan Entitas Karakter (NER) Mengategorikan entitas (kata atau frasa) dalam teks yang tidak terstruktur di beberapa grup kategori yang telah ditentukan sebelumnya. Contohnya: orang, kejadian, tempat, tanggal, dan lain sebagainya.
Alur kerja Orkestrasi Gunakan untuk menyambungkan Pemahaman Bahasa Percakapan (CLU).
Deteksi informasi identifikasi pribadi (PII) dan kesehatan (PHI) Mengidentifikasi, mengategorikan, dan meredaksi informasi sensitif dalam dokumen teks yang tidak terstruktur, dan transkrip percakapan. Contohnya: nomor telepon, alamat email. unsur identifikasi lainnya, dan lain sebagainya.
Analisis sentimen dan penggalian opini Membantu Anda mengetahui apa yang orang pikirkan tentang merek atau topik Anda dengan menambang teks untuk petunjuk tentang sentimen positif atau negatif, dan dapat mengaitkannya dengan aspek teks tertentu.
Ringkasan Menggunakan ringkasan teks ekstraktif untuk menghasilkan ringkasan dokumen dan transkripsi percakapan. Ringkasan teks ini mengambil kalimat yang secara kolektif merepresentasikan informasi paling penting atau relevan dalam konten asli.
Analisis teks untuk kesehatan Mengekstrak dan memberi label informasi medis yang relevan dari teks yang tidak terstruktur seperti catatan dokter, ringkasan pelepasan, dokumen klinis, dan catatan kesehatan elektronik. Saat merancang beban kerja Anda, evaluasi lokasi pemrosesan dan residensi data fitur yang dihosting cloud ini untuk memastikannya selaras dengan harapan kepatuhan Anda. Beberapa beban kerja mungkin dibatasi dalam kapasitasnya untuk mengirim data layanan kesehatan ke platform yang dihosting cloud. Anda dapat menggunakan API ini sebagai kontainer Docker untuk menghosting di komputasi Anda sendiri di cloud atau lokal, yang mungkin membantu mengatasi masalah kepatuhan yang melibatkan PaaS. Untuk informasi selengkapnya, lihat Menggunakan Text Analytics untuk kontainer kesehatan

Kasus penggunaan

Tabel berikut ini menyediakan daftar kemungkinan kasus penggunaan untuk layanan Azure AI Language.

Gunakan huruf besar Disesuaikan*
Memprediksi niat input pengguna dan mengekstrak informasi dari mereka. Ya
Identifikasi dan/atau redaksi informasi sensitif seperti PII.
Identifikasi bahasa tempat teks ditulis.
Ekstrak informasi medis dari dokumen klinis/medis, tanpa membangun model
Ekstrak informasi medis dari dokumen klinis/medis menggunakan model yang dilatih pada data Anda. Ya
Ekstrak kategori informasi tanpa membuat model kustom.
Ekstrak kategori informasi menggunakan model khusus untuk data Anda. Ya
Ekstrak topik utama dan frasa penting.
Meringkas dokumen
Mengklasifikasikan teks dengan menggunakan analisis sentimen. Ya
Mengklasifikasikan teks dengan menggunakan kelas kustom. Ya
Mengklasifikasikan item ke dalam kategori yang disediakan pada waktu inferensi.
Tautkan entitas dengan artikel basis pengetahuan.
Memahami pertanyaan dan jawaban (generik). Ya
Buat aplikasi percakapan yang merespons input pengguna.
Sambungkan aplikasi dari pemahaman bahasa percakapan dan jawaban atas pertanyaan. Ya

*Jika fitur dapat disesuaikan, Anda dapat melatih model AI menggunakan alat kami agar sesuai dengan data Anda secara khusus. Jika tidak, fitur telah dikonfigurasi sebelumnya, yang berarti model AI yang digunakannya tidak dapat diubah. Anda hanya mengirim data Anda, dan menggunakan output fitur dalam aplikasi Anda.

Penerjemah Azure AI

Penerjemah Azure AI adalah layanan terjemahan mesin yang merupakan bagian dari keluarga layanan Azure AI. Penerjemah mendukung banyak produk dan layanan Microsoft.

Kemampuan

Tabel berikut ini menyediakan daftar kemampuan yang tersedia di layanan Penerjemah Azure AI.

Kemampuan Deskripsi
Terjemahan Teks Jalankan terjemahan teks antara bahasa sumber dan bahasa target yang didukung secara real time. Buat kamus dinamis dan pelajari cara mencegah terjemahan menggunakan API Penerjemah.
Terjemahan Dokumen Terjemahan batch asinkron: Terjemahkan file batch dan kompleks sambil mempertahankan struktur dan format dokumen asli. Proses terjemahan batch memerlukan akun penyimpanan Azure Blob dengan kontainer untuk sumber dan dokumen yang diterjemahkan.
Terjemahan file tunggal sinkron: Terjemahkan satu file dokumen saja atau dengan file glosarium sambil mempertahankan struktur dan format dokumen asli. Proses terjemahan file tidak memerlukan akun penyimpanan Azure Blob. Respons akhir berisi dokumen yang diterjemahkan dan dikembalikan langsung ke klien panggilan.
Penerjemah Kustom Membuat model yang disesuaikan untuk menerjemahkan bahasa, terminologi, dan gaya khusus domain dan industri. Buat kamus (frasa atau kalimat) untuk terjemahan kustom.

Kasus penggunaan

Tabel berikut ini menyediakan daftar kemungkinan kasus penggunaan untuk layanan Penerjemah Azure AI.

Gunakan huruf besar Dokumentasi
Menerjemahkan teks khusus industri. Penerjemah Kustom Layanan AI
Terjemahkan teks generik yang tidak spesifik untuk industri. Apa itu Terjemahan Teks Azure

Azure AI Document Intelligence

Bahasa Azure AI adalah layanan berbasis cloud yang menyediakan fitur Natural Language Processing (NLP) untuk memahami dan menganalisis teks. Gunakan layanan ini untuk membantu membangun aplikasi cerdas menggunakan Language Studio, API REST, dan pustaka klien berbasis web.

Kemampuan

Tabel berikut ini menyediakan daftar beberapa kemampuan yang tersedia di layanan Kecerdasan Dokumen AI.

Kemampuan Deskripsi
Ekstraksi kartu nama Model kartu nama Kecerdasan Dokumen menggabungkan kemampuan Pengenalan Karakter Optik (OCR) dengan model pembelajaran mendalam untuk menganalisis dan mengekstrak data dari gambar kartu nama. API menganalisis kartu nama cetak; mengekstrak informasi utama seperti nama depan, nama keluarga, nama perusahaan, alamat email, dan nomor telepon; dan mengembalikan representasi data JSON terstruktur.
Ekstraksi model kontrak Model kontrak Kecerdasan Dokumen menggunakan kemampuan Pengenalan Karakter Optik (OCR) untuk menganalisis dan mengekstrak bidang kunci dan item baris dari sekelompok entitas kontrak penting tertentu. Kontrak dapat memiliki berbagai format dan kualitas termasuk gambar yang diambil telepon, dokumen yang dipindai, dan PDF digital. API menganalisis teks dokumen; mengekstrak informasi utama seperti Pihak, Yurisdiksi, ID Kontrak, dan Judul; dan mengembalikan representasi data JSON terstruktur. Model saat ini mendukung format dokumen berbahasa Inggris.
Ekstraksi kartu kredit Model kartu kredit/debit Kecerdasan Dokumen menggunakan kemampuan Pengenalan Karakter Optik (OCR) untuk menganalisis dan mengekstrak bidang kunci dari kartu kredit dan debit. Kartu kredit dan kartu debit dapat memiliki berbagai format dan kualitas termasuk gambar yang diambil telepon, dokumen yang dipindai, dan PDF digital. API menganalisis teks dokumen; mengekstrak informasi utama seperti Nomor Kartu, Bank Penerbit, dan Tanggal Kedaluwarsa; dan mengembalikan representasi data JSON terstruktur. Model saat ini mendukung format dokumen berbahasa Inggris.
Ekstraksi kartu asuransi kesehatan Model kartu asuransi kesehatan Kecerdasan Dokumen menggabungkan kemampuan Optical Character Recognition (OCR) dengan model pembelajaran mendalam untuk menganalisis dan mengekstrak informasi utama dari kartu asuransi kesehatan AS. Kartu asuransi kesehatan adalah dokumen kunci untuk pemrosesan perawatan dan dapat dianalisis secara digital untuk onboarding pasien, informasi cakupan keuangan, pembayaran tanpa uang tunai, dan pemrosesan klaim asuransi. Model kartu asuransi kesehatan menganalisis gambar kartu kesehatan; mengekstrak informasi utama seperti perusahaan angsuran, anggota, resep, dan nomor grup; dan mengembalikan representasi JSON terstruktur. Kartu asuransi kesehatan dapat disajikan dalam berbagai format dan kualitas termasuk gambar yang diambil telepon, dokumen yang dipindai, dan PDF digital.
Ekstraksi dokumen pajak AS Model kontrak Kecerdasan Dokumen menggunakan kemampuan Pengenalan Karakter Optik (OCR) untuk menganalisis dan mengekstrak bidang kunci dan item baris dari sekelompok dokumen pajak tertentu. Dokumen pajak dapat memiliki berbagai format dan kualitas termasuk gambar yang diambil telepon, dokumen yang dipindai, dan PDF digital. API menganalisis teks dokumen; mengekstrak informasi utama seperti nama pelanggan, alamat penagihan, tanggal jatuh tempo, dan jumlah jatuh tempo; dan mengembalikan representasi data JSON terstruktur. Model saat ini mendukung format dokumen pajak bahasa Inggris tertentu.
Masih banyak lagi... Azure AI Document Intelligence mendukung berbagai model yang memungkinkan Anda menambahkan pemrosesan dokumen cerdas ke aplikasi dan alur Anda. Anda dapat menggunakan model khusus domain bawaan atau melatih model kustom yang disesuaikan dengan kebutuhan bisnis dan kasus penggunaan spesifik Anda. Kecerdasan Dokumen dapat digunakan dengan pustaka klien REST API atau Python, C#, Java, dan JavaScript.

Untuk mempelajari selengkapnya tentang cara memilih model yang berfungsi untuk skenario Anda, lihat Model mana yang harus saya pilih?

Langkah berikutnya