Mengkustomisasi Model bahasa dengan API Azure AI Video Indexer
Penting
Karena pengumuman penghentian Azure Media Services, Azure AI Video Indexer mengumumkan penyesuaian fitur Azure AI Video Indexer. Lihat Perubahan yang terkait dengan penghentian Azure Media Service (AMS) untuk memahami apa artinya ini untuk akun Azure AI Video Indexer Anda. Lihat panduan Mempersiapkan penghentian AMS: Pembaruan VI dan migrasi.
Azure AI Video Indexer memungkinkan Anda membuat model Bahasa kustom untuk menyesuaikan pengenalan ucapan dengan mengunggah teks adaptasi, yaitu teks dari domain yang kosakatanya ingin Anda beradaptasi dengan mesin. Setelah melatih model Anda, kata-kata baru yang muncul dalam teks adaptasi akan dikenali.
Untuk gambaran umum terperinci dan praktik terbaik untuk model Bahasa kustom, lihat Menyesuaikan Model bahasa dengan Azure AI Video Indexer.
Anda dapat menggunakan API Azure AI Video Indexer untuk membuat dan mengedit model Bahasa kustom di akun Anda, seperti yang dijelaskan dalam artikel ini. Anda juga dapat menggunakan situs web, seperti yang dijelaskan dalam Menyesuaikan Model bahasa menggunakan situs web Azure AI Video Indexer.
Membuat Model bahasa
API membuat model bahasa membuat Model bahasa kustom baru di akun yang ditentukan. Anda dapat mengunggah file untuk Model bahasa dalam panggilan ini. Atau, Anda dapat membuat Model bahasa di sini dan mengunggah file untuk model berikut dengan memperbarui Model bahasa.
Catatan
Anda masih harus melatih model dengan file yang diaktifkan untuk model untuk mempelajari konten filenya. Petunjuk tentang pelatihan bahasa ada di bagian berikutnya.
Untuk mengunggah file yang akan ditambahkan ke Model bahasa, Anda harus mengunggah file di isi menggunakan FormData selain memberikan nilai untuk parameter yang diperlukan di atas. Ada dua cara untuk melakukan tugas ini:
- Kuncinya adalah nama dan nilai file adalah file txt.
- Kuncinya adalah nama dan nilai file adalah URL ke file txt.
Respons
Respons memberikan metadata pada Model bahasa yang baru dibuat bersama dengan metadata pada setiap file model mengikuti format contoh output JSON ini:
{
"id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
"name": "TestModel",
"language": "En-US",
"state": "None",
"languageModelId": "00000000-0000-0000-0000-000000000000",
"files": [
{
"id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
"name": "hellofile",
"enable": true,
"creator": "John Doe",
"creationTime": "2018-04-28T11:55:34.6733333"
},
{
"id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
"name": "worldfile",
"enable": true,
"creator": "John Doe",
"creationTime": "2018-04-28T11:55:34.86"
}
]
}
Melatih Model bahasa
API melatih model bahasamelatih Model bahasa kustom dalam akun yang ditentukan dengan konten dalam file yang diunggah dan diaktifkan di Model bahasa.
Catatan
Anda harus terlebih dahulu membuat Model bahasa dan mengunggah filenya. Anda dapat mengunggah file saat membuat Model bahasa atau dengan memperbarui Model bahasa.
Respons
Respons memberikan metadata pada Model bahasa yang baru dilatih bersama dengan metadata pada setiap file model mengikuti format contoh output JSON ini:
{
"id": "41464adf-e432-42b1-8e09-f52905d7e29d",
"name": "TestModel",
"language": "En-US",
"state": "Waiting",
"languageModelId": "531e5745-681d-4e1d-b124-12e5ab57a891",
"files": [
{
"id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
"name": "RenamedFile",
"enable": false,
"creator": "John Doe",
"creationTime": "2018-04-27T20:10:10.5233333"
},
{
"id": "9ac35b4b-1381-49c4-9fe4-8234bfdd0f50",
"name": "hellofile",
"enable": true,
"creator": "John Doe",
"creationTime": "2018-04-27T20:10:10.68"
}
]
}
yang dikembalikan id
adalah ID unik yang digunakan untuk membedakan antara model bahasa, sementara languageModelId
digunakan baik untuk mengunggah video untuk mengindeks dan mengindeks ulang API video (juga dikenal sebagai linguisticModelId
dalam API pengunggahan/pengindeksan ulang Azure AI Video Indexer).
Menghapus Model bahasa
API menghapus Model bahasa menghapus Model bahasa kustom dari akun yang ditentukan. Video apa pun yang menggunakan model Bahasa yang dihapus menyimpan indeks yang sama sampai Anda mengindeks ulang video. Jika Anda mengindeks ulang video, Anda dapat menetapkan Model bahasa baru ke video. Jika tidak, Azure AI Video Indexer menggunakan model defaultnya untuk mengindeks ulang video.
Respons
Tidak ada konten yang dikembalikan saat Model bahasa berhasil dihapus.
Memperbarui Model bahasa
API memperbarui Model bahasa memperbarui Model bahasa kustom di akun yang telah ditentukan.
Catatan
Anda harus sudah membuat Model bahasa. Anda dapat menggunakan panggilan ini untuk mengaktifkan atau menonaktifkan semua file di bawah model, memperbarui nama Model bahasa, dan mengunggah file untuk ditambahkan ke model bahasa.
Untuk mengunggah file yang akan ditambahkan ke Model bahasa, Anda harus mengunggah file di isi menggunakan FormData selain memberikan nilai untuk parameter yang diperlukan di atas. Ada dua cara untuk melakukan tugas ini:
- Kuncinya adalah nama dan nilai file adalah file txt.
- Kuncinya adalah nama dan nilai file adalah URL ke file txt.
Respons
Respons memberikan metadata pada Model bahasa yang baru dilatih bersama dengan metadata pada setiap file model mengikuti format contoh output JSON ini:
{
"id": "41464adf-e432-42b1-8e09-f52905d7e29d",
"name": "TestModel",
"language": "En-US",
"state": "Waiting",
"languageModelId": "531e5745-681d-4e1d-b124-12e5ab57a891",
"files": [
{
"id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
"name": "RenamedFile",
"enable": true,
"creator": "John Doe",
"creationTime": "2018-04-27T20:10:10.5233333"
},
{
"id": "9ac35b4b-1381-49c4-9fe4-8234bfdd0f50",
"name": "hellofile",
"enable": true,
"creator": "John Doe",
"creationTime": "2018-04-27T20:10:10.68"
}
]
}
Gunakan id
file yang dikembalikan sebagai respons untuk mengunduh konten file.
Memperbarui file dari Model bahasa
Memperbarui file memungkinkan Anda memperbarui nama dan status enable
file dalam Model bahasa kustom di akun yang ditentukan.
Respons
Respons memberikan metadata pada file yang Anda perbarui mengikuti format contoh output JSON di bawah ini.
{
"id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
"name": "RenamedFile",
"enable": false,
"creator": "John Doe",
"creationTime": "2018-04-27T20:10:10.5233333"
}
Gunakan id
file yang dikembalikan sebagai respons untuk mengunduh konten file.
Mendapatkan Model bahasa tertentu
API mendapatkan mengembalikan informasi pada Model bahasa yang ditentukan dalam akun yang ditentukan seperti bahasa dan file yang ada dalam Model bahasa.
Respons
Respons memberikan metadata pada Model bahasa yang ditentukan bersama dengan metadata pada setiap file model mengikuti format contoh output JSON ini:
{
"id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
"name": "TestModel",
"language": "En-US",
"state": "None",
"languageModelId": "00000000-0000-0000-0000-000000000000",
"files": [
{
"id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
"name": "hellofile",
"enable": true,
"creator": "John Doe",
"creationTime": "2018-04-28T11:55:34.6733333"
},
{
"id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
"name": "worldfile",
"enable": true,
"creator": "John Doe",
"creationTime": "2018-04-28T11:55:34.86"
}
]
}
Gunakan id
file yang dikembalikan sebagai respons untuk mengunduh konten file.
Mendapatkan semua Model bahasa
API mendapatkan semua mengembalikan semua Model bahasa kustom di akun yang ditentukan dalam daftar.
Respons
Respons memberikan daftar semua Model bahasa di akun Anda dan setiap metadata serta filenya mengikuti format contoh output JSON ini:
[
{
"id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
"name": "TestModel",
"language": "En-US",
"state": "None",
"languageModelId": "00000000-0000-0000-0000-000000000000",
"files": [
{
"id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
"name": "hellofile",
"enable": true,
"creator": "John Doe",
"creationTime": "2018-04-28T11:55:34.6733333"
},
{
"id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
"name": "worldfile",
"enable": true,
"creator": "John Doe",
"creationTime": "2018-04-28T11:55:34.86"
}
]
},
{
"id": "dfae5745-6f1d-4edd-b224-42e1ab57a892",
"name": "AnotherTestModel",
"language": "En-US",
"state": "None",
"languageModelId": "00000000-0000-0000-0000-000000000001",
"files": []
}
]
Menghapus file dari Model bahasa
API menghapus menghapus file yang ditentukan dari Model bahasa yang ditentukan di akun yang ditentukan.
Respons
Tidak ada konten yang dikembalikan saat file berhasil dihapus dari Model bahasa.
Mendapatkan metadata pada file dari Model bahasa
API mendapatkan metadata file mengembalikan konten dan metadata pada file yang ditentukan dari Model bahasa yang dipilih di akun Anda.
Respons
Respons memberikan konten dan metadata file dalam format JSON, mirip dengan contoh ini:
{
"content": "hello\r\nworld",
"id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
"name": "Hello",
"enable": true,
"creator": "John Doe",
"creationTime": "2018-04-27T20:10:10.5233333"
}
Catatan
Konten dari contoh file ini adalah kata-kata "halo" dan dunia" dalam dua baris terpisah.
Mengunduh file dari Model bahasa
API mengunduh file mengunduh file teks yang berisi konten file yang ditentukan dari Model bahasa yang ditentukan di akun yang ditentukan. File teks ini harus cocok dengan konten file teks yang awalnya diunggah.
Respons
Responsnya adalah unduhan file teks dengan konten file dalam format JSON.
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk