Mengkustomisasi Model bahasa dengan API Azure AI Video Indexer

Penting

Karena pengumuman penghentian Azure Media Services, Azure AI Video Indexer mengumumkan penyesuaian fitur Azure AI Video Indexer. Lihat Perubahan yang terkait dengan penghentian Azure Media Service (AMS) untuk memahami apa artinya ini untuk akun Azure AI Video Indexer Anda. Lihat panduan Mempersiapkan penghentian AMS: Pembaruan VI dan migrasi.

Azure AI Video Indexer memungkinkan Anda membuat model Bahasa kustom untuk menyesuaikan pengenalan ucapan dengan mengunggah teks adaptasi, yaitu teks dari domain yang kosakatanya ingin Anda beradaptasi dengan mesin. Setelah melatih model Anda, kata-kata baru yang muncul dalam teks adaptasi akan dikenali.

Untuk gambaran umum terperinci dan praktik terbaik untuk model Bahasa kustom, lihat Menyesuaikan Model bahasa dengan Azure AI Video Indexer.

Anda dapat menggunakan API Azure AI Video Indexer untuk membuat dan mengedit model Bahasa kustom di akun Anda, seperti yang dijelaskan dalam artikel ini. Anda juga dapat menggunakan situs web, seperti yang dijelaskan dalam Menyesuaikan Model bahasa menggunakan situs web Azure AI Video Indexer.

Membuat Model bahasa

API membuat model bahasa membuat Model bahasa kustom baru di akun yang ditentukan. Anda dapat mengunggah file untuk Model bahasa dalam panggilan ini. Atau, Anda dapat membuat Model bahasa di sini dan mengunggah file untuk model berikut dengan memperbarui Model bahasa.

Catatan

Anda masih harus melatih model dengan file yang diaktifkan untuk model untuk mempelajari konten filenya. Petunjuk tentang pelatihan bahasa ada di bagian berikutnya.

Untuk mengunggah file yang akan ditambahkan ke Model bahasa, Anda harus mengunggah file di isi menggunakan FormData selain memberikan nilai untuk parameter yang diperlukan di atas. Ada dua cara untuk melakukan tugas ini:

  • Kuncinya adalah nama dan nilai file adalah file txt.
  • Kuncinya adalah nama dan nilai file adalah URL ke file txt.

Respons

Respons memberikan metadata pada Model bahasa yang baru dibuat bersama dengan metadata pada setiap file model mengikuti format contoh output JSON ini:

{
    "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
    "name": "TestModel",
    "language": "En-US",
    "state": "None",
    "languageModelId": "00000000-0000-0000-0000-000000000000",
    "files": [
    {
        "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.6733333"
    },
    {
        "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
        "name": "worldfile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.86"
    }
    ]
}

Melatih Model bahasa

API melatih model bahasamelatih Model bahasa kustom dalam akun yang ditentukan dengan konten dalam file yang diunggah dan diaktifkan di Model bahasa.

Catatan

Anda harus terlebih dahulu membuat Model bahasa dan mengunggah filenya. Anda dapat mengunggah file saat membuat Model bahasa atau dengan memperbarui Model bahasa.

Respons

Respons memberikan metadata pada Model bahasa yang baru dilatih bersama dengan metadata pada setiap file model mengikuti format contoh output JSON ini:

{
    "id": "41464adf-e432-42b1-8e09-f52905d7e29d",
    "name": "TestModel",
    "language": "En-US",
    "state": "Waiting",
    "languageModelId": "531e5745-681d-4e1d-b124-12e5ab57a891",
    "files": [
    {
        "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
        "name": "RenamedFile",
        "enable": false,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.5233333"
    },
    {
        "id": "9ac35b4b-1381-49c4-9fe4-8234bfdd0f50",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.68"
    }
    ]
}

yang dikembalikan id adalah ID unik yang digunakan untuk membedakan antara model bahasa, sementara languageModelId digunakan baik untuk mengunggah video untuk mengindeks dan mengindeks ulang API video (juga dikenal sebagai linguisticModelId dalam API pengunggahan/pengindeksan ulang Azure AI Video Indexer).

Menghapus Model bahasa

API menghapus Model bahasa menghapus Model bahasa kustom dari akun yang ditentukan. Video apa pun yang menggunakan model Bahasa yang dihapus menyimpan indeks yang sama sampai Anda mengindeks ulang video. Jika Anda mengindeks ulang video, Anda dapat menetapkan Model bahasa baru ke video. Jika tidak, Azure AI Video Indexer menggunakan model defaultnya untuk mengindeks ulang video.

Respons

Tidak ada konten yang dikembalikan saat Model bahasa berhasil dihapus.

Memperbarui Model bahasa

API memperbarui Model bahasa memperbarui Model bahasa kustom di akun yang telah ditentukan.

Catatan

Anda harus sudah membuat Model bahasa. Anda dapat menggunakan panggilan ini untuk mengaktifkan atau menonaktifkan semua file di bawah model, memperbarui nama Model bahasa, dan mengunggah file untuk ditambahkan ke model bahasa.

Untuk mengunggah file yang akan ditambahkan ke Model bahasa, Anda harus mengunggah file di isi menggunakan FormData selain memberikan nilai untuk parameter yang diperlukan di atas. Ada dua cara untuk melakukan tugas ini:

  • Kuncinya adalah nama dan nilai file adalah file txt.
  • Kuncinya adalah nama dan nilai file adalah URL ke file txt.

Respons

Respons memberikan metadata pada Model bahasa yang baru dilatih bersama dengan metadata pada setiap file model mengikuti format contoh output JSON ini:

{
    "id": "41464adf-e432-42b1-8e09-f52905d7e29d",
    "name": "TestModel",
    "language": "En-US",
    "state": "Waiting",
    "languageModelId": "531e5745-681d-4e1d-b124-12e5ab57a891",
    "files": [
    {
        "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
        "name": "RenamedFile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.5233333"
    },
    {
        "id": "9ac35b4b-1381-49c4-9fe4-8234bfdd0f50",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.68"
    }
    ]
}

Gunakan id file yang dikembalikan sebagai respons untuk mengunduh konten file.

Memperbarui file dari Model bahasa

Memperbarui file memungkinkan Anda memperbarui nama dan status enable file dalam Model bahasa kustom di akun yang ditentukan.

Respons

Respons memberikan metadata pada file yang Anda perbarui mengikuti format contoh output JSON di bawah ini.

{
  "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
  "name": "RenamedFile",
  "enable": false,
  "creator": "John Doe",
  "creationTime": "2018-04-27T20:10:10.5233333"
}

Gunakan id file yang dikembalikan sebagai respons untuk mengunduh konten file.

Mendapatkan Model bahasa tertentu

API mendapatkan mengembalikan informasi pada Model bahasa yang ditentukan dalam akun yang ditentukan seperti bahasa dan file yang ada dalam Model bahasa.

Respons

Respons memberikan metadata pada Model bahasa yang ditentukan bersama dengan metadata pada setiap file model mengikuti format contoh output JSON ini:

{
    "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
    "name": "TestModel",
    "language": "En-US",
    "state": "None",
    "languageModelId": "00000000-0000-0000-0000-000000000000",
    "files": [
    {
        "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.6733333"
    },
    {
        "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
        "name": "worldfile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.86"
    }
    ]
}

Gunakan id file yang dikembalikan sebagai respons untuk mengunduh konten file.

Mendapatkan semua Model bahasa

API mendapatkan semua mengembalikan semua Model bahasa kustom di akun yang ditentukan dalam daftar.

Respons

Respons memberikan daftar semua Model bahasa di akun Anda dan setiap metadata serta filenya mengikuti format contoh output JSON ini:

[
    {
        "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
        "name": "TestModel",
        "language": "En-US",
        "state": "None",
        "languageModelId": "00000000-0000-0000-0000-000000000000",
        "files": [
        {
            "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
            "name": "hellofile",
            "enable": true,
            "creator": "John Doe",
            "creationTime": "2018-04-28T11:55:34.6733333"
        },
        {
            "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
            "name": "worldfile",
            "enable": true,
            "creator": "John Doe",
            "creationTime": "2018-04-28T11:55:34.86"
        }
        ]
    },
    {
        "id": "dfae5745-6f1d-4edd-b224-42e1ab57a892",
        "name": "AnotherTestModel",
        "language": "En-US",
        "state": "None",
        "languageModelId": "00000000-0000-0000-0000-000000000001",
        "files": []
    }
]

Menghapus file dari Model bahasa

API menghapus menghapus file yang ditentukan dari Model bahasa yang ditentukan di akun yang ditentukan.

Respons

Tidak ada konten yang dikembalikan saat file berhasil dihapus dari Model bahasa.

Mendapatkan metadata pada file dari Model bahasa

API mendapatkan metadata file mengembalikan konten dan metadata pada file yang ditentukan dari Model bahasa yang dipilih di akun Anda.

Respons

Respons memberikan konten dan metadata file dalam format JSON, mirip dengan contoh ini:

{
    "content": "hello\r\nworld",
    "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
    "name": "Hello",
    "enable": true,
    "creator": "John Doe",
    "creationTime": "2018-04-27T20:10:10.5233333"
}

Catatan

Konten dari contoh file ini adalah kata-kata "halo" dan dunia" dalam dua baris terpisah.

Mengunduh file dari Model bahasa

API mengunduh file mengunduh file teks yang berisi konten file yang ditentukan dari Model bahasa yang ditentukan di akun yang ditentukan. File teks ini harus cocok dengan konten file teks yang awalnya diunggah.

Respons

Responsnya adalah unduhan file teks dengan konten file dalam format JSON.