Kemampuan kognitif Terjemahan Teks
Kemampuan Terjemahan Teks mengevaluasi teks dan, untuk setiap rekaman, mengembalikan teks yang diterjemahkan ke bahasa target yang ditentukan. Keterampilan ini menggunakan API Teks Penerjemah v3.0 yang tersedia di layanan Azure AI.
Kemampuan ini berguna jika Anda memperkirakan bahwa dokumen Anda mungkin tidak semuanya dalam satu bahasa, dalam hal ini Anda dapat menormalkan teks ke satu bahasa sebelum mengindeks untuk pencarian dengan menerjemahkannya. Ini juga berguna untuk kasus penggunaan pelokalan, di mana Anda mungkin ingin memiliki salinan teks yang sama yang tersedia dalam beberapa bahasa.
API Teks Penerjemah v3.0 adalah layanan Azure AI non-regional, yang berarti bahwa data Anda tidak dijamin tetap berada di wilayah yang sama dengan Pencarian Azure AI atau sumber daya layanan Azure AI terlampir.
Catatan
Keterampilan ini terikat ke layanan Azure AI dan memerlukan sumber daya yang dapat ditagih untuk transaksi yang melebihi 20 dokumen per pengindeks per hari. Eksekusi keterampilan bawaan dibebankan pada harga prabayar layanan Azure AI yang ada.
Saat menggunakan keterampilan ini, semua dokumen dalam sumber diproses dan ditagih untuk terjemahan, bahkan jika bahasa sumber dan target sama. Perilaku ini berguna untuk dukungan multi-bahasa dalam dokumen yang sama, tetapi dapat mengakibatkan pemrosesan yang tidak perlu. Untuk menghindari biaya penagihan tak terduga dari dokumen yang tidak perlu diproses, pindahkan dari kontainer sumber data sebelum menjalankan keterampilan.
@odata.type
Microsoft.Skills.Text.TranslationSkill
Batasan data
Ukuran maksimum rekaman harus 50.000 karakter sebagaimana diukur oleh String.Length
. Jika Anda perlu memecah data sebelum mengirimkannya ke kemampuan penerjemahan teks, pertimbangkan untuk menggunakan Keterampilan Pemisahan Teks. Jika Anda menggunakan keterampilan pemisahan teks, atur panjang halaman ke 5000 untuk performa terbaik.
Parameter keterampilan
Parameternya peka huruf besar/kecil.
Input | Deskripsi |
---|---|
defaultToLanguageCode | (Diperlukan) Kode bahasa untuk menerjemahkan dokumen ke dalam untuk dokumen yang tidak menentukan bahasa "ke" secara eksplisit. Lihat daftar lengkap bahasa yang didukung. |
defaultFromLanguageCode | (Opsional) Kode bahasa untuk menerjemahkan dokumen dari untuk dokumen yang tidak menentukan bahasa "dari" secara eksplisit. Jika defaultFromLanguageCode tidak ditentukan, deteksi bahasa otomatis yang disediakan oleh API Teks Penerjemah akan digunakan untuk menentukan bahasa "dari". Lihat daftar lengkap bahasa yang didukung. |
suggestedFrom | (Opsional) Kode bahasa untuk menerjemahkan dokumen dari jika fromLanguageCode atau defaultFromLanguageCode tidak ditentukan, dan deteksi bahasa otomatis tidak berhasil. Jika bahasa suggestedFrom tidak ditentukan, bahasa Inggris (en) akan digunakan sebagai bahasa suggestedFrom. Lihat daftar lengkap bahasa yang didukung. |
Input keterampilan
Masukkan nama | Deskripsi |
---|---|
text | Teks yang akan diterjemahkan. |
toLanguageCode | Untai (karakter) yang menunjukkan teks akan diterjemahkan ke bahasa. Jika input ini tidak ditentukan, defaultToLanguageCode akan digunakan untuk menerjemahkan teks. Lihat daftar lengkap bahasa yang didukung. |
fromLanguageCode | Untai (karakter) yang menunjukkan bahasa teks saat ini. Jika parameter ini tidak ditentukan, defaultFromLanguageCode (atau deteksi bahasa otomatis jika defaultFromLanguageCode tidak disediakan) akan digunakan untuk menerjemahkan teks. Lihat daftar lengkap bahasa yang didukung. |
Output keterampilan
Nama output | Deskripsi |
---|---|
translatedText | Hasil untai (karakter) terjemahan teks dari translatedFromLanguageCode ke translatedToLanguageCode. |
translatedToLanguageCode | Untai (karakter) yang menunjukkan teks diterjemahkan ke kode bahasa. Berguna jika Anda menerjemahkan ke beberapa bahasa dan ingin dapat melacak teks mana yang merupakan bahasa mana. |
translatedFromLanguageCode | Untai (karakter) yang menunjukkan teks diterjemahkan dari kode bahasa. Berguna jika Anda memilih opsi deteksi bahasa otomatis karena output ini akan memberi Anda hasil deteksi tersebut. |
Definisi sampel
{
"@odata.type": "#Microsoft.Skills.Text.TranslationSkill",
"defaultToLanguageCode": "fr",
"suggestedFrom": "en",
"context": "/document",
"inputs": [
{
"name": "text",
"source": "/document/text"
}
],
"outputs": [
{
"name": "translatedText",
"targetName": "translatedText"
},
{
"name": "translatedFromLanguageCode",
"targetName": "translatedFromLanguageCode"
},
{
"name": "translatedToLanguageCode",
"targetName": "translatedToLanguageCode"
}
]
}
Input sampel
{
"values": [
{
"recordId": "1",
"data":
{
"text": "We hold these truths to be self-evident, that all men are created equal."
}
},
{
"recordId": "2",
"data":
{
"text": "Estamos muy felices de estar con ustedes."
}
}
]
}
Sampel output
{
"values": [
{
"recordId": "1",
"data":
{
"translatedText": "Nous tenons ces vérités pour évidentes, que tous les hommes sont créés égaux.",
"translatedFromLanguageCode": "en",
"translatedToLanguageCode": "fr"
}
},
{
"recordId": "2",
"data":
{
"translatedText": "Nous sommes très heureux d'être avec vous.",
"translatedFromLanguageCode": "es",
"translatedToLanguageCode": "fr"
}
}
]
}
Kesalahan dan peringatan
Jika Anda memberikan kode bahasa yang tidak didukung untuk bahasa "ke" atau "dari", kesalahan dihasilkan, dan teks tidak diterjemahkan. Jika teks Anda kosong, peringatan akan dihasilkan. Jika teks Anda lebih besar dari 50.000 karakter, hanya 50.000 karakter pertama yang akan diterjemahkan, dan peringatan akan dikeluarkan.