Bagikan melalui


Deteksi Bahasa Microsoft

Layanan deteksi bahasa ELS disebut Deteksi Bahasa Microsoft. Layanan ini menggunakan teknologi yang dipatensi Microsoft untuk memungkinkan aplikasi mendeteksi bahasa tempat teks tertentu ditulis.

Input ke Deteksi Bahasa Microsoft

Input ke layanan Deteksi Bahasa Microsoft adalah teks UTF-16 (formulir C yang dinormalisasi). Layanan harus menentukan bahasa untuk teks ini.

Output Deteksi Bahasa Microsoft

Layanan Deteksi Bahasa Microsoft mengambil bahasa daftar string UTF-16 berformat registri ganda yang dihentikan null, yang diwakili oleh pemisah karakter null. Daftar diurutkan menurut relevansi. Untuk sebagian besar bahasa, nama netral digunakan. Namun, untuk beberapa orang, misalnya, sr-Cyrl, sr-Latn, zh-Hant, dan zh-Hans, nama lengkap digunakan.

Operasi Deteksi Bahasa Microsoft

Layanan Deteksi Bahasa Microsoft memeriksa skrip Unicode dari teks yang disediakan oleh aplikasi. Ini mengesegmentasi teks berdasarkan skrip yang dideteksinya, lalu menentukan bahasa tempat setiap segmen ditulis. Jika skrip menunjukkan satu bahasa, bahasa dijamin ada dalam daftar output bahasa. Layanan ini menggunakan algoritma yang dipaentkan untuk menentukan relevansi setiap bahasa yang didukung.

GUID Deteksi Bahasa Microsoft

GUID untuk layanan Deteksi Bahasa Microsoft dideklarasikan dalam Elssrvc.h, seperti yang ditunjukkan dalam kode berikut.

// {CF7E00B1-909B-4d95-A8F4-611F7C377702}
static const GUID ELS_GUID_LANGUAGE_DETECTION =
    { 0xCF7E00B1, 0x909B, 0x4D95, { 0xA8, 0xF4, 0x61, 0x1F, 0x7C, 0x37, 0x77, 0x02 } };

Tentang Extended Linguistic Services