UTF8Encoding.Preamble Properti
Definisi
Penting
Beberapa informasi terkait produk prarilis yang dapat diubah secara signifikan sebelum dirilis. Microsoft tidak memberikan jaminan, tersirat maupun tersurat, sehubungan dengan informasi yang diberikan di sini.
Mendapatkan tanda urutan byte Unicode yang dikodekan dalam format UTF-8, jika objek ini dikonfigurasi untuk menyediakannya.
public:
virtual property ReadOnlySpan<System::Byte> Preamble { ReadOnlySpan<System::Byte> get(); };
public override ReadOnlySpan<byte> Preamble { get; }
member this.Preamble : ReadOnlySpan<byte>
Public Overrides ReadOnly Property Preamble As ReadOnlySpan(Of Byte)
Nilai Properti
Rentang byte yang berisi tanda urutan byte Unicode, jika objek ini dikonfigurasi untuk menyediakannya; jika tidak, rentang default.
Keterangan
Objek UTF8Encoding dapat memberikan awalan, yang merupakan rentang byte yang dapat diawali dengan urutan byte yang dihasilkan dari proses pengodean. Prefacing urutan byte yang dikodekan dengan tanda urutan byte (titik U+FEFFkode ) membantu dekoder menentukan urutan byte dan format transformasi, atau UTF. Tanda urutan byte Unicode (BOM) diserialisasikan sebagai 0xEF 0xBB 0xBF. Perhatikan bahwa Standar Unicode tidak memerlukan atau merekomendasikan penggunaan BOM untuk aliran yang dikodekan UTF-8.
Anda dapat membuat instans UTF8Encoding objek yang Preamble merupakan BOM valid dengan cara berikut:
Dengan mengambil objek yang UTF8Encoding dikembalikan oleh Encoding.UTF8 properti .
Dengan memanggil UTF8Encoding konstruktor dengan
encoderShouldEmitUTF8Identifierparameter dan mengatur nilainya diatur ketrue.
Semua objek lain UTF8Encoding dikonfigurasi untuk mengembalikan rentang default daripada BOM yang valid.
BOM menyediakan identifikasi yang hampir pasti dari pengodean untuk file yang jika tidak kehilangan referensi ke pengodean mereka, seperti data web yang tidak diberi tag atau tidak benar atau file teks acak yang disimpan ketika bisnis tidak memiliki kekhawatiran internasional. Seringkali masalah pengguna mungkin dihindari jika data ditandai dengan konsisten dan benar.
Untuk standar yang menyediakan jenis pengodean, BOM agak berlebihan. Namun, ini dapat digunakan untuk membantu server mengirim header pengodean yang benar. Atau, ini dapat digunakan sebagai fallback jika pengodean hilang.
Ada beberapa kelemahan menggunakan BOM. Misalnya, mengetahui cara membatasi bidang database yang menggunakan BOM bisa sulit. Penggabungan file juga dapat menjadi masalah, misalnya, ketika file digabungkan sewaktu-waktu sehingga karakter yang tidak perlu dapat berakhir di tengah data. Terlepas dari beberapa kelemahan, namun, penggunaan BOM sangat disarankan.
Untuk informasi selengkapnya tentang urutan byte dan tanda urutan byte, lihat Standar Unicode di halaman beranda unicode .
Penting
Untuk memastikan bahwa byte yang dikodekan didekodekan dengan benar saat disimpan sebagai file atau sebagai aliran, Anda dapat mengawali awalan aliran byte yang dikodekan dengan dapat dimulalui. Perhatikan bahwa GetBytes metode ini tidak menambahkan BOM ke urutan byte yang dikodekan; memasok BOM di awal aliran byte yang sesuai adalah tanggung jawab pengembang.