UTF32Encoding.GetPreamble 方法
定義
重要
部分資訊涉及發行前產品,在發行之前可能會有大幅修改。 Microsoft 對此處提供的資訊,不做任何明確或隱含的瑕疵擔保。
如果設定 UTF32Encoding 編碼物件提供編碼方式,則會傳回以 UTF-32 格式編碼的 Unicode 位元組順序標記。
public:
override cli::array <System::Byte> ^ GetPreamble();
public override byte[] GetPreamble ();
override this.GetPreamble : unit -> byte[]
Public Overrides Function GetPreamble () As Byte()
傳回
- Byte[]
如果設定 UTF32Encoding 物件提供編碼方式,則為包含 Unicode 位元組順序標記的位元組陣列。 否則,這個方法會傳回長度為零的位元組陣列。
範例
下列程式碼範例會擷取並顯示不同 UTF32Encoding 實例的位元組順序標記。
using namespace System;
using namespace System::Text;
void PrintHexBytes( array<Byte>^bytes );
int main()
{
// Create instances of UTF32Encoding, with the byte order mark and without.
UTF32Encoding ^ u32LeNone = gcnew UTF32Encoding;
UTF32Encoding ^ u32BeNone = gcnew UTF32Encoding( true,false );
UTF32Encoding ^ u32LeBom = gcnew UTF32Encoding( false,true );
UTF32Encoding ^ u32BeBom = gcnew UTF32Encoding( true,true );
// Display the preamble for each instance.
PrintHexBytes( u32LeNone->GetPreamble() );
PrintHexBytes( u32BeNone->GetPreamble() );
PrintHexBytes( u32LeBom->GetPreamble() );
PrintHexBytes( u32BeBom->GetPreamble() );
}
void PrintHexBytes( array<Byte>^bytes )
{
if ( (bytes == nullptr) || (bytes->Length == 0) )
Console::WriteLine( "<none>" );
else
{
for ( int i = 0; i < bytes->Length; i++ )
Console::Write( "{0:X2} ", bytes[ i ] );
Console::WriteLine();
}
}
/*
This example displays the following output:
FF FE 00 00
<none>
FF FE 00 00
00 00 FE FF
*/
using System;
using System.Text;
public class SamplesUTF32Encoding
{
public static void Main()
{
// Create instances of UTF32Encoding, with the byte order mark and without.
UTF32Encoding u32LeNone = new UTF32Encoding();
UTF32Encoding u32BeNone = new UTF32Encoding( true, false );
UTF32Encoding u32LeBom = new UTF32Encoding( false, true );
UTF32Encoding u32BeBom = new UTF32Encoding( true, true );
// Display the preamble for each instance.
PrintHexBytes( u32LeNone.GetPreamble() );
PrintHexBytes( u32BeNone.GetPreamble() );
PrintHexBytes( u32LeBom.GetPreamble() );
PrintHexBytes( u32BeBom.GetPreamble() );
}
public static void PrintHexBytes( byte[] bytes )
{
if (( bytes == null ) || ( bytes.Length == 0 ))
{
Console.WriteLine( "<none>" );
}
else {
for ( int i = 0; i < bytes.Length; i++ )
Console.Write( "{0:X2} ", bytes[i] );
Console.WriteLine();
}
}
}
/*
This example displays the following output.
FF FE 00 00
<none>
FF FE 00 00
00 00 FE FF
*/
Imports System.Text
Public Class SamplesUTF32Encoding
Public Shared Sub Main()
' Create instances of UTF32Encoding, with the byte order mark and without.
Dim u32LeNone As New UTF32Encoding()
Dim u32BeNone As New UTF32Encoding(True, False)
Dim u32LeBom As New UTF32Encoding(False, True)
Dim u32BeBom As New UTF32Encoding(True, True)
' Display the preamble for each instance.
PrintHexBytes(u32LeNone.GetPreamble())
PrintHexBytes(u32BeNone.GetPreamble())
PrintHexBytes(u32LeBom.GetPreamble())
PrintHexBytes(u32BeBom.GetPreamble())
End Sub
Public Shared Sub PrintHexBytes(bytes() As Byte)
If bytes Is Nothing OrElse bytes.Length = 0 Then
Console.WriteLine("<none>")
Else
Dim i As Integer
For i = 0 To bytes.Length - 1
Console.Write("{0:X2} ", bytes(i))
Next i
Console.WriteLine()
End If
End Sub
End Class
'This example displays the following output:
' FF FE 00 00
' FF FE 00 00
' 00 00 FE FF
下列範例會具現化兩 UTF32Encoding 個 物件,其中第一個物件未提供 BOM,第二個物件則為 。 然後它會呼叫 GetPreamble 方法,在撰寫 UTF-32 編碼字串之前,先將 BOM 寫入檔案。 如範例輸出所示,儲存第二個編碼器位元組的檔案具有第一個編碼器的四個以上的位元組。
using System;
using System.IO;
using System.Text;
public class Example
{
public static void Main()
{
String s = "This is a string to write to a file using UTF-32 encoding.";
// Write a file using the default constructor without a BOM.
var enc = new UTF32Encoding(! BitConverter.IsLittleEndian, false);
Byte[] bytes = enc.GetBytes(s);
WriteToFile(@".\NoPreamble.txt", enc, bytes);
// Use BOM.
enc = new UTF32Encoding(! BitConverter.IsLittleEndian, true);
WriteToFile(@".\Preamble.txt", enc, bytes);
}
private static void WriteToFile(String fn, Encoding enc, Byte[] bytes)
{
var fs = new FileStream(fn, FileMode.Create);
Byte[] preamble = enc.GetPreamble();
fs.Write(preamble, 0, preamble.Length);
Console.WriteLine("Preamble has {0} bytes", preamble.Length);
fs.Write(bytes, 0, bytes.Length);
Console.WriteLine("Wrote {0} bytes to {1}.", fs.Length, fn);
fs.Close();
Console.WriteLine();
}
}
// The example displays the following output:
// Preamble has 0 bytes
// Wrote 232 bytes to .\NoPreamble.txt.
//
// Preamble has 4 bytes
// Wrote 236 bytes to .\Preamble.txt.
Imports System.IO
Imports System.Text
Module Example
Public Sub Main()
Dim s As String = "This is a string to write to a file using UTF-32 encoding."
' Write a file using the default constructor without a BOM.
Dim enc As New UTF32Encoding(Not BitConverter.IsLittleEndian, False)
Dim bytes() As Byte = enc.GetBytes(s)
WriteToFile("NoPreamble.txt", enc, bytes)
' Use BOM.
enc = New UTF32Encoding(Not BitConverter.IsLittleEndian, True)
WriteToFile("Preamble.txt", enc, bytes)
End Sub
Private Sub WriteToFile(fn As String, enc As Encoding, bytes As Byte())
Dim fs As New FileStream(fn, FileMode.Create)
Dim preamble() As Byte = enc.GetPreamble()
fs.Write(preamble, 0, preamble.Length)
Console.WriteLine("Preamble has {0} bytes", preamble.Length)
fs.Write(bytes, 0, bytes.Length)
Console.WriteLine("Wrote {0} bytes to {1}.", fs.Length, fn)
fs.Close()
Console.WriteLine()
End Sub
End Module
' The example displays the following output:
' Preamble has 0 bytes
' Wrote 232 bytes to NoPreamble.txt.
'
' Preamble has 4 bytes
' Wrote 236 bytes to Preamble.txt.
您也可以在主控台視窗中使用 fc
命令來比較檔案,或者您可以在包含十六進位檢視模式的文字編輯器中檢查檔案。 請注意,當檔案在支援 UTF-32 的編輯器中開啟時,不會顯示 BOM。
備註
UTF32Encoding物件可以提供前置詞,這是位元組陣列,可前置詞至編碼程式所產生的位元組序列。 使用位元組順序標記 (字碼點 U+0000 U+FEFF) 前置編碼位元組序列,可協助解碼器判斷位元組順序和轉換格式,或 UTF。 Unicode 位元組順序標記 (BOM) 序列化,如下所示,以十六進位) (:
大位元組位元組順序:00 00 FE FF
小尾位元組順序:FF FE 00 00
您可以透過下列方式具現化 UTF32Encoding 方法傳回有效 BOM 的物件 GetPreamble :
藉由擷 UTF32Encoding 取 屬性所 Encoding.UTF32 傳回的物件。
藉由呼叫無 UTF32Encoding() 參數建構函式來具現化 UTF32Encoding 物件。
藉由提供
true
做為 和 UTF32Encoding 建構函式的byteOrderMark
引數 UTF32Encoding 值。
建議您使用 BOM,因為它會提供對物件遺失參考 UTF32Encoding 之檔案的編碼方式,例如未標記或未正確標記的 Web 資料,或當企業沒有國際考慮或其他資料時儲存的隨機文字檔。 通常,如果資料一致且正確標記,可能會避免使用者問題。
對於提供編碼類型的標準,BOM 有點備援。 不過,它可以用來協助伺服器傳送正確的編碼標頭。 或者,當編碼遺失時,它可以用來做為後援。
使用 BOM 有一些缺點。 例如,瞭解如何限制使用 BOM 的資料庫欄位可能很困難。 檔案串連也可能是問題,例如,當檔案合併時,可能會讓不必要的字元最終出現在資料中間。 不過,雖然有幾個缺點,但強烈建議使用 BOM。
如需位元組順序和位元組順序標記的詳細資訊,請參閱 Unicode 首頁上的 Unicode標準。
重要
若要確保編碼的位元組正確解碼,您應該使用前置詞來前置編碼的位元組。 請注意,方法 GetBytes 不會在編碼位元組序列前面加上 BOM;在適當的位元組資料流程開頭提供 BOM 是開發人員的責任。