UTF8Encoding.Preamble 属性

定义

获取采用 UTF-8 格式编码的 Unicode 字节顺序标记(如果此对象配置为提供一个这样的标记)。

public:
 virtual property ReadOnlySpan<System::Byte> Preamble { ReadOnlySpan<System::Byte> get(); };
public override ReadOnlySpan<byte> Preamble { get; }
member this.Preamble : ReadOnlySpan<byte>
Public Overrides ReadOnly Property Preamble As ReadOnlySpan(Of Byte)

属性值

ReadOnlySpan<Byte>

如果此对象配置为提供一个字节,则包含 Unicode 字节顺序标记的字节范围;否则为默认范围。

注解

UTF8Encoding 对象可以提供一个前言,它是一个字节范围,可以前缀为编码过程生成的字节序列。 使用字节顺序标记 (代码点 U+FEFF) 开头编码字节序列有助于解码器确定字节顺序和转换格式或 UTF。 unicode 字节顺序标记 (BOM) 序列化为0xEF 0xBB 0xBF。 请注意,Unicode Standard 既不需要也不建议对 UTF-8 编码流使用 BOM。

可以通过以下方式实例化 UTF8EncodingPreamble 为有效 BOM 的对象:

所有其他 UTF8Encoding 对象都配置为返回默认范围,而不是有效的 BOM。

BOM 为文件提供几乎肯定的编码标识,这些编码在其他情况下丢失了对其编码的引用,例如未标记或未正确标记的 Web 数据或当企业没有国际关注时存储的随机文本文件。 如果数据一致且正确标记,则可能会避免用户问题。

对于提供编码类型的标准,BOM 有些多余。 但是,可以使用它来帮助服务器发送正确的编码标头。 或者,它可以用作回退,以防编码在其他情况下丢失。

使用 BOM 存在一些缺点。 例如,了解如何限制使用 BOM 的数据库字段可能很困难。 文件的串联可能也是一个问题,例如,当文件以这样一种方式进行合并时,不需要的字符会在数据中间结束。 但尽管有几个缺点,但强烈建议使用 BOM。

有关字节顺序和字节顺序标记的详细信息,请参阅unicode 主页上的 unicode 标准。

重要

为了确保编码的字节在保存为文件或流时正确解码,可以将编码字节流的开头作为前言前缀。 请注意,该方法 GetBytes 不会将 BOM 追加到编码字节序列;在适当的字节流开头提供 BOM 是开发人员的责任。

适用于