isTextUnicode 函数 (winbase.h)
确定缓冲区是否可能包含 Unicode 文本形式。
语法
BOOL IsTextUnicode(
[in] const VOID *lpv,
[in] int iSize,
[in, out, optional] LPINT lpiResult
);
参数
[in] lpv
指向要检查的输入缓冲区的指针。
[in] iSize
lpv 指示的输入缓冲区的大小(以字节为单位)。
[in, out, optional] lpiResult
输入时,指向要应用于输入缓冲区文本的测试的指针。 在输出时,此参数接收指定测试的结果:如果缓冲区的内容通过测试,则为 1;如果失败,则为 0。 只有输入函数时设置的标志在输出时是重要的。
如果 lpiResult 为 NULL,则该函数使用所有可用的测试来确定缓冲区中的数据是否可能是 Unicode 文本。
此参数可使用以下一个或多个值。 值可与二进制“OR”组合使用。
值 |
含义 |
- IS_TEXT_UNICODE_ASCII16
|
文本为 Unicode,仅包含零扩展的 ASCII 值/字符。
|
- IS_TEXT_UNICODE_REVERSE_ASCII16
|
与前面相同,只不过 Unicode 文本是字节反转的。
|
- IS_TEXT_UNICODE_STATISTICS
|
文本可能是 Unicode,通过应用统计分析确定。 无法保证绝对确定性。 请参阅“备注”部分。
|
- IS_TEXT_UNICODE_REVERSE_STATISTICS
|
与前面相同,只是可能是 Unicode 的文本是字节反转的。
|
- IS_TEXT_UNICODE_CONTROLS
|
文本包含一个或多个非打印字符的 Unicode 表示形式:RETURN、LINEFEED、SPACE、CJK_SPACE、TAB。
|
- IS_TEXT_UNICODE_REVERSE_CONTROLS
|
与前面的相同,只不过 Unicode 字符是字节反转的。
|
- IS_TEXT_UNICODE_BUFFER_TOO_SMALL
|
缓冲区中的字符太少,无法进行有意义的分析 (少于两个字节) 。
|
- IS_TEXT_UNICODE_SIGNATURE
|
文本包含 Unicode 字节顺序标记 (BOM) 0xFEFF 作为其第一个字符。
|
- IS_TEXT_UNICODE_REVERSE_SIGNATURE
|
文本包含 Unicode 字节反转字节顺序标记 (反向 BOM) 0xFFFE 作为其第一个字符。
|
- IS_TEXT_UNICODE_ILLEGAL_CHARS
|
文本包含下列 Unicode 非法字符之一:嵌入的反向 BOM、UNICODE_NUL、CRLF (打包到一个单词) 或0xFFFF。
|
- IS_TEXT_UNICODE_ODD_LENGTH
|
字符串中的字符数是奇数。 根据定义,奇数长度的字符串不能 () Unicode 文本。
|
- IS_TEXT_UNICODE_NULL_BYTES
|
文本包含空字节,指示非 ASCII 文本。
|
- IS_TEXT_UNICODE_UNICODE_MASK
|
该值是IS_TEXT_UNICODE_ASCII16、IS_TEXT_UNICODE_STATISTICS、IS_TEXT_UNICODE_CONTROLS IS_TEXT_UNICODE_SIGNATURE的组合。
|
- IS_TEXT_UNICODE_REVERSE_MASK
|
该值是IS_TEXT_UNICODE_REVERSE_ASCII16、IS_TEXT_UNICODE_REVERSE_STATISTICS、IS_TEXT_UNICODE_REVERSE_CONTROLS IS_TEXT_UNICODE_REVERSE_SIGNATURE的组合。
|
- IS_TEXT_UNICODE_NOT_UNICODE_MASK
|
该值是IS_TEXT_UNICODE_ILLEGAL_CHARS、IS_TEXT_UNICODE_ODD_LENGTH和两个当前未使用的位标志的组合。
|
- IS_TEXT_UNICODE_NOT_ASCII_MASK
|
该值是IS_TEXT_UNICODE_NULL_BYTES和三个当前未使用的位标志的组合。
|
返回值
如果缓冲区中的数据通过指定的测试,则返回非零值。 如果缓冲区中的数据未通过指定的测试,则函数返回 0。
此函数使用各种统计和确定性方法在 lpiResult 参数中传递的标志的控制下做出确定。 当函数返回时,将使用同一参数报告此类测试的结果。
IS_TEXT_UNICODE_STATISTICS和IS_TEXT_UNICODE_REVERSE_STATISTICS测试使用统计分析。 这些测试并非万无一失。 统计测试假定字符串中低字节和高字节之间存在一定程度的变化,并且某些 ASCII 字符串可能会滑过。 例如,如果 lpv 指示 ASCII 字符串0x41、0x0A、0x0D 0x1D (A\n\r^Z) ,则字符串会通过IS_TEXT_UNICODE_STATISTICS测试,但最好失败。
要求
要求 |
值 |
最低受支持的客户端 |
Windows 2000 Professional [仅限桌面应用] |
最低受支持的服务器 |
Windows 2000 Server [仅限桌面应用] |
目标平台 |
Windows |
标头 |
winbase.h (包括 Windows.h) |
Library |
Advapi32.lib |
DLL |
Advapi32.dll |
另请参阅
Unicode 和字符集函数
Unicode 和字符集