文字列関数の相違点

このトピックでは、Unicode および文字セット情報の処理に使用される文字列関数の違いについて説明します。これらの関数には、Unicode と Windows コードページの両方実装があり、Unicode と Windows のコードページパラメーターをサポートします。

次の文字列関数では、特別なコメントは必要ありません。 Unicode と Windows コードページの実装は同じように機能します。

文字列長関数の 1 つによって取得される長さの値は、常に通常の文字幅 (Windows コードページの場合は 8 ビット、Unicode の場合は 16 ビット) に基づきます。この値は、多くの場合、"文字数" と呼ばれます。この用語は厳密に正しいのは、2 バイト文字セット (DBCS) を使用する Windows コードページには、実際には 2 つの連続したバイトで表される一部の全角文字があるためです。 Unicode でサロゲートでも同様の状況が発生します。

次の文字列関数は、ユーザーがコントロールパネルで選択した言語から派生した、現在のスレッドのロケールに依存します。 lstrcmp 関数と lstrcmpi 関数では、ANSI 名の設定などのバイト比較は実行されません(たとえば、strcmp )。代わりに、ロケールの規則に従って文字列を比較します。

CharLowerをする
CharLowerBuffをする
CharUpperをする
CharUpperBuffをする
lstrcmpをする
lstrcmpiをする

次の関数は、使用されているバージョンに応じて、OEM 文字セットと現在の Windows コードページまたは Unicode の間で変換されます。

CharToOemをする
CharToOemBuffをする
OemToCharBuff

印刷関数 (たとえば、StringCbPrintf) は、次の新しいデータ型と変更されたデータ型を形式指定で提供することで Unicode をサポートします。これらの書式指定は、関数が対応する入力パラメーターを解釈する方法に影響します。

形式の指定	Windows コードページバージョンのデータ型	Unicode バージョンのデータ型
c	焦がす	WCHAR
C	WCHAR	焦がす
hc、hC	焦がす	焦がす
hs、hS	LPSTR	LPSTR
lc、lC	WCHAR	WCHAR
ls、lS	LPWSTR	LPWSTR
s	LPSTR	LPWSTR
S	LPWSTR	LPSTR

出力テキストのデータ型は、常に関数のバージョンによって異なります。入力パラメーターのデータ型と出力テキストのデータ型が一致しない場合、印刷関数は、必要に応じて Unicode から現在の Windows コードページへの変換、またはその逆を実行します。

Unicode バージョンの印刷関数の場合、書式指定文字列は Unicode で、出力テキストも同様です。

注意

バッファーの処理が不適切なのは、バッファーオーバーランを伴う多くのセキュリティの問題に関係しています。 Strsafe.h リファレンス参照してください。 Strsafe.h で定義されている関数は、コード内で適切なバッファー処理のための追加処理を提供します。このため、組み込みの C/C++ に対応する、および特定の Microsoft Windows 実装を置き換えることを目的としています。詳細については、「セキュリティに関する考慮事項: 国際機能」を参照してください。

Windows API で Unicode をする

フィードバック

このページはお役に立ちましたか?

Last updated on 2025-03-12

文字列関数の相違点

関連トピック

フィードバック

その他のリソース