char および varchar (Transact-SQL)
適用対象: SQL Server Azure SQL Database Azure SQL Managed Instance Azure Synapse Analytics Analytics Platform System (PDW) Microsoft Fabric のSQL 分析エンドポイント Microsoft Fabric のウェアハウス
固定サイズ (char)、または可変サイズ (varchar) の文字データ型です。 SQL Server 2019 (15.x) 以降では、UTF-8 対応の照合順序を使用すると、これらのデータ型は Unicode 文字データの全範囲を格納し、 UTF-8 文字エンコードを使用します。 UTF-8 が無効の照合順序を指定する場合、これらのデータ型には、対応するその照合順序のコード ページでサポートされている文字のサブセットのみが格納されます。
引数
char [ ( n ) ]
固定サイズの文字列データです。 n によってバイト単位での文字列のサイズが定義されます。1 から 8,000 までの値にする必要があります。 Latin
などの 1 バイト エンコード文字セットの場合、ストレージのサイズは n バイトとなり、格納できる文字数もまた n となります。 マルチバイト エンコード文字セットの場合、ストレージ サイズは引き続き n バイトですが、格納できる文字数は n よりも小さい場合があります。 char の ISO シノニムは、character です。 文字セットについて詳しくは、「1 バイト文字セットとマルチバイト文字セット」をご覧ください。
varchar [ ( n | max ) ]
可変サイズの文字列データです。 n (1 から 8,000 の値を指定可能) を使用して文字列のサイズをバイト単位で定義するか、または max を使用して列の制約サイズが最大ストレージである 2^31-1 バイト (2 GB) までであることを指定します。 Latin
などの 1 バイト エンコード文字セットの場合、ストレージのサイズは n バイト + 2 バイトとなり、格納できる文字数もまた n となります。 マルチバイト エンコード文字セットの場合、ストレージ サイズは引き続き n バイト + 2 バイトですが、格納できる文字数は n よりも小さい場合があります。 varchar の ISO シノニムは、char varying または character varying です。 文字セットについて詳しくは、「1 バイト文字セットとマルチバイト文字セット」をご覧ください。
解説
よくある誤解は、char(n) と varchar(n) では、n によって文字数が定義されると考えられていることです。 ただし、char(n) と varchar(n) では、n によって文字長がバイト (0-8,000) で定義されます。 n は、格納できる文字数を定義しません。 この概念は、 nchar と nvarchar の定義に似ています。
1 バイト エンコードを使用する場合、char および varchar のストレージ サイズは n バイトであり、文字数も n であるため、誤解が生じます。 しかしながら、UTF-8 などのマルチバイト エンコードの場合、より高い Unicode 範囲 (128 - 1,114,111) では 1 文字に 2 バイト以上が使用されることになります。 たとえば、char(10) として定義された列では、データベース エンジンで格納できる文字は、1 バイト エンコード (Unicode 範囲 0 - 127) を使用する場合は 10 文字ですが、マルチバイト エンコード (Unicode 範囲 128 - 1,114,111) を使用する場合は 10 文字未満です。 Unicode の格納と文字の範囲の詳細については、「UTF-8 と UTF-16 でのストレージの相違点」を参照してください。
データ定義または変数宣言ステートメントで n を指定しないと、既定の長さは 1 になります。 CAST
および CONVERT
の関数で n を指定しないと、既定の長さは 30 になります。
COLLATE
句で特定の照合順序を指定しない限り、char 型または varchar 型を使用するオブジェクトにはデータベースの既定の照合順序が割り当てられます。 照合順序によって、文字型データの格納に使用されるコード ページが制御されます。
SQL Server のマルチバイト エンコードには以下が含まれます。
一部の東アジア言語に向けた 2 バイト文字セット (DBCS)。コード ページ 936 および 950 (中国語)、932 (日本語)、または 949 (韓国語) を使用します。
コード ページ 65001 を使用する UTF 8。
適用対象: SQL Server 2019 (15.x) 以降のバージョン。
複数言語をサポートするサイトがある場合:
- SQL Server 2019 (15.x) 以降、Unicode をサポートして文字変換の問題を最小限に抑えるために、UTF-8 が有効になっている照合順序の使用を検討してください。
- 以前のバージョンの SQL Server データベース エンジンを使用する場合、文字変換の問題を最小限に抑えるために、Unicode の nchar データ型または nvarchar データ型を使用することを検討してください。
char 型または varchar 型を使用する場合は、次のことをお勧めします。
- 列データ エントリのサイズが一定の場合は、char を使用します。
- 列データ エントリのサイズが大幅に変化する場合は、varchar を使用します。
- 列データ エントリのサイズが大幅に変化し、かつ文字列の長さが 8,000 バイトを超える可能性がある場合は、varchar(max) を使用します。
CREATE TABLE
またはALTER TABLE
の実行時にSET ANSI_PADDING
がOFF
されると、NULL
として定義された char 列が varchar として処理されます。
警告
null 値以外の varchar(max) または nvarchar(max) の各列には、24 バイトの追加の固定割り当てが必要です。これは並べ替え操作中の 8,060 バイトの行制限におけるカウント対象となります。 これにより、テーブル内に作成できる Null 以外の varchar(max) または nvarchar(max) の列数について、暗黙的な制限が生じます。
テーブルの作成時やデータ挿入時に、最大行サイズが許容最大値の 8,060 バイトを超えるという通常の警告以外の、特別なエラーは提供されません。 この大きな行サイズが原因で、クラスター化インデックス キーの更新や列セット全体の並べ替えなどの通常操作の一部でエラー (エラー 512 など) が発生する可能性があります。これは、操作の実行中にのみ発生します。
文字データの変換
文字式を異なるサイズの文字型に変換する場合、値が新しいデータ型に長すぎる場合は、切り捨てられます。 uniqueidentifier 型は、文字式からの変換のための文字型と見なされるため、文字型に変換する場合は切り捨てのルールが適用されます。 「使用例」セクションを参照してください。
文字式がデータ型やサイズが異なる文字式に変換される場合 (char(5) から varchar(5) や、char(20) から char(15) など)、入力値の照合順序が変換後の値に割り当てられます。 文字式でない式が文字型に変換される場合、現在のデータベースの既定の照合順序が変換後の値に割り当てられます。 どちらの場合でも、COLLATE 句を使用して特定の照合を割り当てることができます。
Note
コード ページ変換は char および varchar データ型に対してはサポートされていますが、text データ型に対してはサポートされていません。 以前のバージョンの SQL Server と同様に、コード ページの変換中のデータの損失は報告されません。
近似の数値データ型に変換される文字式には、オプションで指数表記を含めることができます。 この表記は、オプションでプラス (+
) またはマイナス (-
) 記号、次いで数字が続く、小文字の e
または大文字の E
です。
文字式を正確な numeric 型に変換する場合、その文字式は、数字と小数点から構成されている必要があります。必要に応じて、プラス記号 (+
) またはマイナス記号 (-
) を付けることができます。 先頭の空白は無視されます。 123,456.00
の千の区切り記号など、コンマ区切りの記号は、文字列内で使用できません。
文字式を money 型または smallmoney 型に変換する場合、その文字式も、小数点とドル記号 ($
) を含むことができます。 $123,456.00
のようにコンマを区切り記号として使用できます。
空の文字列が int に変換されると、その値は 0
になります。 空の文字列が日付に変換されると、その値は date - 1900-01-01
になります。
例
A. 変数宣言で使用された場合の n の既定値を示す
次の例は、変数宣言で使用する場合、 n の既定値が char および varchar データ型に対して 1 であることを示しています。
DECLARE @myVariable AS VARCHAR = 'abc';
DECLARE @myNextVariable AS CHAR = 'abc';
--The following query returns 1
SELECT DATALENGTH(@myVariable), DATALENGTH(@myNextVariable);
GO
B. CAST および CONVERT と共に varchar が使用された場合の n の既定値を示す
次の例は、char または varchar データ型が CAST
および CONVERT
関数で使用された場合に、n の既定値が 30 になることを示しています。
DECLARE @myVariable AS VARCHAR(40);
SET @myVariable = 'This string is longer than thirty characters';
SELECT CAST(@myVariable AS VARCHAR);
SELECT DATALENGTH(CAST(@myVariable AS VARCHAR)) AS 'VarcharDefaultLength';
SELECT CONVERT(CHAR, @myVariable);
SELECT DATALENGTH(CONVERT(CHAR, @myVariable)) AS 'VarcharDefaultLength';
C. 表示用にデータを変換する
次の例では、2 つの列を文字型に変換し、表示されるデータに特定の形式を適用するスタイルを指定します。 money 型は文字データに変換され、スタイル 1
が適用されます。それによって、整数部分は 3 桁ごとにコンマで区切られ、小数点以下は 2 桁までの値が表示されます。 datetime 型は文字データに変換され、スタイル 3
が適用されます。それによって、dd/mm/yy
の形式でデータが表示されます。 WHERE
句の money 型は文字タイプにキャストされ、文字列比較操作が実行されます。
USE AdventureWorks2022;
GO
SELECT BusinessEntityID,
SalesYTD,
CONVERT(VARCHAR(12), SalesYTD, 1) AS MoneyDisplayStyle1,
GETDATE() AS CurrentDate,
CONVERT(VARCHAR(12), GETDATE(), 3) AS DateDisplayStyle3
FROM Sales.SalesPerson
WHERE CAST(SalesYTD AS VARCHAR(20)) LIKE '1%';
結果セットは次のようになります。
BusinessEntityID SalesYTD DisplayFormat CurrentDate DisplayDateFormat
---------------- --------------------- ------------- ----------------------- -----------------
278 1453719.4653 1,453,719.47 2011-05-07 14:29:01.193 07/05/11
280 1352577.1325 1,352,577.13 2011-05-07 14:29:01.193 07/05/11
283 1573012.9383 1,573,012.94 2011-05-07 14:29:01.193 07/05/11
284 1576562.1966 1,576,562.20 2011-05-07 14:29:01.193 07/05/11
285 172524.4512 172,524.45 2011-05-07 14:29:01.193 07/05/11
286 1421810.9242 1,421,810.92 2011-05-07 14:29:01.193 07/05/11
288 1827066.7118 1,827,066.71 2011-05-07 14:29:01.193 07/05/11
D. uniqueidentifier データを変換する
次の例では、uniqueidentifier 値を char データ型に変換します。
DECLARE @myid UNIQUEIDENTIFIER = NEWID();
SELECT CONVERT(CHAR(255), @myid) AS 'char';
次の例は、変換後のデータ型に対して値が長すぎる場合のデータの切り捨てを示します。 uniqueidentifier 型は 36 文字に制限されているため、この長さを超える文字は切り捨てられます。
DECLARE @ID NVARCHAR(MAX) = N'0E984725-C51C-4BF4-9960-E1C80E27ABA0wrong';
SELECT @ID, CONVERT(UNIQUEIDENTIFIER, @ID) AS TruncatedValue;
結果セットは次のようになります。
String TruncatedValue
------------------------------------------ ------------------------------------
0E984725-C51C-4BF4-9960-E1C80E27ABA0wrong 0E984725-C51C-4BF4-9960-E1C80E27ABA0