XML 인스턴스 생성
XML 데이터 유형에 설명된 대로 SQL Server 데이터베이스에 XML 인스턴스를 저장할 수 있습니다. 이 항목에서는 다음에 대해 설명합니다.
- XML 인스턴스를 생성하는 방법
- XML 인스턴스를 문자열로 변환하는 방법
XML 인스턴스 생성
SQL Server에서 다음과 같은 방법으로 XML 인스턴스를 생성할 수 있습니다.
- 문자열 인스턴스 형변환
- SELECT 문에 FOR XML 절 사용
- 상수 할당 사용
- 대량 로드 사용
문자열 및 이진 인스턴스 형변환
문자열을 xml 데이터 유형으로 형변환(CAST)하거나 변환(CONVERT)하여 [n][var]char, [n]text, varbinary 및 image와 같은 SQL Server 문자열 데이터 유형을 xml 데이터 유형으로 구문 분석할 수 있습니다. 형식화되지 않은 XML의 형식이 올바른지 확인하기 위해 검사합니다. xml 유형과 관련된 스키마가 있을 경우 유효성 검사도 수행됩니다. 자세한 내용은 형식화된 XML과 형식화되지 않은 XML을 참조하십시오.
XML 문서는 UTF-8, UTF-16, windows-1252 등과 같은 다른 인코딩 방식으로 인코딩할 수 있습니다. 다음은 문자열 및 이진 원본 유형이 XML 문서 인코딩과 상호 작용하는 방법 및 파서의 동작 방식에 대한 규칙을 대략적으로 설명한 것입니다.
nvarchar에서는 UTF-16 또는 UCS-2와 같은 2바이트 유니코드 인코딩을 가정하므로 XML 파서는 문자열 값을 2바이트 유니코드로 인코딩된 XML 문서 또는 조각으로 취급합니다. 즉, XML 문서는 원본 데이터 형식과 호환되어야 할 뿐 아니라 2바이트 유니코드 인코딩으로 인코딩해야 합니다. UTF-16으로 인코딩된 XML 문서는 UTF-16 BOM(바이트 순서 표시)을 포함할 수 있지만 원본 유형의 컨텍스트에 2바이트 유니코드로 인코딩된 문서만 될 수 있다고 명시되어 있으므로 이 BOM을 반드시 포함할 필요는 없습니다.
varchar 문자열의 내용은 XML 파서에 의해 1바이트로 인코딩된 XML 문서/조각으로 취급됩니다. varchar 원본 문자열에는 연관된 코드 페이지가 있으므로 파서는 XML 자체에 명시적 인코딩이 지정되지 않은 경우 인코딩에 대해 해당 코드 페이지를 사용하고, XML 인스턴스에 BOM 또는 인코딩 선언이 있는 경우 BOM 또는 선언이 코드 페이지와 일치해야 합니다. 그렇지 않은 경우 파서는 오류를 보고합니다.
varbinary의 내용은 XML 파서로 직접 전달되는 코드 포인트 스트림으로 취급됩니다. 따라서 XML 문서 또는 조각은 BOM 또는 기타 인코딩 정보를 인라인으로 제공해야 합니다. 파서는 이 스트림을 통해서만 인코딩을 파악합니다. 즉, UTF-16으로 인코딩된 XML은 UTF-16 BOM을 제공해야 하고 BOM 및 선언 인코딩이 없는 인스턴스는 UTF-8로 해석됩니다.
XML 문서의 인코딩을 미리 알지 못하고 데이터를 XML로 형변환하기 전에 데이터가 XML 데이터 대신 문자열이나 이진 데이터로 전달된 경우 해당 데이터를 varbinary로 취급하는 것이 좋습니다. 예를 들어 OpenRowset()을 사용하여 XML 파일에서 데이터를 읽을 때 다음과 같이 해당 데이터가 varbinary(max) 값으로 읽히도록 지정해야 합니다.
select CAST(x as XML)
from OpenRowset(BULK 'filename.xml', SINGLE_BLOB) R(x)
SQL Server는 내부적으로 UTF-16 인코딩을 사용하는 효율적인 이진 표현으로 XML을 나타냅니다. 사용자가 제공한 인코딩은 유지되지 않지만 구문 분석 프로세스 중에 고려됩니다.
CLR 사용자 정의 유형 형변환
CLR 사용자 정의 유형에 XML 직렬화가 지정되면 명시적으로 해당 유형의 인스턴스를 XML 데이터 형식으로 형변환할 수 있습니다. CLR 사용자 정의 유형의 XML 직렬화에 대한 자세한 내용은 XML Serialization from CLR Database Objects를 참조하십시오.
형식화된 XML에서 공백 처리
SQL Server에서 요소 내용 내에 있는 공백은 시작 및 끝 태그처럼 마크업으로 구분된 공백 전용 문자 데이터 시퀀스 내에 있을 경우와 엔터티화되지 않은 경우 불필요한 것으로 간주됩니다. CDATA 섹션은 무시됩니다. 이러한 공백을 처리하는 방식은 W3C(World Wide Web Consortium)에서 게시한 XML 1.0 사양에 설명된 방법과 다릅니다. 그 이유는 XML 1.0에 설명된 대로 SQL Server의 XML 파서가 제한된 개수의 DTD 하위 집합만 인식하기 때문입니다. SQL Server 2005 에서 지원하는 제한된 DTD 하위 집합에 대한 자세한 내용은 CAST 및 CONVERT(Transact-SQL)를 참조하십시오.
기본적으로 XML 파서는 문자열 데이터를 XML로 변환할 때 다음 중 하나에 해당하면 불필요한 공백을 무시합니다.
The xml:space
특성이 한 요소 또는 한 요소의 상위 항목 요소에 정의되어 있지 않습니다.- 한 요소 또는 한 요소의 상위 항목 요소 중 하나에 적용된
xml:space
특성에 기본값이 있습니다.
예를 들면 다음과 같습니다.
declare @x xml
set @x = '<root> <child/> </root>'
select @x
다음은 결과입니다.
<root><child/></root>
그러나 이 동작을 변경할 수 있습니다. xml DT 인스턴스에 대한 공백을 유지하려면 CONVERT 연산자 및 값 1로 설정된 해당 옵션 style 매개 변수를 사용합니다. 예를 들면 다음과 같습니다.
SELECT CONVERT(xml, N'<root> <child/> </root>', 1)
style 매개 변수가 사용되지 않거나 해당 값이 0으로 설정된 경우 xml DT 인스턴스의 변환에 대해 불필요한 공백이 유지되지 않습니다. 문자열 데이터를 xml DT 인스턴스로 변환할 때 CONVERT 연산자 및 해당 style 매개 변수를 사용하는 방법은 CAST 및 CONVERT(Transact-SQL)를 참조하십시오.
예 1: 문자열 값을 형식화된 xml로 형변환하여 열에 할당
다음 예에서는 XML 조각이 포함된 문자열 변수를 xml 데이터 유형으로 형변환한 다음 xml 유형 열에 저장합니다.
CREATE TABLE T(c1 int primary key, c2 xml)
go
DECLARE @s varchar(100)
SET @s = '<Cust><Fname>Andrew</Fname><Lname>Fuller</Lname></Cust>'
다음 삽입 작업은 문자열에서 xml 유형으로 암시적으로 변환합니다.
INSERT INTO T VALUES (3, @s)
cast()를 사용하여 문자열을 xml 유형으로 명시적으로 형변환할 수 있습니다.
INSERT INTO T VALUES (3, cast (@s as xml))
또는 다음과 같이 convert()를 사용할 수 있습니다.
INSERT INTO T VALUES (3, convert (xml, @s))
예 2: 문자열을 형식화된 xml로 변환하여 변수에 할당
다음 예에서는 문자열이 xml 유형으로 변환되고 xml 데이터 유형의 변수에 할당됩니다.
declare @x xml
declare @s varchar(100)
SET @s = '<Cust><Fname>Andrew</Fname><Lname>Fuller</Lname></Cust>'
set @x =convert (xml, @s)
select @x
SELECT 문에 FOR XML 절 사용
SELECT 문에 FOR XML 절을 사용하여 결과를 XML로 반환할 수 있습니다. 예를 들면 다음과 같습니다.
DECLARE @xmlDoc xml
SET @xmlDoc = (SELECT Column1, Column2
FROM Table1, Table2
WHERE Some condition
FOR XML AUTO)
...
SELECT 문이 xml 데이터 유형 변수에 할당하는 동안 구문 분석되는 텍스트 XML 조각을 반환합니다.
또한 FOR XML 절에 FOR XML 쿼리 결과를 xml 유형으로 직접 반환하는 TYPE 지시어를 사용할 수 있습니다.
Declare @xmlDoc xml
SET @xmlDoc = (SELECT ProductModelID, Name
FROM Production.ProductModel
WHERE ProductModelID=19
FOR XML AUTO, TYPE)
SELECT @xmlDoc
다음은 결과입니다.
<Production.ProductModel ProductModelID="19" Name="Mountain-100" />...
다음 예에서는 FOR XML 쿼리의 형식화된 xml 결과가 xml 유형 열에 삽입됩니다.
CREATE TABLE T1 (c1 int, c2 xml)
go
INSERT T1(c1, c2)
SELECT 1, (SELECT ProductModelID, Name
FROM Production.ProductModel
WHERE ProductModelID=19
FOR XML AUTO, TYPE)
SELECT * FROM T1
go
FOR XML에 대한 자세한 내용은 FOR XML을 사용하는 XML 생성을 참조하십시오.
상수 할당 사용
문자열 상수는 xml 데이터 유형의 인스턴스가 예상되는 위치에 사용할 수 있습니다. 이것은 문자열을 XML로 암시적 형변환하는 것과 같습니다. 예를 들면 다음과 같습니다.
DECLARE @xmlDoc xml
SET @xmlDoc = '<Cust><Fname>Andrew</Fname><Lname>Fuller</Lname></Cust>'
-- Or
SET @xmlDoc = N'<?xml version="1.0" encoding="ucs-2"?><doc/>'
위의 예에서는 문자열을 xml 데이터 유형으로 암시적으로 변환하여 xml 유형 변수에 할당합니다.
다음 예에서는 상수 문자열을 xml 유형 열에 삽입합니다.
CREATE TABLE T(c1 int primary key, c2 xml)
INSERT INTO T VALUES (3, '<Cust><Fname>Andrew</Fname><Lname>Fuller</Lname></Cust>')
[!참고] 형식화된 XML의 경우 지정된 스키마에 대해 XML의 유효성이 검사됩니다. 자세한 내용은 형식화된 XML과 형식화되지 않은 XML을 참조하십시오.
대량 로드 사용
향상된 OPENROWSET(Transact-SQL) 기능을 사용하면 데이터베이스의 XML 문서를 대량 로드할 수 있습니다. XML 인스턴스를 파일에서 데이터베이스의 xml 유형 열로 대량 로드할 수 있습니다. 예제 작업은 XML 문서 대량 가져오기 및 내보내기 예를 참조하십시오.
XML 인스턴스 직렬화
CAST 또는 CONVERT 문을 사용하여 xml 유형의 문서 및 조각을 [n][var]char 또는 varbinary 데이터 유형으로 직렬화할 수 있습니다.
XML 데이터 유형 인스턴스를 유니코드 문자열 형식 또는 varbinary로 형변환하면 기본적으로 UTF-16 형식으로 직렬화됩니다. 비유니코드 문자열 유형으로 형변환하는 경우 대상 문자열 유형의 코드 페이지로 직렬화됩니다.
참고 항목
개념
형식화된 XML과 형식화되지 않은 XML
XML DML(XML 데이터 수정 언어)
xml 데이터 형식
예제 XML 응용 프로그램