Integration Services에 대한 국가별 고려 사항
Microsoft SQL Server Integration Services에서는 다국어 데이터의 구문 분석, 처리 및 모든 Windows 로캘을 지원하며 문자열을 정렬하고 비교하는 특수한 비교 옵션을 제공합니다.
텍스트 마이닝 및 유사 항목 일치의 Integration Services 변환은 영어 이외의 언어에서는 제대로 작동하지 않을 수 있습니다. 그러나 텍스트 마이닝 및 유사 항목 일치 변환은 언어에 따라 영어 이외의 여러 언어에서 사용할 때 유용한 결과를 제공할 수 있습니다.
로캘 구분하지 않는 구문 분석
Integration Services에서는 특정 형식의 데이터에 사용할 수 있는 로캘을 구분하지 않는 구문 분석 루틴이 지원됩니다. 통틀어 빠른 구문 분석이라 불리는 이러한 구문 분석 루틴은 가장 일반적으로 사용되는 데이터 형식만 지원하며 로캘 관련 구문 분석은 수행하지 않고 통화 데이터 내의 특수 문자도 인식하지 않으며 16진 표기 정수 또는 공학 표기 정수를 변환할 수 없습니다. 빠른 구문 분석은 로캘 종속성이 없는 Integration Services 패키지의 성능을 크게 향상시킬 수 있습니다. 자세한 내용은 데이터 구문 분석을 참조하십시오.
로캘 설정
Integration Services는 패키지 개체, 컨테이너, 태스크 및 데이터 흐름 구성 요소 수준에서 로캘을 지원합니다. 이벤트 처리기 수준의 로캘을 설정할 수도 있습니다.
한 개의 패키지가 여러 다른 로캘을 사용할 수 있습니다. 예를 들어 패키지가 영어(미국) 로캘을 사용하는 동안 패키지 내의 한 태스크는 독일어(독일) 로캘을 사용하고 다른 태스크는 일본어(일본) 로캘을 사용할 수 있습니다.
Integration Services 패키지든 모든 Windows 로캘을 사용할 수 있습니다. 패키지를 구성할 때 로캘을 설정하면 패키지에서 구성을 사용하여 로캘 속성을 업데이트하지 않는 한 다른 지역 및 언어 옵션을 사용하는 컴퓨터로 배포하더라도 배포 이전과 동일한 패키지 동작을 보장할 수 있습니다.
그러나 다른 서버로 배포할 때 패키지가 다른 로캘을 사용해야 하는 경우 패키지를 실행할 때 사용할 업데이트된 로캘을 제공하는 구성을 만들 수 있습니다. 자세한 내용은 패키지 속성 설정 및 SSIS 패키지 구성.을 참조하십시오.
비교 옵션
로캘은 데이터 흐름 내의 문자열 데이터 비교를 위한 기본 규칙을 제공합니다. 예를 들어 로캘은 영문자의 각 문자에 대한 정렬 위치를 지정합니다. 그러나 수행하려는 비교에 이 규칙만으로는 충분하지 않을 수 있으므로 Integration Services에서는 로캘의 비교 규칙 이외의 고급 비교 옵션 집합을 지원합니다. 예를 들어 비공백 문자를 무시하도록 선택하면 비교 작업에서 "a"와 "á" 문자가 동일하게 인식됩니다. 자세한 내용은 문자열 데이터 비교를 참조하십시오.
텍스트 마이닝
텍스트 마이닝, 용어 추출 및 용어 조회 변환에서는 자체 사전을 사용합니다. 사전은 영어로만 사용할 수 있으며 영어 이외의 언어를 사용한 텍스트 마이닝 결과는 제한적입니다. Microsoft는 영어에서만 이러한 사전을 사용할 수 있도록 지원합니다.
그러나 영어가 아닌 언어에서도 영어와의 언어적 유사도에 따라서는 용어 추출 변환을 통한 용어 추출, 용어 조회 변환을 통한 용어 조회 및 용어 사용 빈도의 계산이 가능할 수 있습니다. 언어 간 유사성이 클수록 용어 마이닝의 결과도 좋아집니다. 예를 들어 스웨덴어는 영어와 유사한 단어 및 문장 구분 기호를 사용하므로 스웨덴어 문자열에 대한 텍스트 마이닝 용어 추출 변환은 효과적으로 이루어질 수 있습니다. 반면에 일본어에 대한 용어 추출 변환 결과는 그리 만족스럽지 않을 것입니다. 자세한 내용은 용어 추출 변환 및 용어 조회 변환을 참조하십시오.
유사 항목 일치
유사 항목 그룹화 및 유사 항목 조회의 두 변환은 데이터 집합 내에서 비슷한 레코드를 그룹화하거나 참조 테이블 내에서 조회를 수행하기 위해 유사 항목 일치를 사용합니다. 두 가지 변환은 모두 텍스트 데이터가 공백 또는 구분 기호로 구분된 다수의 긴 단어를 포함하는 경우 효과적으로 일치를 수행할 수 있습니다. 소수의 문자로 단어를 구성하고 공백으로 단어를 구분하지 않는 중국어와 같은 표의 문자 언어에서는 변환에 오류를 허용하지 않습니다. 일반적으로 변환에서는 표의 문자 언어의 철자 오류, 여분의 단어 및 누락된 단어를 잘 발견하지 못합니다. 자세한 내용은 유사 항목 그룹화 변환 및 유사 항목 조회 변환을 참조하십시오.
|