.NET Framework의 유니코드
업데이트: 2007년 11월
.NET Framework에서는 유니코드 UTF-16(유니코드 변환 형식, 16비트 인코딩 양식)을 사용하여 문자를 표시하며 내부적으로 UTF-8을 사용하는 경우도 있습니다.
유니코드 표준은 문자 및 텍스트의 범용 문자 인코딩 체계로, 전세계의 작성용 언어에 사용되는 모든 문자에 코드 포인트라고 하는 고유한 숫자 값과 이름을 할당합니다. 예를 들어, 문자 "A"는 코드 포인트 "U+0041"과 이름 "LATIN CAPITAL LETTER A"로 표시됩니다. 65,000자가 넘는 문자에 대해 이러한 숫자 값을 지정할 수 있으며 백만자 이상까지도 지원할 수 있습니다. 자세한 내용은 Unicode 홈 페이지에서 유니코드 표준을 참조하십시오.
과거에는 다른 문화권에 대한 언어 요구 사항이 다양했으므로 응용 프로그램에서 다양한 인코딩을 사용하여 데이터를 내부적으로 표시해야 했습니다. 이와 같은 다양한 인코딩 체계 때문에 개발자들은 유럽 언어에는 싱글바이트 버전, 아시아 언어에는 더블바이트 버전, 중동 언어에는 양방향 버전 등과 같이 운영 체제와 응용 프로그램에 대한 분리된 코드 기준을 만들게 되었습니다. 이러한 분리로 인해 문화권 간 데이터 공유가 어려워지고 다국어 사용자 인터페이스를 지원하는 지역화 대비 응용 프로그램을 개발하는 일이 더욱 어려워졌습니다.
유니코드 데이터 인코딩 체계는 모든 국제 문자를 하나의 인코딩으로 표시할 수 있으므로 지역화 대비 응용 프로그램 개발을 간단하게 만듭니다. 응용 프로그램 개발자는 특정 언어의 문자를 만들기 위해 사용하던 인코딩 체계를 더 이상 추적할 필요가 없으며 데이터도 손상 없이 국제적으로 시스템 간에 공유할 수 있습니다.