Chapter 2


An Introduction to Unicode

첫 번째 챕터에서, 명령어입력방식의 프로그래밍에서는 볼 수 없고, 윈도우 프로그래밍에서 볼 수 있는 C 언어의 용법을 설명할 거라고 말했었다. wide-character(한글이나 한문, 일본어등) 세트 와 유니코드(Unicode) 가 바로 그러한 측면의 주제가 되겠다.

간단하게 말해서, 유니코드는 ASCII 문자 코드의 확장판이다. ASCII 가 엄격하게는 7비트 문자를 사용하거나, 또는 모든 컴퓨터에 공통으로 쓰기 위해 8비트 문자를 사용하는 것과 비교해서, 유니코드는 full 16비트 문자를 쓴다. 이러한 방식은 모든 문자(표의문자나 세계의 모든 나라의 글자)를 나타낼 수 있게 해준다. 유니코드는 ASCII 의 대안이며, 운좋게도 바톤 터치를 매우 잘하고 있다. ASCII 가 컴퓨팅에서 가장 지배적인 체계라는 걸 생각해보면 매우 고무적인 일이다.

유니코드는 컴퓨터 산업의 모든 부분, 즉 운영체제와 프로그래밍 언어에 파고들 것이다. 우리는 그 과도기에 서있다. 윈도우 NT는 유니코드를 지원한다.(불행하게도 윈도우 98은 유니코드의 작은 부분만 포함한다.) ANSI C 언어는 내가 아래에서 설명할 wide character를 지원함으로써 유니코드를 지원한다.

물론, 우리 프로그래머들은 여러 가지 까다로운 작업에 직면하게 될 것이다. 이 챕터에서 유니코드에 대해 논의함으로써 좀 더 자세하게 알아볼 것이다.