한글 그리고 유니코드
키보드를 이용해 한글을 칠 때 마다 느끼는 것이지만 한글. 정말 과학적이다. 한글이 있어 정말 다행이라는 생각을 갖게 해준다. 한자를 그대로 사용했으면 어떻게 이런 속도로 타이핑을 할 수 있겠는가?

그런데 한 가지 아쉬운점. 외국 소프트웨어를 사용할 때 마다 이 한글 때문에 골치가 아프다는 것이다. Euc-kr, CP-949, UTF-8 등등 한글을 사용하는 방법도 가지각색. 사람들이 가장 많이 사용하는 두가지 문자셋은 완성형과 유니코드 지만 이것을 표현하는 인코딩법도 가지각색이다. Euc-kr 은 완성형, CP-949 는 확장 완성형, UTF-8은 유니코드 여기에다 예전에 있던 조합형(조합형도 한가지도 아니고 여러가지 있고). 첫가끝 부호계 등등등. 정말 한글사용하기 복잡하다.

유니코드가 좋다는 것은 알지만 UTF-8에사 한글 하나 표현하는데 3byte 가 필요하니 웬지 손해 보는 느낌이다. 가장 완벽한것은 첫가끝 부호계를 유니코드로 표현하는 것이지만, 너무 많은 바이트가 필요하다. (자음 + 모음일때 적어도 4byte 가 필요하다. 자음+모음+자음 은 적어도 6byte 가 필요하다. ) Euc-kr 은 그냥 완성형이라 현대글자도 다 표현하기 부족하고 CP-949 는 글자 순서가 뒤죽박죽이고. ..

어째든 그나마 가장 좋은 방법은 유니코드로 통일되는 방법같은데... 외국 사람들은 별 신경을 안쓰는 것 같다. (사실 그 쪽은 급할 일 없겠지. )

지금 cp949 와 유니코드 사이에서 헤메고 있다. 프로그래밍을 파이썬으로 짜고, DB는 SQLite 이용하니까 2개 프로그램 사이에서 인코딩이 어떻게 되는지 당체 알 수 있나. 어디가 문제인가?? 골치아프다.
by 한밀 | 2006/11/11 00:08 | 이생각 저생각 | 트랙백
<< 이전 다음 >>