'문자열'에 해당되는 글 2

  1. 2007.07.23 한글 유니코드 값 구하는 공식

한글 유니코드 값 구하는 공식

edited : 2007/08/02 10:05 add Unicode Table
출처 : 위키백과

현대 한글 유니코드 값 구하는 공식은 다음과 같다.

[{(초성)×588}+{(중성)×28}+(종성)]+44032

예를 들어, ‘뷁’이라는 글자의 유니코드 값을 구한다면

  • 초성은 ㅂ이므로 7,
  • 중성은 ㅞ이므로 15,
  • 종성은 ㄺ이므로 9가 된다.

이 값을 위 공식에 대입하면 {(7×588)+(15×28)+9}+44032가 된다. 이를 계산하면 48577이 나온다. 곧, ‘뷁’의 10진수 유니코드 값은 48577이다.

이 코드 앞에 &#을 붙이면 된다...

따라서 뷁을 쓰면 ‘뷁’을 얻을 수 있다.

원리

이 공식이 성립할 수 있는 까닭은 유니코드에 현대 한글 영역이 가나다순으로 11172글자가 쭉 배열돼 있기 때문이다.

  • 끝에 44032를 더하는 까닭은 첫 번째 현대 한글 ‘가’의 코드가 44032(16진수 U+AC00)이기 때문이다.
  • 초성 값에 588을 곱하는 까닭은 초성이 588(=21×28)글자마다 바뀌기 때문이다. 이때 21은 중성 개수이고 28은 종성 개수이다.
  • 중성 값에 28을 곱하는 까닭은 중성이 28글자마다 바뀌기 때문이다. 이때 28은 종성 개수이다.

초성

  • ㄱ 0
  • ㄲ 1
  • ㄴ 2
  • ㄷ 3
  • ㄸ 4
  • ㄹ 5
  • ㅁ 6
  • ㅂ 7
  • ㅃ 8
  • ㅅ 9
  • ㅆ 10
  • ㅇ 11
  • ㅈ 12
  • ㅉ 13
  • ㅊ 14
  • ㅋ 15
  • ㅌ 16
  • ㅍ 17
  • ㅎ 18

중성
  • ㅏ 0
  • ㅐ 1
  • ㅑ 2
  • ㅒ 3
  • ㅓ 4
  • ㅔ 5
  • ㅕ 6
  • ㅖ 7
  • ㅗ 8
  • ㅘ 9
  • ㅙ 10
  • ㅚ 11
  • ㅛ 12
  • ㅜ 13
  • ㅝ 14
  • ㅞ 15
  • ㅟ 16
  • ㅠ 17
  • ㅡ 18
  • ㅢ 19
  • ㅣ 20

종성
  • 0
  • ㄱ 1
  • ㄲ 2
  • ㄳ 3
  • ㄴ 4
  • ㄵ 5
  • ㄶ 6
  • ㄷ 7
  • ㄹ 8
  • ㄺ 9
  • ㄻ 10
  • ㄼ 11
  • ㄽ 12
  • ㄾ 13
  • ㄿ 14
  • ㅀ 15
  • ㅁ 16
  • ㅂ 17
  • ㅄ 18
  • ㅅ 19
  • ㅆ 20
  • ㅇ 21
  • ㅈ 22
  • ㅊ 23
  • ㅋ 24
  • ㅌ 25
  • ㅍ 26
  • ㅎ 27
직접 테이블을 보고 싶다면...

more..

신고
Trackback 1 Comment 0

티스토리 툴바