칵이닷! :: '문자열' 태그의 글 목록

Category

All (84)

Life (42)

철도 (0)

My Devices (19)

Language (8)

스크랩 (5)

책 (2)

Blog log (5)

Recent Article

Recent comment

Recent Trackback

My Link

Notice

Tag Cloud

Calender

Archive

sidebar_open

sidebar_close

'문자열'에 해당되는 글 2건

2007.07.23 한글 유니코드 값 구하는 공식

한글 유니코드 값 구하는 공식
Language/MFC
2007. 7. 23. 12:19
Posted by 칵군

한글 유니코드 값 구하는 공식

edited : 2007/08/02 10:05 add Unicode Table
출처 : 위키백과

현대 한글 유니코드 값 구하는 공식은 다음과 같다.

[{(초성)×588}+{(중성)×28}+(종성)]+44032

예를 들어, ‘뷁’이라는 글자의 유니코드 값을 구한다면

초성은 ㅂ이므로 7,
중성은 ㅞ이므로 15,
종성은 ㄺ이므로 9가 된다.

이 값을 위 공식에 대입하면 {(7×588)+(15×28)+9}+44032가 된다. 이를 계산하면 48577이 나온다. 곧, ‘뷁’의 10진수 유니코드 값은 48577이다.

이 코드 앞에 &#을 붙이면 된다...

따라서 뷁을 쓰면 ‘뷁’을 얻을 수 있다.

원리

이 공식이 성립할 수 있는 까닭은 유니코드에 현대 한글 영역이 가나다순으로 11172글자가 쭉 배열돼 있기 때문이다.

끝에 44032를 더하는 까닭은 첫 번째 현대 한글 ‘가’의 코드가 44032(16진수 U+AC00)이기 때문이다.
초성 값에 588을 곱하는 까닭은 초성이 588(=21×28)글자마다 바뀌기 때문이다. 이때 21은 중성 개수이고 28은 종성 개수이다.
중성 값에 28을 곱하는 까닭은 중성이 28글자마다 바뀌기 때문이다. 이때 28은 종성 개수이다.

초성

ㄱ 0
ㄲ 1
ㄴ 2
ㄷ 3

ㄸ 4
ㄹ 5
ㅁ 6
ㅂ 7

ㅃ 8
ㅅ 9
ㅆ 10
ㅇ 11

ㅈ 12
ㅉ 13
ㅊ 14
ㅋ 15

ㅌ 16
ㅍ 17
ㅎ 18

중성

ㅏ 0
ㅐ 1
ㅑ 2
ㅒ 3
ㅓ 4
ㅔ 5
ㅕ 6

ㅖ 7
ㅗ 8
ㅘ 9
ㅙ 10
ㅚ 11
ㅛ 12
ㅜ 13

ㅝ 14
ㅞ 15
ㅟ 16
ㅠ 17
ㅡ 18
ㅢ 19
ㅣ 20

종성

0
ㄱ 1
ㄲ 2
ㄳ 3
ㄴ 4
ㄵ 5
ㄶ 6

ㄷ 7
ㄹ 8
ㄺ 9
ㄻ 10
ㄼ 11
ㄽ 12
ㄾ 13

ㄿ 14
ㅀ 15
ㅁ 16
ㅂ 17
ㅄ 18
ㅅ 19
ㅆ 20

ㅇ 21
ㅈ 22
ㅊ 23
ㅋ 24
ㅌ 25
ㅍ 26
ㅎ 27

직접 테이블을 보고 싶다면...

prev

1 2

next

티스토리툴바