Native/C
Unicode 언어영역별 정의 헤더 (unicode)
aucd29
2013. 10. 2. 18:54
Unicode 언어영역별 정의 헤더
어절 분리기 및 한자-한글 변환시에 사용되는 언어 영역별 정의 헤더입니다. 유니코드 3.0에 기반하여 41개의 언어영역 및 상징문자, 공백문자, 특수문자, 제어문자 영역 등으로 구분하였습니다. 헤더에는 0 ~ 65,535, 즉 U+0000 ~ U+FFFF까지의 모든 코드에 대해 언어를 지정하였습니다. [Source]
번호 | 표기 | 언어 | 설명 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 |
T_ARA T_ARM T_BLN T_BNG T_CAN T_CHE T_CJK T_COP T_CTK T_CYR T_DEV T_DIG T_ETH T_GEO T_GRE T_GUJ T_GUR T_HAN T_HEB T_JPN T_KAN T_KHM T_LAO T_LAT T_MAL T_MON T_MYA T_OGH T_ORI T_RES T_RUN T_SIN T_SPC T_SYM T_SYR T_TAM T_TEL T_THI T_THN T_TIB T_YIS |
Arabic Armenian Blanks & Spaces Bengali Canadian Syllabics Cherokee Chinese Coptic Control Characters Cyrillic Devanagari Digits Ethiopic Georgian Greek Gujarati Gurmukhi Hangul Hebrew Japanese Kannada Khmer Lao Latin Malayalam Mongolian Myanmar Ogham Oriya Reserved Runic Sinhala Special Characters Symbols Syriac Tamil Telugu Thaana Thai Tibetan Yi Syllables |
아랍어 아르메니아어 공백 및 개행 문자 벵골어(인도) 캐나다(잘 모르겠습니다) 체로키 인디언? 한중일 공통한자 콥틱어 제어 문자 시프러스어? 데바나가리(인도어?) 숫자 이디오피아어 조지아어 그리스어 구자라티어(인도) 구르무키(?) 한글 히브리어 일본어 칸나다? 크메르어 라오스어 라틴어 말레이어 몽고어 미얀마어 오감어 오리야어 예비영역 루니어 신할라 특수문자 심볼 시리아어 타밀어 텔루구 타나 태국어 티벳어 이 한자 [출처] Unicode 언어영역별 정의 헤더|작성자 형기 |