马上加入TC
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
ANSI:汉字区的内码范围高字节从B0-F7,低字节从A1-FE
Unicode:汉字的Unicode编码范围为4E00-9FA5 、 F900-FA2D,如果不在这个范围内就不是汉字了.
GBK 亦采用双字节表示,总体编码范围为 8140-FEFE,首字节在 81-FE 之间,尾字节在 40-FE 之间,剔除 xx7F一条线。总计 23940 个码位,共收入 21886 个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号 883个。
Unicode 汉字内码的汉字区为4E00-9FA5, 共有20902个汉字
BIG5 是台湾计算机界实行的汉字编码字符集。它包含了 420 个图形符号和 13070 个汉字(不包含简化汉字)。编码范围是0x8140-0xFE7E、0x81A1-0xFEFE,其中 0xA140-0xA17E、0xA1A1-0xA1FE是图形符号区,0xA440-0xF97E、0xA4A1-0xF9FE 是汉字区。
在TC里,我们只要考虑汉字的Unicode码就可以了!以下再附上各国文字编码范围查询链接,希望对大家有用。 各国文字Unicode编码范围:http://www.doc88.com/p-801578373970.html
对编码使用不熟悉的可以观看下面的视频:
[进阶实例篇] 第一课 百变字符串
http://bbs.tyuyan.com/forum.php?mod=viewthread&tid=37033&fromuid=16
|