如何判断一个十六进制是汉字的国标码
问题描述:
如何判断一个十六进制是汉字的国标码
答
这里面涉及编码范围问题,Unicode,big5,gbk国标码都是两个字节表示一个汉字,而utf8是三个字节表示一个汉字.
而且这几种编码中有大量重叠,很难直接判断一个字是哪一种编码,
例如下面:汉字编码范围
名称 第一字节 第二字节
GB2312 0xB0-0xF7(176-247) 0xA0-0xFE(160-254)
GBK 0x81-0xFE(129-254) 0x40-0xFE(64-254)
Big5 0x81-0xFE(129-255) 0x40-0x7E(64-126)
0xA1-0xFE(161-254)
我曾经做过一个编码识别与转换的软件,
把你的要求再具体一点,
对这方面有一些了解,应该可以帮助你!