七月网

gbk内码(GBK内码和GBK码的区别)

七月网3890

各位老铁们,大家好,今天由我来为大家分享gbk内码,以及GBK内码和GBK码的区别的相关问题知识,希望对大家有所帮助。如果可以帮助到大家,还望关注收藏下本站,您的支持是我们最大的动力,谢谢大家了哈,下面我们开始吧!

gbk内码(GBK内码和GBK码的区别)

gbk编码是什么

GBK编码,是对GB2312编码的扩展,因此完全兼容GB2312-80标准。GBK编码依然采用双字节编码方案,其编码范围:8140-FEFE(高字节从81到FE,低字节从40到FE),剔除xx7F码位,共23940个码位。

GBK编码共收录汉字和图形符号21886个,其中汉字(包括部首和构件)21003个,图形符号883个。GBK编码支持国际标准ISO/IEC10646-1和国家标准GB13000-1中的全部中日韩汉字,并包含了BIG5编码中的所有汉字。GBK编码方案于1995年12月15日正式发布,这一版的GBK规范为1.0版。

扩展资料:

全部编码分为三大部分:

1、汉字区。

包括:

a.GB2312汉字区。即GBK/2:B0A1-F7FE。收录GB2312汉字6763个,按原顺序排列。

b.GB13000.1扩充汉字区。包括:

(1)、GBK/3:8140-A0FE。收录GB13000.1中的CJK汉字6080个。

(2)、GBK/4:AA40-FEA0。收录CJK汉字和增补的汉字8160个。CJK汉字在前,按UCS代码大小排列;增补的汉字(包括部首和构件)在后,按《康熙字典》的页码/字位排列。

(3)、汉字“〇”安排在图形符号区GBK/5:A996。

2、图形符号区。

包括:

a.GB2312非汉字符号区。即GBK/1:A1A1-A9FE。其中除GB2312的符号外,还有10个小写罗马数字和GB12345增补的符号。计符号717个。

b.GB13000.1扩充非汉字区。即GBK/5:A840-A9A0。BIG-5非汉字符号、结构符和“〇”排列在此区。计符号166个。

3、用户自定义区:

分为(1)(2)(3)三个小区。

(1)、AAA1-AFFE,码位564个。

(2)、F8A1-FEFE,码位658个。

(3)、A140-A7A0,码位672个。

第(3)区尽管对用户开放,但限制使用,因为不排除未来在此区域增补新字符的可能性。

gbk内码输入法字母代表什么

GBK内码带有ABCDEF六个字母,分别代表六个数字10、11、12、13、14、15。既A—10、B—11、C—12、D—13、E—14、F—15。

GBK内码填涂实例:

0不涂、1涂【1】、2涂【2】、3涂【1】【2】、4涂【4】、5涂【1】【4】、6涂【2】【4】、7涂【1】【2】【4】、8涂【8】、9涂【1】【8】、A填涂【2】【8】、B填涂【1】【2】【8】、C填涂【4】【8】、D填涂【1】【4】【8】、E填涂【2】【4】【8】、F填涂【1】【2】【4】【8】。

GBK内码和GBK码的区别

GBK是又一个汉字编码标准,全称《汉字内码扩展规范》(GBK),英文名称ChineseInternalCodeSpecification,中华人民共和国全国信息技术标准化技术委员会1995年12月1日制订,国家技术监督局标准化司、电子工业部科技与质量监督司1995年12月15日联合以技监标函[1995]229号文件的形式,将它确定为技术规范指导性文件,发布和实施。这一版的GBK规范为1.0版。GB即“国标”,K是“扩展”的汉语拼音第一个字母。

GBK向下与GB2312编码兼容,向上支持ISO10646.1国际标准,是前者向后者过渡过程中的一个承上启下的标准。

ISO10646是国际标准化组织ISO公布的一个编码标准,即UniversalMultilpe-OctetCodedCharacterSet(简称UCS),大陆译为《通用多八位编码字符集》,台湾译为《广用多八位元编码字元集》,它与Unicode组织的Unicode编码完全兼容。ISO10646.1是该标准的第一部分《体系结构与基本多文种平面》。我国1993年以GB13000.1国家标准的形式予以认可(即GB13000.1等同于ISO10646.1)。

ISO10646是一个包括世界上各种语言的书面形式以及附加符号的编码体系。其中的汉字部分称为“CJK统一汉字”(C指中国,J指日本,K指朝鲜)。而其中的中国部分,包括了源自中国大陆的GB2312、GB12345、《现代汉语通用字表》等法定标准的汉字和符号,以及源自台湾的CNS11643标准中第1、2字面(基本等同于BIG-5编码)、第14字面的汉字和符号。

一、字汇

GBK规范收录了ISO10646.1中的全部CJK汉字和符号,并有所补充。具体包括:

1.GB2312中的全部汉字、非汉字符号。

2.GB13000.1中的其他CJK汉字。以上合计20902个GB化汉字。

3.《简化字总表》中未收入GB13000.1的52个汉字。

4.《康熙字典》及《辞海》中未收入GB13000.1的28个部首及重要构件。

5.13个汉字结构符。

6.BIG-5中未被GB2312收入、但存在于GB13000.1中的139个图形符号。

7.GB12345增补的6个拼音符号。

8.汉字“○”。

9.GB12345增补的19个竖排标点符号(GB12345较GB2312增补竖排标点符号29个,其中10个未被GB13000.1收入,故GBK亦不收)。

10.从GB13000.1的CJK兼容区挑选出的21个汉字。

11.GB13000.1收入的31个IBMOS/2专用符号。

二、码位分配及顺序

GBK亦采用双字节表示,总体编码范围为8140-FEFE,首字节在81-FE之间,尾字节在40-FE之间,剔除xx7F一条线。总计23940个码位,共收入21886个汉字和图形符号,其中汉字(包括部首和构件)21003个,图形符号883个。

全部编码分为三大部分:

1.汉字区。包括:

a.GB2312汉字区。即GBK/2:B0A1-F7FE。收录GB2312汉字6763个,按原顺序排列。

b.GB13000.1扩充汉字区。包括:

(1)GBK/3:8140-A0FE。收录GB13000.1中的CJK汉字6080个。

(2)GBK/4:AA40-FEA0。收录CJK汉字和增补的汉字8160个。CJK汉字在前,按UCS代码大小排列;增补的汉字(包括部首和构件)在后,按《康熙字典》的页码/字位排列。

2.图形符号区。包括:

a.GB2312非汉字符号区。即GBK/1:A1A1-A9FE。其中除GB2312的符号外,还有10个小写罗马数字和GB12345增补的符号。计符号717个。

b.GB13000.1扩充非汉字区。即GBK/5:A840-A9A0。BIG-5非汉字符号、结构符和“○”排列在此区。计符号166个。

3.用户自定义区:分为(1)(2)(3)三个小区。

(1)AAA1-AFFE,码位564个。

(2)F8A1-FEFE,码位658个。

(3)A140-A7A0,码位672个。

第(3)区尽管对用户开放,但限制使用,因为不排除未来在此区域增补新字符的可能性。

三、字形

GBK对字形作了如下的规定:

1.原则上与GB13000.1G列(即源自中国大陆法定标准的汉字)下的字形/笔形保持一致。

2.在CJK汉字认同规则的总框架内,对所有的GBK编码汉字实施“无重码正形”(“GB化”);即在不造成重码的前提下,尽量采用中国新字形。

3.对于超出CJK汉字认同规则的、或认同规则尚未明确规定的汉字,在GBK码位上暂安放旧字形。这样,在许多情况下GBK收入了同一汉字的新旧两种字形。

4.非汉字符号的字形,凡GB2312已经包括的,与GB2312保持一致;超出GB2312的部分,与GB13000.1保持一致。

5.带声调的拼音字母取半角形式。

关于gbk内码的内容到此结束,希望对大家有所帮助。