郑码(字形编码系统)

郑码又称字根通用码,是我国著名文字学家、享誉海内外的《英华大词典》主编郑易里教授经半个世纪对汉字字形结构的研究,后期和女儿郑珑高级工程师共同创造的重大科技成果。已获中、美、英国专利授权,并通过国家级的鉴定。权威专家们确认郑码是国内最优秀的字形编码系统。郑码具有规范、易学、快速、通用的优点。

简介

《郑码》简称《字根通用码》,是我国著名文字学家、享誉海内外的《英华大词典》主编郑易里教授经半个世纪对汉字字形结构的研究,后期和郑珑高级工程师共同创造的重大科技成果。已获中、美、英国专利授权,并通过国家级的鉴定。权威专家们确认《郑码》是国内最优秀的字形编码系统。《郑码》规范、易学、快速、通用。

用同一编码规则不但可以输入2万汉字,还可以输入68000个和10万个汉字。《郑码》曾荣获北京国际发明金奖和最优秀发明大奖;荣获第22届日内瓦发明金奖。国家主管部门通过评比向国内外用户广泛推荐《郑码》。中国的中文之星等系统平台选用《郑码》,美国Microsoft公司的Windows95/98/NT/2000/XP/Vista中文系统选用《郑码》,美国IBM公司的OS/2和JAVAOS等许多中文产品也都选用《郑码》。

《郑码》以单字输入为基础,词语输入为主导,用2-4个英文字母便能输2字词、多字词和30个字以内的短语;在这种字词交融输入之下,输入一个汉字的平均码长是1.8-1.9键之间。他备有两个词库,分别收录25000和50000条词语。

《郑码》是一种繁体字输入法,也是一种生僻字输入法,当然它也是一种常规输入法。郑码可以打出国标扩充字库(原来叫GBK字库,后来发展为GB18030字库)里的2万多个汉字,极大满足了人们在日常生活、工作中使用汉字的需求。

在常规情况下,《郑码》输入法可以打出GBK字库里的20902个汉字。比普通《五笔字型》能打出的6763个汉字要多打出14139个汉字。正因为这个原因Windows没有预装《五笔》,而是预装了《郑码》。

编码原理

《郑码》编码的基本原理 《标准型》

郑码的帮助文件中这样说:“为了不同用户的需求,《郑码输入法》分为《普及型》和《标准型》两种。《标准型》重码率低,适合高速盲打输入。它不但适用于当前通用字符集的 6763 个汉字的输入,而且用同样的编码规则,Windows 2000 中,还能方便地输入大字符集的 20902 个汉字。《普及型》的编码规则简单易学,但不能用来输入大字符集汉字。《普及型》可以作为《标准型》的学习阶梯,因为二者字根的代码有共性,因此用熟练后能自然过渡到《标准型》。”由于我的机上可以输入大字库的字,所以我讲的是《标准型》。

主要方式

高频字取码方式

这W月Q我M发Z现C了Y对X一A度T所P说S要F成H为U个O没V多R中J用L地B在G世E上I的D是K他N/n

一基根字的取码方式

就是那些只有一个基根的字。它们如果是第一主根,就打出该主根代码,然后在其后加上A即是。举例:言是S上的第一主根,其的代码即是SA。马**X***XA,依此类推。/n它们如果是第二主根或者是副根,直接打出。/n尤*****GR,其****EC,业******KU,广*****TG,氏****RH,欠******RO/n女*****ZM,子*****YA,已*****YYA,申*****KIC,比******RR/n七*****HD,龙*****GM,大******GD。十*****ED,寸*****DS/n但是,由于许多基根不是常用的,当它们的代码与某些词组重码时,系统将默认词组。

你要打出基根时候,有时不得不加上一个或者多个A,这是郑码的帮助文件中未提及的。好在这种情况发生时,你要的基根并不是很需要按+,系统也是要提醒你输入A的。/n

二基根字的取码方式

两个基根的字,如果两个基根的代码都是一个字母,就在它们的后面加上"VV"。其余的就直接取码就是了。/n例子:码=石G+马X********GXVV/n杜=木F+土B=FBVV。上=卜ID+一A=IDA,下=一A+卜ID=AID/n推=扌D+隹NI=DNI拓=扌A+石G=GAVV,雹=雨FV+包RY=FVRY/n取=耳CE+又XS=CEXS么=丿M+厶ZS=MZS要+西FJ+女ZM=FJZM/n

三基根字的取码方式

三基根字的取码方式又分为两种情况。/n

1如果首基根是一个代码,就取次基根的首码[不管它有几个码]和末基根的全码。/n

腾=月Q+UB+马X=QUX,渊=氵V+リND+米UF=VNUF/n

2如果首基根是二个代码。那么次基根和末基根只取首码[不管它们有几个码]。/n

靠=⺧MB+口J+非KC=MBJK,羟=⺶UC+スXS+工BI=UCXB/n

四基根字的取码方式

1如果首码是一个码,就取首码和次基根的首码,加上次末基根和末基根的各一个首码。藏=艹E+戈HM+爿ZI+臣H=EHZH,懿=士B+冖WW[一口丬冫]欠RO+心WZ=BWRW/n

2如果首码是二码,由于首基根的代码不能省,就只能省略次基根的代码。相对于上一种情况,首基根的另外一个位置由次基根让出。也就是说:首基根的代码加上次末基根和末基根的各一个区码。例子:/n戆=立SU+[日十夊工]+贝LO+心WZ=SULW/n

总之首基根是不能省的,是一取一,是二取二。/n

小注意:郑码中"辶","廴"是取码中首要取的,这一点不和五笔一致。但是在有别的偏旁存在的情况下,又要放在后面。比如“进”中“辶”在首选就要取码,而在“莲”中就要在“艹”的后面马上要取,先于“车”。这一点好像恰恰与五笔字型中的取码方式相反。/n

简码的取码方式

一级简码:就是刚才说的26个高频字。/n

二级简码用该字首根和次根各1码组成。举例:把–DY找–DH管–MW。需–FG取–CX/n个别常用词也有二级简码,就是取每字第一个基根的区码。

举例:中国–JJ国家–JW一定–AW我们–MN政府–AT开展–AX/n北京–TS上海–IV天津–AV合作–ON各种–RM采取–PC。/n

二基根字:取第一个基根的区码和第二个基根的区位码,如:处–RID。/n

三基根和多基根字:依次取第一、第二和第三个基根的区码,如:散–EQM。/n

词组输入取四码

1.二字词组2+2/n

例子:我们MVNT中华JVNR(我字是一个高频,故其后加V)/n言语SASB(言在第一个故其后加A)/n大家GDWG词组SYZL腾飞QUYT/n神话WKSM童话SKSM神仙WKNL/n

2.三字词组1+2+1/n

例:大家庭GWGT神经原WZXG/n

3.四字词组/俗语/成语1+1+1+1/n

例:祖国统一WJZA中华民族JNYS无奇不有AGGG/n一丝不苟AZGE无拘无束ADAF风土人情QBOU/n字库里成语不多哩:)/n

4.五字以上1+1+1+1/n

取前面四字首码/n例:中华人民共和国JNOY/n中央电视台JLKW/n

编码规则

第一条:要按照《郑码》的基本字根总表上所列出的基根(包括形近根),把汉字分解成基本字根才能编码。如果没有合适的基根,就要进一步分解成笔画。例如:

补–衤卜恳–艮心滤–氵虍心书–乛丨丶

第二条:汉字分解后,基根和笔画排列的顺序叫做“根序”。根序的确定有三种情况:

l.左右字、上下字以及由单笔画组成的字,根序与规范的书写顺序一致(见上例中的“补、恳、滤、书”四个字的分解)

2.具有相接、交叉和相嵌结构的字,第一笔先写的基根或笔画排列在前。例如:([]方括号内是例字)相接结构的字:夭–丿大[沃笑];

疋–乛止[蛋疏];

交叉结构的字:束–木口[整辣];

夷–大弓[姨];

屯–七凵[纯钝吨];

相嵌结构的字:亘–二曰[桓恒];

佥–人二(横三点)[检验]

渊–氵(撇-竖)米;

肃–肀(撇-竖)八[萧箫]

复合结构的字:决–冫乛大[缺炔](又有相接又有相交);

3.对于包围字和包孕字,要将第一笔先写的基根排在第一位。

因为是以基根为单位排列根序。例如:

困—囗木闻—门耳函—乛氺凵式—弋工

载—车库—广车匦—匚车九赵—走乂

但是,为了检索的快捷和归纳的划一,对于有“辶、廴”的字,确定根序时,要将“辶、廴”排列在第一位。

例如:“达—辶大”、“延—廴丿止”。

总之,给单字或词语编码,就是按照编码规则依次取基根的代码组成字词的编码。根序搞错编码也随之而错。因此,正确认识单字的根序十分重要。

第三条:单字和词语的编码不能超过4个字母,因此要根据单字或词语中基根数的多少决定基根代码的取舍,这种取舍代码的方法叫取码方法(详见以下说明)。

取码方法

术语:“1码根”是指第一主根,因它的代码只用区码1个字母。“2码根”是指第二主根和副根,因为它们的代码要用区位码的2个字母。“取1码”的意思是只取该基根的区码。

一、单字编码的取码原则

1.单字首根(即第一个基根)的代码要按照实际码数取,不能有所省略。就是说,首根是1码根就取1码;首根是2码根就取2码(区码和位码都要取)。

2.为保证单字编码不超过4个字母,首根之后的其余基根代码要根据不同情况决定取舍。一般是先舍位码,只取区码的1码。

例如:樱–木F贝LO贝LO女ZM–FLLZ

醒–酉FD曰K生MC–FDKM

但是,对于四基根和多基根字,还要将中间一些基根的代码全部舍弃,只取前两码和最末2个基根各1码。就是说,取两头舍中间。

例如:缩–纟Z宀WD(亻)一A白NK–ZWAN

糖–米UF(广)肀XB口J–UFXJ

专利申请

2008年11月21日,北京一中院开庭并做出一审宣判,驳回微软撤销郑码专利的请求。微软甩赖未成。 郑码输入法由郑易里先生及其女儿郑珑共同发明,获得中国、美国等国家专利。1992年,由北京中易中标电子信息技术有限公司经郑易里和郑珑授权,开发、研制、设计了符合国家标准的宋体、黑体两套中文汉字字库,并获得了国家专利。

该文章由作者:【乌伊法鲁西】发布,本站仅提供存储、如有版权、错误、违法等相关信息请联系,本站会在1个工作日内进行整改,谢谢!

发表回复

登录后才能评论