形母码汉字输入法

xiaoxiao2020-10-23  17

形母码汉字输入法
【技术领域】
[0001] 本发明属于计算机信息处理技术领域,是对汉字形母码输入方法的改进。
【背景技术】
[0002] 汉字的编码是对汉字进行检索的基本依据。特别是随着电子计算机应用的普及, 如何通过标准键盘上的几十个按键输入成千上万个汉字,成为许多人所关注的课题,也出 现了许多种汉字输入法。
[0003] 各种名目的汉字输入法,主要可分为两大类:依照字音编码和依照字形编码。依照 字音编码主要是按照汉语拼音进行汉字输入,没有多少创新的空间。这种方法简单,易于掌 握使用。其缺点是重码率高,难以提高速度。对于不会汉语拼音和发音不准确的人难以使 用。所以人们更多考虑创新的方向是依照字形编码。
[0004] 多少年来,人们设计的属于计算机信息处理技术领域各种依照字形编码的汉字输 入法侧重于解决汉字的计算机输入问题,尽量降低重码率,减小平均编码长度。由于汉字结 构的复杂性,各种依照字形编码的输入法都比较难学,不宜掌握。
[0005]CN1054448C公开了一种汉字形母码输入方法,该方法使用26个字母键和10个数 字键输入汉字和词语的特征编码信息,具有记忆量小、简单易学等特点,特别是率先提出了 汉字输入法要与中文的教学相结合,尤其是与中小学的基础教育相结合,符合汉字书写笔 顺,因此受到国家有关部门的重视,并在大庆等地教育系统进行推广的试点工作。

【发明内容】

[0006] 本发明的目的是提供一种形母码汉字输入法,使用26个字母键输入汉字和词语 的特征编码信息,是对汉字形母码输入方法的重大改进。
[0007] 本发明的目的是通过以下技术方案实现的:
[0008] -种形母码汉字输入法,包括如下步骤:
[0009] -、将汉字输入键盘时的拆分单元分为基本形母、普通形母和组合形母,其中:
[0010] 1)、基本形母包括26个码,分配在计算机键盘的26个英文键名上:
[0011] A:马、B:贝、C:寸、D:刀、E:人、F:丰、G:弓、H:火、I:匕、J:金、K:可、L:了、M:木、 N:女、0 :口、P:片、Q:犬、R:日、S:水、T:土、U:目、V:山、W:亡、X:小、Y:月、Z:止;
[0012]2)、普通形母包括146个码,分配在计算机键盘的26个英文键名上:


UPP;酉:UK;朿:VM;束:0M;
[0041] 二、利用上述基本形母、普通形母和组合形母,进行汉字编码的方法为:
[0042](一)单字输入:
[0043] 1)、基本形母单独成字时,其编码是:基本形母所在键名后加字母V。
[0044] 2)、"虫"、"已"、Q "、"心"、"王"、"鸟"这六个形母组字时,如果是字的最后一个部 件,且编码小于四码,则在末尾附加其末笔画的编码。
[0045] 3)、普通形母单独成字时,其编码是:普通形母所在键名后加字的汉语拼音首字 母;
[0046]特例:
[0047] ①单笔画普通形母单独成字时,不加汉语拼音首字母。
[0048] ②"〇、一、四、五、七、八、九、儿"单独成字时,属"一级简码",不再保留附加汉语拼 音首字母的全码形式。
[0049]③普通形母中有一些在现代汉语中不单独成字,而只用做偏旁部首,如、 孑八、等,对于这些字,只能按单笔画编码。
[0050] 4)、两码组成一字时,其编码是:输入两码所在键名的字母。对于一部分常用字可 以在两码后附加字的汉语拼音首字母以避免重码的选择。
[0051] 5)、三码组成一字时,其编码是:输入三码所在键名的字母。
[0052] 特例:由三个相同的基本形母或普通形母构成的"品字形"的字,要附加末笔画编 码。
[0053] 6)、四码组成一字时,其编码是:输入四码所在键名的字母;
[0054]7)、超过四码组成一字时,其编码是:输入"首、二、中、末"四码所在的键名。
[0055] (二)词组输入:
[0056] 1)、对于由两个字组成的词组,依次取每个字的首、末码;
[0057]2)、对于由三个字组成的词组,依次取前两个字的首码和第三个字的首末码;
[0058] 3)、对于由四个或四个以上字组成的词组,依次取前四个字的首码;
[0059](三)简码输入:
[0060] -级简码:包括"一、快、看、他、她、它、不、把、吧、没、每、吗、四、想、要、否、非、发、 更、该、给、来、里、啦、五、子、在、儿、如、若、你、能、呢、的、地、得、六、为、无、旁、将、第、从、 除、此、比、以、及、七、都、走、我、〇、着、和、还、或、是、所、说、八、做、作、学、些、谢、去、却、 请、因、出、国、九、既、就、也、有、呀"78个最常用的字。它们大部分是按字的汉语拼音的首 字母定义其编码,有少数是按字的韵母字母定义其编码,或根据字的编码包含的形母的字 母定义其编码。
[0061] 本发明具有如下优点:
[0062] 1、汉字输入与汉语学习相结合。
[0063] 本输入法不仅适合用于汉字输入,而且适应汉语教学,特别是中小学基础教育。它 的拆分、编码完全符合汉字的部件组成及笔顺,符合汉字的字理。
[0064] 2、本输入法的设计完全考虑到符合国家标准的规定。主要有:
[0065] 识字教学用通用键盘汉字字形输入系统测评规则(教育部规GF-2011);
[0066] 信息技术通用键盘汉字输入通用要求(国标GB/T19246-2003);
[0067] 现代常用字部件及部件名称规范(教育部规范GF0014-2009);
[0068] 现代汉语通用字笔顺规范(语委会1997);
[0069]GB13000. 1字符集汉字笔顺规范(语委会GF3002-1999)。
[0070] 3、简单易学。
[0071] 本输入法选择26个笔划简单、有代表性、组字频率高的汉字部件作为组字的码 元,在本输入法中称之为"基本形母"。根据这些字的汉语拼音特性,对应定在键盘上的26 个英文字母键上,学者只需要几分钟就可以记住了。
[0072] 根据26个基本形母,通过"形"、"音"、"义"的联想,将其它常用字部件做出了衍伸 的定义,称为"普通形母"和"组合形母"。《现代常用字部件及部件名称规范》中所收录的汉 字部件共有514个。对于"普通形母"和"组合形母",需要做一点必要的学习和练习,但不 必死记硬背,通过"形"、"音"、"义"的联想,很容易掌握。用本输入法对汉字拆分、编码和录 入,就很容易实现了。
[0073] 4、本输入法所定义的形母全部是规范的汉字部件,这是其它很多种汉字输入法, 包括原始版本的形母码输入法所未能做到的。这对于学者准确地认识汉字的结构、字理是 很有好处的。
[0074] 5、本输入法对汉字的拆分、编码,完全符合汉字书写笔顺的规范,这对于正确地学 会汉字的书写是很有益的。
[0075] 除了使用本输入法设计的编码对汉字进行输入之外,同时也可以使用单笔画的方 式进行汉字输入。两种方法可以根据自己的习惯任意混合交替使用。这既可以解决初学 者遇到不会拆分的汉字无法输入的问题,又为学习汉字的人提供了练习汉字书写笔顺的环 境。
[0076] 6、按照国标GB/T19246-2003的规定,使用26个字母键输入汉字和词语的特征编 码信息,这是对形母码输入法(CN1054448C)的重大改进(CN1054448C使用26个字母键和 10个数字键输入汉字和词语的特征编码信息)。
[0077] 7、本输入法根据所包含的字符集的不同又分为三个版本。
[0078] 首先是以国标GB2312《信息交换用汉字编码字符集》收录的6, 763个汉字为基础, 又根据2013年国家最新颁布的《通用规范汉字表》8, 105个汉字做了补充,也保留了 1988 年版《现代汉语通用字表》中的字,即《信息交换用汉字编码字符集》、《通用规范汉字表》和 《现代汉语通用字表》的并集,共计8, 243个汉字。
[0079] 在此基础上简化出一个子集,只包括《通用规范汉字表》中一级字表的3, 500个常 用汉字的版本。它适合于初学汉语的人使用。
[0080] 在此基础上又收集了国标GB18030-2000规定的27, 533个汉字(包括部首、部件 等),合起来编制成共计27, 719个汉字的版本。它适合要求使用繁体字、异体字的人。
[0081] 本输入法为提高汉字录入的速度,还收录了常用词汇约5万条。
[0082] 8、平均码长和重码率。
[0083] 对于8, 243字符集的版本,本输入法收录的字、词共57, 977条,计135, 696字,将 全部字词录入一遍,共需击键282, 230次(包括重码选择的辅助信息输入击键),计算出平 均码长为2. 080键/字。
[0084] 选择议论文、散文、诗歌、故事等几种体裁的文章共9篇,11,107个汉字(所有汉字 都在国标GB2312范围内,不分段,无标点,无疑难字,无特殊符号,无专业术语),将全部资 料录入一遍,共击键23, 767次(包括重码选择的辅助信息输入击键),计算出 平均码长为 2. 140 键 / 字。
[0085] 对于8, 243字符集的版本,有重码字345个,重码率为4. 185%。
[0086] 对于3, 500字符集的版本,重码字仅59个,重码率为1. 686%。
[0087] 对于27, 719字符集的版本,重码字为5, 458个,重码率为19. 690%。
[0088] 形母码输入法的原版仅包括国标GB2312的6, 763字符集。在这个字符集中,原版 本的重码字为467个,重码率为6. 905%。《龙文基因形母码汉字输入法V8. 1》版本的重码 字为221个,重码率为3. 268%,比原版本降低了一半多。
[0089] 可见,本输入法在平均码长和重码率方面都有较好的效果。
【附图说明】
[0090] 图1为基本形母与按键的对应关系图;
[0091] 图2为普通形母"横"、"竖"、"撇"、"点"、"折"与按键的对应关系图;
[0092] 图3为一级简码字在键盘上的位置图。
【具体实施方式】
[0093] 下面结合附图对本发明的技术方案作进一步的说明,但并不局限于此,凡是对本 发明技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,均应涵盖 在本发明的保护范围中。
[0094] 一、汉字拆分单元
[0095](一)基本形母
[0096] 本输入法选择26个笔划简单,初学汉语的人较早就接触到并认识的汉字,也是很 有代表性、组字频率高的汉字部件作为组字的码元,在本输入法中称之为"基本形母"。为了 便于记忆,把这26个基本形母编成下面的口诀:
[0097] 日月金木水火土;
[0098] 山犬亡了刀弓止;
[0099] 小贝寸片女可丰;
[0100] 马口人匕目。
[0101] 前三行中,"山"按其形象定义在"V"键上,其它20个按汉语拼音的声母首字母定 键。
[0102] 第四行5个,按韵母首字母定键。
[0103] 基本形母与按键的对应关系如图1所示。
[0104](二)普通形母
[0105] 普通形母是由基本形母根据"形"、"音"、"义"等方面的联想而派生的形母,共有 146个,详见表1。
[0106] 定义普通形母的依据有以下两点:
[0107] 1、单笔画
[0108] 汉字是由笔划组成的。汉字的笔划归纳为五种:"横"、"竖"、"撇"、"点"、"折"。
[0109] 横(一):定在"K"键上。算是一个特殊的规定。
[0110] 竖(丨):与字母"I"形似,定在"I"键上。
[0111] 撇(J):与字母"J"形似,定在"J"键上。
[0112] 点(、):包括"捺",与字母"L"形似,定在"L"键上。
[0113] 折(包括各种形式的折笔,用"乙"来表示):与字母"M"形似,定在"M"键上。
[0114] 本输入法也可以随意改成"笔划输入方式"。这时,这五个键恰好适合右手不须移 位的键盘操作,非常方便。从这个角度来说,用本输入法,几分钟学会打字成为可能。
[0115] 两种方法可以根据自己的习惯任意混合交替使用。这既可以解决初学者遇到不会 拆分的汉字无法输入的问题,又为学习汉字的人提供了练习汉字书写笔顺的环境。
[0116] 2、根据基本形母,或根据所在键名的"形"、"音"、"义"联想记忆,不须死记硬背,很 快就可以掌握。
[0117]例如:
[0118] A键:基本形母是根据韵母首字母定键的"马"。
[0120] 这些汉字部件就都作为普通形母定义在A键上。
[0121] B键:基本形母是根据声母首字母定键的"贝"。
[0123] 这些汉字部件就都作为普通形母定义在B键上。
[0124] C键:基本形母是根据声母首字母定键的"寸"。
[0125] 与"寸"形近音近:廿(卄)(草字头、贲字腰)
[0126] 与"廿"形近:带字头)廿升(弄字底)
[0127] 册牛?(举字底)
[0128] 这些汉字部件就都作为普通形母定义在C键上。
[0129](三)组合形母
[0130] 教育部和国家语言文字工作委员会发布的《现代常用字部件及部件名称规范》 (GF0014-2009)中收入了 514个常用的汉字部件。这么多的部件不可能都用26个字母中的 一个来定义成形母。所以有些部件用2个或2个以上的键来定义。这就是"组合形母"。
[0131] 绝大多数的组合形母不需要记忆,就像对汉字进行拆分那样,可以把它们联想成 是由若干个基本形母或普通形母组合成的。
[0132] 例如:"白",联想成"J"和"日"组成;"本"联想成"木"和"一"组成。这是很容 易的,人们日常生活中也常常这样来描述字的形象。
[0133] 那么为什么还要引出"组合形母"的概念呢?这是要让学习汉字的人懂得:"白"和 "本"都是组成汉字的基础部件,是不可分的。我们根据它们的形象,使用"j"和"日"所在 的键"JR"定义了部件"白";用"木"和"一"所在的键"MK"定义了部件"本"。而不能认为 "白"可以分成"J"和"日";"本"可以分成"木"和"一"。
[0134] 另外,也有少部分的组合形母是需要特殊地学习和记忆一下的。
[0135] 表2~4列出了《组合形母定义表》,共有341个,分为三个部分。
[0136] 第一部分是绝大部分,包括290个。这部分只要简单地看一看就够了。按照书写 的笔划顺序,很容易把它们联想为某些形母的组合。
[0137]例如:
[0139] 第二部分有40个,需要简单地学一下,因为定义这些形母所依据的组成部分,有 些只是形状相似,而并不完全相同。
[0140] 例如:
[0141] "皮":按照书写的笔顺分成"厂"、"丨"、"又",所以定义为"AIX"。而实际上,第一 部分与"厂"形象相似,但并不相同。
[0142] "直":按照书写的笔顺分成"一"、"丨"、"且",所以定义为"KIU"。下面的部分只是 象"且",其实并不是"且"。
[0143] "鸟":按照书写的笔顺分成"j"、"马",所以定义为"JA"。下面的部分只是象"马", 其实并不是"马"。
[0144] 尽管如此,还是很容易记忆的。
[0145] 第三部分有11个,需要认真学一下,并记住。好在数量很少。因为定义这些形母, 不完全按照书写的顺序,有些考虑到"字理",有些为了汉字的拆分和编码的便利做了简化, 有些是依据其突出的特点。
[0146] 例如:
[0147] "言":只按首末两部分,取~,、" 口",定义为"TO"。
[0148] "隹"(锥字边):只按首末两部分,取"彳"、"*",定义为"EF"。
[0149] 敝字旁):象"米"和"门"组合在一起,定义为"XV"。
[0150] "豕"(啄字旁):比"豕"多一点,所以在"豕"的编码后面再加一个"点"的编码, 定义为"KQL"。
[0151] "酉":比"西"多一横,所以在"西"的编码后面再加一个"横"的编码,而省略了"西" 的编码前面的一横,定义为"UK"。
[0152] "朿":CN1054448C中是完全遵循书写顺序把它拆分为"一"、"门"、"小"。而本方法 按照字理分析,"朿"是象形字,由"木刺"的形象演变而来,还是应突出"木"的根本,所以分 成"门"、"木",定义为"VM"。
[0153] "束":CN1054448C中是完全遵循书写顺序把它拆分为"一"、" 口"、"小"。而本方 法按照字理分析,"束"是会意字,由木柴被一根带子捆扎起来的形象演变而来,还是应突出 "木"的根本," 口"代表绳子,所以分成"口"、"木",定义为"0M"。
[0154] 在定义组合形母时,有时会想出多种组合方式。一般情况下,是遵循"尽多"的原 贝1J,就是看哪种方式能首先使尽可能多的笔划集中在一起。
[0155] 下例一些组合形母,可以设想出多种编码方式,但按照"尽多"的原则,可以确定一 种是正确的:
[0156]
[0157] 二、编码规则
[0158](一)单字输入
[0159] 1、基本形母单独成字时,其编码是:基本形母所在键名后加字母V(两键一字)。例 如:
[0161] 2.附加末笔画编码的形母
[0162] "虫"、"已"、"Q(仓字底)"、"心"、"王"、"鸟"这六个形母(前五个是普通形母,最 后的"鸟"是组合形母)组字时,如果是字的最后一个部件,且编码小于四码,则在末尾附加 其末笔画的编码。
[0163]例如:
[0165] 下面各条规则都是在本条规则之外的。
[0166] 3、普通形母单独成字
[0167] 普通形母单独成字,其编码是在普通形母的编码后面附加字的汉语拼音首字母 (两键一字)。这些字的编码是必须附加汉语拼音首字母的,好在不多,只有47个,基本上 都是大多数人熟知的、简单的常用字。
[0168]例如:
[0170 ] 这里有下面的特例:
[0171] ①单笔画普通形母单独成字时,不加汉语拼音首字母(一键一字)。有:
[0172]字:一乙
[0173]编码:K M
[0174] ②以下普通形母单独成字时,被列为"一级简码",不再保留附加汉语拼音首字母 的全码形式(一键一字)。有:
[0176] ③普通形母中有一些属于GB2312标准收录的汉字,但在现代汉语中不单独成字, 而只用做偏旁部首,对于这些字,只能按单笔画编码。
[0177]例如:
[0179] 4.两码组成一字
[0180] 两码组成一字时,由两码定义(二键一字)。
[0181]例如:
[0183] 为了尽量避免重码的选择,有一少部分字可以附加汉语拼音声母首字母。具体规 则如下:
[0184] ①只选择了 2013年国家发布的《通用规范汉字表》中的一级字表和二级字表中 的一部分常用的、大部分人都认识的字附加汉语拼音首字母。而对于较疑难的字,特别是不 在一级字表和二级字表范围之内的字一律是不加汉语拼音首字母的(二键一字)。
[0185]例如:
[0187] 这些是很多人不大认识的字,肯定是不加汉语拼音首字母的。
[0188] ②两码都是单笔画形母时,不加汉语拼音声母首字母(二键一字)。
[0189]例如:
[0191] ③没有声母的字("零声母"),当然就不加汉语拼音声母首字母(二键一字)。
[0192]例如:
[0194] ④可能有人会说,还是弄不清这个字要不要附加汉语拼音首字母。没关系。本输 入法在设计中还实现了这样的功能,对于一级字表和二级字表中的常用字,加不加汉语拼 音首字母都可以。只不过适当地附加汉语拼音首字母(三键一字)可以尽量减少对重码的 选择。
[0195] 例如:
[0197] 这些都是由两码组成的字,加不加拼音首字母都可以录入。如果只输入两码,是重 码字;加了拼音首字母,就不是重码字。
[0198] 有些字按规定是不加汉语拼音首字母的,输入两码就已经排在首位,不是重码字。 如果在汉字录入时附加了汉语拼音首字母,打了三码,也没有关系,但有可能反而成为重码 字了。
[0199] 5.三码组成一字
[0200] 三码组成一字时,由三码定义(三键一字)。
[0201] 例如:
[0203] 这里有一个特例。由三个相同的基本形母或普通形母构成的"品字形"的字,要附 加末笔画编码(四键一字)。
[0204] 例如:
[0206] 6.四码组成一字
[0207] 四码组成一字时,由四码定义(四键一字)。
[0208] 例如:
[0210] 7.超过四码组成一字
[0211] 超过四码组成一字时,由"首、二、中、末"四个编码来定义(四键一字)。也就是 说,第一、第二和最后一码是必须的,而第三到末码之前的部分选择一个。选择的方法是:去 掉单笔画形母,然后取最前面一个。如果中间都是单笔画,则保留最前面一个。这个规则称 为"跳单笔"。具体字例见表5。
[0212] 8.形母合并
[0213] 有些字比较复杂,笔画多,只用四码来表达一个字很容易造成较多的重码字。为了 尽量减少重码,规定下面的一些情况,将几个形母合并处理,也可以理解成是省略了某些部 分。
[0214] 但要注意,如果合并后的编码将不足三码,则不能合并。
[0215] ①"1"(玄字头)下面有"、(倒八),合并编码为"W"。也可以理解为省略了 〇
[0216]例如:
[0218] ②"口"下面有"、,(倒八),合并编码为"0"。也可以理解为省略了"、^'。
[0219]例如:
[0221] ③以"人"开头的字下面有"一",合并编码为"E""。也可以理解为省略了 "一"。
[0222] 例如:
[0224] ④"亡"下面有" 口"、"月",合并编码为"W"。也可以理解为省略了"口 "和"月"。
[0225]例如:
[0227] ⑤两个"口"横向并排,看做"目",合并编码为"U"。例如:
[0228]例如:
[0230] ⑥"才"与"夂"中间夹有其它的部件,或"才"与"亍"中间夹有其它的部件形成左 右结构的字,合并为"JE",也可以理解为省略了"夂"或"亍"。
[0231]例如:
[0233] ⑦两个"辛"中间夹有其它的部件形成左右结构的字,合并为"WT",也可以理解为 省略了右边的"辛"。
[0234]例如:
[0236]⑧有十个成字的部件(有基础部件,也有组合部件),为了编码的便利,用于组字 时做了合并处理(或说是简化)。有的是合并为首码(一码),有的合并为首末两码。
[0238] 具体字例见表6。
[0239](二)简码
[0240] "简码"是单字编码的简化形式。用(一)所讲的编码规则为单字定义的编码就称 其为"全码"。
[0241] 为了提高汉字录入的速度,选出一部分使用频率高的字,为其定义一个比全码短 的编码,就是该字的简码。
[0242] 简码分为一、二、三级。
[0243] 有些字的全码可能是三个或四个字符,现在只用两个字符为其编码,即"两键一 字",称为二级简码。
[0244] 有些字的全码是四个字符,现在只用三个字符为其编码,即"三键一字",称为三级 简码。
[0245] 二、三级简码比较多,不必专门去背。在实际操作中,有时全码还没有打完,该字就 已经显示出来了。这就是其简码。逐渐就熟悉了。
[0246] 我们着重讲一下一级简码。
[0247] 选出78个最常用的字,每个字由一个字符编码,S卩"一键一字",称为一级简码。这 些字的使用频率特别高,所以掌握好一级简码对提高汉字录入速度是非常有利的。
[0248] 前面讲的有8个普通形母(〇、一、四、五、七、八、九、儿)单独成字时按其所在键 的字符编码(一键一字),即属于一级简码的一部分。并且这8个字不再保留附加汉语拼音 首字母的全码形式。
[0249] 又选出70个特别常用的字为它们在全码之外又定义了一级简码。一时记不住简 码,也可以使用其全码。但掌握了简码,对提高汉字录入速度是非常有利的。加上前面讲的 8个,共78个。
[0250] 我们先讲其中的26个。为了便于记住哪些字的编码属于一级简码,可以读一读下 面的口诀:
[0251] 因我的儿没去
[0252] 更不从旁和你比
[0253] 他是否也来学
[0254] -四五六七八九
[0255] 这些字中,除了前面讲过的属于普通形母单独构成的字以外:
[0256] "我"、"他"、"比",按其汉语拼音的韵母分别定义在"0"、"A"和"I"键上;
[0257] "因"、"六",按全码的首字母,分别定在"V"和"W"键上;
[0258] 其它字都是按其汉语拼音的首字母定键。很容易记住。
[0259] 由这26个字,根据音近或其编码包含有所在键的形母,又定义了另外52个。为了 便于记忆,再读一读下面的口诀:
[0261] 这52个简码中,"她、它、以、及、着"是根据韵母分别定在"A、I、Q"键上,"想、要、 将、第、都、走、做、作、出、国"是根据它们的编码包含有所在键的形母分别定在"U、P、T、E、 V"键上,其它字都是按其汉语拼音的声母首字母定键的。
[0262] 每个三字句的第一字,输入其简码后,按空格键即可;每个三字句的第二、三字,输 入其简码后,用" 2 "、" 3 "键选择即可。
[0263] 一级简码字在键盘上的位置,如图3所示。
[0264](三)词组编码
[0265] 对于经常用到的由两个或两个以上汉字组成的词组用特定的方法为其编码是提 高汉字录入速度的重要手段。本输入法吸纳了约5万条常用词组,这是不需要背的,也不可 能背下来。在汉字录入的实际操作过程中自然会掌握。
[0266] 下面说明词组的编码方法。
[0267] 1、两字词的编码方法
[0268] 对于由两个字组成的词组,依次取每个字的首、末码(不包括末尾附加的字符"V" 或汉语拼音首字母、末笔画。下同,不重述),简记为"首末、首末"。
[0269]例如:
[0270]
[0271] 特殊情况:
[0272] (1)如果两个字之一的编码是单个字符,它的首末码就合为一个了。
[0273]例如:
[0275] (2)如果两个字的编码都是单个字符,要重复第二个字的编码。
[0276]例如:
[0278] 2、三字词的编码方法
[0279] 对于由三个字组成的词组,依次取前两个字的首码和第三个字的首末码,简记为 "首、首、首末"。
[0280]例如:
[0282] 特殊情况:
[0283] 如果第三个字的编码是单个字符,它的首末码就合为一个了。
[0284]例如:
[0286] 3.多字词的编码方法 [0287] 对于由四个或四个以上字组成的词组,依次取前四个字的首码,简记为"首、首、 首、首"。
[0288]例如:
[0289]
[0290] (四)编码中的注意事项
[0291] 汉字的书写笔顺,绝大部分是写完一个部件再写另一个部件,但也有例外。
[0292] 例如:带有围字框("□")的字,如"国"、"园"、"因"、"团"等,是先写围字框的 "竖"和"横折",然后写框内的部分,最后才写围字框底下的"横"。本输入法在编码时要考 虑到汉字部件的完整性,又要考虑到书写笔顺的正确,对几种特殊情况做以下规定。这时要 特别弄清汉字的部件是什么,并注意书写的笔顺。
[0293] 1、带有围字框("□")的字
[0294] 围字框(□)是组合形母,形似由"门"和"一"组成。带有的围字框(□)的字 的编码顺序是:
[0295] 围字框的第一码(V) +框内部分的编码+围字框的第二码(K)
[0296] 例如:
[0298] 在这里还有一个略为特殊的规则:如果围字框(□)下面的"一"是字的最后一码, 要先略去这个"一",其余部分按规则编码,最后再补上"一"的编码"K"。
[0299] 这样一来,有些字会成为"五码一字"。但真正需要录入五码的字极少。
[0300] 例如:
[0302] 2、带有区字框("匚")的字
[0303] 区字框("C")是组合形母,由单笔画"一"和"乙"组成,带有的区字框("匚") 的字的编码顺序是:
[0304] 区字框的第一码(K) +框内部分的编码+区字框的第二码(M)
[0305] 例如:
[0307] 3、由"山"构成包围结构的字
[0308] 把"山"分成"丨"和"LJ"两部分,编码顺序是:
[0309] "丨"的编码(1) +框内部分的编码+ "LJ"的编码(V)
[0310] 例如:
[0312] 4、由"戈"或"弋"构成半包围结构的字。
[0313] "戈"是组合形母,编码是"TJL"。
[0314] "弋"是组合形母,编码是"TL"。
[0315] 由"戈"、"弋"构成半包围结构的字是先写"一",然后写被包围的部分,最后才写 "戈"或"弋"剩余的笔画。
[0316] 在这种情况下,"戈"、"弋"都完全拆分为单笔画。
[0317] 例如:
[0319] "戈"的"一"有时与其它笔画相连组成新的编码。
[0320] 例如:
[0322] "|++1 "(戕字框)是组合形母,左边的部分是"爿"的变体,笔顺也有变化。由"|++| "构成半包围结构的字的编码顺序是:
[0323] 的前两码(KP) +被包围部分的编码+ "U"的最后一码(L)
[0324] 例如:
[0325] 字:藏臧
[0326] 编码:CKPLKPBL
[0327]
[0328]
[0329]
[0330]
[0331]
[0332]
[0333] 表2 :组合形母定义表(第一部分)
[0334]
[0335]
[0336]
[0337]
[0338]
[0339]
[0340]
[0341]
[0342]
[0343] 表3 :组合形母定义表(第二部分)
[0345]
[0346] 表4 :组合形母定义表(第三部分)

[0349] 表5:"跳单笔"字例
[0351] 表6:"形母组合"字例
[0353]
【主权项】
1.形母码汉字输入法,其特征在于所述输入法步骤如下: 一、将汉字输入键盘时的拆分单元分为基本形母、普通形母和组合形母,其中: 1) 、基本形母有26个,分配在计算机键盘的26个英文键名上: A :马、B :贝、C :寸、D :刀、E :人、F :丰、G :弓、H :火、I :匕、J :金、K :可、L :了、M :木、N : 女、O :口、P :片、Q :犬、R :日、S :水、T :土、U :目、V :山、W :亡、X :小、Y :月、Z :止; 2) 、普通形母有146个,分配在计算机键盘的26个英文键名上:3) 、组合形母有341个,对应的编码如下:乍:PKK ; 11: KPML ;夂:JX ;言:TO ;隹:EF : XV ;豕:KQL ;竹:PP ;兆:RS ;鼎:UPP ;酉:UK ; 束:VM ;束:0M ; 二、利用上述基本形母、普通形母和组合形母,进行汉字编码的方法为: (一) 单字输入: 1) 、基本形母单独成字时,其编码是:基本形母所在键名后加字母V ; 2) 、"虫"、"已"、" Q "、"心"、"王"、"鸟"这六个形母组字时,如果是字的最后一个部件, 且编码小于四码,则在末尾附加其末笔画的编码; 3) 、普通形母单独成字时,其编码是:普通形母所在键名后加字的汉语拼音首字母; 4) 、两码组成一字时,其编码是:输入两码所在键名的字母; 5) 、三码组成一字时,其编码是:输入三码所在键名的字母; 6) 、四码组成一字时,其编码是:输入四码所在键名的字母; 7) 、超过四码组成一字时,其编码是:输入"首、二、中、末"四码所在的键名; (二) 词组输入: 1) 、对于由两个字组成的词组,依次取每个字的首、末码; 2) 、对于由三个字组成的词组,依次取前两个字的首码和第三个字的首末码; 3) 、对于由四个或四个以上字组成的词组,依次取前四个字的首码; (三) 简码输入: 定义"一、快、看、他、她、它、不、把、吧、没、每、吗、四、想、要、否、非、发、更、该、给、来、 里、啦、五、子、在、儿、如、若、你、能、呢、的、地、得、六、为、无、旁、将、第、从、除、此、比、以、 及、七、都、走、我、〇、着、和、还、或、是、所、说、八、做、作、学、些、谢、去、却、请、因、出、国、 九、既、就、也、有、呀"78个最常用的字为一级简码,其中:"我"、"着"、"他"、"她"、"它"、"比"、 "以"、"及",按其汉语拼音的韵母分别定义在"〇"、"A"和"I"键上;"〇"、"一"、"四"、"想"、 "要"、"五"、"六"、"七"、"都"、"走"、"八"、"做"、"作"、"儿"、"将"、"第"、"因"、"出"、"国"是 根据其全码的特征分别定在"〇"、"1("、1"、"2"、"1"、"1'"、1"、"1?"、叩"、1"键上,其它字 按其汉语拼音的声母首字母定键。2. 根据权利要求1所述的形母码汉字输入法,其特征在于单笔画普通形母单独成字 时,不加汉语拼音首字母。3. 根据权利要求1所述的形母码汉字输入法,其特征在于"〇、一、四、五、七、八、九、 儿"单独成字时,属"一级简码",不再保留附加汉语拼音首字母的全码形式。4. 根据权利要求1所述的形母码汉字输入法,其特征在于普通形母中在现代汉语中不 单独成字,而只用做偏旁部首的字,按单笔画编码。5. 根据权利要求1所述的形母码汉字输入法,其特征在于由三个相同的基本形母或普 通形母构成的"品字形"的字,要附加末笔画编码。6. 根据权利要求1所述的形母码汉字输入法,其特征在于对于由两个字组成的词组, 如果两个字之一的编码是单个字符,它的首末码合为一个;如果两个字的编码都是单个字 符,重复第二个字的编码;对于由三个字组成的词组,如果第三个字的编码是单个字符,它 的首末码合为一个。7. 根据权利要求1所述的形母码汉字输入法,其特征在于对于带有围字框"口"的字, 编码顺序是:"门"的编码+框内部分的编码+ "一"的编码。8. 根据权利要求1所述的形母码汉字输入法,其特征在于对于带有区字框"匚"的字, 编码顺序是:"一"的编码+框内部分的编码+ "乙"的编码。9. 根据权利要求1所述的形母码汉字输入法,其特征在于对于由"山"构成包围结构的 字,编码顺序是:"丨"的编码+被包围部分的编码+ "U"的编码。10. 根据权利要求1所述的形母码汉字输入法,其特征在于对于由"戈"或"弋"构成半 包围结构的字,"戈"、"弋"完全拆分为单笔画。
【专利摘要】形母码汉字输入法,将汉字按汉字部件规范拆分单元分为基本形母、普通形母和组合形母,基本形母单独成字,在基本形母所在键名后加字母V;普通形母单独成字,在普通形母所在键名后加字的汉语拼音首字母;两码组成一字,输入两码所在键名的字母,少部分在两码后加字的汉语拼音首字母;三码组成一字,输入三码所在键名字母;四码组成一字,输入四码所在键名字母;超过四码组成一字,输入“首、二、中、末”四码所在键名;对于由两个字组成的词组,取“首末、首末”;对于由三个字组成的词组,取“首、首、首末”;对于由四个或四个以上字组成的词组,取“首、首、首、首”。本发明使用26个字母键输入汉字和词语的特征编码信息,简单易学。
【IPC分类】G06F3/023
【公开号】CN104898862
【申请号】CN201510193975
【发明人】云国福, 赵之仁, 杨凌云, 乔元华
【申请人】云国福
【公开日】2015年9月9日
【申请日】2015年4月22日

最新回复(0)