请输入您要查询的百科知识:

 

词条 汉字基因
释义

汉字基因是朱邦复对汉字进行拆解得出的仓颉码,做更进一步的分析整理,得出的汉字理论。他提出汉字构造蕴含古人的概念认知,可以整理归纳成概念分类和常识分类,电脑可以透过之达成与人类的沟通和理解,也就是说把一个汉字拆解到最简的字根部件组合(即为仓颉码)后,各字根有对应的含意,电脑可以俱以理解字义。完整实做从中文特有基因(基本因子)归纳出的六大要素:字码、字序、字形、字辨、字音、字义,称为汉字基因工程。

简介

汉字基因朱邦复认为汉字有六大要素和功能:字形、字音、字义、字码、字序、字辨,前三者为汉字本有,而后三者是在资讯时代为处理需要,必须发展、整理出来的要素。而对汉字进行分析,以得出基因的工作,即称为“汉字基因工程”。字码用于汉字的编码使用仓颉检字法可根据字形得出一个字的字码

字序用于汉字的检索、排序以仓颉码为内码。由于仓颉码具有固定序列,可用作排序

字形即汉字的形体,可被人类视觉感受字形产生器可根据仓颉码产生字形

字辨感受汉字的形体而得知其含义的抽象、动态过程仓颉系统可根据扫描的文字位图,搜寻其中的仓颉字根,转换成相应的仓颉码,字音即汉字的读音,人类可发出和感受者仓颉系统可根据仓颉码推断大致读音,但因古今音变剧烈,须做较多例外处理

字义即汉字可供人认知的意义对汉字进行“概念分类”和定义,可供电脑的“理解系统”根据仓颉码(内码)理解字义,再加以组合,即可令电脑理解人类的自然语言与思想,甚至可和人类沟通。

码序形辨的分析方法,即是早期朱邦复开发仓颉输入法的过程[2]。而关于字义的分析方法,朱邦复认为,透过人类感官,对事物作“绝对分类”(二分法),求出最小的概念象征因子,即是字义基因;由于汉字是中文的最小组成因子,因此字义基因也是“中文概念基因”。

因子 功能 技术应用

字码 用于汉字的编码 使用仓颉检字法可根据字形得出一个字的字码

字序 用于汉字的检索、排序 以仓颉码为内码。由于仓颉码具有固定序列,可用作排序

字形 即汉字的形体,可被人类视觉感受 字形产生器可根据仓颉码产生字形

字辨 感受汉字的形体而得知其含义的抽象、动态过程 仓颉系统可根据扫描的文字位图,搜寻其中的仓颉字根,转换成相应的仓颉码

字音 即汉字的读音,人类可发出和感受者 仓颉系统可根据仓颉码推断大致读音,但因古今音变剧烈,须做较多例外处理

字义 即汉字可供人认知的意义 对汉字进行“概念分类”和定义,可供电脑的“理解系统”根据仓颉码(内码)理解字义,再加以组合,即可令电脑理解人类的自然语言与思想,甚至可和人类沟通。

缘起

朱邦复一九七三年,朱邦复旅居巴西圣保罗,在一家规模极大的「四月出版公司」中,任职美工完稿。一天,朱邦复目睹了一本书的出版,由手稿印成书籍到运送销售,不过整整十二个小时!当时中文印书尚停留在活版铅字时代,印一本十五万字的书,排版要四个月,校对再排要三个月,三次的校对就是九个月。若是一年内能上市,作者应该额手称庆了。朱邦复心中的感慨既深且远,如果中文处理不能具相同的效率,中文迟早将被时代淘汰。再若中文淘汰了,国人全盘接受外国文化的洗礼,那又能算什么人?千秋万世的后代子孙,怎知中华文化在绝灭前,曾经绵延过五千年,曾经令黄土高原光辉灿烂?义无反顾地,朱邦复决定献身于中文的研发工作,默默地耕耘了二十六年。如果可能,朱邦复打算再努力另一个二十六年。毕竟,文化是永无止境的!

同年,朱邦复先回到台湾,在一九七六年先发表了「形意检字法」。朱邦复作过试验,如果用在铅字的排列上,可以增加约五倍的检字效率。此外,朱邦复发现朱邦复所采用的字根,正是文字的基因,除了字形可供取码外,如果选取及安排得当,完全可以代表文字所有的机能。尤其是在汉字(中文尚包括其他民族文字)中,百分之九十是形声字,除了声符之外,形声字尚有「假借」的机能,也就是说,字首代表分类,字身可作定义之用。为此,朱邦复对检字法的要求,是以字义的理解为第一诉求。

一九七八年,时年四十有二,朱邦复有幸接触到电脑,愤而学习。在一个月内,朱邦复边学边做,试着写作程式,将朱邦复的检字法与电脑字形结合,并完成了史上第一套军用通讯系统。当时,蒋纬国将军特别命名为「仓颉输入法」。

汉字基因工程一九七九年,朱邦复利用仓颉输入法的字根观念,完成了「向量字形产生器」的设计。同时,在程式设计过程中,朱邦复又发现如果倒反流程,就相当于文字辨识。

同年,朱邦复用这些观念,设计了一台具有简单概念的「中文电脑」。由于朱邦复无力生产,便与宏碁公司合作,只提供了字码输入及字形输出的功能,另外由宏碁公司设计了中文操作系统及中文程式语言。

一九七九年九月,朱邦复和宏碁公司共同发表了「天龙中文电脑」,打破了电脑不能使用中文的迷信。

此后,朱邦复继续从事汉字的研究,达二十年之久。一九八九年八月,朱邦复曾与深圳科技工业园合作,完成「汉字大字库」,国家科学院在北京友谊宾馆,举行技术审核及评估。最后在十馀位第一流科学家的审核下,评定为「超过世界水平」。

一九九○年六月,朱邦复发展的「聚珍整合系统」,又在国家科学院的核估下,被评为「超过世界水平」的软件技术。一九九一年朱邦复回到台湾,为了抗衡微软的文化侵略,朱邦复坚决认定微软视窗应该把文字介面公开,令从事中文软件的业者,保有一线生机。但微软悍然拒绝,朱邦复又寻求台湾资讯策进会合作,协助他在视窗3.0上,建立了一个中文系统,其功能远胜微软之中文视窗。

微软立刻拉拢台湾软件界,合纵连横。一九九二年,台湾仅有的十馀家软件公司,不是成为微软的代销业者,就是被蚕食鲸吞。最后微软推出视窗3.1,并取消了资策会版本更新的权利,至此大势已去,事到如今,台湾的中文软件界已告全军覆没。

朱邦复经过这次惨败的打击,便宣布退隐归山,专心一致研发汉字的基因工程。但惜曲高和寡,朱邦复曾前后在台湾大学及报章杂志上发表「概念网络」理念,却得不到任何回响。于是朱邦复又转换策略,将汉字基因理论运用在三维动画处理上,打算将中华文化的精髓转化为人人可以接受的动画产品。

一九九九年二月,朱邦复完成了由编剧到动画制作的应用系统。又在短短三个月中,以四个工作人员,完成了台湾大学中国文学系所委制的九十分钟三维动画,是根据《周礼》制作的「士昏礼」,又是国人突破性的创举。

同时,朱邦复接到了香港「文化传信集团有限公司」的邀请,赴港合作,谋求利用最新科技,将文化事业发扬光大。

这次回到台湾发表「汉字基因工程」,正值祖国改革开放成果展现,又恰是微软大军临境,进一步推广其维纳斯计划之际。此中意义之大,无与伦比,朱邦复今年已六十有三,虽然屡战屡败,但仍坚信汉字基因是唯一能够维护朱邦复中华文化之科技至宝。

理念基础

朱邦复在当今资讯时代,微型电脑(MicroComputer)俨然成为时代的代言人,无处无时不见其踪影。然平心而论,微型电脑是在一九七一年,美国英特尔公司受日本人的委托,设计了一颗计算晶片。由于速度未达原定规格,致遭退货,英特尔公司为了弥补损失,只好以之作为一种控制器,孰料竟意外演变成后来的微电脑。微电脑的优点,是执行的结果精确,处理速度快捷,可以节省大量的人力、物力。更兼以能利用软件设计以增益其功能,对于当今变化无常,而又需求殷切的各种服务业,简直是大旱之逢甘霖。在商业推波助澜下,一时大行其道,人们遂误以为现今的电脑技术,就是最终的资讯解决方桉。

其实,人生从初试啼声至意识渐明,无非是各种信息之交汇所致。因此,人脑可说是一个自然形成的「信息网络」。大自然进化数十亿年,万事万物井然有序,其法则自必效率最高。从理论上来说,顺遂自然,是最简单易行的法门。

举例而言,猫、狗、鸟、鱼都各有辨识能力,足证辨识必非高深莫测的「高科技」。再看作图、计算等能力,不仅猫、狗无此能力,连人类也必须经过长时期的学习、训练,否则无法胜任。

朱邦复但电脑发展至今,辨识迄今难如登天,而其绘图、计算之功能却轻而易举。在我们盲目讴歌电脑「高科技」的同时,是不是该平心静气地反思,究竟我们走的方向是对是错?

电脑原名「计算机」,是以数学运算为主要功能。数学的特性是精准明确,从技术来说,这种特性是基于工业发达后,人们因从事物质生产,迫切需要的一种规范。根据这种诉求,我们不难想见,无论微电脑的功能发展到何种地步,要想以之解决人生的各种问题,可以说是缘木求鱼。

概念系指概略的念头,是人将繁复的经验,用概括简略的表达方式,以便于与他人沟通者。每一个人都生存在独一的时空中,在变化无穷的环境刺激下,个人经验之排列组合机率,完全没有与他人重复的可能。

因此,最理想的,能解决人类各种问题的方桉,便是用概念设计出一种协助人类思维的工具。由于电子技术的进步,显然可以在微电脑现有的结构上,重新规划,设计出一种完全符合人性的拟人电脑。

字易

汉字基因《字易》是朱邦复根据汉字基因理论,和网友合作写出的开放文学著作。他认为汉字由于合乎人类的思维原理,因此非常易学,其中也谈及他认为的汉字的“正确学习方法”。朱邦复认为,汉字的创造和其字义的由来,主要系“约定俗成”,即“视讯之图形基因供约定,而由使用者是否易于接受为俗成”。由于人类的感官类似,因此对同样的视觉图像能产生类似的感受,此即“约定”。数千年以降,读书人若能轻易接受、沿用,即为“俗成”。历史上短暂出现的“死字”,皆系无法“俗成”而放弃者。

他分析了几个巨大的汉字字集,认为其中约六、七千个常用汉字都是由这样的“约定俗成”产生。这些字都有类似的组成逻辑,其中绝大多数可拆分为字首和字身,根据字首(常识分类)和字身(细部定义),就可以联想推理出汉字所表达的“主观思想概念”。而拆分到最后不能再拆的字形,即为最小的概念单位,也就是“汉字基因”中的“字义”因子。

据此,汉字学习极易,只要学习者掌握了正确的方法,对常识加以联想,就可以“触类旁通”而无须“强迫记忆”。而所谓“正确”,即符合“约定俗成之规律”,并且能正确解释古今用法的字义。要正确地学习汉字,应先习会独体字(含字首及字身),次学组合字。此两者总共约七百余字,却可组合常用之六、七千字。也就是说,只要熟识了七百个字形,即可掌握常用汉字八成的认知。

但同时他也发现,六万字的字集中,仍有约九成的汉字无法用汉字基因理论解释,这些字大部份是名称用字,是“纯粹的形声字”,这种字的创造与理解无干,只能视为一个符号,自然也无法用汉字基因理论解释;其他如“古用字”、“异体字”、“错讹字”亦同。学习这类“符号”的唯一方法是死记硬背,就像大部分无法拆解的英文单字一样。

字义解释

这本书除理论以外,并以常见的字身为纲,用统一的方式解释许多类似字的字义,例如:

生 指事,会意-甲骨文

草木长出,活著,起始,不熟。人称。

与〔日〕组合为〔星〕

日所生者,万物之精也,在夜空为发光的天体。

与〔金〕组合为〔鉎〕

金所生,铁衣,锈也。

与〔水〕组合为〔泩〕

水生,水涨也。

与〔竹〕组合为〔笙〕

竹生,管可生音的吹奏乐器。

与〔心〕组合为〔性〕

人所认知之起始,事物之本质。

与〔女〕组合为〔姓〕

古代从母称姓,从男称氏,家族的代表也。

与〔贝〕组合为〔貹〕

财生,财富也。

与〔生〕组合为〔甡〕

生之再生,众多状。

与〔牛〕组合为〔牲〕

牛之生,家中生养的动物。

与〔更〕组合为〔苏〕

再生,死而复活。

与〔文厂〕组合为〔产〕

因文明而生、有价值之物品﹔制造,出生。

朱邦复认为很多当今所谓的形声字,其“声部”亦代表了一定的概念,因此实际上是“形意字”(形声兼会意字),并据此解释字义,与主流的文字学解释不同。

汉字基因-字首和字身

电脑思考中文

字首和字身是朱邦复之汉字基因理论的一部分,他把这个 概念实践在他开发的苍颉系统上。字首:多半为字义的概略分类。

字身:一个汉字去除字首以外的部分,称之。多半为字义的细部定义。

整体字(独体字):凡不可分割为字首和字身的汉字,称之。仓颉输入法的规则亦称之“连体字”。

组合字:可分割为字首和字身的汉字,称之。仓颉输入法的规则亦称之“分体字”。

汉字基因理论与字首:朱邦复认为,汉字的创造和其字义的由来,主要系“约定俗成”,即“视讯之图形基因供约定,而由使用者是否易于接受为俗成”。由于人类的感官类似,因此对同样的视觉图像能产生类似的感受,此即“约定”。数千年以降,读书人若能轻易接受、沿用,即为“俗成”。历史上短暂出现的“死字”,皆系无法“俗成”而放弃者。

他分析了几个巨大的汉字字集,认为其中约六、七千个常用汉字都是由这样的“约定俗成”产生。这些字都有类似的组成逻辑,其中绝大多数可拆分为字首和字身,将字首(常识分类)和字身(细部定义),就可以联想推理出汉字所表达的“主观思想概念”。而拆分到最后不能再拆的字形,即为最小的概念单位,也就是“汉字基因”中的“字义”因子。

据此,汉字学习极易,只要学习者掌握了正确的方法,对常识加以联想,就可以“触类旁通”而无须“强迫记忆”。而所谓“正确”,即符合“约定俗成之规律”,并且能正确解释古今用法的字义。

要正确地学习汉字,应先习会独体字(含字首及字身),次学组合字。此两者总共约七百余字,却可组合常用之六、七千字。也就是说,只要熟识了七百个字形,即可掌握常用汉字八成的认知。

但同时他也发现,六万字的字集中,仍有约九成的汉字无法用汉字基因理论解释,这些字大部份是名称用字,是“纯粹的形声字”,这种字的创造与理解无干,只能视为一个符号,自然也无法用汉字基因理论解释。

视窗合作破裂

汉字的组成形式:

一、同字组合:同字代表同一概念,重复使用时,会因位置不同,产生迥异之感受。

平行排列,以示数量多况:

木+木═林 木多成群者。

石+石═砳 石多成声者。

相反排列,以示相反状:

非-相背之形,鸟翼形。

上下堆砌,以示盛大、成熟之况:

日+日═昌 大盛(或指下面曰字)。

火+火═炎 火盛。金字塔排列,以示人之感受状:

木+木+木═森,多树之感受,指荫凉感。二、字首在上:

原形在上:指事物之正常态,由上而下者。

日+比═昆 日下比列而排,众多,咸同。

向上生长:指生态或有动力使向上者。

艸+牙═芽 草木芽形之苗,事物之初。

包含状况:有全包、半包、侧盖等,代表限制。

囗+或═国 限于土地,有人民、主权、需持戈守域者。

后人误解,为简化而更为复杂者:

山+夆═峰 象征实况,山尖在顶,今人以之为“异体字”或无此字。

山+夆═峰 象征分类,山有夆者。

中文编辑公用程式说明

三、字首在下:

现实本况:理应在下者。

执+土═垫 持土而衬,土在下面。

分+山═岔 山分有歧,三分路。

表示正在发生者,如心之当前状况:

刍+心═急 事及于心,迫切也,快速也。

今+心═念 此刻之心,想也﹔又读书出声也。

承载状况:代表动态。

走+召═超 唤乃因于距离高远,走而召,行走高过也。

四、字首在左:常态分类,左为类右为别。分类组合:

心+亡═忙 心之亡失,事情繁多没有空闲。

心+青═情 心的本性,人的欲望、感受。

同类组合:

日+月═明 日月皆有光,可见可知,引申为下一个可知者。

女+子═好 有子有女,完美也,正面有价值的感受、认知,喜欢。

五、字首在右:如力刀反斤鸟欠殳邑等(除鸟外,皆与行为有关)

且+力═助 且出力,辅佐,帮忙。

车+斤═斩 车被截,砍断。

字首的切分规律:

字首和字身的切分方法大略如下:

指示字的主干为字首,附加部分为字身。如“本”,“木”为字首,“一”为字身。

形声字的形符为字首,声符为字身。如“楣”,“木”为字首,“眉”为字身。

会意字中概念分类的部分为字首,细部定义的部分为字身。如“信”,“人”为字首,“言”为字身。

仓颉输入法的字首和字身:《汉字基因字典》和《字易》在探讨字义时,用的是“字义”因子,而仓颉输入法取出的是“字码”因子,二者不完全相同。仓颉输入法对汉字的切割规则是依据汉字基因理论设计,因此对大部分的汉字而言,仓颉输入法取出的字首与“字义”分析的字首相同。但为了视觉辨识的方便,以及为了提高编码的效率和分辨率,仓颉输入法对某些字的取码规定便与字义分析的结果不同。

其中最大的特点是,仓颉输入法规定取字的最左、最上或最外的部分为字首。部首在右的字,如【头】,依汉字基因理论,字首为〔页〕;但仓颉输入法取出的字首是〔豆〕。

有些字甚至连切割部分都有根本的不同,如【条】,依字义分析,字首为〔木〕,字身为〔攸〕;但仓颉输入法取出的字首是〔亻〕,字身为[丨夊木]。

有些字在字义上是组合字,但字形上是连体字,如【舌】,依字义分析,字首为〔干〕,字身为〔口〕;但仓颉输入法视为无法分割的连体字[舌]。

有些字在字义上是独体字,但字形上是组合字,如【兆】,依字义分析,为无法分割的独体字;但仓颉输入法可分出字首“中一”和字身“山人”。

汉字基因字典

汉字基因字典《汉字基因字典》是朱邦复按汉字基因理论

编纂的一部字典,特点是以汉字的字首字身解释字义,去除后来的“错讹字义”,达到“正本溯源”的目的。他认为,汉字是世界独有的概念文字,其中蕴涵的微言大义,是古人思维的结晶,数千年来行文乃至思考的根本,因此古文能够言简意赅,含意深远。但由于白话文运动鼓吹以“词”取代“字”,现在的辞典仅解释词义而不谈及该词义的由来;而现代的字典则多以词为基准,将汉字分成一条一条解释,违反汉字本质,令汉字看似费解且难以学习。汉字“本义”被人忘却,现代人中文水平低落,正因不能辨明字义所致。为了揭示字义,消除现今辞典的弊病,故此编写这部字典。

这部字典仅取汉字的“本义”,参照《康熙字典》和《形音义综合大字典》,并根据汉字基因理论,把组合字分为字首、字身解释,字首为常识分类,字身为细部定义。从字首字身的“体用”关系联想来说明字义。再按“体用因果”组合为词,均以汉字的本义解释。如此每个字、词不再是一条一条独立的解释,而是由一个简短的概念延伸、演化而来,有源有本。

这样的编写方式是因每个汉字都表示一概念,词则是把概念加以组合联想而来。以字首字身解释汉字本义,能加深了解其中的概念,阐明汉字的微言大义。也说明只需明了字首字身和组合规律,就能掌握汉字理解的要诀,证明汉字的合理易学,是简化字和其他文字所比不上的。

汉字排序采用第五代仓颉码,是汉字基因中的“字序”因子。

这部字典由朱邦复独力编写,尚未出版。他把初稿放在其网站作参考用,收六千多字。

仓颉系统

仓颉系统仓颉系统是朱邦复先生及沈红莲女士根据“汉字基因”理论设计的电脑系统,目的是解决汉字在数位化、资讯化上的一切困难,如缺字、编码、储存、排序、输入。将其进一步发展,仓颉系统还可做到汉字理解(理解系统),以及将文字转为动画(图文系统)等功能。

仓颉系统方案:朱邦复先生在发展仓颉输入法时,原意是要发展“中文检字法”,使汉字具有“序位观念”,使中文能像拼音文字一般,用少数字母找到所有汉字。仓颉输入法的26个字码“日月金木水火土…止卜”,其实正如同拉丁字母的26个字母“ABCDE…XYZ”、日本语的五十音序等,是有序的排列,可用于检索汉字,是以称作“仓颉字母”。

事后他进一步扩充系统,提出汉字基因理论。由于字根都依汉字形声字特性分析得来,故若在电脑上运用这套方法,将有以下六大用途:

1.字码:仓颉码可用于汉字之输入,即仓颉输入法。

2.字序:仓颉码有一定的排序规律,汉字也可如同英语般快速地排序、查询、检索。

3.字形:将仓颉码输入“向量字形产生器”后,可组合成汉字,显示于电脑屏幕或用于打印。

4.字辨:把扫描所得的汉字点阵资料输入,转换为向量,分析其中的仓颉字根,可得出仓颉码。这种由“形”得“码”的过程就是文字辨识。

5.字音:大部分的汉字具有形声的特质,因此将输入的仓颉码的字身分析出来,通常可代表该汉字的声部,即读音,可用于语音辨识。(但实务上,很多汉字发音已变,须另外处理。)

6.字义:由“仓颉码”可分析出字首和字身,能够透过程式组合出汉字字义,可供电脑“理解”人类常识,甚至和人类沟通。

仓颉系统即是将上列六大要素综合考虑而发展出的电脑系统。

批评

汉字基因由于朱邦复不是专业的语文研究者,有人认为他提出的“汉字基因”理论只是“拆字”,不是“释字”。其中有些内容符合汉字学的原理,但有更多不符合汉语的发展和规律。因此运用朱邦复的“汉字基因字典”必须十分谨慎,阅读常带批判角度,用以启发思考不妨,但是不能作为教学和研究的基础。

其中,“汉字基因字典”的一大特色是把大多数的汉字视作表意字,即象形、指事或会意,特别是把很多简单形声字都看成会意。有人认为,这样“把汉字看成与词汇无关的直接表达概念的符号”,是完全错误的汉字观念,是一种附会和向壁虚构

随便看

 

百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。

 

Copyright © 2004-2023 Cnenc.net All Rights Reserved
更新时间:2025/3/1 16:27:51