2.4 数字符号的感知
来自外部的符号是智能体感知的主要渠道。这里的符号是指所有通过信息传输通道进入智能体传感区的电磁信号,或者说是已经完成图2.4所示的物理信号到电信号转换的信息外壳。由于大量的外部对象及人类积累的知识和经验已经数字化,无论是学习还是问题求解的需要,符号感知是智能体主要的信息来源。
在逻辑符号感知中,能还原为音、视频的,其感知即转送至物理信号感知通道,本节只讨论内容为非音、视频的逻辑符号感知。
2.4.1 符号感知的特点和一般处理原则
逻辑符号感知的基本要求与物理信号一致,就是把感知对象转换为智能体可理解、可使用的记忆。
将转换为音视频信号的部分排除之后,需要感知的逻辑符号构成可分为两大类:文本和图形。相对于物理信号的感知,这些感知对象识别的难度整体上要低一些,因为绝大部分的感知对象可以由近乎一一对应的感知器接收并识别,但其上下文及语义、场景的关系十分复杂,如何揭示好识别对象中存在的这些关系及为智能体知识的成长提供有效的环境,是符号识别的重点,也是特点。这就是说,符号感知系统的重心应是如何将已感知的基本单元按照感知对象的原意重新组合起来,而且这种组合有利于智能体其他功能系统的处理及智能体记忆的有效增长。
根据这样的要求和特点,符号感知处理应遵循下面的一般原则。
(1)最小单元。感知识别以最小语义单元和最小图形单元为起点。原则上,每个不同的文字或图形单元至少存在一个逻辑的感知器与之对应。
(2)优先次序。识别的组合采用不同的优先次序:文字组合,规则优先;图形组合,功能组优先。组合不仅以本次感知对象的上下文为基础,还要参考感知器或感知功能组的已有知识。
(3)前后衔接。识别过程要为后续的描述、连接、记忆功能系统创造条件;同样也以这些过程的成果为依据。
(4)呈现分类体系。应该有一组特殊的分类功能组,将组合好的内容归入感知对象的上下文没有直接表示出来的类别中。这里的类别是指文本或图形的学术、使用场景、艺术或情绪性等特征。
(5)不厌其烦。对感知对象所有可能的组合采用全组合原则,对于冗余或可能的不确定,由后续的功能系统,特别是描述、记忆、学习等环节去除、纠正。
2.4.2 符号感知的流程
符号感知的流程与物理信号感知的流程存在重大差别,其产生的原因是符号几乎不存在不能识别的,极小概率发生的不能识别也可以通过交互的方式解决,或者因此构建出一个感知器。
如图2.10所示,到达智能体感知区的符号串,首先经过转换与标识,即完成将感知对象转换为智能体专用的符号体系,并完成形式性标识,即完全标注感知对象的位置;然后传送到功能组识别区,如果能识别,则继续进行基于功能组的组合,一直到没有新的组合为止。在这一系列操作中,不能组合即转向感知器识别。由于符号感知微处理器囊括所有可能识别的文字或图形,所以一般不存在不能识别的字符,但存在还没有为特殊图形构建专门微处理器的可能,此时可以构建一个新的感知微处理器。在文本的上下文环境,新的感知微处理器可以将其转变为智能体可理解的含义表述。
图2.10 符号输入处理流程
感知微处理器的识别与组合流程与感知功能组一致。所有可能路径遍历之后,感知内容再次标识,将识别和组合过程需要记录的信息全部标识清楚,然后输出到智能体的描述区。当然,整个符号感知过程需要接收来自智能体其他部分经由后处理模块处理的调整型信息,并从入口开始循环,落实到应该调整的功能模块中执行。
在图2.10中,感知器是指感知微处理器,感知功能组及感知器的组合均依据其知识库中的知识进行识别。
2.4.3 典型例子分析
1.文本的识别
假设用于识别的文本为,“由,诲汝知之乎!知之为知之,不知为不知,是知也。”假设感知功能体系对象形文字全部采用单字为最小识别单元,拼音文字均以词为最小识别单元,即每个最小识别单元均有独立的感知微处理器。假设感知器已经从相关输入文本中知道这仅是一篇文献中的一段。假设主要中文词典的知识已经成为每个汉字感知器中知识库的内容。
感知的实施步骤如下。
感知文本从通道进入感知区计算域,以一种优化算法,使一个个汉字字符被感知微处理器接收,完成符号格式转换和形式性标识。这段文字一共被13个感知微处理器处理,其中最多的是“知”字微处理器,共接收6次。为优化处理,一般地,不同的语言按照字符出现的频率,对高频字符增加微处理器。假设有3个“知”字微处理器,则每个感知器接收两个“知”字,需要根据规则合并。合并的任务是将各自的上下文位置标识加到其他的同字符感知器中,相同字符的不同感知微处理器,其知识库始终是一致的,这是功能组及功能体系的常规功能。
标识之后,就进入感知微处理器的组合过程。文字的组合基于两套流程,首先是与自带的知识库中已有的词组、句子匹配。假定相对于感知对象,在“不”和合并后的“知”两者的知识库中均有“不知”这个词组,则再次确认组合,并以此为基础,根据感知器或功能组中存在的分词和组合规则,完成全部短文的切分与组合,并分别保存在每一个相关的感知器和感知功能组中。在经过多次重复,或经交互得到可以判断为可靠的确认后,这篇短文本身就组成一个字符功能体系中的逻辑功能组。
字符的感知本质在于丰富的知识库和细致的组合规则。字符感知这一子功能系统,在初始、赋予及训练学习阶段,用上述方式输入全部去除重复后的各类语言的字典、词典,以及在自然语言处理中积累起来的全部成熟的与词的组合与切分的规则。
在此基础上,上述短文感知的组合可能变得很简单。由于这篇短文是古汉语的名篇,已在大量的文献中出现,相应的感知微处理器中也已经保存了充分的知识,可以直接通过某个字符导出全部短文的组合模式(也称分词模式),以及这篇短文的出处、读音(多种语音,如古汉语读法)、现代文翻译(包括多种不同的理解)。因此,这次感知只需要再为这篇在逻辑上已经成为一个功能组的对象增加新的来源或新的应用场景标识即可。
2.图形的识别
图形可以分成两类。一类是以约定的方式,由具有特定含义的形状构成具有特定含义的图形,如公式、流程图、设计图。另一类是美术性图形,以写实、神似或抽象的方式表达客观存在或想象的事物、心境等。
在感知的分工中,第一类由符号识别区识别,第二类由信号感知区识别。两类图形的存在形态大部分是智能体可识别的符号模式;也有少数,包括少数文字,尽管是以0和1的方式保存,但是不可区分保存内容的图像,这种可以通过光学识别方式转换。在转换后的集合中,根据符号感知区的分类功能,将第二类图形转送至信号识别区感知。
图形的识别模式和流程与文字的识别类似。识别的基础是所有约定的图形均有专门的感知器,每个感知器所识别的图形在特定图形中的含义、在已经存在的不同类型图形中的含义均已包含在其知识库中。感知先从最基本单元开始,然后逐步组合,一旦组合成一个独立的图形,这个图形就构成了一个逻辑功能组,这个功能组的解释通过该图形的上下文与/或文本中关于该图形的相关描述形成。由此这些解释就成为这个功能组的知识库来源。智能体的相关功能体系不能确定的,通过交互方式增加确定性判断依据。
以图2.10为例,不同的感知器识别基本图形单元,每个矩形、菱形、直线和带不同方向箭头的线条分别被感知。图中文字可以通过光学识别后感知,也可以根据字符感知器知识库中的形状进行识别,将其识别为一个个词组,表示为相应图形的解释。
一幅图形,如果嵌套在文字中,有图的标号、图名,在上下文中对图的功能做了必要的解释,这些内容如何与字符识别一起组合,图形组合到文字的识别中,文字组合到图形的识别中,形成两个真实反映文本含义的逻辑组合,是符号感知区的重要功能。符号感知区含义组合的一个原则是最大组合。按照已经积累的文字、图形组合的经验而归纳出的规则,在一段包含图形的文字中,将其组合到最大,并将最大的组合发展为逻辑功能组,成为其中部分的理解指引,是感知功能体系和感知子功能体系的重要功能。