2.1 智能体的感知
2.1.1 感知的要求与定义
智能体面对一帧图片、一段声纹、一段文字(见图2.1)等来自外部的信息,需要通过感知来接收、转换、组合、判断,并通过描述功能成为智能体记忆、理解和使用的材料。智能体通过感知器接收图片的光信号、声纹的波长、字符串特征,通过前置的通道和不同的传感器,依据规则和经验,对接收到的信号或符号进行标注、组合,辨别出智能体当前能理解的部分,如路、车、树、语音、词或词组、句子等,并根据感知的结果,分别将接收到的内容传送到描述区或感知存储区。
智能体将来自感知通道的所有内容,按照规则和感知器的特点,分门别类,逐一感知,直到对所有的信号或符号做出能否感知、能否完整感知的判断,将结果做出相应的处置,并完成感知器经验值的调整,这就是感知功能的基本要求。
图2.1 感知对象示例[1]
根据上述对智能体感知的要求,本书给出定义:智能体感知是指一个智能体在整个生命周期对所有来自外部世界的信号或符号通过接收、转换、标注、组合、判断、处置,传送到对应的描述微处理器的过程。这个过程的意义就在于它所感知的所有对象,经由描述微处理器转换之后,就可以成为智能体可理解、可积累、可利用的记忆。这个过程也隐含了不能转换为智能体可理解、可利用的不感知对象。
定义中的信号泛指所有来自外部环境、智能体可以感知的物理性刺激,它们都被称为物理信号或信号,如温度、压力、光、声波等;由这些物理信号显示的状态、场景、事件,以及被转换为模拟信号的对象,如照片、记录音视频的磁带等归属为感知对象中的信号系列。定义中的符号是指智能体接收到的所有数字化信息,特指由0和1构成的电磁信号,如来自已经连接的信息系统或网络的一篇文章、一段音乐或视频。智能体感知经由数字化的信息系统或网络传输过来的信息统称为数字符号或符号。感知的定义强调了感知对外部信息范畴的全覆盖,无论是动态还是静态,主动还是被动,连续还是断续,系统还是片段,都属于感知的对象。
感知的定义强调了智能体感知只处理自身可描述、可理解、可利用的外部信号或符号,如果不能满足这个要求,则放弃或搁置。这样的设定基于从智能的角度对信息的理解。本质上,智能体对物理信号感知的是信息的载体,对数字符号感知的是信息的外壳,经感知过程转换之后的是可描述的含义。这也是感知与传感、模式识别或分类的不同。关于信息由载体、外壳和含义组成的三层结构的解释见参考文献[2]。将信息构成进行三层区分,并将智能体可理解、使用的含义作为感知的结果,是构建智能体的必要前提。
感知定义中的智能体是指一个具有控制自身全部行为能力的非生物智能体,强调了感知是由智能体控制的一类行为。定义中的智能体生命周期是指一个智能体从设计开发到终止的全过程。定义中的接收是指外部信号或符号进入智能体的感知器。接收过程的重点是将来自外部的信号或符号进行区分,逐一归到智能体可以理解、操纵、使用的类别中。定义中的转换是指智能体将接收到的物理信号或数字符号转换为智能体可以理解和使用的含义的过程。定义中的标注是指智能体感知器对转换过的对象按规则添加智能体可理解和处理的标识。定义中的组合是指智能体感知器对标注好的对象根据该感知器的经验将智能体能辨识的部分组合成一个个可描述的客体。定义中的判断是指对感知对象结果进行分类并按不同类型予以相应处置的过程。根据对感知对象的感知结果的判断,有三种处置模式:放弃、保存及输送到描述区。
感知也可以如下形式定义:
式(2.1)表达的是,任何智能体的感知对象a必须经由感知通道和感知器进行识别,被识别的内容经过描述(D)进入记忆(M),否则放弃或暂时保留。感知通道和感知器是外部信息进入智能体的唯一途径,而且这个过程是由智能体控制的。
智能体感知不包含智能体内部的感知,如智能体生存系统及工作系统的状态感知。尽管这些感知中有部分与外部的感知有相同的机理及功能构成,需要调用感知功能系统中的相应功能组件,但主导者已经不是感知功能系统,而是智能体的生存和意识思维控制等功能系统。
作为工程目标的智能体的感知,必须做到过程可控制、技术可实现、目标可达成。过程可控制是指感知的所有过程不仅处于智能体控制下,还要求如果出现不能控制、不能操纵、超出智能体当时能力的感知过程,那么智能体应该具备放弃、不予处置的能力。这个要求也隐含了智能体的感知功能是一个随着智能体的成长而成长、完善的过程。技术可实现是指所有的感知过程处理只采用已经存在且智能体已经拥有并可使用的技术。目标可达成是指所有感知过程需要取得的最终结果都是可控、可实现的。
感知功能由机械功能模块和逻辑功能模块组成。机械功能模块具有将物理信号和数字符号接收和传输的功能;逻辑功能模块具有将物理信号和数字符号进行转换、调整和反馈的功能。感知器是感知功能的主要承担者,通常既有机械功能,又有逻辑功能。
智能体感知不是模式识别。必要时,利用模式识别的工具或算法将保存在感知存储区内的内容恰当归类是智能体的学习功能。感知的判断全部基于相应感知功能系统预置及积累的经验,依据不同的阈值做出如何处置的判断。判断的规则与阈值以一个感知微处理器为单位,并在感知的过程中持续调整、提升。
智能体感知不是信息系统的输入,而是感知对象载体或外壳的转换及其内在含义的提取,使获取的内容转化为智能体可操纵的符号体系,以及智能体可理解、利用的含义。
2.1.2 感知的对象、类型与来源
智能体感知的对象由两大类构成:物理信号和逻辑符号。依据感知过程及所需感知功能的不同,可以进一步细化感知的对象。物理信号感知对象的类型,包括:光波、声波、压力、味道、温度、速度,物理或化学、生物成分,状态、场景、事件等。状态、成分、场景、事件在这里都是泛指。逻辑符号感知对象的类型可分为模拟的和数字的。若讨论逻辑符号中包含的内容则涵盖了物理信号的所有类别。
从感知处理的特征和目的看,感知的对象可以分为表2.1中所列的八类。这个分类兼顾了信号类型与感知目的。音、视频属于逻辑符号范畴,而其他六类均兼具物理信号和逻辑符号的存在方式。区分这六类是服务于感知的目的,识别什么、为什么识别。
表2.1 感知对象大类列举
注:物体是指场景中的存在物;事件是指场景中进行的有关联的活动;场景不包含自动化系统、物联系统等状态量已被相应系统处理的情形,这些感知在状态变量识别中
感知类型还可以按感知器进行分类。传感器有多种分类标准。按工作机理,可分为结构型、物性型、复合型和智能型;按被检测量,可分为物理变量、化学变量、生物变量;按制造材料,可分为半导体传感器、单晶体传感器、陶瓷传感器、薄膜传感器、光纤传感器、高分子材料传感器、生化酶传感器等[2]。
从感知内容的颗粒度看,感知对象至少需要分为三层:单点、可描述客体、整体。
单点是指一个智能体相对于特定感知功能的感知器的最小可感知单位。例如,符号的一个0或1,信号的一条光束、一段声波。光束、声波的范围、长度,依赖于感知器的功能。
可描述客体是指在一个描述对象体中需要或可以用作独立观察、认知对象的一个感知单点集合。可描述客体本身具有不同的粒度。如一张人物相片,可描述对象可以是相片中关于人的全部,可以只是脸部或眼睛、眼睫毛、眼珠、眼袋等部分。可描述对象的粒度基于智能体识别的目的和能力。如图2.1所示,图中可以分辨出成百上千的可描述客体,若非作为教育分析等特殊用途,智能体只分辨学习和行为所需的可描述客体。例如,要分析机动车违规,只需要对机动车是否违规的要素区分,如静态的车道、动态的车速。
感知对象整体包括静态整体和动态整体。静态整体是指时间上独立的一帧信号或自然隔断的一组符号。动态整体相对于信号是指一个时间序列构成的可独立场景或事件,相对于符号则是一串完整的输入集合。动态整体是一组静态整体的集合。视频的一帧、音频的一段、被分割的一串符号是静态整体,一个连续音/视频、一个独立文本是动态整体。
感知对象的来源主要有两类:一是智能体的传感设施可触及的环境,包括由智能体控制的、传感设施可以移动或连接的来源,以及与智能体并非处于同一空间、地域的对象;二是智能体可连接、可利用的网络信息,包括互联网及其他信息系统或网络。
2.1.3 感知功能的构成及与智能体其他部分的关系
在2.1.1节中,已经介绍了智能体感知的功能要求,本节讨论实现这些功能要求的基本模块及其与智能体其他部分的关系。
图2.2是实现智能体感知要求的功能划分,由三条通道、六个功能模块构成。三条通道是感知通道、控制通道、成长通道。感知通道是智能体所能管理和控制的信息输入通道。控制通道承担智能体对感知功能的完全控制,主要包括感知过程对智能体其他资源的调用,感知功能系统与其他系统的协调,不同感知系统之间超越感知功能相互协调的部分,输入环境的协调,成长通道的控制和协调。成长通道承担感知功能系统自身及智能体其他相关功能系统的处理过程中所有对其成长相关信息的反馈及处置,涉及所有感知功能模块的成长。六个功能模块分别是输入分类、转换、标识、分类、后处理、输出,这些模块承担的任务及实现将在2.2节进行介绍。
图2.2 智能体感知功能构成
感知是智能体各项功能形成和发展的起点。如图2.3所示,感知功能体系与其他功能体系之间存在大量的联系,其中最重要的是与下列10个功能体系的关系。
图2.3 感知功能体系在智能体架构中的位置
图2.3列举的是通用智能体必须具备的11个功能体系。感知功能体系与另外10个功能体系存在不同程度的双向关系。
感知功能体系与交互功能体系存在功能相互调用和信息交互的关系。感知通道也可以用作交互功能体系的外部连接通道,交互功能的相关结果可以成为感知功能体系的规则和背景知识提升的一种来源。
感知功能体系接受智能体控制功能体系的管理。除属于感知功能体系一部分的连接、感知结果的处置等功能外,其他所有与智能体功能体系之间功能的协同均通过控制系统的管理功能。
感知功能体系使用连接功能体系的功能,感知功能拥有的连接是连接功能体系的组成部分,接受两个功能体系的双重管理。感知功能体系内部的连接以自己管理为主,与外部共用的连接以连接功能体系的管理为主。
感知功能体系的结果是描述功能体系的一个起点,但不是唯一起点,描述功能体系还要完成来自学习、任务、管理等功能体系的描述要求。描述功能体系的结果是感知功能体系完善、提升的重要来源。
感知功能体系的结果是学习功能体系的重要来源。感知存储器是学习的重要材料来源。经由连接到达记忆区域的感知—描述的结果成为学习功能体系的处置对象。学习功能体系与感知相关的成功是感知功能体系完善和提升的主要来源。
感知功能体系的处理能力是处理功能体系的组成部分,两个功能体系对此均有管理权。感知功能体系保持使用的管理权,处理功能体系保持处理功能提升的管理权。
感知功能体系与记忆功能体系的关系主要通过描述结果体现;与任务功能体系的关系主要是为任务功能体系执行任务提供感知相关的功能;与生存功能体系的关系主要是接受生存功能体系的管理和调整;与资源功能体系的关系主要是申请并获取满足功能需求的资源。
需要再次强调的是,智能体所有的功能体系是一个有管理、有控制的整体。
2.1.4 感知的基本准则
感知在智能体的构成和成长中居于基础的位置,没有感知就没有智能,感知要成为通用、可成长智能体形成和发展的起点。智能体感知功能要达到这样的要求,需要精心设计若干基本准则,主要有:含义形成并为后续与理解相关的要求奠定基础、渐进提升的能力、大规模并行及协同、可操作可容忍的歧义处理、跨时间和场景的参照及一致性等。
第一,含义和理解准则,也可称为目的性准则,即要求所有的感知是为了将感知对象转换为智能体能理解的含义,感知形成含义并为后续与理解相关的要求奠定基础。这是智能体感知的首要准则,其他准则都应满足这个要求,所有功能设计都必须遵循这个准则。含义和理解准则是指经由感知的信号或符号必须转换、组合为智能体可描述、可利用、可理解的含义,如果做不到这一点,感知功能体系可以选择放弃或留置,即保存于临时存储区域,而不能进入智能体的记忆及其他工作区域。
第二,自主准则,即感知的进程由智能体控制,即使在智能体形成早期的调试阶段,如果智能体无法识别、组合测试过程及测试数据集应立即停止,绝不接收任何不理解的信号或符号。智能体只有记忆,没有存储。
第三,成长准则,也可称为渐进提升准则,是指智能体的感知是一个长期的发展和完善过程,即感知是成长的。渐进提升包括功能渐进、模式渐进和结果渐进。功能渐进是指智能体感知的物理和逻辑功能,以及整体功能,如计算资源和执行的规则,都是渐进的,在整个生命周期可以持续增长。模式渐进是指智能体感知模式在智能体的生命周期可以持续增加或调整。结果渐进是指在感知过程中,以前感知、已经进入智能体记忆区域的结果可以被后续的感知结果调整、修改。
第四,穷尽准则,也可称为完备准则,就是对每个感知对象,要穷尽对象中的所有内在含义,使得每次感知趋近完备。在后面对不同感知执行过程中的后处理和反馈不厌其烦,不管是否重复的组合,都是这一准则的体现。
第五,可操作准则,即每个感知操作都是可执行的,所有不能操作的设想不应出现在一切感知流程中。
第六,容错准则,是指感知器针对存在歧义的单点感知或感知归类,采用可实现的简易操作处置,对感知的结果允许在使用或学习过程中发现差错。一般地,容错操作有三种方式:试错、容错和前馈式校对。试错是指在单点感知和组合时,若结果不能确认可否接受,则继续转到其他感知器或采用其他组合方式,直至没有可选的感知器或组合模式。容错是指智能体允许每个感知器及感知组合功能保留少量未经验证的感知结果,等待后续验证;保留什么、保留多少则根据已经存在的相关规则执行。前馈式校对是指每次感知结果经由后续的描述、记忆进程及智能体在学习和智能任务执行过程中相关内容的证实或证实结果梯次向前反馈,用作感知器及组合功能的参照。渐进准则隐含的一个规则是允许不完整,允许有错,在此后的发展中趋向完整,改正错误。
第七,大规模并行准则,是指智能体的感知不仅必然采取大规模并行的模式,还要保证并行的有效性,智能体不因大规模并行而失去控制或感知成果间的不一致。这里的“大规模”是指数量巨大,“并行”则有两层含义:一是不同功能和模式的感知并行进展;二是指具有相同功能或模式的感知也采取并行方式。采用大规模并行既是感知的需要,也是智能体以数量换时间,加快感知进度的结果。大规模并行达到什么规模,大体上感知器数量可能达到十亿或者更高的数量级。功能相同,但感知对象不同的,分设不同的感知微处理器;功能对象均相同,但感知对象众多的,可并行设立多个相同的感知器,但应该具有整合的功能。
第八,一致性准则,是指智能体应该能够对来自不同时间与/或场景的感知对象保持含义的一致性。这一准则的目的在于感知对象在含义上本来具有一致性,但在不同的时间被感知,如相同感知对象第一次没有恰当组合,感知器在提升经验之后又能够组合或形成新的组合,要保证前后的一致性。同样,相同的内容在不同的场景中出现,需要保证不同场景的一致性。这个准则是感知成长的基本要求。