认知科学是研究人类感知和思维信息处理过程的科学,包括从感觉的输入到复杂问题求解,从人类个体到人类社会的智能活动,以及人类智能和机器智能的性质。认知科学是现代心理学、信息科学、神经科学、数学、科学语言学、人类学乃至自然哲学等学科交叉发展的结果。
认知科学的兴起和发展标志着对以人类为中心的认知和智能活动的研究已进入到新的阶段。认知科学的研究将使人类自我了解和自我控制,把人的知识和智能提高到空前未有的高度。生命现象错综复杂,许多问题还没有得到很好的说明,而能从中学习的内容也是大量的、多方面的。如何从中提炼出最重要的、关键性的问题和相应的技术,这是许多科学家长期来追求的目标。要解决人类在21世纪所面临的许多困难,诸如能源的大量需求、环境的污染、资源的耗竭、人口的膨胀等笛单靠现有的科学成就是很不够的。必须向生物学习,寻找新的科技发展的道路。
一、知觉信息的表达和处理
知觉信息的表达是知觉研究的基本问题,是研究其它各个层次认知过程的基础。 知觉过程是从那里开始的?外在物理世界的那些变量具有心理学的知觉意义? 作为知觉的计算模型计算的对象是什么?这些围绕知觉信息表达的问题是建立任何知觉和跟知觉有关的学说和理论模型, 无论是人类的还是计算机的,都必须首先回答的问题。知觉信息表达的研究可以有不同层次的问题, 包括诸如知觉组织的问题、知觉学习的问题、知觉动态记忆的问题、以及面孔识别的问题等。
将在计算理论层次、 脑的知识表达层次和计算机实现层次上, 把认知神经科学实验研究和计算机视觉研究结合起来,将对上述科学问题提出崭新的理论(或思想)和解决的方法。
二、学习提升智能
学习是基本的认知活动,是经验与知识的积累过程,也是对外部事物前后关联地把握和理解的过程,以便改善系统行为的性能。
学习的神经生物学基础是神经细胞之间的联系结构突触的可塑性变化, 已成为当代神经科学中一个十分活跃的研究领域。突触可塑性条件即在突触前纤维与相联的突后细胞同时兴奋时, 突触的连接加强。1949年,加拿大心理学家Hebb提出了Hebb学习规则,他设想在学习过程中有关的突触发生变化,导致突触连接的增强和传递效能的提高。Hebb学习规则成为连接学习的基础。神经网络是由具有适应性的简单单元组成的广泛并行互连的网络。Kohonen提出自组织映射网络。Haken根据协同形成结构,竞争促进发展的规律,将协同的非线性动力理论与神经网络有机结合, 提出了协同联想记忆网络。Amari提出用微分流形和统计推理来研究神经网络。 在Amari理论的基础上史忠植等提出了一种神经场模型,由场组织模型和场效应模型构成。
感知学习是发生在感知水平上的学习,主要研究如何从低级的传感器输入的原始数据获取相关的抽象数据。感知学习主要考虑通过视觉和听觉的学习,研究从非结构与半结构信息到结构信息变换方法,研究图像的语义描述及其快速提取技术,研究感知学习中的注意机制与元认知等。
认知学习理论认为在人的行为背后都有一个相应的思维过程,行为的变化是可观察的,并且通过行为的变化也可以推断出学习者内心的活动。在认知学习理论中,如Ausubel提出的有意义学习理论(又称同化理论),其核心思想是获得新信息主要取决于认知结构中已有的有关观念;意义学习是通过新信息与学习者认知结构中已有的概念相互作用才得以发生;由于这种相互作用的结果,导致了新旧知识意义的同化。Gagne提出的信息加工学习理论则将学习过程类比成计算机的信息加工过程,学习结构由感受登记器、短时记忆、长时记忆、控制器、输出系统组成,认知过程可分为选择性接收、监控、调节、复述、重构。在这个信息加工过程中,非常关键部分是执行控制和期望。执行控制是指已有的学习经验对当前学习过程的影响,期望是指动机系统对学习过程的影响,整个学习过程都是在这两个部分的作用下进行的。
内省学习是一种自我反思、自我观察、自我认识的学习过程。在领域知识和范例库的支持下,系统能够自动进行机器学习算法的选择和规划,更好进行海量信息的知识发现。
内隐学习就是无意识获得刺激环境复杂知识的过程。在内隐学习中,人们并没有意识到或者陈述出控制他们行为的规则是什么,但却学会了这种规则。在80年代中期之后,内隐学习成了心理学界、尤其是学习和认知心理领域最热门和最受关注的课题,成了将对认知心理学的发展产生深远影响的最重要课题之一。内隐学习具有以下三个特点:
内隐知识能自动地产生,无需有意识地去发现任务操作的外显规则;
内隐学习具有概括性,很容易概括到不同的符号集合;
内隐学习具有无意识性,内隐获得的知识一般不能用语言系统表达出来。
三、语言开启智能之门
人类进化过程中,语言的使用使大脑两半球功能分化。语言半球的出现使人类明显有别于其他灵长类。一些研究表明,人脑左半球同串行的、时序的、逻辑分析的信息处理有关,而右半脑同并行的、形象的、非时序的信息处理有关。
语言是以语音为外壳、以词汇为材料、以语法为规则而构成的体系。语言通常分为口语和文字两类。口语的表现形式为声音,文字的表现形式为形象。口语远较文字古老,个人学习语言也是先学口语,后学文字。
语言是最复杂、最有系统、而应用又最广的符号系统。语言符号不仅表示具体的事物、状态或动作,而且也表示抽象的概念。汉语以其独特的词法和句法体系、文字系统和语音声调系统而显著区别于印欧语言,具有音、形、义紧密结合的独特风格。概念是反映事物的特有属性的思维形态,概念与语词有密切的联系。概念的产生和存在,必须依附于语词。语词所以能够表示其它事物,就是由于人们头脑中有相应的概念。所以,语词是概念的语言形式,概念是语词的思想内容。
从神经、认知和计算三个层次上研究汉语,给予我们开启智能之门极好的机遇。汉语的认知心理学研究已有多年历史,取得了世界一流的研究成果。但这些研究多侧重于汉字与词汇,对更高层次的句法和语句加工尚需深入探讨。对整个言语链的研究还不够系统,特别是对脑的语言加工机制知之不多。在智能系统领域,我国对汉语计算机信息处理极为重视,曾投入大量资金,支持计算语言学、机器翻译和自然语言理解系统的研究和开发,取得了一大批重要成果。但就整体而言,语言信息的智能处理存在许多悬而未决的问题,其解决必须需要以认知科学的研究为基础,以新的理论为指导才有可能取得突破。
1991年Mayeux 和Kandel在Wernicke-Geschwind模型基础上提出新的语言信息处理模型。听觉输入的语言信息由听皮层传至角回,然后至Wernicke区,再传到Broca区。视觉输入的语言信息直接从视觉联合皮层传至Broca区。对一个词的视知觉与听知觉是由感觉模式不同的通路相互独立地处理的。这些通路各自独立地到达Broca区,以及与语言含义和语言表达相关的更高级区域。大脑中语言处理通路的每一步工作机理都有待深入研究。
用数学方法研究语言,寻找语言结构的形式、模型和公式,使语言的语法规则能象数学符号和公式一样具有系统化、形式化的特点,可以用来生成无限的句子。美国著名语言学家Chomsky于1956提出了语言的形式文法,为语言信息处理建立了理论基础。 1996年,Yip和Sussman提出在语音学规则中使用双向约束传播机理,可以解释神经水平的听觉信号怎样对应思维层次的符号。
四、工作记忆蕴藏智能的玄机
记忆是人脑对过去经验中发生过的事物的反映,是新获得行为的保持。由于记忆,人才能保持过去的反映,使当前的反映在以前反映的基础上进行,使反映更全面、更深入。也就是有了记忆,人才能积累经验,扩大经验。
人类记忆有三种类型:感觉记忆、短时记忆和长时记忆。刺激作用停止后,它的影响并不立刻消失,可以形成后象。视觉后象最为明显。后象可以说是最直接、最原始的记忆。后象只能存在很短的时问,如最鲜明的视觉后象也不过持续几十秒钟,这就是感觉记忆。短时记亿的时间间隔比感觉记忆的要长些。但是,存储材料的时间也只有一分钟左右,或者甚至更短些。长时记忆是指保持时间在一分钟以上信息存储。人类的记忆可以分为过程记忆和命题记忆。过程记忆是保持有关操作的技能,主要由知觉运动技能和认知技能组成。命题记忆是存储用符号表示的知识,反映事物的实质。命题记忆更进一步分为情景记忆和语义记忆。前者是存储个人发生的事件和经验的记忆形式。后者是存储个人理解的事件的本质的知识,即记忆关于世界的知识。
1974年,Baddeley和Hitch在模拟短时记忆障碍的实验基础上提出了工作记忆的三系统概念,用“工作记忆”代替了原来“短时记忆”的概念。Baddeley认为工作记忆指的是一种系统,它为复杂的任务比如言语理解、学习和推理等提供临时的储存空间和加工时所必需的信息,工作记忆系统能同时储存和加工信息,这和短时记忆概念仅强调储存功能是不同的。工作记忆分成三个子成分,分别是中枢执行系统、视空初步加工系统和语音环路。大量行为研究和神经心理学上的许多证据表明了三个子成分的存在,有关工作记忆的结构和作用形式的认识也在不断地丰富和完善。人们发现工作记忆与语言理解能力、注意及推理等联系紧密,工作记忆蕴藏智能的玄机。
五、注意是智能的开关
50年代中期以来,随着认知心理学的兴起,人们重新认识注意在人类大脑信息加工中的重要性,提出了若干注意模型。其中有代表性的是注意的过滤模型和衰减模型,它们属于知觉选择模型。这两种模型把注意机制定位于信息加工的知觉阶段,在识别之前实现信息选择。与知觉选择模型形成对照的是反应选择模型,它认为注意的作用不是选择刺激,而是选择对刺激的反应。该模型认为,所有的信息都可以进入高级处理阶段,但只有最重要的信息才会引起中枢系统的反应。这两类模型的侧重点不同,知觉选择模型强调集中注意,而反应选择模型则注重分配注意。两者争论的焦点是注意机制在信息加工中的位置。注意的中枢能量模型就是在这一背景下产生的。该模型的理论基础是信息系统的有限加工能力。它避开了注意机制在信息加工中的位置这个难题,使知觉选择模型和反应选择模型的实验结果在形式上得到了统一;但缺点是没有揭示注意所涉及的信息加工过程。
随着脑成像技术和神经生理研究的迅速发展,使得把注意网络从其他信息处理系统中分离出来的努力成为现实。利用正电子断层扫描(PET)和功能磁共振成像(fMRI)技术,可以较精确地测量在完成特定的注意任务时大脑各区域脑血流的变化(rCBF),从而确定各个注意子网络的功能结构和解剖定位。 80年代初期,Treisman提出的特征整合模型把注意和知觉加工的内部过程紧密地结合起来,并用“聚光灯”形象地比喻注意的空间选择性。根据这一模型,视觉处理过程被分为两个相互联系的阶段,即预注意和集中注意阶段。前者对视觉刺激的颜色、朝向和运动等简单特征进行快速、自动的并行加工,各种特征在大脑内被分别编码,产生相应的“特征地图”。特征地图中的各个特征构成预注意的表象。预注意加工是一个“自下而上”的信息处理过程,并不需要集中注意。特征地图中的各个特征在位置上是不确定的,要获得物体知觉就需要依靠集中注意,通过“聚光灯”对“位置地图”进行扫描,把属于被搜索目标的各个特征有机地整合在一起,实现特征的动态组装。1989年, Gray指出集中注意可以引起与被注意事件相关的神经元的同步发放,同步发放通常表现为40周左右的同步振荡。这一发现为注意的特征整合模型提供了神经生理证据。
根据已有的研究结果,Posner把注意网络分为三个子系统:前注意系统、后注意系统和警觉系统。前注意系统主要涉及额叶皮层、前扣带回和基底神经节。后注意系统主要包括上顶皮层、丘脑枕核和上丘。警觉系统则主要涉及位于大脑右侧额叶区的蓝斑去甲肾上腺素到皮层的输入。这三个子系统的功能可以分别概括为定向控制、指导搜索和保持警觉。
六、意识是智能的控制中枢
意识也许是人类大脑最大的奥秘和最高的成就之一。自1879年现代心理学建立以来,意识就成为心理学的主要研究对象。 James认为,心理学是研究意识的科学。但由于方法问题,不可能对意识进行具体的科学研究。 20世纪20年代兴起的行为主义心理学,不承认意识的存在。50年代出现的认知心理学重新提出意识问题,并且从知觉和觉知入手研究意识。对知觉的研究已取得较大的进展,但目前对觉知及其它问题的研究仍处于初步阶段。
对意识给予统一、确切的科学定义在当前是十分困难的。不同的领域,对意识的理解也是不同的。诺贝尔奖获得者Crick认为,意识所涉及的是注意和短时记忆相结合的神经机制,可以用科学的方法去研究[4]。Crick关于意识的惊人假设和通过视觉注意和短时记忆研究视觉意识的具体建议,引起了大批认知心理学家、神经科学家和计算神经科学家的广泛兴趣。
80年代末90年代初在视觉生理研究方面有一个重大的发现:从不同的神经元的发放中记录到同步振荡现象,这种大约40Hz的同步振荡现象被认为是联系不同图像特征之间的神经讯号。 Crick和Koch提出视觉注意的40Hz振荡的模型。并推测神经元的40Hz同步振荡可能是视觉中不同特征进行“捆绑”的一种形式。至于“自由意志”,Crick认为它与意识有关,牵涉到行为和计划的执行。
另一位诺贝尔奖获得者Eccles,热衷于意识问题的研究。他与哲学家Popper合著的“自我与大脑”一书中,发表了“三个世界”的哲学观点。认为世界1包括所有物质世界(大脑也在内),世界2包括人的精神世界,世界3包括人的社会、语言、科学、文化等活动。他后期的著作中,根据神经系统的结构和功能,提出“树突子”(dendron)的假设,树突子是神经系统的基本结构和功能单元,由100 个左右顶部树突构成。估计在人脑中有40万个树突子。他进而又提出“心理子”(Psychon)的假设,世界2的心理子与世界1的树突子相对应。由于树突中的微结构与量子尺度相近,所以量子物理有可能用于意识问题。
意识是一个复杂的问题,应该找一个切入点,并且结合当前可用的技术手段进一步深入地研究。研究意识可以将觉知(awareness)和非觉知作为切入点,找到神经相关物在脑活动中的区别。
实际上还有一个情感系统,近年来呈现活跃的研究态势。免疫系统与智能也有密切的关系,限于篇幅,这里就不展开讨论了。