多宝视

中山大学脑与认知实验室丁玉陇教授谈知觉学习

2014-01-23 10:59:24
这篇文章我们将转载中山大学脑与认知实验室丁玉陇教授关于知觉学习的一些见解,与大家分享!

一、什么是知觉学习?

通过反复训练可以使我们对许多任务的能力显著提高,这是学习的一般含义。本文所要讨论的知觉学习(perceptual learning)是学习研究的一个新兴领域。

一般来说,知觉学习指的是知觉能力随着训练而变化(大多为增强,也有减弱的情况)的现象(Karni, 1997; Goldstone, 1998)。 Gibson(1963)最早给出了一个比较确切的定义,即,凡是由于训练或经验某种刺激而引起的对于这种刺激的长期而稳定的知觉改变都可以认为是知觉学习(“Any relatively permanent and consistent change in the perception of a stimulus array following practice or experience with this array will be considered perceptual learning”)。

从以上定义,我们可以看出,知觉学习与其它各种形式的学习一样,都是依赖于外界环境或经验的,而非由内部基因所决定的。在这点上,知觉学习不同于发育(development)和成熟(maturation)。

知觉学习如何区分于其它形式的学习呢?在目前阶段,知觉学习一般被认为是一种内隐性学习(implicit learning),是相对独立于意识经验而存在的,因此,它不同于可以表述的外显性学习(explicit learning),而与运动学习(motion learning)相似:两者似乎都是在任务处理过程中直接改变神经通路的活动,并不需要一种立即的巩固存储(例如海马)。然而,两者还是有区别,知觉学习被认为发生在大脑皮质(cortex),而运动学习是在小脑纹状体(striatum)发生的。与其它内隐性学习,如适应(adaptation),习惯(habituation)和知觉启动(perceptual priming)相比较,知觉学习则更可能体现了一种可以维持相对长时期的中枢神经系统的改变。知觉学习也不同于联合学习(associative learning),并没有将两个原本分开的处理过程捆绑在一起,而是提高了对刺激的辨别力,使得学习之前无法区分的一些刺激在学习之后可以分辨区分开;通过知觉学习,被试可能知觉到以前所不能知觉到的事物。特别地,知觉学习与其它形式的学习不同之处在于,知觉学习具有高度特异性,即,学习的效果几乎不能在非常相似的任务之间迁移,这提示知觉学习涉及了早期的感觉信息处理过程(Fahle, 2002)。

然而,随着研究的发展以及研究兴趣的变化,不同的研究者在不同的时期对于以上这些概念也有着不同的理解。例如学习识别新的面孔,有人认为这是一种可以表述的外显性学习,涉及了较高级的信息处理过程 (Gilbert 1994; Gilbert et al, 2001),但是也有人也把它归于知觉学习的研究范畴 (Dolan et al 1997; Bruce & Burton, 2001)。又如,传统上认为知觉启动效应只能维持几十秒钟,但在少数研究中也报道了维持好几天,甚至几个月的知觉启动效应 (Julesz, 1971)。而最近几年的研究发现,知觉学习与注意关系密切 (Ahissar & Hochstein,1993),传递性也是普遍存在于知觉学习之中的 (Liu & Weinshall, 2000),这提示知觉学习可能涉及了多个水平的信息处理机制(Fahle, 2002)。

二、知觉学习的研究历史

知觉学习的研究已有100多年的历史了。早在19世纪,人们就发现对于复杂的视觉分类任务(如肺,腰,肝等物体的识别)的能力可以随着训练而增强(Volkmann 1863; Best 1900)。然而当时人们并没有对这种学习现象的机制进行深入的探讨,这类研究的进展十分缓慢,直到1963年,Gibson总结了前人的相关研究结果,提出了知觉学习的概念,知觉学习的研究才引起人们较多的关注。到了20世纪七、八十年代,大量研究发现,即使在许多简单的知觉任务(如立体深度知觉,游标视敏度 vernier acuity,和线段朝向分辨等)中也存在训练引起能力增强的现象(Ramachandran & Braddick, 1973; McKee & Wetheimer, 1978;Vogels & Orban,1985)。然而,当时并没有把这些分辨能力的提高归功于外周或早期中枢信息处理过程,而认为可能是某种内隐的甚至是外显的认知过程的变化,即某种较高层次视觉信息处理过程的变化而引起的。

然而,近二十年来一个令人兴奋的发现是,许多知觉任务的学习具有高度特异性。比如,对于某个特定朝向(或位置)刺激的知觉学习不能迁移到其它朝向(或位置)刺激上(Crist et al, 1997);如果在训练过程中闭着某一只眼睛,那么通过睁开的眼睛所获得的学习不能迁移到闭着的眼睛上(Karni & Sagi, 1991)。就目前所知,只有非常低级的皮层(如初级视皮层)才具有对于朝向、位置等刺激属性高度专一的神经元,以及只对一只眼睛信号产生反应的单眼细胞(Hubel & Wiesel, 1977;Desimone& Ungerleider,1989)。因此,这些特异性提示知觉学习发生在早期感觉处理阶段,甚至是初级感觉皮层(Gilbert, 1994, 2001)。知觉学习的特异性是知觉学习研究史上的一个里程碑式的发现,使得知觉学习的研究空前繁盛起来。目前,知觉学习已成为认知神经科学研究的热点问题之一。知觉学习具有特异性,以及知觉学习涉及了早期皮层信息处理过程的这个观点已被大多数人所接受,被认为是知觉学习区分于其它学习的标志之一 (Fahle, 2002)。

三、知觉学习的研究意义

可塑性(plasticity)一般是指由于经验等因素引起的生命机体结构或功能的改变。James(1890)最早把可塑性这个概念应用于大脑功能的研究中,他指出可塑性意味着一种结构的产生,这种结构具有一定的稳定性,它足以对某些认知问题产生影响,但是不能对所有认知问题产生影响 (“Plasticity …means the possession of a structure weak enough to yield an influence but strong enough not to yield all at once”)。目前一般采用的是Konorski的定义,他强调可塑性是神经系统的某种“持久性的转变”,应该与神经元对变化采取的应激反应区分开。

在生命早期阶段,大脑具有非常强的可塑性,其结构和功能每时每刻都可能发生改变,这种改变通常是由于学习(外界环境)和发育(内部基因)共同所起的作用。即使是成熟的大脑,在某些局部区域具有可塑性,也早就被人们普遍认同。因为我们在生命中的每一天都可能需要适应环境的变化和学习新鲜的事物,例如,学习识别新的面孔等复杂物体。一般认为,面孔等复杂物体是由下颞叶皮层(IT区)表征的,因此,对于这种复杂物体识别的知觉学习可能提示了在整个生命过程中,下颞叶皮层都应该具有表现可塑的能力以满足功能变化的需要。通常认为这些具有可塑性的局部大脑区域与“记忆存储”有关。

然而一直到最近,人们还普遍认为早期的感觉皮层,特别是初级感觉皮层,成年之后就被固定住了,不再具有可塑性了。以视觉系统为例,常见的一个现象是,单眼弱视病人(因为斜视等原因,长期只用一只眼睛而抑制了另一只眼睛获得外界视觉信息,导致这只不用的眼睛视力非常差)只有在10岁以前治疗才可能有效果。Wiesel和Hubel(1965)最早开展了关于初级视皮层可塑性关键期(critical phase)的电生理研究。他们发现,长期封闭初生小猫或小猴的一只眼睛后,大多数初级视皮层的神经元将主要(甚至是仅仅)与睁开的眼睛有连接,而只有少数的神经元是由封闭眼睛激活;如果在非常早的阶段(对于小猫,在出生后的头几个月)把封闭的眼睛打开,而把睁开的眼睛封闭上,将使刚才观察到的皮层改变颠倒过来。此后相似的一系列研究表明,无论在人类还是其它脊椎动物中,初级视皮层在幼年早期阶段确实是可塑的,但是这种可塑性在以后的生命阶段中不再存在。Marr(1982)也曾提出,成年人的初级视皮层是一个相当固化的预处理模块,用来从视觉图像中抽提“基本元素”(elementary features)。Marr的这个观点代表了现阶段人们的普遍想法。

但是,近年来关于简单任务知觉学习(特别是关于知觉学习特异性)的研究提示,学习发生在早期的大脑信息处理阶段,甚至包括了初级感觉皮层。这些研究使我们不得不重新考察现有的皮层可塑性的观点:成年阶段大脑皮层的可塑性可能比我们目前所理解的强得多,即使成熟的初级感觉皮层在一定程度上也是可塑的。

近年来已有直接的神经解剖学和电生理学实验证实:训练确实可以导致信息处理过程的变化,即使成年初级感觉皮层也具有相当的可塑性。最初的证据来源于初级体感皮层的损伤实验,Merzenich(1988)等人发现初级体感皮层的感受野在损伤之后发生了惊人的变化;而此后的知觉学习研究发现,伴随着体感知觉能力的提高,初级体感皮层发生了一种具有高度刺激选择性的皮层重组过程(Recanzone et al, 1992)。在视觉系统里,研究者通过单细胞记录发现成年猴子的视网膜损伤将导致其初级视皮层感受野的位置、大小等发生改变(Gilbert & Wiesel, 1992)。知觉学习研究也发现,训练光栅朝向分辨任务可以使成年猴子初级视皮层的某些特定神经元对于训练所用刺激的电活动发放降低 (Schoups, et al, 2001);成年人的视诱发脑电位将随着游标视敏度任务的训练而显著地变化,这种变化是特异于刺激线段朝向的,并且主要分布在头皮后部区域(Skrandies et al, 1996);等等。

从以上举例我们可以看出,关于成熟大脑皮层可塑性的研究主要是通过损伤实验或知觉学习实验进行的。因此,知觉学习研究的一个意义就在于,为早期感觉皮层可塑性的研究提供了一条无创伤性的途径。此外,知觉学习的这些研究还拓宽了我们对于“记忆”这个概念的理解(Fahle, 2002):传统上记忆是存储于皮层颞叶和海马等特定区域,然而知觉学习中的记忆并非大脑某些特定区域皮层神经元集合的特性,而是所有的皮层区域都可能发生改变,并且按照一定的时间过程或快或慢地调整它们的功能。

四、知觉学习的应用研究

迄今,绝大多数的知觉学习研究根本目的或者是探讨知觉的机制(在这里,知觉学习只是研究知觉的众多范式之一);或者是研究学习的规律(目前已有的关于视觉的研究基础可以帮助我们更好得开展相关的学习研究)。这两类都是非常基础的研究,研究方法包括行为(心理物理,这方面的研究占了90%以上)、电生理(特别是猴子的单细胞记录)、神经成像(ERP/EEG、PET、fMRI)以及损伤研究(脑损伤病人、TMS研究等)。然而,在这些研究的基础上,一些更加应用的研究也逐步开展起来,主要有以下两类:

1.弱视(amblyopia)治疗:

探讨知觉训练是否能够改善成年人的弱视症状
推荐文献:Polat&Sagi,PNAS2004_Improving vision in adult amblyopia by perceptual learning.pdf
PNAS-2004-Polat-6692-7.pdf (486.32 KB) http://www.topeye.cn/bbs/attachment.php?aid=410&k=0ca73edd1e9543454fab9505e954e1c5&t=1390355515&sid=d1d4zljfzKsS2hws5Spy5PnXb91DEKCSxDMV4oYlzrvGsOs

2.计算机游戏:

视觉游戏是否能提高青少年的注意力等认知能力
推荐文献:Green, nature ,2004_action vidio game modifies visual selective attention

此外,还有一些应用于职业培训的文章,非常有趣。

例如,有人发现,经过训练,可以使养鸡场的工人非常快得识别小鸡是公的还是母的;CT/MRI室的医生识别肿瘤的能力大大提高。这方面的文章主要发表在JEP上。

五、知觉学习研究group之一

从今天起定期介绍一个当今有影响的知觉学习研究团队,排序按照这些团队在xiao_ding心目中的影响力。

一. Merav Ahissar and Shaul Hochstein

这是两位以色列科学家,可惜我不懂希伯来文,不能将他们的背景调查地更深入。自1993年在PNAS上发表第一篇论文起,Ahissar和Hochstein已在知觉学习这个领域探索了十多年。这两位学者在我心目中排名第一的原因是,他们的实验设计非常精巧,并且逻辑简洁清晰,论点深刻;他们不仅在Nature、PNAS、Neuron、Trends in Cognitive Science、Vision Research等著名期刊上发表了一系列高水平论文,而且提出了第一个并且也是我认为至今最有影响力的知觉学习理论;他们身处巴以冲突的炮火战乱中,却还能潜下心来深入系统地开展研究。更加难得的是,在这十几年来,他们始终保持异常亲密的合作关系,他们的每一篇论文都是你中有我,我中有你。在当今学术届日趋浮躁功利的环境下,我不知道还能找到多少这样值得年轻学者学习的楷模。。。

经典文献:

1. Ahissar&Hochstein, PNAS1993_ Attentional control of early PL

知觉(学习)和注意之间的关系是近十年来研究者们关心的重要问题之一。传统观点认为,高级、复杂的任务需要注意,然而对于低级简单的知觉(学习)是否也有注意的参与?这一篇论文最早深入探讨了注意在早期知觉学习中的作用。现在几乎每一篇知觉学习的论文在讨论注意的机制时,都会引用这篇文献,可见其影响力之大。

这篇文献最有特色的地方在于其精巧的实验设计, 实验采用同一套简单视觉刺激,但是给与被试不同的任务,观察被试对于的学习效果是否能在不同的任务(尽管刺激相同)之间迁移。研究发现知觉学习具有很强任务特异性,当给被试看某个刺激,让他执行A任务,经过一段时间的训练,被试的执行A任务能力明显提高;但是此时被试对于同一个刺激执行B任务的能力并没有提高,学习效果没有从A任务迁移至B任务。这个结果说明对于简单视觉刺激的学习不仅仅是因为刺激的反复呈现,而且可以受到任务的影响,即知觉学习中存在有注意的调控机制。

这种通过改变指导语,而刺激不变的实验手段值得我们学习。尤其在ERP、fMRI实验中,通常外在物理刺激比内在心理活动更容易引起信号变异,要更精确地探讨心理过程的脑机制,必须在刺激材料上做好控制。

2. Ahissar & Hochstein, Nature1997_ task difficulty and the specificity of PL

这篇文章通过调控知觉任务的难度作为中间变量,以行为实验方法探讨知觉学习在脑内的发生地点和时间问题。结果发现,任务难度不仅与刺激朝向特异性成正比(任务越难,特异性越强),而且与学习发生的时间成正比(任务越难,学习发生得越晚);因此,学习发生的时间和刺激朝向特异性成正比(特异性越强,学习发生得越晚)。又因为经典的视觉信息处理模型认为,刺激朝向特异性与视皮层层次成反比(皮层越低级,特异性越强)。因此,学习发生的时间和视皮层层次成反比(视皮层越高级,学习发生地越早)。即,知觉学习与视觉信息处理过程相反,是一个从高级皮层到低级皮层的过程。

这篇文章的逻辑非常巧妙,所揭示的现象和机制也非常有趣。由于这些发现,Ahissar&Hochstein才得以提出“视知觉(学习)的反转层次理论”

3. Hochstein & Ahissar, Neuron2002_ View from the Top: Hierachies and reverse hiarchies in the visual system;

Ahissar&Hochstein,Trends in Cognitive Sciences2004_ the reverse hierachy theory of visual perceptual leanring

这是两篇综述文章,系统地阐述了“视知觉(学习)的反转层次理论”。这个理论以Nature1997文章发现为基础提出的,Hochstein&Ahissar在这两篇综述里利用这个理论对很多视知觉经典现象进行分析和解释,拓展了理论的适用范畴。

“视知觉(学习)的反转层次理论”实质上探讨了长久以来争论不休的“视知觉是从哪里开始的“这个视知觉研究根本问题,并且融合了两个看上去截然相反的观点:“视觉是从局部到整体的“vs“视觉是从整体到局部的“。关于前者,有Marr的计算理论,Treisman的特征整合论等,这些理论或者是建立在许多精巧的行为实验基础之上,或者用计算机信息处理的思路和方法来研究人的信息加工机制。而以Hubel&Wiesel(他们因此获得了1981年的Nobel生理奖)为代表的经典神经生理学研究提出了更为直接的证据,在视通路的低级阶段,可以对线段朝向、位置等局部特征作精细分辨;而在视通路的高级阶段,可以对各种局部特征的整合信息——物体进行处理。关于后者,最经典的是Gestalt的直觉组织概念、以及Gibson的直接知觉理论等,甚至是皮亚杰的认知发生论似乎也隐含此观点。这些理论基于日常生活中的各种现象以及儿童认知发展的研究。例如,为什么我们一睁开眼,首先知道的是眼前有一个东西,是一个人还是一个苹果,然后再根据需要分辨这个苹果是在那里,这个苹果大概有多大,苹果的梗是朝上还是朝下。。。根据“视觉是从局部到整体的“的观点很难解释这一点。但是“视觉是从整体到局部的“的观点看上去又和经典的神经生理学证据相违背。那么,如何调和这些矛盾呢?

“视知觉(学习)的反转层次理论”就是尝试调和以上矛盾的一个很有意思的理论。一方面,它不否认经典的视觉信息处理的神经模型,即视觉信息的处理是从低级皮层到高级皮层的过程。然另一方面,它提出视知觉是从高级皮层到低级皮层的过程,在这个过程中注意非常重要,与“视觉是从整体到局部的“的观点一致。调和的点睛之比在于前者加上了“内隐”,而后者加上了“外显”。即内隐的信息处理是从低到高的,而外显的知觉意识是从高到低的。这样,看上去主要矛盾就解决了,既可以解释千变万化的知觉现象,又不违背经典的实验发现。真是高啊。。。

然而,有了这个理论是否就万事大吉了呢,视知觉的终极问题是否就解决了呢?幸运的是,这个理论还存在很多粗糙之处(否则,xiao_ding不就没有饭碗了:)。首先,Ahissar&Hochstein没有对“内隐的视觉信息处理”和“外显的知觉意识”进行一个操作性定义。具体什么是“内隐的信息处理”,什么是“外显的知觉”,两者之间有什么本质曲背?根据传统的心理学书籍,“外显”大概指的是可以用某些可观测的指标直接把这个东西测试出来,被试自己也能感受到这个过程;而“内隐”是被试不能清楚地意识到的,需要通过精巧的实验设计简介测得。但是,这个定义也是含糊得很,通常只能举例说明,却不能操作性生产,只能意会不能言明。否则,怎么又来了个“无意识知觉呢”?生理指标是否可以直接观测的东西呢?唉,真是越想越糊涂:( 其次,之前所提及的神经生理学研究结果虽然经典,但是太老了,近年来受到越来越多的拓展和质疑。例如,经典研究提出了“感受野”的感念,认为低级视皮层V1的的感受野很小,只能识别线段等简单局部特征;然而,近年来的研究又提出了“整合野”的概念(上海神经生理所的李朝义院士几年前就有一篇这样的文章发表在Neuron上),指出虽然V1的单个神经元只能识别简单局部特征,但是神经元之间的强大联系可以使得V1进行质地分辨等整体识别功能。

所以,再经典的研究也有过时的时候;再美妙的理论也有瑕疵的地方。

六、跨感觉通道的大脑可塑性

这是最近发表的一篇有趣的文章,听觉训练居然可以提高视觉能力,详细请见最后的摘要。

关于跨感觉通道的大脑可塑性,已经有一些动物实验和损伤病人的研究。一个非常著名的动物实验例子是,如果把动物的视神经改变路线,把它接到听觉皮层上,那么,当在动物眼前摆放一只燃烧的蜡烛,它将“看到”这只蜡烛,还是“听到”这只蜡烛呢?这真是一个很有趣的想法,信号从视觉信息的接收站-眼睛输入,但是最终到达的是听觉信息处理皮层,那么什么组织结构对于信号的解释是最重要的呢?在这个研究里,有两个关键性问题,一是要选择一种动物,它的神经可塑性非常强,可以通过手术的方法将视神经联结到听觉皮层上,雪貂就具有这个特点;第二点是,动物不能说话,我们怎么知道它是“看到”还是“听到”了呢?这个研究采用了“操作性条件反射”这种在动物实验和婴幼儿研究中常用的方法。比如,训练正常的雪貂看到蜡烛后头向左转,而听到声音后头向右转,让雪貂通过转头方向告诉我们它是“看到了”还是“听到了”。但是如果让正常雪貂学会了策略之后再对它进行手术,手术之后的愈合时间很长,愈合后雪貂是否还能按照训练时的策略反应?为了解决这个问题,研究者想了一个非常巧妙的方法,将雪貂的一侧(例如左眼)视神经改接方向,而让另一侧(例如右眼)视神经保持完好。先让右眼进行学习转头策略,之后测试左眼。研究发现,如果在左眼前放一只燃烧的蜡烛,这只雪貂将依然“看到”蜡烛而不是“听到”蜡烛,尽管这时蜡烛的信号已经传导至听觉皮层处理了!这提示感觉皮层具有想当大的可塑性,如果长期让它只接收其它感觉通道传来的信号,那么这个皮层组织的功能将发生本质变化。这个例子发表在Nature2000,作者von Melchner, Pallas & Sur,已被不少教科书和科普读物引用(例如,Biological Psychology, James Kalat;重塑大脑,傑佛瑞.史瓦茲 等);


然而动物实验的结果是否适用于人类呢?在探讨大脑可塑性问题时,常用的另一种方法是损伤病人研究。应用在跨通道研究里,人们自然就想到了利用某种感觉缺陷有障碍的人来进行实验。例如,2001年的Nature Neuroscience的一篇文章探讨了这样一个问题:天生聋哑人的听觉皮层是否会对视觉信息有反应?研究发现,聋哑病人的一些主要听觉皮层对视觉信号产生了显著的兴奋。在特定的条件下,“听觉”皮层已经转换成了视觉皮层。类似的现象还存在于盲人中,其视皮层可以对触觉信号和声音信号产生反应(例如,Sadato,Nature1996; Weeks, J.Neurosci2000)。这些例子充分说明了感觉皮层并不是一个天生固化的东西,而是可以由后天的环境和训练重塑的!

最近的这一篇知觉学习的研究又拓展了人们的思路。听觉训练可以改善视觉能力,这提示对成年正常人而言,听觉训练也可能导致视觉皮层的功能变化。可惜,这只是一个行为实验,其内在的生理机制还不清楚。对于正常人而言,跨感觉通道的学习将会引起大脑怎样的变化呢?这是值得我们今后探讨的一个问题。

七、颜色、形状、运动、深度。。。

最近讨论了一篇文章,颜色和运动、运动和立体深度、以及颜色和立体深度的联合学习(Nature1986, Nakayama and Silverman),虽然是20年前的文章了,还是收获不小。

视觉搜索指的是从一堆背景物体中找到一个目标物体。在日常生活中,视觉搜索无处不在。例如,我们经常需要在人群中寻找我们的父母、亲人或朋友。视觉搜索早已称为一种有效的实验范式,用来探讨视知觉的机制以及注意的机制。在这个领域里最有名的研究之一是Triesman的研究。1980年,Treisman发现,如果当目标和背景只在一个维度上有差异,比如在一堆红色的圆形中寻找一个绿色的圆形,目标和背景只在颜色上有差别,那么这时的搜索效率很高,并且搜索时间和背景物体的个数没有关系,无论有多少个红色的圆形,我们寻找绿色圆形所需的时间都是一样的。这时的搜索称为并行搜索,也就是我们一下子加工了所有的物体,绿色的圆形“pop-out”在我们眼前,搜索不需要注意的参与。但是如果目标和背景在两个维度上有差别,比如在一堆红色的X和绿色的O里找绿色的X,这时目标与背景在颜色和形状上有差异,这时搜索效率变慢,并且搜索时间与背景物体的个数成正比,背景物体越多,搜索目标图形所需要的时间越长,这时的搜索称为串行搜索,我们需要将我们的注意力依次分配在各个物体上,分辨这个物体是不是我们所需要找的东西。根据这个发现,Triesman提出了有名的“注意的特征整合理论”。

Triesman当时只讨论了颜色和形状这两种特征的联合。是否所有的特征联合搜索都是串行的呢?Nature1986的文章对此进行了探讨,发现颜色和运动这两种特征的联合也是串行搜索。然而,有趣的是,当立体深度与颜色结合,或者与运动结合时,搜索表现出了并行的模式。

根据现有的神经生理学知识,颜色、形状和运动分别由不同的脑区加工处理。例如,在V4(V8)可以进行颜色分辨,有专门对绿色反应的神经元,只要它活动就可以把目标寻找出来。而运动是由另外一个脑区(MT区)加工处理的。还没有发现有脑区可以同时加工颜色和运动,没有神经元对红色的向上运动的物体有特异性兴奋。在进行颜色和运动的联合搜索时,必需要将两个脑区的神经元(例如V4区对红色反应的神经元和MT区对向上运动反应的神经元)活动联系起来,才能找到红色的向上运动的物体。联系的方法,有人提出是由于后部顶区这个与注意关系非常密切的脑区的作用,也有人提出是由于两个脑区的神经元活动同步化机制。不论是哪一种方式,相对于单个脑区有限神经元参与的特征搜索,颜色和运动的联合搜索效率都大大下降了。

对于立体深度和运动,这两种特征的加工在视通路上很难分离,已有研究发现加工运动的MT区细胞可以同时对立体深度进行加工。这样,立体深度和运动虽然在物理上可以定义为两个独立的维度,但是在心理加工上把它们结合成了一个维度。打个比方,有的神经元可能对距离比较远的向上运动的物体反应,有的神经元对距离比较远的向下运动反应,有的对距离比较近的向上运动反应;这就好像是同样在颜色区,分别有神经元对红色、绿色、和蓝色反应一样。因此,对于立体深度和运动的结合,有专门的神经元对目标刺激反应,这样的搜索就类似于单个特征的搜索,效率提高,变成并行了。

然而,对于立体深度和颜色,虽然Nature1986根据并行搜索的结果提出假设会有脑区同时对于立体深度和颜色加工,但是二十年过去了,还是没有找到有力证据。教科书上还是把立体深度和颜色的加工分别归纳于两条不同的通路上。那么,为什么立体深度和颜色的联合表现出了并行搜索的结果呢?

Nature1986给的另外一个解释是,立体深度比颜色加工得早,这样人们就可以先进行立体深度的分辨,在此基础上进行颜色的加工。因为视觉搜索常用的范式是2×2的设计,虽然物体的数量有很大的变化,但是立体深度和颜色都分别只选了两个水平(比如前、后两个深度;红、绿两种颜色)进行结合,因此,根据立体深度可以把所有物体只分成两堆,每堆内的物体只有颜色的区别,在每一堆内都只是特征搜索,表现出并行效应;整个搜索只要完成两次并行搜索,这样搜索就与物体的个数没有关系了,也是一种并行过程。如果这个假设成立的话,我们可以预期,如果立体深度的水平增多至3个、4个、5个,甚至更多,立体深度和颜色的搜索时间会逐渐提高,表现出与立体深度水平数成正比的串行效应。也不知道这样的研究是否已经有人做了。

回到学习上,我们经常会发现,在人群里寻找自己的父母要比寻找一个只见过一次面的人要容易得多,前者表现出接近并行的模式,而后者串行。这提示我们,经过学习,串行搜索可能变成并行搜索。事实上,已经有实验探讨了这个问题,发现训练确实能够使得搜索模式发生变化。那么,与这种变化所对应,我们的大脑发生了什么样的改变呢?

1。产生了专门处理熟悉刺激的神经元。例如,相对于陌生面孔,有更特异的神经元对父母兴奋;有新的脑区可以同时处理不同维度特征。

2。脑区之间的联系加强。例如,ERP的gamma-band增强

3。后部顶区不再参与搜索任务。

。。。。

八、视觉信息处理双通路模型



形状、颜色信息的处理在大脑腹侧进行,运动、方位和深度信息的处理在大脑背侧进行
如何将这些信息整合起来,形成一个整体知觉?这是一个视觉研究的重要难题-“binding problem”特征捆绑“binding problem”也存在于不同的感知觉信息(例如,视觉和听觉)之间。

九、视觉信息处理的分层机制



一直在介绍这个机制,文字的,还是要配合图形,更加生动一些。

图中的每个蓝色的圆圈代表一个神经元的感受野,只有当视觉信号落在这个区域,神经元才可能有反应;

蓝圈内的白线段代表这个神经元的最优反应朝向;

由图中可以看出,低级的神经元感受野小,最优反应朝向少,这里的神经元对于位置和朝向具有很高的特异性;

高级的神经元感受野大,可以对很多朝向反应,这里的神经元对于位置和朝向的特异性较弱。

《图片来源:Hochstein & Ahissar, Neuron2002.》

十、学习效果 vs 学习过程

目前已有的知觉学习研究(特别是fMRI、PET和ERP等脑功能研究),基本上是这样的范式:前测、训练、后测,然后比较前测和后测之间的差别。利用这样的范式,基本上测量的是学习效果(学习的表现),而不一定是学习过程(学习的机制)。可以用怎样的实验方法研究学习本身的机制呢?Clark & Lavond;Krupa & Thompson (1993)的兔子实验提供一个很好的思路。

在这个研究里,训练兔子听到铃声就眨眼,这是一个经典条件反射的例子,很基本的学习。研究者已知,在完成眨眼反射这个任务时所需要的脑区及其回路关系。比如,有两个脑区,LIP和red nucleus(红核)对于这个任务的完成很重要,LIP的活动发生早于red nucleus。研究者想测量哪个脑区对于这个任务的学习很重要,而哪些仅仅是对这个任务的表达很重要。



《图片来源:Biological Psychology, James Kalat》

研究者选择了三组兔子来探讨这个问题。第一组,在训练的同时抑制了LIP区;第二组,抑制red necleus;第三组是控制组,训练时没有进行任何处理。研究比较了三组兔子的训练-学习曲线。发现,当训练了3个session之后,控制组的兔子就能很好地学会眨眼反射;然而,第一组和第二组的兔子在训练过程中一直没有表现出学习效应,训练了6个session还是不会听到铃声就眨眼。这提示,LIP和red necleus对于学习效果的表达有重要作用。那么,这两个脑区是否是学习过程的必要条件呢?研究者接下来将第一、二组兔子的脑区抑制解除,观察LIP和red necleus功能都正常时的训练-学习曲线。结果发现,一旦解除red necleus的抑制,兔子立即表现出了明显的学习效果,可以很好得完成眨眼反射;然而,即使解除LIP的抑制,兔子还是需要经过一定的训练才能学会眨眼反射。这个发现很好得证明了LIP对于学习过程(学习本身的机制)有重要作用,而red necleus仅仅与学习效果表达有关。如果仅仅red necleus功能失常,因为LIP在red neucleus之前兴奋,学习还是能发生,只是不能将其正常表达出来。

这种关于动物的条件反射学习的实验方法能否应用于人类身上呢?首先,需要知道一个任务在学习前和学习后需要哪些脑区参与及其时间先后关系,可以结合fMRI和ERP的方法;接下来,在训练过程中对于这些脑区分别进行抑制处理,可以采用TMS结合MRI的方法,这是一种可逆性损伤技术,只要磁刺激不超过一定的频率,在同一个人身上多次使用也不会产生副作用; 然后, 观察某个脑区抑制时训练-学习曲线, 以及抑制恢复之后的训练-学习曲线。

这种方法实现起来可能有一定的困难. 现有的TMS技术只能抑制靠近头皮的脑区,对于深度脑区的抑制效果和定位精度都大大下降。另外,还有一个问题是, 如果有一个脑区, 在执行任务时并不需要, 但是可能对于学习过程很重要, 用以上方法是不能把这个区域找到的。
另一个方法是, 在训练时同时记录被试的ERP和fMRI, 观察是否存在任务执行之外的脑区或特征ERP存在。 这个方法只是一种相关研究,而不像TMS这种方法可以确定脑区的必要性。另外,有很多研究提示学习可能发生在训练之后的时间, 可以采取什么方法把这段时间脑内的机制测试出来?

困难重重...

十一、知觉学习之三重境界

佛曰,人生三境界。第一境:看山是山,看水是水;第二境:看山不是山,看水不是水;第三境:看山还是山,看水还是水。

这三个境界描述了人的一生,从“涉世之初,天真烂漫,纯朴无暇,此时看山是山,看水是水”,到“年龄渐长,历事渐多,人心惟危,不断设防,此时看山不是山,看水不是水”,再到“茅塞顿开,心胸豁然,荣辱不惊,去留无意,淡泊随缘,复归于自然,此时看山又是山,看水复是水”的变化过程。虽然第一境和第三境表观如此相似,其内在却已有本质升华。

古往今来,无数的思想家和文人墨客告诉我们,不止人生,万物都可能存在如此之轮回。那么,人的大脑和心智活动,是否也会经历类似的转变呢?

上个月末,研究心脑关系的科学家提示我们,其实知觉学习也存在三重境界(Neuron_2008)。随着知觉训练的进行,大脑初级视觉皮层的活动经历了从低,到高,再回复到低的变化过程。从第一境到第二境,突触活动(个数)增强(增多);从第二境到第三境,突触活动(个数)减弱(变少)。虽然第一境和第三境的表现都是突触活动水平较低,但是相对于前者漫无目的的激活,后者的活动更加特异于知觉任务,两者的机制存在根本不同。

原来,世间的道理,竟是如此相通的。

十二、任务难度对于知觉学习的影响

训练任务的难度会影响学习的获得吗?乍一看这好像是一个非常“naive”的问题。确实,这还需要研究吗?早就有古人云,凡事需要“循序渐进”,否则就会“欲速而不达”。这些至理名言教导我们,任务难度会影响学习的效果,学习需要选择一个合适的难度(“序”)才可以达到良好的效果。然而,究竟什么是“合适的”难度?为什么“合适的”难度会产生好的学习效果?换句时髦的脑术语,“难度”究竟是如何调控“大脑活动”的变化进而影响我们外在的“学习表现”的?这些问题,却是古人或日常经验无法直接告诉我们答案的。

从理论研究上,Ahissar和Hochstein最早在1997年的Nature上发表了一篇关于难度调节视知觉学习的行为研究报道,之后又有Amitay等人在2006年的Nature Neuroscience上发表了一篇关于难度调节听知觉学习的行为研究报道。这些研究表明,任务的难度会影响知觉学习的效果及其迁移机制,并且对其内在脑机制进行了推测(Ahissar和Hochstein是xiaoding一直佩服的大牛,关于他们的系列研究,请见xiaoding以前的拙文:知觉学习研究group之一)。然而,推测毕竟是推测,任务难度对于知觉学习的影响一直缺乏直接的神经生理方面的证据。

我们最近的研究(Task difficulty modulates electrophysiological correlates of perceptual learning, International Journal of Psychophysiology, in press; http://www.ncbi.nlm.nih.gov/pubmed/19969030?itool=EntrezSystem2.PEntrez.Pubmed.Pubmed_ResultsPanel.Pubmed_RVDocSum&ordinalpos=2)采用ERP技术发现,与容易任务(初始正确率95%)学习相比,困难任务(初始正确率75%)学习改变了更早的视觉加工阶段,更大的视觉皮层区域,更多的晚期加工阶段。我们的研究在国际上首次提供直接的证据说明了知觉学习的神经机制是如何受到任务难度的调控的。

关于知觉学习在大脑内的发生地点和时间一直是研究者们普遍关心的问题,几乎所有的重要行为研究和脑成像研究都是围绕着这个方向开展的。而其中一个焦点问题是,学习是否真的能够如行为研究所提示的,在最早期的感知皮层就发生了(即,信息流在大脑皮层加工的第一站是否就开始受到训练的影响)?虽然近年来有数篇fMRI研究揭示,知觉训练确实能够改变初级视皮层的活动,但是这种脑活动变化究竟是反映了视觉刺激刚刚传导到视皮层时的脑加工机制变化(自下而上的变化),还是反映了信息流进一步传导到更高级的皮层之后再由高级皮层反馈给低级视皮层的活动变化(自上而下的变化),却是一个无法用fMRI等具有高空间分辨率但缺乏良好时间分辨率的技术所能解决的问题。我们之前的一系列ERP研究表明,无论对于简单的光栅、线段朝向分辨,还是对于复杂的箭头指向分辨,学习改变的最早期脑活动都发生在大约140ms,这个时间相比起早期感知皮层加工,还是显得太晚了些。分析这些研究的共同特点是,采用了非常容易(正确率>95%)的训练任务,那么是否因为任务不够难,所以导致更早期的活动没有受到训练的影响呢?

我们最近的这篇研究证实了这个假设,并且在国际上“第二次“发现知觉训练改变了早至100ms内的视觉皮皮层活动(“首次”是由Pourtois等人在2008年的Vision Research上报道的C1效应,但是我们的另一个研究采用了与他们完全相同的研究范式,却没有重复出这个结果;说两句题外话,这个group的研究真是非常有趣而奇怪,近年来这个group发表了不少论文报道较高级认知过程,例如学习、情绪、和注意状态等,对于早期视觉C1活动的影响;可惜的是,至今好像还没有人重复出他们的结果,xiaoding最近刚刚在Hillyard实验室完成的研究又一次没有重复出他们发表在2009年HumanBrainMapping的结果)。

这篇研究是中大心理系第一篇以研究生为第一作者的SCI&SSCI收录的英文论文,投稿过程通过了6位国际专家的严格评审。论文能够受到同行的认可,发表在国际知名研究刊物上自然是一件值得高兴的事情;而亲眼目睹学生的一步步成长,却又别有一番乐趣和欣慰。

十三、知觉学习的保持机制

从小到大,老师和家长们都教导我们学习需要讲究方法方式,劳逸适当结合才能取得优良的成绩。而相应的,训练和休息之间的关系,也是各种学习研究的永恒话题。伴随着训练,我们的成绩会逐步提高,这是训练的作用;训练之后的休息,则能帮助我们在下次训练中取得更好的成绩。大量日常经验,或是理论研究都表明,无论是训练,还是休息,都对我们的成绩提高有重要作用。这些经验和研究引发了以下两个有趣的问题:

(一)成绩的提高是一种行为表现变化,而根据目前主流的一元论观点,某种行为表现之下必定有相应的脑活动机制。那么,伴随训练而发生的学习(“快速学习”),与休息期间发生的学习(“慢速学习”)是否具有共同的脑机制呢?

(二)学习的保持性是衡量学习意义的重要指标。再多的学习,不能保持也是没有任何价值的。那么,究竟是(A)快速学习,还是(B)慢速学习,亦或是(C)两者都能长期保持呢?

进一步思考:如果只有一种学习才能长期保持,那么另一种学习到底有什么作用呢?

我们最近被Neuropsychologia所接受的文章,利用ERP技术探讨了以上几个问题,并给出了有趣的答案 (ERP evidence for distinct mechanisms of fast and slow visual perceptual learning http://www.ncbi.nlm.nih.gov/pubmed/20080117?itool=EntrezSystem2.PEntrez.Pubmed.Pubmed_ResultsPanel.Pubmed_RVDocSum&ordinalpos=1)。

请问你猜对了吗:)

后记:大脑可塑性是国际前沿热点研究问题。近年来的研究或者是从宏观行为的角度探讨人的学习记忆现象,或者是从微观生理的角度探讨动物的神经元可塑性机制。仅有的少数几个直接用现代脑成像研究方法探讨成年知觉学习脑机制的研究也都忽视了学习效果(大脑变化)的保持性这个重要的问题。我们的这个研究,在国际上首次报道了由于视觉训练而导致可长期保持的成年人大脑可塑性机制。希望这个研究所创建的实验范式和理论思想能够对今后的人类大脑可塑性研究带来指导意义。