从错觉说到偏见

心理导读：我们可能因为受到知识的局限性而对事物的看法产生无法消除的偏见，有时候打破这种偏见的唯一途径就是开阔视野，多积累知识，以及和具有不同知识背景的人讨论，否则就算抱着“我可能是错的”这种信念，你也不知道怎么去证伪自己的一个猜测。 ——

我们看到这张图片的第一反应是：5个凸的按钮，1个凹的按钮。

现在仅仅将图片上下颠倒一下：

在我们眼中立即就变成了：1个凸的按钮，5个凹的按钮。

为什么同一副图片，仅仅是上下颠倒一下，我们就对其作出了完全不同的解释呢？

我们知道，视觉图像要到达大脑，首先要在视网膜上成像（视网膜上密密麻麻地排布着感光细胞），刺激感光细胞形成的神经电冲动然后经过一系列复杂的神经通路到达视觉皮层。但后续的繁杂步骤其实都是对视网膜上成的像的处理。这里，对我们的讨论而言视网膜不妨可以看作一张感光胶片，重点在于视网膜上的像完全是一张二维图片。大脑从图像中提取出来的任何信息都以这张二维图片为原始素材。

那么，究竟大脑是怎么从二维图片中看出（推导出）三维的？

其中一个重要的工作就是判定深度。前面的两张图片完全是二维图片，在我们的视网膜上也是二维的。然而大脑却能够从中理解出三维出来，大脑能够判断出一个按钮是“凹”的还是“凸”的。这是怎么办到的？

很简单，假设环境中有光源，并且光源来自上方，那么凸的物体会使其下部出现阴影，凹陷的物体则会在上部出现阴影。于是，图中按钮的下半部出现阴影就意味着按钮是凸的，按钮的上半部出现阴影则代表按钮是凹的。

然而，别忘了，大脑的这个推理成立必须有一个前提，即光线从上方照下来，如果光线从下方照下来的话，一切就反过来了，凸的物体将会使其上部呈现阴影，凹的物体将会使其下部呈现阴影。因此同样的一副图片如果假设光线从下方照耀的话，原来看成凸的物体就应该看成凹的，原来看成凹的就应该看成凸的。

那么，回到我们的第一副图片，你能够看着第一副图片并假想光线从下方照下来，进而把原来凸的按钮看成凹的吗？事实证明这很难，但我们可以做一个等价的事情——将图片上下颠倒一下：考虑到我们总是假设光线从上方照耀以及按钮的上下对称性，颠倒原图就相当于对原来的图片而言假设光线从“下方”照上去了。

我们发现（上文第二张图），一旦颠倒图片之后，果然凹凸就换位了。

这就是说，同一副图片其实有两种（乃至更多）可能的解释，取决于你的大脑到底假定光照来自下方还是上方。但为什么我们看上面两幅图片却不会出现“二义性”的错觉呢？因为在我们生存的环境中始终就有这么一个巨大的来自上方的光源——太阳，漫长的进化已经在我们的神经回路中刻下了“光源来自上方”这样一个强大的假设，所以虽然第一副图片本该完全有两种解释，我们还是不可避免地只看到其中的一种解释，即假设光线来自上方的解释，即使卯足了劲看也难以将凸的看成凹的，因为难以克服进化印刻在大脑中的“光线来自上方”的假设，因此为了让你看到“当光线来自下方时你会看到什么景象”我不得不将图片颠倒一下，结果你就看到原来凸的变成凹的了。

对于了解贝叶斯方法的同学，这个“光线来自上方”的假设就是先验（prior）的。

世界在我们眼中其实只是一张二维图片，由于引入了“光照来自上方”这个先验假设，便有了凸凹。否则，文中一开始那张图片中的“按钮”可以是凸的，也可以是凹的，也可以是一张平面的、故意捉弄你的眼睛的画。

最后，我们再来做一个实验，将原图转动90度：

是不是发现凸凹感基本消失了？现在图片看上去更像是透过面板上的一些孔洞看背后的一张黑白条纹纸。前面提到，我们的大脑通过阴影来判断凸凹，在对阴影的“含义”进行推断的时候必须假定光照来自上方，而在这张竖着的图中，假设光照来自上方的话，那些阴影是没有意义的，因为不管凸还是凹，都不会形成这样的阴影，因此我们的大脑便无法判断凸凹了。（注：其实只要稍微把头往某个方向转一下就会看到凸凹了，并且，由于90度的偏角远小于上下颠倒，所以可能不少人还是能够在上图中看出凸凹感来的，只要想象光线来自左方或右方即可，比想象光线来自下方容易多了）。

也许这个实验对你来说过于简单，对于我们大脑中的“光线来自上方”的先验假设你还没有强烈的感觉。下面是一个更强的先验假设——人脸。

我们的大脑有一个神经网络模块负责识别人脸，这也是一块硬编码的神经网络，也就是说我们天生就对任何（类似）人脸的图像敏感，所以随处都看到人脸，稍微类似人脸的图像就会被优先解释为人脸（用“手中拿着锤子，什么东西看上去都想钉子”的话来说，人脸模型就是我们的大脑在图像识别时的一柄黄金大锤）：

（图片注：荣耀属于八卦@互联网）

当这种对人脸的强大先验假设在与“光线来自上方”假设产生冲突的时候，真正诡异的事情就出现了！

这是卓别林的面具在旋转过程中的四个不同瞬间的截图，左上图是面具正面的正常图像，但右下角是从反面看的情形——这个时侯实际上面具是向内凹陷的面孔，但是我们的大脑欺骗了我们，让我们仍然看到凸的面孔，因为大脑的人脸识别模块对“脸是凸曲面”的先验假设轻易地打败了“光照来自上方”的假设。大脑的逻辑是这样的：如果假设光照来自上方，那么根据阴影来推断这就应该是一张凹陷的脸。但我们又知道所有的脸都是凸的，因此必须推翻光线来自上方的假定才能符合“事实”——当大脑中的两个假设相冲突的时候，更强硬的那个获胜。如果这不是一张人脸面具，我们便可以轻易地意识到是凹陷的了。

静态图片不够生动，下面是这个视频的动态旋转过程（看不到视频的话请直接转至youtube link | youku link）：

下面这个视频则很好地将上文提到的两个实验结合了起来（看不到视频的话请直接转至youtube link | youku link）：

如果你对这种先天印刻在大脑中的先验假设仍然有所怀疑，再来看看著名的诡异的Ames’ Room和Ames’ Window吧：

（图片/视频注：荣耀属于Richard Gregory）

Ames’ Room的构造有点复杂，但Ames’ Window是很好造的。

在Ames’ Window 和 Ames’ Room中，由于我们假设屋子的框架和窗户的框架是平行的，从而会将视觉上平行的窗户看作是与我们相对平行放置的，而将视觉上扭曲（一头宽一头窄）的窗户看作是与我们相对垂直放置的（因为其一端离我们远去从而变小）。事实上我们在现实中正是通过物体大小的变化来判断远近的，这也正是透视法能够在平面纸张上创造出三维视觉效果的原理：

在上文的实验中，我们的大脑由于有“内建”的假设，所以轻而易举地将一些按钮无歧义地解释为凸或者凹（后面我们会看到，虽然先验假设帮助我们消解二义性，但先验知识恰恰也正是偏见的本质来源），我们不免要想：如果缺乏先验知识来消解二义性，会出现什么现象呢？

这个是著名的Necker Cube，对它的三维解释是二义的。也许由于我们对平放的方块更熟悉（对图片来讲这是一个先验知识，因为它并不蕴含在图片本身携带的知识当中），更多的人会看到其中的一种解释（即“一个平放着的方块”），但其实还有一种解释也是完全可能的。如果不引入“现实中平放着的方块更常见”这个先验假设，我们其实是无法在两种假设中选出一种的，两种可能性等同。事实上盯着图片久了之后这两种解释就会随机切换。

要消解二义性其实很简单，引入新的evidence（了解贝叶斯方法（数学之美番外篇：平凡而又神奇的贝叶斯方法）的同学对这个字眼应该很熟悉吧？）：

（图片注：荣耀属于wikipedia和Necker）

我们的大脑会综合图片中所有的evidence，以及大脑中原本就有的先验假设，给出最可能的解释。但必须注意的是，如果按照统计学派的观点，应该让数据本身说话，不引入先验假设的话，二维图片就是二维图片，每种解释的可能性都是均等的，但如果考虑了先验假设，那么往往只有一种或几种可能性是靠谱的(plausible)：

（图片注：荣耀属于Indexed）

前一阵子互联网上流行的“看你是左脑还是右脑”的“旋转的女人”图片也是绝佳的例子（注：其实这跟左右脑毫无关系）（类似的多义性视觉错觉参见 Multistable Perception）：

有人看到顺时针有人看到逆时针。但更多的人看到的是顺时针，正如 Necker Cube 中更多的人看到的是一个水平放置的方块一样。一种可能的解释是我们对顺时针旋转更为熟悉（先验假设）。

但是如果我们给图片加上一些新的evidence，就会发现变化出现了：

（图片注：荣耀属于Nobuyuki Kayahara和八卦的wikipedia，以及台大心理系陈建中副教授的解释）

像前面的加上了新的 evidence 之后的 Necker Cube 一样，通过对图中旋转的女人的剪影添加轮廓线索，强烈提示了目前这个瞬间到底是正面还是反面。通过这个提示，大脑正确的对二义性进行了消解。

其实，说到底一张二维图片就是一张二维图片（外界物体反射的光线投射到我们的视网膜上也只是留下二维的剪影），其三维解释有N种（甚至无数种），但为什么绝大多数情况下我们的大脑能够一下就锁定在其中的一种可能性解释上呢？皆因我们的大脑对生成这张图片（特别是图片中的阴影）的环境参数有一些先验的假设（如前面提到的“光照来自上方”、“脸是凸曲面——严格来说，鼻子是凸的”）（注意，这些先验假设并不蕴含在图片中，而是我们在长期生活中无意识统计出来的，或者干脆就是漫长的进化过程筛选出来的有价值的先验假设——正如婴儿天生在吃奶期就懂得吮吸一样。）

我们再来回顾一个经典的视觉现象——色彩恒常性（Color Constancy）。我们已经知道，同一个物体，在不同光照条件下我们知觉到它的颜色是基本不变的。一个青苹果在日挂头顶的中午的白炽光线下看上去是青的，在斜阳西下暗红色的光照下是青的，在清晨淡蓝色的雾霭中还是青的。你可能觉得这很正常，青的本来就是青的，有什么好奇怪的。但问题是如果将我们的眼球换成一个光线接收器，从而客观记录下从苹果表面反射出来的光线的RGB值（红、绿、蓝三色的比例），会发现在不同环境光照条件下，实际从苹果表面反射出来的光线差异是很大的；例如环境光只有长波（红色）的话，那么不管苹果表面的反射比如何，反射出来的光也只能是长波，但为什么我们看起来仍还是青色的呢？

如果我们在一个封闭的箱子中放置一张白纸，让观察者透过暗箱上的一个孔洞来观察这张白纸。那么当我们在箱子内用黄光照的时候，观察者会看到黄纸，用红光照的时候会看到红纸。但如果打开箱子，则不管用什么光照，我们看到的还是白纸。

为什么会出现这种现象？目前为止已经有了一个理论解释框架：尽管同一物体在不同光照条件下反射的光线差异很大，即视网膜接收到的光线差异很大，但视觉皮层对视网膜接收到的光线又进行了一层处理，这层处理就是从视网膜接收到的光线中“抽取”出物体的“真实颜色”。但我们的神经回路如何计算目前还并不最终明确，但有靠谱的逼近算法（被称为retinex algorithm），其中一个简洁的版本是这样的：假设目标物体周围的邻近环境中存在完全反射光线中的绿光成分的物体、也存在完全反射光线中的红光成分的物体、也存在完全反射光线中的蓝光成分的物体，那么只要将眼睛采集到的环境光线中最强的绿光成分Gmax，最强的红光成分Rmax，最强的蓝光成分Bmax分别记录下来，然后算一下目标物体所反射的光线的RGB对(Rmax,Gmax,Bmax)的比例即可。

这里，再一次，我们的大脑从一个具有多义性的信息源中抽取出了一种最靠谱的解释。从物体表面反射出来的光线并不能唯一确定物体的反射比，一个方程无法解出两个未知数（光照、反射比）。但我们的大脑仍然还是聪明地利用了环境中的evidence，靠谱地解决了这个问题。

然而，接下来的才是我真正想说的，在刚才提到的算法中，一个先验假设是“目标物体周围的邻近环境中存在完全反射光线中的绿光成分的物体…”，问题是如果这个假设不满足呢？戏剧性的错觉就出现了，见下图：

（图片注：荣耀属于Mauro Vecchi，这是从一个精美的视觉错觉视频中摘取出来的画面。）

图中白线所指的两个小方块的颜色一样吗？如果你觉得不一样的话，不妨用软件把这两个色块的像素摘取出来对比一下（小壹：或者直接截取那两小块的颜色放在一起比较）（注：这里还有一个关于Color Constancy 的不错的文章：你绝不相信A和B颜色相同）（注：色彩恒常性只是我们体验到的一系列主观知觉恒常性中的一种）

以上这些错觉与实际生活多少有点脱离，但我打--读以下这个现象每个人都看到过——只要你去过理发店，因为这个错觉也被叫做（理发店门口的）“旋转彩柱错觉”：

（图片注：荣耀属于wikipedia）

透过条柱看到的黑白条块在往下移动，而透过孔隙看到的黑白条块则往右下方移动。然而，实际上孔隙背后的黑白条纹纸可能正在往下移动，也可能往左移动，实际上其移动的角度有无穷多种可能，为什么我们的大脑只看到了一种可能？具体解释可以参照 Barberpole illusion条目。

我们的视觉系统通过大量的先验假设来解释投射到我们视网膜上的二维图像，从中推断出三维结构，类似的例子还有：Kinetic Effect, Aerial Perspective, Parallax Scrolling, 等等。视觉系统感知到的三维图像只是我们的大脑给我们玩的一个小把戏，或者，严格来说，一系列小把戏之一。

在一般人看来，视觉错觉只是拿来哄MM开心的小伎俩，是魔术师的小把戏，“不登大雅之堂”，然而在心理学家和认知神经科学家们眼里，视觉错觉是一个迷人的研究领域，是研究人脑如何处理信息的窗口，正如数学家们透过悖论对数学的奥秘一窥端倪，心理学家们也在透过形形色色的错觉现象探索大脑对信息的处理机制。一篇严谨而不失趣味的论文可以参考“Perceiving the Present and a Systematization of Illusions(PDF)”）

以上这些错觉现象实质上揭示了一个深刻的原理，这个原理不仅适用于视觉现象，同样适用于其他心理现象：我们的大脑从外界接受到的信息其实是满含着歧义的，单单从这些信息本身来看，我们应该感到无所适从才是，然而我们的大脑几乎每次都能够从富含歧义的信息中找出最靠谱的解释，作出无比牛B的点估计，这得益于漫长的进化过程，以及我们平常生活中积累的大量先验假设，然而，接下来我们要说到，这些先验假设是双刃剑，其锋刃的另一面就是我们常说的“偏见”。

Probability Theory, the Logic of Science上讲了这么一个故事：

一个月黑风高的夜晚，你是一位警察，在一条荒无人烟的街上巡逻，忽然听到入室盗窃自动警报，你转头望去，发现街对面的珠宝店的玻璃窗户破了个大洞，一个蒙面的家伙背着一个鼓鼓囊囊的的包正从窗户中爬出来，此时，你一定毫不迟疑地断定这个人就是强盗。你是怎么推断的呢？

疯狂的赛车里，耿浩到庙里取了骨灰，一出门看到几个黑社会老大模样的家伙，以为是殡仪馆的人，而对方却以为耿浩是SHA了泰国佬的地头蛇，并把耿浩手里的骨灰盒当成了藏du的工具，还一通佩服，结果一桩阴差阳错的生意就做成了。他们又是怎么推断的呢？

正如以前听过的一句话所说：对于日常生活中的事件，总有一个平凡的解释，和一个疯狂的解释。

例一中的那个背着包的人可能是珠宝店的老板，从假面舞会回来，身上没带钥匙，当他走过自己的珠宝店的时候，一辆卡车呼啸而过，轧飞的石子把他的珠宝店窗玻璃打碎了，为了保护他自己的珠宝，他只能进去把珠宝收起来带走。

至于疯狂的赛车，另一种解释不用我说了。

Top Language上的一位朋友li kai讲了这么一个故事：

我有个朋友前些日子刚结完婚，这里有一个故事。他本身并不富裕，因此呢，就跟媳妇商量，咱能不能一切从简，什么三金，（就是金项链、金戒指、金耳环）也就都免了吧，媳妇说这是家里规矩，不能同意，这边老丈人当然就更不同意了，非逼着我这穷哥们买三金，给一万元礼钱。

最后，没办法，我这朋友东挪西借把东西弄齐了，婚礼上，老丈人也给新郎一个红包，可我这哥们却始终憋着一股气，接过来之后终于没按耐住，爆发了，你猜怎么？他把红包给撕了扔地上，后来大家就劝他别这样，结婚呢，好不容易安抚下来，有人就说，你把彩礼捡起来吧，看看到底给你多少钱，结果他捡起来一看，是一张存折，上面显示有十万元存款。

原来老丈人并不是想要从男方家捞什么钱，只不过就是认为按照自家风俗这些时必须的，否则女儿嫁的太不风光了。仅此而已。

故事中的这位朋友又是怎么推断的呢？他所得到的信息仅仅是他的丈人坚持要他给礼钱，他并没有得到关于丈人这么做的意图的信息。丈人的意图只是他自己的推断，他对丈人意图的推断只是一种可能性，并非唯一的可能性。然而他仍然还是不可避免地陷入了对自己推断的过分信任的陷阱，一旦脆弱的自尊被触发，接踵而来的便是一连串情绪化的、自动化的行为（仿佛汽车挂上了自动挡）。

想一想生活中有多少误解是由于自以为是地对别人的意图的误读而导致的呢？

我们总是混淆“事实”和“推断”，尤其是当我们对推断的确信度很高的时候，或者某种推断对我们有利的时候，或者当这个推断源于大脑天生的偏见的时候，例如，将关联误当做因果就是我们的认知死穴之一：

（图片注：荣耀属于xkcd）

松鼠会的新书发布的时候，姬十三发布了一个页面作了简介，我跳转过去浏览了一下，看到介绍的结尾跟着一段话：

我就感到奇怪，当彩色的声音尝起来是甜的是松鼠会诸多作者的作品合集，为什么这里作者简介只写姬十三呢？我想当然地把这里的作者简介当作了是新书的作者简介，我心想：那难道还有什么可能呢？（这同样也是我们的认知偏差之一——把“想不出其他可能”当做“没有其他可能”）。然而老婆又适时地泼来一盘冷水（我为什么要说又呢？）：这里的作者简介难道不可能是这篇--BO文的作者简介？我一想，也是啊。要证伪我原来的假设很简单，翻开另一篇--BO文就知道了。于是我随便打开松鼠会网站上的另一篇--BO文，果然这里的作者简介是--BO文的作者简介，而非（我原来所猜测的）新书的作者简介。

但是，关键是，原先我并不知道松鼠会的--BO文有这么一段作者简介，因而就我原来所持有的知识而言，我作出的推断是唯一靠谱的，这也是为什么我感到如此确信的原因之一。而且，由于我不知道松鼠会的--BO文有这么一段作者简介，因而我根本无法看到或设想另一种可能性。既然想不到另一种可能性，又怎么可能有机会去证伪我的猜测呢？当知识有硬性局限的时候，就算持有Open Mind甚至也是不够的：

（图片注：荣耀归于Matrix67）

古罗马哲学家Lucretius认为，宇宙是无限的。让我们来看一看他的经典论证。假设宇宙是有限的。我们往宇宙的边界投掷一根标-。则我们将看到以下两种情况之一：这根标-穿过边界飞向远方，这说明宇宙并无边界，它是无限的；或者这根标-一头装上宇宙边界停了下来，这说明边界外“有东西”挡住了标-，同样说明宇宙是无界的。（来自Matrix67）

我想说的是，在我们的知识体系里面还不存在“有限无界”这个概念的时候，上面的推理真的很滑稽吗？我们现在的知识体系和古希腊相比固然得到了极大的进步，但是我们真的变得更“聪明”了吗？要知道推理的引擎（演绎和归纳）几十万年来却并没有变化，我们只是站在巨人（数千年知识的积累）的肩膀上，但这个巨人的高度并不属于我们自己，我们有什么理由五十步笑百步呢？

我们太可能因为受到知识的局限性而对事物的看法产生无法消除的偏见，有时候打破这种偏见的唯一途径就是开阔视野，多积累知识，以及和具有不同知识背景的人讨论，否则就算抱着“我可能是错的”这种信念，你也不知道怎么去证伪自己的一个猜测。

召集一些人，告知他们将会参加一项学术研究计划，实验者先带领他们来到一间办公室，让他们稍加等候，一段时间之后，叫他们出来，并询问他们记得办公室里面有哪些东西。一些人声称看到了书，然而实际上办公室里面根本没有书。

这里的原理是显而易见的，我们期望在一个学术机构的办公室里面看到典型的事物——书。当我们的直接记忆并不深刻或者我们当时等候的时候并没有刻意留心屋子内的摆设和物品时，我们会依靠之前生活中积累出来的先验假设进行推理，填充记忆的模糊或空白。关于虚假记忆的研究也表明，我们的记忆并不像电脑的存储设施那样，忠实记录，然后忠实读取，而是在记录和读取的时候都是相当程度上“构建性”的，而构建所用的“素材”则是我们之前在生活中积累出来的经验。这也是为什么同一个故事经不同的人口口相传之后会出现形形色色的版本的原因。

最后再来一个例子，生动地说明了我们在平常生活中积累的偏见有多深：

问题：现在有两个孩子，张森和李梅，其中一个孩子有四个卡车玩具，你认为是谁？

问题：莉莉和丁丁谁将来更可能成为护士？

（注：荣耀仍属于Frith。以上问题演绎自Making Up the Mindp168页的英文版本）

尽管我们只拥有他们的名字，名字本身只是任意的汉字，自身并不携带信息（从一个角度来说），但就连三岁的小孩也能对这两个问题给出“靠谱”的答案。

当然我们也可以说偏见代表着长期积累的生活经验，能够使我们事先就对未知对象的属性进行靠谱的预测，但另一方面，偏见也很可能成为自我实现的预言和自我妨碍的篱笆：女孩和男孩的数学智商真的有显著差异吗？但受文化影响，女孩认为自己更不擅长数学和理科，这个自我信念从两个角度产生作用，第一，它会让女生倾向于投入更少地时间在理科上，从而导致更低的理科成绩，结果进一步强化了她的“我的数学不好”的信念。这几乎是一个死循环。第二，人们为了维护对自我的信念，会拒绝接受与之相反的信息，如果那一次她数学考得不错，她会寻找外部理由，譬如“只是凑巧罢了”，虽然这种把自己看低的心理过程有点不可思议，但这的确是心理学家们实验证实的结果。

在社会文化方面，人们常用“仁者见仁、智者见智”这个俗语来指代三种现象：

1) 偏见：不同的人戴着不同的有色眼镜，对同一现象产生不同的理解或解释。是平凡的解释还是阴谋论的解释？存乎一心。

2) 立场：例如对于“生活的意义”没有统一的标准公理，因此每种生活都是合理的，各人可以持有不同的价值观，优化不同的目标函数。

3) 选择性关注：对于同一事物，不同的人关注的点不一样，象有四腿，各摸一条。

与“仁者见仁、智者见智”这个俗语的褒义色彩相反，这里除了第二点是中性的之外，另外两点都不能算是好事，譬如程序员在做项目的时候经常只选择性地关注“使用的技术是否有意思，是否有挑战性，是否好玩，我能否从中得到乐趣，是否能学到新东西”，而并不是关注最应该关注的“如何以最小成本达成项目成功”。至于第一点——偏见——就不用多说了，前文已经说得够多了。如果还觉得不够的，不妨读一读社会心理学经典之作社会性动物的冲突和偏见部分。

偏见在我们解决问题、认识世界的过程中都起到了很大的影响，并且很多时候是不好的影响。因此，让我们经常和具有不同信念和知识背景的人讨论，弥补个人经验知识的局限性导致的偏差，并时常使用以下这句话来提醒自己keep an open mind吧：

“这只是一种解释（可能），未必是唯一的解释（可能）。（想不出其他解释不代表就不存在其他解释）。”

DIG心理学讲座9：感情里的经济学

睡前故事

儿童小故事

的故事，小故事大全