《噪声》的读书笔记和读后感。
我们来看第五部分:提升五大人类判断力。
噪声读书笔记
文章目录
卓越的判断者,卓越的判断力
要有开放性思维
要想真的消除噪声,做出正确的判断,我们需要开放性思维,也就是不断地接纳不同的观点,吸收不同的意见,然后把他们加以过滤,去粗取精,去伪存真,所以我们看到,一些真正的专家,往往是比较谦卑的,他们更愿意承认更多地东西,自己看不懂,也愿意去听取不同的意见
- 最典型的例子就是巴菲特,芒格专门负责反对巴菲特的意见,而巴菲特每次都认真倾听,仔细思考。通过芒格当成一面镜子,审视自己思维的误区。我们古代的君王,最高尚的品质就是纳谏,能够听取群臣的意见
- 而最愚蠢的品质,则莫过于刚愎自用。比如崇祯,你不能说他不努力,但是最大的问题就是刚愎自用,总觉得有刁民想害朕。结果没人再给他出主意。甚至他的历史地位可能还不如他的木匠哥哥天启,很多史学家认为,他要是不折腾,没准大明朝还真不至于灭亡
消除偏差与决策卫生
事后及事前消除偏差
我们消除偏差和噪声,纠正判断的方式主要有两种,要么在做出判断后进行及时的纠正,要么在判断之前,进行一定的干预,事后纠偏主要靠的是监管,边打边调整,而事前干预,则要求更高。接下来那我们来讲讲,哪些办法可以有助于我们事前消除噪声。
如何在事前消除噪声
该如何在事前消除噪声,这个主要也分为两大类方法
- 一个是助推,也就是说我们利用人性的弱点,达到正确的目的,比如在小便池里放一个苍蝇的图案或者摆上一个小球门,那么在男士小便的时候,就更倾向于瞄准这些东西。从而防止尿液四溅
- 另一种事前消除噪声的方法,就是真的要克服偏差了。这种方式最大的难点在于,如何认识到,一个新问题,与我们在别处所见到的问题有相似之处,而我们曾在某处缩减的偏差,很可能也会在其他的地方出现。说的非常绕,简单来说就是这些错误,之前出现过没有。比如在售楼处,你们受到销售的压迫,做出的买房决策,会出现很大的偏差,所以我告诉你,他说的天花乱坠,你也不要买,回家冷静一宿之后,第二天还要买。那么你再去买。
无论是事后纠偏,还是事前消除,他们都有一个共同点,针对的都是某种被人们假定存在的偏差,也就是说他真的存在,而且你还能识别他,但是现实中,其实很多偏差,你不觉得他是个偏差,甚至不觉得他有什么问题。
决策观察者
这个时候,作者建议,说不要再决策前后进行偏差检测,而要在决策的过程中进行,不过人们通常都不会认为自己有问题,那么这时候,你需要引入另外一个第三方,叫做决策观察者。让他站在第三方的视角上,审视你的整个决策过程,是否出现了偏差和噪声。观察者其实是可以训练出来的,毕竟给别人挑毛病,要比否定自己容易的多。从理论上来说,查理芒格就是一个决策观察者,所以和巴菲特搭档了几十年。
最好这个决策观察者,跟你没什么利益关系,如果你给他发工资,那么他很难对你提出有效的意见,如果你俩本身就不对付,他也看你不顺眼,那么也不能起到 太好的辅助作用,最好的观察者就是客观。叫做对事不对人。这样的话效果会好很多。
一些组织中,可以设置自由监督员,来成为决策观察者,监督员不仅需要监督项目团队提案的内容,还要特别注意,提案产生的过程,以及团队的动态,这个会让决策观察者,对于可能影响提案过程的偏差,有所警觉。还可以专门任命一个人,担任偏差破坏者,他是在团队中唱黑脸的角色,只负责提示风险,把别人想到的方案,反过来考虑。如果再有条件,甚至可以建立外部观察人员,但是前提是,需要花费更高,也不利于保密,像一些超级大企业,通常都会有外部咨询顾问,就是来帮助企业消除决策偏差。
决策卫生
偏差和噪声
之前一开始我们就说了,偏差和噪声是不同的,偏差是有方向性特征的,所以你拉回来一点就行了,但是噪声就比较困难,他没有特别明确的方向。噪声就是不可预测的误差,既不容易看到,也不容易解释,很容易被我们给忽视掉。
作者说噪声就像是生活中的细菌一样,肉眼看不见,但是却又真实存在,不小心吃进去,会造成不可预知的疾病,我们减少噪声,就跟洗手一样,要实现决策卫生。消除掉这些病菌。当然,可能到最后,你也不知道,到底减少了哪些噪声。消除掉了哪些错误。
司法科学,信息排序是最大的噪声
对任何结果都保持怀疑
比如我们的司法过程中,大家都觉得指纹比较靠谱,但是指纹的鉴定过程会不会有错呢?作者说,根据大量的数据判定,这里面也存在着很大的噪声干扰。所以最后出现了不小的误差
- 比如有些嫌疑人有完美的不在场证明,导致了在指纹鉴定的时候,可能就没有那么严格的去比对。遗漏掉了一些线索。
之前我们说过,哪里有判断,哪里就一定有噪声,我们要想消除噪声,必须得先承认他的存在,不要认为任何东西是完美的,我们最好对任何结果都保持怀疑。然后我们需要在程序上进行不断地优化。以达到洗手的目的
- 比如那些做指纹鉴定的人员,最好完全不知道谁是犯罪嫌疑人,也不要先入为主,知道谁有不在场证明。让检测人员和办案人员相互独立,这才能起到决策卫生的作用
- 这其实跟我们之前说的金融决策和交易完全分开,是一个道理。交易独立,让基金经理也不知道,什么时间会成交。会以什么价格成交。甚至现在投资决策委的东西
- 这就是备菜的和炒菜的不是一个工种,炒完菜之后端出去的也是另外一个人
甄选与汇总,超级预测的两大策略
改进预测的两种方法
对于判断过程中减少噪音,作者也给了一个建议,这就是汇总多种独立的评估结果,也就是说让多个专家,各自独立评判,互不干扰,然后拿到结果之后取得平均值。平均值通常会减少噪声
- 如果你取了100个判断的平均值,那么就减少了90%的噪声,如果你对400个独立判断,取平均值,那么会减少95%的噪声。基本上就能够起到消除噪声的作用了
- 这大概就跟我们当年那种青歌赛的打分方式差不多,你不是强烈看好吗,我去掉一个最高分,还有人强烈看衰,我再去掉一个最低分,然后上百个评委打分最后平均,就得到了一个歌手的最终成绩
- 现在投资圈也在这么干,把研报的数据做汇总,去掉最高的预测,去掉最保守的预测,用中间报告做平均,但是有的时候找不到太多的报告。不过这种方法,需要最后再消除一下情绪上的偏差。也就是说,牛市以来,很可能是集体乐观的。所以要把这个偏差扣除掉才行。
总结一下,改进的办法就是两个,选择更好的判断者,做出更加专业的判断,另一种是汇总多项独立判断的结果,取的平均值。现在其实美国很多民调数据,就是这么来的
- 比如美国大选之前,就是有民调数据来预测结果,但这个也只是一个概率,与最后的真实结果并不一致,比如在最近两次美国大选中,希拉里拜给特朗普,以及特朗普输给拜登,其实都挺意外的。跟民调数据的统计并不相符。确实有些智者,预测的概率可能会稍微高一些,他们通常智力过人,而且十分懂得如何去运用自己的智慧。
训练出更高的预测水平
但是一般人要想达到一个更高的预测水平,则需要被训练。作者说有三种方式。
培训,也就是逻辑推理,从而寻找更大概率的可能
- 比如一些棋牌类的培训,其实就是这一类,教你记牌,然后根据数据,判断未来更大的获胜概率在哪?
团队合作,也就是之前说的汇总判断,利用不同人的判断,来实现最终的预测
- 比如金融行业中的分析师指数,主动基金指数,其实都是这个意思。
甄选,对所有预测者打分,然后不断的末位淘汰,精英晋级,从而找到超级预测者
- 这也类似于市场机制,看错方向的人就被淘汰了,看对方向的,就会越做越大。对市场越来越敏感。
这三种手段,都是非常有效的,也可以快速的改变我们的预测结果。前两个是我们可以马上就能用的方法,一定的学习,可以让你马上改变看待事物的角度,同样的通过团队的力量,也可以马上给你规避掉很多的错误。至于甄选精英,这个需要有一个漫长的过程。也需要你有足够的话语权才行。否则人家凭啥听你的。
医疗决策,用科学的诊断指南减少噪声
设备替代医生的诊断
现在医院看病,动不动就让你去做检查,其实就是要用一整套设备逻辑,来取代医生判断的噪声干扰
- 比如你的血糖升高到一定程度,就是糖尿病,无需医生再给你做出判断。而设备化验的判断,是几乎没有噪声干扰的。无论你多大岁数,只要是指标到了,就是一样的结果
未来这也是现代医学的一个重要方向,会有越来越多的设备替代医生的诊断,甚至很多可穿戴设备会在生活中一点一滴的收集你的数据
- 比如有人一到医院 就会血压升高,而在家里没事,这就是医院这个场景,形成了明显的噪声。未来大量的长期个人数据的收集,会逐渐取代医疗上的各种判断
上面我们说到了,医学当中减少噪声的方法,就是尽量用设备数据,取代医生们的判断,未来机器取代医生,会是一个逐渐的过程。另外,医生们也会继续增加培训,然后也会增加会诊,这些都是减少噪声的方法,未来的医学会越来越多的依赖算法,这个过程,可以减少偏差和噪声,同时可以大幅削减成本,挽救更多的病人生命。一套机器再贵,他也能快速复制,而好医生的培养,却始终十分稀缺,所以医疗资源始终不平衡。如果医疗算法标准化了,很多疾病,其实都可以在当地得到救治。
但客观来说,现在医生的手术价值,机器还没办法取代,啥时候机器能够替医生去做手术了,那么医生的职业危机也就来了。医生的疲劳程度,其实严重影响了他们的判断力,这个对于患者来说,是很不利的一种噪声。
绩效评估,用基于外部视角的共识框架做出量化判断
绩效评估也是一种判断
下面我们再来说说绩效评估,一般公司都会有绩效评估,1-5分,5 是特别出众,1是表现很差,不高不低就是3,稍微好一点就是4,大家往往都会息事宁人,给个3分就算了。
但其实绩效评估也是一种判断,而这里面噪声非常的大,甚至绝大部分都是噪声
- 作者说,一个员工的绩效差异可能不会很大,也就是20-30%,但是在不同的人眼里,却往往有70-80%的差异,这些肯定都是噪声。那么这些噪声从哪来的
- 比如尺度,对于某些员工你可能比较宽松,对于某些员工则会比较严格,这有多种因素,不能说是完全的偏见,有时候领导非常想要培养的员工,反而会对他们高标准严要求,而那些已经块退休的,基本就没人管了
- 所以最后很多人可能都会感到不公平,凭啥他上班迟到就没事,我就得被扣罚奖金。这就属于是,不能领会领导的意图,往往领导看到之后,也就会对他放弃培养。既然你自己不上道,那就没办法了
还有一种噪声就是心情,有些人很会拍马屁,而有些人自认为耿直,天天怼领导,那么评估绩效的时候,他肯定是不可能一碗水端平的。现在很多公司,为了绩效公平,研究了360度绩效汇总反馈系统,不光是领导给下属打分,下属还要给领导打分,然后同级别之间还要相互打分,这种做法看似公平,但其实问题也不小,因为他成倍的增加了人力资源的反馈成本,相当于大家天天都在打分了,也就别干什么事情了,而且领导和员工的权责是完全不对等的,底下的员工也肯定会站队领导一边,所以你跟领导对着干,给领导打低分,最后结果还是一样,会被领导和他的拥护者集体干掉。所以360度复杂评测,不但无效,反而有害。
排名,但不强制
后来,有的公司用了一套排名法,也就是你把员工按照好坏做个排名,不打分。这样无论这个领导要求严格,还是要求宽松,他给出的排名都是一样的。这就减少了息事宁人的那种噪声。这其实就跟高考有点类似,你行不行,不是老师说了算,都得拉出来,拿成绩说话,而且成绩还要排名,只有这个排名是最重要的。所有的录取分数线,都是从排名中来。他虽然有这样或者那样的问题,但就目前这个体制来说,高考成绩排名制,反而是最为公平的方式方法。那么公司的绩效评估其实也是一个道理,用成绩说话,然后拿排名做为升级,持平,降级的参考。这样很多人也就无话可说。
作者说,排名可以,但是不要强制排名,强制排名会让人引起极度不适,会让人感受到适得其反,这反过来也会增加噪声。绩效评估这种事,是一把双刃剑,耗费大量的工时不说,还会打击员工的积极性。有的公司,为了能让绩效评估量化,还是用了相对量的标准,也就是说,找到一大堆案例,比如这样做你会的到什么分数,排在什么名次,那样做你会得到什么评估结果。但是这其实又进一步增加了绩效评估的复杂性,其实绩效评估这种事,一般大企业才去干,小企业实在没必要,绩效评估会严重影响公司的效率,这其中绝大多数都是噪声的干扰。所以在你没有特别明确的标准之前,最好慎重。这玩意实在是比较耽误事。其实很多公司都存在着过度管理的问题,一共就几十个人的小公司,你做什么绩效管理,这时候其实靠的并不是管理,而是热情和同样的价值观。
人员招聘,以结构化指标衡量人才
怎么去掉面试中的噪声
下面我们看人员招聘,这其实也是要通过面试官来进行直觉上的判断,而依据就是面试者所回答的一些问题,但这个中间有很大的风险,因为说归说,做归做,完全不是一码事,有的人说的时候天花乱坠,但是实际做起来,则完全不是一回事。所以招聘的时候,失败率是很高的。经常招来的人并不理想。所以面试中,其实也存在着很多噪声,面试官更倾向于找跟自己相似的求职者。面试也是心里偏差的重灾区,大家与自己相似的人,聊天会显得更加的舒服,也倾向于找到一些,跟自己想法相同的人。所以面试官,找来的都是自己看着顺眼的人。不同的面试官,挑选出来的候选人,可能会完全不同。偏离度也会比较大。
另外,面试中,还会有很多其他的噪声,比如环境,疲劳程度,还有心情,穿着,第一印象等等。有时候在第一印象中,你可能就已经输了。一些善于表达,开朗的候选人,很容易拿到第一印象分,但一些内敛的面试者,则可能会给面试官留下不好沟通的印象。如果今天他已经面试了很多人,那么遇到这种候选人,面试官可能会直接选择放弃。
那么怎么改变,怎么去掉面试中的噪声,一个常见的方法,就是通过不断地多轮面试,然后拿到一个面试官的评分汇总,比如谷歌,有时候会让一些面试者参加25轮面试,但这显然太过于繁琐了。研究人员发现,其实4次面试是一个比较好的选择,在4次面试之上,再增加面试的轮次,其实也不能再提升预测效度了。
中介评估法,做出明智决策的核心方法
之前我们也说了,汇总肯定是一个有效的消除噪声的方法,但是前提是判断必须是独立的,谷歌后来把人事决策分解成为4个中介评估法,一般性认知能力,领导力,文化契合度,和角色相关知识,也就是说,分成四个部分,去给一个面试者打分。注意,这四个方面,并不包括良好的外表,以及流畅的表达能力。也就是说,他故意用4个方向,来引导面试官,去在消除噪声的方向上去做评判。其实这也是清单法的最大好处。比如飞机起飞之前,也是一张清单,机组人员,要一项一项检查,然后画勾,这就是在引导机组人员,从头到尾的检查。不能出现纰漏。如果没有这个清单,那么机组成员会有先入为主的印象。
做投资其实也是如此,一家公司能不能投资,也应该进行清单检查。比如基本面,包括利润率,营收,增长率等等,估值包括市净率,市盈率,市销率,市场最高估值和最低估值,分别都在什么位置。现金流贴现法,还有情绪面,是否存在市场预期差,这些都应该建立清单,在投资之前,应该一一对应的建立清单。这样才能降低噪声,防止遗漏。
接着说,招聘的事,结构化判断,还要做到独立,不要让面试官聚在一起打分。然后建立一个基本的量化评估表格,给出一定的案例,作为标准,比如什么叫做认知能力高,有没有哪些具体的要求。最后,在完成了所有面试后,招聘委员会,共同来汇总资料,结合每次面试的评分,出具招聘意见。从本质上来说,这还是一种判断,但是这种判断,依赖于客观的分析和证据的收集。
我们简单来总结一下,所谓中介评估法,就是避免直觉判断,1要独立评估,2要有具体的事项,3要汇总平均,这些手段,就跟我们洗手消除病菌一样,虽然你不知道他消除的到底是什么噪声,但是肯定会起到,相对客观的作用。