爱瑞丝·博内特(Iris Bohnet)是哈佛大学肯尼迪学院女性及公共政策系主任,同时兼任该学院行为洞察小组(Behavioral Insights Group)联席主席。
博内特认为,公司正在多样性培训上浪费金钱,多数项目根本没有成效。她说,与其开展更多研讨会或试图消除导致歧视的偏见,公司还不如重新设计流程,从一开始就杜绝带有偏见的选项。
在接受《哈佛商业评论》英文版高级编辑加德纳·莫尔斯(Gardiner Morse)采访时,博内特讲述了如何利用行为设计消除偏见并激发潜在才能。
HBR:组织在促进平等和多样性方面下了很大功夫,但仍然不见成效。是它们采取的方法不对,还是不够努力,抑或两种原因都有?
博内特:以上两种情况都在一定程度上存在。坦白讲,我现在最关注的是想要采取正确方法,但又不知道怎么做的公司,以及那些花大价钱解决问题,却未取得多少成效的企业。比如很多公司开展多样性培训,却不评估这些项目的成效。哈佛大学的弗兰克·多宾(Frank Dobbin)及其他诸多研究者调查了公司多样性培训项目取得的成果,发现这些项目基本上都没有改变参与者的态度,更不用说行为了。
我鼓励所有认为自己项目有效的人,实际评估并记录下项目成效。这将是一项极其重要的工作。我正在试图说服公司、NGO和政府机构以处理财务决策和市场战略的严谨态度来对待人事管理。市场人员长期以来都使用A/B测试评估项目是否有成效。HR部门也应这样做。
HBR:什么算是多样性评估?
博内特:一个比较好的例子是约翰·多维迪奥(John Dovidio)所做的班级实验。他和耶鲁同事针对61个班的一二年级学生进行反偏见培训,并评估培训成效。大概30个班的学生随机接受4周反性别、种族和体型偏见的培训,目的是让这些学生更包容与自己不同的人。另外一半学生没有接受培训。该项目对孩子们与他人分享和玩耍的意愿基本上没有任何影响。这不代表你不必教孩子学会包容,只能说明增强人们的包容意识非常困难。我们须不断收集数据,从而得知最有成效的培训方法。
所以,公司可以从上述实验中学到的一点是,对所有试行项目都采用相同的评估方法:随机抽选一组员工,为他们提供培训,随后将其表现与控制组作比较。你要提前定义什么是成效。如果组织不希望培训项目只是按既定流程办事,就必须认真考虑自己想要改变什么,以及准备如何评估改进项目是否取得成效。
HBR:除评估成效外,行为科学还告诉我们做什么吗?
博内特:首先要承认,我们都固守自己的想法。消除偏见很难,但我们可以改进组织,帮助自己保持公平公正。《哈佛商业评论》读者可能知道管弦乐队自20世纪70年代开始使用盲选方法的故事。这个例子很好地诠释了行为设计对公平的促进作用。当时的问题是美国大型管弦乐队中女性演奏者只占不到10%。原因不在于女性的演奏水平不如男性,而是面试官抱有偏见。所以管弦乐队开始让音乐家在窗帘后试奏,于是面试官无法得知对方性别。哈佛大学的克劳迪娅·戈尔丁(Claudia Goldin)和普林斯顿大学的塞西莉亚·劳斯(Cecilia Rouse)指出,这一简单的改变对推动管弦乐队中女性比例升至现在的将近40%,起到重要作用。该成果并不源于思维模式的改变。实际上,当时一些最负盛名的管弦乐队指挥深信自己不需要窗帘,因为他们必定比任何人都更关注音乐的品质,而非对方看上去是否合乎规范。但现实情况则与其想法大相径庭。
HBR:所以这是个好消息。行为设计是有效的。
博内特:是的,的确如此。窗帘排除演奏者的外貌因素,乐队指挥得以更轻松地发掘人才。一方面,我如释重负地得知每个人都会受偏见影响,不管他们是否意识到偏见的存在,或动机是不是好的。另一方面,我也感到很沮丧,因为即使是我们中那些致力于推进平等和多样性的人也受偏见所累。
我就是其中之一。几年前,我第一次带儿子去哈佛幼儿园时,迎面走过来的老师中有一个人是男性。我想转过头就走。这个男人不符合我对幼儿园老师外貌的期望。当然,后来我发现他是一位细心体贴的老师,再后来他还成为我们家可靠的保姆——但我不能控制自己最初的直觉反应。我只在初见面那几秒钟内抱有性别偏见,但这件事直到现在还困扰着我。
眼前所见即脑中所想。也就是说,如果我们要改变自己的思维,就必须看到有悖于刻板印象的实例。而在看到更多男性幼儿园老师或女性工程师之前,我们需要用行为设计帮助抱有偏见的自己恢复公平公正,同时打破直觉反应与实际行为之间的关系。
HBR:有什么比较好的组织行为设计案例吗?
博内特:我们可以谈谈存在严重偏见问题的招聘和人才管理。你不太可能让应聘者坐在窗帘后,但可以利用软件取得同样的效果。我特别喜欢能让雇主忽略应聘者个人背景的Applied、GapJumpers和Unitive等工具。这些软件能帮助人事部经理排除简历中有关年龄、性别、教育和社会经济背景等方面的信息,让他们专注于人才本身。
另有大量文章介绍消除面试流程中偏见的方法,基本可归纳为:别用直觉作判断。那些由面试官凭借自己感觉判断应聘者是否适合应聘职位或有无潜力的随意面试,基本上就是在浪费时间。你要系统性地安排面试:让每个应聘者都按同样的次序回答同样的问题,并按次序实时给他们的回答评分。
HBR:完成招聘后又该怎么办?之后怎么针对管理者的偏见作行为设计?
博内特:采取同样的原则:尽最大努力不用直觉思考并依赖可靠数据。比如员工升职应基于客观评估得出的绩效,而非老板对他们的感觉。这听上去并不出奇,却很少被实践。
但你要谨慎使用数据。使用错的数据和不用数据同样糟糕。举例来说,很多管理者将下级的自我评估作为绩效评估的一部分。但如果员工自信程度(或者说乐于自吹自擂的程度)不同的话,管理者对他们的评估就会出现偏差。乐于自我宣传的人给自己的评分更高。大量针对锚定效应(anchoring effect)的研究表明,不管是谈判还是绩效评估,我们都会受对方给出的数据影响。所以管理者看到员工自我评估中虚高的分数后,会不自觉地给他们更高一些的评价。同样,如果员工自我评估分数较低,即使分数不准确,管理者也会给他们偏低的评分。
这是个严重的问题,因为两性和不同文化之间都存在自信方面的明显差异。坦白讲,男性比女性更容易高看自己,也就更有可能自吹自擂。一项涵盖将近100份独立样本的研究发现,男性会认为自己是比女性更有效率的领导,而实际上他们的效率远不及女性。另一方面,女性更有可能低估自己的能力。比如多个研究显示,女性会低估自己的数学能力,并认为自身水平再提高一些才能攻读更难的数学课程。此外,女生比男生更有可能放弃成绩没达到自己期望的课程。所以在管理者做出决定前,别和他们分享自我评估。他们的判断很可能不是公正的,而且我还没看到过任何证据能证明,分享自我评估有益于员工或组织。
HBR:但取消所有存在偏见的管理活动也许是不可能的吧?
博内特:对的。但你可以改变管理流程。这里要指出的一点是,管理者应查看自己采取的“性别中立”措施是否实际造成了不公正的后果。以SAT考试为例,考生成绩本不应受性别因素影响,但结果正相反。在以往的考试中,考生会因多选题选错答案而被扣分。因此靠猜想答题会有风险,而这对考生,尤其是女生的影响很大,俄亥俄州立大学的凯蒂·保迪佳·考夫曼(Katie Baldiga Coffman)所作研究提供了佐证。在能力相同的考生中,男生靠猜想答题的可能性更大,女生则更可能因为害怕扣分而选择跳过问题,最终得到偏低的分数。凯蒂的研究表明,考生在猜答案方面表现出的性别差距在很大程度由男女在承担风险方面的差异导致。新SAT考试并不侧重改变学生对风险的态度,而是为不同风险容忍度作出调整。毕竟,SAT评估的是才能,而非对风险的接受程度。
组织应借鉴SAT改进流程的方式:调查并确定既有流程是否偏好某一性别,使某些人没法尽全力工作。比如开会时,最乐意侃侃而谈的人有优势吗?如果是,你有没有利用一些会议模版让所有人都处于平等的地位?
HBR:公司如何着手改变?
博内特:从收集数据开始。我任哈佛大学肯尼迪学院院长时,有一天上班发现一群学生在我的办公室门前等候我。他们对本学院中女性过少表示担忧。或者我当时是这样以为的。但出乎意料的是,他们告诉我给他们最大困扰的不是本学院教师中女性人数过少,而是女生缺少学习的榜样。他们希望在教室中、座谈会上和讲台后看到更多女性领导者教课、做研究和咨询。实际上,我们从来没有关注或评估过肯尼迪学院中授课者的性别比例。
于是我们着手调查,而结果和多数第一次收集类似数据的组织一样:数据显示情况并不乐观。
但好消息是,你在收集并研究数据后就可以做出调整并评估进度了。MIT于1999年承认曾在无意中歧视女教师。研究人员通过查看数据发现,两性在薪酬、空间、资源、奖项和处理校外工作机会方面都存在差异。这些数据带来了实际改变。2011年发表的后续调查表明,理工科女教师增长一倍,还有几位女性进入高级领导层。
改变人们的观念,首先要改变他们的人生经历。如果你身边都是一些外貌与你相似的榜样人物,你就能想到像你这样的人可能有什么成就。比如华盛顿大学的沙普纳·切理恩(Sapna Cheryan)就证明,计算机科学系教室的装饰能影响成绩。将主要描绘男性的《星球大战》和《星际迷航》图片换成不涉及性别的艺术和自然图片,让女生更容易联想到女性也可以在计算机方面有一番事业。另一研究显示,客观来看,相比在公众演讲前看到比尔·克林顿(Bill Clinton)照片或什么都没有看到的女性而言,看到希拉里·克林顿(Hillary Clinton)或安格拉·默克尔(Angela Merkel)照片的女性表现得更为出色。