什么是图灵测试?为什么它很重要?

什么是图灵测试?为什么它很重要?

什么是图灵测试?为什么它很重要?_爱车智能_智能网联

图灵测试应该发展吗?


如果你有过人工智能(AI)的经历,你肯定听说过“图灵测试”。这是阿兰·图灵在1950年首次提出的一个测试,这个测试是为了测试人工智能是否达到了人类水平的智能而设计的。从概念上讲,如果人工智能能够通过测试,那么它所获得的智能与人类相当,或者说与人类没有区别。


我们将探讨谁是艾伦·图灵,测试是什么,为什么它很重要,以及为什么测试的定义需要进化。


谁是艾伦·图灵?


图灵是一位古怪的英国数学家,以其开创性的未来主义思想而闻名。


1935年,22岁的他在概率论方面的工作为他赢得了剑桥大学国王学院的奖学金。他的抽象数学思想推动他在一个尚未发明的领域朝着完全不同的方向发展。


在1936,图灵出版了一份现在被公认为计算机科学基础的论文。在这里,他发明了“通用机器”的概念,可以解码和执行任何指令集。


1939年,图灵被英国政府的破译部门招募。当时,德国正在使用一种被称为“谜机”的东西来加密其所有的军事和海军信号。图灵很快开发了一种新的机器(“炸弹”),它能够在工业规模上破解谜语信息。这一发展被认为有助于击退纳粹德国的侵略。


1946年,图灵回到了1936年出版的革命性思想的工作中,开发了一台能够运行各种计算的电子计算机。他为所谓的自动计算引擎(ACE)做了一个详细的设计


1950年,图灵发表了他的开创性著作,“机器是否能思考?”, 这篇论文彻底改变了计算机科学和人工智能。


1952年,一个年轻人向警方报案后,图灵因其同性恋活动被判犯有严重猥亵罪。由于这个原因,他的政府安全许可被取消,他的职业生涯也被摧毁了。为了惩罚他,他被化学阉割了。


1954年6月8日,他在家中被清洁工发现。他前一天死于氰化物中毒。一个吃了一半的苹果躺在他的尸体旁边。验尸官的结论是自杀。


幸运的是,他的科学遗产继续流传。


什么是图灵测试?


1950年,艾伦·图灵在《心灵》杂志上发表了一篇开创性的论文,题目是“计算机械与智能”。在这篇详细的论文中,问题是“机器能思考吗?”。文章建议放弃对机器是否能思考的定义,而用“模仿游戏”来测试机器。这个简单的游戏有三个人玩:


一个男人(a)


一个女人(B),


审讯者(C)可能是任何性别的审讯员。


这个游戏的概念是审问者呆在一个与男人(a)和女人(B)分开的房间里,目的是让审问者确定谁是男人,谁是女人。在这种情况下,男人(A)的目标是欺骗审问者,而女人(B)可以试图帮助审问者(C)。为了公平起见,我们不能使用语言提示,而只能来回发送打印的问题和答案。问题就变成了:审问者如何知道该信任谁?


审问者只知道它们的标签是X和Y,在游戏结束时,他简单地声明要么是“X是A,Y是B”,要么是“X是B,Y是A”。


问题就变成了,如果我们把男人(A)或女人(B)移开,用一台智能机器代替那个人,机器能用它的人工智能系统欺骗审问者(C)相信是男人还是女人吗?这本质上就是图灵测试的本质。


换句话说,如果你在不知情的情况下与人工智能系统交流,并且你假设另一端的“实体”是人类,那么人工智能会无限期地欺骗你吗?


为什么图灵测试很重要


在阿兰图灵的论文中,他提到了这样一个事实:他相信图灵测试最终会被击败。他说:“到2000年,我相信在大约50年的时间里,将有可能对存储容量约为109的计算机进行编程,使它们能够很好地玩模仿游戏,这样一个普通的审问者将不会有超过70%的机会在五分钟的讯问后作出正确的识别。”


当用现代镜头观察图灵测试时,人工智能系统很有可能欺骗人类五分钟。人类与支持聊天机器人互动的频率有多高?不知道聊天机器人是人类还是机器人?


有很多关于图灵测试通过的报告。2014年,一个名为尤金·古斯曼的聊天机器人项目模拟了一名13岁的乌克兰男孩,据说在阅读大学组织的一次活动中,通过了都灵测试。聊天机器人显然说服了伦敦皇家学会33%的法官相信这是人类。尽管如此,批评者很快指出了测试的不足之处,这么多法官不相信,测试持续时间只有5分钟,以及缺乏这一成就的即将到来的证据。


2018年,在谷歌助理协助下的谷歌双工预订系统,致电发廊预约理发。在这种情况下,AI系统并没有将自己介绍为AI,在电话通话中,当与沙龙的接待员交谈时,假装是人。经过短暂的交流,理发成功安排,双方挂断了电话。


然而,它是一个自然语言处理(NLP)的时代,它的自然语言理解(NLU)和自然语言解释(NLI)子领域,需要问这个问题,如果机器在不完全理解机器背后的上下文,而问和回答问题,它说的机器是真正智能的吗?


毕竟,如果你回顾一下沃森背后的技术,这是一个能够回答自然语言提出的问题的计算机系统,是由IBM为击败《危险边缘》冠军而开发的,那么很明显沃森能够通过互联网下载世界上大部分的知识来击败世界冠军,没有真正理解这种语言背后的背景。有2亿页的信息,来自各种来源,包括维基百科。当时有一个限制,沃森不能在玩游戏时访问互联网,但这只是一个小限制,对于一个可以在游戏开始前访问所有人类知识的人工智能来说。


与搜索引擎相似,本文提出了关键词和参考点。如果人工智能能够达到这种理解水平,那么我们应该考虑,基于当今的先进技术,欺骗一个人5或10分钟,根本就不能把门槛设置得足够高。


图灵测试是否应该演变?


图灵测试在经得起时间考验方面做了出色的工作。然而,自1950年以来,人工智能已经发生了巨大的变化。每次AI取得一个壮举,我们都声称只有人类才能把门槛设置得更高。直到AI能够像我们所理解的那样,持续通过图灵测试,这只是时间问题。


回顾人工智能的历史,人工智能能否达到人类水平的智能,最终的晴雨表几乎都是基于它能否在各种游戏中击败人类。1949年,克劳德·香农发表了他关于如何让计算机下棋的想法,因为这被认为是人类智力的终极高峰。


直到1996年2月10日,经过一场艰苦的三小时比赛,世界象棋冠军加里·卡帕罗夫才输了与深蓝色的六场比赛的第一场比赛,后者是IBM电脑,每秒能评估2亿步。不久,国际象棋才被认为是人类智力的顶峰。后来国际象棋被围棋所取代,这是一种起源于3000多年前的中国游戏。人工智能实现人类智力的障碍被提升了。


快进到2015年10月,AlphaGo与三届欧洲冠军范辉进行了首场比赛。AlphaGo以5比0赢得了有史以来第一场与围棋职业选手的比赛。围棋被认为是世界上最复杂的游戏,有10360个可能的玩法。


最终,争论是AI必须能够击败MMORPG(大规模多人在线角色扮演游戏)的球员团队。OpenAI通过使用深度强化学习迅速地迎接了挑战。


正是由于这条谚语的不断移动,我们应该重新考虑图灵测试的一个新的现代定义。目前的测试可能过于依赖欺骗,以及chatbot中的技术。潜在的,随着机器人技术的发展,我们可能要求人工智能真正实现人类水平的智能,AI需要在我们的实际世界中与游戏环境或具有其定义规则的模拟环境进行交互和“活”。


如果机器人不欺骗我们,而是可以像其他人一样与我们互动,通过交谈,提出想法和解决方案,也许只有这样图灵测试才能通过。图灵测试的最终版本可能是当人工智能接近人类时,并试图说服我们它是自我意识的。


在这一点上,我们也将实现人工通用智能(AGI)。届时,人工智能/机器人将不可避免地在智能上超过我们。

51
3
0
90

相关资讯

  1. 1、好莱坞电影再纳“英雄”成员中国屡屡拯救世界4384
  2. 2、当林心如和贾静雯素颜出境时,终于见识到女神和少女的区别了4256
  3. 3、快讯!《第十一回》等10部影片集中上映,2021年清明档,会爆发吗?2194
  4. 4、“抖森”聚会绅士手再度上线好男人将在《复联4》回归1661
  5. 5、《山海情》《大江大河2》……哪部最打动你?2558
  6. 6、牛年春节档票房连续三天单日破10亿4322
  7. 7、刘德华肖央阴差阳错“交换人生”,荒诞喜剧《人潮汹涌》重磅来袭2367
  8. 8、尴尬了!古驰家族谴责电影《古驰》:感觉受到冒犯2782
  9. 9、曾经的天涯四美怎么样了?三个都回家带娃了,钟汉良还在演偶像剧2731
  10. 10、《城市游戏》发窦骁陈妍希特辑吻戏床戏首曝光817
全部评论(0)
我也有话说
0
收藏
点赞
顶部