关于人工智能的思考——是否要将决策权赋予AI

你会让人工智来替你做决定吗?随着关于人工智能的讨论和对其监管的呼吁言论增加(例如:显然人工智能总有一天会杀死我们所有人),我一直在思考,在什么情况下,我们会将某些领域的决策权赋予给机器(称之为人工智能)。这一切听起来并不是那么荒谬,因为人类很多年前就已经这么做了。

最简单的,我们让交通灯来决定下一个通过十字路口的车是哪一辆。很可能你会说这不是人工智能,但现在有一些更新的模型可以用更聪明的方式控制交通流量,各种传感器来监测十字路口的车辆状况智能调节红绿灯等等。我们不仅推行了这个方法,甚至赋予了会自动惩罚闯红灯的人(有照片的红灯相机),如果对他人造成伤害,会有更严厉的惩罚。

通常,信用评分是对未偿还贷款的风险评估。以前,征信报告一直是一种非常个人化的行为。如果某人想要获得银行或机构的贷款,如果有信誉良好的朋友或者邻居为他担保,那么他获得银行或机构的放宽可能性将会变大。显然,这些报告非常主观。

举个例子,飞机的起飞和降落都是飞行员操控的,但是大量飞行时间都是在计算机控制下来完成飞行轨迹,飞行员在剩下的时间只需要监督飞行即可。一般来说,自动驾驶仪就像一个额外的机组成员在协助斐讯,让飞行员能够关注更高的飞机运行指标(油压、发动机,或监测风力的大小或更平稳的高度)。在自动驾驶仪出现之前,飞行员的工作要累人得多,发生事故的风险也可能随之增加。自动驾驶仪可以追溯到20世纪20年代初,现在如果没有自动驾驶仪,可能很难以想象。

《关于人工智能的思考——是否要将决策权赋予AI》

这些是成功将决策赋予机器的例子。如果你平常关注一些科技新闻,可能会读到一些讨论自动驾驶汽车的文章,讨论各种各样的假设情景,关于汽车是否应该能够解决道德困境,决定刹车失灵时谁应该被汽车碾过去。坦率地说,我认为这些场景太牵强,而且我怀疑大多数人也不能在这些场景中做出良好的瞬间决策。

现在一个有趣的问题是,在危急时刻应该相信谁——你是听人类的,还是听机器的?这并不容易回答。例如,如果驾驶员遵循自动避碰系统而不是地面控制系统的指令,Uberlingen的空中碰撞本来是可以避免的。

另一个需要考虑的领域是心理健康问题和心理测试。人们所认为的专业人士在精神健康问题上更难以有可靠的诊断。一个叫Paul Meehl的人在这方面做了很多工作,早在1954年,他就假设机械决策比临床诊断结果更好更可靠。Meta-analyses comparing clinical 和 mechanical prediction efficiency为优于临床诊断结果提供了支持。

我们可以把对病人的监督留给机器吗?看来人类的工作做得还不够好,FDA刚刚批准了一项系统,该系统允许对病人进行持续监测,对病人进行分析,并实时发送给医院工作人员,以帮助预防意外死亡。临床试验看起来很有希望。

那么,在所有这些将决策赋予给机器的例子中,我们应该在什么时候进行赋予呢?如果有一些简单的系统在每个单独的实例中都能匹配或优于人类的决策,该怎么办?如果只是大部分时间呢?我们是否应该在任何时候,只要机器可以做这项工作,并且表现得比人类更好,机器就应该取代人类?人类应该只是监督和干预吗?任何人都可以使用自动驾驶吗?为了简单起见,让我们考虑一个简单的分类问题——例如,生病与健康。即使机器不是100%正确,或者很难理解为什么要做出特定的预测,如果人类的监督(或干预)会导致更糟的结果呢?在什么情况下让机器来完成所有的工作才有意义呢?我对这个问题没有一个好的、最终的答案,但我认为这在很大程度上将取决于人类对机器性能的感知。

我发现这非常类似于一个企业试图雇佣有能力的人。我们经常发现自己不得不雇佣律师、会计师和各种各样的专业人士来完成我们知之甚少的任务。当然,你可以聘请家庭律师来帮助准备婚前协议。如果你雇了一个比较垃圾的律师,你要等到结果出行才会意识到决策失误,这份协议可能在法庭上被判决无效。垃圾的律师可能会用一些专业知识来给你解读法律术语(但至少他们不会因为给出错误的建议而被起诉),给出不切实际的建议等等。类似于这样的其他任何类型类型的专家,你可以雇用的领域,你没有专业知识。在当今这个时代,我们利用互联网上的评论、口碑、推荐信和学校的声誉(在招聘时)以及其他的方法,来确定有能力的专家,把我们的问题委托给他们。在现实生活中,很多招聘更多的是关于业绩记录和个性匹配,而不是单纯的能力。我认为用户体验也是选择和信任AI的一个因素。

我们雇佣的一些人有受托责任,可以被追究责任,其他人不必遵循这样的标准(持牌投资顾问、经纪人,等等)。如果您让您的机器人助手gadget订购新的soap(没有指定是哪个),那么它将订购最适合您的soap,还是为公司带来补贴软件和云资源的利润率最高的soap ?这些问题将需要在不久的将来进行更多的讨论。

我还没有完全考虑到这一点,但我认为参考过去AI或算法的性能会很有用。我们可以测量人工智能/预测系统的性能,将人工智能性能与人类的性能进行比较,然后做出决定。与人工决策不同的是,如果需要,人工智能可以在数以百万计的例子上进行查询、测试、审计和改进。统计数据为我们提供了正确测试这些系统的工具,如果发现它们在某种程度上更好(多少?),我认为应该用它们来代替人类。尽管许多人担心将决策留给算法和人工智能的危险,但重要的是要记住人工智能和自动化已经在我们的生活中成功应用的实例。

 

本文翻译自国外博客文章:http://blog.markus-breitenbach.com/2018/02/14/deferring-decisions-to-/

本文为九五青年博客翻译,如需转载请在下面留言,原文如有版权问题,在下面留言板反馈,我们会第一时间处理。

点赞
  1. Jason说道:

    文章关于人工智能的思考提出了很多问题,人工智能正一步一步贴近我们的生活,不妨一起思考思考这些说远又不是很远的问题。

发表评论

电子邮件地址不会被公开。 必填项已用*标注