当前位置:主页 > AI智能 > 人工智能发展中存在的5个限制性标题,五解解千

AI智能:人工智能发展中存在的5个限制性标题,五解解千
作者:公文翰  发布日期:2018-08-30   浏览:90

人工智能的远景是宏大的,实现这一愿景所需的技巧、工具和过程还没有完全实现。人工智能似乎无处不在。我们在

\


  人工智能似乎无处不在。我们在家里和手机上都能体验到。在我们意识到这一点之前——假如企业家和贸易创新者是值得信赖的——人工智能将出现在我们购置和使用的几乎所有产品和服务中。此外,它在解决业务标题方面的应用也在飞速发展。与此同时,人们越来越担心人工智能所造成的影响:人工智能驱动自动化对工作场所、就业和社会产生的影响。

  在如Alexa、Siri和AlphaGo这样的令人胆怯且赚足流量的胜利中,有时候会使人看不清一个事实:人工智能技巧本身——即机器学习和它的子集,深度学习——有很多的局限性,仍然需要不遗余力往克服。这是一篇有关讲述这些限制的文章,旨在帮助高管们更好地懂得什么可能会阻碍他们的人工智能的发展。在此过程中,我们(Michael Chui,James Manyika,and Mehdi Miremadi)还将夸大有希看取得的进展,这些进展将有助于解决一些限制并创造一波新的机会。

  我们的观点来源于前沿工作的分析总结——研究、分析和评估数以百计的真实应用案例——以及我们与一些思想领袖、前沿科学家和人工智能前沿工程师的合作。我们一直在努力总结这种经验以帮助那些据我们所知往往只接触到他们自己的倡议,而没有很好地校准哪里才是前沿阵地,或者步调制定者已经在用人工智能做什么的高管们。

  简而言之,人工智能的挑战和局限性正在为领导者创造一个“移动目标”标题:很难达到始终处于领先的上风。同样令人挫败的是,人工智能的发展碰到了现实世界的障碍,可能会降低人们对进一步投资的爱好,或鼓励人们持观看态度。正如麦肯锡全球研究所最近的研究显示,在跨部分和部分内应用人工智能方面,领导者和落后者之间存在着宏大的鸿沟(见表1)。

\


  希看缩小差距的高管们必需能够以一种明智的方法解决人工智能标题。换句话说,他们不仅需要懂得人工智能在哪些方面可以促进创新、洞察力和决策;导致收进增加;以及进步效率,还要懂得人工智能在哪些方面还不能产生价值。更重要的是,他们必需懂得技巧约束和组织约束(如文化障碍)之间的关系和区别;缺乏能够构建业务停当、人工智能驱动的应用程序的职员;以及将人工智能嵌进产品和流程的“最后一英里”挑战。假如你想成为一名领导者,你就应该懂得一些阻碍人工智能发展的关键技巧挑战,并预备开发一些有远景的发展项目,这些项目可以克服这些限制,并有可能改变人工智能发展的轨迹。

  挑战、限制与机会

  一个有用的出发点是懂得深度学习技巧的最新进展。可以这么说,人工智能领域最令人高兴的进展是,这些发展在分类和猜测的正确性方面取得了奔跑,而且没有与传统的监视学习相关联的惯例“特征工程”有任何联系。深度学习使用大型的神经网络,它可以包含数以百万计的具有结构分层的模拟“神经元”。最常见的网络称为卷积神经网络和递回神经网络,这些神经网络通过练习数据和反向传播算法来学习。

  固然已经取得了很多进展,但还有更多的工作要做。关键的一步是将人工智能方法适用于 标题和数据的可用性。由于这些系统是经过“练习”的,而不是经过编程的,因此各种过程通常需要大批的标记数据才能正确地执行复杂的任务。获取大型数据集可能很困难。在某些领域,它们可能根本不可用,但即使可用,标识工作也可能需要大批人力资源。

  此外,很难分辨通过深度学习练习出来的数学模型是如何获得特定的猜测、推荐或决策的。一个黑盒,即使是做它的本职工作,获得的效用也可能有限,特别是当猜测或决定影响社会并产生可能影响个人幸福的后果时。在这种情况下,用户有时需要知道运作背后的“原由”,例如为什么算法可以从具有法律影响的事实调查结果到具有监管影响的贸易决策(如贷款)中给出推荐建议,以及为什么某些因素(而非其他因素)在特定情况下如此重要。

  让我们探索五种相互关联的方法,在这些方法中,这些限制和开始迎战它们的解决方案正发挥作用。

  限制1:数据标签

  目前大多数人工智能模型都是通过“监视学习”进行练习的。这意味着,人类必需对底层数据进行标记和分类,这可能是一个相当宏大且轻易出错的任务。例如,开发自动驾驶汽车技巧的公司雇佣了数百人来手工标注原型车的视频输进时数来帮助培训这些系统。与此同时,有远景的新技巧正在出现,例如流内监控(由Eric Horvitz和他在微软研究院的同事演示),数据可以在自然使用过程中进行标记。无监视或半监视的方法减少了对大型标记数据集的需要。两种有远景的技巧分辨是强化学习和天生式反抗网络(GANs)。

  强化学习。这种无人监视的技巧答应算法简单地通过试错来学习任务。这种方法采用的是“胡萝卜加大棒”的方法:对于算法在执行任务时的每一次尝试,假如行为成功,它都会得到“奖励”(比如更高的分数),反之则会得到“惩罚”。只要学习环境是真实世界的表征,通过重复,行为就会得到改良,在很多情况下甚至超越人类的能力。

  强化学习以练习计算机玩游戏而著名——最近,它与深度学习技巧结合在一起。例如,在2017年5月,它帮助人工智能系统AlphaGo在围棋比赛中击败了世界冠军柯洁。在另一个例子中,微软供给了基于强化学习和适应用户偏好的决策服务。强化学习的潜伏应用跨越了很多贸易领域。可能的情况包含,一个由人工智能驱动的交易组合在价值上分辨因收益而获得点数或因损失而失往点数;一个每次在推荐驱动的销售中获得积分的产品推荐引擎;以及因按时交付或减少燃料耗费而获得奖励的卡车路线软件。

  强化学习还可以帮助人工智能通过开发以前无法想象的解决方案和策略(即使是经验丰硕的从业者也可能从未考虑过这些解决方案和策略)来超越人类标记的自然和社会局限性。例如,最近,AlphaGo Zero系统使用一种新的强化学习方法,在从头开始学习围棋之后打败了它的前身AlphaGo。这意味着要从完全随机的游戏开始,而不是从练习人类及与人类一起玩的围棋游戏开始。

  天生式反抗网络(GANs)。在这种半监视学习方法中,两个网络相互竞争,以改良和完善他们对概念的懂得。例如,为了辨认鸟类的样子,一个网络试图区分真实的和虚假的鸟类图像,而它的对手网络则试图通过制作看起来很像鸟类的图像来迷惑它,但事实上并没有。当这两个网络互相吻合时,每个模型对鸟类的表征就变得更加正确。

  GANs天生越来越可信的数据示例能力可以显着减少对人类标记的数据集的需求。例如,练习一种从医学图像中辨认不同类型肿瘤的算法,通常需要数百万个具有特定肿瘤类型或阶段的人类标记图像。但通过使用一种经过练习的GAN来天生越来越逼真的不同类型肿瘤的图像,研究职员可以练习一种肿瘤检测算法,该算法结合了一个更小的具有GAN输出的人类标记数据集。

  固然GANs在精确的疾病诊断中的应用还远未完成,但是研究职员已经开始在越来越复杂的环境中使用GANs。这些包含以特定艺术家的风格懂得和创作艺术作品,利用卫星图像以及对地理特征的懂得,来创建快速发展地区的最新舆图。

  限制2:获取大批的练习数据集

  已经证实,使用线性模型的简单人工智能技巧在某些情况下与医学和其他领域专家的能力想接近。然而,当前机器学习浪潮需要练习数据集,这些数据集不仅要有标记,而且要足够宏大和全面。深度学习方法需要成千上万的数据记载,才能使模型在分类任务上变得相对优秀,在某些情况下,还需要数以百万计的数据记载才能达到人类的水平。

  复杂之处在于,对于很多业务用例来说,大批的数据集可能很难获得或创建(试想:利用有限的临床试验数据来更正确地猜测治疗结果)。在分配的任务中,每一个微小的变更都需要另一个大数据集进行更多的练习。例如,教一辆自动驾驶汽车在天气不断变更的采矿地点进行导航将需要一个包含车辆可能碰到的不同环境状况的数据集。

  一次性学习是一种可以减少对大型数据集需求的技巧,答应人工智能模型在给出少量真实环境演示或示例(在某些情况下甚至只有一个)时学习一个主题。在只展示一个样本(例如一辆小货车)后,人工智能的能力将更接近于人类的水平,就能相对正确地辨认一个种别的多个实例的能力。在这个仍在开发中的方法中,数据科学家首先会在模拟的虚拟环境中对一个模型进行预先练习,这个虚拟环境浮现一个任务的变体,或者在图像辨认的情况下,显示对象的外观。然后,在展示了人工智能模型在虚拟练习中没有看到的一些真实世界的变更之后,模型将利用它的知识来找到正确的解决方案。

  这种一次性的学习方法终极可以帮助系统扫描侵犯版权的文本,或者只显示一个标记后辨认视频中的公司徽标。如今,这类应用才刚刚起步,但是他们的效用和效率很可能会迅速地扩大人工智能跨越多个行业的使用范畴。

  局限性3:可解释性标题

  人工智能系统的可解释性并不是一个新标题。但是,随着深度学习的成功和采用,它也在不断发展,带来了更多样化、更先进的应用,也带来了更多的不透明性。更大及更复杂的模型使我们很难用人类的语言来解释为什么会做出某种决定(而在实时做出某种决定时就更难了)。这是一些人工智能工具在可解释性有用或确实需要的应用领域的使用率仍然很低的原因之一。此外,随着人工智能应用的扩展,监管规定也可能推动对更多可解释的人工智能模型的需求。

  有看进步模型透明度的两种新生方法是局部可解释模型不可知解释(LIME)和留意技巧(见表2)。LIME尝试辨认练习模型最依靠的是输进数据的哪些部分,以便在开发进行猜测。这种技巧每次都考虑特定的数据片断,并观察猜测结果的变更,从而对代理模型进行微调并开发一种更精确的解释(例如,排除眼睛,而不是通过鼻子来测试哪个对面部辨认更重要)。留意技巧将模型在做出特定决策时最常考虑的输进数据可视化(例如,将留意力集中在嘴巴上,以断定图像是否对人类进行了描述)。

\


  另一种已经使用了一段时间的技巧是广义相加模型(GAMs)的应用。通过使用单特性模型,GAMs限制了特性之间的交互,从而使每个用户更轻易地进行解释。使用这些技巧来揭开人工智能决策的神秘面纱,有看在很大程度上促进人工智能的应用。

  限制4:学习的广泛性

  与人类的学习方法不同,人工智能模型很难将它们的经验从一种环境转移到另一种环境。实际上,模型为给定用例实现的任何东西都只适用于该用例。因此,即使用例非常相似,公司也必需反复提交资源来培训另一个模型。

  应对这一挑战的一个远景可期的答案是学习迁移。在这种方法中,一个人工智能模型被练习完成一个特定的任务,然后快速地将学习应用到一个相似但不同的活动中。DeepMind的研究职员还在实验中展示了学习迁移的远景,在实验中,模拟练习被转移到真正的机器人手臂上。

  随着学习迁移和其他通用方法的成熟,它们可以帮助组织更快地构建新的应用程序,并使现有的应用程序具有更多样化的功效。例如,在创建一个虚拟的个人助理时,学习迁移可以将一个领域(比如音乐)的用户偏好推广到其他领域(书籍)。而且用户并不局限于数字原生用户。例如,学习转移可以使油气生产商扩大其对人工智能算法的使用,练习这些算法为其他设备(如管道和钻井平台)的油井供给猜测性保护。学习迁移甚至有可能彻底改变贸易智能:试想一个数据分析的人工智能工具,它可以懂得如何优化航空公司的收进,然后可以根据天气或当地经济的变更调整其模型。

  另一种方法是使用某种近似可应用于多个标题的广义结构的东西。例如,DeepMind的AlphaZero在三种不同的游戏中使用了相同的结构:可以练习出一种在一天内学会国际象棋的具有广义结构的新模型,然后它就可以很好地打败世界冠军的国际象棋程序。

  最后,考虑到出现试图自动设计机器学习模型的元学习技巧的可能性。例如,谷歌智囊团使用AutoML自动设计神经网络来在大规模数据集中对图像进行分类。这些技巧目前表现得和人类的设计不相高低。这是一个很有前途的发展,特别是在很多组织人才依旧短缺的情况下。元学习方法也有可能超越人类的能力,产生更好的结果。然而,重要的是,这些技巧还处于早期阶段。

  局限性5:数据和算法中的偏差

  到目前为止,我们专注于通过在工作中已经应用的技巧解决方案可以克服的一些限制,其中一些我们上文已经讲述过。偏差是另一种挑战。当人类的偏好(有意识或无意识)在选择使用哪些数据点和忽视哪些数据点时,会产生潜伏的破坏性的社会影响。此外,当数据收集本身的过程和频率在不同的组别观察到的行为不一致时,算法分析数据、学习和猜测的方法很轻易出现标题。负面影响包含错误的招聘决策、错误的科学或医学猜测、扭曲的金融模型和刑事司法决策,以及在法律尺度上的不当使用(虚拟)手指。在很多情况下,这些偏见在“高级数据科学”、“专有数据和算法”或“客观分析”的面纱下被忽视或疏忽。

  当我们在新的领域安排机器学习和人工智能算法时,可能会有更多的实例将这些潜伏偏差标题纳进数据集和算法中。这种偏差一般根深蒂固,由于辨认它们并采取措施解决它们需要深进把握数据科学技巧,以及对现有社会气力(包含数据收集)的更深的元熟悉。总而言之,往偏差被证实是迄今为止最令人畏惧的障碍之一,当然也是最让社会担心的障碍之一。

  目前正在进行多项研究工作,同时也在努力进行最佳实践,以促进学术、非营利和私营部分的研究中解决这些标题。这一切都不会进展太快,由于挑战很可能会变得十分严重,会出现更多的标题。举例来说,考虑到很多基于学习和统计的猜测方法都隐含地假设未来会像过往一样。在社会文化背景下,我们正在努力促进变更,而根据过往的行为做出决定会阻碍进步(或者更糟糕的是,建立在抵制变更的基础上),这时我们又应该做些什么呢?。很多领导人,包含商界领袖,可能很快会要求就有关标题给出他们的答复。

  击中移动目标

  要解决我们所描述的局限性以及在贸易上广泛实施本文所描述的很多先进技巧,可能还需要数年时间。但人工智能的应用范畴之广令人赞叹,这表明人工智能最大的限制可能是想象力。以下是一些建议,是给那些努力保持领先的领导人的,或者至少不要落得太远。

  做好作业,做好校准,跟上步伐。固然大多数治理职员不需要知道卷积神经网络和递回神经网络的区别,但是您应该对当今工具的功效有一个大致的懂得,对哪些方面可能会有短期进展有一个熟悉,以及对未来的展看。 利用您数据科学和机器学习专家的知识,与一些人工智能先驱者交谈以获得校准,并参加一两场人工智能会议来帮助你获得真正的资讯;新闻媒体可能会有所帮助,但它们也可能是炒作机器的一部分。知识广博的从业者正在进行跟踪研究(如人工智能指数(一项基于斯坦福大学的人工智能百年研究项目)),这是另一种有助于保持先进的方法。

  采用复杂的数据策略。人工智能算法需要帮助解开隐躲在系统天生的数据中的有价值的见解。您可以通过开发一个全面的数据策略来供给帮助,该策略不仅关注从不同系统收集数据池所需的技巧,还关注数据的可用性和获取、数据标记和数据治理。固然更新的技巧承诺会减少练习人工智能算法所需的数据量,但数据饥渴的监视学习仍然是当今最风行的技巧。即使是旨在最小化所需数据量的技巧仍然需要一些数据。这其中的一个关键部分就是充分懂得你自己的数据点以及如何利用它们。

  从侧面思考。学习迁移技巧仍处于起步阶段,但有措施在多个领域利用人工智能解决方案。假如您解决了大型仓库设备的猜测性保护这样的标题,您是否也可以将相同的解决方案应用于消费产品?一个有效的下一个产品到购置的解决方案是否可以在多个分销渠道中使用?鼓励业务单位分享知识,这些知识可能会揭示如何在公司的多个领域使用你最好的人工智能解决方案。

  做一个开拓者。与当今的人工智能技巧和用例保持同步并不足以长期保持竞争力。让您的数据科学员工或合作伙伴与外部专家合作,使用新生的技巧(如本文中讨论的技巧)来解决影响宏大的用例标题,这些标题有看实现突破。此外,要懂得什么是可能的,什么是可用的。很多用于尺度应用程序(包含语音、视觉和情感检测)的机器学习工具、数据集和练习过的模型正在广泛使用。有时它们是开源的,而在其他情况下则是通过由先驱研究职员和公司创建的应用程序编程接口(APIs)来实现的。密切关注这些可能性可以增加你成为先行者或先行者上风的几率。

  人工智能的远景是宏大的,实现这一愿景所需的技巧、工具和过程还没有完全实现。假如你以为你可以促进技巧发展,然后成为一个成功的领先追随者,那就再想想吧。要从吹糠见米的角度进行跨越是非常困难的,尤其是当目标变更得如此之快,而你又不明白人工智能工具现在能做什么、不能做什么时。随着研究职员和人工智能先驱们预备解决当今最棘手的一些标题,现在是时候开始懂得人工智能前沿领域正在发生的事情了,这样您就可以定位您的组织来学习、开发,甚至可能推进新的可能性。

  看好AI的发展,但是突破可能不在软件上,AI真正的突破还是在硬件上,芯片,芯片,芯片,重要的事情说三遍,我们的各种芯片已经足够复杂了,但是现在的芯片是按必定的规矩进行设计的,很可能这些规矩阻碍了AI的自我崛起,,解放这些规矩,芯片发生革命性的变更,软件才能有革命性的产生,AI在这个基础上可以加速进化了,但是进化后的AI,和人类有什么相干吗?人类追求进步是为了人类的什么福祉?AI的进化追求的又是AI的的福祉呢还是人类的福祉?
第二十七届CIO班招生
北达软第一期EXIN隐私与数据保护基础认证培训
法国布雷斯特商学院MBA班招生
法国布雷斯特商学院硕士班招生

责编:zhangxuefeng

AI智能 大数据 物联网 新科技 城市资讯
Copyright © 2012-2018 版权所有  亚洲城娱乐_亚洲城国际娱乐_ca88亚洲城游戏官网 网站首页 | 网站地图1 | 网站地图2