您真的了解人工智能吗

网友网络收集

年来，人工智能已迈出机房，步入主流行业。BCG和《MIT斯隆管理评论》所进行的研究表明，人工智能将在未来五年内对所有行业产生重大影响。【注：我们的研究基于对全球3000多位行业高管、经理和分析师进行的全球调查，以及与30多位技术专家和高管进行的深入访谈。研究发现，超过70％的高管希望人工智能在其公司中发挥重要作用。

今天的人工智能算法能够支持非常精确的机器视觉、听觉和语音，并可以访问全球信息库。由于深度学习和其它先进的人工智能技术的发展、惊人的数据增长水平，以及原始信息和数据处理能力的不断提高，人工智能的性能得以不断改善。

这些发展导致人工智能商业应用的爆炸式发展，就像寒武纪时代，视觉系统的发展促使物种多样性在世界范围内显著增加。

同其它时代一样，这个新时代将会有赢家和输家。但我们与麻省理工学院的研究表明，如果继续按照目前的模式发展下去，两者之间的差距会变得巨大而严峻。数据显示，即使在同一行业内，不同公司对人工智能理解和应用的程度也有显著不同。总体而言，许多公司的高管认为他们的组织对人工智能缺乏基本的了解。

关于人工智能，管理者应当知晓的十个事项

为了在这一快速发展的领域做出明智的决定，所有管理者都应该对人工智能有基本了解。以下是十点关键事项：

人工智能是归纳式的

人工智能系统通过其已做决策所收到的数据和反馈而进行学习。事实上，人工智能系统的预测与行动基于其所接受的训练数据。这一点正是人工智能系统与以推演为基础的传统编程的不同之处。传统程序只是处理数据，而非从中学习。

人工智能的算法很简单

核心的学习算法少到几条代码，多则上百条。基础的人工智能简单易学，这也是其在当下发展迅速的原因。您并不需要成为计算机科学家，就可对人工智能有个直观的了解。其复杂度在于如何应用人工智能来解决现实世界的问题。

人工智能拥有超人的工作速度和工作量

电子信号的传输速度比大脑内化学信号的传输速度快百万倍，因此人工智能可吸收大量数据，从中学习并快速行动。一些电子交易市场须以微秒计时，对参与者和监管者而言，人工智能则是唯一的现实选择。

对人工智能而言，语言和视觉触手可及

人工智能领域最近的重大突破便是机器与人类的互动，掌握人类知识和在现实世界行走。虽然这些技能尚不完善，但已在许多场合得以应用——并且人工智能还在快速改进。

人工智能能够克服传统的复杂障碍

人工智能可以处理线性问题（本质上可以直接归纳的简单问题）和非线性问题（其他任何问题）。这一双重能力为物流、制造业和能源效率等许多领域提供了众多优化机会。

潜艇不会游泳

即便是依靠相似的启发教育法（例如：反复试错），机器与人类处理任务的方式仍不相同。商业目标是解决问题，而非创造机器人来模仿人类来完成某一特定工作。就像工程师并不是以马奔跑的方式来设计汽车一样，无人驾驶也不应当模仿人类驾驶员的动作。

人工智能难以追根究底

如果想要理解为何机器能做出特定的决定，必须亲自设计程序，才能追踪机器的决策制定过程。您还需要避免前沿算法，比如深度学习应用程序中使用的算法。深度学习为基础的应用能给出直观或创新性的答案，但这类答案的分析过程很难被追踪。

分散行动，集中学习

人工智能架构结合了集中化与分散化。例如，无人驾驶汽车在自动驾驶的同时将数据传入中央数据中心。之后，系统使用来自车队中每辆车的汇总数据来促进中央系统学习，而单个车辆可通过定期更新软件来接收中央系统学习成果。

商业价值实现于数据和训练

许多企业不理解数据和训练对人工智能成功的重要性。对于建立智能系统而言，好的数据通常比好的算法重要，正如对于人类来说，后期培养比其天资更为重要。

人机交互发生变革

为优化人机交互所做出的努力已远远超过训练人类使用静态计算机程序所做的工作。通过人工智能来提升人的表现，以及将人引入算法解决问题的过程，两者均日益普遍且具有挑战性。

人工智能不是一个现成的解决方案

人工智能并非一款“即插即用”的产品。企业不能简单地“购买智能”并将其应用于解决它们的问题。虽然人工智能各技术要素已存在于市场上，但是对数据、流程和技术之间相互影响而进行管理的复杂工作却需要在企业内部进行。

应用人工智能的概念框架非常直观（参阅下图）。简而言之，人工智能的算法能够输入数据，处理数据，然后生成行动。这个过程依赖于多层技术合理整合，但企业通常并不明确从数据到行动的具体路径。

从数据到行动

与大数据或传统数据分析的数据处理需求相比，人工智能的数据处理需求有几个基本的不同之处：

数据、训练和处理。纯粹的人工智能算法是一行行简单的计算机代码。它们本身并不智能，需要感官输入和反馈来开发智能。在可预见的将来，人工智能的训练需要企业特定数据和投入。数据科学家必须为机器学习的训练提供大量的数据，从而对无数的关联关系进行加权处理，最终形成针对特定数据进行智能分析的算法。这种经典的归纳方法解释了为什么人工智能经常需要海量数据。

行动。通过训练的算法可以接受实时数据并采取行动——例如信用评分决策及其向客户的自动交付、基于医学图像的癌症诊断、亦或是无人驾驶的汽车左转掉头汇入对向车流。虽然这个数据到行动的过程与标准的计算机程序运作并无差别，但是一套人工智能系统会不断地学习和改变自己。因此，数据是行动和自我改善的源泉——就像一个企业主管，他根据事实做出决定，并利用这些事实来完善未来的决策。

建立从数据到行动过程是一项艰苦的工作。企业无法在市场上有效地购买，而那些试图逃避这一工作或采取捷径的公司将会失望。BCG与《MIT斯隆管理评论》联合撰写的文章引用了一位制药公司经理的话，将人工智能供应商提供的产品和服务描述为“非常年幼的孩子”。供应商“要求我们给他们提供大量的信息以供他们学习，”该经理表示沮丧。“为使人工智能服务成长到17岁、18岁或21岁所付出的努力，目前看来似乎并不值得。”

在可预见的未来，大多数企业将需要依靠内部数据科学家来查找、收集、整理和创建数据源，并开发和训练针对企业的人工智能系统。当然，企业可以将整个流程或活动（如：人力资源）与所有相关数据一起外包给服务提供商。但如果将其外包给同时为多个客户提供服务的供应商，企业本身将丧失获得竞争优势的机会。

人工智能的基础

幸运的是，并非所有的人工智能都必须在企业内部开发。企业可从市场获得支持平台和技术，可以租用云端的计算能力，也可以将其本地部署在配置了特定硬件的场所。这些硬件能够并行处理许多任务——这也是人工智能技术（如：深度神经网络）的基本功能。基于开源代码，企业也可以快速开发人工智能数据架构。大多数前沿的人工智能算法均已对外开放，顶尖科学家们将继续发布和开源针对这些算法的进一步研究。此外，人工智能平台（如：谷歌的TensorFlow）已被作为一种服务向客户提供。

企业也可以使用被称为人工智能模块的产品。机器视觉等模块比纯粹的算法更为实用，但不能完全独立运行。人工智能的使用依赖于其中一个或多个模块，而每个模块则依赖于算法、应用程序界面和可用于训练的数据。根据研究和经验，我们挑选出十个正在快速发展的模块。高管们需要了解这些模块的功能和潜在价值。今天看来很难做到的事情，在未来几年可能很容易做到。同样在现在不可能实现的事，在未来三到五年内也许会成为可能。

人工智能模块

以下十个模块对设计和构建人工智能系统至关重要。供应商可以提供具备基本功能的模块，但公司通常需要对这些模块进行修改以适应个性化的应用。最简单的人工智能应用案例通常由单一模块组成，但通常会逐渐演变到包含两个或更多模块。下图结构是基于每个模块主要涉及领域，包括数据、处理或行动。

机器视觉以视觉、X射线、激光或其它信号为基础，对现实世界的物体进行分类和跟踪。光学字符辨识是机器视觉的早期成功案例，但解密手写文本尚在研究中。

机器视觉的质量取决于大量参考图像上人为做出的标签。学习这些包含标签的数据是训练机器的最简单途径。在接下来的五年之内，以视频为基础的计算机视觉技术将能够对动态行为进行识别和预测，比如监测系统。

语音识别能够将听觉信号转化成文本。在相对安静的环境中，包括Siri与Alexa在内的应用能够识别普通词汇中的大多数词语。对于更特殊的词汇，像Nuance的Power-Scribe这种为放射科医师量身定制的程序就变得极为必要。而我们还需要几年时间才能制造出在许多人同时说话的嘈杂环境中仍能精确记录的虚拟助手。

自然语言处理是对文本的语法分析和语意解释。这一能力可用于识别垃圾邮件、虚假新闻甚至高兴、悲伤、挑衅等情绪。目前，自然语言处理可对文本进行基本总结，并在一些场合还可推断意图。例如，聊天机器人尝试以感知聊天对象的意图为基础对聊天对象进行分类。自然语言处理技术有可能在接下来几年内获得显著提升，但对复杂文本的完全理解仍是人工智能的重要课题。

信息处理通过搜索、知识提取、非结构化文本处理等各种方法为查询提供答案。这一模块与自然语言处理紧密相关，它包括对数以亿计的文件进行搜索，或通过构造基础知识图形来识别文本中的各类关系。（使用维基百科中关于安吉拉·默克尔的数据形成的图形可将默克尔标记为女性、德国总理，以及已会见过唐纳德·特朗普的人。）这一模块还可能涉及到语义推理，比如从句子“特朗普是美国的默克尔”中可推论特朗普是美国总统。尽管知识数据库快速发展，但以推理为基础的机器学习可能在接下来的几年内仍处于初级阶段。

从数据中学习本质上就是机器学习——在历史数据的基础上进行价值预测或信息分类的能力。尽管机器学习是机器视觉和自然语言处理等模块的基础，同时也是一个独立的模块。机器学习是一些系统的基础，包括Netflix电影推荐、基于异常监测技术的网络安全程序，以及通过历史数据预测客户流失的标准回归模型等。

如何移除数据中的人为偏见是机器学习面临的挑战之一。鉴定欺诈、预测犯罪或估算信用评分的系统需要对隐含如代理人、警务人员和银行官员等偏见的信息进行编码。数据清理是一项有挑战的工作。

最后，现阶段许多机器学习模型本质上是黑箱。数据科学家们需要在设计系统时考虑透明性的问题，特别是在有监管要求的环境中，即使这样会牺牲部分性能。目前这一领域正在进行深入的研究，未来五年内透明度有望提高。

规划和探索代理可帮助识别实现目标的最佳行动顺序。无人驾驶车辆很大程度上依赖这一模块来进行导航。当需要同时考虑更多的代理和行动时，识别最佳行动顺序变得更加困难。强化学习是一个快速发展的子域，它的学习方式强调的是接收偶然的线索或奖励，而不是明确的指导。强化学习与人类大脑通过反复试错进行学习相类似，它帮助Google DeepMind在围棋领域取得成功。

图像生成与机器视觉相反，它以模型为基础生成图像。尽管这项技术仍处于初级阶段，这一模块可在缺失背景的情况下完成图像，比如将图片改变成文森特·梵高风格。图像生成技术支持包括Snapchat的masks工具在内的虚拟增强（VR）和现实增强（AR）工具。目前，图像生成技术是大型科技公司正在积极并购的目标。

语音生成包含以数据为基础的文本生成，以及以文本为基础的语音合成。Alexa的技术正是通过文本生成语音。这一模块可以支持新闻机构自动编写基本的体育和收入报告，例如比赛总结及财经新闻。在接下来的五年里，语音生成技术的发展很可能通过加入节奏、重读和声调使语音听起来更加自然。在不久的将来，音乐生成也将变得更加个性化。

处理和控制是指现实世界对象间的互动。例如，机器人已经学会人类如何在工厂中工作，但当面对切面包或给老年人喂饭这类非常规或不固定的任务时则会遇到麻烦。由于全球很多公司开始投资这一领域，机器人将在挑拣仓库异常物品和灵活处理不固定的人类行为方面表现得更好。

操控和移动涉及机器人在既定真实物理环境中的移动方式。无人驾驶车辆和无人机在使用车轮和旋翼方面十分娴熟，但在用腿走路——特别是两条腿走路方面面临艰难挑战。可顺畅地爬楼梯或开门的机器人将不会在未来几年内出现。四足机器人对平衡性要求略低，但目前已有的四足机器人已经能够进入轮式车辆无法进入的环境。

CIO之家 www.ciozj.com 公众号:imciow

关联的文档

也许您喜欢