数据分析和精确运算让深度学习如何做到“思考”?
网友 www.itongji.cn

复杂的智能有着多种表现形式 

这个问题回答起来很复杂,因为智能本身就是很复杂的。拿我们人类来说,有人擅长读书学习,有人擅长人情世故,有人情商高,有人智商高,或是强于推理,又或是经验丰富;但是很少能有一个人可以集这些长处于一身。 智能有很多种表现,但我们的大脑并不会以同样的方式去响应它们。 因此,人工智能的探寻之路面临着诸多挑战,但并不仅仅是我们尚未理解透的人类的智力。 

最初的人工神经网络(artificial neural networks,ANN)

当然,人工智能最好的向导还是人类的大脑。人脑由数百万个神经元相互连接构成,信号在神经元之间传递并且形成了有如记忆区、语言区及思想区等功能性区域。大脑是动态变化的,就像我们可以通过锻炼来增强肌肉一样,我们同样可以加强我们的认知能力— 通过学习。 得益于人工神经网络(artificial neural networks,ANN)的兴起,AI也可以做到这一点。人工神经网络是一种模仿人脑机制的机器学习算法,网络中的节点类似于神经元,可以计算并传播所接收到的信息。 去年打败围棋世界冠军的AlphaGo,正是利用ANN来计算当前各种行为的概率、结果,并根据对手的行为做出策略上的调整。 

相比ANN 加入了更多层数的深度学习

Facebook, Amazon, Netflix, Microsoft和谷歌等公司都在研发深度学习。 深度学习是在传统的ANN上添加了更多的层数,更多的层数就意味着数据更多的表示形式以及数据之间更多的关联。 这就与人类思考很相似了,当处理输入信息的时候,人脑在类似于ANN层的组织里做着相似的信息处理。比如,当我们在电视上看一场足球赛的时候,我们获取了某一时刻屏幕上正在发生的事件的最基本信息,但我们却能从中获取更多的知识,比如哪个运动员在球场上哪个不在,球场上是个怎样的局面,球员的配对攻防情况,根据历史来看这场比赛的胜负会怎样(一支球队是否经常踢赢另一支球队?四分卫是否跟以前一样传球?),裁判会怎样判决这场比赛等等。在处理当前信息的过程中,我们调用了存储的记忆、模式识别、统计学、决策分析、比较、预测以及一些其他地感知能力。深度学习就是致力于实现人脑的这些层次。

深度学习如今在文本挖掘、图像识别和语言翻译中的应用

或许你已经了解了深度学习的算法,那你有没有好奇过Facebook是怎样做到在你刚巧被大雨淋后就在你的主页上插入了雨靴的广告,或者在你刚刚点击喜欢了一个网页后就立刻给你推荐一个类似的网页? Facebook的深度文本挖掘算法(DeepText)能在一秒内处理数千则各种语言的帖子,它当然也能通过彩虹就推断出你需要一双雨靴了。 
深度学习也可以用于人脸识别,比如识别出参加某一纪念日活动的家庭成员。 深度学习的算法也可以在具体环境中识别出某些物体,比如有程序可以在客厅地板上识别出字母块,一摞儿童书或是弹性座椅。深度学习能通过一张图片就得到一些结论,并将这些结论应用到有针对性的广告中。 

谷歌在图像识别和语言翻译上运用了循环神经网络(Recurrent Neural Networks, RNN),这使得谷歌的翻译程序可以在无需对语言本身编码的情况下就能在语言之间建立联系,并且其表现远远优于传统的一一对应的翻译模式。 所以,即使谷歌翻译程序并没有给冰岛语向越语的翻译具体地编码,它仍然能找出两种语言之间的关系并生成一种中间语言,从而完成翻译。

图灵测试:语言处理和思考是两个完全不同的能力

1950年,阿兰· 图灵(Alan Turing)发表了《计算机器与智能》(Computing Machinery and Intelligence),自此以后,机器思维便与语言联系在一起。 文中提出用“图灵测试”来衡量机器是否会思考: 如果一个计算机程序在与人类通过文字来聊天时,能不被辨别出其机器身份,那么可以说这台机器具有智能。 之后,在该领域举办过一些比赛,如罗布纳奖(Loebner prize)比赛,相关理论也一直在演进,如单单凭借一个程序能像人一样进行沟通(伴随打字错误、许多感叹号、誓言和俚语)并不能断定它确实在思考。20世纪60年代,Rogerian开发出一个计算机程序——ELIZA治疗师,让测试者误以为他们确实在和治疗师聊天,也许是因为它不像一些人类对话伙伴,它问了些问题,像是在听。 ELIZA从会话者的回答中收集关键词,并将其转化为问题,或者简单说“告诉我更多吧”。虽然有些人认为ELIZA通过了图灵测试,但从与ELIZA(在这里试试)及类似的聊天机器人谈话中看:语言处理和思考其实是两个完全不同的能力。

IBM的Watson打败两名顶级人类选手的“思考”

那IBM的Watson在《危险边缘》(Jeopardy)节目中打败两名顶级人类选手又是如何做到的呢?Watson的优势在于:可访问到大量即时信息、及能准确计算出答案。在游戏中,Watson收到了一条线索:“在莫里斯·拉马奇(Maurice LaMarche)内心深处有个声音,是奥森·威尔斯(Orson Welles)在说啮齿动物想接管这个世界。”Watson可能的答案和概率为:

《红耳和小聪明 Pinky and the Brain》: 63%


《艾德·伍德 Ed Wood》: 10%


《水豚 Capybara》: 10% 
Google一下“莫里斯·拉马奇”能轻松得出他说的是红耳,但是线索棘手的地方在于,它包含了大量关键字:拉马奇、旁白音、啮齿动物、统治世界。其中,“奥森·威尔斯”就是在混淆视听,拉马奇听到奥森·威尔斯的声音容易让人联想到《艾德·伍德》中的文森特·多诺费奥(Vincent D'Onofrio),但这与啮齿动物无关。同样,水豚是一种南美啮齿动物(世界上最大的啮齿动物,Watson或许会将其与“接管世界”的线索联系起来),但是动物与拉马奇或旁白音没有关系,除非拉马奇隐含了水豚的意思。人类大脑应该不会和像Waston那样混合概念,参赛选手肯·詹宁斯(Ken Jennings)实际上就选择了正确的答案。

尽管如此,Watson的能力和应用仍在拓展——它正致力于癌症。通过上传病史、诊断信息、治疗方案及其他数据,Watson可以和人类医生一起帮助识别癌症,并确定个性化治疗计划。“露西计划”(Project Lucy)重点聚焦于Waston在帮助非洲应对农业、经济和社会挑战等方面的超级计算能力,Waston能证明自己在分散的知识领域里是智能却非全面的。 

未来强人工智能(AGI)将会如何“思考”

也许人工智能的主要局限可以用一个字母表达:G。虽然我们有AI,我们没有AGI——artificial general intelligence(常指 “强人工智能”或“全人工智能”)。两者的区别在于,AI擅长于单个任务或游戏,却不能推断战略或技术并应用于其他场景或领域——正如你很可能在井字棋游戏中打败AlphaGo。这种限制对应了人类的批判性思维或综合推理能力。我们可以将往期特定活动的相关知识运用到研究新的时尚趋势中,或者在与老板谈论加薪时使用有效的营销技巧,因为我们能看到其中的重叠部分,而AI目前还不能做到。 
有些人认为我们永远不可能有AGI,而另一些人认为这只是时间(和金钱)的问题。去年,Kimera揭示了Nigel计划,它是第一个AGI。由于测试版尚未向公众发布,因此无法评估这些声明,但我们将密切关注。在此期间,AI会像我们一样继续学习:通过观看YouTube视频和阅读书籍,至于会令人欣慰还是恐惧则是另一个问题了。


CIO之家 www.ciozj.com 公众号:imciow
关联的文档
也许您喜欢