2018排名前10的AI开源项目
优达学城 知乎

目前,人工智能和机器学习仍在风头浪尖上。IDC 咨询去年 9 月做出预测, 2017 年全球在认知和人工智能解决方案方面的支出约为 120 亿刀。这一总额可能会以 50.1% 的复合年增长率(CAGR)增长到 2021 年,届时市场将高达 576 亿刀。

在其 2018 年的报告中,机构预测今年「人工智能将会重塑分析和商业创新」,同时「人工智能将会作出决策并且对20%的机构提出实时指导」。然而它也提出了警告——「 2018 年,CIO 们认识到,要在 AI 这样的新技术上发展,就需要繁重的工作。」

对于许多组织来说,大部分繁重的工作的第一步都是学习机器学习框架和人工智能框架。根据 Gartner 的报告,59% 的组织还在收集信息以构建他们的人工智能战略。

大部分信息收集可能围绕着开源解决方案。许多领先的人工智能工具都可以通过开源许可证获得,许多尖端的研究和开发工作都在这些开源项目上进行。

那么,我们应该研究哪些开源 AI 解决方案?本文重点介绍 10 种最受欢迎的开源人工智能和机器学习工具,赶紧收藏起来吧~


1 TensorFlow

由 Google 创建的 TensorFlow 已经成为当今最广泛使用的机器学习框架之一。该项目的 GitHub 页面拥有超过 87,700 颗 stars,并且已经 fork 超过 42,700 次。2017 年的 GitHub Octoverse 报告表明,这一开源 AI 工具是最多 fork 的项目之一,在「最多贡献者榜单」中排名第5,在「最多讨论榜单」中排名第 10。它在基于云的服务中大受欢迎。同时,亚马逊网络服务、微软 Azure、和谷歌云平台均提供与 TensorFlow 协同工作的支持和(或)或服务。 据该项目网站称,使用它的公司包括 Airbnb、NVIDIA、Uber、SAP、Dropbox、eBay、Google、Intel、可口可乐、twitter 等等。TensorFlow 不愧是机器学习框架界的大佬了~


2 Scikit-Learn

Scikit-Learn 是一个重点在于「数据挖掘与数据分析」的 Python 机器学习工具。基于另外三个开源项目—— NumPy、SciPy 和 matplotlibe 之上,它提供了分类、回归、聚类、降维、模型选择和预处理的算法。其用户包括 Spotify,Evernote,OKCupid 和 http://Change.org 等等。起初时,它是谷歌的夏季代码项目。随后的开发得到多个组织的资助,其中包括 INRIA,Paris-Saclay 数据科学中心,纽约大学,Télécom Paristech,哥伦比亚大学,Alfred P. Sloan 基金会和悉尼大学。在 Github 上这个项目拥有了多于 25,300 的 stars 和多于 12,900 的 forks。


3 Caffe

Caffe 是 Yangqing Jia 的创意。他创建了这个项目,作为他在在加州大学伯克利分校的博士工作的一部分。伯克利人工智能研究所(BAIR)正在进行这个项目的开发。项目网站将其描述为“由意识的表现、速度和模块化构成的深度学习框架”。Caffe 的主要特征为表现性架构、可扩展代码、快性能以及一个包括学术和行业用户的大型社区。在 GitHub 上,该项目在 GitHub 上拥有 22,600 多个 stars 和 13,800 多个 forks。


4 Microsoft Cognitive Toolkit

微软认知工具包(以前称为 CNTK )自称为「免费,易于使用的开源商业级工具包,可以训练深度学习算法,以像人类大脑一样学习。」 这个 AI 解决方案是由微软内部开发的,在 2016 年以开源许可的形式发布。它的主要特征为支持 Python/C++/BrainScript 的工具、增强学习、生成对抗网络以及有监督和无监督的学习、有效资源使用、与 NumPy 相互协作以及与 Microsoft Azure 集成。该项目在 GitHub 上拥有 13,700 多个 stars 和 3600 多个 forks。


5 PredictionIO

作为一个 Apache 项目,PredictionIO 是一个开源的机器学习服务器,它利用了许多其它 Apache 大数据工具,如 Hadhoop、HBase 和 Spark。公司经常使用它来实现 lambda 体系架构,该网站将其作为包括 Apache Spark,MLlib,HBase,Spray 和 Elasticsearch 的完整机器学习技术栈的一部分提供。该项目的目标是帮助数据科学家和开发人员快速创建可作为 Web 服务部署的预测引擎。该项目在 GitHub 上拥有 10,900 多个 stars 和 1,777 多个 forks。


6 Deeplearn.js

正如你可能从名字中猜出的那样,deeplearn.js 是一个深度学习的 JavaScript 库(JS 无所不能!)。它允许用户在浏览器中训练神经网络。像本文中其它的几个开源 AI 项目一样,它的起初可追溯到谷歌大脑团队,并且谷歌在继续支持这个项目。Deeplearn.js 包含两个独立的 API ——与 NumPy 相似的即时执行模型和更像 TensorFlow 的延迟执行模型。该项目在 GitHub 上拥多有 6000 个 stars 和 550 多个 forks。


7 Pattern

Pattern 由安特卫普大学计算语言学和心理语言学(CLiPS)研究中心创建。它提供多种人工智能方面的功能,包括数据挖掘、自然语言处理、机器学习、网络分析和可视化,并基于 Python 捆绑了超过 50 个示例和超过 350 个单元测试。该项目在 GitHub 上拥多有 6000 个 stars 和  1100 多个 forks。


8 Turi Create

Turi Create 旨在允许非专家创建自己的机器学习模型,而无需编写大量代码。其包括用于分类、回归、图形分析、聚类、最近邻、主题模型等方面的算法,对于创建推荐引擎,图像分析工具和文本分类引擎非常有用。苹果公司最近(2017 年 12 月)才在 GitHub 上发布了这个工具,但它已经引起了很多兴趣,该项目在 GitHub 上拥多有 5700 个 stars 和 490 多个 forks。


9 Aerosolve

Aerosolve 由 Airbnb 创建,是一种特别擅长处理地理数据的人工智能工具。它声名远扬的原因是它的设计「人性化」。主要特征为基于节约原则的特征表现、特征转换语言、可调试模型、对 Java 和 Scala 的支持以及包含图像内容分析代码。该项目在 GitHub 上拥有 4200 多个 stars 和 550 多个 forks。


10 DSSTNE


DSSTNE(发音像“Destiny”)由亚马逊创建,代表「Deep Scalable Sparse Tensor Network Engine」(深度可扩展的稀疏张量网络引擎)。这是电商大佬用来创建自己的推荐引擎的 AI 工具,这引起了其他零售商和在线组织的很大兴趣。它的开发人员声场,它对于机器学习培训数据稀缺的用例特别有用。该项目在 GitHub 上拥有 4000 个 stars 和 660 多个 forks。


CIO之家 www.ciozj.com 公众号:imciow
关联的文档
也许您喜欢