休息之余,为大家奉上过去一周引发 AI 开发者圈子关注的那些事儿。大伙儿泡杯茶,坐在摇椅上,一起来看看在埋头工作的这个星期,外面的世界又有哪些变化。
█ 微软发起 Minecraft AI 挑战赛
本周,基于 Minecraft 上的知名 AI 技术研究测试平台 Project Malmo,微软发起了一项 AI 协作挑战赛The Malmo Collaborative AI Challenge,目前已经开始注册报名。
比赛要求每支参赛队伍(最多 3 名队员)开发并训练一个 AI 软件产品。然后通过该软件产品参加一个名为 Pig Chase (小猪快跑)的小游戏。该游戏在 Minecraft 环境中展开,每局游戏有两名参赛者,一方为参赛队伍开发的 AI 软件产品,另一方为系统随机分配的队友,有可能是人类选手,也有可能是另一个队伍开发的 AI 软件。游戏一开始,参赛双方都有 25 分的原始积分,比赛要求双方在 25 步之内将一只小猪抓住,每走一步会减掉 1 分,最终抓住小猪双方各得 25 分,每轮比赛 10 局,最终累计得分高者获胜。
目前,关于 Pig Chase 的样例代码和详细说明已经公开在 GitHub 上
█ Keras 2 发布,无缝支持 TensorFlo
在本次版本更新中,最重要的一项内容就是增强了 Keras 与 TensorFlo 的逻辑一致性。按照 Keras 在博客中的说法“这是将 Keras API 整合到 TensorFlo 核心的一个重要的准备步骤”。
实际上,从 2015 年 12 月的版本开始,Keras 就已经支持用户将 TensorFlo 作为运行后端(runtime backend),但此前,Keras 的 API 与 TensorFlo 的代码库尚处于相互隔离的状态。未来,从 TensorFlo 1.2 版本开始,Keras 2 API 将作为 TensorFlo 框架的一部分直接向用户提供支持,Keras 在博客中表示“这是 TensorFlo 实现下一个百万用户级目标的关键”。
█ 谷歌升级语义理解框架 SyntaxNet
这是 SyntaxNet 自诞生以来的最重大升级。这建立在谷歌对各语言的语义理解研究基础之上。此次升级的核心是一项新技术能对输入语句的多层表示进行很好的学习。具体来讲,它延伸了 TensorFlo,能对多层语言结构进行合成建模,还能够在语句或文件处理过程中,动态地生成神经网络架构。
谷歌发布了新的预训练过的模型 ParseySaurus。它使用了基于字母的输入表示,极大提升了预测新词语含义的能力。这是基于两个方面来实现词汇的拼写和在语境中的使用方式。雷锋网了解到,ParseySaurus 的准确率远远超出 Parsey's Cousins,错误率降低了 25%。由于语言的形态特性和其他属性,新模型在俄语、土耳其语、匈牙利语上的效果尤其好——这些语言中,同一个词汇有多种不同形态,其中许多形态从未在训练阶段出现过(即便是大型语料库)。
█ Cloudera 发布自助式数据开发工具
在圣何塞举行的 Strata+Hadoop World 大会上,美国大数据服务商 Cloudera 发布了 Cloudera Data Science Workbench —— 一个运行于 Cloudera Enterprise,自助式的数据科学开发环境。目前该全新研发的软件尚在 beta 内测阶段。
其相关技术来自于 Cloudera 去年收购的数据科学初创公司 Sense.io。该产品的最大特点是原生支持 Apache Spark、Hadoop 和 R、Python、Scala 等开发语言。 开发者能在 Cloudera 的企业平台上使用这些工具和语言,这将加速数据分析项目从研发到最终产品的过程。
推荐深度阅读
█ 用数据说话把自拍照变成毕加索名画 哪种算法最高效?
有位外国开发者根据 fast.ai 平台开设的深度学习代码实践课程,亲手实现了一个照片风格转换器,并对几种常见的优化算法的性能进行了综合对比,最终以图表加博客的方式记录下来。
作者比较了基于 CNN 的六种优化算法梯度下降、Adadel、RMSProp、Adam、L-BFGS 和 Adagrad。