李沐团队半年离开六人,MxNet是否英雄落幕?贾扬清:关键能否解决新痛点

生活知识 2024-12-21 16:03www.robotxin.com生活百科

近日,一则关于亚马逊AI李沐团队的消息在知乎上引起了热议。据网友爆料,今年初至今,该团队已有六名成员离职。对于一个拥有20名正式员工的团队来说,这无疑是一次重大的人员流失。面对外界的猜疑,李沐亲自回应了这一情况。他表示,这是正常的组织新陈代谢,有些人可能因为觉得新项目具有挑战性而选择离开,也有人因为团队在新项目开始前需要考虑产品组的实际需求而离开。

在知乎的评论中,有两种声音引起了大家的关注。一种观点认为,这是类似于末尾淘汰制的自然选择,对于不符合培养要求的研究人员进行“劝退”。另一种观点则倾向于“精英淘汰”,认为一些真正的精英人才可能会遭到冷遇、排挤甚至打压。

李沐进一步解释了他的团队近期的一些思考和调整。他提到,团队正在重新考虑项目的优先级,以适应未来五年的发展愿景。他们也在尝试从更宏观的角度思考如何将工作变得“不可或缺”,并在新项目开始前与产品组紧密沟通实际需求。这样的调整对一些团队成员来说可能感觉不够自由,从而导致他们的离开。值得注意的是,李沐强调了团队合作的重要性,认为他们组一直强调与合作伙伴的差异化合作,而非单纯竞争。此次人员变动也在一定程度上反映了团队的这种策略调整。李沐还提到过去一年他们一直在招聘能够管理科学家团队的经理,并计划在未来进行大规模招聘。他还回应了关于MXNet处境的质疑并表示未来值得期待的大招还有很多。与此同时也有网友提到有前MXNet团队员工离职的原因是其在MXNet ecosystem的发展并未达到预期反而越来越局限所致。这也从侧面反映出李沐团队对于员工待遇的重视和团队的变革需求是刻不容缓的议题之一。而对于这些人才流失的现象也引发了人们对于AI行业未来发展的思考以及AI行业人才竞争问题的关注。框架沉浮,MXNet的突围之路

我与MXNet的缘分可谓深厚,对其生态系统也充满感情。在开发之余,曾负责MXNet博客的文章翻译润色和校对,我的名字在其中得以留下痕迹。近期我选择离开,是因为MXNet生态的发展空间日渐缩小,市场份额面临严峻挑战。

深度学习领域的优秀回答者mileistone对MXNet的困境进行了深刻评价:整个深度学习框架市场几乎被TensorFlow和PyTorch占据,MXNet的市场份额日渐萎缩。尽管李沐团队技术实力卓越,但产品市场认可度不高。以GluonCV、GluonNLP和Dive into Deep Learning为例,这些产品虽具有创新性,却未能有效解决深度学习框架的痛点,市场份额有限。

一位亚麻员工透露,公司内部使用MXNet的情况也较少。在专门做Edge端CV的团队中,虽然可以使用MXNet,但并不是必须。这与MXNet市场占有率低迷的现状相呼应。一位自称“野生MXNet砖家”的网友细数了MXNet的诸多缺点,包括莫名其妙的错误、算子欠缺、性能问题等,给新手用户带来不小的困扰。

尽管MXNet平台在某些方面表现出色,但竞争激烈的市场环境下,其面临的挑战不容忽视。李沐的人生轨迹也见证了这一挑战。他曾于百度创建分布式机器学习广告系统,积累工业界经验后选择前往CMU深造。在CMU,他得到导师的指导,科研能力迅速提高。他加入深度学习研究热潮,与陈天奇合作从CXXNet起步,致力于深度学习框架的研究。即便有他的深厚背景和团队的努力,MXNet的市场份额仍然面临挑战。

事实上,MXNet平台并不缺乏优点,不论是功能还是性能都有亮眼之处。但如何克服现有的问题,提高用户体验和市场份额,是MXNet面临的重要课题。竞争平台也并非十全十美,这意味着机会仍然存在。我们期待MXNet能够解决现有问题,实现突围,为深度学习领域带来更多创新和发展。一年后,李沐和另一位合作伙伴联手在Github上创建了DMLC组织,并启动了一个名为MXNet的项目,这一项目与他后续在亚马逊的职业生涯紧密相连。基于对MXNet未来发展的深思熟虑,李沐放弃了加入谷歌的机会,选择了前往亚马逊,一直深耕于此,围绕MXNet展开一系列相关项目。

MXNet迅速成为亚马逊首选的深度学习库。尽管它在众多深度学习框架中的市场份额远不及TensorFlow和PyTorch,但其速度、内存优化、接口灵活性和分布式效率等方面都有显著优势。MXNet拥有类似于Theano和TensorFlow的数据流图,为多GPU配置提供了良好的支持。它还提供了类似于Lasagne和Blocks的更高级别的模型构建块,并能在众多硬件上流畅运行,包括手机。除了对PyTorch的支持外,MXNet还提供了对R、Julia、C++、Scala、Matlab和Javascript的接口。

正如李沐之前所言,MXNet是由不同背景的开发者合力打造的平台,其特色在于排名前20的开发者大多来自不同的门派和世家。无论是起始时间还是平台特性,MXNet都与TensorFlow颇为相似。它拥有完整的多语言前端,后端类似编译器,进行内存和执行优化。应用场景广泛,从分布式训练到移动端部署都有所覆盖。整个系统模块化设计,编译依赖极小,非常适合快速开发。

MXNet总会被拿来与TensorFlow进行比较。对此,李沐曾在AI科技评论的采访中表示,他理解大家喜欢对比,但他更关注于优化的过程和与理想状态的差距。同时他也表示,MXNet与TensorFlow并非竞争关系,未来的趋势是框架的融合,各自为政的时代将被更多的兼容与支持所取代。

那么,在未来的框架融合潮流中,MXNet能否守住自己的一席之地呢?这需要我们暂时留一个问号。正如在李沐团队的离职风波中,有猜测认为MXNet的这两年发展较慢,在PyTorch和TensorFlow的双重夹击下突围困难。

那么MXNet有没有突围的可能呢?曾创建Caffe2的贾扬清认为每个平台都有自己的强项和弱项。他表示框架的沉浮很正常,关键是找到能解决哪些问题的痛点。Caffe2的设计早于Tensorflow,其系统部署能力在当时是核心挑战之一。对于Facebook来说,这是一个可以同时部署在云上广告推荐训练以及端上AI/AR场景的平台。但是每个平台都有自己的优势和劣势。一个框架在系统上表现强势时,相应的生态可能稍弱一些。大公司内部的需求和科研人员或长尾应用的需求是不同的。解决新的痛点才是目的所在。贾扬清认为mxnet已经在不可能的方向上利用自己的资源做了很多事情,无论是推动Gluon还是做“动手学深度学习”。他在Facebook的策略是着眼于解决业务核心问题并保持竞争优势的策略取得了成功也推动了系统上的创新使Facebook在广告、手机AI等方面取得了显著进展前端逐渐转向使用PyTorch原语后端系统则继续利用caffe2的高性能架构。在离开之前,我与Facebook的同事们共同设计了PyTorch 1.0的发展策略,我们的目标清晰而一致。在那段时间里,我们也曾遭遇一些弯路。出于对于开源的满腔热情,我曾经全力推进过Caffe2社区的发展。但在反思后我意识到,每个系统都有其长处和短处。我们利用Caffe2解决的是业务系统中的问题,而非社区问题。我们不应该将所有问题都揽入怀中。后来,我们将外部品牌统一为PyTorch,正是基于这样的思考。

对于MXNet的发展路径,我认为它与众多机器学习框架的演变有着诸多相似之处。关键不在于“我能做什么”,而在于“我能解决谁的痛点,以及什么痛点”。我们不应沉迷于创造新的技术轮子,而是要着眼于解决真正的新痛点。解决真正的需求才是我们的目标,这才是所有技术发展的核心所在。

Copyright © 2016-2025 www.robotxin.com 人工智能机器人网 版权所有 Power by