在2016年世界经济论坛的报告中,人工智能被预测为第四次工业革命的核心技术代表,越来越多的企业开始借力人工智能,在这场科技革命中抢占先机。深耕人工智能工业多年、全球第一个商用深度学习系统和全球最大的深度学习系统设计者陈雨强也表示,“AI+大数据”正在成为企业竞争标配,超高维的人工智能技术能为企业“弯道超车”提供突破口,未来每一个成功的公司都是一个人工智能公司。
,作为科学家的陈雨强面对AI热潮保持冷静。他表示机器学习的基本要素是“数据+模型+特征”,近期不断取得突破也是源于这三个因素前所未有的大数据、更高维的机器学习模型和更高效的特征分析能力。,这些要素目前还有诸多技术难点有待突破。“对现在的机器学习来说,数据的时序性、模型的解释性、特征工程的复杂性等技术难题,仍是横在人工智能工业应用前的鸿沟。人工智能无所不能只是人们的过度想象。”
,就数据而言,目前主流的深度学习技术是以二维数据矩阵来进行训练的,在工业化的应用场景之中,还需要引入时序特征,从而构成三维数据。以银行业为例,根据业务目标对银行用户的某些历史行为自动并做出相应关联,这就需要机器能调用并深度理解“人+特征+历史时间轴”的三维数据组合。第四范式尝试以工业界的具体目标为导向,最大程度地枚举出全部pattern,从而找到全面的历史特征,让数据三维立体化。
,在模型方面,只有人工智能的客户能够更好地理解模型原理,才会投入更大力度支持人工智能的工业应用,模型的可解释性,已经成为人工智能在产业界发展的必要前提。第四范式的科学家们希望模型易于理解、易于交互,来满足某些关键问题上要求输出和特定特征呈强线性关系的需求。对于价值密度高的特征来说,可以用特征细节增强技术,一个特征可以从多维度进行描述,当实际应用需求产生时能够自动判断出最佳维度,保证既有全局观,又不失细节。这种新的技术不但具有良好的模型效果,还具备良好的可解释性,能为工业界所快速接受。
,在特征方面,复杂的特征工程要求企业能够提供较强的专家知识和经验,一个基本的AI应用需要由专家来提取700个特征,并不断根据业务目标进行排列与,这些都使得机器学习的在人力的投入上居高不下。人工智能的工业应用急需使机器具备更强大的特征提取能力,使得机器学习对专家的依赖性降低,获得更佳效果。通过领先的特征工程技术,第四范式扭转了传统机器学习精力分配不合理的局面,将原本占比80%的特征工程工作量降低到20%,而将80%的精力安排在更有价值的模型调优上,提高了机器学习的效率。这种技术能够极大地降低机器学习的行业应用门槛,帮助人工智能在各行业普及。
时下,尽管人工智能被寄予厚望,其中也不乏停留在空想阶段的“画饼”人工智能技术。而第四范式希望人工智能在高速发展的,可以以一种全局的、智能的、低耗的方式不断突破技术难题,让AI的商业价值落地于各行各业。例如第四范式推出的国内首个人工智能应用者开发平台”先知”,就将顶级科学家10余年人工智能研究和应用经验封装到产品中,极大降低了人工智能应用门槛。
陈雨强,第四范式联合创始人,首席研究科学家,世界级深度学习、迁移学习专家。曾在多个国际顶级人工智能会议发表论文,论文被全球著名科技杂志MITTechnologyRevie收录报道。陈雨强主持架构了世界上第一个商用深度学习系统“百度凤巢系统”,大幅提升了广告点击率并使变现能力提升8倍;主持架构了中国用户量最多的新媒体人工智能推荐系统“今日头条”,以支持千亿特征、千亿数据的流式机器学习系统,实现今日头条新闻推荐的个性化、准确性与时效性。
第四范式是国际领先的人工智能技术与服务提供商、数据科技驱动行业应用的创新者。创始团队杨强、戴文渊开创的“迁移学习”被业界认为是“下一代人工智能技术”。