多快好省的生成式AI何时进入规模化商用
近日,一位国外游戏设计师的AI作品《太空歌剧院》在美国科罗拉多州博览会艺术比赛中夺得了数字类别的一等奖,这一结果引起了广泛的关注和热议。不少传统艺术家对此提出质疑,关于AI作画是否属于作弊、人类艺术是否逐渐消亡的讨论在网络中持续发酵。
随着科技的进步,AI技术日益成熟,其中生成式AI作为新兴技术备受瞩目。根据Gartner发布的技术成熟度曲线显示,生成式AI等技术在经过两年的萌芽后,已迅速步入期望膨胀阶段。而根据MIT科技评论和Gartner的评选,生成式AI更是被公认为全球突破性技术之一。
那么,何为生成式AI呢?简单来说,生成式AI是一种可以从现有文本、音频文件或图像等创建新内容的技术。它能够学习并生成全新、原创且逼真的作品,保留与训练数据相似的特征。这种技术的潜力巨大,不仅可以加快从医学到产品创造等领域的研发周期,还能为企业创新工作流程提供助力。
企业可以采用两种方式运用生成式AI。可以与业务部门合作,增强当前的创新流程,开发自动化工具以辅助人类完成创造性任务。游戏设计师便可以利用生成式AI来创建地下城,突出其创意构思。生成式AI也可以作为业务流程的核心部分,自主生产无数的创意作品,只需设置相关上下文即可。
生成式AI的关键技术包括生成式对抗网络(GAN)和变分自动编码器(VAE)。其中,GAN广泛应用于图像处理,通过生成器和判别器的对抗训练,生成更加逼真的图像。而VAE则更多用于信息压缩,通过编码器和解码器的组合,优化数据的表示和重建。
生成式AI的巨大潜力正逐渐显现。IDC报告预测,到2025年,全球AI市场规模将达到2218.7亿美元。在中国,这一技术也受到了广泛的关注和应用。以生成式AI和组合式AI为代表的新兴技术被认为是推动中国数字商业发展的关键力量。
在各行各业中,生成式AI有着广泛的应用场景。在工业设计领域,企业可以利用生成式AI设计出满足各种限制条件的方案。在媒体内容生成方面,生成式AI可以处理并生成各种类型的媒体数据,包括图片、音频、视频等。它还可以用于增强式编程,辅助程序员完成复杂的编码工作。数字人、虚拟偶像等也是生成式AI的应用方向之一,通过大模型实时生成并融合呈现各种形式的数据。
除此之外,生成式AI还为企业数据使用提供了新的可能性。在真实数据的基础上,生成式AI可以制作合成的数据,保留数据价值的同时隐藏涉及数据安全的隐私部分。这一技术的应用将为企业带来革命性的变革,推动各行各业的创新发展。随着技术的不断发展,合成数据已展现出其巨大潜力,成为提高数据资源丰富度的重要工具。合成数据在国际上已被广泛运用于辅助AI训练,特别是在为工业机器人和自动驾驶车辆设计训练场景方面,成果显著。国内商业公司如支付宝,已采用实物建模与渲染技术,推出3D合成方案,有效降低了模型训练中的数据成本,并避免了人工标注数据可能带来的误差。
Unity总裁约翰·里奇蒂洛坚信,合成数据能够精确无误地训练人工智能算法。与真实世界数据强化过程相比,合成数据几乎能即刻完成复杂的训练过程,这在过去需要耗费数日甚至数月的时间。
在Gartner研究总监闫斌眼中,合成数据未来的应用前景十分广阔。相较于全球市场,国内的合成数据厂商尚少,机会更多。合成数据不仅能实现不同企业间数据的汇集,还可应用于第三方分析、厂商选型、测试以及云应用等。更重要的是,在脱敏和合规的基础上,合成数据能够帮助实现数据的变现,同时最大限度地保留其原有价值。
尽管前景光明,合成数据仍面临一些挑战。生成式AI和合成数据虽然被看作人工智能2.0的潜力股,但在大规模商用之前,仍需在逻辑与安全性方面取得突破。
专家们指出,全面应用合成数据集前,必须充分研究其与真实数据集的差异,避免应用合成数据集带来的偏差。目前,合成数据技术的“非自然数据”问题也引起了关注。由于经典统计学侧重于数据中蕴含的相关性,而忽视因果性,可能会生成不合逻辑的数据。这些“非自然数据”对智能算法的鲁棒性和可靠性将产生何种影响,仍是未知数。
合成数据的安全性问题也不容忽视。包括生成对抗网络等模型的稳定性问题、对原始训练样本的记忆可能导致的隐私泄露等风险。合成数据在实际应用中仍存在模拟场景不足的问题,对于人脸检测、物体识别等任务也不一定适用。对于低成本实现动态场景模拟等技术难点还需进一步攻克。
虽然合成数据在人工智能领域的应用前景广阔,但仍需在多个方面取得突破,才能更好地发挥其潜力。