生成式 AI 火了:硅谷押注,让你把简单文字变成图像甚至视频

新闻热点 2024-12-28 11:08www.robotxin.com纳米机器人

最近几年,生成式人工智能(generative AI)技术正成为硅谷科技巨头和风投机构瞩目的焦点。这种AI能够在几秒内,根据少量词汇生成匹配的图像。分析师预测,这项技术将广泛应用于各行各业,并有望创造数万亿美元的经济价值。

尽管这些计算机程序生成的图像还存在一些不完美之处,如肢体比例不自然或符号无意义等。这些图像生成程序可能预示着新一轮科技热潮的来临。硅谷风投机构NextView Ventures的投资人大卫·贝塞尔表示,“生成式人工智能”已成为流行语。

自2021年以来,生成式AI技术取得了显著进步,激发了人们的创业热情,许多人梦想着AI将来为新一代科技巨头提供动力。在过去的五年里,AI领域持续发展,大多数进步与理解现有数据有关。生成式AI模型能够生成前所未有的全新内容,它们是在创造,而不仅仅是分析数据。

AI与机器学习平台Craiyon Productive AI的创始人鲍里斯·戴玛表示,生成式AI能够创作全新事物,不仅限于类似旧有图像的复制,还可以创造与以前完全不同的新事物。红杉资本在其网站上发文称,从游戏、广告到法律领域,生成式AI将改变所有需要人类创造力发挥作用的领域,并可能产生数万亿美元的经济价值。有趣的是,红杉资本的帖子还指出,部分文章是由GPT-3撰写的,而GPT-3就是一个能够生成文本的生成式AI。

生成式AI的工作原理源于机器学习的一个子集——深度学习。自2012年一篇关于图像分类的突破性论文重新点燃人们对这项技术的兴趣以来,深度学习推动了AI领域的大部分进步。图像生成器的工作原理则是逆转这个过程,它们将英语短语转换成图像,通常包含处理初始短语和将数据转换成图像的两个主要部分。

基于名为生成式对抗网络(GAN)的方法,是图像生成器工作的基础。较新的方法则使用转换器,这是谷歌在2017年的论文中首次提出的概念。第一个引起大量关注的图像生成器是Dall-E,由硅谷初创公司OpenAI于2021年推出。另一个广受欢迎的基于AI的图像生成器是Craiyon(之前称为Dall-E Mini),可以在网络上使用。自2021年7月推出以来,Craiyon每天生成约1000万张图片。

但最能激发人们热情的项目是Stable Diffusion,该项目于今年8月向公众发布。它的代码可以在GitHub上获取,可以在电脑上运行,也可以在云端或通过编程接口运行。这个项目让人们看到了生成式AI的无限可能,从创业、投资到实际应用,都在预示着这一领域即将迎来巨大的发展。本文将向您介绍Stable Diffusion如何通过集成到Adobe Photoshop中的插件,为生成式AI技术带来了变革。插件开发者坎特雷尔,这位在Adobe工作了20年的资深人士,如今专注于生成式AI领域,他表示该插件已被下载数万次,并且艺术家们已经发掘了无数意想不到的使用场景。

通过生成式AI技术,艺术家们现在可以通过Lexica搜索引擎,利用特定的短语来生成图像。这种技术正在引发一场革命,尤其是在艺术领域。Reddit和Discord等平台上,人们分享着如何巧妙运用短语生成心仪图像的技巧。

创企、云服务提供商和芯片制造商可能是最大的受益者。许多投资者将生成式AI视为一种具有变革性的平台,类似于智能手机或互联网早期的阶段。一些初创公司已经获得了大量投资,并且该领域的其他人认为这些初创公司最终可能会挑战目前主导AI领域的软件巨头,并为下一代科技巨头的崛起铺平道路。云服务提供商和芯片制造商也将受益于这项技术的普及,因为生成式AI可能是计算密集型技术。meta和谷歌已经在这一领域招聘了大量人才,并计划将这种技术整合到他们的产品中。谷歌最近发布了名为Phenaki的程序代码,可以将文本转换为视频。这种技术的热潮也给英伟达等芯片制造商带来了提振。英伟达首席执行官黄仁勋强调生成式AI是他们最新芯片的关键用途,并预测这种技术将很快给通信领域带来革命性的变化。虽然目前生成式AI对终端用户的好处仍然有限,但未来肯定会带来更多令人兴奋的应用场景。随着技术的不断进步和普及,我们期待更多的创新和突破性的应用涌现出来。让我们共同见证生成式AI如何改变我们的生活和未来!面对生成式AI的挑战

最终,每一位涉足生成式AI开发的先驱,都将无可避免地遭遇图像生成技术所带来的深刻挑战。

是关于就业的问题。尽管这些程序依赖于强大的图形处理器,但它们生成的内容成本,相较于专业插画师的时薪,仍然低廉得多。那些依赖于创作作品谋生的人们,如艺术家和视频制作人,可能会受到生成式AI的巨大冲击。迈克尔·邓普西,Compound VC的管理合伙人,警告道:“机器学习模型有可能在工作效率、速度和成本方面超越人类。”

紧接着是原创性和所有权的问题,生成式AI对此带来了前所未有的复杂挑战。这些AI模型是通过大量现有图像进行训练的,而关于以原创风格生成的图像,原始图像的创建者是否拥有版权仍在激烈争论中。最近,一位艺术家在科罗拉多州的艺术比赛中凭借主要由MidJourney生成的图像获胜。他在赛后接受采访时提到,他从数百张生成的图像中挑选了一张,并在Photoshop中进行了后期处理。

Stable Diffusion生成的一些图像似乎带有水印,暗示其原始数据集部分受到版权保护。某些指导建议用户提及在世艺术家的名字,以便在模仿其风格时获得更好的结果。上个月,Getty Images因担心侵权纠纷而禁止用户上传生成式AI生成的图像至其库存数据库。

图像生成器还能制造商标人物或目标的新图像,如小黄人、漫威角色或《权力的游戏》中的王座。而随着图像生成软件的日益完善,它们也有可能误导用户,让他们相信从未发生过的虚假事件或显示虚假图像和视频。

开发者们还需警惕另一种可能性:基于大量数据训练的AI模型可能会包含与性别、种族或文化相关的偏见,这可能导致其输出中反映出这些偏见。Hugging Face已经发布了关于问题的资料,并就在负责任的态度下开发AI模型的问题展开了讨论。Hugging Face的首席执行官克莱门特·德兰格指出:“由于这些模型是在大数据集上训练的概率模型,因此往往会吸收许多偏见。”他举例说,曾有一次生成式AI被要求绘制“软件工程师”的图像,结果却生成了白人男性的形象。面对这些挑战,我们需要共同努力,确保AI的发展既智能又公正。

Copyright © 2016-2025 www.robotxin.com 人工智能机器人网 版权所有 Power by