推特等公司要价太高 OpenAI 和 Cohere 等 AI 公司转向合成数据

服务机器人 2025-03-19 15:46www.robotxin.com女性服务机器人

人工智能巨头微软、OpenAI以及新兴公司Cohere共同面临着一个挑战:Reddit、Twitter等公司的数据采集成本高昂。面对这一难题,他们纷纷转向合成数据作为AI模型的训练资源。近日,Cohere公司的首席执行官Aiden Gomez透露了这一转变。

Gomez强调,合成数据的应用前景广阔,但尚未得到全面推广。他举例说,如果一个企业希望在高等数学领域训练模型,可以利用合成数据创造两个智能模型,模拟老师和学生的互动,讨论如三角学等复杂话题。这一过程主要依靠人工监控,一旦发现错误,即可迅速纠正。

那么,何为合成数据?简单来说,合成数据是通过计算机技术人工生成的数据,不同于那些源于真实事件的数据。尽管它们是人工制造的,但合成数据在数学和统计学上具有高度的可用性,能够反映原始数据的属性。它完全可以替代真实数据,用于训练、测试和验证大型模型。

这一技术的采用显示出AI行业在应对数据采集挑战时的创新精神,也预示着合成数据在未来AI发展中的重要作用。

Copyright © 2016-2025 www.robotxin.com 人工智能机器人网 版权所有 Power by