让炼丹师不再为数据集发愁,这家公司创建了一
机器之心编辑部
初创公司格物钛希望通过在公开数据集社区和数据管理工具领域的创新,从而推动数据定义软时代这一新时代背景下的全球创新,破局数据孤岛,赋能AI基础设施建设。
数据定义软件时代到来
回顾互联网发展历史,过去 30 年是开源软件生产数据的时代,这个时代诞生了 Google、Facebook、阿里、和字节跳动这样的互联网巨头,他们都在用软件生产海量的数据。不难发现这一趋势从近几年开始悄然发生了变化,实际上前 30 年的数字化变革已经产生了大量用于算法训练的非结构化数据,如何存储、管理以及利用现有的数据来完成更加高效的算法迭代和应用开发才是 AI 开发者在未来 30 年需要面对和解决的课题。伴随着 Snoflake 这样的数据处理软件公司进入了人们的视野,我们看到数据定义软件的时代已经到来。而初创公司格物钛希望通过在公开数据集社区和数据管理工具领域的创新来推动这一新时代背景下的全球创新。
破局「数据孤岛」成为关键
高质量的数据是支持 AI 算法的基矗以往数据大多以孤岛的形式存在,数据之间却并没有产生连接。不同企业、机构之间的数据标准规范并不统一,数据质量也参差不齐,就算进行共享也依然困难重重。伴随着各类 AI 应用场景落地的技术难点逐渐浮出水面,以领域为例,许多驾驶场景具有稀缺性,仅凭一家之力构建包含所有的交通场景的数据集将消耗巨额的数据采集成本,并且很难在短时间内一步到位,AI 企业认识到打破数据孤岛走向合作开放将是未来谋求发展的必然选择。
近年来行业中不少企业和高校研究机构已经陆续发布公开数据集,将自身积累的优质、庞公开出来,为认知层、感知层的 AI 技术提供学习驱动,把更多的数据、算力、技术汇集在一起,帮助各领域的数据释放出其应有价值,为人工智能的产业化落地提供关键基矗
格物钛公开数据集平台
以开源数据集平台赋能 AI 基础设施建设
随着行业参与者们对数据的态度越来越开放,很多公开数据集应运而生。由于缺乏统一的行业规范与标准,用户搜索下载和使用这些公开数据集存在诸多困难。格物钛看到这一行业痛点后随即发起了 “寻集令” 项目的号召,希望发挥自己在数据管理上的技术优势,建立 AI 公开数据集平台。招募、互联网泛娱乐、新零售、智慧城市和在线教育等多领域的合作伙伴加入,打造最受开发者欢迎的公开数据集社区,为企业、机构和个人提供高质量的真值数据、推动人工智能行业场景落地。
格物钛公开数据集平台自去年九月份上线以来,用户数实现了 13 倍的爆发式增长。目前已有涵盖 8 个领域的 16 家企业与我们达成了战略合作,他们将会在格物钛公开数据集平台上开源自有的数据,赋能 AI,加速人工智能行业的快速落地和科研创新。
格物钛 CEO 崔运凯表示“寻集令是一个永远不会终止的倡议。如果你是一个企业的决策者,如果你有大量的数据,还不知道如何发掘它的价值,或者还想探寻如何更好使用它们的创意,也许是时候开放它们其中的一小部分,给这个社区中的创新者们,让他们运用他们的智慧,来发现这其中无限的价值。这个价值被发现的过程,往往带来的是双赢。社区的力量是强大的,Graviti 希望今天的分享和倡议,可以激励你参与到我们的行动中来,因为只有我们携起手来,才能一起定义未来。” Graviti 公开数据集平台下一阶段还将持续投入研发,为人工智能企业和各类学术研究机构提供专业的一站式公开数据集发布及运营支持,完善社区功能为用户提供问题与需求的反馈渠道,有效解决用户提出的各类数据集需求。未来格物钛也希望可以携手更多 AI 生态的各类伙伴,一起用心去开源,建设人工智能数据领域的高地。
寻集令全球合作伙伴一览
THE END
转载请联系本公众号获得授权
机器人工业设计
- 工业机器人技术专业方向 工业机器人技术专业方
- 国际上第一台工业机器人产品诞生于 世界上第一
- 工业机器人编程属于什么专业 工业机器人编程属
- 工业机器人编程是学的什么专业课程
- 工业机器人技术需要学什么 工业机器人技术需要
- 工业机器人编程是学的什么内容 工业机器人编程
- 工业机器人发展趋势 工业机器人未来的发展趋势
- 国内工业机器人企业排名 2024年国内工业机器人企
- 工业机器人学起来难不难 工业机器人好不好学
- 工业机器人就业形势了解 工业机器人就业现状
- 工业机器人编程及操作的阅读内容 工业机器人编
- 工业机器人编程难不难 工业机器人编程难不难学
- 工业机器人入门实用教程 工业机器人入门应该学
- 工业机器人编程基本思路是什么 工业机器人编程
- 工业机器人难学吗 工业机器人学起来难不难
- 工业机器人岗位介绍 工业机器人岗位说明