ODCA发布厂商中立的大数据新指南

智能机器人 2025-03-29 14:41www.robotxin.com人工智能机器人网

究竟什么是大数据?对于这个问题,答案多种多样。其中,Gartner提出的著名的3V特征——高容量、高速度、多样性的信息,是最常被引用的定义。尽管如此,关于大数据的定义,仍然存在着一定的模糊性。为了帮助企业解答这个问题,以及了解大数据的重要性并如何从中获益,开放数据中心联盟(ODCA)发布了的“消费指南”。

ODCA,自2010年创建以来,一直致力于开发开放标准。在接受电话采访时,ODCA负责人表示,该联盟的“消费指南”是对其工作的逻辑延伸。ODCA首席技术顾问John Pereira指出,大数据的本质在云环境中得到了很好的体现,尤其是大数据的量可以在很短的时间内显著增长。

Pereira进一步表示,由于大数据的这些特性,企业可能会考虑采用分布式环境,而大数据范式将帮助企业朝这一方向迈进。该消费指南展示了平台如何助力各行各业。例如,银行可以关联来自多个不相关来源的数据,以发现潜在的信用卡欺诈。该指南还提供了统一的定义和术语,以便企业在与服务供应商合作时使用。

该指南还引用了一些惊人的统计数据:非结构化数据占当今企业内信息的90%以上,其中大部分存储在文档、电子邮件、文本和Web内容中。属于大数据范畴的非结构化数据包括来自传感器的机器生成的数据、机器日志和手机GPS信号,以及来自社交网站和网上交易的数据。

消费指南中提到了Apache Hadoop作为“领先的技术”,但也指出还有很多其他开源项目可供选择。这位ODCA负责人表示,企业需要提前仔细规划自己的战略,以避免浪费资源和金钱的不良做法。处理数据蔓延是企业面临的关键问题。根据麦肯锡全球研究院的数据,一些部门的存储数据量已经超过了美国国会图书馆的数据量。并且,大量新的数据产生于过去两年中,例如越来越多地使用视频分析技术。

五年前的企业可能不会想到保存视频并对视频进行分析以做出更明智的商业和购物决定。但现在这已经成为了一种普遍的做法,这也完全回溯到了大数据的核心。正是大数据提供了这种有趣的新技术和范式,让越来越多的企业意识到其价值并开始从中获益。在大数据的浪潮中,无论是金融、医疗、教育还是其他行业,都在积极如何利用这一资源丰富的数据宝库来推动业务的发展和进步。

Copyright © 2016-2025 www.robotxin.com 人工智能机器人网 版权所有 Power by