服务对于企业云来说颇具吸引力,亚马逊AWS,微软Azure和谷歌公共云为此在市场中激烈竞争,但哪家公司会脱颖而出呢?
的市场正在迅速发展,而大数据业务也在不断变化。虽然这对于云计算供应商来说比较困难,这是值得尝试的,而这对于全球领先三大云计算供应商(亚马逊网络服务,微软Azure和谷歌公共云)来说也是不平等的。
在云计算和大数据具有协同效应的市场区域,谷歌公司在搜索方面经验非常丰富有但亚马逊网络服务(AWS)和微软Azure吸引一些有趣的初创公司增加价值。
而大数据服务这个充满活力的服务无论从性能和经济的角度来看越来越有吸引力。云计算用户将最终从三个云计算巨头之间的大数据竞争中获益,不过这看起来将要持续多年。
以下仔细看一下亚马逊AWS,微软Azure和谷歌公共云目前提供的大数据服务
亚马逊网络服务
亚马逊网络服务(AWS)拥有广泛的大数据服务。例如亚马逊弹性MapReduce,运行Hadoop和Spark而KinesisFirehose和 KinesisStreams提供了大数据集到AWS。用户可以通过Redshift存储数据,Redshift是通过数据压缩以帮助降低成本PB级规模 的数据仓库,开源软件Elasticsearch是部署在AWS中的分析工具,提供如点击率和日志监控等服务。并通过Kinesis补充分析数据流。
值得一提的是,谷歌提供的大数据产品缺乏的就是GPU实例。
与谷歌公司相比,AWS有一个更大的数据集的存储选择。除了大量的AWS简单存储服务的农场以外,还拥有低延迟的NoSQL数据库;为Titan图形数据库提供存储服务的DynamoDBTitan;PB级的NoSQL数据库和关系数据库ApacheHbase。
AWS还具有一个商务智能(BI)服务,QuickSight可以采用并行的方式,在内存中实现高速处理。这是亚马逊机器学习和的AWS联网(IoT)平台,该平台的设备连接到云中,并可以扩展到数十亿美元的设备和万亿条消息。
虽然谷歌公司具有边缘的搜索和分析引擎,而AWS的服务范围更广,并有双图形处理单元(GPU)的实例。
微软Azure
对于分析,微软Azure有数据分析湖,它采用专有的U-SQL与SQL和C++,以及基于Hadoop的服务的HDInsight。,还有 Azure的分析数据服务DataFactory,使用全局元数据系统识别数据资产和数据工厂,其中连锁内部部署和云数据源和管理数据管道。
数据存储湖是Azure在Hadoop文件系统的大数据存储服务。云服务提供商有广泛的通用存储产品,包括StorSimple,SQL和NoSQL数据库和存储块。