5年前大数据喷涌而来;现在大数据这词已经不火了
五年前,《纽约时报》宣告人类迈入大数据时代,预示着海量数据的收集与分析将改变人类生活的方方面面。自那时起,大数据仿佛成为了一种全新的宗教,引发了全社会的狂热追捧。从商业到学术,再到医疗和两性关系,人们期望先进的数据分析能带来前所未有的变革。这种数据狂潮迅速扩散至全球,甚至连巴拉克·奥巴马的白宫也卷入了这场大数据漩涡。正如麦肯锡咨询公司所指出的那样,大数据的影响远不止于此。尽管大数据在日常生活中的重要性愈发凸显,但大数据这一术语似乎开始褪去其流行色彩,甚至引发了一些人的反感。
大数据一度被视为未来革命的催化剂,引领我们进入一个充满创新和洞见的新时代。近年来,“大数据”一词的使用越来越频繁,开始带有一种负面的意味。因为当企业机构匆忙执行和应用大数据进行所谓的“数据驱动型决策”时,出现了一些严重错误和失误。这些错误不仅引人注目,而且更加阴险。它们隐藏在那些看似神秘的数据驱动制度性模型之中,比如法庭上使用的带有种族偏见的累犯模型,或是基于可疑数据解雇教师的模型等。最近Facebook算法帮助俄罗斯通过针对性的假新闻影响美国总统大选的事件更是让人警醒。这些失误揭示了不加批判地盲目依赖大数据可能带来的灾难性后果。
事实上,“大数据”本身并不是问题所在。问题在于我们如何解读和使用这些数据。当处理数十亿个数据点时,任何给定数据点的来源都变得模糊不清。这些数据包罗万象:包括网站点击、光标位置数据、大型公共空间十字转门的转动次数、全球各地的风速观察记录以及社交媒体推文等等。在如此庞大的数据规模面前,解读其背后的真正含义变得极具挑战性。正如茱莉娅·罗斯·韦斯特在最近给Slate杂志的文章中所言,不加批判地盲目依赖数据往往会导致灾难的发生。我们需要更加谨慎地对待大数据的应用,避免被表面的光鲜亮丽所迷惑而忽略了其背后可能存在的风险和问题。在使用大数据的我们还需要加强对数据的批判性思维和分析能力,以确保我们能够真正从这些数据中获得有价值的洞见和启示。只有这样,我们才能充分发挥大数据的潜力并避免其可能带来的负面影响。在现今信息泛滥的时代,我们往往陷入数据的海洋,试图从中寻找真相和答案。如同波澜壮阔的大海隐藏着无数未知的漩涡一样,那些看似强大的数据也可能隐藏着陷阱和误导。从民意调查到学生成绩评估,再到社交媒体的用户反馈,我们依赖的指标真的能够准确反映我们所想要了解的真实情况吗?
民意调查,如同古老的航海指南针,是我们衡量公众意愿的航标。从汤姆·布拉德利的选举失利到特朗普的当选,一次次提醒我们,投票结果并非总是与民意测验相符。如同风起云涌的海面与变幻莫测的风向标之间的微妙差异,民意测验与人们的真实意愿之间也存在微妙的偏差。Facebook上的点赞数曾是衡量用户喜好的重要指标,但随着算法优化的动态信息的涌现,这个指标开始显得捉襟见肘。标题诱饵和婴儿照片等内容的出现导致用户满意度下降,让公司意识到单一的“点赞”指标并不能真正反映用户的真实感受。这就像航海者在海上遇到复杂的天气变化时,仅凭单一的指南针是不够的,需要更多的工具和方法来导航。
当我们深入思考大数据的优劣时,不禁会想起学区评估教师的例子。尽管大数据可以帮助我们发现隐藏在复杂数据集中的关联性,但它也可能带来误导。学生成绩的影响因素众多,与教师的表现并不完全相关。大数据模型试图通过一系列复杂的算法来评估教师表现,但这样的模型可能会因为各种因素而偏离真相。就像船只在大海中航行时可能会受到风浪的干扰一样,任何模型都可能因为各种未知因素而偏离正确的航道。我们需要更加谨慎地看待大数据模型的结果。与此透明度和验证模型的机制也是不可或缺的。奥尼尔和李洋姬两位教育家的实践给我们提供了不同的视角。他们的系统各有利弊,但都提醒我们要保持对数据的批判性思维。
为了解决数据集与现实世界不完全相关的问题,我们可以尝试加入更多的指标数据来丰富我们的模型。Facebook的实践为我们提供了一个生动的例子。通过增加用户观看帖子的时长、浏览文章的时间等更多指标,Facebook试图更准确地衡量用户的内容喜好。这种方法也存在挑战:它难度大且成本高昂,同时模型的复杂性可能导致其难以理解和维护。当模型变得过于复杂时,它可能会变得不透明和难以诊断问题所在。过度拟合和过度信任也可能带来风险。这就像在大海中航行时遇到风暴一样,过于依赖复杂的模型可能会导致我们在危机面前束手无策。我们需要保持警惕并不断调整我们的模型以适应现实世界的复杂性。
对于大数据集的偏见问题,另一个可能的应对方法是“小数据”。小数据指的是那些足够简单可以直接由人来分析和解读的数据集。与依赖复杂算法的大数据模型相比,小数据更加直观和易于理解。通过运用小数据,我们可以避免过度复杂和难以理解的模型带来的风险。“小数据”为我们提供了一个回归简单、回归真实的可能路径。在这个充满数据的世界里,我们需要找到平衡,既要利用大数据的力量发现关联性,也要保持批判性思维和对真实世界的理解。只有这样,我们才能在信息的大海中航行得更加稳健和明智。丹麦作家马丁·林德斯特罗姆在其2016年著作《小数据:揭示大趋势的微小线索》中,深入探讨了企业应该如何应对数据处理的策略。他以丹麦知名玩具制造商乐高为例,说明了过分依赖大数据可能会导致的失误。
过去,乐高在尝试迎合千禧一代的需求时,依据的是大量的市场调研数据。他们认为这一代人需要即时满足,更容易被轻松的项目吸引,因此转向生产更大块的积木,甚至在1990年代末和2000年代初推出了主题公园和视频游戏。这种转型并未取得预期的成功。
一次范围较小的人类学调查打破了这种数据驱动的策略。林德斯特罗姆提到,乐高的营销团队开始询问孩子们最珍爱哪些物品,结果发现孩子们最喜欢的是那些能够展示他们努力与技能的产品,比如经过长时间练习而磨损的旧运动鞋。于是,乐高重新专注于生产那些小巧的积木,这一决策让乐高实现了复兴。
亚马逊是一个很好的例子,说明了大数据的威力。该公司运用大量关于顾客购买和浏览习惯的数据,成功成为了全球最顶尖的零售商之一。正如布拉德·斯通在其著作《万货商店》中所描述的,亚马逊的CEO杰夫·贝索斯不仅仅依赖大数据分析来提升运营效率,他还深知大数据可能掩盖某些特定问题的真正原因和机制。贝索斯要求他的团队不仅要解决表面问题,还要深入挖掘问题的根源。
展望未来,随着“大数据”不再是热门词汇,我们有望对数据的威力和潜在风险有更深入的理解。数据的涌现引发了一场淘金热,有时会使人忽视审慎的重要性。也会有越来越多的人开始意识到大数据可能带来的负面影响。与此像机器学习和深度学习这样的新技术正在迅速发展,它们与大数据紧密相连,并可能导致严重的错误。我们必须更加谨慎地处理和使用数据,以确保我们能够充分利用其潜力,同时避免其可能带来的风险。
生活小妙招
- 智能建造加速传统产业格局重构
- 人工智能2050年超过人类智能
- 机器人产业未来的趋势如何
- 用匠人精神打造服务机器人
- 救援机器人的崛起与未来
- 机器人上岗引领安全生产3.0时代
- 灵动AMR哈雷摩托Pic2Go即拣即走方案成DHL全球
- 江苏苏州:疫情催生物流配送新市场 配送机器人
- 机器人应用推广提速,赋能千行百业转型升级
- 机器换人大势所趋 中小企业该如何践行?
- 丰田的首款下一款EV将是雷克萨斯品牌电动业务正
- 我是谷歌机器人,我认为人类天生不适合在科技
- 日本银行设中文服务机器人接待华人
- 人形机器人的未来,藏在人工智能的历史里
- 浙江日报头版点赞!会“缝合”不锈钢钣金的机
- 工业机器人龙头布局智能人形机器人,但不止于