机器人为什么能写稿,以及它们能拿普利策奖吗?
导读:在里约奥运会期间,写稿机器人“Xiaomingbot”展现出了惊人的实时新闻撰写能力。通过与奥组委数据库对接,它在短短的16天内发布了456篇资讯报道,新闻生成到发布的平均时间仅为2秒钟,传播速度几乎达到电视直播的水平。
随着自然语言处理、知识库等人工智能技术的飞速发展,媒体领域已经开始了机器人报道的探索。许多媒体机构,如《纽约时报》数字部门、美联社等,都已经开始使用机器人进行新闻报道。这些机器人不仅能够撰写日常报道,还能在财报季、运动比赛等特殊时期发挥重要作用。
媒体领域出现这种趋势的背后,是人工智能技术的成熟度与新闻媒体需求的完美匹配。在信息组织结构中,像卡斯韦尔的“结构化故事”系统这样的创新工具,使得信息像音乐音符一样可以被灵活组装和阅读。任何类型的信息,从法院报道到天气预报,都可以被放入这样的数据库中,显示出巨大的潜力。
根据DonaldWReynolds的说法,人工智能系统在新闻创作过程中需要解决许多技术难题,包括自然语言处理中的自动摘要、文本分类等,以及知识库和知识发现(KDD)等相关技术。简单来说,机器首先需要理解自然语言,然后通过知识管理弄清楚新闻中各个要素之间的关系。在自然语言处理技术的推动下,谷歌、Facebook和微软等科技巨头都在这一领域投入了大量研究力量。谷歌开源了SyntaxNet,将神经网络和搜索技术结合,显著解决了歧义问题;Facebook推出了DeepText文本理解引擎,能理解多种语言的博文内容。
其中,让机器阅读并理解人类语言是一项极具挑战性的任务。为了完成这项任务,机器不仅需要理解自然语言,还需要具备根据多种线索进行推理的能力。为了教会机器完成完形填空式的阅读理解,需要学习文档和查询之间的关系,因此必须依赖大规模的训练数据集。采用基于注意(attention)的神经网络方法,机器可以学习这些模式。为了创造大规模训练数据,CNN/DailyMail新闻语料库等资源的出现为机器理解新闻内容提供了宝贵的学习材料。近年来,随着技术的不断进步,机器阅读理解领域取得了显著的发展。从Hilletal.(2015)发布的Children’sBookTest(CBT)数据集到Maluuba公司提出的EpiReader模型,再到国内哈工大讯飞实验室的创新性attention-over-attention阅读器模型,一系列技术和模型的不断涌现表明了该领域的活力与潜力。
CBT数据集通过自动化的方式生成训练样本,为神经网络的大规模训练提供了宝贵的数据资源。随着数据量的增长,机器阅读理解逐渐从简单的语境推理转向更复杂的问题解决,需要更高水平的交互和更深层次的理解。在此背景下,机器阅读理解系统的性能不断提升。
今年六月,人工智能创业公司Maluuba公司推出的EpiReader模型在机器阅读理解领域取得了突破性进展。该模型采用两步策略确定问题答案,首先通过双向GPU逐字阅读故事和问题,挑选出可能的答案备选单词;然后采用卷积神经网络将每个假设与故事中的句子进行比较,寻找文本蕴涵关系,从而确定最终答案。这一模型在CNN和CBT两个数据集上的表现均超过了谷歌DeepMind、Facebook和IBM等公司的系统。
与此国内哈工大讯飞实验室提出了一种全新的attention-over-attention阅读器模型,该模型在文档级的注意之上引入了另一种注意机制,并称之为“集中注意”。相较于之前的神经网络模型,该模型只需要更少预定义的超参数,并能够以一种简洁的架构进行建模。实验结果表明,这一模型在多个公共数据集中的表现均显著优于当前许多最佳系统。
随着技术的不断进步和研究人员的不断努力,机器阅读理解领域正在取得越来越多的突破和创新。尽管面临着诸多挑战,但这一领域的发展潜力巨大,有望在未来为人工智能领域带来更多的惊喜和突破。在今日头条实验室的深度学习结合知识库的CFO方法创新下,自然语言问题被巧妙地转化为结构化查询。不同于传统方法,CFO方法采用StackedBidirectionalGRU神经网络,能够精准识别问题中的实体及其关系。通过构建结构化查询语句并从知识库中寻找答案,其准确率已经超越了微软和Facebook。
这一技术进展在新闻领域的人工智能应用中影响深远。今日头条作为资讯推荐领域的先驱,一直通过观察用户的日常行为来深化对用户兴趣偏好的理解,从而提高推荐准确性。如今,技术的进步进一步延伸了这种智能推荐的边界。正如创始人兼CEO张一鸣所预言,人工智能演化的第一阶段将在各个垂直领域诞生若干超级智能,如资讯推荐领域的今日头条等。
在媒体领域,机器人创作正逐渐成为超级智能的起点。今日头条与北大计算机所万小军教授团队合作的Xiaomingbot,其资讯生成部分的研究——实时文本生成,正是此趋势的生动体现。同样,用于问答系统的CFO也将广泛应用于今日头条的其他媒体产品中。头条问答等产品希望通过自动回答方式解决简单和事实性问题,以节省人力。
今日头条实验室不仅仅关注文本理解,还致力于推动人工智能技术研究,让算法更好地理解文字、图片、视频、环境场景和用户兴趣。这一综合性平台不仅是新闻客户端,更是一个基于机器学习的个性化资讯推荐引擎,为信息的分享和创作提供了广阔空间。人工智能和机器学习的算法在其中起到了关键作用,帮助精准推荐用户感兴趣的内容。
随着人工智能技术在媒体行业的深入应用,其影响力日益显现。互联网作为智力工具,带来了信息爆炸的同时也增加了筛选优质信息的难度。而人工智能的优势在于,它能让大数据从负担转变为便利,重塑媒体的内容生产和分发方式。
以美联社为例,采用Wordsmith机器人后,其财报文章撰写效率大大提高。在哥伦比亚大学庆祝普利策奖诞生一百年之际,智能机器人开始在财经报道、体育实况报道等领域崭露头角。对于机器人能否赢得普利策新闻奖这一问题,美通社的贾斯汀·迈尔斯表示“绝对相信”。实际上,早在1988年,电脑辅助写作的调查报道已荣获普利策奖。
自动化新闻不仅提高了生产效率,还助力于定位客户需求。通过用户画像、情感分析等技术,为用户提供个性化内容。智能对话系统更可与用户进行交互,进一步提升用户体验。随着技术的不断进步,人工智能在媒体行业的应用将更加广泛和深入。随着人工智能技术在新闻领域的深入应用,关于其是否会引发失业问题的讨论愈发激烈。牛津大学先前发布的一份报告预测,当前有47%的工作岗位最终可能会被自动化取代。对此观点持批评态度的人们认为,工作的变迁并不意味着劳动者的失业。就如同汽车的普及取代了马车夫这一职业,但同时也催生了更多与道路建设和加油站服务相关的新工作。
在媒体界,这一趋势同样明显。机器人的引入将单调乏味的任务自动化处理,从而将记者们从琐碎工作中解放出来,让他们有更多精力投入到深度报道的挖掘上。机器人也能够帮助消费者更有效地筛选海量信息,提升他们获取知识和信息的效率。人工智能在媒体领域的应用,不仅仅是一次技术革新,更是一次解放人类创造力的革命。我们有理由相信,未来人工智能将成为新闻产业的重要工具,引领产业的创新发展。
家用机器人
- 从初生创业到人工智能领域的佼佼者
- 人工智能产业的全面发展
- 中国人工智能已比肩世界
- 全球产业格局大调整 工业4.0掀半导体变革
- 机器人13年内将抢走全球8亿人饭碗 这些职业影响
- 懒人福音:三星新款 AI 冰箱支持电动开门
- 大疆机场,让无人机基础设施巡检迈向自动化、
- 能链智电开启充电机器人等创新业务 预计2023年收
- 人工智能创新应用先导区再扩容 智能经济渐行渐
- 集萃智造三栖机器人,灵活切换水、陆、空三栖
- 机器人产业发展规划(2016-2020年)发布
- 四大论坛日程出炉,创客、机器人、校外教育、
- 新发布14家“双跨”工业互联网平台
- 《中国制造2025》解读之:推动机器人发展
- 机器人为什么能写稿,以及它们能拿普利策奖吗
- 国产机器人发展方针研究,国产AI芯片再引关注,