微软人工智能正在学看图说话 视障患者看到了希望

服务机器人 2025-03-27 15:13www.robotxin.com女性服务机器人

微软研究人员近期利用人工智能让计算机学会了一项独特的技能——为图片配上生动的注解,并能够将多张图片串联成故事。据国外科技媒体VentureBeat报道,这一技术的突破意义重大。

传统的图像识别技术通常只能识别出图片或视频中的物体,但微软的新技术让计算机能够理解的更多。为了让人工智能掌握叙述故事的能力,微软团队首先为每一张图片以及按顺序排列的组图编写了富有情境感的注解。随后,工程师们利用这些信息训练机器,使其能够按照图片的顺序,将这些故事娓娓道来。

微软的研究人员采用递归神经网络进行这项训练,使用的是机器翻译领域常用的序列到序列学习方法。这一技术的潜力无比巨大,不仅能够帮助视障人士识别周围的事物和环境,还能通过看图讲故事的方式辅助语言学习,甚至激发孩子们的创造性思维。

随着智能拍照手机的普及,我们常常一次性拍摄多张照片来记录生活。微软正在研发一项技术,努力让机器理解这些照片之间的关系。虽然这项技术尚未完全成熟,但我们可以预见,未来通过人工智能的加持,计算机将能够为我们串联起生活中的每一个瞬间,让我们通过图片回味生活的精彩瞬间。

Copyright © 2016-2025 www.robotxin.com 人工智能机器人网 版权所有 Power by