阿里巴巴年度技术总结:人工智能在搜索的应用和实践
以深度学习为引擎的人工智能技术,已在图像、语音和NLP领域催生出革命性的进展。在信息检索和个性化领域,近年来更是涌现出众多创新实践。例如,通过wide & deep架构结合深度与浅层模型,dssm在计算语义相关性方面的应用,deepfm增强特征组合能力,以及deep CF和rnn recommender等运用深度学习实现协同过滤和行为序列预估个性化推荐的创新技术。工业级的信息检索或个性化系统是一个复杂的系统工程,深度学习的应用需要具备强大的系统计算能力、卓越的模型设计能力和适配的应用场景。我们回顾了近期一年多在搜索领域的深度学习探索,并分享我们在深度学习系统、算法及搜索应用方面的进展与思考,希望能为大家带来启发。
概括而言,深度学习的搜索应用主要表现在四个方面:
在系统层面,我们建立了强大的深度学习训练平台和在线预测系统,这是深度学习应用的基础。我们的离线、在线深度学习框架和预测框架已统一至tf,实现了日志处理、特征抽取、模型训练和在线服务部署的端到端流程,极大提升了算法迭代效率。
在搜索应用方面,我们聚焦于智能交互、语义搜索、智能匹配和智能决策四个技术方向。这些方向的协同创新推动了搜索全链路的深度学习技术升级,使我们具备从传统单场景单目标优化向多场景多目标联合优化的能力。
我们在性能优化上进行了广泛探索,包括模型压缩、量化、低秩分解至二值网络等技术。这些调研和论证为未来提高深度模型预测性能和软硬件协同优化打下了坚实基础。
我们实现了搜索服务的统一平台化,通过特征和模型复用,促进了多条业务线技术的快速升级。
搜索系统和算法的核心构成主要包括:
a. 离线数据平台ODPS,负责离线日志处理、特征抽取和模型预估,产出排序特征。时效性不强的特征由此平台产出,如用户性别标签、商品关键字等。
b. 离线机器学习平台PAI,底层采用主流的parameter server和TF深度学习框架,实现大部分机器学习算法模型的并行训练和预测。在搜索应用中,主要负责离线模型训练,产出排序特征模型。
c. 流式计算和在线学习平台Porsche,基于blink实现实时日志解析和特征join,生成实时排序特征。由于用户行为和市场环境变动快速,流式计算和在线学习在搜索应用中得到广泛运用,并积累了丰富的在线学习和强化学习算法。
d. 在线服务平台,包括引擎、排序服务和搜索平台,负责在线服务分发、索引查询、排序服务等功能。搜索的排序策略、相关性、个性化等模型主要通过在线预测服务生效。我们已建立了完善的商品搜索排序算法体系,包括知识图谱、分词、tagging、类目预测等,并以平台化的方式支持相关业务团队。
在系统的进展方面,我们特别关注了机器学习平台和在线预测平台的建设。机器学习平台方面,我们运用了PAI和Porsche两大平台,并统一了深度学习框架至tf-pai。我们对原生tf进行了优化,如底层通讯、稀疏参数存储、优化方法、GPU显存优化等,显著提升了深度模型的训练效率。虽然GPU在搜索应用中也有应用,但CPU仍是主流。在未来,我们计划更好地利用闲置的CPU资源,进行深度学习训练,以提升系统的整体效率。在线预估RTP,高性能搜索排序算分服务
在每一次搜索请求中,上千个商品需要计算排序分数,这对RTP服务来说是一项巨大的挑战。为了应对这一挑战,RTP采用了异构计算、计算算子化和模型分片等技术手段,成功解决了深度模型inference的计算和存储问题。其中,深度模型运用GPU进行运算,而浅层模型则使用CPU。就在今年的双11大促期间,搜索RTP服务动用了550张GPU卡,确保了高效稳定的服务运行。
算法四大方向:智能交互、语义搜索、智能匹配与搜索策略
智能交互
商品搜索不仅是简单的关键词匹配,更是一种智能交互过程。用户通过关键词表达他们的搜索意图,搜索引擎则根据这些关键词返回个性化的推荐结果。在搜索交互中,除了主动关键词输入,还有关键词推荐。推荐引擎会根据用户的搜索历史、上下文、行为及状态来推荐关键字。这是一个典型的强化学习问题,其中action是推荐的关键字候选集合,状态是用户当前的搜索关键词和上下文,而收益则体现在搜索引导成交上。
除了被动关键字推荐,我们正在探索更主动的交互方式,希望像导购员一样与用户进行双向互动,主动询问需求并给出个性化推荐。阿里搜索团队已经在智能导购和智能内容方向进行技术原型研发和论证。智能导购主要借鉴对话系统,通过引导用户和引擎对话来与关键字推荐方式互补。这包括自然语言理解、对话策略、对话生成、知识推理、知识问答和商品搜索等模块。功能包括根据用户搜索上下文生成引导交互的文本,以及知识导购和智能内容生成等。随着深度学习、强化学习和生成对抗学习等技术的发展,这一领域的应用前景广阔。
语义搜索
语义匹配与智能决策:阿里巴巴电商搜索的进化之路
经典DSSM模型的深度应用将query和商品转化为向量,借助向量内积进行语义相似度匹配,广泛应用于问答和阅读理解领域。在电商搜索中,我们摒弃了低效的随机负采样策略,取而代之的是基于电商知识图谱生成负样本的方法。这一方法通过生成字面相似但不相关的query及相关文档,提升了模型对语义匹配的精度。
接下来,我们计划构建一个统一的语义计算框架,以支持多种语义计算任务。主要方向包括:
1. 商品表征学习框架:整合商品标题、属性、详情页和评价等文本信息抽取,图像特征抽取和多模信号融合,为商品内容理解、内容生成、商品召回和相关性提供有力支持。
在智能匹配方面,我们聚焦于个性化和排序。其中,ibrain(深度用户感知网络)能够从海量用户行为日志中直接学习用户的通用表达,基于淘宝的用户画像静态特征和用户行为动态特征,这一学习方法使用户表达更基础、更全面,广泛应用于搜索、推荐和广告等个性化业务。我们还引入了多模学习、deepfm模型、在线深度排序模型等技术,实现了从召回、排序特征、排序模型、个性化和重排的深度学习升级,在双11无线商品搜索中带来超过10%的搜索指标提升。
针对搜索中个性化产品导致的搜索结果趋同和浪费曝光问题,我们采用了多智能体协同学习技术。该技术实现了搜索多个异构场景间的环境感知、场景通信、单独决策和联合学习,以追求联合收益最大化。在今年双1�中,联合优化版本带来的店铺内和无线搜索综合指标提升显著。
我们还关注深度模型的inference性能瓶颈问题,为此在模型压缩(剪枝)、低秩分解、量化和二值网络等方面进行了大量调研和实验。
展望未来,我们计划推进通用用户表征学习,以及其他阿里巴巴人工智能搜索应用的未来发展。通过持续的技术创新和应用优化,我们期待在电商搜索领域取得更多的突破,为用户提供更智能、高效的购物体验。在探讨用户表征模型的进阶之路时,我们发现DUPN模型虽然表现优异,但它的注意力机制主要基于查询,更适合搜索场景,对于其他业务场景的推广存在局限性。为了突破这一局限,我们设想了一种全新的用户表征模型,它应该具备适应多业务场景的能力,通过简单的fine tuning就能在非搜索业务中表现出色。
用户的购物偏好深受季节和周期等因素影响,时间跨度极为广阔。我们期望构建一种能够执行长期学习的模型,能够深度挖掘用户过去数年的行为序列。这种模型将不再局限于近期的K个行为序列假设,而是能够捕捉用户行为的长期趋势和变化。
对于搜索链路优化,我们着眼于从用户进入搜索到离开搜索的整个过程中的优化。这包括搜索前的query引导、搜索中的商品和内容排序,以及搜索后的query推荐等各个环节。通过跨场景联合优化,我们已经在主搜索和店铺内搜索取得了显著成效,未来我们期望拓展这一策略至更多大流量场景,以全面提升手淘的购物体验。
搜索除了追求成交外,还需满足卖家多样性、流量公平性以及流量商业化等多目标联合优化。我们的搜索产品中不仅有商品搜索,还有“穹顶”、“主题搜索”、“锦囊”以及“内容搜索”等非商品搜索内容。未来,我们将深入挖掘不同搜索目标和不同内容之间的联合优化潜力,以提供更加丰富的搜索体验。
我们期待将搜索打造成智能交互的平台,而不仅仅是一个工具。我们希望通过先进的对话和多轮交互技术,让搜索能够听懂用户的语言,理解用户的情绪,成为用户的私人导购助手。这样,搜索不仅能解决用户明确的需求,还能预测并推荐个性化的商品,成为售前售后的全方位服务伙伴。
扫地机器人排行榜
- 从重达百斤价值百万,到能负载2吨,外骨骼机器
- 2022年全球人工智能产业态势分析
- 超拟人数字人重磅发布,讯飞智作引流数字人新
- 低空经济破局进行时:无人机末端配送常态化,
- MDN Web 文档项目引入生成式 AI 后遭到开发者广泛
- 产教融合 校企联动 GCVC大会技术与教育论坛成功
- 中国工业互联网平台的最新观察
- 三菱电机:匠心独具 打造功率半导体行业“样本
- 玩机器人玩出“十一连冠” 碧波实小国际大赛再
- 一体化、智能化、自动化——引领模具智造 DM
- 英特尔携美国红十字会 将人工智能技术用于防灾
- 抓住人工智能“牛鼻子” 加快形成新质生产力
- 中国探月工程正打造月球版北斗系统,深空互联
- 减轻员工工作量 新加坡图书馆试用机器人管理员
- 全球机器人产业竞争中的中国策略加快追赶步伐
- OpenAI 不惜重金挖角谷歌,年薪可达 1000 万美元