不一样的科大讯飞,他们把计算机视觉踢进“世界杯”

人工智能 2024-12-17 12:30www.robotxin.com人工智能专业

自人工智能的概念诞生以来,其从理论走向实际应用所经历的漫长岁月,无疑是科技进步史上的一段壮丽史诗。人工智能技术的突破,背后是无数科学家以时间和心血为代价的辛勤耕耘。从概念提出到真正落地应用,每一步都凝聚了他们的决心与智慧。

人工智能技术的演进并非一蹴而就。从1965年的Dartmouth会议到2006年深度学习的兴起,神经网络经历了从诞生到真正拥有深度的漫长过程。大数据和计算力的飞速进步,助推深度学习在各个领域爆发巨大威力。技术的演进并非易事,而是伴随着不断的研究和创新,持续取得突破。

人工智能领域内的两位领军人物——殷保才和吴嘉嘉,他们的经历见证了人工智能在计算机视觉领域的飞速发展。他们痴迷于探索计算机视觉领域内的各种可能性,从语音识别的革命性突破,到图像识别的巨大成功,再到人工智能技术的真正应用,他们始终走在科技前沿。

殷保才和吴嘉嘉的加入,为科大讯飞计算机视觉团队注入了新的活力。他们带领的团队不断攻克技术难题,将技术应用到更复杂的场景,推动着计算机视觉技术的不断进步。他们的努力和创新精神,使得科大讯飞在计算机视觉领域的技术水平保持国际领先地位。

殷保才和吴嘉嘉的故事,是人工智能领域众多科技工作者的缩影。他们对技术的热爱和坚守初心,推动着人工智能技术的不断进步。他们不仅是计算机视觉领域的才子佳人,更是推动人工智能技术发展的无名英雄。

在人工智能的征途上,每一个科学家都是宝贵的财富。他们的付出和努力,使得人工智能技术在各个领域取得突破性的进展。从语音技术到计算机视觉,再到自然语言处理、机器学习等领域,人工智能技术的发展日新月异。未来,随着科技的持续进步,人工智能将在更多领域发挥巨大的作用,为人类带来更多的便利和惊喜。

在人工智能的道路上,我们期待着更多像殷保才和吴嘉嘉这样的科技工作者,为科技的进步和发展贡献自己的力量。他们的故事,将不断激励着更多的人投身于科技事业,共同创造更美好的未来。在信息化时代的浪潮中,OCR技术已逐渐渗透到生活的方方面面,展现出了巨大的社会价值。对此,吴嘉嘉深有体会。他回忆道,在教育领域,OCR技术的崛起几乎与人工智能的发展同步,成为实现个性化教育、智能阅卷等应用的关键入口。

“OCR技术的推进,必须结合实际场景的需求。”吴嘉嘉强调,OCR技术的创新并非单纯的技术追求,而是需要解决实际问题,满足实际场景中的刚需。这一理念在科大讯飞得到了充分的实践。

以文本行识别技术为例,吴嘉嘉团队在2014年开始攻坚。初期,他们尝试使用深度学习的CNN技术进行孤立字识别,并取得了显著的识别精度提升。他们发现孤立字识别技术难以适应文本行识别的问题,因为手写字体涉及连笔,使得字符切分变得困难。

面对这一难题,吴嘉嘉团队借鉴了语音识别的逻辑和方式。语音技术的深厚积累为团队带来了灵感,他们发现,将语音识别中的HMM模型框架引入到文本行识别,可以大幅提升精度。这一跨越领域的借鉴,展现了AI研究院的创新能力。

在OCR技术的生根阶段,科大讯飞不断开拓计算机视觉领域的其他技术方向,从人脸识别、医学影像到辅助驾驶、虚拟形象等,都留下了他们的足迹。

值得一提的是,在人工智能+医疗概念兴起的背景下,科大讯飞参与了LUNA医疗影像测评任务。针对肺结节检测的问题,殷保才团队提出了使用3D模型的解决方案,最终获得了高召回率,刷新了榜单世界纪录。这一成就背后是团队长期的技术积累和对问题本身的深刻理解。

时间来到2017年,吴嘉嘉团队面临公式识别的挑战。公式识别问题比文本行识别更为复杂,涉及嵌套结构、左右上下的杂糅等。团队起初尝试使用传统方法,但效果并不理想。后来,他们受到机器翻译技术的启发,将基于注意力机制的Encoder-Decoder模型运用到公式识别上,取得了显著成果。这一跨领域的融合创新,再次展现了科大讯飞在AI领域的深厚实力。

这一路走来,科大讯飞的OCR技术团队历经无数挑战,但始终坚信技术的力量。他们的成功背后是长期的技术积累、对场景的深入理解以及跨领域的融合创新。在未来,我们期待他们在OCR领域继续深耕,为我们带来更多的惊喜和突破。在短短不到一年的时间里,吴嘉嘉团队在公式识别领域取得了巨大的突破,准确率高达96%。这一成绩在国际顶级手写公式识别挑战赛中得到了验证,团队接连获得多个国际冠军,包括2019年ICDAAR CROHME和2020年ICFHR OffRaSHME。

同样是在OCR技术教育领域,才子殷保才和他的团队发现了图文分析任务与其他计算机视觉任务之间的共性。凭借着早期在计算机视觉任务上的积累,他们迅速将多种技术方案应用于文档图像处理及版面分析任务中。目前,这对才子佳人正联手打造全链路的图文识别技术,朝着实现Read Anything的目标迈进。

OCR技术的不断突破,源于跨领域创新思想的交融与交汇融合式的思想迁移。而人工智能助力行业的发展,则源于厚积薄发的积累和沉淀。以殷保才为例,他的成功背后是多年的刻苦经历,以及突发式攻关的直觉。

在2020年疫情爆发初期,殷保才接到了紧急任务,针对新冠疫情开发医疗辅助系统。面对巨大的压力,他和团队迅速行动,推出了一款能在3秒内完成病例辅助诊断的系统,大大提高了医生的工作效率,减少了漏诊误诊的发生。这一成果的取得,离不开殷保才团队在AI医疗影像领域的深厚积累和刻苦自学。

在科大讯飞AI研究院,这种跨领域、融合式的创新氛围得到了充分的体现。研究院鼓励不同方向之间的交流和借鉴,促进了技术的迁移应用。殷保才表示,研究院的氛围简单真诚,大家都非常纯粹地追求技术的前沿和实用性。这也是科大讯飞AI研究院能够在工业界保持战略定力的原因之一。

研究院不仅注重技术的创新,也注重技术的实际应用。他们秉承“顶天立地”的价值观,坚持在资源投入上以市场导向分配“弹药”,遵循“721研发投入模式”。这种模式的实施,使得研究院不仅能够在技术水平上保持领先,也能够在技术价值上为社会创造真正的价值。

吴嘉嘉和殷保才的团队只是研究院众多优秀团队之一。在这里,每个人都在为实现AI的愿景而努力,不断追求技术的突破和创新。他们的成功,不仅源于个人的努力和团队的协作,也离不开科大讯飞AI研究院提供的良好氛围和有力支持。科大讯飞:技术与应用的蓬勃发展

在科技创新的前沿阵地,科大讯飞凭借其在人工智能领域的持续深耕,取得了显著成就。每年投入超过20%的营收用于研发,其中主导产品占据资源的七成,而战略新产品和探索型项目则分别占据两成和一成。殷保才作为团队的核心成员,主要负责引领前沿技术的探索与应用。

殷保才聚焦于指尖交互、手势交互、多模态识别等方向,推动遥感技术和智慧畜牧等领域的深度融合。他的每一次视觉前瞻的尝试,都是基于公司业务需求、未来趋势的判断以及研究院的能力建设,旨在拓宽整个视觉领域的应用边界。

与此吴嘉嘉在OCR技术领域也取得了令人瞩目的成绩。他从孤立字识别到篇章级公式识别的研究,实现了技术的一次次突破。如今作为OCR条线的负责人,他带领的团队在OCR技术链路方面已经建立了较高的技术壁垒,并成功应用于教育领域,解决了学生作业试卷文档识别的难点问题。吴嘉嘉的梦想是保持核心技术的领先水平,并将人工智能技术应用到更多领域,让科技改变生活,惠及大众。

科大讯飞本身已经成长为一个神经网络,不断吸收AI三要素:算力、数据和算法,输出先进的技术和产品。企业的组织方式、技术方法论以及人才构成了编码层,将输入转化为输出,实现“技术顶天”与“应用落地”的完美结合。

这对“才”子“嘉”人在科大讯飞的成长故事,是科大讯飞不断扩展的缩影。他们凭借不懈的努力和追求,推动人工智能技术在各个领域的应用,用人工智建设美好世界。

Copyright © 2016-2025 www.robotxin.com 人工智能机器人网 版权所有 Power by