跨模态前沿AI技术有哪些产业应用? | TF70回顾

阅读量:309
TF

CCF TF70“跨模态AI技术及产业应用“于线上成功举办。三位业内专家深入分析跨模态AI技术及其应用于产业方面的实践案例,为参会者提供了参考。本年度算法与AI SIG还有两场活动,详细时间请见文末。


随着AI逐步落地,产业需求不断深入,在单模态领域,如翻译等相关应用,AI的能力已经可以达到媲美人类的水平。但随着技术和产业的进一步发展,多模态成为了AI技术和产业突围的新方向,更多场景应用需要多模态大模型来支撑,例如跨模态检索、智能问答、文学艺术创作、视频配音、视频摘要等等。


如今跨模态AI技术有哪些前沿的研究成果及优秀的产业应用?未来的发展之路又将走向何方?本期活动邀请到Jina AI高级AI工程师王峰、超对称技术首席科学家吴恒魁、网易有道NLP算法专家程桥等企业专家,深入分享跨模态AI技术的相关思考及产业实践。CCF TF算法与AI SIG主席、网易有道首席科学家、段亦涛担任主持人。


CCF TF算法与AI SIG主席段亦涛


《神经搜索在3D场景中的研究与应用》

 

王峰分享内容


来自Jina AI 王峰的报告题目是《神经搜索在3D场景中的研究与应用》,3D 物体的表征形式多种多样,相比于文本、图像,其包含了物体更加丰富的信息。精确建模与理解这些3D物体可以帮助我们更好的实现对 3D 模型进行分类、搜索、以及管理。将深度表征学习与 3D 模型数据结合可以将 3D 物体的特征更好的展现出来,以此支持各个领域下对 3D 物体数据的搜索需求。


《让预训练语言模型读懂数字:10亿参数时序-文本跨模态模型Big Bang Transformer》


吴恒魁分享内容


来自超对称技术的吴恒魁在报告中主要分享了超对称技术公司发布的10亿参数金融预训练语言模型BigBang Transformer(乾元),基于时序-文本跨模态架构,融合训练文本和时序两种模态数据,下游任务准确率较T5同级别模型提升近10%,并大幅提高时序预测的R2 score,跨模态架构能让语言模型识别时序数据的变化并通过人类语言来分析和阐述其发现。


《Cross-modal Multi-task Learning for Speech Translation》

 

程桥分享内容


网易有道在语音翻译,图片释义,文档理解等很多实际业务中都面临着跨语言跨模态的场景,跨语言跨模态应用通常面临着训练数据不足,不同模态之间语义存在差异,系统多个模块之间错误传播等问题。来自网易有道的程桥在报告中介绍了有道在跨语言跨模态场景中的相关应用,以及使用多任务学习框架解决跨语言跨模态场景下的语音翻译相关问题。


参会者连麦提问讨论


在提问互动环节中,除了有参会者积极连麦与讲者进行线上交流,交流群内也有众多参会者提问讨论,并纷纷对讲者的解答表示感谢。人工智能技术不断向前发展,如今已赋能到各种产品和场景中,多方位地走入人类的生活,当更多复杂的场景对 AI 技术的应用效果提出更高要求时,跨模态就成为了 AI 技术和产业突围的新方向。CCF TF 算法与AI SIG组织的本次“跨模态前沿AI技术与产业应用“活动,旨在加强技术交流,为相关从业者提供有效参考,感谢三位讲者的精彩分享及各位参会者的支持,敬请关注CCF TF算法与AI SIG 接下来的活动。


算法与AI SIG后续活动安排


TF94

2023/2/23

NLP技术(具体话题待定)产业化之路

TF97

2023/3/23

语音处理前沿及产业化


本期精彩报告和回顾视频可在CCF数字图书馆观看,也可扫描下方二维码观看。欢迎大家持续关注TF的更多精彩活动!



下期预告:


CCF TF73


随着数以亿计的智能终端设备连接到互联网上,边缘智能逐渐成为人工智能领域的一颗耀眼新星,它完美结合了人工智能和边缘计算技术,使得用户在享受人工智能带来的便利时,不必担心隐私数据上传到云端带来的安全问题,也不必忍受数据传输带来的延迟问题,同时产品部署方也可以做到更高效率、更低能耗、更优成本。可以说:边缘智能促进了人工智能和边缘计算的发展和应用。本期论坛邀请到联想集团副总裁黄莹、英特尔研究院资深研究员郭萍、百度百度边缘计算业务负责人、主任架构师杜海三位从事边缘智能产品架构设计及产品开发的专家,和大家分享他们对边缘智能技术应用的观点和实践经验。


识别或扫码报名

报名链接:https://conf.ccf.org.cn/TF73

关于CCF TF

CCF TF技术前线(Tech Frontier)创立于2017年6月,旨在为工程师提供顶级交流平台,更好地服务企业界计算机专业人士,帮助企业界专业技术人士职业发展,通过搭建平台实现常态化合作和发展,促进企业间、学术界与企业间技术交流。目前已组建架构、安全、智能前端、知识图谱、数据科学、工程师文化、算法与AI、智能制造、智能设备与交互、产业智能化、研发效能等十一个SIG(Special Interest Group),提供丰富的技术前线内容分享。2022年4月至2023年3月,CCF TF将在线开展47场活动,会员免费参加。

加入CCF

加入CCF会员享受更多超值活动,为自己的技术成长做一次好投资。

点击链接了解更多会员权益:CCF个人会员权益  CCF公司会员权益 

识别或扫码入会


欢迎关注CCFTF及CCF业务总部公众号,精彩陆续开启!


关注CCFTF获取TF活动资讯

关注CCF业务总部优惠预定会议场地


合作媒体


CCF推荐

【精品文章】



读完这篇文章后,您心情如何?