返回首页
您的位置:首页 > 新闻 > CCF聚焦

多模态大模型关键技术及应用 | CCF数图焦点 第49期

阅读量:505 2025-02-13 收藏本文


 

编者寄语(1)

多模态大模型通过图像、文本、音视频等多种模态数据的集成整合和学习,能够实现复杂的跨模态理解、生成与推理。在多媒体内容检索、推荐、问答、生成和人机交互等任务中,显示出巨大的潜力,并在教育、创作、医疗、娱乐等众多领域展现出广阔的应用前景。

多模态大模型面临的挑战是:跨模态一致性和连贯性、高效的模型架构和训练方法、统一的模型评估标准等。

本期围绕多模态大模型的预训练、跨模态对齐等关键技术,跨模态检索、具身智能等领域的应用,将CCF数字图书馆相关报告视频和期刊文章资源进行聚合,方便会员集中观看学习,也为读者探索多模态大模型关键技术及应用抛砖引玉


编委主任:苏金树 CCF会士 军事科学院研究员

本期主编:闵巍庆 CCF多媒体技术专委秘书长 中国科学院计算技术研究所副研究员

本期编委: 茜 中国科学院微电子研究所副研究员

目录(1)

234


第49期详细专题可点击链接查看>>多模态大模型关键技术及应用