返回首页
您的位置:首页 > 会员活动

CCF 新疆大学学生分会“前行者说”系列讲座(第十一期)成功举办

阅读量:1 2026-06-24 收藏本文

由中国计算机学会(CCF)主办,CCF 乌鲁木齐、CCF 新疆大学学生分会承新疆大学计算机科学与技术学院协办的 CCF 新疆大学学生分会・前行者说系列讲座(第十一期)于 2026415 日在新疆大学成功举办。本期讲座围绕自然语言处理、场景文字识别、三维视觉重建与视觉骨干网络等前沿研究方向展开,面向研究生与 CCF 会员系统分享相关领域的技术原理、研究方法与前沿进展,吸引了学院众多师生到场参与,现场学术氛围浓厚,交流热烈。

本次讲座开始之际,CCF 常务理事、CCF 乌鲁木齐主席、新疆大学计算机学院库尔班・吾布力教授为活动致辞,对到场师生表示欢迎,强调了 前行者说系列讲座搭建学术交流平台、助力青年学子科研成长的重要意义,鼓励同学们深耕科研、勇于创新。他表示,前行者说列讲座始终致力于搭建高质量的学术交流平台,围绕计算机领域热点方向和前沿问题,邀请优秀同学结合自身科研经历进行分享,帮助广大学生拓宽学术视野、把握研究动态、提升科研能力,进一步营造良好的学术交流氛围,正式开启了本次学术分享。本期讲座邀请到新疆大学相关研究方向的四位同学进行专题汇报,分别围绕问答任务中的无源无监督领域自适应、基于指令引导的场景文字识别、基于 Gaussian Splatting 的稀疏视图表面重建,以及混合式 Mamba-Transformer 视觉骨干网络等内容展开分享,报告主题鲜明、内容丰富,兼具理论深度与前沿视角。

首先,石超睿同学带来题为《Source-Free Unsupervised Domain Adaptation for Question Answering via Prompt-Assisted Self-learningACL2024)》的学术专题报告。问答任务中的领域迁移问题一直是自然语言处理领域的重要研究方向之一,而在缺乏源域数据的条件下,如何提升模型在目标域中的泛化能力,是当前研究中的关键难点。石超睿同学围绕这一问题,系统梳理了无源无监督领域自适应在问答任务中的研究背景与技术挑战,结合论文方法,深入介绍了提示辅助自学习框架在目标域知识迁移中的作用机制,详细分析了模型在没有源数据参与的情况下如何借助伪标签生成、提示信息构建与自训练策略,逐步提升在目标领域中的问答性能,为同学们理解自然语言处理中的领域自适应问题提供了清晰思路。


石超睿同学分享报告

报告中,石超睿同学不仅对论文的研究动机、整体框架和实验设计进行了细致解读,还结合具体任务场景,分析了该方法在减少领域偏移影响、增强模型适应能力方面的优势。他从研究问题出发,帮助大家进一步理解提示学习、自监督学习与迁移学习之间的内在联系,也为从事自然语言处理相关研究的同学提供了具有启发性的参考。

随后,围绕三维视觉重建方向,王少奇同学带来题为《FatesGS: Fast and Accurate Sparse-View Surface Reconstruction using Gaussian Splatting with Depth-Feature Consistency》的专题报告。稀疏视图表面重建是计算机视觉和三维重建领域的重要研究内容,在视角有限、观测信息不足的情况下,如何兼顾重建效率与重建精度,是该领域长期关注的核心问题。王少奇同学从三维重建技术的发展脉络出发,介绍了 Gaussian Splatting 方法在新视图合成与场景表示中的应用优势,并进一步讲解了 FatesGS 方法如何通过引入深度特征一致性约束,在稀疏视图场景下提升表面重建质量。


王少奇同学分享报告

分享过程中,王少奇同学结合方法流程图与关键模块设计,对该模型的技术思路进行了较为系统的梳理,重点分析了多层特征表达、深度信息约束以及表面点估计等核心环节在整体框架中的作用,展示了该方法在复杂场景下实现快速、精准重建的技术逻辑。通过这一报告,在场师生对当前三维视觉重建研究中的关键问题与发展趋势有了更加直观和深入的认识。

随后,秦艺航同学带来题为《MambaVision: A Hybrid Mamba-Transformer Vision Backbone》的专题报告。近年来,视觉骨干网络的结构设计不断演进,如何在提升建模能力的同时兼顾效率与泛化性能,已成为视觉领域的重要研究方向。秦艺航同学围绕 MambaVision的研究思路,系统介绍了混合式 Mamba-Transformer 架构在视觉任务中的设计理念,详细阐述了该模型如何融合 Mamba 结构与 Transformer 的优势,在保持较强全局建模能力的同时提升计算效率,为视觉表征学习提供新的网络设计思路。



秦艺航同学分享报告

报告中,秦艺航同学从视觉主干网络的发展趋势切入,对相关模型的特点进行了梳理,并结合 MambaVision 的结构设计,分析了其在图像理解等任务中的潜在应用价值。通过对模型框架、研究背景与创新思路的讲解,帮助同学们进一步理解当前计算机视觉领域模型架构演进的新方向,也为相关研究选题和方法设计带来了有益启发。

最后,魏麒丹同学带来题为《Instruction-Guided Scene Text Recognition》的专题报告。场景文字识别作为计算机视觉与模式识别领域的重要研究方向,在智能交通、文档分析、辅助阅读、人机交互等实际场景中具有广泛应用价值。然而,由于真实场景中的文字往往存在模糊、遮挡、形变、光照复杂以及背景干扰强等问题,如何提升模型对复杂场景文本的识别能力,一直是该领域研究中的重点与难点。魏麒丹同学围绕这一问题,系统介绍了场景文字识别任务的研究背景、核心挑战及相关技术发展脉络,并结合论文内容,重点讲解了指令引导机制在场景文字识别中的作用思路。报告中,魏麒丹同学从模型设计与任务适配的角度出发,详细分析了该方法如何通过引入指令信息,引导模型更加有效地聚焦文本区域特征、理解识别目

标,从而提升复杂场景下文字识别的准确性与鲁棒性。他还结合方法框架,对该论文在特征表达、指令建模与识别流程等方面的创新点进行了梳理,帮助在场师生进一步理解指令学习思想在视觉文本任务中的应用潜力,也为从事 OCR、场景理解与多模态智能相关研究的同学提供了有益启发。

分享环节结束后,现场师生围绕提示辅助学习、领域适应策略、复杂场景下文字识别模型的泛化能力、稀疏视图条件下的重建精度控制、Gaussian Splatting 方法的应用边界,以及新型视觉骨干网络在实际任务中的适配性等问题踊跃提问。四位分享同学结合自身科研实践和论文阅读体会,逐一进行了耐心细致的解答,并与现场师生展开了深入的互动交流,现场讨论氛围热烈,学术交流成效显著。


互动交流环节

本期讲座为新疆大学 CCF 学生会员搭建了高质量学术交流平台,助力师生深入了解自然语言处理、场景文字识别、三维视觉重建与视觉模型设计等领域的前沿研究进展,有效激发了同学们的科研兴趣与学术热情。未来 CCF 新疆大学学生分会将继续秉持服务会员、促进交流宗旨,持续打造前行者说系列精品讲座,策划更多贴合学子科研需求的前沿学术活动,为同学们提供更优质的成长交流平台,诚挚欢迎广大师生持续关注与参与。


活动结束合影