返回首页

CCF广东工业大学学生分会举办“带多功能加工的机器人集群设备的强化学习调度算法”学术讲座

阅读量:0 2025-12-08 收藏本文

CCF广东工业大学学生分会于2025年11月19日(星期三)晚上成功举办了主题为“带多功能加工的机器人集群设备的强化学习调度算法”的学术讲座。来自广东工业大学计算机学院的朱清华副教授是这场内容丰富且极具前沿性的学术讲座的报告人。


朱清华博士,广东工业大学计算机学院副教授,CCF高级会员、IEEE高级会员,IEEE RAS-机器学习技术委员会委员。他曾在美国新泽西理工学院(NJIT)任访问学者两年;担任2017IEEE ICRA分会主席及2022-2025IEEE SMCAssociate Editor。朱清华副教授长期致力于智能调度优化、半导体芯片制造系统的调度优化、云计算和移动边缘计算等领域的研究,在IEEE TransactionsSCI期刊和国际会议发表论文50余篇,并被列入美国Marquis世界名人录Who's Who in the World 2016,曾两次受邀参与QS世界大学排名的评分调查。


本次讲座中,朱清华副教授首先以芯片制造的硅载体:晶圆为切入点,深入浅出地介绍了半导体制造的基础背景。他指出,机器人集群设备是晶圆制造的核心装备,而多功能工艺模块(MPMs)的引入虽然增强了生产的灵活性和效率,但也带来了极大的调度挑战。特别是在双臂集群工具中,可变的MPM分配模式会导致截然不同的生产率,使得传统的调度方法难以适用。


针对这一难题,朱清华副教授重点介绍了基于强化学习的解决方案。他提出了一种结合掩码技术的自适应深度Q网络(Adaptive DQN)算法。该方法首先通过算法枚举所有有效的MPM分配模式,然后利用DQN智能地选择最高效的模式并生成机器人调度方案,旨在最小化完工时间和晶圆制造后的驻留时间。


在算法细节上,朱清华副教授展示了精心构筑的多目标奖励函数:通过设定时间步惩罚(-1)以缩短完工时间,并行模块利用奖励(±5)以提升效率,违反约束重罚(-1000)以严防死锁,并给予晶圆完工大额奖励(+1000)。这种稠密与稀疏奖励的有机结合,有效破解了复杂约束下的调度优化难题。


讲座最后,朱清华副教授与在场的同学们进行了热烈的互动交流,耐心解答了同学们关于强化学习在工业界落地应用以及算法收敛性等方面的疑问。本次讲座不仅拓宽了同学们的学术视野,也让大家对半导体智能制造这一国家重点领域有了更深刻的认识。