返回首页

LLaMA-Factory大模型高效训练框架|SPP第153期

阅读量:0 2026-05-21 收藏本文

LLaMA-Factory是一个高效的零代码大模型微调框架,在GitHub开源社区收获了5万余个星标。该框架支持超过500种大模型的高效微调,覆盖多轮对话、工具调用、多模态理解等不同场景,同时支持GPU、昇腾NPU和海光DCU等不同平台上的大模型训练和推理。欢迎关注本期SPP1112日(本周三)19:3021:00

本期直播你将收获哪些

1、了解开源项目LLaMA-Factory的主要功能

2、掌握大模型训练过程中调参技巧和评估方法

3、理解大模型训练显存计算方法,学会如何评估大模型训练硬件资源。

演讲嘉宾

郑耀威

北京航空航天大学计算机学院博士生

郑耀威,北京航空航天大学计算机学院博士生,LLaMA Factory 大模型微调框架作者。以第一作者在 ACLCVPR等会议发表多篇论文。获得北航榜样、昇腾生态开源卓越贡献奖。受邀至人工智能计算大会,阿里云栖大会等峰会发表主题演讲。