他以学生一作发表高水平学术论文6篇,谷歌学术引用量超过600次,第一作者论文引用量超过500次;他是LLaMA-Factory开源项目的主导者,单个项目获得超过4万收藏量,成为大语言模型微调国内最热门框架,登顶Github热门项目榜单全球第一;他受邀发表10余场主题演讲,荣获华为昇腾生态开源卓越贡献奖、中国电信魔乐社区卓越贡献合作伙伴。他是开源技术先锋、计算机学院2022级博士研究生郑耀威。

缘起AI,厚积薄发
2016年,谷歌AlphaGo在围棋大赛中击败人类世界冠军的消息轰动世界。正在备战高考的郑耀威,被人工智能的奥秘深深吸引,立志要在人工智能领域做出突破。考入北航后,他立刻投身人工智能的知识海洋。
郑耀威在大一就展现出强烈的学习主动性,从自学课程、参与竞赛到主动加入实验室,每一步都稳扎稳打。大一期间,他利用课余时间先后自学了6门专业公开课,涵盖Python、概率论、机器学习、深度学习等多个领域,累计课时达800余学时,打下了坚实的专业基础。他说:“我因AlphaGo的契机走进了人工智能世界,又因北航优秀学长学姐的事迹坚定了创新的志向。”看到学长学姐在AI领域发光发热,他也立下了志向。

为了能更深入地投入学术研究,大二时,郑耀威主动加入计算机学院张日崇教授的科研团队。起初只能从跑实验和读代码做起,但他坚持“每天都有进步”。每周往返于沙河与学院路之间。在这段披星戴月的奔波路上,郑耀威开启了属于自己的科研创新之旅。他在本科二年级暑假选择留校科研,每天沉浸在实验室的讨论、建模与调试中。“那时候每天都觉得特别充实。”
“博观而约取,厚积而薄发” 是郑耀威的人生信条。秉持对学术的执着追求,他心无旁骛地钻研科研问题。与导师张日崇教授、高年级同学的思想频繁碰撞,有时一天会进行三四次深入讨论,这不断激发着他的灵感与创新思维。郑耀威专注于低资源场景下的机器学习技术研究,面对重重困难,他一次次地尝试、总结、提升,以第一作者的身份在ACL、CVPR、AAAI、WWW等国际顶级会议上发表了多篇论文,其中学生一作论文6篇。
在科研之余,他也积极参与各类课外科技竞赛。他提出的“基于语法图上随机游走的多方面情感分类”,斩获北航冯如杯科技竞赛一等奖。他开发自动检查心脑血管疾病算法,在全国数字健康创新应用大赛中脱颖而出,荣获算法模型一等奖。此外,他还荣获全国大学生冰壶人工智能挑战赛的总冠军、蓝桥杯信息技术大赛全国一等奖等各类专业竞赛奖项,展现了北航学子的卓越风采与创新精神。

郑耀威获得全国数字健康创新应用大赛一等奖
“竞赛不是目的,而是锻炼创新力的过程。”郑耀威说。他印象最深的是数学建模美赛:连续三天两夜奋战,与队友轮流通宵,边查资料边写代码,最终收获了极强的团队协作能力。这些实践经历不仅提升了他的技术能力,也锻炼了他面对压力和不确定性的应变能力。
智享开源,大模型赋能
“互联网的精神就是自由、开放、共享。”2022年末,ChatGPT的诞生彻底引爆了人工智能领域,以大模型为代表的人工智能技术深刻改变学术、生产和生活的方方面面。郑耀威在被吸引的同时,察觉到大模型微调和推理资源消耗巨大,阻碍了AI落地应用,且GPU资源被大型公司垄断,给研究人员和开发者带来重重壁垒。他坦言:“开源打破了大模型的信息壁垒,我希望通过我的项目让所有人都可以真正用好大模型。”
为此,他将研究重心全然倾注于大模型微调框架。以第一代LLaMA开源大模型为基石,结合自身在低资源场景机器学习领域的技术积累,历经数月沉浸式钻研与开发,成功在该框架中实现了大语言模型的量化和低秩分解技术,使模型的显存消耗大幅降低,训练成本更是降低了30倍。依托这一技术,他构建了大模型高效微调框架LLaMA-Factory,并开源至GitHub平台。

LlamaFactory项目获得国内外多家机构认可
该项目一经提出就受到了广泛关注,社区开发者的需求纷至沓来,特别是在国产化计算环境中实现应用方面。为此,郑耀威学习了各类型号硬件平台文档,实现了硬件感知的自动优化方案,使LLaMA-Factory在英伟达芯片和国产芯片上均能无痛运行。这一贡献赢得了华为昇腾芯片部门官方的高度认可,郑耀威也因此荣获华为昇腾生态开源卓越贡献奖。

郑耀威获中国电信魔乐社区卓越贡献伙伴
他坦言:“维护开源项目其实压力也挺大,但既然它代表了我们实验室,我就要把它做好。”在不断优化功能的过程中,他始终坚持回应社区开发者的问题与建议,在他的不懈努力下,项目逐渐赢得了社区开发者的广泛赞誉与热烈欢迎。2024年年初,项目达到了1万颗GitHub星标,目前累计获得超过40000星标,成为了国内最热门的大语言模型微调框架,并登顶Github热门项目榜单全球第一!

LLaMA-Factory登顶Github热门项目榜单全球第一
郑耀威积极将学术成果与社会应用紧密结合。他多次受邀参加行业峰会、开发者大会,与全球各地的LLaMA-Factory用户面对面交流,共同探讨技术难题。2023年11月,在北京举行的AICC人工智能计算大会上,他首次发表主题演讲,深入讲解LLaMA-Factory的技术创新与广泛应用。

郑耀威发表大模型高效训练主题演讲
2024年8月,郑耀威将项目带至国际计算语言学年会ACL现场,向来自世界各地的开发者演示框架技术,并交流开源经验。阿里云栖大会上,他还介绍了LLaMA-Factory在山西文旅AI导游场景中的实际应用。
2025年2月,郑耀威作为嘉宾参加了北京人工智能产业创新发展大会端侧推理圆桌论坛,围绕DeepSeek爆火后的行业趋势,与华为、软通、清昴等企业嘉宾共同探讨大模型如何更好落地服务每一个人。

郑耀威参加国际计算语言学顶会ACL 郑耀威分享LLaMA-Factory在山西文旅AI导游场景的实践

郑耀威与业界大咖共话DeepSeek带来的AI应用加速创新
逐梦前行,奋斗永不停歇
谈及自己的成长过程时,郑耀威尤为感谢身边老师的支持。他回忆起在项目受挫时,导师张日崇教授花一整天陪他一起分析代码、逐句讨论论文的经历,“那种陪伴式的科研指导,我至今铭记在心。”而本科辅导员在“挑战杯”竞赛中给予的悉心指导、PPT演练支持,也让他更加坚定了科研道路的选择。
面对学弟学妹们,他也提出了诚恳的建议。“做科研不要只局限于写论文,而是为了真正解决人们的难题。”他建议同学们在学好课内知识之余,可以通过参与开源社区的形式接触前沿技术,与学者碰撞观点。同时,他强调了数学与英语的重要性。他希望有更多同学走进创新,用好大模型,也希望通过开源精神,让每个人都能有机会做出耀眼的成果。

对于人工智能的未来,他有着自己的思考。在他看来,大模型不应只是技术成果,更应该成为全社会共享的福祉。他特别关注当前大模型“知识定格”的局限性,并提出AI应具备“动态学习力”,能够随着世界变化不断更新知识体系,从而真正迈向通用智能。
将大模型赋能给每个人,是郑耀威的理想。如今,LLaMA-Factory项目已成为国内外广受欢迎的大模型微调工具,被阿里云、腾讯云、英伟达、亚马逊云计算等众多知名企业广泛应用。他表示,开源项目的持续维护源于他希望人人皆可训练大模型的初衷。未来,郑耀威将继续推动人工智能技术开源,致力于让AI大模型的资源惠及所有人,为社会创造更大价值。
(素材来源:计算机学院 采写:王子赫)
(审核:李建伟)
编辑:贾爱平