super mt，国产大模型训练框架真的好用吗？

作为一个泡在独立游戏圈快十年的游戏自媒体,我最近两年最大的感受就是：AI正在彻底改写中小游戏团队的生存规则，原来只有大厂能碰的大模型技术，现在三五个人的小团队也能玩得起了，而这两年我被问得最多的工具，就是开头说的super mt，很多刚试水AI游戏开发的朋友都来问我：这个国产开源框架到底值不值得入坑？会不会又是吹得天花乱坠、实际全是坑的半成品？今天我就结合身边朋友真实踩坑踩出来的经验，跟大家好好唠唠。

我为什么会盯上super mt？源于独立团队的燃眉之急

故事要从我老朋友阿凯说起,阿凯原来在网易做了五年开放世界策划，三年前辞了职，攒了五十万拉了两个程序一个美术，出来做自己的独立游戏——《像素古镇》，主打“每个NPC都是活的”，玩家可以跟任何NPC自由对话，NPC有自己的性格、记忆，还能根据玩家的对话触发随机任务，这个概念放摩点预热的时候，一下子吸了两千多预定，看起来开局非常顺，没想到一落地就卡了壳。

当时阿凯他们摆在面前的只有两个方案：要么接第三方大模型API，要么自己微调一个小模型部署在本地服务器，我们当时一起算过账，第一个方案直接被pass了：按最保守的估计，上线后首月一万个活跃玩家，每个玩家每天跟NPC说5句话，加上对话上下文保留的token，一天就要1000多万token，一个月API成本最少要八万，高峰期能突破十五万，他们整个项目的服务器加营销预算才二十万，等于运营两个月就把钱烧完，根本扛不住。

那就只能走第二条路：自己微调模型，一开始他们选了国外最火的那个开源训练框架，我就不提名字了，圈内人都知道，结果整整折腾了一周，连训练都没跑起来：先是环境配不对，CUDA版本不对、NCCL通讯报错，折腾了三天才勉强把环境搭好，把数据集放进去一开训，直接显存炸了——他们用的是单张24G显存的3090，是中小团队能拿出来的顶配了，那个框架对低显存微调的支持极差，要自己改五六处代码，改完之后虽然能跑了，一秒钟才跑2个token，微调一个7B的模型要二十多天，云服务器按小时收费，光训练成本就要小五千，还不知道中间会不会出问题。

那时候阿凯都快放弃了,说实在不行就砍了动态对话，改回固定选项，那预热时候吹的“活的NPC”就成了笑话，粉丝肯定不买账，也就是这个时候，我翻GitHub找国产大模型工具的时候，看到了字节开源的super mt，点进去一看全中文文档，还有专门针对中小显存设备的优化，还有中文开发者群，我当时就给阿凯发了过去，说死马当活马医试试。

上手一周说真话：super mt最戳中小开发者的三个优点

当时我们也没抱太大希望,毕竟很多国产开源工具都是“共享一下就没人维护”的半成品，没想到阿凯他们团队上手之后，直接被惊艳到了，用了一周我跟他们总结，super mt最戳我们中小开发者的，就是三个优点，全戳在痛点上。

第一个优点就是环境配置真的省心,对新手太友好了，之前用那个国外框架，后端小吴熬了三个通宵才勉强把环境搭明白，换super mt之后，人家直接做好了现成的Docker镜像，拉下来就能跑，不想用Docker的，一行pip命令就能装完，所有依赖都给你适配好了，根本不用自己一个个解决冲突，他们两个小时就把环境跑通，把整理好的NPC对话数据集放进去，一次就启动成功了，小吴当时说，这是他做AI开发以来，第一次这么顺利搭好训练环境。

第二个优点就是显存优化真的牛,完全是为中小团队量身定做的，我们都知道，中小团队拿不出带80G A100的服务器，最多就是几张24G的3090，能不能放下模型是最核心的问题，super mt原生就支持当前最火的QLoRA低显存微调，还有序列并行、激活重计算这些优化，不用自己改一句代码，开个参数就能用，阿凯他们要微调的是7B的模型，原来用别的框架，两张24G卡都放不下，换super mt开了优化之后，单张24G 3090，显存占用才不到18G，剩下的显存还能顺便跑部署服务，不用额外加钱买服务器，这真的是省了大钱，而且训练速度也快，一秒能跑12个token，原来那个框架一秒才2个，速度翻了六倍，原来要二十多天的训练，现在四天就跑完了，又省了一大笔服务器租金。

第三个优点就是中文社区支持真的太舒服了,出问题有人管，做开发的都懂，碰到问题找不到解决方法，能把人急疯，原来用国外框架，出了问题提个issue，时差对不上，一周都不一定有人回，搜国内的教程，全是零散的帖子，根本解决不了问题，super mt不一样，有官方的中文开发者群，维护的同学都是国内团队，时差跟我们完全一致，我印象最深的一次，阿凯他们要多卡训练提速，结果跑起来loss一直不降，不知道哪出了问题，晚上十点多把日志发到群里，不到二十分钟就有维护的同学出来解答，说就是配置文件里一个序列并行的参数填错了，直接给了一个正确的配置片段，替换完重启就好了，当时我们都惊了，开源项目能做到这个响应速度，真的少见，对于中小团队来说，时间就是钱，拖一天项目进度，就多花一天的成本，能快速解决问题比什么都重要。

落地游戏开发半年：实际用起来效果到底怎么样？

现在阿凯的《像素古镇》已经做了封闭测试，我也上去玩了快一个月，跟我说说实际的体验，现在他们微调好的NPC对话模型，就部署在自己的两台3090云服务器上，一个月服务器租金才两千八，比原来预估的API成本便宜了三十倍，这个成本对于小团队来说，完全没有压力。

我测过很多次,对话效果真的超出预期，比如酒馆老板，我故意逗他，问“你家酒为什么比对面贵两块”，他直接回我“对面那酒都是掺水的，我这都是隔壁高粱园刚酿的，上次那个剑客喝了我的酒，一刀砍了三头野猪，你去问问他是不是这个理”，完全符合他酒馆老板的身份，逻辑也顺，我接着追问“那我喝了能不能砍野猪”，他直接回“你要是能给我带回来半扇野猪肉，我免费请你喝三碗”，直接就触发了一个随机狩猎任务，这个就是固定文本根本做不到的体验，我还故意说歪话，问铁匠“你家打铁炉能烤红薯吗”，铁匠回我“你要是不怕烤糊就扔，我这炉子一天到晚烧着，温度够高”，完全不翻车，一百句对话里面也就两三句逻辑不通的，加个简单的过滤规则就能拦住，完全不影响游戏体验。

super mt也不是完美的，我也得说说缺点，如果你是要训100B以上的超大模型，做通用大模型，那super mt的分布式集群优化确实不如大厂内部的框架，也不如一些国外专门做超大规模训练的工具，确实有差距，但是对于99%的中小游戏开发者来说，我们做AI NPC、生成剧情、辅助生成美术素材，最多用到34B的模型，super mt完全够用，根本不存在这个问题，还有就是一些最新出的微调算法，super mt合并更新会慢一两周，但是常用的算法都有，对于普通开发者来说完全够用了。

super mt火起来，背后是国产开源工具的春天

说了这么多,我也说说我个人的观点：super mt的走红，绝对不是偶然，它代表的是国产开源工具给中小开发者带来的新机会。

原来我们做游戏开发,不管是引擎还是AI工具，几乎都是国外的垄断，动不动就卡脖子：去年不就有一个国外开源大模型框架，直接更新协议不让中国开发者用了，多少团队吓出一身冷汗；用API呢，今天涨价明天限制，数据还要交给第三方，说不定哪天API停了，你的项目直接就死了，而super mt这种国产开源工具，完全不一样：第一，免费开源，商业使用也不收费，不用怕侵权，不用怕哪天用不了；第二，全中文文档，国内团队维护，出问题有人解决，不用对着英文文档猜谜语；第三，针对中文做了专门的优化，训出来的中文模型，比国外框架训出来的更通顺，没有翻译腔，更适合做国内玩家的游戏内容。

我身边还有一个做古风恋爱独立游戏的朋友,原来要生成几十万条剧情分支，找外包用国外工具花了八万多，还一堆逻辑错误，改了一个月都没改完，去年底他用super mt微调了一个7B的剧情生成模型，花了不到一千块的服务器成本，三天就生成完了，错误率比原来低了一半，省了七万多，还提前了一个月完工，这就是国产工具给我们带来的实实在在的好处。

很多人说,大模型是大厂玩的，中小团队凑什么热闹？我从来不这么认为，原来我们做独立游戏，最缺的就是钱和人，大厂一个AI团队几百人，我们整个团队才三五个人，原来想做AI创新根本想都不敢想，现在有了super mt这样低成本、好用的工具，三五个人也能调出一个能用的模型，做出有差异化的产品，现在Steam上那些带动态AI对话的独立游戏，很多都是中小团队用国产开源框架做出来的，super mt就是其中使用率非常高的一个。

总结下来,super mt不是什么完美的神器，也解决不了所有问题，但是对于我们中小游戏开发者来说，它绝对是目前性价比最高的大模型训练工具之一，它的意义不只是一个框架，而是让我们看到：国产开源工具也能做的这么好用，也能真真切切解决普通开发者的痛点，我们不用再看国外的脸色，不用再花大价钱买技术，原来只有大厂能玩的大模型，现在小团队也能玩，这就是最大的进步，我也希望未来能有更多像super mt这样的国产开源工具出来，帮我们中小开发者做出更多更好玩的游戏，给玩家带来更多不一样的惊喜。

super mt，国产大模型训练框架真的好用吗？

我为什么会盯上super mt？源于独立团队的燃眉之急

上手一周说真话：super mt最戳中小开发者的三个优点

落地游戏开发半年：实际用起来效果到底怎么样？

super mt火起来，背后是国产开源工具的春天

相关阅读

女神养成记 | 普通女孩的松弛感逆袭之路

玫瑰小镇任务老玩家重拾情怀的破局指南

铁骑冲锋，十年前的老页游为何仍有热度

电光火石3，18年后还让玩家舍不得删的神作

华工吧，华南理工人共同的网上精神家园

今年春晚主持人阵容公布，藏着三个意外惊喜

向日葵网页版网站在线进入高效远程办公新选择

暗黑破坏神3点卡，还有人在为它买单吗？