作为一个泡在独立游戏圈快十年的游戏自媒体,我最近两年最大的感受就是:AI正在彻底改写中小游戏团队的生存规则,原来只有大厂能碰的大模型技术,现在三五个人的小团队也能玩得起了,而这两年我被问得最多的工具,就是开头说的super mt,很多刚试水AI游戏开发的朋友都来问我:这个国产开源框架到底值不值得入坑?会不会又是吹得天花乱坠、实际全是坑的半成品?今天我就结合身边朋友真实踩坑踩出来的经验,跟大家好好唠唠。

我为什么会盯上super mt?源于独立团队的燃眉之急
故事要从我老朋友阿凯说起,阿凯原来在网易做了五年开放世界策划,三年前辞了职,攒了五十万拉了两个程序一个美术,出来做自己的独立游戏——《像素古镇》,主打“每个NPC都是活的”,玩家可以跟任何NPC自由对话,NPC有自己的性格、记忆,还能根据玩家的对话触发随机任务,这个概念放摩点预热的时候,一下子吸了两千多预定,看起来开局非常顺,没想到一落地就卡了壳。
当时阿凯他们摆在面前的只有两个方案:要么接第三方大模型API,要么自己微调一个小模型部署在本地服务器,我们当时一起算过账,第一个方案直接被pass了:按最保守的估计,上线后首月一万个活跃玩家,每个玩家每天跟NPC说5句话,加上对话上下文保留的token,一天就要1000多万token,一个月API成本最少要八万,高峰期能突破十五万,他们整个项目的服务器加营销预算才二十万,等于运营两个月就把钱烧完,根本扛不住。
那就只能走第二条路:自己微调模型,一开始他们选了国外最火的那个开源训练框架,我就不提名字了,圈内人都知道,结果整整折腾了一周,连训练都没跑起来:先是环境配不对,CUDA版本不对、NCCL通讯报错,折腾了三天才勉强把环境搭好,把数据集放进去一开训,直接显存炸了——他们用的是单张24G显存的3090,是中小团队能拿出来的顶配了,那个框架对低显存微调的支持极差,要自己改五六处代码,改完之后虽然能跑了,一秒钟才跑2个token,微调一个7B的模型要二十多天,云服务器按小时收费,光训练成本就要小五千,还不知道中间会不会出问题。
那时候阿凯都快放弃了,说实在不行就砍了动态对话,改回固定选项,那预热时候吹的“活的NPC”就成了笑话,粉丝肯定不买账,也就是这个时候,我翻GitHub找国产大模型工具的时候,看到了字节开源的super mt,点进去一看全中文文档,还有专门针对中小显存设备的优化,还有中文开发者群,我当时就给阿凯发了过去,说死马当活马医试试。
上手一周说真话:super mt最戳中小开发者的三个优点
当时我们也没抱太大希望,毕竟很多国产开源工具都是“共享一下就没人维护”的半成品,没想到阿凯他们团队上手之后,直接被惊艳到了,用了一周我跟他们总结,super mt最戳我们中小开发者的,就是三个优点,全戳在痛点上。
第一个优点就是环境配置真的省心,对新手太友好了,之前用那个国外框架,后端小吴熬了三个通宵才勉强把环境搭明白,换super mt之后,人家直接做好了现成的Docker镜像,拉下来就能跑,不想用Docker的,一行pip命令就能装完,所有依赖都给你适配好了,根本不用自己一个个解决冲突,他们两个小时就把环境跑通,把整理好的NPC对话数据集放进去,一次就启动成功了,小吴当时说,这是他做AI开发以来,第一次这么顺利搭好训练环境。
第二个优点就是显存优化真的牛,完全是为中小团队量身定做的,我们都知道,中小团队拿不出带80G A100的服务器,最多就是几张24G的3090,能不能放下模型是最核心的问题,super mt原生就支持当前最火的QLoRA低显存微调,还有序列并行、激活重计算这些优化,不用自己改一句代码,开个参数就能用,阿凯他们要微调的是7B的模型,原来用别的框架,两张24G卡都放不下,换super mt开了优化之后,单张24G 3090,显存占用才不到18G,剩下的显存还能顺便跑部署服务,不用额外加钱买服务器,这真的是省了大钱,而且训练速度也快,一秒能跑12个token,原来那个框架一秒才2个,速度翻了六倍,原来要二十多天的训练,现在四天就跑完了,又省了一大笔服务器租金。
第三个优点就是中文社区支持真的太舒服了,出问题有人管,做开发的都懂,碰到问题找不到解决方法,能把人急疯,原来用国外框架,出了问题提个issue,时差对不上,一周都不一定有人回,搜国内的教程,全是零散的帖子,根本解决不了问题,super mt不一样,有官方的中文开发者群,维护的同学都是国内团队,时差跟我们完全一致,我印象最深的一次,阿凯他们要多卡训练提速,结果跑起来loss一直不降,不知道哪出了问题,晚上十点多把日志发到群里,不到二十分钟就有维护的同学出来解答,说就是配置文件里一个序列并行的参数填错了,直接给了一个正确的配置片段,替换完重启就好了,当时我们都惊了,开源项目能做到这个响应速度,真的少见,对于中小团队来说,时间就是钱,拖一天项目进度,就多花一天的成本,能快速解决问题比什么都重要。
落地游戏开发半年:实际用起来效果到底怎么样?
现在阿凯的《像素古镇》已经做了封闭测试,我也上去玩了快一个月,跟我说说实际的体验,现在他们微调好的NPC对话模型,就部署在自己的两台3090云服务器上,一个月服务器租金才两千八,比原来预估的API成本便宜了三十倍,这个成本对于小团队来说,完全没有压力。
我测过很多次,对话效果真的超出预期,比如酒馆老板,我故意逗他,问“你家酒为什么比对面贵两块”,他直接回我“对面那酒都是掺水的,我这都是隔壁高粱园刚酿的,上次那个剑客喝了我的酒,一刀砍了三头野猪,你去问问他是不是这个理”,完全符合他酒馆老板的身份,逻辑也顺,我接着追问“那我喝了能不能砍野猪”,他直接回“你要是能给我带回来半扇野猪肉,我免费请你喝三碗”,直接就触发了一个随机狩猎任务,这个就是固定文本根本做不到的体验,我还故意说歪话,问铁匠“你家打铁炉能烤红薯吗”,铁匠回我“你要是不怕烤糊就扔,我这炉子一天到晚烧着,温度够高”,完全不翻车,一百句对话里面也就两三句逻辑不通的,加个简单的过滤规则就能拦住,完全不影响游戏体验。
super mt也不是完美的,我也得说说缺点,如果你是要训100B以上的超大模型,做通用大模型,那super mt的分布式集群优化确实不如大厂内部的框架,也不如一些国外专门做超大规模训练的工具,确实有差距,但是对于99%的中小游戏开发者来说,我们做AI NPC、生成剧情、辅助生成美术素材,最多用到34B的模型,super mt完全够用,根本不存在这个问题,还有就是一些最新出的微调算法,super mt合并更新会慢一两周,但是常用的算法都有,对于普通开发者来说完全够用了。
super mt火起来,背后是国产开源工具的春天
说了这么多,我也说说我个人的观点:super mt的走红,绝对不是偶然,它代表的是国产开源工具给中小开发者带来的新机会。
原来我们做游戏开发,不管是引擎还是AI工具,几乎都是国外的垄断,动不动就卡脖子:去年不就有一个国外开源大模型框架,直接更新协议不让中国开发者用了,多少团队吓出一身冷汗;用API呢,今天涨价明天限制,数据还要交给第三方,说不定哪天API停了,你的项目直接就死了,而super mt这种国产开源工具,完全不一样:第一,免费开源,商业使用也不收费,不用怕侵权,不用怕哪天用不了;第二,全中文文档,国内团队维护,出问题有人解决,不用对着英文文档猜谜语;第三,针对中文做了专门的优化,训出来的中文模型,比国外框架训出来的更通顺,没有翻译腔,更适合做国内玩家的游戏内容。
我身边还有一个做古风恋爱独立游戏的朋友,原来要生成几十万条剧情分支,找外包用国外工具花了八万多,还一堆逻辑错误,改了一个月都没改完,去年底他用super mt微调了一个7B的剧情生成模型,花了不到一千块的服务器成本,三天就生成完了,错误率比原来低了一半,省了七万多,还提前了一个月完工,这就是国产工具给我们带来的实实在在的好处。
很多人说,大模型是大厂玩的,中小团队凑什么热闹?我从来不这么认为,原来我们做独立游戏,最缺的就是钱和人,大厂一个AI团队几百人,我们整个团队才三五个人,原来想做AI创新根本想都不敢想,现在有了super mt这样低成本、好用的工具,三五个人也能调出一个能用的模型,做出有差异化的产品,现在Steam上那些带动态AI对话的独立游戏,很多都是中小团队用国产开源框架做出来的,super mt就是其中使用率非常高的一个。
总结下来,super mt不是什么完美的神器,也解决不了所有问题,但是对于我们中小游戏开发者来说,它绝对是目前性价比最高的大模型训练工具之一,它的意义不只是一个框架,而是让我们看到:国产开源工具也能做的这么好用,也能真真切切解决普通开发者的痛点,我们不用再看国外的脸色,不用再花大价钱买技术,原来只有大厂能玩的大模型,现在小团队也能玩,这就是最大的进步,我也希望未来能有更多像super mt这样的国产开源工具出来,帮我们中小开发者做出更多更好玩的游戏,给玩家带来更多不一样的惊喜。
