从“比划猜半天”到“实时转文字”,解决的是真刚需
上个月我刷到一位听障博主@小桐的无声世界发的日常vlog,看完心里挺感慨的,小桐是先天失聪,从小学习手语,但是走出家门之后,大部分健听人都看不懂她的手势,别说找工作办事,就连买杯奶茶都要折腾半天。

她在视频里翻出去年的一段偷拍素材:那是她去当地医院挂号,她想要挂皮肤科看过敏,对着窗口比划了快五分钟,一会指自己的脸,一会挠胳膊,值班的工作人员还是一脸懵,问她“你到底要挂什么?是不是牙疼?”后面排队的人开始催促,小桐急得眼泪都在眼眶里转,最后还是掏出随身带的小本子写字,才把事情说清楚,那时候她的手都因为紧张抖得写不直。
而今年3月的视频里,她去银行办新卡,全程只用了手机里的手语在线翻译小程序,她对着手机前置摄像头比划出“我要办一类储蓄卡,修改预留手机号”,不到两秒钟,屏幕上就跳出了清晰的文字,银行柜员看完直接操作,柜员说的话也实时转成文字和手语动画显示在小桐的手机上,全程八分钟就办完了所有手续,走出银行的时候她对着镜头笑,说“这是我第一次办业务不用写字不用慌,感觉和普通人没两样”。
这不是个例,根据2024年2月中国互联网络信息中心(CNNIC)发布的第53次《中国互联网络发展状况统计报告》,我国现有听障群体超过2780万,其中超过60%的听障人士长期生活在中小城市和乡镇,当地基本没有专业的全职手语翻译资源,想要请手语翻译帮忙,不仅要提前三五天预约,还要承担几百块一天的服务费,对很多普通家庭来说都是不小的负担,2023年底中国聋人协会做的一项调研显示:73%的听障受访者表示,出门办事遇到的最大障碍就是沟通不畅,61%的听障求职者曾因为无法和面试官顺畅沟通,被用人单位直接拒绝。
在没有手语在线翻译之前,这个痛点几乎是无解的,专业手语翻译资源太少,集中在一线大城市的大型会议和赛事上,轮不到普通听障人士日常使用;健听人学手语门槛高,不可能人人都会,听障人士随身带小本子写字,不仅麻烦,遇到不认字的老年听障人士,更是完全行不通,而手语在线翻译的出现,相当于把一个随时待命的翻译放进了每个人的手机里,几块钱就能用一个月,不少基础功能还是免费的,真正解决了普通人日常沟通的刚需。
技术迭代后,手语在线翻译早已不是“鸡肋工具”
很多人对AI手语翻译的印象还停留在好几年前:识别不准,经常出错,只能识别几个简单手势,复杂一点的对话就完全乱套,但实际上,随着大模型技术的落地,最近两年手语在线翻译的准确率已经提升了一大截,早就不是当初的“鸡肋工具”了。
2024年5月,阿里达摩院发布了新一代的手语翻译大模型,训练数据超过了100万小时的真实场景手语素材,不仅能识别国家通用规范手语,还能识别不同地区的手语变体,甚至能听懂听障群体日常使用的自定义手势,整体识别准确率超过了96%,日常场景基本够用,不止是头部科技公司,现在打开微信、支付宝这些国民APP,都能找到免费的手语在线翻译小程序,不用下载额外的APP,点开就能用,对普通用户非常友好。
其实最近两年,手语在线翻译已经用在了很多正式的公共场景里,2023年杭州亚残运会,所有赛事直播都用上了AI手语在线翻译,让听障观众可以实时看懂解说;2024年开年之后,杭州已经在全市300多个政务服务网点、100多家二级以上医院配备了手语在线翻译终端,听障人士去办事、看病,随时可以呼叫AI实时翻译,也可以连线远程的专业手语翻译,据杭州残联公布的数据,2024年第一季度,这些终端已经服务了超过1.2万人次听障人士,用户满意度达到了92.7%。
我之前看到有网友争论:AI手语翻译能代替真人翻译吗?其实在我看来,根本不需要非此即彼,复杂的法律诉讼、大型会议这种专业场景,确实需要专业的真人翻译,但大部分听障人士日常遇到的买东西、办业务、看病挂号、和朋友聊天,这些场景里,现在的手语在线翻译完全能满足需求,就算偶尔出错,调整一下手势就能解决,比之前比划半天猜不出来好太多了,更重要的是,手语在线翻译把原来只有少数人能享受到的翻译资源,普及到了每一个普通听障人士的日常生活里,这本身就是技术很大的进步。
普及还剩“最后一公里”,这些问题仍待解决
尽管手语在线翻译已经发展得很快,但我在翻遍听障群体的社交平台之后发现,这个工具的普及,还差不止一公里的路要走。
第一个问题就是认知差:很多听障人士根本不知道有这样的工具存在,小桐就在视频里说,她用手语在线翻译快一年了,她所在的一个两百多人的本地听障群里,知道这个工具的人还不到三分之一,很多中老年听障人士只会用微信刷视频,根本不知道小程序里还有这样的功能,更别说主动去找了,而很多线下的公共服务场所,也根本没有主动提供这个服务,我家这边的医院、银行,我问过好几个窗口的工作人员,大部分都不知道有手语在线翻译,更别说告诉来办事的听障人士了。
第二个问题就是准确率还有提升空间,复杂场景还是容易出错,我看到有听障网友吐槽,她去医院看甲状腺结节,比划手势的时候,AI把“甲状腺结节”识别成了“甲状腺结果”,差点闹了乌龙;还有一些南方地区的手语变体,AI训练数据少,识别准确率就会下降很多,不少听障人士反映,快手势识别的准确率还不够高,日常聊天习惯打快手势,经常识别错。
第三个问题就是商业化可持续的问题,现在大部分手语在线翻译工具的基础功能都是免费的,研发训练大模型需要投入大量的成本,但是对企业来说,这个领域很难赚到快钱,很多小团队做了一段时间就做不下去,停运了,大公司做更多是出于社会责任,很难持续投入大量资源优化,这些都是摆在手语在线翻译普及面前的现实问题。
无障碍从来不是慈善,是所有人共享的权利
说了这么多问题,我个人仍然非常看好手语在线翻译的未来,因为我始终觉得:无障碍从来不是给少数人做的慈善,是所有社会成员都应该享有的基本权利,而手语在线翻译就是数字时代给听障群体最好的礼物之一。
我身边就有真实的例子:我表姐的公公,前年中风之后抢救回来,但是失去了语言能力,只能靠手势比划,一家人每天都在猜他要什么,想要喝水还是想要翻身,哪里疼,猜不对老人就急得拍床,天天情绪低落,瘦了快二十斤,后来表姐在网上找到了手语在线翻译小程序,陪着老人学了十几个常用的规范手势,现在老人想要什么,直接对着手机比划就能翻译出来,哪里不舒服也能说清楚,老人的情绪好了很多,一家人也不用天天猜来猜去了,你看,这个工具不止是先天听障人士能用,后天失去语言能力的人也能用,本质上它是帮所有有沟通障碍的人打通了堵点。
2024年1月国务院发布的《“十四五”残疾人保障和发展规划》中期评估报告里,专门提到要加快推进信息无障碍建设,鼓励人工智能技术在无障碍领域的落地应用,手语在线翻译就是政策落地最好的载体之一,在我看来,未来手语在线翻译的发展,不能只停留在手机小程序里,还要进一步下沉:线下的医院窗口、银行柜台、政务大厅、公交站点,都应该贴出手语在线翻译的二维码,让听障人士随时可以扫码使用;学校可以增加一点基础手语的普及内容,让更多健听人了解手语,配合在线翻译就能帮到更多人;政府也可以给研发手语翻译工具的企业一点政策补贴,降低企业的成本,让这个行业能可持续发展。
我之前看到一位听障网友在微博上写:“我最大的愿望不是别人让着我,是别人能像对待普通人一样和我说话,不用不耐烦,不用猜来猜去。”手语在线翻译给不了别人平等的态度,但是它给了听障人士获得平等的工具,让他们不用再因为沟通不畅矮人一等,不用再慌慌张张掏小本子写字,不用再把话咽回去不敢说,这种作为普通人的尊严感,是任何东西都换不来的。
小小的一个翻译工具,背后是整个社会对少数群体的接纳,是技术的温度,我们总说科技改变生活,其实改变的不只是效率,更是每一个普通人的尊严,让每一个人,不管有没有身体障碍,都能顺畅说话,都能平等享受这个时代的便利,这才是科技发展真正的意义。
