我用搜狗输入法很多年了。它就像个老朋友,平时感觉不到,但就是离不开。这次他们搞了个20.0版本,说要“AI重铸”。我一开始觉得,又是营销噱头吧。但是看了他们的说法,感觉这次有点不一样。他们负责人柴宝全说,AI不是来给输入法加一堆乱七八糟功能的。它是来把最根本的事情做好的。

什么是最根本的事?就是打字、语音、翻译。
先说语音输入。以前我用语音,有时候挺烦的。在办公室想用,又不敢大声说。你说得小声点,它就识别不出来,一堆错字。而且,我说完话,文字里总带着一堆“嗯”、“啊”、“那个”这种口头语。我还得自己手动一个个删掉,特别浪费时间。
现在,他们把语音识别整个换了。用的是腾讯混元AI语音大模型。数据是这样说的:语音识别的流畅度提升了40%。整体准确率做到了98%。这个数字可能没概念,但普通话务员的打字准确率也就96%左右。而且,他们专门解决了我刚才说的那个办公室场景的痛点。就算你在一个低于20分贝的环境里,就是跟说悄悄话一样,识别准确率还能有97%。这意味着,以后在图书馆、会议室这种需要安静的地方,你也能用语音了。
但是,光听得准还不够。他们还加了个新功能,叫**“口语转书面语”**。这个功能我觉得特别实用。它的工作原理是这样的:
第一步,你就像平时聊天一样,用语音输入一大段话。比如,你说:“嗯…那个,我想一下啊,咱们今天下午,对,就是那个会,得开一下。”
第二步,输入法会自动处理这句话。它能识别出哪些是口头禅,哪些是核心意思。
第三步,它直接输出的文字就是:“今天下午我们需要开会。”
你看,它自动就把那些废话都过滤掉了。这样你发出去的文字就很正式,很干净。这个功能,他们自己叫**“电子嘴替”**,我觉得挺形象的。
再来说打字。这几年,我总觉得手机打字没有以前准了。不知道你有没有这种感觉。搜狗自己也说,收到了海量的用户反馈,都在说“打字不准了”。他们研究后发现,不是技术退步了,是我们的语言环境变了。
现在网上每天都有新词、热梗冒出来。不同圈子有不同的黑话。你跟朋友聊天,和在网上买东西,用的词完全不一样。老的那套词库,根本跟不上我们的变化。所以,他们搞了一个自研的AI打字大模型。
这个模型最关键的地方,是它能理解场景。它知道你现在打开的是哪个App,在干什么。
举个例子就明白了。比如你打拼音“ks”:
- 当你在微信里跟朋友聊天,它可能会优先给你“看书”,或者你某个叫“坤硕”的朋友的名字。
- 但是,当你在淘宝里搜索,它就会优先给你“裤子”、“款式”。
- 如果你在抖音的评论区,它可能就会联想出某个网红的名字。
它会根据你所在的场景,动态调整同一个拼音下面的候选词顺序。为了实现这个,他们把词库扩大到了十亿级别。而且,网上刚出的新词热词,他们能做到小时级别的更新。还专门针对我们日常生活,加了五千多万个长尾词,比如你家楼下那家新开的餐厅名字,它可能都收录了。
“小众”群体的专业需求:从通用工具到生产力组件
这次升级,有个地方让我觉得他们真的用心了。就是开始关注我们这些“少数人”的专业需求。
他们AI打字负责人沈祥金讲了一件事。有个律师用户,刚换用搜狗输入法,就直接去问他:“你们怎么连‘孳息’这个词都打不出来?”。就这么一句话,对他们的刺激很大。他们服务几亿用户,但却忽略了特定行业里最基本的需求。
所以,他们推出了**“律师模式”**。这个模式不只是简单地加了一个法律词库。它还跟一家叫“得理科技”的公司合作,打通了法律知识库。
它是这么帮你提高效率的:
想象一个律师在写一份合同。当他打出“违约责任”这个关键词时,输入法的候选框里,除了相关的词组,可能还会直接出现《民法典》里关于违约责任的具体法条选项。他只需要点一下,这条法规原文就能直接输入到文档里。
这时候,输入法就不再是个简单的打字工具了。它成了一个能帮你查资料、写文书的生产力组件。
同样的故事也发生在医生身上。之前搜狗给医院做过一个医疗版的输入法,很受欢迎。很多医生就说,能不能让我们在自己的手机和电脑上也用上。
现在,**“医生模式”**也来了。开启之后,那些又长又复杂的药品名、疾病名,打简拼就能出来。比如你打“atfxtd”,它就能直接出来“阿托伐他汀片”。而且,在你输入完药品后,它会自动联想出“mg”、“ml”、“片”这些医疗单位。这还不够,它还打通了腾讯医典的数据库。你可以边打字,边在输入法里直接查询这个药的详细说明书。
这个变化很关键。输入法终于不再满足于只在微信、QQ里帮我们聊天了。它开始真正地进入到我们的工作流程里。从一个给所有人用的“通用工具”,变成了一个可以插在不同专业领域的“信息处理器”。
“归零”心态:直面历史包袱与商业化的平衡之困
一个产品做了20年,肯定会积累很多问题。搜狗输入法也不例外。他们自己说,产品功能最复杂的时候,光是“设置”里面的选项就有将近200个。说实话,这太夸张了。我们普通用户根本不会去看,找一个功能得翻半天。这对用户来说,就是一种负担。
所以这次,他们下决心做了清理。他们把很多复杂、很少有人用的设置项都删掉或者合并了。官方的数据是,用户现在完成一项设置,平均花费的时间能比以前降低60%。我觉得这个方向是对的,功能不是越多越好,简单、直接才最重要。
当然,还有一个更重要,也是大家骂得最多的问题:广告。
对于广告,他们这次没回避。负责人柴宝全直接承认,过去在一些广告的处理上,确实不够好,有时候推送得太“粗暴”了。我们用的时候也深有体会,打着字突然弹出一个广告,真的很影响心情。
那么新版本是怎么解决这个问题的呢?他们的方案很直接:用户可以自己一键关闭。
具体步骤很简单:
第一步:打开搜狗输入法App。
第二步:找到“设置”菜单。
第三步:在设置里找到广告相关的选项,直接关掉键盘广告。
他们明确说,“用户体验大于基础商业利益”。一个公司,特别是做工具类产品的公司,能有这个态度,我觉得很难得。他们想明白了,只有产品好用,大家愿意用,才会有长远的未来。
而且,关掉键盘广告只是开始。他们还在重新检查产品里所有的内容推送,比如皮肤推荐、资讯消息等。目标是让这些东西不再那么有打扰感,变得更“丝滑”。
这种敢于面对自己过去的问题,敢于“归零”的心态,比发布多少个新功能都更让我对这个产品有了信心。
对话未来:入口价值、技术边界与慢思考
现在AI这个词很火。所有公司都想做成“超级入口”,恨不得一个App帮你把所有事情都干了。输入法离我们的手指最近,每天都要用无数次,它会成为下一个AI大战的入口吗?
搜狗团队对这个问题的回答,让我觉得他们挺清醒的。
柴宝全说,输入法的本质,就是一个基础的人机交互工具。它的核心任务,就是帮我们把脑子里的想法,简单、顺畅地告诉机器。他说:“我们不会规划明天就去帮用户点外卖。” 在这个浮躁的环境里,能有这种专注和克制的“慢思考”,挺不容易的。
他们也关注行业里很火的新技术,比如手机本地就能跑的端侧模型,或者完全用语音来操作的输入方式。但是他们的态度很谨慎。比如离线语音输入,他们一直在迭代,但前提是评估用户的真实场景里到底需不需要,而不是为了炫技。
还有个老问题,语音输入以后会取代键盘打字吗?
他们的共识是**“长期共存”**。因为不同的人,在不同的场景下,有完全不同的习惯和需求。
举个例子,我平时跟朋友发微信,可能用语音多一点,方便。但是,如果我是一个医生,我要写一份严谨的电子病历;或者我是一个律师,我要起草一份重要的合同。在这种情况下,我一定需要用键盘来保证每一个字的精准无误。
所以,不存在谁取代谁。而是语音和打字,在各自适合的场景里,都变得更好用。
最后,回到那个最根本的问题:AI到底会怎么改变输入法?
搜狗没有给出一个确定的、画大饼式的答案。他们说,20.0版本不是终点,而是一个新的起点。他们通过AI重构了底层,让输入法有了新的可能性。但未来具体会长成什么样,他们也不预先定义。这取决于技术怎么发展,我们用户怎么选择,以及他们能从我们真实的生活里,捕捉到多少真正的需求。
我觉得,这种保持“归零”的心态,敏捷地去寻找和满足用户每一个真实需求的做法,比那些宏大的叙事,要靠谱得多。