微信键盘诞生背后:国产输入法 30 年 -j9九游会登陆入口
2022-12-24 14:47
用户等了近两年,微信键盘 1.0.0 正式版终于上线。
这是张小龙口中,为保护用户隐私而开发的产品,它不收集数据、不用于盈利。
微信为什么要做输入法?如果读懂输入法的前世今生,那也许能理解巨头的想法。
键盘上的汉字生意
虽然不同输入法的功能千差万别,但它们的原理完全相同 ——
电子世界是只有 1 和 0 的二进制,无论输入或者输出什么汉字,中间都要经过二进制代码转换。
1980 年颁布的 gb2312-80《信息交换用汉字编码字符集》,相当于给每个汉字都发放了唯一的“身份证”。而输入法的工作,就是保证用户以最快的方式,记住每一个汉字的 id。
从此,第三方输入法各显神通,市面上有了五笔、全拼、双拼等各式各样的输入法,传统的单机输入法出现了 ——
传统输入法
从输入方式上,我们可以把输入法分为两类:形码输入法和音码输入法。
形码输入法中最有名的当属五笔字型。1983 年,中科大教授王永民根据汉字书写特点的发明了五笔字型,并在 1989 年成立北京王码电脑有限公司,销售“王码五笔输入法”。
五笔字型解决了 pc 端汉字输入的问题,新华社称“其意义不亚于活字印刷术”,而王永民也因此成为“当代毕昇”和全国劳动模范 [1]。
但实际上,早在 1964 年,王永民还是中国科学技术大学的一名本科生时,编译家郑易里就在为邮电科学院设计另一种形码输入法 ——“四码汉字”,可惜后因不可抗力中断。
1979 年,河南省科委邀请郑易里为汉字编码做专题报告。王永民还连夜赶到郑州,向郑易里讨教汉字编码问题。
直到 1989 年,郑易里才与女儿郑珑发明出“字型通用码”汉字输入法,也就是后来人们口中的郑码 [2]。
对五笔上有印象的人可能还记得,形码输入法的打字效率虽然高,但要花费大量时间记字根,学习成本非常高。怎么创作一款容易普及的输入法,成了当时开发者面临的问题,而答案则寄托在音码输入法上。
音码就是一种把汉字转换拼音字母的编码。用户使用音码输入法时,只要输入汉语拼音,就能找到想要的汉字,极大地降低了汉字输入门槛。
80 年代末,哈工大博士王晓龙研发出一款名为 insun 的拼音输入法,不仅让 pc 用户摆脱了复杂的字根,还可以支持整句输入,在输入效率和学习门槛中间进行折中。
不过,这款输入法在当时并没有得到广泛关注。90 年代中期,insun 被王晓龙以 10 万美元的价格卖给微软,成为 windows95 内置的“微软拼音”[4]。
被微软收购的还有智能 abc。这款北京大学教授朱守涛在 1990 年研发出的输入法,结合了音码和形码的功能:用户可以在拼音输入的基础上,通过该字第一笔的形码进行快读定位。
虽然更多的人只是把它当作普通的拼音输入法使用,但这丝毫没能影响智能 abc 的成功。被收购后,微软将它内置在 windows2000 上,成为彼时大陆使用人数最多的输入法。
智能 abc 的成功,带动了更多开发者的参与,国内输入法产业竞争越发激烈。紫光华宇、智能狂拼、黑马神拼、拼音加加等优秀的拼音输入相继面世,也曾分别俘获一批追随者。
输入法的“混战”一直持续到 2005 年,直到硕果仅存的四位 —— 智能 abc、紫光拼音、拼音加加和微软拼音,占据了 90% 的市场 [5]。后来,以搜狗输入法为代表的智能输入法出现,国内的输入法市场又发生了新一轮变化。
智能输入法
2005 年,太原一家国企的应届生马占凯发现,在搜索框里打出“zhoujielun”的拼音时,搜索引擎会提示“您要找的是不是:周杰伦”。这给了他灵感 —— 是否可以给输入法联网,借助搜索引擎的功能,开发一款能监控时下热词的输入法呢?
于是马占凯开始向百度发邮件、提建议。多封邮件石沉大海后,马占凯又转投搜狐,光速入职成为一名产品经理,加入王小川组建的团队开发搜狗输入法。直到 2006 年 6 月,搜狗输入法正式上线,中文输入法宣告进入“网络时代”。
与传统输入法相比,自带搜索引擎的智能输入法不仅“猜词”更准,还开创了输入法的账号登录功能,把用户的输入习惯上传至云端,方便用户异地使用输入法和备份个人词库。
可以说,智能输入法就是一个用户专属的人工智能,用户的每一次打字都是在训练 ai,只要用户联网登录自己的账号,就能切换到那个“最懂自己”的输入法。
互联网的普及印证了马占凯的思路,微软原生输入法和其它传统输入法越发无人问津,其它大厂也推出同类产品。2007~2010 年谷歌、腾讯、阿里、百度先后发布同类输入法。不过最早入局的搜狗仍具有不可取代的优势。到 2009 年 6 月,搜狗输入法的装机量已超过 8000 万,占据输入法市场 70% 的份额。
推出智能输入法的公司越来越多,所属公司之间的“骚操作”也屡见不鲜。
作为开创者的搜狗,率先把矛头指向谷歌。2007 年,搜狗发布声明称 google 输入法盗用搜狗词库,此事最终以谷歌公开道歉、删除争议词库结束。随后,国内互联网公司开始相互扯皮。
2009 年 6 月 23 日,搜狗以不正当竞争和侵犯知识产权为由起诉腾讯,索赔 2000 万元。不过腾讯没怂,反而在同年 11 月 4 日向法院起诉搜狗虚假宣传,索赔金额同样为 2000 万元。
腾讯甚至还为此在腾讯网开辟了“搜狗拼音输入法不正当竞争”专页。页内不仅整理了最新报道、专家观点、两家产品功能对比,还专门介绍了搜狐官司缠身的诸多新闻,和 qq 拼音的 60 项专利 [6]。这个具有“纪念性的网页”直到今天 —— 腾讯与搜狗完成合并已近一年,仍未被下线。
《北京青年报》曾发文称,搜狗输入法与 qq 拼音之争,表明拼音输入法的市场竞争开始进入了白热化的阶段 [7]。此后,输入法圈也有过数起纠纷,如 2015 年搜狗和百度相互起诉对方的输入法专利侵权 [8][9]、2019 年百度和 360 等公司联合起诉搜狗输入法流量劫持 [10] 等。
一方面,互联网大厂在为智能输入法专利吵得不可开交;另一方面,第三方输入法的广告问题让令用户不胜其扰。
日渐式微的微软输入法突然抓住机会,在 2010 年宣布将加大更新力度,并在 windows10 上针对性对中文输入法的使用体验进行改善 [11]。新版微软输入法在延续原生输入法纯净无广告特点的基础上,对功能进行了大量优化升级 ——
微软的输入法体验是越来越好了,但它的奋发图强还是迟了一步。这时的互联网大厂,早已把业务重点转向了移动端。
从 pc 到手机,输入法成为“必需品”
早在那个万能充还随处可见的 2008 年,搜狗已经初涉移动业务,盯上了用户的智能手机。只不过,那时谷歌刚推出第一部安卓手机,因此搜狗在移动端的试水选择了彼时更加成熟的塞班系统。
输入法的战线从 pc 端来到手机端,小公司们也冒出头跟大厂争夺市场,出现了触宝、a4、点讯梅花等一批专注于手机输入法的产品。
到 2009 年,lg、索尼爱立信等厂商退出塞班生态。输入法厂商见风使舵,开始推出安卓版 app。2011 年,安卓手机在智能手机中的市场份额跃升至 48%,挤掉诺基亚成为世界第一大智能系统 [12]。
塞班大势已去,手机输入法纷纷转战安卓。2014 年,仅支持原生输入法的苹果在 ios 8 首次开放第三方输入法,各公司又纷纷宣布登陆 app store,双线发展。
不过,后来的事实证明,即便是在移动端这样的新兴平台上,输入法想要起量,也得“抱大腿”。上述三家公司中,a4 和点讯梅花在 2009 年分别被腾讯和百度收购,推出了 qq 手机输入法和百度手机输入法。
到 2017 年,各类手机输入法中只有搜狗、讯飞、百度三家头部公司 mau 超过百万。在这之中,搜狗输入法又占据绝对优势,其 mau 是讯飞和百度两家产品 mau 之和的两倍 [13]。易观数据的报告显示,到 2020 年 11 月,搜狗、讯飞、百度三家的去重用户渗透率超过 95%,而搜狗独占 58.4%[14]。
另外,至今仍是“自由身”的触宝虽然已经上市,但也在国内失去了生存空间,全面转战海外,变成一款付费使用的产品。
输入法有成为“大生意”的潜力。与社交、游戏等类别的 app 相比,工具类的输入法天生具有极高的用户粘性和渗透率。据 cnnic 的数据,到 2020 年 12 月我国有 9.86 亿手机网民 [15],而在 questmobile 的 2020 年中国移动互联网年度大报告里,输入法 app 的活跃用户规模已达 8.82 亿,渗透率高达 89.5%[16]。
明明用户规模如此庞大,为什么只容得下几家巨头?
正经人谁做输入法啊?
纵使输入法行业在中国发展了近 30 年,仍有诸多问题未能解决,最大的问题是难以商业化。
大公司的“玩具”
输入法的商业模式和技术模式都决定了,这是一个有钱人才玩得起的“玩具”。
一方面,技术的进步给输入法行业带来了新的转变,游戏规则对小公司越发的不友好。
十年前的输入法更关注如何让打字更快更准。有些公司开发出双拼输入、滑动输入和 t 1 键盘,优化文字输入体验,有些则在选词上下功夫,推出地域词库、专业词库和通讯录词库等个性化词库。
十年后,输入法越来越考验公司的 ai 技术。
随着人工智能技术的进步,用户不再满足于中规中矩的传统输入法。语音输入、翻译输入、表情包斗图等功能,更讨用户喜欢。
根据易观数据 2019 年的调研,在选择第三方输入法时,有 47.5% 的用户会考虑语音输入是否好用,有 46.6% 的用户考虑斗图表情是否合意 [17]。另外,智能助手、语音变声、ai 写作助手和 ocr 扫描输入等智能功能,也成为 z 世代用户高频使用功能 [14]。
而这些技术,往往只有大公司才拿得出手。
搜狗、百度、讯飞三家输入法巨头中,百度和搜狗是国内较早涉足人工智能搜索引擎的公司,讯飞则起家于语音识别和语义识别技术,实力过硬。
另一方面,输入法的盈利模式至今仍是个谜。
在 pc 端,输入法一直是款“基本上不赚钱”的免费产品,其盈利模式除了偶有的弹窗广告外,几乎没有付费功能。背靠两大互联网巨头的 qq 和百度输入法过得滋润,但小公司们要么择木而栖,被大公司收购,要么直接倒闭停运。
少数厂商曾测试过付费皮肤和输入法广告功能,但立刻引起用户强烈反感。
王小川的“三级火箭”模式曾被输入法行业寄予厚望,他发现输入法虽不能直接赚钱,却可以作为一个流量入口,为其它盈利业务输血。
于是,搜狗在 2008 年又推出浏览器,建立了一个基于“输入法-浏览器-搜索引擎”的产品体系 —— 利用搜狗输入法(一级火箭)带动搜狗浏览器(二级火箭)安装量,再通过浏览器给搜狗搜索(三级火箭)带量。
搜狗的“三级火箭”模式,到 2012 年前后基本成型。这一年,搜狗搜索近半流量来源于搜狗浏览器 [18];这一年,搜狗营收 1.31 亿美元,较 2011 年增长 108%[19]。
但归根结底,三级火箭的模式只是一个导流手段,盈利压力全指望搜狗搜索的广告。后来,国内搜索引擎业务逐渐被百度垄断,搜狗搜索的市场份额越来越少,这一模式也随之失灵。
这几年搜狗一直在吃搜索业务的老本,财报显示,2019 年搜狗总营收 11.7 亿美元,其中搜索广告业务贡献率超过 91.5%[20]。
最后,搜狗没有找到更好的盈利途径,最终被腾讯全资收购。
近几年,输入法也曾在手机厂商身上寻找其它出路。
搜狗曾与小米、oppo、vivo 三家手机厂商达成合作,在部分机型上内置深度定制的搜狗输入法。百度也不甘示弱,除上述三家厂商外,还曾与华为达成独家合作,后者全机型使用定制版百度输入法。
但与厂家合作无法给输入法公司带来实际收益。
一方面,与手机公司合作虽然能快速带来活跃用户,但并没有解决输入法本身的盈利困境。另一方面,输入法公司们还得随时提防手机厂商带着自研输入法杀回来。2021 年 11 月,华为推出了自研的“小艺输入法”;而 vivo 自研的“jovi 输入法”也在持续更新,应用市场就是输入法的前车之鉴。
为了商业化,部分输入法暗地里开始做起“倒卖数据”的生意,这又给输入法行业带来了隐私保护问题。
用户数据去哪了
2021 年 1 月 19 日,张小龙在“微信之夜”上表示,因为用户频繁投诉自己的聊天记录被窃取,出于保护用户隐私的目的,才决定自研并推出输入法。
张小龙一番话,把其它输入法公司置于不义之地。
用户数据一直是输入法行业里“隐秘的角落”。即便输入法公司一遍遍地向用户声明“我们将妥善处置用户数据,保护用户隐私”,用户依然对输入法心存芥蒂。
作为用户手机中最大的信息集散地,输入法与广告商、分析服务商等建立了数据合作关系,你打开任意一款输入法 app 的隐私政策,都能够看到类似“会将用户部分信息共享给j9九游会登陆入口的合作伙伴”的描述。
所谓的“部分信息”不是用户的敏感数据,而是“用户画像”“用户标签”等脱敏形式,用于推荐个性化广告 [21]。
比如,京东曾在 2017 年与搜狗签下名为“京搜计划”的合作框架。京东彼时便表示,与搜狗合作将获得更多流量入口,能提升投放的精准性 [22]。
正因如此,很多用户跟朋友聊天时说了什么,就会在电商 app 接收到相关的产品推荐。
2019 年 12 月 30 日,国家网信办、工信部等四部门联合发布《app 违法违规收集使用个人信息行为认定方法》,提到 app 不得“违反必要原则,收集与其提供的服务无关的个人信息。”[23]
2021 年初,工信部对输入法行业“格外关心”,一下子公布了 26 款侵害用户权益的 app。其中,qq 输入法、快输入、手心输入法、微商输入法四款输入法均因违规手机用户个人信息,被下架整改 [24]。
这只是前菜。
2021 年 4 月 26 日,工信部发布《移动互联网应用程序个人信息保护管理暂行规定(征求意见稿)》,其中第七条规定“从事 app 个人信息处理活动的,应当具有明确、合理的目的,并遵循最小必要原则,不得从事超出用户同意范围或者与服务场景无关的个人信息处理活动。”[25]
5 天后,国家互联网信息办公室发布了“关于输入法等 33 款 app 违法违规收集使用个人信息情况的通报”,其中 15 款输入法 app 存在非法获取、超范围收集个人信息的现象。搜狗、讯飞、百度、qq 等主流输入法 app 无一幸免 [26]。
监管趋严的结果是,输入法的数据管理越来越规范。搜狗输入法 2022 年 4 月更新的《收集个人信息明示清单》和《第三方信息共享清单》里,已经看不到可用于个性化广告的信息共享。
自此,输入法的数据生意结束,正式成为互联网巨头的公益产品,最多为自家产品导导流 ——2022 年 9 月,在微信键盘最近一次的灰度测试中,已经有了智能荐书和小程序、公众号分享等功能。
但这就是微信的全部目的吗?显然不是。
手机行业的“名利场”
中国最大社交媒体、月活超 12 亿的微信,掌握着几乎全中国网民的隐私数据。这是社交产品难以企及的成就,同时也是块“烫手山芋”。
而聊天打字用的输入法,是除了微信以外,聊天信息的唯一出口。国家对用户隐私的管理日益严格,微信有必要与这些“风险”切割,而自研输入法就是最好的方法。
开发输入法对微信来说并不难。
一来目前微信 app 上已经包括了语音输入、语音转写、文字翻译、表情包搜索等功能,与一款完整的输入法比起来只差一个键盘;二来腾讯已经收购搜狗,无论是搜狗输入法还是 qq 输入法的团队,都有现成的技术和经验供微信团队借鉴。
微信也不必考虑开发输入法的投入回报比,毕竟隐私面前无小事。至于怎么盈利,那是信息流广告该考虑的问题。
那这不是砸了同行饭碗吗?是的,但第一个饭碗已经被苹果砸了。
2021 年,苹果在 ios 14.5 中限制了 app 的广告追踪功能,砸了谷歌、亚马逊以及彼时 facebook 饭碗。虽然同行怨声载道,甚至宣布起诉苹果,但用户一片叫好。
如今,不过是事件的主角换成了微信、战场变成了输入法,但手机行业依旧是那个隐私与盈利的名利场。
references:
[1] 中国发明协会副会长王码五笔字型发明人 “当代毕昇”-王永民 http://www.wangma.net.cn/ wangyongmin.aspx?sm=10
[2] 王码与郑码 2014.11.8 https://www.qqxiuzi.cn/ wz / zixun / 1163.htm
[3] 王码五笔字型 86 版、98 版、新世纪版简体字根键位图 http://www.wangma.net.cn/ infomationdetail.aspx?sm=5&m=41
[4] 打字虽快错字罚五十 重温输入法发展史 2011.9.7 https://soft.zol.com.cn/ 247/2476547_all.html#p2476650
[5] 马占凯:sogou 输入法之父的故事 2007.10.11 https://blog.csdn.net/ anzi57066381 / article / details / 1819943
[6] 腾讯 qq 拼音输入法正式起诉搜狗拼音输入法不正当竞争 https://tech.qq.com/ zt / 2009 / qqpinyin09 / index.htm
[7] 拼音输入法竞争进入白热化 2009.7.1 https://www.chinanews.com/ it / it-itxw / news / 2009/07-01/1756009.shtml
[8] 搜狗起诉百度输入法 8 项专利侵权 索赔 8 千万元 2015.10.26 https://www.yicai.com/ news / 4702489.html
[9] 百度正式起诉搜狗输入法 索赔一亿元 2016.10.28 http://news.imobile.com.cn/ articles / 2016/1028/172563.shtml
[10] 因“流量劫持”被 360 及百度等公司起诉,搜索候选功能被判不正当竞争 搜狗输入法之劫 2019.7.13 http://www.cb.com.cn/ index / show / bzyc / cv / cv13418711641
[11] 新版 windows 10 特别针对中国市场 改善简体中文输入体验 2016.12.8 https://www.51cto.com/ article / 524434.html
[12] android 手机占据全球智能机市场 48% 份额 2011.8.2 http://www.techweb.com.cn/ news / 2011-08-02/1075173.shtml
[13] 极光大数据:2018 年输入法 app 行业研究报告 2018.8.31 http://www.199it.com/ archives / 766638.html
[14] 2020 年中国第三方输入法市场发展分析 2021.1.11 https://www.analysys.cn/ article / detail / 20020025
[15] 我国网民规模达 9.89 亿 2021.2.4 http://www.xinhuanet.com/ tech / 2021-02/04 / c_1127061748.htm
[16] questmobile2020 中国移动互联网年度大报告・上:变局孕育新生,新“消费者触达矩阵”掀起销售、营销变革 2021.1.26 https://mp.weixin.qq.com/ s/_y6d43vvzrol_olndsrewq
[17] 中国第三方输入法市场专题分析 2019 2020.1.3 https://www.analysys.cn/ article / detail / 20019622
[18] 搜狗姓搜,搜狐的搜 2017.8.2 https://www.pingwest.com/ a/127351
[19] 解读搜狐 2012 年财报:创纪录下的隐忧 2013.2.6 https://www.huxiu.com/ article / 9979.html
[20] 搜狗财报 https://www.sec.gov/ archives / edgar / data / 1713947/000110465920049011 / a20-15253_120f.htm
[21] 输入法会“背叛”我们吗?2021.1.31 https://www.infzm.com/ contents / 200787
[22] 京东联合搜狗推京搜计划 全面开放企业核心能力 2017.10.20 https://tech.huanqiu.com/ article / 9cakrnk5y44
[23] 关于印发《app 违法违规收集使用个人信息行为认定方法》的通知 2010.12.30 http://www.cac.gov.cn/ 2019-12/27 / c_1578986455686625.htm
[24] 关于违规调用麦克风、通讯录、相册等权限侵害用户权益行为的 app 通报(2021 年第 2 批,总第 11 批) 2021.2.5 https://www.miit.gov.cn/ jgsj / xgj / gzdt / art / 2021 / art_7893db5f4a4d403192f69c72fc0320d9.html
[25] 公开征求对《移动互联网应用程序个人信息保护管理暂行规定(征求意见稿)》的意见 2021.4.26 http://www.gov.cn/ xinwen / 2021-04/26 / content_5602780.htm
[26] 关于输入法等 33 款 app 违法违规收集使用个人信息情况的通报 2021.5.1 http://www.cac.gov.cn/ 2021-04/30 / c_1621370239178608.htm
本文来自微信公众号:,作者:杨景诒, 编辑:李拓