对话金山办公CEO章庆元:大模子带来的交互革命

发布时间:2023/05/11 点击量:

  一家 SaaS 软件公司,正处正在大模子范式革命的前沿,包罗它正在内的软件公司最终都有被大模子代替的或许。而它仰面一看,本人追逐了数十年的敌手微软,正猛然成为大模子期间的最大「赢家」。后者用 100 亿美元投资了 OpenAI,并用大模子技巧重塑了软件和云。接下来该如何办?这即是金山办公要面对的实际。

  动作一家 35 年史乘的办公软件公司,金山办公走过个体电脑期间、PC 和搬动互联网期间、云和合营期间。其旗下 WPS 是国内最亲近微软 Office 的产物,至今仍每个月任事近 6 亿用户配置。而面临方才显示的大模子期间,它的回身仍旧迅捷、坚定。本年头,金山办公决议彻底调转公司船头,转型 AI,平常跟 AI 无合的交易都要砍掉。

  它也率先拿到了结果。4 月,它推出「WPS AI」,这是国内协同办公赛道首个类 ChatGPT 式行使。

  我对这家公司的处境与斟酌至极好奇,动作一家 SaaS 软件公司,它何如对付本人正在大模子期间的运气?何如对付本人跟微软三十几年胶着的逐鹿?以及动作一家履历如许久的公司、它何如正在构造上能这么疾地已毕 AI 转型?不久前,我跟金山办公 CEO 章庆元有了一次访讲。

  章庆元 2000 年参与金山软件,可能恰是措施员身世,他更锋利地认识到了此次技巧革命会带来的深远影响、并紧迫念收拢它。「当我看到 AI 本人能写措施的时期,我晓畅这个天下齐备变了。」他说。而更首要的是,过去金山办公紧跟每波技巧海潮的基因,才让它有这么久的性命力、这么疾的反映举措。

  笑趣的是,当行业都正在用「军备竞赛」的容貌去做大模子,金山办公却避开了这种「嘈杂」。它采用跟大模子公司团结,先笃志本身交易、做好行使层。

  而合于 SaaS 软件的运气,章庆元说,大模子将彻底推翻其用户交互,简而言之,软件不再「难用」;合于逐鹿,他说大模子希望「统御」全豹软件公司,多人的出道是更好地领会大模子、供给更好的产物、并为 AI 供给更好的接口;合于构造力,他说正在大模子期间,哪家公司能率先更动本人的构造架构和思想形式,谁就能先活下来、乃至胜出。

  金山办公的故事,无论是对 SaaS 软件行业、仍是关于念拥抱大模子期间的创业公司来说,都是有启迪的。

  35 年过去,技巧海潮更迭、期间斗转星移,金山办公仍旧面临着强盛的微软、仍旧愿望跻身下一个热气腾腾的期间。

  张鹏:感想金山办公此次面临 AI 海潮反映的速率至极疾,这么疾速推出 WPS AI,你们内部的决定流程是怎么的?

  章庆元:金山办公过去几年继续正在做 AI,只只是是用守旧的幼模子正在做。咱们几年前就定下了五个词的产物战术,「多屏、云、实质、AI 和合营」。只是客岁亲近岁终的时期,咱们得出一个结论,AI 的道曾经走到非常了,没啥好搞的。由于技巧也就如许子,AI 一点也不「机灵」。

  然后,极度戏剧化的事宜爆发了。咱们刚做完这个总结,GPT3.5 闪现了。咱们才晓畅它的才能有何等强盛。当一个 AI 本人能写措施的时期,这个天下齐备变了,一个新的期间曾经到来。咱们感想,这将比金山办公史乘上始末的全豹技巧改良都更热烈、更有推翻性。动作软件公司,咱们必需踊跃拥抱,不然肯定会被落选掉。

  章庆元:最先,它会给用户交互带来革命性、推翻性的蜕变。过去,软件行业常说「二八表面」,80% 的人只用了 20% 的性能。由于办公软件很杂乱,用户需求辛勤练习才气操纵它。

  但即日,大模子有思想链 CoT(Chain-of-Throught,用于逻辑斟酌)的才能、Codex(编程说话预操练模子,可能帮措施员天生代码)的才能。它可能把用户的一句话,直接酿成代码的移用、再餍足需求。这导致用户交互齐备变了。

  张鹏:可弗成能领会说,过去软件的底层性能很强盛,但如何跟用户交互是很大的题目。而即日,咱们不需求去做用户交互了,由于 AI 可能直接领会用户需求,并移用性能、管理题目?

  章庆元:对,比方当你要领悟华南区某一个商品的发卖排名情状,你不必再去练习数据透视表,而是直接跟呆板说需求,它就会自愿帮你移用器械、闪现结果。另日,UI(User Interface,用户交互)这个词乃至就没有了。

  咱们不再需求琢磨界面如何摆设、某些点线如何摆放。咱们只需求管好产物的底层性能、并将这些性能的 API(行使措施编程接口)做好,让 AI 能通过 API 移用它们、就能餍足用户的各类需求。

  包罗咱们公司过去做文档扫描、图像识别,继续都是用守旧的 AI 措施来正在做,很辛劳。但即日你会发明,这个技巧可能用多模态(指文本、图像、视频、音频等分歧模态数据交融的技巧,是大模子的主旨技巧之一)重写一遍。

  章庆元:比方另日,我感到 Photoshop (Adobe旗下的图像处罚软件)表面上可能切入「美图秀秀」这类器械的墟市。

  即日,Photoshop 的性能固然比 C 端那些美图器械强盛得多,但它输正在用户交互上,许多用户不会用。但到了 AI 期间,当用户交互的本钱降为 0,Photoshop 的强盛性能就会成为绝对上风,终究它能处罚比美图秀秀杂乱得多得多的场景,这对原有的财产格式当然就有或许形成影响。

  张鹏:我看你们继续念做简化用户交互这件事,但或许用过去的 AI 技巧很难竣工?

  章庆元:对,咱们之前就说过,办公软件不是给平常人用的,太难用了。用户应当尽或许少地去练习性能,这是咱们继续正在做的辛勤。只是之前的技巧不 ready,此次咱们到底可能做到了。

  咱们即速会上一个(WPS)新版本,第一件事即是正在用户界面上尽量地做减法。过去的按钮实正在是太多、太杂乱了,咱们要把它简化简化再简化。人要被齐备地解放出来了。

  这些新的范式很令人兴奋,我打个例如,即日有点像十年前搬动互联网刚出手的时期,多人都正在做汤姆猫这种容易行使的期间。

  但原本,它(这波 AI 海潮)对软件行业的更动,不单是文字实质的天生和改写、或者加个 Copilot(个体帮理)这么容易。另日,它会推翻软件行业的方方面面。正在这个条件下,咱们本人也是越念越兴奋,过去做的许多事宜都太无聊了。

  张鹏:适才说到用户交互的蜕变,我好奇这会正在文档这个产物上有什么发挥?过去咱们写作品老是开一个空缺的文档,但往往脑子也是一片空缺,就盯着那一个光标出手写,原本挺疾苦的。

  章庆元:我也是如许。咱们总感想办公很疾苦、不是什么愿意的事,都念早点把办公软件合掉。相当于每个体我给你一张白纸,纸很好、笔很好,可是不是每个体都写得出好字、写得出好作品。

  张鹏:因而另日用户创作文档的形式有没有爆发蜕变?比方通过更智能的模板,乃至上来就给我一个写作指导,一步步帮我睁开思绪,而不是正在一片白纸上创作?

  章庆元:这个咱们曾经正在做了,比方咱们有稻壳这款产物。由于六合作品,许多式子都固定的。用户应当合心表达本人的实质,而不必去念着式子如何弄、或者从一片空缺出手写。

  但之前那种模板是「死」的,你总感到那些东西差点道理。咱们现正在公布的这玩意(WPS AI),它天生的模版是「活」的。比方你要写 OKR,它会自愿帮你天生一个,你一看仍是稍微能用。

  章庆元:换句话说,正在咱们觉得目生的界限,AI 起码可能成为「比拟及格的屯子启发教员」。它什么都略懂、又什么都不精,但它起码能给你供给少少最根本的框架、思绪。你可能正在这个基本上做修正和提拔。

  章庆元:我以为这些 AI 天生的东西,只可帮帮低级水准的人。但假如一个体天天齐备操纵 AI 天生的实质,他肯定会被落选。每一篇真正的文档,应当有一个特有的思念正在内里,念法要足够有价钱。

  但写这种高价钱文档的难点是,你不晓畅要写什么东西、脑子里还没有显示出创意和思念。这个主旨即是要管理灵感素材的题目。以我本人为例,每年正在金山董事会上的通知根本都是我本人写的。写之前,我会花一夜晚岁月去看各类数据,可能试念今后让 AI 更迅速确切地调出干系数据,当我看完这些数据或许就有灵感了,后面就好写了。

  张鹏:因而一方面是所谓「低价钱创作」,比方可能用模版帮用户打个基本。另一方面是「高价钱创作」,要管理用户的灵感素材题目,要帮用户「显示思念」?

  章庆元:对,咱们的任务就叫「容易创作、轻松表达、竣工价钱的维系」,又有一句标语是「绽放伶俐的气力」。主旨即是愿望帮帮用户把本人的思念表达出来。

  这原本涉及另一个跟文档息息干系的交互革命。过去,WPS 云上积聚了差不多两千亿个文档,但过去,这些文档是「死」的,只是起了一个备份的效力。现正在大模子顿然能帮用户看懂这是什么东西了。这些文档顿然有效了,酿成了用户专属的真正的学问库。

  比方当你要写一个东西的时期,你可能直接问你的云文档,请帮我把过去一年公司的应收款叠加现金流,做成折线图。你看完这些,或许就有创作灵感了。这些数据就能帮你显示出「伶俐」和「思念」。

  张鹏:这让我念到过去的学问库性子是「connection」,用户只是通过探索对应到文档。但即日是「from connection to solution」,你直接告诉我你要什么,我直接告诉你需求的。

  章庆元:这才是真正的学问库,以前的学问库都是假的。以前我原本念做学问库,末了没做。由于当时我问产物司理这个东西有什么用?他说即是云文档加个目次,没啥区别,仍是靠症结词探索。

  但即日,大模子靠的是向量探索。比方你输入「手机」,它不是把「手机」干系的症结词闪现给你,而是可能回复你合于「手机」的题目。只要你能问文档题目、它能反应结果,这才是真正有价钱的学问库。

  张鹏:当咱们可能基于企业可靠的文档数据去做学问库,是不是可能从根底上提拔企业的功效?

  章庆元:这切实好坏常有联念空间的事宜。自己企业的数据分两种,一种是构造化数据,一种好坏构造化数据。构造化数据是曾经被处罚过的数据,重要正在财政编造、交易编造内里。而非构造化数据重要正在文档里,过去它很难被领会,因而或许需求找人帮我梳理。但现正在,我直接找 AI 就可能。

  张鹏:你感到文档是一个独立的东西,仍是必定要融入到全数企业管束的管事流里?文档会不会往管事流走?

  章庆元:原本,企业文档这么多年来继续是企业内部管事流的一局限。守旧的 OA(Office Automation,协同办公编造)也继续接济 WPS 做内部流转的产物,但咱们没做 OA,另日也不会做。由于这内里有许多 Know how(认知堆集),我感到咱们做不了这个事宜。包罗微软这么多年跟咱们的念法也是相同的。

  张鹏:全豹人都晓畅「AI 个体帮理」是大模子期间「皇冠上的明珠」,但没有人晓畅这个帮理会正在哪里闪现。但即日来看,假如文档可能显示出思念,那它有或许会显示出真正的「AI 个体帮理」吗?

  章庆元:即日我是一家公司的 CEO,我可能聚焦正在我本人念表达的主张上,许多实践的活儿有团队配合。比方财政团队帮我供给数据(灵感)、案牍团队帮我写作、UI 团队帮我美化。但另日,浅显用户或许只用花一点钱,也能具有一个同样强盛的团队。

  设念一下另日,你有一个 AI 帮理,它既可能帮你调数据、给你创作灵感,乃至还可能帮你写作——由于他看过你全豹的作品,晓畅你的写态度格是什么。或许你语音跟他说下要表达的主张,它就能帮你构造文字、输出属于你的作品。末了他也能帮你美化 PPT。症结是他 24 幼时待命,牢靠又安详。这种体验齐备是推翻性的。

  张鹏:当另日人们都直接跟呆板交互的时期,咱们还需求文档吗?那时期文档正在人类天下中的意思是什么?

  章庆元:我以为文档是不会隐没的,由于它是人类思念和创意的载体。除非人类的思念和创意没有价钱了,全豹东西都是呆板缔造,文档才会隐没。但那时期人类或许曾经消逝了。

  章庆元:由于你的思念和创意最终是给人看的,因而它必需是人类能领会的地势,是文字而不是向量。除非你是向呆板报告,那一天人类就艰难了。

  可是又有一种情状,文档将会隐没,即是多人都接了脑机接口。那时期人类就不必看文档了,思念和创意直接酿成了向量的传输。那一天或许即是真正的 MATRIX(源自片子《黑客帝国》,指的是一个担任了实际天下的推算机人为智能编造),人类也不必辛勤管事了,给你一个虚拟屋子,你的大脑就能得回疾感。

  章庆元:所谓用户交互革命,即是用户不必去练习各类杂乱的性能了、用户的数据寓意都能被领会了。只要这两个都做到了,它才是真正的 Copilot。

  章庆元:我感到微软这波太牛了。它跟 OpenAI 的这个来往(注:微软向 OpenAI 投资了 100 亿美元),应当是这两个世纪内里最得胜的贸易来往,没有之一。它 100 亿美元过去了今后,OpenAI 不单给它供给特别的任事,然后又返到了 Azure(微软的云任事)上来。这个生意太好了。

  另日没有 AI 才能的云就卖不动了,只卖 CDN(实质分发收集)、卖带宽,这个是没有价钱的云。而目前,只要微软的云嫁接了 OpenAI 的才能。可能说,微软加 OpenAI,是另日贸易天下的新一代「灯塔」。

  微软又有个真正的大招,即是操作编造。操作编造是最大的流量入口,它会把许多东西集成了,另日许多容易的行使软件就直接被代替了。比方像做栈房预定的公司,另日 AI 可能直接遵循用户需求,调取栈房的 API 已毕预订、抽成比例还低,他们的财产场所或许就没有了。

  张鹏:以前携程如许的公司,恰是通过帮守旧行业已毕了新闻化、数字化,才具有平台的价钱。那另日那些合于新闻化、数字化的软件还会存正在吗?软件的界说和目的是不是也变了?

  章庆元:软件短期内还存正在的,永恒内就另当别论了。极度是 ChatGPT 有了 Plugin(插件)才能之后,就比如它不擅长算数学题,但它会用 Plugin 去调推算器来算。说白了,咱们另日软件公司干的即是推算器的活。咱们最终的价钱,或许即是给大模子供给 action(管理计划)。比方说表卖公司,它最有价钱的局限或许是给 AI 供给派送才能。

  另日咱们这些公司或许会酿成一个个节点。比方开一个贸易公布会,它或许先调 WPS 天生一个文档,然后把文档发给栈房,接着本人预订好栈房……大模子酿成了真正的 MATRIX,把全豹软件公司都维系了起来。

  章庆元:我猜,它的 Copilot 也不会齐备用 OpenAI,由于本钱太高了,它应当也扛不住。正在中国的话,它的 Copilot 才能的后端或许需求正在国内落地才可行。

  章庆元:总的来说每家的思绪都不相同。比方企业微信卖的是微信的价钱、飞书卖的是字节的管束、钉钉卖的是一个强大无比的 SaaS 平台,而金山办公继续卖的是管理计划。咱们会帮客户做一个属于它本人的「飞书」,这对它来说新闻是可控的。

  咱们继续是任事思想,你念要什么,我帮你。哪天你不念用金山办公,你的数据直接 control+A、control+C、control+V 就可能弄走了。

  多人的客户群重叠度也没有那么高。钉钉或许卖给中幼企业多一点,飞书卖给大型的民企多一点,咱们重要卖给央国企、当局。

  章庆元:这是有或许的。由于历来 SaaS 公司之因而这么多,即是由于客户需求的多样性,需求定造化拓荒来餍足。举个例子,WPS 以前有本性能「删除文字空缺段」,但这种性能不必再拓荒了,ChatGPT 可能管理。因而当大模子能管理历来 SaaS 定造化的题目,SaaS 公司就会逐步变得同质化。

  章庆元:我感到它们的逐鹿力重要仍是,它们对大模子的领会,它们的产物底层是否健旺、本能是否足够好,它们的 API 是否足够怒放、是否能为大模子做少少优化。我感到最重要是去领会用户的需求,把管事流策画出来,AI 是不会去做这件事宜的。

  以 BI(贸易智能)编造为例,再过一年这些 SaaS 公司主打的卖点应当即是,谁家的 AI 才能最强。比方当用户讲出需求之后,它可能帮用户领悟各类数据,直接给出谜底。这才是真正的 BI,没有 AI 的都是假 BI。

  我比拟运气的是,由于这么多年的逐鹿敌手继续是微软,因而咱们继续正在跟微软看齐。微软做全豹的产物都是先做 API、再做 UI,因而它的 API 至极强盛。WPS 之条件出的对微软的「三大兼容」,除了 UI 兼容、文献式子兼容,更首要的即是 API 兼容。咱们的 API 接口跟微软一模相同,至极强盛。这也酿成咱们的首要上风。

  比来,我也把不乱金山办公的 API 架构定为公司的主旨战术。由于只要 API 的架构不乱了,咱们团结公司的大模子才可能移用它、用来餍足用户的完全需求。

  张鹏:多人都正在研讨微软这波这么牛、或许要「金瓯无缺」,金山办公如何应对?

  章庆元:包罗此次发年报,我出去道演讲了 38 场,多人都正在问我合于 AI 的题目。主旨是两点。一是金山如何跟微软逐鹿,二是如何看国内正在线文档正在 AI 加持后的逐鹿格式。我的回复是,咱们的逐鹿能力很强,由于咱们的 API 才能和云都曾经很成熟了。

  张鹏:某种水平上有一个超等强盛的敌手对你们来说也是一种好事,亦敌亦友亦师。

  章庆元:我是 2000 年来金山的,那时期微软也恰是巅峰期。当时咱们金山全数形式整体是学微软的,看《微软的隐藏》那些书、也挖了许多微软的人,从微软身上学到了许多。只是其后正在互联网期间,咱们显得稍微掉队一点,产物看着也不那么性感。但即日这个 AI 期间,或许又让咱们有了新的机缘,不断跟微软看齐、产物也可能变得性感起来。

  章庆元:大约是春节后。金山文档是咱们全数公司的「先遣队」,我把许多团队的人都分派到那里去练习。咱们测了国表里全豹的大模子,包罗第一批拿到了谷歌大模子的内测。咱们看着这些大模子的才能,细思极恐、越念越恐怖,太强盛了。因而快捷参加了研发。

  章庆元:第一,正在线文档做起来疾、更新也疾,相对守旧的 Office 更容易,因而咱们先拿出来做。第二,咱们那支团队是的 AI 淳厚的「信徒」,他们一伙人扎进去,越扎越深。他们会不息地告诉我,咱们可能如许做,可能那样做。

  章庆元:即日我本人做大模子纯粹虚耗岁月。由于另日正在中国,BATB(百度、阿里、腾讯、字节)这四个通用的大模子肯定是最好的。况且现正在去做也会限度我本身主旨交易的起色。

  我的主旨逐鹿力还正在 Office 自己。因而我肯定要跟进最好的大模子,谁好我就用谁。我就做大模子的行使者。

  章庆元:现正在只要两种大模子,一个叫 ChatGPT,一个叫其他。由于大模子最首要的是 COT 的才能、Codex 才能,除了 ChatGPT 除表,其他家这块的发挥差异比拟大。我对中国的大模子有决心,由于咱们对新技巧的怒放水平原本是更高的。

  张鹏:即日的创业者有两种思绪,一种像你相同就做大模子的行使,另一种是也必必要干大模子,不念把命握正在巨头的手里。从你的角度,你很疾就真切了是前者。

  章庆元:最先,我是要做大模子的行使。但其次,我另日也肯定要管理大模子自帮可控的题目。由于假如念用简单的大模子管理全豹题目,本钱会很高。况且咱们有本人的定造化需求,因而咱们必需得有本人的优化模子。

  但即日,我本人做的本錢會至極高,還不如別人幫咱們做。因而咱們就找國內大模子創業公司如許的團結夥伴,餍足咱們定造化的需求。

  章慶元:對,現正在本錢太貴了。用戶的一句 prompt(提示詞),看起來就 10 個 token(字節),但爲了讓大模子回複更確切,咱們還要加一大堆的 prompt 進去,就釀成了 100 個 token。一個月得多少錢?現正在根底不念算。但我堅信很疾,這個本錢肯定會降下來。

  章慶元:咱們 AI 團隊現正在重要正在幹兩件事宜。第一,踴躍練習各大模子。第二,本人做個「分診台」幼模子,比方遵循用戶的場景、需求,給它立室最適合的大模子,從而竣工分流。這個還算容易,根本上有七八十億參數、方才出手「顯示」的模子就夠了。

  他們的任務即是,供給表面封裝好的模子、供給基本舉措,讓公司其他團隊基于 API 的拓荒變得更容易。

  章慶元:一出手是我逼著其他的團隊轉(AI),OKR 整體都要改。正在內部來說,新版的全豹的産物即是 AI Native(AI 驅動),假如不是 AI Native 的産物,應當一年內我預備都把它合了,沒什麽價錢,不參加了。

  其後發明原本團隊關于此次大模子的閃現都是很是興奮的,全數産研團隊永遠沒有這麽興奮,都帶著極高熱心自我驅動地練習和參加。

  章慶元:咱們 OKR 底本是客歲底定的,但本年一季度整體改了。主旨即是如何把 AI 行使到各個團隊的交易裏。咱們比來創辦了一個産物幼組,今後內部做什麽産物都要先審核,不要再做少少守舊的(産物)了,那即是虛耗錢。多念念 AI 如何做。

  張鵬:創始人或者 CEO 往往傾向感很強,但傳導到全數公司需求歲月、流程也很疾苦。這或許是另日全數 AI 期間創業公司最大的離間。

  章慶元:正在 AI Native 期間,誰率先更動了公司的架構和公司思想的形式,誰就能活下來、誰就能勝出。

  我本人是措施員身世的。我許多年前就以爲,假如有一天措施本人會寫措施,那咱們這些措施員都垮台了。結果今純真的爆發了,這件事對我的挫折至極大。我感到都不必看它(AI)的其他才能,光這點,就能更動天下了。

  章慶元:比方咱們的措施員應屆生,正在進項目組之前,都有半年脫産操練和幹系試驗。現正在,咱們出的每道題都市用 ChatGPT 寫一遍谜底,那即是条合格线。包罗现有的措施员,也要学会用 ChatGPT 来辅帮写代码。

  关于措施员来说,他们要从新商量本人的技巧栈。最先是去领会和练习 AI,其次要念着如何行使它。这是最首要的。

  章庆元:一方面是海表版,即是要踊跃跟进环球最前辈的技巧,敌手有的东西我都要有,什么 Copilot、ChatPDF、ChatDOC、ChatExcel 全做一遍。另一方面国内版,或许要慢少少,要等国内团结伙伴的大模子上线。我坚信正在做的流程中,决定会堆集出少少体会,然后更多的斟酌、念法就会显示出来。

  咱们遭遇什么海潮都是先干了再说。由于金山办公一经正在这方面吃过亏,从 DOS 操作编造到 Windows 操作编造就反映慢了,公司差点挂了。所今后来搬动互联网起来的时期,咱们也没念领略,就先干了再说。到其后云、合营、AI 那一波海潮,咱们也干了。

  以前那些年,有时期正在新产物公布会上,我本人有时会有种「为改进而改进」的感想。但此次 AI 海潮,我感到咱们是真的正在改进。原本 AI 的许多才能咱们还没有齐备开释出来,我本人都感到另日会是蛮让人期望的。