当李大海遇上刘知远：知乎和面壁的「大模型」故事环球微头条

2023-06-20 09:46:17 来源: 微信公众号：雷峰网

2016年12月23日，北京的树上早就挂起了丝丝条条的彩灯，距离圣诞节还有两天，吹着微微的北风，周五的街道并不冷清。

而在这天，北京海淀的768园区，刘知远带着几个博士生，敲开了知乎合伙人李大海的大门。

不同于今天，智源学者、清华大学计算机系副教授的名号加身，2016年冬天的刘知远，还只是清华研究 NLP 的一个助理教授，虽然有了一些成绩，但仍然算是“名不见经传”。

(资料图片仅供参考)

这次来找李大海，刘知远想要的是“借用”知乎的数据。在知乎，用户的回答更专业，质量也更高——对于 NLP 研究来说，是相当上乘的语料数据。

有人曾把当下互联网范式的转移，形容成从“分发信息”到“分发知识”的转变，知乎作为一个着力传递知识和见解的平台，自然被认为是 AI 2.0时代的“前头兵”。

刘知远博士师从孙茂松院士，后留校清华，从博士算起，他彼时已经在自然语言处理的领域，深耕了十年之久。能得到知乎的数据，自然对研究是如虎添翼。

但数据，几乎算得上是一家互联网公司的“命门”，刘知远早就做好了被拒绝的准备，而李大海的反应却异常地爽快。

2016年冬天，李大海加入知乎不过一年的时间。不同于刘知远在象牙塔一路攀升，李大海自己形容自己，是个“爱折腾”的人，在谷歌和豌豆荚都有过任职。在离开谷歌后李大海一直是创业状态，靠着在工业界深厚的积累，获得了知乎的认同。

早在见面之前，李大海就对刘知远莫名地亲切，不仅仅是因为刘代表的是清华，推动这项合作，本质上推动的是 NLP 领域的产学研结合；也是因为李大海早在谷歌和豌豆荚，就以搜索业务的研发见长，与刘知远所研究的自然语言处理脱不开干系，虽然两人经历迥异，但也算殊途同归。

把刘知远接进办公室，不需多言，李大海就知道，面前的这个年轻学者，务实、客观，对技术路径的判断相当精准。

短短聊了半个小时，李大海和刘知远将合作就敲定了下来——不需要支付任何费用，一纸 NDA（保密协议）签好，知乎的语料数据就对刘知远开放了。

一晃6年过去，今天李大海的身份，已经不仅是知乎的 CTO，更兼任了刘知远所创办的面壁智能的 CEO，成为了两家公司在大模型方面沟通合作的桥梁。

1、大模型最强的“珠联璧合”

说起关注大模型的时间点，李大海的*反应是“惭愧”。

“我对这件事情经常反思，对我在这个点上的技术判断不满意。”李大海说起这话时，对自己高要求的苛责，几乎写在了脸上。

尽管早在 ChatGPT 在科技圈“激起千层浪”之前，李大海和知乎的算法团队，早就关注到了大模型的可能性，并且尝试过 BERT 架构的模型，也留意着技术变化的趋势。然而，李大海坦言，直到大模型成为一门显学之前，都没预想过技术的突破会来得这么快。

“过去，我们把工作重点放在前端的推荐、搜索等业务中，对于大模型主要以应用为主，当然也一直在跟进大模型最新的成果为业务所用。”

在 ChatGPT 强势登场之后，人们惊呼，科技界的下一个“iPhone 时刻”将至。而在几个月的持续观察与发酵之后，人们这才发现，把大模型类比“iPhone”，可能野心太小——大模型很可能是新的“蒸汽机”，带来的机遇不仅限于某个领域，而是全社会大多数领域的重构。

本该早就看到这个趋势，至今想起，李大海仍然觉得遗憾。

尽管一时落后，李大海仍想迎头赶上，让知乎快步追上大模型的浪潮，这时他想起了刘知远。

2018年，应和着 BERT 的出现，刘知远和团队就开始做预训练，后又和唐杰、文继荣、黄民烈三人一起，在智源开展大模型的研究，是*批开展大模型研究的研究者之一（关于刘知远、唐杰、文继荣、黄民烈等人的大模型研究故事，后续雷峰网还将推出《大模型产学研的前世今生》，讲述四位学者的大模型梦，以及他们与阿里、华为等大公司的合作和在AGI浪潮到来之前，与其他大模型创业公司的参与度，敬请期待）

而刘知远在2021年创办的面壁智能，不仅有多年来留下的技术积累，而且已经训练出他们自己的大模型 CPM-Bee，并且开放了 API。

23年2月，知乎和面壁谈过初步的合作后，李大海回到知乎，就紧急地开展了一次技术评估，把面壁的代码——无论是训练还是推理——都看了一个遍，又评估了面壁的模型 API，跑了大量的问题，最终测试结果出人意料地好。

彼时，大模型的人才争夺战刚刚打响，面壁收到了好几家公司的诚心邀约，最后选择了与知乎合作。

谈到和面壁最契合的地方，李大海说，知乎和面壁的团队，*的共同点是，大家都是相信技术的人——相信技术能改变世界，如此也就更纯粹，讨论问题时更加实事求是。

与面壁合作，知乎并非“只出钱不出力”，自从大模型起势，知乎也快速组建了大模型的团队，与面壁团队一起进行深度共建。知乎参与过大模型相关项目的开发的人员数也不少。

除了出技术，知乎也为面壁提供管理上的协助——这样的协助，莫过于李大海的“肉身”加入。

2023年的面壁，苦 CEO 久矣——成立一年半，面壁的团队绝大部分成员仍以工程师构成，对于一个初创团队来说，全员极客、专注开发的路线并没有太大问题，但牵涉到后续的融资、战略等问题，面壁的成员没有经验。

而李大海加入知乎已有8年，除了作为 CTO 为公司规划技术路径，也作为执行董事深度参与了公司的战略层决策，并且他也有合伙创业的经验，对于面壁来说，是极为合适的 CEO 人选。

获得了知乎创始人、CEO周源首肯，李大海来到了面壁出任 CEO，一方面帮助面壁更好地做战略的规划和制定，一方面也让知乎和面壁的战略合作更加紧密，算是两全其美。

有李大海的工程化和管理经验，也有刘知远作为国内* NLP 专家的技术实力；有知乎的活跃社区和优秀语料，也有面壁在大模型训练和开发上深厚的积累，这两家公司的合作，可能促成了中国大模型最强大的一桩“珠联璧合”。

2、“千模大战”中，知乎靠什么突围？

说完“纸面实力”，知乎和面壁的核心优势在哪里？

影射多年前的“千团大战”，越来越多人开始用“千模大战”来形容今天大模型赛道的竞逐——行业普遍认为，尽管做大模型需要投入大量资源，但由于大模型的结构不存在秘密，算法已经不构成企业壁垒。大模型“有门槛、没壁垒”的特点，使得诸多”跑步进场“的团队一边倒向 C 端类 ChatGPT 的研发，同质化严重、与行业需求差距大等问题开始显现。

而从另一个方面看，如果将AI时代的大模型比喻成电气时代的电力，当人们认识到电力的价值，之后会有水电、风电、核电等多种多样的“发电手段”不断演进，不断降本增效；未来的大模型也是如此，比拼的核心是成本和效率，竞争的重点是应用和生态。

这一点从今年上半年国内大模型产品发布的情况也能看出：通用大模型的发布热潮已经回落，近两月来，大模型公司已经迅速将重心从 To C 转向 To B，大模型的落地应用场景、私域数据的储备、技术团队的产品能力成为大模型差异化竞争的关键因素。

知乎和面壁合作的“知海图”大模型，瞄准的也正是知乎的场景和数据与大模型的深度结合。

归根结底，知乎是一家互联网公司，虽然技术上要向大模型倾斜，但大树有根，知乎的根在业务上。

围绕着业务，知乎在数据上的优势也能得到充分的发挥，同时通过提升用户对产品的体验，把公司的“钱袋子”守住。有了更多使用、更多的数据，大模型的“飞轮”也就能更好地飞转起来，再去向 B 端公司推广，也更有底气。

在这样的逻辑下，李大海给知乎大模型，设计了一个“三步走”的战略。

*阶段：用大模型来识别内容，保证标准合规

高质量、有人文的社区，一直是知乎最重要的财富，正是依托这个社区，知乎才能持续产出令用户喜爱的内容，进而保持粘性、完成增长。

针对这种情况，知乎大模型的应用场景，首先并不是喧宾夺主地“生成”，而是识别用户产出的内容。

“对我们来说，识别是必须的，”李大海对雷峰网说道，“识别能让我们更精细地理解用户，来支持产品运营同事的工作，进而帮助我们更好地把这个社区建设好。”

除了识别“人”产出的内容，知海图一项同等重要的工作，是检测 AI 生成的内容。

ChatGPT 的登场，让很多人看到了 AI 创作的可能。在知乎上，也出现了不少搬运 AI 创作的情况存在。

而知乎，在创始人们的初心里，仍然是一个“以人为本”的社区。虽然对于 AI 生成的内容，知乎的态度是开放的；但如果一个用户，只搬运生成式 AI 的产出，那对于知乎来说，未免有些本末倒置。

一方面是要识别出这样的账号，一方面也要识别出 AI 生成的内容，做好“AI 创作”的标注，让平台内容标准、合规。

第二阶段：用大模型来辅助过滤、筛选信息

推荐引擎，常常被不少人认为是可以利用大模型“重构”的技术之一，在技术上也有继承和发扬。

基于对语言更好的理解，来让用户在平台上获得更好的信息获取体验，大模型可以说是“恰到好处”。

李大海原本就是搜索引擎出身，而刘知远也在 NLP 领域有近20年的经历，知乎和面壁在这个领域，可以说轻车熟路。

如果说，大模型在内容识别上的内容，做的大多是“幕后工作”；那么“搜索聚合”在搜索和热榜上的内测，就是知乎 AI 实力“犹抱琵琶半遮面”的一次展示。

在大模型的帮助下，用户能更快找到他需要问题的答案，也能在生成式 AI 的辅助下，节省下浏览诸多答案、归纳总结信息的时间，让用户直接阅读高质量回答的梗概。

知海图的内测还刚刚开始，李大海对雷峰网表示，目前还没有更多的信息透露出来，但预计在第三季度的七八月左右，会有一个阶段性的成果展现。

第三阶段：用大模型辅助创作，拒绝喧宾夺主

从识别到推荐，第三阶段，知乎对知海图的期待，则是辅助用户在平台上的创作。

李大海表示，知乎做 AI，最终关注的还是，如何让 AI 帮助更多用户在内容上做生产，如何保持社区的高质量，保持知乎原本的味道。

要做到这一点，一方面，大模型输出的内容质量要足够高，让用户能用得方便放心——这是大模型的基本功，知海图要有；另一方面，则是要根据用户个人的语言风格和叙事方式，做个性化的用户助手，帮助每一个用户产出属于他们自己的内容，避免 AI 生成内容的“千人一面。

在今天，知海图的能力已经从 NLP 逐渐向多模态迈进，在5月底的中国国际大数据产业博览会上，知乎和面壁联合推出的知海图，不仅宣布了开始大模型在搜索、热榜上的应用，也同样展示了知海图的多模态能力：

“我们上传了一张小男孩的照片，我们的 AI 不仅能识别出小男孩的主题，也能通过他的面部表情，识别出他愤怒的情绪。”李大海说道。

大模型能做的事越来越多，这也迫使知乎开始思考一个难以被绕过的问题：在未来，人类创作者，会被AI所取代吗？

原先，知乎曾经想过，要不要给知海图也做一个知乎的账号，让 AI 在知乎上回答用户的问题——很多人都有过这个设想，毕竟这和时下生成式 AI 和知乎的产品特性相当契合。

但在深思熟虑后，李大海的态度仍然相当谨慎：

“在我们看来，AI 应该是人的能力扩充，而非替代。有些精品的内容，创作者要2天才能完成，在 AI 的帮助下，我们希望让创作者用2个小时就能产出内容——但这2个小时，仍然还是需要他去自己创作的。”

3、结语

从2016年冬天，李大海和刘知远初遇，到2023年春天，李大海兼任面壁智能 CEO，六个寒暑的光阴，在两人身上看似没有留下多少痕迹，他们投身的事业却开始汇入时代的洪流。

6年过去，李大海仍然是多年前的那个自己，并不“安分”。早在谷歌业务退出中国时，尽管编制还在，但李大海却决意离开——他要在中国做产品，服务中国用户。

而当大模型浪潮涌来，李大海不动不摇，张开臂膀，拥抱急流。

在知乎，他的精力一门心思扑在大模型上，决心用 AI 2.0 的技术重构知乎现有的技术架构；

在面壁，他得以运筹帷幄，执掌公司在商业和战略的运作，发挥他在技术之外的实力和远见。

而刘知远，在大模型的技术趋势刚刚到来的 2018 年，就已经敏锐地看到了这个趋势，并从 2019 年开始把实验室的研究方向从传统的 NLP 命题中撤出，全面围绕大模型的方方面面展开。

李大海把这赞誉为一种“技术胸襟”——就如同一个技艺高超的马车匠人，*次遇到了蒸汽火车，多少人难以接受，多少人抱怨，但最早转型的人，往往就能越早占*机。

知乎和面壁智能，人才密度高，密度背后有优质语料数据、深厚技术底蕴和产品落地场景的支持，已然是一股不能被轻易忽视的力量。

今天，李大海仍然在多年前，与刘知远初次见面时的那个办公室伏案工作。而面壁的团队也同样务实、低调，常常骑着自行车穿过学院路，来到768园区和知乎的团队探讨工作。

这颗在6年前被种下的种子，在大模型的时代终于开花结果。而中国大模型的未来，正是以李大海、刘知远为代表的技术理想主义者和实干者手中，于无声处等待厚积薄发。

标签：

当李大海遇上刘知远：知乎和面壁的「大模型」故事环球微头条

您可能也感兴趣:

今日热点

文明校园 | 葵涌第二小学：足球特色持续赋能助力文明校园创建-快消息

世界今热点：“大模型应该更懂行业、更易落地”！腾讯云首次发布行...

放榜在即：已有26省份明确将于6月23至26日间公布高考成绩

更多

更多

排行

精彩推送

今日要闻

当李大海遇上刘知远：知乎和面壁的「大模型」故事 环球微头条

您可能也感兴趣:

今日热点

文明校园 | 葵涌第二小学：足球特色持续赋能 助力文明校园创建-快消息

世界今热点：“大模型应该更懂行业、更易落地”！腾讯云首次发布行...

放榜在即：已有26省份明确将于6月23至26日间公布高考成绩

为您推荐

北京：对涉疫情违法人员要从快依法严肃处理 坚决守好口岸入境防线 全力防范境外疫情输入

军队抽组医疗力量承担 武汉火神山医院医疗救治任务

同马来西亚总理马哈蒂尔通电话 创造更多合作成果，造福两国和两国人民。

构筑起疫情防控的严密防线

更多

更多

排行

精彩推送

今日要闻

当李大海遇上刘知远：知乎和面壁的「大模型」故事环球微头条

文明校园 | 葵涌第二小学：足球特色持续赋能助力文明校园创建-快消息

北京：对涉疫情违法人员要从快依法严肃处理坚决守好口岸入境防线全力防范境外疫情输入

军队抽组医疗力量承担武汉火神山医院医疗救治任务

同马来西亚总理马哈蒂尔通电话创造更多合作成果，造福两国和两国人民。