当前快讯:从星火看大模型中场:祛魅与拷问
厄尔尼诺指数快速增加,史上最热夏天即将到来,但比气候更“火热”的是科技互联网行业的大模型淘金潮。
(资料图)
今年年初,各方大佬下场创业打响了淘金热的*枪,紧接着的是3月开始的大厂扎堆布局,连高校与国家队都争取跑步入场,淘金热愈演愈烈。5月6日,我们又迎来了一位玩家入场,科大讯飞发布旗下认知大模型星火。
兴许是大众与业界对于密集发布的大模型有些“脱敏”,讯飞星火发布的消息未能引起行业的热烈反响。如今的局面其实并不意外,因为商业社会的发展总是需要新的故事。早在今年2月,ChatGPT的出圈就为AI板块的科大讯飞狠狠地拉了一波股价,GPT概念股至今仍广为投资者所关注。
据了解,“星火认知大模型”是纯文本模型,仅支持文本内容的输入和输出,多模态交互需要自升级产品星火Pro获取。而通过TTS(从文本到语音)实现语音提问功能可以说是意外之喜,也是科大讯飞有别于一众大厂的特点之一。
此外,本次发布会与此前各家大模型发布会*的不同在于,科大讯飞CEO刘庆峰为大家“画了一张带有时间线的大饼”:6月9日前,讯飞星火大模型将突破开放式问答,实现对话能力和数学能力的再升级;8月15日前代码能力会上大台阶,多模态交互能力再升级,在10月24日前,星火大模型将对标ChatGPT,在中文能力上超过ChatGPT,在英文能力上与ChatGPT相当。
这是一个管理预期的故事。
回顾近十年的商业新故事,其中既有智能手机、新能源、云计算等光环(aura)加身的神话,也不乏元宇宙、NFT这类被祛魅后步入暗夜的案例。每一个故事在开始之时都宣称将开启一个新时代、新纪元,宏大的叙事为其披上克里斯玛的外衣,等待其进入商业场景后被市场验证。
反观科大讯飞,大模型是它不得不抓住的光环。
大模型是AI赛道重新洗牌的机会已是共识。而且自科大讯飞近年来的业务发展路线看,其引以为傲的语音识别赛道受困于创新者窘境,视觉领域也有AI四小龙后来居上,尝试拓展的智慧医疗、智慧金融业务的表现也只是不够出彩,在2022年整体营收中占比均不足3%。
回归大模型本身,随着迄今为止人类历史上用户增长速度最快的ChatGPT不得不关闭付费渠道,一场属于科技互联网的“西进运动”俨然开始进入中场。
现在我们离GPT还有多远?
LLM(大语言模型)、Token(文本单位)、参数,为4月内几乎未曾间断的大模型发布会所吸引的VC们一面接收这场宝贵的知识爆炸,一面摇身一变成为AI领域的深耕者。按本山大叔的话来说,就是“聪明的智商又占领高地了”。
先行的创业者们早早通过自身过硬的攒局能力拉来了数轮融资,后来的创业者们也在抓紧忽悠风投上车,勇立时代潮头一起吃肉喝汤。
只是直到目前,无论是最早发布的大模型文心一言还是后续开放测试或在发布会上实机演示的大模型都距离ChatGPT存在一定距离,包括5月6日发布的科大讯飞星火。
星火发布会上,刘庆峰现场演示星火的能力并提出了评测大模型的覆盖7大类481个细分任务类型。尽管真机实测勇气可嘉,测试内容出错较少且响应快速,整体的情感理解与逻辑线也都在线,但整体测试类别还是以简单的文字生成为主。这一块基本属于科大讯飞的传统艺能,并不能看出自去年12月起至今近6个月的数据投喂成果。
换句话说,目前的生成内容还无法看出星火达到了智能涌现的标准。不过考虑到科大讯飞的数据要素来源主要在于教育、医疗、汽车等细分领域,目前的表现也就不难理解了。
本次发布会上科大讯飞还展示了星火搭载下的学习机、虚拟人、汽车座舱域智能办公演示,这既是亮点也是槽点。亮点在于星火大模型在诞生之初就已经找到了明确的商业化落地路径,其中教育硬件与办公硬件也是科大讯飞过去两年内的营收主力;槽点在于这几条路径相对于大模型而言显得过于狭窄,可能是星火在测试时所表现出的能力还尚未达到赋能千行百业的水平。
不过,学霸未尝就是未来混得*的。在大模型竞争剧烈的当下,率先占领垂直领域应用的高地并进入自我造血反哺大模型训练的良性循环,未尝不是一条可行的路径。
更值得注意的是,刘庆峰在发布会结束后透露,星火大模型的算力硬件主要由华为提供,当前并未受到限制。
由此我们也不难看出,一是自身是否有算力储备在大模型训练中也许没那么重要,尤其是并不是所有人都将大模型定位于“通用”级别的时候。相反,数据要素的重要性更加凸显,这在当初百度、阿里等坐拥多领域高质量语料的头部大厂发布大模型时尚不明显,如今科大讯飞在教育领域的演示成果与泛领域演示成果的鲜明对比足以说明数据的重要性。
二是“送水人”式的“技术商人”路径在大模型井喷的当下切实可行。一方面送水人可以通过租售算力甚至训练方法,在获利的同时解决算力冗余,另一方面收水人也可以节约大模型训练的成本,杜绝内卷和重复基础设施建设,让大模型相对不再那么“重资产”。
在刘庆峰的规划中,星火将在10月24日达到中文能力超越ChatGPT,英文语料能力相当。且不论对标的是GPT3.5还是GPT4,我们不妨以此时间为节点,到时候再审视国内大模型与OpenAI的差距,是越来越小还是越来越大。
祛魅大模型
讯飞星火的发布从一方面也可以看做是从李开复理解的AI 1.0演进为AI 2.0,是从NPL(自然语言处理)、CV(计算机视觉)到海量数据喂养下具备跨领域知识与智能交互能力的大模型。这是在李开复万字演讲中广为流传的"AI 2.0"范式。
有能力者做通用大模型,稍有欠缺者如科大讯飞,也要根据自有业务线如医疗、教育等场景做规模稍小的大模型。这是一个足够宏大的叙事,尤其是在国内多位大佬呼吁将所有应用接入大模型重做一遍的话术,充满了即刻为一项技术突破迅速找到场景进行商业化落地的渴望。
如今的火热场景我们并不陌生,近年来,我们为了便于传播与理解,往往会以序列号化的话术来形容技术范式的迭代演进。意义建构理论的学者认为,这是将信息的寻求与使用视作一种沟通实践模型,帮助人进行信息接收的做法。
从互联网泡沫后提出的Web1.0和Web2.0到通信领域的4G和5G,以及AI领域,序列号给人以最直白的观感,为我们带来无限的想象空间,这个视角下的技术可以在草蛇灰线之中无限升维演进。越是这样带有技术革命色彩的故事,越是能吸引关注与投资,越具备商业化落地的可能性。
只是能否落地却是未知数,就像大模型涌现现象的发生概率只有0%和100%。
在资深机器学习与应用开发者杨军看来,市场上的“百模大战”与投资圈的狂热是在巨量资源投入后,广谱性质的压强效应所致,但是在这之中不可避免泡沫的存在。“我不太认可在介绍ChatGPT相关技术时引入的春秋笔法或过于PR的味道,总觉得这会把一个原本正常该由技术驱动的事物的演进节奏变得混乱了。关键的技术需要回归到客观层面理解,才更有利于这个方向的健康发展。”
春秋笔法对新生事物的揠苗助长在AIGC前一轮Web3风口中随处可见,尤其是结合了VR、AR后诞生的元宇宙赛道。科技互联网从业者必须铭记的案例是Facebook更名Meta,梭哈元宇宙后的窘境。反观国内,一直以来商业化都是我们的强项,反之也遭到不少缺乏研发耐心、忽略底层技术的诟病。
杨军透露:“我知道的一些这个行业里比较资深的模型从业人士,似乎很多都因为背负了投资方的压力,更多考虑的是商业变现,而不是底层技术的创新和突破。”
在商业化变现前,大模型需要填满的洞有多深?
由英伟达给出的GPT3训练数据,参数规模为1750亿,训练语料为30亿 tokens,那么训练一个周期需要26天,采用租赁方式以8卡A100训练的成本超256万美元/月,即使忽略人力成本,硬件成本*也需要大约2亿人民币一年。杨军称,这已经是很保守的估计,系统故障、策略调整等因素也未曾考虑,人力成本更是在技术创新领域的大头,如果希望提高效率,以并行方式实验探索,那么硬件成本还需追加一倍。
5年时间,25~30亿不计回报的总投入,这是客观技术视角下做好一个GPT4前两代的大模型所需要的准备。这笔研发投入已经接近于半导体了。
杨军对此忧虑颇多,尤其是在风投方面。“在我有限的阅历里,看到了不少风投一开始说支持情怀,随着时间推移,会对变现和寻求接盘退出越来越饥渴,最终以各种方式干预到项目执行层面。不确定性较强的技术攻关遭遇的问题,需要行业层面来克服”。
在技术革命后的*次格局重构中,狂热者往往被浪潮无情裹挟,重重拍在浅滩上。好比去年吸收了数千亿美元的Web3,其大本营新加坡如今已有不少从业者租不起房,吃不起饭。
我们对大模型的畅想究竟是像APUS李涛所言“争夺下一代操作系统的话语权”,还是针对某个具体场景和领域的赋能,亦或是在浪潮之中寻求资金、博取热度,无论哪种都需要让大模型褪去克里斯玛,客观地看待与探求。
大模型也可以小而美
在众人一拥而上的时候,相对冷清的路径反而更有可能成功。
比如在星火上被验证的“送水人”路径,除华为外,字节旗下火山引擎、腾讯云等玩家已在4月这个节点对外明确了自身“送水人”的角色,通过提供算法优化、算力、数据飞轮等技术栈服务来做淘金热中的服务商。路径明晰竞对少的同时还可以一定程度上“分摊”大模型的训练成本。
这条商业路径早在淘金运动中便已验证,但成功故事的背后是淘金运动的“内卷”特性,才会诞生服务的需求空间,同时“送水人”还需要在这种上游配套式或衍生周边式服务中占据垄断地位。“送水人”亚默尔原本只是平平无奇的淘金者之一,直到他*时间抓住了淘金者对水的需求并通过开挖水渠的方式打造了一个专属于他自己的饮用水生产线。
在如今的大模型中局,时间问题无需考虑,也不存在有谁能在某项服务中能占据垄断地位。那么讨论的重点便在于其提供的服务。
大模型的服务需求则可以用AI三要素来概括,分别是算力、算法与数据,其中算力是相对最缺乏竞争力的领域。因为算力在淘金者的视角下仅仅只是成本,而在送水人的视角下却是商品,单纯提供算力难免会陷入价格战的怪圈,反过来掣肘自己的大模型训练。
算法与数据则与此相反,两者均可以提高大模型的训练效率,甚至直接影响训练成果。只是长远看来,这两项服务的前景也不甚乐观。
算法方面,OpenAI就是*的例子,被开发者戏称为“CloseAI”的原因之一便是其坚持闭源。大模型训练中的策略、算法是可以作为企业护城河的核心资产,“送水人”开放给外界使用的程度将直接关联自家大模型的竞争强度,数据方面也是如此。反之,购买大模型服务的企业也会要求算法与数据的安全,争取在“安全线”之下有限的互帮互助。
目前看来,“送水人”们除非退出通用大模型的竞争,否则送水的动作也很可能只是在成本控制上的锦上添花,真正的“送水人”还得是英伟达。这也意味着,我们需要另寻更切实的路径。
日前,OpenAI关闭付费渠道已在业内引起不小的讨论,最有可能的原因是GPT4在接入微软全栈应用后算力吃紧,只能暂时放弃C端增长来稳住大金主。而OpenAI联合创始人兼CEO Sam Altman更是公开表示OpenAI已接近LLM的极限,认为LLM的规模不再是衡量模型质量的重要指标,未来将有更多的方式来提升模型的能力和效用。
换句话说,大模型中场之际,OpenAI在否决了一昧追求规模的路径同时为行业指出了大模型的迭代新路,即通过优化训练策略、全局调度以减少投入成本,同时将笨重的大模型转向小而美的方向发展。
杨军对此颇有研究,并对此介绍了部分海外已经开始的创新案例。
关注系统优化并结合模型训练策略进行全链路训练优化的公司MosaicML提出,通过将参数降低至300亿同时将Token数提升至61亿,以256张40GB的A100为资源训练一个周期,只需要36天即可得到与GPT3相同质量的训练结果,而成本仅需要88万美元,几乎是GPT3原始训练成本的三分之一。除了训练策略的优化外,通过对CPU主存+磁盘外存+GPU显存的使用进行全局调度优化,让低端显卡serve大模型成为可能。
“一款AI框架解决的其实是上层的业务模型需求到底层计算硬件执行的映射问题,在性能足够的情况下,仅拼性能就可能陷入了‘技术有深度但竞争呈红海’的战场。”
为了避免这样的竞争,不少大模型在推出时便在宣传上做了一定的区分,关键在于是否存在“通用”二字。这其中有源自NPL基底并在数个领域直接落地的星火、根植办公场景的金山“WPS AI”、立足于问答社区生态的知乎“知海图AI”等,其共同点在于针对具体场景,以对行业的纵深理解与数据支撑为基础,以大模型的“涌现”能力为跳板,实际上却是披着通用大模型外衣的中小模型。
送水人也可以参考这样的“技术商人“的思维。在杨军看来,与其参与无谓的hardcore“内卷”,不如去思考自己的技术点在可以在完整商业链中发挥什么功能,完成什么闭环,通过能力与方向的差异化发掘更多价值。
保持一个啃硬骨头的决心,开阔技术商业化的视野,是大模型玩家们的必修课。相对追求规模,我们与海外在小而美方向上的研究反而在时间节点上更相近,这也意味着更大的机会。无论是预算与资源相对紧张的创业公司还是有底气随时掏出数千张A卡的大厂,都需要认识到这点。
标签:
您可能也感兴趣:
为您推荐
军队抽组医疗力量承担 武汉火神山医院医疗救治任务
同马来西亚总理马哈蒂尔通电话 创造更多合作成果,造福两国和两国人民。
构筑起疫情防控的严密防线
排行
- 腾龙股份股东王柳芳减持302.01万股 价格区间为14.81-15.90元/股
- 因个人资金需要 新泉股份实际控制人唐志华拟减持不超1124.54万股
- 信捷电气股东邹骏宇减持50万股 价格区间为60.41-67.50元/股
- 国家卫健委:湖北以30个省外新增病例17例
- 因自身资金需求 科森科技股东徐宁拟减持不超3.71万股公司股份
- 中公高科股东潘玉利减持50万股 价格区间为20-20.60元/股
- 多地患者治愈后“复阳” 对疫情防控提出新挑战 五大焦点权威解析
- “精诚合作,打赢这一仗!”
- 生态环境部:自1月20日以来全国已累计处置医疗废物12.3万吨 ...
- 承诺两年扭转乱象 银保监会加快推进意外险费率市场化改革 ...
精彩推送
- 当前快讯:从星火看大模型中场:祛魅与拷问
- 我不想潦草地告别新冠
- dnf推荐地下城通关次数最多的人_dnf推荐地下城
- 我国海洋经济复苏态势强劲
- 全球信息:1057.70亿元!淄博最新发布
- 东莞横沥召开2023年第一季度经济形势分析会
- 全球今日报丨教育部:中小学教材不得夹带商业广告
- 387.53万㎡、新建11所学校!广州黄埔枫下村旧改规划方案出炉|独家
- 宜宾最新人口统计出炉,6年增加14.2万人|全球速看
- 招商宏观:4月制造业投资动能有所减弱 服务消费有望成为新增长点
- 节后机票价格大“跳水” 错峰出游花费可省三成多
- 每日关注!2023年一季度黑龙江各市GDP排行榜 哈尔滨排名第一...
- 全球快消息!宽带收费合同范本(汇总13篇)
- 将假期交给一个“小”地方 “下沉式旅游”热度初显-新要闻
- 全球关注:中国电力企业联合会:预计二季度全国电力消费增速...
- 全球快看点丨中央选定惠州建珠三角中心城市,真实的惠州有多...
- 前4月我省外送电量同比增长238.8%
- 下周关注丨4月CPI、PPI等数据将公布,这些投资机会最靠谱
- 【全球时快讯】国泰君安:货币政策渐趋稳健 5月流动性平稳偏宽
- 环球热议:朱民、李稻葵、黄奇帆、刘元春最新发声!
- 鳄龟怎么养凶猛_鳄龟怎么养
- 热头条丨广东2023年高考时间定了!这3门科目使用全国卷
- 世界快资讯:广泛开拓就业渠道!教育部2023年这么干→
- 电脑复制不到u盘win8-(电脑不能复制到u盘)
- “倍加珍惜爱护优秀企业家”,才能壮大民营经济
- 焦点热门:一季度同比增长1.4% 贵州工业经济平稳运行
- 环球即时看!安徽省属企业一季度营收大幅增长
- 金价大涨12%:消费者疯狂“囤货” 黄金行业赚翻了
- 环球微头条丨江苏十三市成绩单出炉:6市GDP超过2000亿元,扬州第十
- 专访黄资婷:从多引擎战略到lifestyle论宏碁发展模型|新资讯
- 全国人均存款曝光,老百姓普遍没钱,高额存款都是谁的?
- 全球聚焦:我国海洋经济复苏态势强劲
- 热点!2023年五一节,国内消费市场情况如何?哪个城市第一名?
- 重庆集聚新动能释放发展活力_环球看热讯
- 鬼子走着瞧共有几集(小鬼子走着瞧高清完整版下载)
- 环球关注:36.2亿元!
- 环球热议:2023年一季度甘肃省各市(州)GDP排行榜:庆阳首次超千亿
- 天天热点!交通枢纽商业消费如何巩固恢复性增长
- 200亿撬动1000亿?看湘江新区如何“进击”
- 2023年一季度安徽省各市(州)GDP排行榜:合肥稳居第一-全球快播报
- 【天天时快讯】24座“万亿之城”一季报:12城GDP增速超全国,...
- 广州大学与英国剑桥大学菲茨威廉博物馆签署合作备忘录|全球实时
- 教育系统开展“访企拓岗促就业”行动 新开拓就业岗位250余万个
- 每日快播:一季度少卖出4500万部,全球手机市场怎么了?
- 【全球热闻】曾皙后句式_曾皙后的后词类活用
- 海南交通事故赔偿律师收费明细-环球播报
- 田轩:中国经济增长短期靠消费长期靠创新 民营经济是重要抓手
- 【世界新要闻】中国驻菲律宾使馆协同菲执法部门开展案件办理
- 绿视界丨4月份中国大宗商品指数回落,专家预计5月份环比将回升
- 世界热资讯!美国银行业动荡风险仍会持续 今年中国经济关键...
- 多项主要指标增速位列全省第一!东营全市经济实现首季"开门红"
- 我国老百姓真实收入,可能颠覆了你的想象!内行人:实在是可...
- 秦刚:打造更加紧密、友好的邻国和伙伴关系
- 今年一季度我国海洋经济稳中有进,海洋客运量同比增长87.8%
- 全球看热讯:一季度义乌市实现规上工业产值415.7亿元
- 潍坊市委书记刘运:倾力支持民营经济走好奋进路-焦点信息
- 观热点:如何理解当前中国经济发展 三位经济学家吐真言
- “人口问题”显现!有人提议:富人多生,穷人少生,避免浪费...
- 金融助力深圳新能源汽车产业跑出“加速度”
- 广东2023年高考时间定了,3门科目使用全国卷
- 科大讯飞全球首款认知大模型AI学习机T20系列重磅发布 环球新资讯
- 深技大附中饭堂门口多出了一架钢琴,咋回事? 天天最资讯
- k线中的上下影线代表什么意思_上下影线k线组合
- 天天快讯:数字人民币推广不断加速,或改变支付生态
- 江苏13市一季度成绩单出炉!连云港GDP同比增长9.5%,位居全省第一
- 当前通讯!外资热议中国经济复苏,将从这些方面寻找超额收益
- 解读|以人口高质量发展支撑中国式现代化:推进教育强国,向...
- 紫荆观察丨“五一”消费浪潮彰显内需市场活力 全球热文
- 精彩看点:“五一”后出境游机票降价,旅客已开始抢订端午机票
- 5分钟“茶从天降”!奈雪的茶联合美团提供无人机配送服务
- 飞龙股份(002536.SZ):目前没有回购计划 每日视点
- 全球金融风险上升?中国拼经济稳增长怎样干?朱民、李稻葵、...
- “加码”数字经济 越城在下一盘什么棋?_当前简讯
- 聚焦中国假日经济“成绩单” 外媒称中国经济复苏势头可喜
- 国际金融论坛在港举办研讨会 聚焦香港与全球化-简讯
- 管涛:建议维护对外融资和对外资产安全
- 全球最新:南明区:开展林长巡林 保护生态资源
- 全球报道:联想创投共同发起“光明计划”,携11家被投企业造访...
- 投资界LP周报(14起动态)| 安徽500亿;湖南300亿;又一超级...
- 谁是00后手机里的「BAT」? 当前快报
- 一年进账超20亿元,宁德时代又撑起一个IPO
- 新闻发布:2022年滨州市数字经济核心产业实现营收175亿元,同...
- 李稻葵谈促消费:在支付端给老百姓补贴,不要限定产品、行业
- 嘉兴经济运行交出优异答卷
- 刘元春:货币政策要想真正浸润到微观主体,必须要纠正利率“...
- 世界视点!“五一”假期 闽清北站发送旅客6733人
- 和光微完成近千万元种子轮融资,合肥市科创集团种子基金投资|...
- 逆势增长的iPhone,「保住」了苹果的脸面|全球速看
- 德清经济一季度“成绩单”公布 总体平稳开局 承压向好
- 送快递这件事到底体不体面?
- 【榜样力量】徐世达:实干担当,使命必达,用匠心铸就“轨道...
- 全球首例,南开大学完成介入式脑机接口非人灵长类动物试验-观察
- 我在淄博吃烧烤:排队九小时,差点露宿街头 世界实时
- 喜报!四专利获省级奖 视焦点讯
- 天天通讯!杭州“五虎将”要重组?
- “五一”假期掀消费热 多项数据创新高带动中国经济回暖-世界热讯
- 一季度跨省异地就医减少个人垫付268.75亿元
- 清华大学五道口金融学院副院长田轩:中国经济要回到潜在增长...
- 焦点热门:直击鲲鹏昇腾开发者峰会2023:昇腾AI面向人工智能三...
- 宁夏将进一步深化贸易金融联动机制-短讯