首次开源这一强大算法,我们向Meta致敬
Facebook改名Meta后,“财务厄运”并未因此终止,但技 术作风却一如既往的大胆。
虽然自2022年2月以来,公司股价已下跌30% ,市值损失超过2500亿美元。但是,这并没有影响开发者们的精神世界与工作动力。
本周,来自Meta一小撮程序员的疯狂举动,在全球AI开发者群体中引发了巨大骚动——
Meta AI 实验室高调宣布,将开放自己的语言大模型 OPT(Open Pretrained Transformer,预训练变换模型),毫无保留地贡献出所有代码。
不夸张地说,在人工智能圈,这算得上是一个里程碑事件。
这个被称为OPT的大规模语言模型,自建立以来,各项参数与能力便精准对标OpenAI 的GPT3,甚至连缺点都是。后者在全球学术界建立的赫赫声望和随处可见的网络小说续写作品,想必已不必再过多赘述。
简而言之,这是一种利用巨量网络文本与书籍进行训练,可以将单词和短语串在一起组成精彩文本的深度学习算法模型。
它能生成复杂句子,有时候甚至读起来与人类撰写毫无无异(想粗浅了解GPT,可以看这篇《让00后疯狂的超级算法》)。某种程度上,它所具备的神奇人工文本模仿能力,被视为人类通往真正机器智能道路上的一个巨大突破口。
GPT3生成的文本
然而,“培育”大模型的代价,是昂贵的人力成本与成千上万块显卡。因此,许多学者都认为,把这种大模型开放出来,几乎不可能发生在“游走在垄断边缘”的大型科技公司身上。
譬如,OpenAI 的GPT3曾被专家粗略估算过,至少投入了1000万美元。他们后来为了摆脱入不敷出的现状,将GPT3作为一项付费服务来推广——只提供API,但不会开放模型本身和底层代码。
然而,Meta表示,会把不同参数规模的训练模型以及“OPT如何建造和训练”的详细信息分发给研究人员。
其中,也包括一份超过100页的算法训练日志——实验室记录下的每一个错误与崩溃现象,训练和添加数据的过程,以及有效与无效策略。
“考虑到计算成本,如果没有大量资金,这些模型很难复制。对于少数通过api可调用的模型(这里暗指GPT3),如果不能获得完整的模型权重,就难以进行研究。”他们在OPT的论文摘要里鲜明表达了态度,
“因此,我们推出了OPT(这是一个只有解码器的预训练变换模型),参数范围从125M到175B,目标是全面且负责任地分享给感兴趣的研究人员。”
“是真的开放。”
一位“正准备去看看他们实现情况”的中国开发者查阅了MetaAI网站后,告诉虎嗅,这的确是一个好消息。“从现有数据来看,整个训练代码都被贴出来了。Meta很了不起。”
擅用集体力量
这一次开源,毫无意外受到了学术界的高度认可,甚至有科学家称其是一个伟大的举动。
究其原因,一方面,一项强大技术,如何在一个封闭的企业精英团队中诞生,一直是包括学界在内大众好奇的焦点;
另一方面,“开源”的优势在于利用集体力量来解决问题,因此长期被硅谷的有识之士所倡导——更多人参与进来,技术突破便来得越快,漏洞便填得越快。
尽管大部分人几乎只记住了GPT3(因为它是迄今为止最好的“通才”),实际上,除了Meta,谷歌、微软都曾在2020年都推出过相似的大模型,但由于都是“关起家门”做私密研究,因此在“透明度”方面饱受诟病。
譬如,2021年的“谷歌人工智能伦理学科学家辞退事件”便引发了长达一年的“批判海啸”,而这一切都是因一篇探讨“语言大模型暗藏重大隐患”的论文而起。
没错,GPT3们不仅缺陷多多,而且非常致命。尽管多数责任应归咎背后的人类文本。
创业公司 Latitude 曾在2019年推出过一款基于GPT3开发的半开放冒险游戏 AI Dungeon。但没想到,随着用户增多,OpenAI监测到,有玩家竟然利用这项高阶技术,自发生成儿童性爱场景。
虽然用户利用GPT3生成的污言秽语也曾遭遇过广泛抨击,但这件事仍然让大众哗然。这也是外界第一次意识到,GPT3这类大模型更为深刻的阴暗面。因此,Latitude增加了审核系统,但却引发了与用户体验相关的一系列麻烦。
然而,“越是危险,越不能回避危险”。这也是Facebook自称选择开放的关键原因之一。
Meta AI 负责人Joelle Pineau承认,团队解决不了所有问题,包括文本生成过程中的伦理偏见和恶毒词句。因此,他们诚邀天下豪杰,共同学习;而实际上,这也是一种彼此监督。
“我认为,建立信任的唯一途径是极端透明。”
我们查看了Meta提供的下载通道,发现实验室根据每个模型的参数规模设立了不同的下载条件:300亿参数以下可随意;而1750亿参数值模型,也就是与GPT3大小相同的OPT,则需要填写申请表证明用于非商业用途,获得批准后方可下载。
翻过大山,仍然是山
当然,理论上这个做法是可圈可点的,但一个更大的问题出现了:如果你要使用这个1750亿参数值的大模型,就意味着你的计算机要带得动它。
换句话说,你需要拥有足够的算力,这里可以直接换算成“财力”。
“一个参数如果是FP32,也就是4个字节大小。而1750亿参数值则相当于7000亿字节,大约700G显存空间。而现在一张普通显卡是20GB。” 一个开发者向虎嗅称赞了Meta的做法,但他认为,对于普通开发者群体,该模型仍然是不可承受之重。
“虽然可以把不同参数放在不同显卡里的框架里,但据个人体验,目前仍然欠缺开源成熟的框架。”
因此,截至目前,这个开源大模型,仍然是属于大型科技公司、拥有充足资金的大型实验室与学术机构的“内部游戏”。
曾有家尝试做中国版GPT3的创业公司叹息说,他们也在想方设法实现GPT3可以实现的文字能力,但的确掣肘于有限算力。
事实上,除了巨头,GPT3一直难以解决的商业化难题,是让绝大部分企业呈观望之势的根本原因。尽管大型语言模型已成为过去几年来人工智能领域最热门的趋势之一。但至少目前来看,除了品牌营销优势,OpenAI 的投入产出比,很不尽如人意。
图片来自MIT
此外,在西方社会普遍认知中,比起技术突破,它们带来的巨量能源消耗更是一种原罪。
科学家Emma Strubell与合作者在2019年发表的论文,就揭露了大型语言模型在碳排放上超乎想象的环境破坏力(上图)。
他们发现,用一种神经结构搜索方法(NAS)训练出的特定语言模型,可产生284吨(626155磅),上图)二氧化碳,这大约是5辆小轿车长达5年的排放总量;
而谷歌搜索引擎的基础——BERT语言模型训练,则产生了0.65吨二氧化碳,Strubell提醒,这相当于一个乘客从纽约到旧金山往返航班的碳排放量。
更需要注意的是,这些数字都应被视为“最保守数值”:只是在一次性训练中的模型成本。
因此,考虑到能源效率与环境成本,西方不少科学家与开发者认为,某种程度上,大模型的训练开发也是在允许大型企业掠夺着环境资源,而这些成本,将会平摊在所有人身上。因此,他们并不希望企业加入到大模型队列中。
“尽管是无意识的,但这只会加大对边缘人群的打击。”
开源商业回报,巨大且无形
很多时候,人们会对开源模式发出这样的质疑:
有什么能比“两个来自竞争对手公司的员工,可以为同一个目标协作,还免费送出自己成果”更不可思议的事情?
譬如,可能连小学生都清楚的安卓系统,就是基于开源的Linux操作系统。这意味着,任何人都可以查看绝大多数安卓手机的核心代码,修改并分享它。
事实上,“开源”正是为不同利益群体,提供一种“利远大于弊”的长期技术合作方式——你增加的独特元素我能使用,那么我迭代的版本你也不会错过。
这种“互利”态度,让看似不可思议的“协作”成为可能,经过100多年来的反复修正,早已成为一种常态。如今,Linux 就是由全世界超过15000名程序员共同开发和维护。
而在人工智能领域内,最有名的案例则是谷歌的深度学习开源框架Tensorflow。它已是开发人工智能应用程序的标准框架之一。非常有趣,当Tensorflow在2015年开源时,外界也是发出了跟这次Meta开源大模型同样的疑问:
作为开放者,谷歌为什么要放弃对自己搜索业务如此重要的东西?
一部分原因上面讲过——外部开发人员把软件做的更好,该软件就能适应谷歌未来商业化的很多需要。就像当下,大模型商业化还尚不明朗,那么前期工作的开放性与主导性,就变得至关重要。
根据谷歌自己公布的数据,已有超过1300名外部人员在TensorFlow上帮助升级迭代。而完善后的Tensorflow,则为谷歌云上的相关付费服务输送了强力支持。
另外,我们永远不要小看开源软件为企业带来的巨大营销价值。
它最一流的“带货效果”,便是吸引和留住一众顶尖人才,不知道为大厂省下多少高昂的人力资本。这也与当下Meta开始收缩招聘规模的现状,做了完美呼应。
当然,优秀开源软件打的时间差和聚拢效应,将会使后来者很难在短时间内形成气候,Tensorflow与一众国产深度学习开源框架的往事就是最好的例子。
因此,Meta这一决定,将会让OpenAI陷入一个尴尬的境地——虽然名声很大,但它毕竟是一家创业公司。从另一个角度看,在寻找商业落地的过程中,大厂通过开放、免费等手段遏制对手,取得胜利,这种事情似乎永远都在发生。
但好处在于,这会让一家公司意识到,在商业世界,没有一分钟时间可用来顿足,绝不能停下创新的狂奔步伐——近期他们发布的达利系统第二代,也许是以GPT3为跳板,向文字与视觉融合方向跃升的最好标志。
标签:
您可能也感兴趣:
为您推荐
丰田金融服务,二手车消费的放心之选
奔赴向往之地!捷途X90 PLUS让家充满爱
人性化的人车交互 解析捷途X70诸葛版智能座舱
排行
- 腾龙股份股东王柳芳减持302.01万股 价格区间为14.81-15.90元/股
- 因个人资金需要 新泉股份实际控制人唐志华拟减持不超1124.54万股
- 信捷电气股东邹骏宇减持50万股 价格区间为60.41-67.50元/股
- 国家卫健委:湖北以30个省外新增病例17例
- 因自身资金需求 科森科技股东徐宁拟减持不超3.71万股公司股份
- 中公高科股东潘玉利减持50万股 价格区间为20-20.60元/股
- 多地患者治愈后“复阳” 对疫情防控提出新挑战 五大焦点权威解析
- “精诚合作,打赢这一仗!”
- 生态环境部:自1月20日以来全国已累计处置医疗废物12.3万吨 ...
- 承诺两年扭转乱象 银保监会加快推进意外险费率市场化改革 ...
精彩推送
- 首次开源这一强大算法,我们向Meta致敬
- 露营经济兴起:去年2万家企业入场,今年4家获投资
- 变质蜜瓜被曝做成水果切!百果园IPO遭遇当头一棒
- 抖音上市,估值几何
- 「迷你仓」背后:年轻人尝鲜,创业者开荒
- 砍权益、送软件,小鹏的促销你学不会
- 海底捞「越界」
- 刚刚,欧莱雅在华成立首家投资公司
- 一切好运,从被大厂辞退开始
- 居家办公,我被公司用摄像头「盯梢」
- 字节跳动成立抖音集团,或在香港上市
- SHEIN,值不值1000亿美元
- 小米的印度危机
- 马斯克三把火烧向推特这支「烟屁股」
- 交通银行外汇牌价一览 5月7日交行人民币汇率多少?
- 刘畊宏,一个人打赢了整个Keep
- 大佬发迹史之红衣教主:中国互联网界最能打的人
- 招商银行外汇牌价表5月7日 招行人民币汇率多少?
- 光大银行外汇牌价表5月7日 光大银行人民币汇率多少?
- 建设银行外汇牌价表5月7日 建设银行外币汇率多少?
- 初夏到了,环球影城却还在寒冬
- 浦发银行外汇牌价实时查询 5月7日浦发银行人民币汇率多少?
- 五菱「背叛」打工人?
- 谁还喝香飘飘
- 电子浆料行业概念股票一览 苏州固锝5月6日资金净流出292.59万元
- 互联网零售行业龙头股有哪些?苏宁易购5月6日主力资金净流流出...
- 2022年传媒娱乐概念龙头股有哪些?分众传媒2021年营业总收入148.36亿
- 园林概念股有哪些?ST花王 2022年第一季度实现总营收4479.04万元
- 2022年供汽概念股一览 海联金汇涨0.26%
- 电力龙头股有哪些?中国广核近3日股价下跌2.17%
- 2022年电商平台概念股有哪些?三木集团2022年第一季度营业总...
- 家电电机行业概念股有哪些?长鹰信质5月6日资金净流出324.47万元
- 2022年万达概念股有哪些?优博讯近7日股价上涨10.36%
- 空冷系统行业概念股票有哪些?哈空调2021年资产负债率63.86%
- 2022年智能水表概念股上市公司有哪些?三川智慧2022年第一季...
- 存储上市公司股票有哪些?兆易创新2021年营业总收入85.1亿元
- 2022年质结电池设备概念股票有哪些?捷佳伟创5月6日成交量6.41万手
- 广州地铁5天假期客运量最高为三号线467.8万人次 其次为二号...
- “五一”小长假 广东银行卡消费金额超610亿元
- 广东省营商环境综合改革试点任务全面完成 汕头获评全国标杆
- 澳元对人民币汇率多少 5月7日澳元汇率走势图
- 周末英镑对人民币汇率多少 5月7日英镑汇率查询
- 虚拟主播,困在二次元
- 蓝翔「宫斗剧」发酵,孔素英:我死都不怕了
- 游戏的价值,可能被严重低估了
- 人民币对南非兰特汇率查询 5月7日100人民币等于多少南非兰特?
- 瑞士法郎兑换人民币汇率走势 5月7日瑞士法郎汇率查询
- 新西兰元兑换人民币汇率多少?5月7日新西兰元今日汇率一览
- 在线健身,谁来接棒刘畊宏
- 大佬们的下一站,奋斗在直播间
- 人民币对日元汇率今日价格(5月5日 更新)
- 人民币对澳元汇率今日价格是多少 5月5日100人民币等于多少澳元?
- 人民币对英镑汇率今日价格是多少 午后100人民币等于多少英镑?
- 人民币对美元汇率下跌 5月5日午后100人民币等于多少美元?
- 从二次元到元宇宙,IP商业正被重塑
- 人民币对欧元汇率是多少 5月5日100人民币等于多少欧元?
- 湖南新五丰产业并购二期基金完成基金备案
- 百子湾寻找下一个支点
- 璞玉投资并购危险品物流公司「闵东物流」
- 互联网大佬直播间「再就业」
- 亿联银行快速上线数字化解决方案助力打通物资保障“生命线”
- 众邦银行:践行普惠金融助力小微企业“最后一公里”
- 数千亿元“现金红包”陆续发放 上市银行分红方案全部揭晓
- 私人银行业务分化明显 中小银行如何寻找新突破口?
- 5月1日起实施 小客车登记全国“一证通办”、信息联网共享核查
- 国内首个 百度小马智行获批“无人化载人示范应用通知书”
- 换电“朋友圈”再添新玩家 宁德时代与爱驰汽车联手开发组合...
- 新能源汽车保有量增加 未来新能源汽车后市场将迎一片“蓝海”
- 新能源汽车下乡再迎政策东风 2021年新能源汽车下乡车型销量...
- 罗莱生活:床上用品上市公司龙头 5月6日跌1.28%
- 2022年化妆品概念股有哪些?联环药业近五年净利率均值为8.16%
- 2022年自行车出口概念股汇总 信隆健康跌1.12%
- 零食上市公司龙头有哪些?良品铺子近三年营业总收入均值为83....
- 5月6日收盘回顾:减速电机概念报涨 新宏泰领涨江南奕帆
- 5月6日收盘简讯:正级材料概念报跌 容百科技领跌
- 氯碱化工概念股龙头股票有哪些?沈阳化工2021年公司营业总收...
- 固废处置上市公司有哪些?高能环境7日内总市值上涨了17.37亿元
- 医用氧板块上市公司2022年有哪些?ST和佳2020年实现营业收入9.3亿元
- 5月6日收盘要闻:红外技术概念收盘报涨 富吉瑞领涨
- 2022年净水概念股有哪些?日出东方近5日股价上涨11.24%
- 2022年铬行业股票龙头有哪些?五矿发展2021年总营业收入875.11亿
- 2022年智能交通概念股:合众思壮跌0.51% 皖通科技下跌
- 2022年通信运营商概念股汇总有哪些?瑞斯康达2020净利率6.97%
- 5月6日农业种植概念报跌:厦门象屿领跌 泸州老窖、新赛股份等跟跌
- 2021年第四季度铁矿龙头股一览 海南矿业2021年第四季度净利润-1.03亿
- 2022年智能驾驶概念股一览 中科创达3天上涨11.8%
- 苏奥传感、泰山石油和浩物股份:2022年燃油概念股名单
- 优化口岸营商环境 惠州海关推出六条措施巩固外贸增长势头
- 线上广交会火热进行中 广东企业加快寻求外贸新增长点
- 广东荔枝“12221”市场体系建设暨荔枝促销视频会举行
- 一季度广东居民人均消费支出8393元 同比增长4.6%
- 一季度广东银行业总资产32.95万亿元 同比增长8.66%
- 上千万尾虾苗的“包机”之旅:航班骤减急坏养殖户
- 江门市首个“金融前线服务器”揭牌首批进驻5家银行机构
- 2021年广东农业总产值和增速均创1987年以来的最高水平
- 广州港南沙汽车口岸迎来首条滚装南美准轮航线
- 2022年航空新材料概念股有哪些?新疆众和2022年第一季度实现...
- 5月5日厦门钨业涨1.21% 安泰科技股价上涨3.84%
- 电子制造概念股龙头有哪些?工业富联5日内股价上涨4.27%
- 2022年口罩防护概念股一览 奥美医疗5日内股价上涨12.56%
今日要闻
- 存储上市公司股票有哪些?兆易创新2021年营业总收入85.1亿元
- 2022年质结电池设备概念股票有哪些?捷佳伟创5月6日成交量6.41万手
- 数千亿元“现金红包”陆续发放 上市银行分红方案全部揭晓
- 2022年智能驾驶概念股一览 中科创达3天上涨11.8%
- 线上广交会火热进行中 广东企业加快寻求外贸新增长点
- 数字绘画概念上市公司有哪些?汉王科技5日内股价上涨0.57%
- 5月5日尾盘制动器概念报涨 华域汽车领涨
- 首届国际茶文化节“宝船奖”公布潮州单丛茶获金奖
- 4月28日农银工业4.0混合基金市场表现如何 2022年第一季度基金行业配置如何?
- 截至4月28日圆信永丰兴源混合A基金市场情况如何? 基金详情介绍