端侧AI,如何化解国内算力之困?
解决了算力之困后,端侧大模型将有可能*引爆本轮AI革命的盈利点。
算力和数据的天花板,决定了本轮的AI热潮究竟能走多远。
但不幸的是,对国内而言,其中的算力天花板,离“到顶”已经越来越近。
(资料图)
就在8月初,美签署最新行政令,禁止美国对中国计算机芯片等敏感技术进行一些新投资,重点将在限制美国资本对于中国半导体设计软件和制造硬件的投资。
此消息一出,不少人顿感:国内算力危矣!
而机警的大厂,也开始了各自未雨绸缪的准备。
《金融时报》的一篇报道称,国内包括阿里、字节在内的科技巨头,已经订购50亿美元的英伟达的A800芯片,来面对训练大语言模型需要的算力挑战。
按照此前媒体报道,目前中国企业GPU芯片持有量超过1万枚的不超过5家,拥有1万枚A100的至多1家。
那么,在愈发紧张的算力之下,中国AI的前途、命运将如何发展?
短期来看,算力之困对于业内,似乎是个无解的问题。然而,技术的发展,有时就像生物的进化,当一种技术在面临“生存挑战”时,也会由于选择压力而发生一系列的突变。
而对国内而言,这样的突变方向,也许就是分散于各个终端里的端侧大模型。
1
端侧大模型,如何解算力之困?
端侧大模型的发展,对国内算力突围有着怎样的意义?这还得从目前云计算的需求说起。
当下,面对大模型高昂的算力成本,许多致力于涉足AI领域,但却算力匮乏的企业,往往都选择了租用云算力的方式,来满足训练需求。
在此背景下,昇腾AI集群这样的云服务平台也趁势而起,成为了孵化国内各个大模型的“母工厂”。
然而,即使是云计算本身,也需要大量的GPU支撑。
如果云服务商无法获取足够的GPU资源,那么它们也无法为国内AI企业提供高效、可靠的云计算服务。
而端侧AI最重要的意义,就在于分担了目前国内云计算的压力。
倘若我们将十几亿分散的智能手机,当成了一个个潜在的、拥有大量闲置算力的移动计算单元,那么部署在手机中的端侧AI,就能在这些设备闲置时间里,将这些碎片化、分布式算力利用起来,产生颇为可观的规模效应。
具体来说,联邦计算,就是这样为人熟知的分布式计算方式之一。
所谓联邦计算,简而言之,就是在数据源(例如用户设备)上进行模型的局部训练,然后将这些局部模型的参数或更新聚合到中央服务器上,形成一个“全局模型”。
相比于集中式的训练,这种分布式的方式可以更好地利用各个设备的计算能力,降低中央服务器的算力需求。
在这样的过程中,依靠终端设备(例如手机)的庞大数量规模,每个“全局模型”的训练成本,在无意中便被不断摊薄了。
因为每个“小模型”的训练只需要消耗端侧设备的计算资源,而不需要传输大量的原始数据到云端。这样,就可以节省网络带宽和云端存储空间,也可以减少云端服务器的计算压力。
更重要的是,与云端GPU这类高成本的训练方式相比,由于端侧AI芯片往往是针对特定的AI应用和算法,进行优化和定制,因此其往往有着相对更明确的“回血”途径。
例如,前段时间,爆火的妙鸭相机,大家应该都听说了。在其最受追捧的初期,成千上万的用户涌进应用中,高峰期一度有4000-5000人排队,需要等待10多个小时才能出片。
之后,是阿里云进行了紧急扩容,才勉强应对了这暴涨数百倍的算力需求。
但倘若用户不用在云端等待,而是直接在本地,或者通过端云协同的方式,就能实现这样的生成效果呢?
一种可能的方式,是先在端侧生成低分辨率的图片,之后再上传到云端,用较少的资源对图片进行清晰化处理。
如此一来,既降低了云端算力的负担,又在一定程度上保障了生成的质量、效率。
在当下的AI应用开发中,开发者不仅需要支付云端大模型API接口的成本,还得自己租用服务器,保证密钥安全。
如果是文字生成类AI,文字量大的话,相应的token也是一笔不小的开支。
而随着算力门槛的降低,众多AI应用的开发者,将不再被云端算力的成本所缚,而只需调用端侧大模型提供的开放API,就可以快速开发各类AI应用。
在此基础上,一个开放的、多样化的AI应用生态,就随着端侧大模型的普及,而应运而生了。
2
以“偏”补“全”的端侧芯片
AI应用井喷的时代似乎近在眼前,但要想让每台手机都标配一个大模型,前面还有道难以回避的门槛——硬件基础。
由于芯片架构不同,在端侧部署时,往往需要对模型网络结构进行一通修改才能勉强“上车”。
具体来说,目前GPT这类主流AI所使用的Transformer架构,往往部署于云端服务器。
这是因为GPU对于MHA结构(Transformer中的多头注意力机制)计算支持更友好。而端侧AI的芯片,则主要侧重于CNN(卷积神经网络)的结构。
如果将前者强行转移到端侧,带来的一个明显问题,就是模型精度下降。
那么有没有什么办法,能让大模型在进行端侧化改造的同时,仍能保证其精度呢?
爱芯元智推出的端侧芯片AX650N,似乎提供了一个可能的路线。
AX650N芯片拥有自研混合精度NPU和爱芯智眸AI-ISP两大核心技术,其对Transformer结构的网络进行了专门的优化,在其NPU中增加了专门用于自注意力计算的单元,可以大幅提升Transformer网络的运行速度和准确率。
凭借着这类针对端侧的优化技术,AX650N已经做到了在端侧部署原版Swin Transformer只需要5分钟,而跑起私有模型,只要1个小时就能搞定。
但尽管如此,受限于架构和内存,这样的优化,仅仅只是针对视觉大模型方向而言的,因为从硬件算力上来说,端侧AI芯片,始终难以做到GPU芯片那样“面面俱到”的通用性、兼容性。
既然如此,国内的大模型之困,是否就指望不上它了?
其实不然,从量的角度来讲,边缘侧、端侧的需求一定比云侧更大,毕竟边缘侧、端侧设备会更多。
而在这众多的需求中,只要使用了大模型的终端(如手机、智能音箱),能做到两点,那么国内大模型在应用层,就有盘活的可能。
其中*点,就是够降低人们获取信息、知识的成本。
倘若以后人们打开手机或者其他终端,就能获得一个诸如私人医生和律师、厨师的AI助理,能为我们提供成本低廉、快速的咨询服务,那么人们就会对其产生依赖。
因为从行为学上来说,人总归是有惰性的。
虽然目前的某些律所,也能为人们提供免费的咨询服务,但这其中却包含了无形的时间成本、沟通成本。
正如互联网出现后,虽然人们仍能通过纸制地图进行导航,但大部分人却再也离不开手机上的定位功能一样。
从某种程度上说,压缩了各种知识、智能的端侧模型,将会重复这一过程。
第二点,则是个性化功能的普及。
在“前AI时代”,个性化定制的大规模推广,是一件不可想象的事。
在没有AI技术支持的情况下,实现个性化定制通常需要大量的人力和时间投入。为每个用户提供个性化的产品或服务,往往需要大量的人工处理。
然而,随着本轮AI革命的到来,人们已经在应用层,看到了AI用于个性化、定制化服务的可能。
例如character.Ai一类的应用,支持用户根据自己的需求、偏好,量身定制一个“AI伴侣”。
试想一下,倘若这样的定制化服务进入到了端侧,端侧大模型就能不断收集用户数据,再进行反馈、训练,并最终打造出一个*的、贴身的AI助手。
而这样量身定制的体验,显然比大规模的标准化服务,更具吸引力。
3
总结
尽管在模型规模、性能等方面,端侧大模型目前还远无法与云端大模型相比,但分布式的算力格局,以及庞大的规模效应,都将大大降低目前国内云端算力的负担。
而在算力成本降低之后,大量基于API接口的AI应用,也得以通过一个个部署在本地的端侧大模型不断涌现。
在应用大爆发的背景下,一些捕捉到先机的应用,就会基于端侧大模型实时响应、个性化定制的功能,引爆本轮AI革命真正的盈利点。
而这,正是无数人在这股AI浪潮中苦苦追寻的。
标签:
您可能也感兴趣:
为您推荐
军队抽组医疗力量承担 武汉火神山医院医疗救治任务
同马来西亚总理马哈蒂尔通电话 创造更多合作成果,造福两国和两国人民。
构筑起疫情防控的严密防线
排行
- 腾龙股份股东王柳芳减持302.01万股 价格区间为14.81-15.90元/股
- 因个人资金需要 新泉股份实际控制人唐志华拟减持不超1124.54万股
- 信捷电气股东邹骏宇减持50万股 价格区间为60.41-67.50元/股
- 国家卫健委:湖北以30个省外新增病例17例
- 因自身资金需求 科森科技股东徐宁拟减持不超3.71万股公司股份
- 中公高科股东潘玉利减持50万股 价格区间为20-20.60元/股
- 多地患者治愈后“复阳” 对疫情防控提出新挑战 五大焦点权威解析
- “精诚合作,打赢这一仗!”
- 生态环境部:自1月20日以来全国已累计处置医疗废物12.3万吨 ...
- 承诺两年扭转乱象 银保监会加快推进意外险费率市场化改革 ...
精彩推送
- 端侧AI,如何化解国内算力之困?
- GDP增速全省倒数,「世界工厂」东莞站在十字路口
- OpenAI成立以来首笔收购:买下一个「神秘」8人公司
- 全球化速度超极兔的物流出海小巨头
- 蘇从哪里来|无锡梅里遗址,为“泰伯奔吴”提供新线索
- 全面注册制实施满半年 11家企业IPO21天过会
- 央行、外汇局:人民币汇率在合理均衡水平上保持基本稳定
- 莫斯科传出“巨大爆炸声” 俄国防部:击落一架乌军无人机
- 亚士创能:对碧桂园无应收账款等 已停止向其直接供货业务
- 降本增效已见成果,京东还需要更多增长点
- 数字人的表里,仰算力之鼻息
- 特评 | 这种促消费扩内需的“移山拔河”不妨多来一些
- 视觉中国再陷风波:打击「碰瓷式维权」刻不容缓
- 养生的年轻人,自己给自己「治病」
- 电车淘汰油车,悬了
- 这11种行为,有奖!
- 中国人民银行广东省分行挂牌,广东各地市分行同步挂牌
- 177.79亿!暑期档票房新纪录诞生
- 伤感经典语录短句(伤感经典语录短句大全)
- 东土科技:融资净偿还111.09万元,融资余额2.73亿元(08-17)
- 免费洗头、夜市摆摊……海底捞还有多少「奇招」?
- 深圳正在消失的「小修小补」:补鞋起家,开店23年,攒下4套房
- 创新药企「阿斯利康」逆袭启示录
- 12问德甲新赛季之争冠篇:悬念能否再次保留到底?
- 深圳市地方金融监管局:深化金融支持 服务民企再加码
- 如何正确看待本地生活直播?
- 视频监控芯片赛道的隐形冠军
- 李在明第四次到案受讯!弊案VS渎职,韩国朝野互相调查
- 打造你的专属数字人!即构科技上线“创新生产工场”
- 至今早6时,北京116条公交线受雨后道路和地质灾害风险影响
- 人民币对瑞典克朗汇率今天8月17日 瑞典克朗汇率多少?
- 人民币对泰铢今日汇率多少?8月17日泰铢汇率实时查询
- 8月17日人民币对土耳其里拉汇率多少?
- 人民币对韩元汇率多少?8月17日韩元汇率实时查询
- 人民币对卢布的汇率是多少?8月17日卢布汇率实时查询
- 上半年全市实际利用外资99亿美元
- 前7月上海进出口达2.45万亿元
- 1-7月安徽省一般公共预算支出完成5114.3亿元
- 数字人民币展示将引入潮流消费场景
- 稳固支持实体经济恢复发展
- 购物号被降权了怎么办(购物号)
- “安全员建在楼栋上”,马峦街道筑牢暑期安全防线
- 货车行驶过程突然起火,深汕消防紧急救援
- 侃股:A股也可以考虑取消印花税
- 幻想中的幻影碎片(15)
- ST中安:控股股东中恒汇志1.41%股份公开拍卖已被撤回
- MIT科技评论:讯飞星火被评为中国「最聪明」的大模型
- 7月基建投资大幅放缓详解,财政发力预期升温|财税益侃
- 刚刚!江西公布1-7月财政收支!
- 商务部答封面新闻:我国的服务贸易“朋友圈”日益扩大
- 高质量发展在申城丨数字经济贡献超三成财政收入,杨浦打造三...
- 美股三大指数集体高开
- 中西部地区真正发达城市只有武汉和长沙,成都谈不上发达
- 创投为智能驾驶产业“挂上加速档”,承泰科技向百亿级营收目...
- 做“巴铁”是什么体验?巴基斯坦小姐姐:从小就知道中国是朋...
- 茶百道赴港IPO,新茶饮上岸潮来了?
- 哔哩哔哩2023年Q2财报:毛利同比增长66%,调整后净亏损同比大...
- 造车新势力破解生产难题
- 影史第一!2023暑期档票房破纪录
- 卷王瑞幸,和它卑微的加盟商们
- 储能电池跌破成本线,行业大逃杀开启!
- 煤老板转行造纸,年入11亿冲刺IPO
- 国家东南区域应急救援中心预计于2024年上半年建成使用
- 市场监管总局发布燃气灶具等4类产品质量安全风险提示
- 船运大动脉告急!巴拿马运河大梗阻,气候危机重创全球海运
- 深圳城管、美丽深圳公益基金会携手腾讯,为培养社会应急力量...
- 为期三年的“公益诉讼守护美好生活”专项监督活动,检察机关...
- 博主:华为Mate60样机将于下周发出 新机已蓄势待发
- “2023 AI SaaS影响力企业”发布,联易融“AI+供应链金融”入榜
- 狂卖30亿,中国女人捧红的尼龙包
- 快时尚高端化,全都是泡沫?
- 二季度中国货币政策执行报告:要稳固支持实体经济恢复发展
- 共享办公等待救赎,WeWork快撑不住了
- 一加和小米打起来了
- 美国:汽车电动化路上磕绊多
- 充电费暴涨1倍,开电车比开油车贵?电车淘汰油车,悬了
- 腾讯2024年校园招聘正式启动,开放五大类岗位需求
- 富豪们的「爱情买卖」
- 广州,又杀出一匹汽车黑马
- 扭亏为盈,阿里大文娱「站起来」了?
- 国产存储的好日子来了?
- 小儿肺不张(关于小儿肺不张介绍)
- 23家北交所公司接受机构调研,民士达获68家机构调研居首
- 周一下单周末收货!菜鸟国际快递英国专线“升级版”来了
- 德邦证券给予青鸟消防买入评级,Q2业绩表现亮眼,经营质量稳...
- 情系中国足球未来,平安倾力守护“绿茵场之梦”
- 北京设立百亿机器人产业基金
- “攒金豆”成年轻人理财新宠,这种方式靠谱吗?
- 菜鸟业绩亮了,新一轮物流比拼走向何方?
- 武汉招商凶猛
- 天府之国走出的茶百道,如何冲刺港股IPO
- 小红书的十年
- A股药企十年销售费用总额超2.2万亿:钱花去了哪里?谁占比最高?
- 著名数学家丘成桐现身深中,勉励学子“立志做大学问”
- “互联网+”创新创业大赛广东省分赛鸣金,深大“水利万物”夺冠
- Here We Go!罗马诺:摩洛哥门将布努加盟利雅得新月!转会...
- 2023廊坊文安县洪涝灾害怎么联络银行帮扶?
- 台今年经济增长“保2”恐无望
- 上半年厦门市各区GDP排行榜 翔安区增速最快 湖里区最慢
- 助力银发经济 千尺学堂在线兴趣课程充实银发族精神文化生活