当前热门:一家 380 亿美元的数据巨头,要掀起企业「AI 化」革命
当地时间 6 月 28 日,美国知名数据平台 Databricks 举办了自己的年度大会——数据与人工智能峰会。会上,Databricks 公布了 LakehouseIQ、Lakehouse AI、Databricks Marketplace 、 Lakehouse Apps 等一系列重要新品。
无论是从峰会的名称,还是新产品的命名,都能看出这家知名数据平台,正在趁着大语言模型的东风,加速向 AI 转变的脚步。
Databricks 公司 CEO Ali Ghodsi 所说的数据和 AI 普惠化|Databricks
【资料图】
「Databricks 要实现的是『数据普惠』和 AI 普惠,前者让数据通向每一个雇员,后者让 AI 进入每一个产品。」Databricks 公司 CEO Ali Ghodsi 在台上说出了团队的使命。
就在大会开始之前,Databricks 刚刚宣布以 13 亿美元收购AI领域的新生力量 MosaicML,创下了当前 AI 领域收购纪录,可见公司在 AI 转型上的力度和决心。
正在前方参会的 PingCAP 创始人兼 CEO 刘奇告诉极客公园,Databricks 平台刚刚上线 AI 的企业级应用,就已经有超过 1500 家公司在上面进行模型训练,「数字超出预期」。同时,他认为 Databricks 由于之前在数据+ AI 方面的积累,让公司能在 AI 大火之际,迅速在之前平台基础上加入新产品,就能快速给出和大模型相关的服务。
「最关键的就是速度。」刘奇说道,在大模型时代,如何用更快的速度让大模型和现有产品整合,解决用户的痛点,可能是当下所有数据公司*的挑战,同时也是*的机会。
Talking points
通过交互界面的升级,不是数据分析师的普通人,也可以直接使用自然语言查询和分析数据。
企业将大模型部署到云端数据库将越来越容易,直接使用成品大模型工具分析数据,也将变得更加简单。
随着AI的进展,数据的价值还将越来越高,数据潜力将被进一步释放。
01
数据库迎来自然语言交互
在会上,Databricks 推出了全新的「神器」LakehouseIQ。LakehouseIQ 承载着 Databricks 近期*的发力方向之一——数据分析普惠化,即不掌握 Python 和 SQL 的普通人也能轻轻松松接入公司数据,用自然语言就能进行数据分析。
为达到这个目的,LakehouseIQ 被设计为一个功能合集,既可以被普通终端用户使用,也可以被开发者使用,针对不同的用户设计了不同的功能。
LakehouseIQ 产品图|Databricks
对于开发者方面,发布了 LakehouseIQ in Notebooks,这项功能中,LakehouseIQ 可以利用大语言模型帮助开发人员完成、生成和解释代码,以及进行代码修复、调试和报告生成。
而对于普通的非程序员群体,Databricks 则提供了可以直接用自然语言交互的界面,背后由大语言模型驱动,可以直接用自然语言来搜索和查询数据。同时,该功能与 Unity Catalog 集成,让公司可以对数据的搜索和查询进行访问权限控制,只返回提问者被授权查看的数据。
自大模型推出以来,用自然语言对数据进行查询和分析,其实一直是一个数据分析方向的热点,许多公司在此方向都有所布局。包括 Databricks 的老对手 Snowflake,刚刚宣布的 Document AI 功能也是主打这个方向。
LakehouseIQ 自然语言查询界面|Databricks
不过 Databricks 宣称,LakehouseIQ 做到了更好的功能。它提到,通用大语言模型在理解特定客户数据、内部术语和使用模式方面拥有局限性。而 Databricks 的技术,能够利用客户自己的模式(schema)、文档、查询、受欢迎程度、线程、笔记本和商业智能仪表盘来获取智能,回答更多查询。
Databricks 的功能与 Snowflake 的功能还有一个差别,Snowflake 平台的 Document AI 功能,仅限于对文档中的非结构化数据进行查询,而 LakehouseIQ 适用于结构化的 Lakehouse 数据和代码。
02
从机器学习到 AI
Databricks 与 Snowflake 在发布会上的相似之处还不局限于此。
此次发布会中,Databricks 发布了 Databricks Marketplace 和 Lakehouse AI,这与 Snowflake 这两天大会的重点也完全吻合,二者都主打将大语言模型部署到数据库环境中。
在 Databricks 的设想中,Databricks 未来既可以协助客户部署大模型,也提供成品的大模型工具。
Databricks 过去就有 Databricks Machine Learning 的品牌,在此次发布会上,Databricks 对其进行品牌全面的重新定位,升级为 Lakehouse AI,主打协助客户部署大模型。
Databricks 上线了 Databricks Marketplace。
在 Databricks Marketplace 中,用户可以接入经过筛选的开源大语言模型集合,包括 MPT-7B、Falcon-7B 和 Stable Diffusion,还可以发现和获取数据集、数据资产。Lakehouse AI 还包括一些大语言模型操作能力(LLMOps)。
Lakehouse AI 架构图|Databricks
Snowflake 也在对此进行积极部署,其相似功能由 Nvidia NeMo、Nvidia AI Enterprise、Dataiku 和 John Snow Labs 提供()。
在协助客户部署大模型方向,Snowflake 与 Databricks 显现出了分歧。Snowflake 选择积极地与合作伙伴进行合作,而 Databricks 则试图将该功能作为其核心平台的本地特性添加进去。
而在提供成品工具方面,Databricks 宣布 Databricks Marketplace 未来还将可以提供 Lakehouse Apps。Lakehouse Apps 将直接在客户的 Databricks 实例上运行,它们可以与客户的数据集成,使用和扩展 Databricks 服务,并使用户能够通过单点登录体验进行互动。数据永远不需要离开客户的实例,没有数据移动和安全/访问问题。
这点则与 Snowflake 公司的产品从命名到功能上都直接撞车。Snowflake 公司与之相似的 Snowflake Marketplace 和 Snowflake Native App 已经上线,是其发布会的重点之一。彭博社就在 Snowflake 的大会上宣布了一个由彭博社提供的 Data License Plus (DL+) APP,允许客户在云端用几分钟时间就能配置一个随时可用的环境,内部设有完全建模的彭博订阅数据和来自多供应商的 ESG 内容。
03
数据平台迎来新变革
开幕式主旨演讲上,Databricks 公布了一个数字:过去 30 天,已经在 Databricks 平台上训练 Transformer 模型的客户超过 1500 家。
在谈及这个令人印象深刻的数字时,PingCAP 刘奇认为,这说明企业应用 AI 的速度比预期的要快得多,「应用模型不一定要去训练模型,所以如果训练的都有 1500 家,那应用的肯定要比这个(数字)大的多得多。」
另一方面,这也表明 Databricks 在 AI 这个领域的布局相对完整。「它现在不仅仅是一个 Data Warehouse(数据仓库),一个 Datalake(数据湖)。现在它还提供:AI 的 training(训练)、AI 的 serving(服务),模型的管理等一整套。」
Ali Ghodsi 以计算和互联网的革命,类比大模型之于机器学习的变革|Databricks
也就是说,底层模型可以通过 Databricks 的平台去训练,「*层的模型改改参数就能训练」。在这个模型之上所需要的 AI 服务,Databricks 也布局了相应的基础设施——今天发布了 vector search(向量搜索)和 feature store(特征库)。
Databricks 全面向大模型升级。
过去,Databricks 在 AI 方面有很多积累,比如在建索引、查数据、预测工作负载等方面,用小模型来提高效率、降低时延。但是,以如此快的速度补上大模型的能力,还是让不少人意外。
在今天峰会全面展示的 AI 布局之前,Databricks 收购了 Okera(AI 数据治理),推出了自家的开源大模型 Dolly 2.0,又以 13 亿美元并购了 MosaicML,一连串的动作一气呵成。
对此,硅谷徐老师 Howie 认为,Databricks 和 Snowflake 这两个大会都可以比较明确地看出:两家公司的创始人认为,基于数据库、数据湖他们所做的行动、接下来会面临根本性的改变。按照一年前他们在做的思路,在未来几年行不通。
相应地,快速补齐大模型的能力,也意味着可以获得由于大模型带来的增量市场。
刘奇认为,没有大模型之前,很多的需求可能都不存在,但有了大模型之后,有了很多新增需求。「因为只有模型没有数据,干不了什么事情,特别是没有办法做出差异化。如果大家都是一个大模型,那你跟别人可能也没有差别。」
但比起大模型,峰会现场的观众似乎更关注小模型,因为小模型的几个优势:速度、成本、安全性。刘奇表示,基于自己独有的数据,做出差异化的模型,模型要足够小才能满足这三条:足够便宜、足够快、足够安全。
值得注意的是,Databricks 和 Snowflake 在日前都公布了它的营收数据,平台年营收增长在 60% 以上。相比整个市场软件支出放缓的大背景,这样的增长速度反映了数据越来越被关注。这次 Databricks 峰会的主题也是数据加 AI,但有了大模型,数据的价值还将越来越高。
大模型的到来,让数据自动生成成为可能,可以预见,数据量将指数级增长。怎么轻松地访问数据、怎么支持不同的数据格式、挖掘数据背后的价值,会成为越来越频繁的需求。
另一方面,今天很多企业还在还在探索观望将大模型接入企业软件,但考虑到安全、隐私、成本,敢直接用的,还很少。一旦通过将大模型直接部署到企业数据上,无需移动数据,部署大模型的门槛将被进一步降低,数据被消费的数量和速度都将被进一步释放。
标签:
您可能也感兴趣:
为您推荐
军队抽组医疗力量承担 武汉火神山医院医疗救治任务
同马来西亚总理马哈蒂尔通电话 创造更多合作成果,造福两国和两国人民。
构筑起疫情防控的严密防线
排行
- 腾龙股份股东王柳芳减持302.01万股 价格区间为14.81-15.90元/股
- 因个人资金需要 新泉股份实际控制人唐志华拟减持不超1124.54万股
- 信捷电气股东邹骏宇减持50万股 价格区间为60.41-67.50元/股
- 国家卫健委:湖北以30个省外新增病例17例
- 因自身资金需求 科森科技股东徐宁拟减持不超3.71万股公司股份
- 中公高科股东潘玉利减持50万股 价格区间为20-20.60元/股
- 多地患者治愈后“复阳” 对疫情防控提出新挑战 五大焦点权威解析
- “精诚合作,打赢这一仗!”
- 生态环境部:自1月20日以来全国已累计处置医疗废物12.3万吨 ...
- 承诺两年扭转乱象 银保监会加快推进意外险费率市场化改革 ...
精彩推送
- 勇当强国建设民族复兴的先锋队、突击队——习近平总书记在同...
- 当前热门:一家 380 亿美元的数据巨头,要掀起企业「AI 化」革命
- 全球播报:用工荒与就业难:为什么说是来自第三方的挤压?
- CBOT玉米连续第三日下跌,因降雨改善金十期货6月30日讯,据外...
- 十四阿哥喜欢若曦吗?小说_十四阿哥喜欢若曦吗_每日观点
- 焦点信息:山东自贸区:深刻践行体系化制度创新
- 环球热消息:操盘必读|近七成银行家认为货币政策“适度”;3...
- 跑900公里少花2000元!10分钟下线一台的这种车火了→|世界新资讯
- 【环球时快讯】20句给自己信心的名人激励自己的座右铭 ,迷...
- 国资委公布国企改革考核A级企业名单
- 要闻:Keep:香港IPO发行价指导区间为每股28.92港元-61.46港元
- 【光明时评】“人机共生”时代更须注重语言规范
- 海报 | 上海6月夜间消费总额已达427.46亿元,夜间经济综合...
- 详解上半年财政政策执行情况,下一步工作重点有哪些?-全球消息
- 北京60岁及以上常住人口达465.1万
- 国资委公布国企改革考核A级企业名单
- 运动康复师资格证报名条件_运动康复师
- 热点评!教育部面向多个省份开展2023届高校毕业生就业工作专...
- 环球信息:“社”彩纷呈 “团”庆九秩!西丽小学推出第五届课...
- 收购民生证券股权进展如何?这家券商发债遭监管问询!控股股...
- 天天最资讯丨大吃大喝,躺瘦30斤?B站,请管一管你的广告
- 联合国对英上诉法院关于非法移民安置计划的裁决表示欢迎
- 鬼父亲动漫在线观看免费(关于鬼父亲动漫在线观看免费的基本...
- 青岛力促银行保险机构“加码”,未来3年贷款增速高于全省平均...
- 【环球新视野】棉花被被老鼠尿过了怎么洗_棉被芯被老鼠尿了怎...
- kk小游戏测评(kk小游戏)
- 每日讯息!佛山1-5月规上工业增加值增长7%,仍需扩内需和提振...
- 专访陈文玲:经济合作是中韩关系的“压舱石”和“稳定器”
- 全球逾1500名代表、170多场高端对话 2023夏季达沃斯论坛改变了什么?
- 高质量发展如何向全球敞开“怀抱”?江苏这场论坛来“解题”-...
- 又低于预期!
- 甜味剂阿斯巴甜可能致癌?将于下月宣布调查结果
- 环球百事通!联想创投宋春雨:看好大计算、AI平台型创新、原...
- 云雀是赤犬女儿,克比升职了-每日快播
- 快问快“达”| 这些外国大咖的夏季达沃斯印象:中国还有更大潜力
- 详解上半年财政政策执行情况,下一步工作重点有哪些
- 深晚观察丨高考已经过去,青春刚刚开始
- 快问快“达”
- 动力强劲!今年一季度中蒙双边贸易额同比增长121.5%
- 四字成语接龙美文,传递祝福的文学盛宴
- 全球最权威ESG标准全新发布,亦与中国企业息息相关
- 附近哪里有售火车票代售点_附近哪里有火车票代售票点
- 今明两年普通人将面临3大难题,做好准备能安稳度过,我也刚知道
- 天天热讯:塑料杯能用洗碗机洗吗_塑料杯可以放洗碗机吗 塑料...
- 荣耀赵明MWC上海发表演讲,称将把AI大模型引入终端 热点在线
- 3000亿产业基金落地,江西发力厚植产业生态圈
- 【焦点热闻】年内股票募资规模超6000亿元 A股摘得上半年全球...
- 资讯:《逆水寒手游》天动星回探索挑战攻略
- 实时焦点:6月盘点:值得关注的成都产业发展相关政策
- 固定资产投资同比增长12.4% 深圳2023年1-5月经济数据发布
- 2023夏季达沃斯丨TCL创始人、董事长李东生:中国企业要适应新...
- 什么是益生元奶粉_什么是益生元_当前最新
- 权威访谈|对话WTO副总干事张向晨:中国始终是全球经济增长关...
- 每日视讯:2023社区团购生存指南:足够大,要么足够小
- 通达极兔顺丰菜鸟,快递业再迎洗牌时刻
- 封闭式小区,何时衰败? 要闻
- 天天快讯:深圳2023—2024学年校历出炉!中小学寒暑假时间这样安排→
- 国产半导体材料,边补短板边「掘金」
- 与世界冠军面对面!深圳市体育与健康教学研讨活动在马峦小学举办
- 世界时讯:冲动考编的年轻人,只有上岸那一秒是快乐的?
- 上期所:目前官网无任何客户登录后开户并交易的端口 也无官...
- 世界今头条!香坊分局圆满完成2023年端午节安保任务
- 引领数字经济新时代,互联网3.0高峰论坛将于7月6日举行|聚焦
- 动力电池「退役潮」来袭,回收难题何解?|天天日报
- 每日视讯:最具影响力的省份?内卷又富得流油
- 美团宣布收购「光年之外」
- 世界新动态:速看!2022年平顶山市工资情况新鲜出炉,年平均...
- 全球球精选!美团以20.65亿人民币收购光年之外
- 销售额创五年新高,买彩票成了年轻人的新型社交方式?
- 焦点速递!深圳水务集团助力两英镇鹤联村党群服务中心提档升级
- 速看:为珠峰氪金的登山人,一次花50万
- 不出意外是鬼灭最拉的一季-全球热资讯
- 北大荒:公司目前尚未开展期货业务,也没有开展大豆油销售业...
- 每日消息!首席谈经济|专访华福证券首席经济学家燕翔:新兴产...
- 深圳:前五月规模以上工业增加值同比增长2.5% 天天报资讯
- 全球经济增速将放缓,中国制造业出路在哪里
- 1-5月北京规模以上工业企业实现利润600.2亿元
- 快递小哥失去618 环球热文
- (夏季达沃斯论坛)专访:数字化是中国制造业走向高端的重要...
- 全球资讯:关注“MWC上海” 四周岁5G“身家”万亿美元
- 2023年1-5月深圳经济延续恢复态势_当前速读
- 今年前5个月粤港贸易实现正增长,广东对香港进出口3752.1亿元
- 环球速读:配股后领涨板块,这家银行资本补充打开了多大空间?
- 快手娱乐发布暑期计划,以蓬勃精品内容呈现大众娱乐无限精彩
- 当前快报:618最大悖论:中小商家站上C位
- 当前时讯:冲刺IPO的敷尔佳,「械字号」背后有多少水分?
- 焦点快看:王慧文的旧光年,会是宿华的新故事吗?
- 金发拉比主要产品是什么?金发拉比获得过哪些荣誉?
- 全球视讯!康斯特现8笔大宗交易 总成交金额5440.50万元
- 世界球精选!明日(30号)特大暴雨大雨确定,连下6天,60年冷...
- 天天观点:6月29日国内TDI市场行情整理运行
- 国轩高科是哪一年上市的?国轩高科主要产品是什么?
- 甘肃电投的主要产品是什么?甘肃电投行业口碑怎么样?
- 元宇宙凉凉?这家游戏公司刚获1.38亿融资-世界视点
- 再传赴美上市,SHEIN的「秘密」公开化
- 世界看热讯:济南城建10亿元超短债将兑付 利率2.35%
- 不换新手机的年轻人,在维修点扎堆|焦点热门
- “中国天眼”FAST又有重大发现 为观测宇宙打开了一个重要“...
- 世界聚焦:小米非原装电池没有快充
- 实时:如何发挥京津冀协同作用?首经贸教授:以北京高精尖产...