谷歌Nature震撼发文,Gemini教练暴打专家!医学双料冠军,秒出睡眠报告-要闻速递
新智元报道
(资料图)
编辑:桃子
【新智元导读】谷歌DeepMind最新Nature王炸,直接把Gemini版大模型PH-LLM调教成了「AI健康私教」,把可穿戴冷冰冰的数据,直接变成睡眠健身建议,结果准确率暴打人类医生。
AI医学的圣杯,可能先被谷歌DeepMind夺下。
最近,谷歌全新健康大语言模型(PH-LLM)正式发布——一款微调Gemini的「个人睡眠和健康」模型。
PH-LLM将可穿戴设备中的数据,瞬间转化为可视化的内容。
它就像一个「AI睡眠专家+健身教练」,可以全天候分析监测个人的智能手表数据。
结果发现,PH-LLM在睡眠医学考试中得分(79%)碾压医生(76%),而且在健身认证中直接把人类专家按在地上摩擦(88% vs 71%)。
更牛的是,在人类评估中,PH-LLM生成的健康建议,几乎与专家无差别。而且,仅凭传感器数据,即可预测用户睡眠质量。
大多数可穿戴设备,往往只会给你一堆数据。
遗传学博士Dominic Ng对此点评道,「PH-LLM所做的,正是一位优秀医生会做的事,即将数据综合成『洞察』」。
最新研究已于14日登上Nature,具体看看,谷歌DeepMind如何做到的?
谷歌出手不凡,Gemini版「健康私教」
传统临床诊疗虽能提供宝贵信息,但对睡眠、运动、压力等,生活健康指标评估仅具阶段性。
如今,可穿戴设备就能实现无感连续监测。
不过,这些数据缺乏上下文背景,存储分析算力要求高、解读难度大等因素,并未广泛应用于临床实践。
甚至,这些数据也并未纳入标准「医学问答数据集」,导致通用基础LLM和医学LLM,都难以有效推理给出个性化建议。
为此,谷歌团队合力在Gemini上微调出PH-LLM,用于评估AI在睡眠与健康领域的表现,如下图所示。
可穿戴设备能监测信息远超这两个领域,为什么研究团队仅聚焦于此?
一方面,现有研究已充分验证可穿戴设备,在这些领域监测数据的准确性与适用性。
另一方面,设备使用者参与度高,无需提供临床建议即可给出实用指导方案。
为此,它建议道:
更好的睡眠时间是从晚上12:00到早上7:30。你可以通过每隔几天将睡眠时间提前15分钟,逐步达到目标。
基于Gemini Ultra 1.0,PH-LLM采用了两阶段训练。
首先,作者对完整模型进行了微调,专门针对睡眠和健康领域的长篇案例分析回复生成任务。
训练数据包含了,人口统计学文本数据、最长30天的每日指标、聚合指标,以及仅针对健康案例的个体运动日志等。
在完成案例分析微调后,他们又为PH-LLM增加了多模态适配器。
这个适配器是用于,根据至少15天的纵向被动传感器数据(包含每日睡眠与活动指标),来预测睡眠障碍和睡眠损伤的主观报告结果(PROs)
两阶段训练完成后,团队从个人健康教练所需的多元能力维度出发,针对三大任务评估了PH-LLM的表现:
首先,通过多选题测试评估模型掌握的专家级领域知识储备;
其次,通过长案例研究检验模型应用专业知识、解读聚合传感器数据以提供教练建议的能力;
最后,测试模型预测患者主观报告结果(PROs)的能力,使其在生成建议时能整合个体对睡眠质量的自评数据,真正实现个性化健康指导。
AI击败人类专家
测试结果显示,在睡眠医学和健康体能考试,PH-LLM的答题正确率分别达到79%和88%(表1与图1b)。
这一结果,显著超过获得睡眠医学继续教育学分(CME)要求的约70%及格线。
而且,与主流外部模型相比,PH-LLM表现颇具竞争力:睡眠类题目稍逊但体能类题目表现相当。
具体而言,在睡眠医学考试中PH-LLM得分79%,Gemini Ultra 1.0为77%;在体能考试中两者均获88%得分。
受试者工作特征曲线(ROC)与精确率-召回率曲线,均证实模型在两类考试中的优异表现(附图2)。
值得注意的是,尽管针对睡眠与健康任务进行了微调,PH-LLM在PubMedQA29和MedQA30通用医学基准测试中,性能并未下降(附表1)。
值得一提的是,睡眠医学题库包含每道题目的人类考生答题分布等元数据,这允许团队基于题目难度进行分层性能比较。
PH-LLM在所有难度层级均小幅领先Gemini Ultra 1.0,且在难题上的优势更为明显。
这表明,睡眠案例研究的微调确实提升了相关题目的解答能力(表2)。
为量化PH-LLM的表现水平,团队还招募了5位平均从业25年的睡眠医学专家(均持有高级学位)和5位平均从业13.8年的职业运动教练参加同规格考试。
专家组在睡眠医学试题样本(N=204)中的平均正确率为76%,体能考试为71%,PH-LLM在两类题库中均超越人类专家(表1)。
按人类考生答题难度分层分析显示,PH-LLM的表现与人类考生及受邀专家群体相当(表2)。
案例分析,接近专家水平
接下来,研究团队进一步评估了,模型应用专业知识与解读传感器数据的能力。
为此,他们创建了首个睡眠与健康领域的详细个人健康案例数据集(857个案例,含3,271组问答对),由多位相关领域专家共同审定。
该数据集包含持续数周的个体可穿戴传感器数据,以及对应的深度分析与建议(图2a,b)。
在健康管理案例分析中,PH-LLM模型在三个维度(运动处方制定、恢复方案建议、训练准备度评估)上,表现出与人类专家及Gemini Ultra 1.0相当的水平(图2d)。
传感器数据,预测健康报告
此外,为了评估PH-LLM能否推断用户体验以优化健康指导,团队测试了每日传感器数值数据预测睡眠障碍和睡眠损伤PROs的能力。
首先通过计算问卷回答间的相关性分析PRO数据,发现16个问题测量了相关但独立的睡眠维度(图3a)。
随后检查传感器特征是否存在混杂因素,发现不同设备和参与者依从性间的传感器读数分布相似。
结果显示:没有单一特征对所有PROs具有绝对预测优势,预测信号广泛分布于多个传感器(图3b)。
为使PH-LLM能从传感器特征预测PROs,研究人员又训练了一个多层感知机(MLP)适配器,将20项传感器特征的统计量映射至PH-LLM的潜在标记空间(方法部分)。
随后将这些潜在标记作为上下文输入PH-LLM,要求其预测每个二分类结局。
在保留测试集中,团队比较了零样本提示、少样本提示与PH-LLM适配器方法,在受试者工作特征曲线下面积(AUROC)和精确召回曲线下面积(AUPRC)的表现(图3c,d)。
值得注意的是,客观睡眠测量数据对主观睡眠质量指标的预测力通常有限,但配备适配器的PH-LLM在AUROC和AUPRC上均显著优于两种提示方法。
正如Dominic Ng所言,谷歌研究意义并不止于一个「AI战胜医生」的故事。
这恰恰证明了,LLM可以将被动的健康监测,转化为积极的健康管理。
它不仅了解你的身体,还能理解其原因,并给出及时应对方法。
这就是预防医学的未来。
参考资料:
您可能也感兴趣:
为您推荐
军队抽组医疗力量承担 武汉火神山医院医疗救治任务
同马来西亚总理马哈蒂尔通电话 创造更多合作成果,造福两国和两国人民。
构筑起疫情防控的严密防线
排行
- 19日人民币对美元汇率中间价报7.0025
- 至纯科技拟募集资金总额不超过11亿元 补充流动资金
- 东岳硅材股价大涨收深交所关注函 要求说明是否与公司基本面匹配
- 商务部:上半年我国服务进出口达2.37万亿元 同比增长6.7%
- 中南建设上半年实现营业收入384.8亿元 综合毛利率16.31%
- 中电光谷上半年股东利润约为1.09亿元 同比下降9.09%
- 海峡石油化工今年上半年收入约3.47亿港元 同比减少92.89%
- 山西焦化股票交易异常波动 未来焦炭产品价格走势存在不确定性
- 日清食品拟在公开市场回购不超约1.07亿股股份 总金额最高为1...
- 新三板公司和天下拟A股IPO 上半年净利润3735.34万元
精彩推送
- 谷歌Nature震撼发文,Gemini教练暴打专家!医学双料冠军,秒...
- 直播板块稳健发展 广告收入同比跃升29%
- 每日快报!斯诺克武汉公开赛:赵心童止步32强
- 2025年汽车制造上市公司龙头股名单出炉,了解一下(2025/8/26...
- 每日热闻!光大期货:8月27日农产品日报
- 最新消息:酒ETF(512690)获融资买入1.92亿元,近三日累计买入5.49亿元
- 焦点快播:指数化投资趋势显著 ETF总规模突破5万亿元大关
- 东京世界田径锦标赛奖金:冠军7万美元,亚军3.5万美元
- 衡水智科塑业有限公司成立 注册资本20万人民币 实时
- 海南海药(000566.SZ):上半年净亏损1.58亿元
- 天天快报![快讯]*ST恒久公布半年报 扣非净利润同比减少-50.53%
- [快讯]科思科技公布半年报|热讯
- 2025年8月26日阳煤化工聚酯级乙二醇起拍价4060元/吨
- 新农股份(002942.SZ):上半年净利润9058.85万元 同比增长32.84% 当前聚焦
- HYPEBEAST(00150.HK)8月26日耗资15.4万港元回购93.5万股_焦点热门
- 哈弗大狗PLUS将于成都车展亮相 同步开启预售
- 焦点热门:镇江船舶海工产业集群加速崛起:8 艘船舶两月下水...
- 30亿元 沪上低空经济企业再添“大单”
- 滚动:港股创新药板块持续走低,君实生物、凯莱英跌超7%
- 焦点热文:贵阳银行:2025年上半年实现归母净利润24.74亿元 ...
- 人民银行开展4058亿元逆回购操作 每日速看
- 星宝电机取得新能源汽车驱动电机防水结构专利
- 焦点关注:零售上市公司探寻数字化转型路径
- 光大期货:8月26日农产品日报-当前资讯
- 伊之密:融资净买入57.92万元,融资余额4.23亿元(08-25)-即时
- 今日讯!常州市嘉视电子科技有限公司成立 注册资本50万人民币
- 要闻速递:盐田秋韵
- 焦点播报:张家口水之源水业有限公司成立 注册资本2万人民币
- 镇江中山路小学开展 “全员导师工作技能培训”,赋能青年教...
- 精选!中船科技:上半年亏损5.74亿元
- 热门看点:传Meta(META.US)将推出首款消费级智能眼镜:售价80...
- 赫伊森在为皇马出战的8场比赛中,有6场触球和传球次数最多|速看料
- 百甲科技半年度营业收入6.99亿元,同比增长50.43%
- 科贝电台:西甲联盟拒绝第4轮巴萨vs瓦伦主客场对调_热资讯
- [快讯]沃尔德公布2025年半年度分红方案
- 当前热议!奥特维:上半年净利润同比下降59.54% 拟每10股派5元
- 鲁迅长孙周令飞已戒烟30年,谈“鲁迅抽烟墙画”被投诉:大家...
- 要闻速递:全系配备 50mm 碳纤维动圈单元,JBL 推出三款头...
- 大飞机供应链智造基地项目开工
- 沪指逼近3900点,科创50大涨逾3%,全市成交超3万亿
- 茅台1935新品定价998元,谍照曝光!|快资讯
- 深振业A:董事会任期届满后,公司积极与监管机关和股东方沟通...
- 快看:"防沙治沙+风电光伏"助力科尔沁沙地治理
- 新华社快讯:“十四五”以来我国口岸检疫防线更加牢固-实时
- 卫报:诺丁汉森林商谈引进利瓦科维奇,若价格合适费内巴切愿...
- 视点!风电板块震荡拉升 金风科技涨停
- AI推理算力龙头看下有没有你关注的!(2025/8/22)-观察
- 最资讯丨2025年金融证券软件题材公司(8月22日)
- 半场-水晶宫1-0领先诺丁汉森林 伊斯梅拉-萨尔破门格伊中柱
- 美因茨vs科隆:李在城、阿米里首发,比尔特、卡明斯基出战 ...
- 【播资讯】盛科通信:上半年净利润亏损2368.91万元
- 通用电梯:上半年净亏损1789.23万元
- 每日时讯!如何理解期货合约的基础知识与应用?
- 今日关注:阿贾爆砍36分13板率王牌十连胜两次解锁单季10次30+...
- 汪峰森林北逛街!搂腰拥入怀旁若无人,狂撒糖让路人看愣:甜炸了
- 聚焦:爷青回!苏州小街巷里藏着蟋蟀江湖
- 勒沃库森vs霍芬海姆:希克、格里马尔多首发,克拉马里奇、曹...
- 今热点:三年持有期基金 还有产品在亏损
- 中国移动副总经理李慧镝:实现“通、智、超、量”四算并网
- 洽洽食品上半年营收27.52亿元,下半年聚焦降本增效 热头条
- 观焦点:国家防总针对海南启动防汛防台风四级应急响应并派出...
- 怎样提高房产的出租收益率? 天天快报
- 实时:机构调研热情升温 本周16家上市公司迎超百家机构调研
- 红星发展:融资净偿还571.2万元,融资余额3.48亿元(08-22)
- 丸美生物披露2025半年度分配预案:拟10派2.5元
- 【播资讯】永利地产发展(00864)发布中期业绩,净亏损1.65亿港...
- 今日热搜:金风科技(002202.SZ):上半年净利润14.88亿元 同比增长7.26%
- 港北区:推动电动车产业“含绿量”“含金量”双提升
- 每日看点!中航高科(600862.SH):上半年净利润6.05亿元 同比增长0.24%
- 微动态丨债市日报:8月22日
- 锂业分会:7月受部分企业采矿权证消息影响 碳酸锂期现货价格上涨
- 当前聚焦:亚洲金融(00662)发布中期业绩 股东应占溢利4.23亿...
- 生意社:8月22日中石化三井苯酚最新价格
- 速读:8月22日生意社白卡纸基准价为4386.67元/吨
- 上海家化上半年净利润同比增长11.7% ,核心品牌发力 视讯
- 新天科技:2025年上半年净利润7890.33万元 同比增长38.45%
- 加氢阻垢剂商品报价动态(2025-08-21)_热资讯
- 今日关注:大行评级|大和:舜宇光学科技上半年业绩稳固 目标...
- 每日资讯:多家中小银行下调存款利率 最高降幅20个基点
- 上证综指8月21日涨0.13%
- 罗城仫佬风情闪耀贵州全国“村超”总决赛
- 保险产品的保障责任与费率的关系是什么?|每日信息
- 洪水蓝色预警!邕江或出现70.3米左右洪峰水位
- 每日看点!投资百亿办大学,也没影响曹德旺的主业!福耀玻璃交...
- 恒瑞医药:2025年半年度净利润约44.5亿元,同比增加29.67%
- A股:电工钢板块上市公司名单!(2025/8/20) 今日热门
- 中国LPR连续三个月“按兵不动”|每日聚焦
- 国信证券发布海兴电力研报,海外布局持续突破
- 【独家】不再满足于“到此一游”快速打卡!来桂林旅游的年轻...
- 今日看点:农行商河支行营业室:暖心上门办社保,金融服务有温度
- 泡泡玛特王宁:不觉得单一IP占公司营收比例过大不健康
- 澳大利亚新南威尔士大学研究揭示无清洗助焊剂或加剧TOPCon组...
- 菏泽一酒店设置公益冰柜:“市民取水都很自觉,从没有人多拿...
- 康宁医院(02120)8月19日斥资116.2万港元回购11.63万股_今日快讯
- 陕西能源:上半年营收98.62亿,净利润同比降13.45%
- 前沿热点:小鹏汽车(09868)第二季度股东应占净亏损同比收窄62.81%
- Payoneer派安盈与Stripe达成战略合作,Checkout收单方案焕新上线
- 最新资讯:港股东方甄选短线跳水转跌,目前跌超8%,此前盘中一...
- 梅雁吉祥亿元“跨界”并购遭问询 标的房子是租的,固定资产...
- 【时快讯】大行评级|麦格理:上调阿里健康目标价至6.78港元...