医院需要怎样的大语言模型?
ChatGPT的出现重构了人们对于AI的想象。一时间内,做模型的,做应用的,一拥而出。适才三个季度,市面上垂直于医疗的大语言模型,数量已经达到两位数。
(资料图片)
不过,医疗异于其他产业。回顾过往医疗科技的发展足迹,一项新兴技术能否规模化地应用于医疗机构,不在于市场参与者的数量,而在于随技术而生的产品,能否真正与医生的工作融为一体。
问题便在于此。
对于大模型而言,什么是医院的真实需求?怎样才能满足医院的真实需求?
1、大模型之于医疗的意义是什么?
具备商业化潜力的AI通常具备两个特征:一是高频,二是提效。
所谓高频,是指医疗大模型在各个场景中被频繁应用。在卫宁健康总裁王涛看来:在医疗领域,基于生成式AI而衍生出的医疗应用或将成为医务工作者离不开的贴身助手,它将作为一个超级大脑而存在,不仅能高效地调度和整理数据资源,甚至能引发自主思考,提升医务工作者的工作效率、医疗质量,并做到有效的辅助决策。
其次是提效,即为算法的购置方带来实打实的收益。一个理想的医疗大模型应该能够实时质控医院各个医疗流程;以最小成本满足政策对医院提出的IT需求,进而为医院的发展运营带来新的可能性。
医院之中符合此类特征的场景非常多。举两个例子,医患沟通、病历书写都是AI应用的经典需求。
先谈医患沟通。不同于其他第三产业,医生与患者之间的“交点”非常频繁,贯穿整个诊疗流程。但由于医患信息的不对称性,大量无效交流穿插其中。
对于本已供不应求的服务提供方医护人员而言,大量碎片化、重复的交流贯穿工作之中,不仅源源不断地产生压力,亦挤压了诊疗与科研时间。对于患者而言,部分医护人员因压力所迫,无法进行详尽的交流,在不同程度上会影响就医体验,甚至可能成为引燃医患矛盾的导火线。
再谈病历书写。在前不久召开的一场医疗IT大会中,多位院长、卫健委领导都积极谈论了大模型及其相关技术的未来:能不能使用大模型来辅助质控流程?能不能使用生成式AI来自动书写病历?他们认为,在医生的日常工作中,病历的理解与书写是一个极为重复耗时的过程,只有将医生从这些繁琐的工作中抽离,才能帮助其实现更大的价值。
因此,大模型之于医院的意义,在于找到医院场景中的高频环节,辅助医护人员高效完成高重复度的工作,进而发挥医护人员的比较优势,助其专注于诊疗与科研,进而推动医院整体能力的良性发展。
但也有人会问:如此陈旧的需求,自然语言处理(NLP)不是早已能够解决吗?可以,但又并非完全可以。
2、大模型强在哪里?
90年代初,技术人员便开始尝试用IT手段辅助医生诊疗,降低医生的工作强度。但那时的成果“专家系统”存在缺陷,仅以简单的数据映射或简单算法难以应对并不复杂的医学问题。
毕竟,医学诊断讲究“望闻问切”,需要医者通过多感官多渠道的信息获取,检验检查等多种辅助手段,加之医学知识和逻辑的综合判断,才能进行有效诊断。只是通过患者简单的主诉,而不能将患者年龄、身体状况、既往病史等进行综合判断,这样的“诊断”不过是碰碰运气。
因此,“专家系统”并未真正从理论走到实践。直到二十一世纪的第二个十年,传统基于规则或统计方法的NLP的出现,才重新唤起了人们对于智能技术的憧憬。近几年来,基于NLP的病案质控、CDSS等系统已普遍应用于管理、临床。
不过,这类NLP也有其局限性。
“尽管早先基于规则或统计方法的NLP技术强化了人工智能的分析能力,但它没有脱离通过‘输入信息-关联数据库-搜索结论’的逻辑。”卫宁健康CTO赵大平在采访中表示,“这种推理的方式只考虑了‘上文’,忽视了‘下文’。相比之下,医生的推导过程不仅会囊括各类报告给到的数据,还会根据过往经验推断数据之外的可能。”
严格意义上说,大模型同样是NLP 的一种形式,但相比较基于规则或统计方法的NLP,知识数据驱动的大模型更具备了自我进化的能力。
具体而言,进化能力的本质来自训练神经网络时采用的随机梯度下降算法,这种算法让程序沿着一定方向一代又一代地随机摸索,一定程度上等效于物种的基因突变。
强大的生存压力下,错误的摸索被淘汰,而正确摸索被积累,久而久之,某些高阶的功能就这么涌现出来了。这些涌现出来的高阶能力不仅能够自动提取重要信息,理解和生成信息;也可融合模型内的知识补全不完备的信息,形成完整的推理。
这样的能力在医疗场景之中尤其珍贵。譬如在辅助医生解读医学影像这一场景中,基于大模型的人工智能不单单是基于给定的影像信息进行辅助诊断,还能通过过往学习结合知识处理影像之中的瑕疵,以更快的速度给出更为精准的辅助诊断结果。
此外,LLM的沟通能力在ChatGPT中的应用也为世界所见证。迁移至垂直领域后,经过预训练和微调的模型能够有效用于医患交流,优化智能导诊、智能问诊、智能随访等应用。而对于更为复杂的病历书写,它能帮助AI脱离模板,像一个真正的资深医生一样理解、生成电子病历。
3、医疗大模型落地,最难的挑战在哪里?
颠覆式的潜力之下,大量互联网企业、头部医疗IT公司涌入大模型赛道。但要使得大模型触及临床,模型训练已经何其艰难,模型落地还要再添挑战。
在理解大模型落地之难前,我们不妨先看看英国文学家艾略特提出的DIKW知识模型。简单来说,该模型将广义上的知识分为 Data(数据) - Information(信息) - Knowledge(知识) - Wisdom(智慧) 四层金字塔结构。
DIKW知识模型与如今的人工智能
传统的逻辑下,我们将数据不断提纯,升维成知识甚至智慧,进而作为应用的基础。而在人工智能时代,我们着重对第二层的信息流进行处理,一方面去粗取精,升维取得知识,构建智能化的基础;另一方面标准化处理,降维得到数据,形成数字化的基础。拥有知识、数据后,再辅以算法与算力支持,一个大模型就完成了。
王涛在采访中对两种模式进行了对比,他认为:从完全的升维到大模型时代的一升一降,其实质是思考逻辑的转变。将这种变化其置于医疗系统之中,便是要将“技术支持应用”的系统架构改写为“技术应用并行”。
因此,大模型的落地,亟须解决的是医疗信息系统对于大模型的兼容问题。
目前能够提供“技术应用并行”式医院信息管理系统的医疗IT企业不多,仅头部数家企业在深度学习大热之时便看到系统架构变更的必要性,打造了能够保障AI*运行的医疗管理系统。
以卫宁健康为例,其新一代医疗管理信息系统WiNEX在设计之初便已经考虑到了对“智能化”(Intelligence)的架构支撑,其内涵的EA+AI智能架构保证了在每一层中都能支持AI的运行。
卫宁健康EA+AI智能架构
WiNEX的创新架构非常适合大数据在院内场景下的迭代。为保障大模型在应用过程中的流畅性与在学习过程的持续性,只考虑在信息化流程中数据记录远远不够,还需要考虑数据计算的架构,需要业务流程与技术流程随时互动。因此,相较于传统EA企业架构,EA+AI智能架构的根本变化是对业务和技术进行了重构,将基于GPU计算的架构和CPU架构并行,使其共同支撑业务,筑起了大模型系统环境的基底。
有了智能化的架构作为支撑,卫宁健康在开发大语言模型时便得心应手许多。实际上,卫宁健康为其自主打造的医疗大模型建立了一个智能服务层。这一层位于业务应用与数据处理之间,使得大模型能够实时与业务、数据完成交互,实现任一流程数据的升维与降维,反哺大模型的迭代与升级。
卫宁健康医疗大模型WiNGPT技术框架
当然,系统问题只是诸多落地问题的一个重要分支,要让大模型稳稳运行于医院,开发者们还需要注意一些细节。譬如要尽可能实现“无感”,让医生无需频繁切换便能快速应用大模型的功能。
这一看似常规的要求,却是互联网公司们的一大考验。由于没有HIS、PACS等业务系统,大模型往往以外挂的形式存在。
虽然外挂的形式不会对模型的性能产生过多影响,但对于医生这一使用者而言,每次调用系统便需切入大模型界面进行启动,大模型的体验及工作的流畅程度都将大打折扣。
相比之下,医疗IT公司们显然更具优势。拥有WiNEX作为支撑,卫宁健康能让各科室的医生在完全不改变业务系统操作流程的前提下享受大模型内涵的诸多功能,已在落地环节拔得头筹。
4、大模型便是越大越好?
在讨论通用模型时,模型的参数量很大程度决定了它的知识学习能力与复杂任务处理能力。因此,国内互联网巨头推出通用模型参数量都在千亿级,GPT系列的参数则达到了万亿级。
但在医疗这类垂直领域,模型的量并非越大越好。有的时候,过大的模型,反而会成为限制其商业化的负担。
由于临床相关的数据不能脱离院区,大模型的落地只能通过封装之后入院运行。但现阶段大部分医院现有资源环境基本是以面向通用计算的CPU,很少有医院有面向图形处理和并行计算的GPU资源,缺乏大模型的部署环境,因而需要在购置应用的同时配备GPU运营大模型应用,并保证足够的存储和高速的网络连接。如果模型过大,医院的配置成本也将因此直线上升。
为了解决上述问题,卫宁健康一直尝试保证应用质量的前提下控制参数规模。赵大平表示:“卫宁健康现有的大模型WiNGPT已经可以实现大部分医疗场景需求,它的参数量为130亿。对于这样一个大模型,单个科室GPU及硬件配置成本控制在10万元之内。而在全院应用大模型,也可以采用更多企业级的GPU并行的方案,配置费用也不过百万元。”
那么,什么量级的参数才能完整覆盖医院的整体需求呢?
根据WiNGPT现有的表现,王涛认为:中文医疗大模型的参数可控制于150亿左右,包含语言与多模态影像的大模型参数可控制于500亿内。WiNGPT的目标参数量是130亿,而在即将推出的第三代大模型——医学影像多模态模型中,300亿参数已经可以满足垂直领域的众多需求。
5、医疗大模型需要
一个“杀手级应用”?
到目前为止,许多企业已经在大模型的基础上推出了多个应用。同样以卫宁健康为例,其文书生成可以自动提取重要信息,理解和生成电子病历、出院小结等文档,形成病历章节,减轻医生的工作量;其医学影像解读能够辅助医生解读医学影像,例如X射线、CT、MRI等,生成影像报告、体检报告,提高诊断的准确性和效率……
粗略一看,大部分企业围绕大模型做的仍是传统场景下的应用,没有找到一个杀手级的应用场景,推动大模型的落地。
但这样的形势或许打开一条新的路径。在王涛看来,医疗大模型的定位本就应是“Copilot”(副驾驶),作为医生的智能化助手与医生一起成长,一起解决诊疗科研中的难题,这也是卫宁健康打造大模型的愿景所在。
在未来的理想时代,所谓的“杀手级应用”,便是每一个医生都拥有一个符合自己风格、与自己精准匹配的大模型。
标签:
您可能也感兴趣:
为您推荐
军队抽组医疗力量承担 武汉火神山医院医疗救治任务
同马来西亚总理马哈蒂尔通电话 创造更多合作成果,造福两国和两国人民。
构筑起疫情防控的严密防线
排行
- 腾龙股份股东王柳芳减持302.01万股 价格区间为14.81-15.90元/股
- 因个人资金需要 新泉股份实际控制人唐志华拟减持不超1124.54万股
- 信捷电气股东邹骏宇减持50万股 价格区间为60.41-67.50元/股
- 国家卫健委:湖北以30个省外新增病例17例
- 因自身资金需求 科森科技股东徐宁拟减持不超3.71万股公司股份
- 中公高科股东潘玉利减持50万股 价格区间为20-20.60元/股
- 多地患者治愈后“复阳” 对疫情防控提出新挑战 五大焦点权威解析
- “精诚合作,打赢这一仗!”
- 生态环境部:自1月20日以来全国已累计处置医疗废物12.3万吨 ...
- 承诺两年扭转乱象 银保监会加快推进意外险费率市场化改革 ...
精彩推送
- 医院需要怎样的大语言模型?
- “数字甘肃”架构“智慧城市”
- 人口和发展有什么联系?中国贫穷的原因,真是人口太多造成的?
- 中国已有4镇GDP过千亿,还有这些后备军,这都是中国的实力
- 住阳光房睡吊床 西北“小可爱”发出甜蜜邀约
- 加大项目招引力度 全面增强发展后劲
- 驻美大使谢锋:唱衰别人不会使自己更好, 中国持续发展世界...
- 美团优选进入深水区
- 电商三国杀,攻守互换
- 湖南,想要一个自己的「宁波」?
- 头部Biotech,如何演绎研发「下半场」?
- 合成生物巨头的生死二十年
- 龙虎榜 | 赢合科技昨日跌停,深股通专用买入1.82亿元并卖出2.08亿元
- 调查|温州老板没“躺平”
- 魔兽地图英灵传说怪物攻略(传说中风蛇的祖先
- 工信部:着力加强经济运行监测分析工作;科技赛道性价比再次...
- 竞争日趋白热化!玄派成为新PC黑马的三大秘诀
- 从半年报看消费新趋势(经济聚焦)
- 人民币对瑞典克朗的汇率是多少(8月30日)
- 人民币对墨西哥比索汇率今日 8月30日墨西哥比索汇率查询
- 8月30日人民币对挪威克朗的汇率多少?
- 人民币对泰铢今天汇率多少?8月30日泰铢hill查询
- 人民币对韩元汇率换算今日价格表8月30日
- 财政部发布!
- 财政部:支持稳住外贸外资基本盘,研究支持先进制造业发展政策
- 王传福的“泪”,比亚迪的“天”
- 关爱生命,“救”在身边!滨江社区提升应急响应能力
- 深圳龙华再添2所新学校!润泽学校、冼屋学校交付使用
- 华宁:义诊服务暖民心
- 粉色露肩长袖衫,搭配黑色牛仔短裤,休闲干练不失高级感
- 财政部:加力提效实施好积极的财政政策,加快地方专项债发行使用
- 增速全区第一!上半年柳州工业投资完成192亿元
- 物流数据看亮点 经济发展“脉动”强劲
- 东莞市上市公司协会会长林海川:全面注册制为东莞企业带来更...
- 广深两地均已落地,“认房不认贷”将带来哪些变化?
- 两大一线城市加强产业协作,上海广州瞄准这些重点领域
- “投资上海•全国行”到穗,携手18家湾企签下170亿大单
- 推动卢比国际化!印度急切向非洲多国“推销”数字支付系统【...
- 我国要面对40年未遇的形势,金融战已经打响?看中国如何突围
- 如东县多举措促民营经济高质量发展
- 深业物业再次闯关IPO,这次能成功挺进资本圈吗?
- 拼多多二季度营收523亿,消费恢复态势向好
- 销量回暖产能追上,小鹏与蔚来走出「至暗时刻」
- 旅游市场爆火,消费却降级了?
- 奈雪的茶2023年半年报出炉,营收利润实现双增长
- 半年亏损超4亿港元,直播带货尚未帮香港TVB翻身
- 翔丰华上半年实现营收9.93亿元 可转债获审核通过募资扩大产能
- 聚焦数字新经济,两岸先进城市共话产业新机
- 相互招商,加速“抢企” 上海与粤港澳大湾区瞄准产业互补共...
- 武汉首发“科技创新50强”榜单,利润总额和税后净利润同比增...
- 云南省园区经济高质量发展再创“云南速度”
- 财经观察|多家银行陆续发声:已做好存量房贷利率调整的预案
- 运营8.3万间保租房!万科半年报显示:守住安全底线 财务状况良好
- 广东省教育厅发布中考改革实施意见,深圳继续试行中考自主命题
- 北科生物董事长胡隽源:解决数据源推动医学AI发展
- 中芯集成设立控股子公司“芯联动力”,5家知名新能源产投联合...
- 中芯集成半年报发布:上半年营收增长逾六成 新能源及工...
- 首个!广州发文正式实施购买首套房贷款“认房不认贷”
- 一图读懂 | 四川“1+2”政策体系促进民营经济高质量发展
- 提振香港经济活力 夜经济只是一个措施
- 2023镇域经济500强发布 我市7镇上榜
- 统计局:有序开展2023年能源数据质量核查工作
- 惠企政策促发展!崂山区半年兑现奖励资金7600余万元
- 三六零:上半年实现营收45.03亿 “360智脑”大模型开始创收
- 300亿饮料巨头等待第二曲线
- 怪兽充电连续两季度盈利,共享充电宝又行了?
- 押注空间计算,「资本宠儿」Rokid谋变
- 就开在家门口!龙岗区7所新改扩建学校上“新”!
- 亚马逊被除名,气候承诺沦为「洗绿」的挡箭牌
- 600平方米!洲明LED显示屏点亮FIBA世界杯体育场
- 演唱会「秒空」成历史、音乐节取消三分之一,演出市场「大降...
- 深圳受邀在教育部新闻发布会介绍经验,未来两年将新改扩建10...
- 女子坐轮椅大闹成都车展保时捷展台,家属:我们是去维权,尚...
- 财政部:上半年住房保障支出增长8.5%
- 工业生产回稳、消费继续复苏!东莞公布1-7月经济运行情况
- 央行潘功胜:将保持总体流动性合理充裕 引导金融资源流向民企
- 财政部:截至6月底,中央财政已下达直达资金3.71万亿元
- 一图读懂|北京市关于进一步支持外资研发中心发展的若干措施
- 财政部:上半年财政收入同比增长13.3%
- 渤海汽车:子公司拟投建高端大功率活塞项目
- 内需不足是个收入分配问题
- “2023数字经济助力高质量发展(北京)”论坛举办
- 上汽集团:上半年海外销量达53.3万辆,同比增长40%
- 数字威海|大抓经济 推动高质量发展
- 财政部:上半年31个省份一般公共预算收入同比均实现正增长
- 时尚品牌盯上咖啡快闪店
- 东方甄选入淘「首日破1.75亿」:套娃式返券功不可没?
- 同浪潮站在一处品玩大模型产业主题论坛在沪圆满落幕
- 当国货彩妆比黄金还贵
- BOSS直聘二季报:营收14.88亿元,同比增长33.7%
- 统联精密股东户数下降11.09%,户均持股35.5万元
- 安庆发放消费券助推夏秋消费升温
- 圣经问答题及答案大全220题(圣经问答题及答案大全)
- 经智长三角(268期)丨长三角多地发力总部经济,北京“专精特...
- 央行马贱阳:金融支持民营经济发展相关文件已形成初稿
- 乘联会:8月1-27日乘用车市场零售135.6万辆 同比增长6%
- 工资又涨了?!出版从业者平均年薪18.9万元,你拖后腿了吗?
- 屋顶当作画布装点城市上空!南山“百校焕新行动”让校园屋顶...
- 俄罗斯辣妹COS《边缘行者》露西 OL造型禁欲的诱惑
- 央行召开金融支持民营企业发展工作推进会,多家银行、民企参会