2月13日下战书,医院会诊室内,13位北京儿童医院着名专家围坐在聚会会议桌一侧,模样形状专注。与这些顶级专家一同会诊的,尚有国内首位AI儿科大夫。 一块屏幕上及时展示着一名疑难病例患儿脑部的磁共振成像影像,随着工作职员将患儿病历及相干影像资料等输入电脑,另一块屏幕上同步呈现着AI儿科大夫对患儿诊疗的深度思索,最终,AI给出的发起与现场专家们的会诊结果高度符合。 这次会诊由北京儿童医院院长、耳鼻咽喉头颈外科专家倪鑫主持,倪鑫告诉《中国消息周刊》,“大产业时看到结果都很惊讶”。现在,每周四,倪鑫都会主持有AI儿科大夫参与的专家会诊,对5—10名患儿的病情全方位讨论。 AI正加速迈向临床应用。在DeepSeek等AI大模子的推动下,医疗行业的智能化进程在加速。据不完全统计,天下已有凌驾100家医院完成DeepSeek的当地摆设。 AI大夫真的靠谱吗?它能否代替人类大夫?这场医疗革命的浪潮中,技能创新、伦理寻衅与羁系体系的博弈,才刚刚开始。 AI加速涌入医院 DeepSeek的影响力,已伸张到了门诊患者中。 2月27日,倪鑫主持了第三次AI儿科大夫参与的专家会诊。一名来自重庆的5岁女孩因不测跌倒,鼻子出现严重红肿并频仍出血,在多家医院就诊未果。由于病情复杂,倪鑫就地未能做出最终诊断,但发起孩子服用一款免疫治疗药物。让他印象深刻的是,会诊结束时,患儿母亲拿出了一张A4纸给他看,上面是她向DeepSeek咨询的问诊记录。“过去,患者看病时,通常会带着不同医院的诊断和病历资料。” 复旦大学附属西岳医院(以下简称“西岳医院”)神经内科主任医师郁金泰对《中国消息周刊》表示,DeepSeek可看作是患者自查工具的“升级版”。过去,人们看病前大概会用百度搜刮相干信息,而现在DeepSeek等提供了更体系化的发起。 现在,医疗AI大模子正如雨后春笋般涌现。 险些天天都有医院公布在DeepSeek根本上摆设AI大模子,或公布与企业相助研发的垂直AI大模子。北京儿童医院的AI儿科大夫便是后者,该大模子由北京儿童医院团结北京百川智能科技有限公司(以下简称“百川智能”)等共同研发。 去年8月,北京儿童医院和百川智能正式官宣相助,筹划推出五款AI医疗产品。此中,参与疑难杂症会诊的AI儿科大夫属于“儿童医学专家临床科研助理”。 百川智能首创人王小川第一天建立百川时,就想“造大夫”,即打造具备专业诊疗本事的AI大夫。在国内的儿科医疗领域,大夫数量严重缺乏。据国家卫生康健委2024年6月份发布的数据,现在天下儿科医师数量仅为20.58万人。去年2月,一次长达两小时的深入交流中,就AI儿科大夫的项目,北京儿童医院和百川智能一拍即合。 “AI大模子就像在‘造人’,它可以或许模仿人类的头脑方式。”百川智能医疗副总裁李施政对《中国消息周刊》表示,最开始百川智能提及的是要“造大夫助手”。结果,倪鑫主动提出“要造100万个儿科大夫”。“第一次AI儿科大夫会诊结束后,当时北京至少有五六家医院主动接洽,思量在将来引入类似技能。”倪鑫表示。 春节前后,DeepSeek的爆火推动了AI大模子的迅猛发展。西岳医院大数据中央主任黄虹告诉《中国消息周刊》,实际上,DeepSeek问世前,医院已在实行摆设其他AI大模子。为了低沉成本,西岳医院并未自行采购算力服务器,而是选择租用其他平台的算力资源,接入医院内网举行测试。 西岳医院大数据中央副主任程思杰告诉《中国消息周刊》,医院完成DeepSeek的接入与硬件摆设,仅用了几天。选择AI大模子时,除了性能,性价比同样是关键考量因素。成本方面,DeepSeek70B版本的硬件成本约为130万元,满血版大模子则必要260万—560万元,硬件成本主要是指算力服务器的费用。“接入DeepSeek只是第一步,真正的寻衅是怎样让它满足医疗级应用标准。” 现在,除了北京儿童医院、西岳医院,天下多家着名三甲医院都在积极摆设AI大模子。西部某省会都会,一家三甲医院外科主任医师赵霖正牵头推进医院的DeepSeek当地大模子摆设。赵霖表示,由于DeepSeek是开源免费的,便于医院根据自身需求当地化调解。现在,团队正在验证AI的学习本事,通过输入权势巨子指南、临床共识以及患者病历,训练AI分析和判断病情的本事。只管AI体系的框架已开端搭建完成,但仍在一连优化。 AI幻觉无法制止 在西岳医院,AI大模子的内部测试已覆盖科研、临床等多个应用场景。 “过去,建立一个包罗1000个不同数据项的临床研究电子数据库,必要研究者和数据库计划师反复沟通,才能天生一个可以在线运行的数据库。现在在AI的辅助下,利用大模子的明白本事,这项工作仅需一两天就能完成。”西岳医院大数据中央副主任刘从进告诉《中国消息周刊》。 除了辅助大夫提供诊疗发起,AI的一个主要应用场景是,在大夫接诊前主动网络和整理患者病历。西岳医院大数据中央一位相干负责人告诉《中国消息周刊》,现在医院内部运行着多个AI大模子版本:7B模子相当于小弟子,32B模子相当于中弟子,满血版则到达了研究生水平。然而,测试发现,在天抱病历等复杂临床使命中,虽然满血版模子参数量更大,但由于无法举行特定微调,实际表现反而不如小模子。 “病历撰写是一项要求较高的使命,尤其是电子病历的天生,必须确保精确性。因此,AI大模子必须颠末严酷测试后,才能在医院投入利用。”程思杰表示,现在医院正在试点融合DeepSeek大模子的不同版本,测试其天生电子病历的本事。不外,AI天生的电子病历仍需大夫考核校验,确保其最终质量和安全性。 AI的输出结果主要基于统计数据。更关键的一个标题是:AI幻觉似乎是难以制止的。所谓幻觉,是指大模子在答复标题时编造信息。 华中科技大学同济医学院附属同济医院感染科副主任医师郭威告诉《中国消息周刊》,现在AI大模子在临床上的辅助应用尚未广泛推广。临床利用中,AI偶然会出现一些令人啼笑皆非的错误。他举例说,影像学的变革非常复杂,偶然所看到的大概是无诊断代价的“干扰信号”,而AI偶然会将其判断为病变。“这也是AI技能训练中一个值得器重的标题。” 赵霖也履历了DeepSeek的AI幻觉。前段时间,由于本科课本更新,他在为弟子准备外科课程时,让DeepSeek帮助制作PPT,结果发现它开始编造内容,包罗杜撰医学名词出处、假造参考文献等。他由此产生了疑问:假如AI用于医学辅助决议,怎样确保它保举的方案是基于真实指南,而不是凭空捏造的?这背后大概会存在严重的医疗风险。 南非顶尖公立研究型大学斯泰伦博斯大学精神病学荣休传授罗宾·埃姆斯利利用ChatGPT时,曾多次遇到过AI幻觉。他在继承《中国消息周刊》采访时谈道,AI幻觉是他现在最为担心的标题。“AI大模子在临床实践中面对的最大标题,是其天生精确可靠信息的本事存在缺陷。” 幻觉通常会被AI自大地呈现,使得它们偶然难以被察觉。医疗领域,任何错误都不可容忍,哪怕是一个微小的失误,也大概危及患者的生命安全。 幻觉的产生,与模子的训练内容密切相干。郁金泰对《中国消息周刊》表示,AI的可靠性取决于输入数据的精确性和专业性。假如输入的信息有误,输出的结果同样会存在毛病。 李施政指出,虽然AI模子堕落较为常见,但在医疗领域,错误必须严酷控制,尤其在用药发起环节。为确保错误率远低于人类大夫,AI大夫的工作必须严酷遵照循证医学原则,即全部决议都必须基于科学证据,包罗权势巨子指南、顶级专家履历和最新研究成果。 “镌汰幻觉出现的关键在于,大模子研发初期,必须严酷把控数据的唯一性和精确性。”倪鑫认为,并非全部医院提供的病历信息等数据,都适当直接用于研究。AI儿科大夫模子训练时,利用的数据是整合医院300多位着名儿科专家的临床履历和专家数十年的高质量病历数据。辅助临床诊断前,AI儿科大夫曾参与四次测试,既包罗专业本事测试,也包罗对幻觉的测试。幻觉测试方面,与DeepSeek做了对比,结果发现AI儿科大夫模子的幻觉率更低。“DeepSeek是一个通用模子,虽然它非常强盛,但并不专注于医疗康健领域。而AI大夫是专门为医疗计划的专业模子,因此,它的表现更为精准。” 临床上,假如大夫依据AI发起而最终发生医疗事故,此中的责任该由谁来负担?北京中医药大学医药卫生法学传授邓勇向《中国消息周刊》分析,责任应根据大夫、医院和AI体系开辟者的不同使命来判断:假如大夫在采纳AI发起时未举行须要的核实,或未对显着不合理的发起提出质疑,则应负担相应责任;医院在引入AI体系时,若未充实评估和验证体系的可靠性,或未对医务职员举行有用的培训和监视,同样必要负担责任;假如因AI体系存在计划缺陷或算法错误而导致错误发起,进而引发事故,开辟者则应负担责任;假如开辟者未能充实分析体系的范围性和潜伏风险,也应负担一定责任。 大夫会被更换吗? 郭威留意到,只管身边大多数大夫对AI大模子等新技能持积极态度,但大夫们也会讨论哪些科室的大夫大概最先会被AI代替。他分析,涉及诊断影像的大夫大概面对更大的被更换风险。比方,AI辅助的X光片和胸部CT阅片,可以或许发现许多肉眼难以察觉的小结节。随着AI技能的不停进步,影像科大夫的工作将更多转向辅助和检察,而不再必要处置惩罚大量的通例影像。 “有些人担心AI大夫的出现,会导致一些大夫赋闲,这不会发生在儿科大夫中。”倪鑫表示,儿科大夫不停处于紧缺状态,AI大夫与人类大夫是相互支持的关系,AI更多是辅助大夫,而非代替他们。 不少一线临床大夫拥抱AI的同时,也保持着冷静。来自感染科、神经内科、外科等科室的多名临床大夫向《中国消息周刊》表示,现在AI在临床中的作用主要是辅助,无法更换大夫的决议。北京大学第一医院神经内科主任医师孙永安对《中国消息周刊》表示,只管AI在分析和整合现有数据方面表现精彩,但它缺乏真正的创新本事,无法独立探索未知领域。而医学的进步每每泉源于突破性的创新。 “无论技能多先进,AI始终难以更换大夫的深度思索和即时应变。”武汉一家摆设DeepSeek的三甲医院急诊科大夫魏明告诉《中国消息周刊》,急诊科偶然也必要对患者举行淋巴结活检。比方,在颈部举行淋巴结活检时,影像上表现的病变大概靠近血管,手术过程中,大夫必须亲身观察并判断,风雅分离淋巴结,同时防止出血。纵然AI能标出大致病灶位置,怎样避开关键布局、确保安全切除,仍需大夫根据病人具体情况作出判断。大夫仍旧是最终的决议者。 郁金泰表示,大夫不但具备专业配景,还能基于临床履历综合判断病情,这正是AI无法完全代替大夫的焦点所在。 此前的疑难杂症会诊中,曾有一个让倪鑫印象深刻的患儿病例。当时AI儿科大夫给出的发起是,要给病人做病理穿刺,但倪鑫最终决定不做。“从影像学的角度来看,我和AI的判断根本同等,都认为该患儿患的是皮样囊肿。这种病是上皮组织不停脱落、堆积后形成的囊肿,算一种天赋性病变,但非恶性。这种情况下,我认为没有须要做有风险的穿刺,而且穿刺并不会带来更多有代价的信息。”倪鑫认为,AI的分析是基于大数据的,逻辑非常缜密,认为穿刺病理能提供更确切的答案,这个发起并不算错。 制止盲目跟风 AI在医疗领域的发展,不会停下脚步。“100万个儿科大夫,这个目的听起来弘大,但现在已经根本实现了。我们的大模子理论上可以诞天生千上万的AI儿科大夫。”倪鑫谈道,河北当地有150多家下层医院,盼望能成为AI儿科大夫的首批试点。北京儿童医院和百川智能筹划先在京津冀地区的医院举行试点,再将AI儿科大夫推广到天下各地。 黄虹表示,DeepSeek只是众多大模子中的一种,而大模子自己并非固定稳定。从医院角度看,将来不但关注单一模子的应用,而且要思索怎样整合多种大模子,以便为不同领域提供精准支持。“将来的AI医疗大概是‘千模融合’。” 除了医院自身搭建的AI大模子,捏造的AI医院正实行走向临床。清华智能研究院实行院长刘洋向导了一项有关智能体医院(Agent Hospital)的研究,这项研究现在只在预印版网站上发布。刘洋是该研究的通讯作者之一。智能体医院的焦点理念,是通过建立一个“闭环式”的医疗捏造天下,实现AI大夫的加速进化。所谓闭环式,是指涵盖从发病、分诊、问诊到全愈的一系列医疗环节,AI大夫可以根据这些反馈不停总结并优化自身的本事。 去年11月,智能体医院的首批42位AI大夫在21个科室上线举行内测,支持凌驾300种疾病的诊疗。“智能体是在大模子根本上的进一步发展,由于它可以或许让AI像人类一样,在复杂情况中举行交互、利用工具并与他人协作。”刘洋表示,将来的目的是构建一个能与实际天下无缝对接的智能医疗体系,随着VR等技能的进步,将来的医疗交互不但仅范围于2D界面利用,而大概进入更加立体的3D空间。 据赵霖相识,很多医院开展的AI大模子项目,现在还处于验证和测试阶段,现阶段真正落地临床,并发挥作用的比例并不高。在他看来,现在国内不少医院面对着较大的生存压力,不乏有医院为了寻求热门、提升影响力,纷纷接入DeepSeek等AI工具,这乃至推高了设置GPU的服务器的代价。但最终转化为实际应用,还是流于情势,现在还是未知数。将来,大概只有少数高质量的大模子项目能得以存活。 郭威也持审慎态度。他指出,眼下各家医院蜂拥而上,这种“凑热闹”的方式,着实更多是出于一种“怕落伍”的生理,而非真正基于技能和临床需求的深入研究。黄虹认为,医院在接入AI大模子的过程中,要充实思量安全、成本、实用性等多方面因素。对于大多数医院而言,怎样确保资金投入到焦点业务中,是必须思量的标题。 邓勇指出,当下,医疗领域的AI大模子缺乏行业标准,这会导致不同机构的大模子在数据收罗、标注和算法计划等方面存在差异,这不但影响了体系的通用性和利用性,还大概增长羁系难度,进而影响医疗质量和安全。因此,订定同一的标准尤为迫切。 “AI医疗的发展不能一哄而上,只有科学规划、稳步推进,才能真正发挥其代价。”上海市卫生和康健发展研究中央主任金春林继承《中国消息周刊》采访时表示,只管当前AI大模子在医疗行业的热度很高,但应制止盲目跟风。他发起,起首要确保数据安全,强化隐私掩护,进而推动行业的有序发展,同时还应建立真正的多中央大数据体系,由多个医疗机构或研究中央共同参与,按照同一的研究计划和标准,协同网络、整合、存储和分析医疗大数据,制止重复建立。
(此诗由DeepSeek联合本文内容创作) (文中赵霖、魏明均为化名) 发于2025.3.17总第1179期《中国消息周刊》杂志 杂志标题:AI大夫来了,靠谱吗? 记者:牛荷 编辑:杜玮 |

专注IT众包服务
平台只专注IT众包,服务数 十万用户,快速解决需求

资金安全
交易资金托管平台,保障资 金安全,确认完成再付款

实力商家
优秀软件人才汇集,实力服务商入驻,高效解决需求

全程监管
交易过程中产生纠纷,官方100%介入受理,交易无忧

微信访问
手机APP