南洋理工新突破:EHRStruct评测基准助力AI医疗决策
创始人
2025-12-15 21:25:55
0

近日,南洋理工大学的研究人员推出了首个全面评测大型语言模型(LLM)处理结构化电子病历(EHR)能力的综合基准EHRStruct。EHRStruct由计算机科学家与医学专家共同构建,覆盖了LLM处理结构化EHR的11项核心任务,包含2,200个标准化样本,为医疗大模型的可控性、可靠性与临床可用性提供统一而严谨的可解释评测框架。

EHRStruct将11项结构化EHR任务按照“情境类型”(数据驱动与知识驱动)和“认知层级”(理解与推理)进行组织,并进一步划分为六类典型任务,包括信息检索、数据聚合、算术计算、临床识别、诊断评估和治疗规划。基于这一任务体系,研究团队对20个主流LLMs与11种先进的增强方法进行了全面的评测,并在此基础上提出了一种代码增强框架EHRMaster。EHRMaster与Gemini联合,使LLM处理结构EHR的性能全面超越SOTA模型。

EHRStruct2026-LLM结构化电子病历挑战赛(EHRStruct2026-LLMStructuredEHRChallenge)也已发布,旨在为研究者提供一个统一、严谨且可对比的LLM处理结构化EHR能力的评测平台,可直接作为论文实验结果的标准基准。Leaderboard已正式在Codabench上线,携手探索LLMs在结构化数据理解与推理上的新边界。

相关内容

热门资讯

小鹏G9L亮相工信部:轴距加长... 5月9日,工信部最新一期申报图中曝光了小鹏汽车的全新车型——小鹏G9L。这款新车在设计上延续了小鹏G...
地块控规修正获批 逾120年黄... 新快报讯 记者陈慕媛报道 新快报记者近日从广州市规划和自然资源局了解到,《广州市道教黄大仙祠AF02...
在当代文学史上留下中阿“同写一... 文/羊城晚报全媒体记者 梁善茵 熊安娜图/主办方提供“青春似火焰源源暖众生,唤醒天地飞奔不了情,冲破...
男子7年间将女友家中近15万元... 近日,辽宁鞍山警方破获了一起男友用练功券替换女友现金的盗窃案件。日前,刘女士发现,家中冰箱里的14....
早接晚送、途经菜市场!广州越秀... 文/羊城晚报全媒体记者 卢佳圳 通讯员 詹苹苹图/欧广傑“妈,明天早上9点,车在楼下接您,晚上5点半...
广州高新区投资集团有限公司党委... 广州市纪委监委5月8日通报:广州高新区投资集团有限公司党委委员、副总经理罗淡彬涉嫌严重违纪违法,目前...
TCL华星t8项目封顶,广州黄... 文/羊城晚报全媒体记者 卢佳圳 通讯员 郑嘉俊 范敏玲图/通讯员提供5月8日,位于广州开发区、黄埔区...
总台记者观察丨日本舆论对高市内... 日本高市早苗内阁推动的设立“国家情报局”相关法案5月8日在日本参议院全体会议进入审议阶段。总台记者 ...
(乡村行·看振兴)广东连江口镇... 中新网清远5月8日电 (张璐 林钰欣)时下,走进清远英德市连江口镇的一片麻竹林,只见翠绿的竹林竹节拔...
馕咖啡风靡北京 | 真相 在新疆,馕不只是食物,更是传承千年的丝路文化符号,是刻在各族人民生活里的烟火底气。从丝路馕香到网红馕...