南洋理工新突破:EHRStruct评测基准助力AI医疗决策
创始人
2025-12-15 21:25:55
0

近日,南洋理工大学的研究人员推出了首个全面评测大型语言模型(LLM)处理结构化电子病历(EHR)能力的综合基准EHRStruct。EHRStruct由计算机科学家与医学专家共同构建,覆盖了LLM处理结构化EHR的11项核心任务,包含2,200个标准化样本,为医疗大模型的可控性、可靠性与临床可用性提供统一而严谨的可解释评测框架。

EHRStruct将11项结构化EHR任务按照“情境类型”(数据驱动与知识驱动)和“认知层级”(理解与推理)进行组织,并进一步划分为六类典型任务,包括信息检索、数据聚合、算术计算、临床识别、诊断评估和治疗规划。基于这一任务体系,研究团队对20个主流LLMs与11种先进的增强方法进行了全面的评测,并在此基础上提出了一种代码增强框架EHRMaster。EHRMaster与Gemini联合,使LLM处理结构EHR的性能全面超越SOTA模型。

EHRStruct2026-LLM结构化电子病历挑战赛(EHRStruct2026-LLMStructuredEHRChallenge)也已发布,旨在为研究者提供一个统一、严谨且可对比的LLM处理结构化EHR能力的评测平台,可直接作为论文实验结果的标准基准。Leaderboard已正式在Codabench上线,携手探索LLMs在结构化数据理解与推理上的新边界。

相关内容

热门资讯

以下是一些改写“回应民生关切”... 回应民生关切是政府工作的重要使命。通过加强政策调研,精准把握民众需求,制定切实可行的举措。在教育方面...
走私出境孕妇血样超10万人份,... 孕妇血样承载着人类遗传基因关键信息,属国家严格限制进出口物品。近日,广州海关缉私局成功破获特大走私孕...
以下是一些改写“回应民生关切”... 回应民生关切是政府工作的重要使命。通过加强政策调研,精准把握民众需求,制定切实可行的举措。在教育方面...
红旗HS6PHEV震撼上市,1... 12月16日,红旗HS6PHEV正式上市,推出3款车型,售价17.88-22.88万元。新车采用全新...
蔚来ET5/ET5T远空套装限... 12月16日,蔚来汽车推出了ET5和ET5T远空套装限定版,限量555台。蔚来ET5远空套装限定版的...
迈向“演艺之城”:一场巨星演唱... 12月15日晚,五月天“5525回到那一天”25周年巡回演唱会广州站在广州南沙区落下帷幕。为期多场的...
以下是一些改写“回应民生关切”... 回应民生关切是政府工作的重要使命。通过加强政策调研,精准把握民众需求,制定切实可行的举措。在教育方面...
赣州网红“橙子墙”有橙子发霉了... 12月15日,有网友发布视频称,在江西赣州宋潮不夜城的网红“橙子墙”上,发现有几颗橙子已经发霉。视频...
最高1600万元扶持资金!广州... 12月16日,广州市海珠区琶洲管委会,就《广州市海珠区建设人工智能大模型应用示范区实施细则(修订稿)...
以下是一些改写“回应民生关切”... 回应民生关切是政府工作的重要使命。通过加强政策调研,精准把握民众需求,制定切实可行的举措。在教育方面...