1. 任务背景
代谢性疾病(如糖尿病、高血压、脂肪肝等)是具有复杂病理机制与显著个体差异性的重大慢性疾病,严重威胁人民健康和社会发展。在临床实践中,合并多种代谢性疾病的患者治疗方案复杂,药物的选择需综合既往病史、合并用药、并发症等多重因素。探索创新的药物管理模式,辅助医师与药师制定精准、个体化治疗方案,对于提升疗效、降低不良反应具有重要意义。
在“住院—社区/家庭”闭环管理中,出院带药是实现院内外治疗衔接的核心环节,直接影响到疾病控制效果和再入院风险。而住院期间产生的大量信息(病程记录、检验检查结果、用药记录)难以在出院时被快速、全面整合至用药决策。中文电子病历蕴含患者完整诊疗信息,为构建个性化用药推荐系统提供了关键数据支撑。随着人工智能技术的快速发展,基于电子病历的智慧药学与精准治疗研究已成为医疗人工智能的重要方向。本评测任务聚焦“基于住院电子病历的出院用药智能推荐”,旨在通过给定患者住院电子病历信息,自动生成出院用药推荐,提升合理用药水平,改善慢性病长期预后。
评测网站链接: https://tianchi.aliyun.com/competition/entrance/532411
2. 任务内容
本评测任务面向真实的、经过去敏化处理的医院电子病历数据,评估和比较各参赛模型在出院用药推荐中的性能。任务定义为给定一段由自然语言文本书写的患者住院病历信息(包括现病史、主诉、诊疗信息等),模型需要推荐患者出院时应携带的药物列表。
任务输入:患者电子病历中除出院用药信息以外的相关字段,主要包括主诉、现病史、既往史、入院情况、诊疗过程、出院诊断等信息。
任务输出:患者出院应携带的药物名称集合(不超出附件《候选药物列表》范围,共651种药物)。
参赛队伍可采用传统神经网络模型、预训练语言模型、大模型等技术方案(要求模型参数不超过10B),可以对模型进行提示学习或者微调,亦可使用检索增强生成(需声明外部知识库来源)。
3. 数据集
本任务构建了一个专门用于评估代谢性疾病用药推荐的数据集(CDrugRed),数据基于大连医科大学附属第二医院的脱敏病历构成,共3,190例患者的5,894条诊疗记录。数据划分为训练集、开发集(A榜测试集)和测试集(B榜测试集),其中开发集和测试集不包含标准答案,需在线提交预测结果。
本评测任务使用以下评测指标,其中\(y\)为真实药物集合,\(\hat{y}\)为模型预测的药物集合,\(|X|\)表示集合\(X\)的元素个数:
Jaccard: 用于衡量两个集合的相似度,等于它们交集的大小除以它们并集的大小。
Precision(精确率)
Recall(召回率)
F1分数
评价总指标
其中\(y_i\)是第\(i\)条数据的真实药物集合,\(\hat{y}_i\)是模型预测的第\(i\)条数据的药物集合,\(N\)表示总数据量。最终排名以评价总指标为准。
5. 结果提交
6. 奖励设置
本任务为学术评测任务,获奖队伍将会获得获奖证书,进行大会汇报、发表英文评测论文(EI收录)。
7. 参赛规则
1. 每名选手仅限注册一个账号,一旦发现选手注册多个账号进行提交,将取消所有账号的参赛资格。
2. 允许使用外部资源,包括但不限于代码、工具和数据,要求所使用的资源是公开可获取,须注明来源。
3. 获奖队伍需要注册并参加CHIP会议,在会议上进行口头汇报,撰写技术论文,否则取消参赛成绩,名次递补。(注:会议注册费、食宿交通费用由参赛团队自理)。
4. 国内外在校生及企业人员均可参赛,个人必须依托单位报名参赛,比赛组织方成员不得参赛。实名认证说明:参加比赛的队伍(包括队长及全体队伍成员)需要在报名截止前完成实名认证(认证入口:官网-右上角个人中心-认证),未完成认证的参赛队伍将被取消比赛资格。
5. 组队人数限制1-5人。
6. 每日提交结果次数为3次。
7. 该任务数据仅用于本次评测,如需用于其他目的,请与任务组织者联系。
8. 获奖队伍材料提交
获奖队伍需提交如下材料:
1. 相关代码及说明。
2. 评测论文,可参考往届CHIP会议评测论文(http://www.cips-chip.org.cn/2024/accepted)。
3. 如果方法使用了额外公开的数据资源,要求说明并提供资源文件或地址,包括但不限于代码、工具和数据。要求所使用的资源是公开可获取的。
选手需要将以上材料在评测论文提交截止日期前发送至邮箱,邮箱地址:CDrugRed@163.com,邮件的标题为:“CHIP2025Task2-评测材料-参赛队伍名称”。代码及文档需打包成一个文件(zip,rar等均可),作为邮件附件传送。
说明: 若没有提交上述材料,将视为自动放弃参与评奖。评奖资格将会自动顺延至排名紧随其后的队伍。
9. 日程安排
报名时间:9月1日-10月21日
训练、开发集数据发布、A榜评测开始:9月1日
A榜评测截止:10月21日 18:00:00
测试集数据发布、B榜评测开始: 10月22日 9:00:00
B榜评测截止:10月25日 18:00:00
评测论文提交截止:11月8日(暂定)
会议日期(评测汇报及颁奖):11月22日-11月24日
10. 评测任务组织者
代谢性疾病(如糖尿病、高血压、脂肪肝等)是具有复杂病理机制与显著个体差异性的重大慢性疾病,严重威胁人民健康和社会发展。在临床实践中,合并多种代谢性疾病的患者治疗方案复杂,药物的选择需综合既往病史、合并用药、并发症等多重因素。探索创新的药物管理模式,辅助医师与药师制定精准、个体化治疗方案,对于提升疗效、降低不良反应具有重要意义。
在“住院—社区/家庭”闭环管理中,出院带药是实现院内外治疗衔接的核心环节,直接影响到疾病控制效果和再入院风险。而住院期间产生的大量信息(病程记录、检验检查结果、用药记录)难以在出院时被快速、全面整合至用药决策。中文电子病历蕴含患者完整诊疗信息,为构建个性化用药推荐系统提供了关键数据支撑。随着人工智能技术的快速发展,基于电子病历的智慧药学与精准治疗研究已成为医疗人工智能的重要方向。本评测任务聚焦“基于住院电子病历的出院用药智能推荐”,旨在通过给定患者住院电子病历信息,自动生成出院用药推荐,提升合理用药水平,改善慢性病长期预后。
评测网站链接: https://tianchi.aliyun.com/competition/entrance/532411
2. 任务内容
本评测任务面向真实的、经过去敏化处理的医院电子病历数据,评估和比较各参赛模型在出院用药推荐中的性能。任务定义为给定一段由自然语言文本书写的患者住院病历信息(包括现病史、主诉、诊疗信息等),模型需要推荐患者出院时应携带的药物列表。
3. 数据集
本任务构建了一个专门用于评估代谢性疾病用药推荐的数据集(CDrugRed),数据基于大连医科大学附属第二医院的脱敏病历构成,共3,190例患者的5,894条诊疗记录。数据划分为训练集、开发集(A榜测试集)和测试集(B榜测试集),其中开发集和测试集不包含标准答案,需在线提交预测结果。
3.1 数据规模
表 1 数据规模
数据集 | 患者人数 | 病历条数 |
---|---|---|
训练集 | 1,910 | 3,602 |
开发集 | 320 | 570 |
测试集 | 960 | 1,722 |
3.2 字段说明
患者序号:患者的唯一标识符。
就诊标识:就诊记录的唯一编号,每位患者可能有多条记录。
性别:患者的性别信息。
出生日期:患者的出生年月。
民族:患者的民族信息。
BMI:患者身体质量指数。
就诊时间:患者入院就诊时间。
诊疗过程描述:患者住院期间的诊断和治疗过程,包括检验、检查等信息。
入院情况:患者入院时的身体状况及相关背景信息,比如入院原因、症状表现、生命体征等。
现病史:患者当前疾病的发生和发展过程,包括症状出现的时间、特点、加重或缓解因素等。
既往史:患者过去曾经患过的疾病、接受过的治疗、手术情况等信息。
主诉:患者来医院就诊时主要的不适或症状。
出院诊断:患者出院时的最终疾病诊断结果。
出院带药列表:患者出院时开具的药物列表(开发集和测试集此字段为空)
3.3 数据样例
图 1:数据样例
4. 评价指标

图 1:数据样例
本评测任务使用以下评测指标,其中\(y\)为真实药物集合,\(\hat{y}\)为模型预测的药物集合,\(|X|\)表示集合\(X\)的元素个数:
\[Jaccard = \frac{1}{N} \sum_{i=1}^{N} \frac{|y_i \cap \hat{y}_i|}{|y_i \cup \hat{y}_i|}\]
\[Precision(y_i, \hat{y}_i) = \frac{|y_i \cap \hat{y}_i|}{|\hat{y}_i|}\]
\[AVG_P = \frac{1}{N} \sum_{i=1}^N Precision(y_i, \hat{y}_i)\]
\[\text{Recall}(y_i, \hat{y}_i) = \frac{|y_i \cap \hat{y}_i|}{|y_i|}\]
\[AVG_R = \frac{1}{N} \sum_{i=1}^N \text{Recall}(y_i, \hat{y}_i)\]
\[F_1(y_i, \hat{y}_i) = 2 \cdot \frac{\text{Precision}(y_i, \hat{y}_i) \cdot \text{Recall}(y_i, \hat{y}_i)}{\text{Precision}(y_i, \hat{y}_i) + \text{Recall}(y_i, \hat{y}_i)}\]
\[F1 = \frac{1}{N} \sum_{i=1}^N F_1(y_i, \hat{y}_i)\]
\[Score = \frac{1}{2} \cdot (Jaccard + F1)\]
其中\(y_i\)是第\(i\)条数据的真实药物集合,\(\hat{y}_i\)是模型预测的第\(i\)条数据的药物集合,\(N\)表示总数据量。最终排名以评价总指标为准。
5. 结果提交
5.1 提交方式
比赛设立A榜阶段与B榜阶段两个环节,具体安排如下:
A榜阶段(开发阶段):参赛队伍在成功报名后,可通过天池平台下载训练数据和A榜测试数据集(开发集)文件,在本地进行模型调试与训练,并在线提交评测结果。A榜阶段成绩仅用于模型开发调优,不计入比赛最终成绩。且A榜测试集答案不公开,不用于B榜阶段模型训练。
B榜阶段(最终评测):B榜阶段将开放B榜测试数据集(测试集)供下载,参赛队伍需根据该数据集生成预测结果并提交至天池平台,各队伍在B榜阶段的历史最优成绩作为最终排名与奖项评定的依据。
提交说明
每支参赛队伍每日最多可向天池平台提交3次评测结果。
排行榜整点更新,按评测指标从高到低进行排名。
评测失败不扣除提交次数。
比赛设立A榜阶段与B榜阶段两个环节,具体安排如下:
5.2 提交格式
A榜和B榜均要求提交对应测试集预测结果的Json文件,文件编码为UTF-8,具体格式如下:
图 2:提交文件格式
字段说明:
ID:对应就诊标识
prediction:预测的药物名称列表(须与附件《候选药物列表》一致)
A榜和B榜均要求提交对应测试集预测结果的Json文件,文件编码为UTF-8,具体格式如下:

图 2:提交文件格式
6. 奖励设置
本任务为学术评测任务,获奖队伍将会获得获奖证书,进行大会汇报、发表英文评测论文(EI收录)。
7. 参赛规则
1. 每名选手仅限注册一个账号,一旦发现选手注册多个账号进行提交,将取消所有账号的参赛资格。
2. 允许使用外部资源,包括但不限于代码、工具和数据,要求所使用的资源是公开可获取,须注明来源。
3. 获奖队伍需要注册并参加CHIP会议,在会议上进行口头汇报,撰写技术论文,否则取消参赛成绩,名次递补。(注:会议注册费、食宿交通费用由参赛团队自理)。
4. 国内外在校生及企业人员均可参赛,个人必须依托单位报名参赛,比赛组织方成员不得参赛。实名认证说明:参加比赛的队伍(包括队长及全体队伍成员)需要在报名截止前完成实名认证(认证入口:官网-右上角个人中心-认证),未完成认证的参赛队伍将被取消比赛资格。
5. 组队人数限制1-5人。
6. 每日提交结果次数为3次。
7. 该任务数据仅用于本次评测,如需用于其他目的,请与任务组织者联系。
8. 获奖队伍材料提交
获奖队伍需提交如下材料:
1. 相关代码及说明。
2. 评测论文,可参考往届CHIP会议评测论文(http://www.cips-chip.org.cn/2024/accepted)。
3. 如果方法使用了额外公开的数据资源,要求说明并提供资源文件或地址,包括但不限于代码、工具和数据。要求所使用的资源是公开可获取的。
选手需要将以上材料在评测论文提交截止日期前发送至邮箱,邮箱地址:CDrugRed@163.com,邮件的标题为:“CHIP2025Task2-评测材料-参赛队伍名称”。代码及文档需打包成一个文件(zip,rar等均可),作为邮件附件传送。
说明: 若没有提交上述材料,将视为自动放弃参与评奖。评奖资格将会自动顺延至排名紧随其后的队伍。
9. 日程安排
报名时间:9月1日-10月21日
训练、开发集数据发布、A榜评测开始:9月1日
A榜评测截止:10月21日 18:00:00
测试集数据发布、B榜评测开始: 10月22日 9:00:00
B榜评测截止:10月25日 18:00:00
评测论文提交截止:11月8日(暂定)
会议日期(评测汇报及颁奖):11月22日-11月24日
10. 评测任务组织者
组织单位
大连理工大学 罗凌、王健、孙媛媛、林鸿飞
大连医科大学附属第二医院 姜衍、王帆、张萍、吕慧怡
大连理工大学 罗凌、王健、孙媛媛、林鸿飞
大连医科大学附属第二医院 姜衍、王帆、张萍、吕慧怡
联系人
李俊涛 (juntaoli@mail.dlut.edu.cn)
袁浩斌 (yhhhhb@mail.dlut.edu.cn)
李俊涛 (juntaoli@mail.dlut.edu.cn)
袁浩斌 (yhhhhb@mail.dlut.edu.cn)
钉钉群
大赛官方钉钉群请扫码加入,最新通知将会第一时间在群内同步:
图 3:钉钉群
大赛官方钉钉群请扫码加入,最新通知将会第一时间在群内同步:

图 3:钉钉群