CHIP2019评测一:临床术语标准化任务

 共有20支队伍提交结果。
 总体情况:
评价指标 Maximum Minimum Mean Median
accuracy 0.94825 0.351083 0.79747 0.831417
 前三名参赛结果:
排名 参赛单位 队伍名称 结果
1 云知声智能科技股份有限公司 Dolphin-ICI 0.948250
2 阿里巴巴 BioMed_NLP 0.927197
3 北京中科凡语科技有限公司 凡医 0.913417
 会议口头报告:
排名 参赛单位 队伍名称 报告人 报告题目
1 云知声智能科技股份有限公司 Dolphin-ICI 崇伟峰 基于BERT蕴含分数排序的术语标准化系统
2 阿里巴巴 BioMed_NLP 谭传奇 基于检索和重排序的手术名称标准化研究
3 北京中科凡语科技有限公司 凡医 薛晨 深度生成式模型在临床术语标准化中的应用
 会议海报:
排名 参赛单位 队伍名称 海报题目
4 大连理工大学信息检索实验室文本挖掘组 DUTIRTM DUTIR临床术语标准化评测报告
5 北京协和医学院/中国医学科学院医学信息研究所 努力!奋斗! 基于文本相似度和BERT的临床术语标准化方法
6 个人 2019萌新 变分术语嵌入:基于变分自编码器(VAE)的临床术语标准化方法
7 北京深睿博联科技有限责任公司 SR_BJ_R&D 基于BERT-迁移学习与规则匹配模型的临床术语标准化方案
8 山西大学计算机与信息技术学院 深兰 基于生成模型的术语标准化
9 中国医学科学院医学信息研究所 和协队 面向电子病历语义规范化的术语标准化研究
10 中国医学科学院医学信息研究所 评测小分队 基于BERT句向量和相似度计算的临床术语标准化
 注:前十名队伍均展示海报,前三名海报题目与报告题目相同。

CHIP2019评测二:平安医疗科技疾病问答迁移学习比赛

 共有40支队伍提交结果。
 总体情况:
评价指标 Maximum Minimum Mean Median
F1值 0.90257 0.49667 0.82322 0.85681
 前三名参赛结果:
排名 参赛单位 队伍名称 模型 模型集成 特征 其他 外部资源 模F1值
1 华南理工大学 wzm roberta-zh-large roberta-wwm-ext-large bert-wwm-ext xgboost、lightgbm 图特征、 交互特征 同义词替换 开源词向量矩阵 0.90257
2 福建亿榕信息技术有限公司 upside-down roberta-wwm-ext-large bert-base roberta-base bert-wwm-ext 优化器替换 0.86927
3 哈尔滨工业大学(深圳) 榴莲班戟 roberta-wwm-ext-large 预训练、 self-atention 0.86909
 会议口头报告:
排名 参赛单位 队伍名称 报告人 报告题目
1 华南理工大学 wzm 吴梓明 基于BERT与提升树模型的语义匹配方法
2 福建亿榕信息技术有限公司 upside-down 宋立华 自然语言处理流水线作业探索及评测实践
3 哈尔滨工业大学(深圳) 榴莲班戟 伏冠宇 Semantic similarity model of medical questions based on fusion pre-training model

CHIP2019评测三:临床试验筛选标准短文本分类

 共有27支队伍提交结果。
 总体情况:
评价指标 Maximum Minimum Mean Median
Average F1 0.810263 0.553736 0.770502 0.788728
 前三名参赛结果:
排名 参赛单位 队伍名称 使用方法 外部资源 Average F1
1 华南理工大学 wzm 语言模型Bert、RoBERTa、LightGBM,最后加权平均 0.810263
2 大连理工大学 DUTIR914 语言模型(Bert、RoBERTa) + 深度学习模型(CNN,DPCNN,LSTM以及注意力机制),模型融合 http://www.chictr.org.cn/index.aspx 0.809936
3 大连理工大学 DUTIRTM 语言模型+神经网络(ERNIE+CNN、ERNIE+ATT、RoBERTa+CNN和RoBERTa+ATT) 0.807456
 会议口头报告:
排名 参赛单位 队伍名称 报告题目 报告人
1 华南理工大学 wzm 基于BERT与模型融合的短文本分类方法 吴梓明
2 大连理工大学 DUTIR914 一种基于预训练模型的医学短文本分类方法 李孟颖
3 大连理工大学 DUTIRTM 基于BERT融合多特征的临床试验筛选标准短文本分类 丁泽源
 会议海报:
排名 参赛单位 队伍名称 作者 海报题目
4 中山大学 好果汁队 潘智伟,舒丁飞 基于多模型集成学习的临床试验筛选标准短文本分类
5 中国医学科学院医学信息研究所 努力!奋斗! 杨飞洪,李姣 基于BERT模型的临床试验筛选短文本分类
6 北京中科凡语科技有限公司 mini batch 王克欣,张萌、王祥宇、付西娜、于志鹏 多模型融合的文本分类算法在临床试验筛选中的应用
7 中南大学 Morning Tea 伍逸凡,余颖 ,李敏 基于不同词向量特征的临床试验筛选标准短文本分类
8 郑州大学 zzunlp 蔡林坤,刘涛 临床试验筛选标准短文本分类
9 新疆大学 A&D 阿依古丽·哈力克,吴迪、李磊 基于ERNIE的文本分类
 注:前九名队伍均展示海报,前三名海报题目与报告题目相同。

CHIP2020评测一:中文医学文本命名实体识别

 共有37支队伍提交结果。
 总体情况:
评价指标 Maximum Minimum Mean Median
F1值 0.6835 0 0.5548 0.6491
 前三名参赛结果:
排名 参赛单位 队伍名称 使用方法/th> 外部资源 F1值
1 腾讯天衍实验室 yangyf 预训练模型+MRC;预训练模型+CRF;词增强 医疗网站上的相关文本 0.6835
2 纽约大学 xi 1.基于CRF的实体抽取,结合阅读理解完成训练
2.采取词汇增强,动态规划文本分割,半监督数据增强及模型融合方法增强效果
0.6825
3 北京理工大学 信息抽取三元组 biaffine、伪标、模型融合、MRC-QA 开源预训练语言模型 0.6824
 会议口头报告:
报告人 单位 报告题目
杨奕凡 腾讯天衍实验室 基于领域自适应和词增强的实体识别方案
娄杰 零氪科技 基于多种策略组合的嵌套实体抽取

CHIP2020评测二:中文医学文本实体关系抽取

 共有17支队伍提交结果。
 总体情况:
评价指标 Maximum Minimum Mean Median
F1值 0.6486 0.2760 0.5515 0.5662
 前三名参赛结果:
排名 参赛单位 队伍名称 使用方法 外部资源 F1值
1 零氪科技 信息抽取三元组 对抗训练、多头选择、指针标注、模型融合 开源预训练语言模型 0.6486
2 腾讯天衍实验室 zyy_77 基于流模型解码和词增强的实体关系联合抽取 0.6387
3 中国科学技术大学 guanchong 0.6378
 会议口头报告:
报告人 单位 报告题目
娄杰 零氪科技 融合BERT与多头选择机制的关系抽取
张云燕 腾讯天衍实验室 基于流模型解码和词增强的实体关系联合抽取
叶元 北京大学 两阶段医疗实体关系联合抽取

CHIP2020评测三:临床术语标准化任务

 共有9支队伍提交结果。
 总体情况:
评价指标 Maximum Minimum Mean Median
F1值 0.725546 0.267261 0.447778 0.303357
 前三名参赛结果:
排名 参赛单位 队伍名称 F1
1 零氪科技LinkDoc 信息抽取三元组 0.725546
2 中国科学院自动化研究所, 云知声智能科技股份有限公司 Magikarp 0.688145
3 平安科技智能疾病管理团队 先随便填 0.630878
 会议口头报告:
报告人 单位 报告题目
娄杰 零氪科技 一种基于召回排序两阶段的医疗术语标准化方案
周桐 中国科学院自动化研究所,云知声智能科技股份有限公司 三元文本蕴含的临床术语标准化方法
袁正 清华大学工业工程系统计学研究中心 规则增强的中文术语正则化

CHIP2020评测四:新冠肺炎趋势预测

 共有2支队伍提交结果。
 总体情况:
评价指标 Maximum Minimum Mean
差异率 5.319205673 4.335495277 4.827350475
 前两名参赛结果:
排名 参赛单位 队伍名称 差异率
1 华南理工大学 不知叫啥队 4.335495277
2 大连大学 耀阳 5.319205673
 会议口头报告:
报告人 单位 报告题目
刘奕鑫 华南理工大学 基于XGBOOST的新冠疫情预测
吴安奇 大连大学 LSTM与多类型时间序列融合的时序数据预测方法