CHIP2019评测一:临床术语标准化任务
 共有20支队伍提交结果。
 总体情况:
评价指标 | Maximum | Minimum | Mean | Median |
---|---|---|---|---|
accuracy | 0.94825 | 0.351083 | 0.79747 | 0.831417 |
 前三名参赛结果:
排名 | 参赛单位 | 队伍名称 | 结果 |
---|---|---|---|
1 | 云知声智能科技股份有限公司 | Dolphin-ICI | 0.948250 |
2 | 阿里巴巴 | BioMed_NLP | 0.927197 |
3 | 北京中科凡语科技有限公司 | 凡医 | 0.913417 |
 会议口头报告:
排名 | 参赛单位 | 队伍名称 | 报告人 | 报告题目 |
---|---|---|---|---|
1 | 云知声智能科技股份有限公司 | Dolphin-ICI | 崇伟峰 | 基于BERT蕴含分数排序的术语标准化系统 |
2 | 阿里巴巴 | BioMed_NLP | 谭传奇 | 基于检索和重排序的手术名称标准化研究 |
3 | 北京中科凡语科技有限公司 | 凡医 | 薛晨 | 深度生成式模型在临床术语标准化中的应用 |
 会议海报:
排名 | 参赛单位 | 队伍名称 | 海报题目 |
---|---|---|---|
4 | 大连理工大学信息检索实验室文本挖掘组 | DUTIRTM | DUTIR临床术语标准化评测报告 |
5 | 北京协和医学院/中国医学科学院医学信息研究所 | 努力!奋斗! | 基于文本相似度和BERT的临床术语标准化方法 |
6 | 个人 | 2019萌新 | 变分术语嵌入:基于变分自编码器(VAE)的临床术语标准化方法 |
7 | 北京深睿博联科技有限责任公司 | SR_BJ_R&D | 基于BERT-迁移学习与规则匹配模型的临床术语标准化方案 |
8 | 山西大学计算机与信息技术学院 | 深兰 | 基于生成模型的术语标准化 |
9 | 中国医学科学院医学信息研究所 | 和协队 | 面向电子病历语义规范化的术语标准化研究 |
10 | 中国医学科学院医学信息研究所 | 评测小分队 | 基于BERT句向量和相似度计算的临床术语标准化 |
 注:前十名队伍均展示海报,前三名海报题目与报告题目相同。
CHIP2019评测二:平安医疗科技疾病问答迁移学习比赛
 共有40支队伍提交结果。
 总体情况:
评价指标 | Maximum | Minimum | Mean | Median |
---|---|---|---|---|
F1值 | 0.90257 | 0.49667 | 0.82322 | 0.85681 |
 前三名参赛结果:
排名 | 参赛单位 | 队伍名称 | 模型 | 模型集成 | 特征 | 其他 | 外部资源 | 模F1值 |
---|---|---|---|---|---|---|---|---|
1 | 华南理工大学 | wzm | roberta-zh-large roberta-wwm-ext-large bert-wwm-ext xgboost、lightgbm | 有 | 图特征、 交互特征 | 同义词替换 | 开源词向量矩阵 | 0.90257 |
2 | 福建亿榕信息技术有限公司 | upside-down | roberta-wwm-ext-large bert-base roberta-base bert-wwm-ext | 有 | 无 | 优化器替换 | 无 | 0.86927 |
3 | 哈尔滨工业大学(深圳) | 榴莲班戟 | roberta-wwm-ext-large | 有 | 无 | 预训练、 self-atention | 无 | 0.86909 |
 会议口头报告:
排名 | 参赛单位 | 队伍名称 | 报告人 | 报告题目 |
---|---|---|---|---|
1 | 华南理工大学 | wzm | 吴梓明 | 基于BERT与提升树模型的语义匹配方法 |
2 | 福建亿榕信息技术有限公司 | upside-down | 宋立华 | 自然语言处理流水线作业探索及评测实践 |
3 | 哈尔滨工业大学(深圳) | 榴莲班戟 | 伏冠宇 | Semantic similarity model of medical questions based on fusion pre-training model |
CHIP2019评测三:临床试验筛选标准短文本分类
 共有27支队伍提交结果。
 总体情况:
评价指标 | Maximum | Minimum | Mean | Median |
---|---|---|---|---|
Average F1 | 0.810263 | 0.553736 | 0.770502 | 0.788728 |
 前三名参赛结果:
排名 | 参赛单位 | 队伍名称 | 使用方法 | 外部资源 | Average F1 |
---|---|---|---|---|---|
1 | 华南理工大学 | wzm | 语言模型Bert、RoBERTa、LightGBM,最后加权平均 | 无 | 0.810263 |
2 | 大连理工大学 | DUTIR914 | 语言模型(Bert、RoBERTa) + 深度学习模型(CNN,DPCNN,LSTM以及注意力机制),模型融合 | http://www.chictr.org.cn/index.aspx | 0.809936 |
3 | 大连理工大学 | DUTIRTM | 语言模型+神经网络(ERNIE+CNN、ERNIE+ATT、RoBERTa+CNN和RoBERTa+ATT) | 无 | 0.807456 |
 会议口头报告:
排名 | 参赛单位 | 队伍名称 | 报告题目 | 报告人 |
---|---|---|---|---|
1 | 华南理工大学 | wzm | 基于BERT与模型融合的短文本分类方法 | 吴梓明 |
2 | 大连理工大学 | DUTIR914 | 一种基于预训练模型的医学短文本分类方法 | 李孟颖 |
3 | 大连理工大学 | DUTIRTM | 基于BERT融合多特征的临床试验筛选标准短文本分类 | 丁泽源 |
 会议海报:
排名 | 参赛单位 | 队伍名称 | 作者 | 海报题目 |
---|---|---|---|---|
4 | 中山大学 | 好果汁队 | 潘智伟,舒丁飞 | 基于多模型集成学习的临床试验筛选标准短文本分类 |
5 | 中国医学科学院医学信息研究所 | 努力!奋斗! | 杨飞洪,李姣 | 基于BERT模型的临床试验筛选短文本分类 |
6 | 北京中科凡语科技有限公司 | mini batch | 王克欣,张萌、王祥宇、付西娜、于志鹏 | 多模型融合的文本分类算法在临床试验筛选中的应用 |
7 | 中南大学 | Morning Tea | 伍逸凡,余颖 ,李敏 | 基于不同词向量特征的临床试验筛选标准短文本分类 |
8 | 郑州大学 | zzunlp | 蔡林坤,刘涛 | 临床试验筛选标准短文本分类 |
9 | 新疆大学 | A&D | 阿依古丽·哈力克,吴迪、李磊 | 基于ERNIE的文本分类 |
 注:前九名队伍均展示海报,前三名海报题目与报告题目相同。
CHIP2020评测一:中文医学文本命名实体识别
 共有37支队伍提交结果。
 总体情况:
评价指标 | Maximum | Minimum | Mean | Median |
---|---|---|---|---|
F1值 | 0.6835 | 0 | 0.5548 | 0.6491 |
 前三名参赛结果:
排名 | 参赛单位 | 队伍名称 | 使用方法/th> | 外部资源 | F1值 |
---|---|---|---|---|---|
1 | 腾讯天衍实验室 | yangyf | 预训练模型+MRC;预训练模型+CRF;词增强 | 医疗网站上的相关文本 | 0.6835 |
2 | 纽约大学 | xi | 1.基于CRF的实体抽取,结合阅读理解完成训练 2.采取词汇增强,动态规划文本分割,半监督数据增强及模型融合方法增强效果 | 否 | 0.6825 |
3 | 北京理工大学 | 信息抽取三元组 | biaffine、伪标、模型融合、MRC-QA | 开源预训练语言模型 | 0.6824 |
 会议口头报告:
报告人 | 单位 | 报告题目 |
---|---|---|
杨奕凡 | 腾讯天衍实验室 | 基于领域自适应和词增强的实体识别方案 |
娄杰 | 零氪科技 | 基于多种策略组合的嵌套实体抽取 |
CHIP2020评测二:中文医学文本实体关系抽取
 共有17支队伍提交结果。
 总体情况:
评价指标 | Maximum | Minimum | Mean | Median |
---|---|---|---|---|
F1值 | 0.6486 | 0.2760 | 0.5515 | 0.5662 |
 前三名参赛结果:
排名 | 参赛单位 | 队伍名称 | 使用方法 | 外部资源 | F1值 |
---|---|---|---|---|---|
1 | 零氪科技 | 信息抽取三元组 | 对抗训练、多头选择、指针标注、模型融合 | 开源预训练语言模型 | 0.6486 |
2 | 腾讯天衍实验室 | zyy_77 | 基于流模型解码和词增强的实体关系联合抽取 | 无 | 0.6387 |
3 | 中国科学技术大学 | guanchong | 0.6378 |
 会议口头报告:
报告人 | 单位 | 报告题目 |
---|---|---|
娄杰 | 零氪科技 | 融合BERT与多头选择机制的关系抽取 |
张云燕 | 腾讯天衍实验室 | 基于流模型解码和词增强的实体关系联合抽取 |
叶元 | 北京大学 | 两阶段医疗实体关系联合抽取 |
CHIP2020评测三:临床术语标准化任务
 共有9支队伍提交结果。
 总体情况:
评价指标 | Maximum | Minimum | Mean | Median |
---|---|---|---|---|
F1值 | 0.725546 | 0.267261 | 0.447778 | 0.303357 |
 前三名参赛结果:
排名 | 参赛单位 | 队伍名称 | F1 |
---|---|---|---|
1 | 零氪科技LinkDoc | 信息抽取三元组 | 0.725546 |
2 | 中国科学院自动化研究所, 云知声智能科技股份有限公司 | Magikarp | 0.688145 |
3 | 平安科技智能疾病管理团队 | 先随便填 | 0.630878 |
 会议口头报告:
报告人 | 单位 | 报告题目 |
---|---|---|
娄杰 | 零氪科技 | 一种基于召回排序两阶段的医疗术语标准化方案 |
周桐 | 中国科学院自动化研究所,云知声智能科技股份有限公司 | 三元文本蕴含的临床术语标准化方法 |
袁正 | 清华大学工业工程系统计学研究中心 | 规则增强的中文术语正则化 |
CHIP2020评测四:新冠肺炎趋势预测
 共有2支队伍提交结果。
 总体情况:
评价指标 | Maximum | Minimum | Mean |
---|---|---|---|
差异率 | 5.319205673 | 4.335495277 | 4.827350475 |
 前两名参赛结果:
排名 | 参赛单位 | 队伍名称 | 差异率 |
---|---|---|---|
1 | 华南理工大学 | 不知叫啥队 | 4.335495277 |
2 | 大连大学 | 耀阳 | 5.319205673 |
 会议口头报告:
报告人 | 单位 | 报告题目 |
---|---|---|
刘奕鑫 | 华南理工大学 | 基于XGBOOST的新冠疫情预测 |
吴安奇 | 大连大学 | LSTM与多类型时间序列融合的时序数据预测方法 |