评测研讨会

简介

CHIP 2021组织了以下三个评测任务：

1）医学对话临床发现阴阳性判别任务：临床发现(Clinical Finding)是临床医学下，病人状态描述的概念集合，每一个临床发现的概念都具有明确的涵义（比如腹泻，呕吐，高温，物理降温，降温药物治疗），医学为了保证其严谨性对每一个概念都进行了明确的定义和说明。医学临床报告是病人状态的汇总性的描述，为了尽可能全面和精准的对病人的状态进行客观描述，需要利用严谨的临床发现的概念对病人状态进行表达，其中最基本的状态就是阴性和阳性，也就是病人是否存在或者发生某一种明确的临床发现（Clinical Finding）。目前互联网医疗患者会对自己的症状进行一些口语化的描述，一般称之为主诉，同时医生也为针对性的进行一些问诊，来进行一些主诉的细化和补充。针对互联网医疗对话场景，阿里巴巴夸克团队计划在CHIP会议上开展一系列学术评测任务，本次评测是第一期，主要是对互联网在线问诊记录中的临床发现的部分进行阴阳性的分类判别。

2）临床发现事件抽取任务：给定schema约束集合及句子sentence，其中schema定义了关系Predicate以及其对应的主体Subject和客体Object的类别。临床发现指的是疾病的表现，泛指患者不适感觉以及通过检查得知的异常表现，主要包括症状、体征。临床发现事件抽取是医学数据处理中的一项任务，需要从病历中抽取临床发现事件的解剖部位、主体词、描述词，以及发生状态四个维度的属性。

3）临床术语标准化任务：临床术语标准化任务是医学数据统计分析中不可或缺的一项任务。临床上，关于同一种诊断、手术、药品、检查、化验、症状等往往会有成百上千种不同的写法。标准化（归一）要解决的问题就是为临床上各种不同说法找到对应的标准说法。有了术语标准化的基础，研究人员才可对电子病历进行后续的统计分析。本质上，临床术语标准化任务也是语义相似度匹配任务的一种。但是由于原词表述方式过于多样，单一的匹配模型很难获得很好的效果。