评测二: 医疗因果实体关系抽取任务
Task2: Medical Causal Entity and Relation Extraction Task
1. 任务背景
现代医疗很强调解释性,医生在诊断,治疗和评估上,都要求从患者为中心出发,突出医疗的因果关系。因此互联网上存在大量的医疗的问答和知识类的文本中存在大量的因果关系解释,在帮助患者的同时,对于医疗搜索和诊断业务来说也具有巨大的价值,从中可以挖掘抽取医疗因果关系构建因果关系解释网络,构建医疗因果知识图谱,提升对医疗结果的逻辑性和可解释性的判断能力。继在
CHIP2021
大会发布“
医疗对话临床发现阴阳性判别任务
”后,阿里巴巴夸克医疗团队今年发布了“医疗因果关系抽取任务”。
2. 任务介绍
因果关系细化的标注,是需要在存在因果关系的片段基础上,需要进行医学概念的片段标注以及医学概念片段之间的关系角色进行标注。具体来说,细分的医学概念片段分为如下3种类型:
1. 因果关系:
因果关系是指某种原因直接导致某种结果。
例子: 人体的 胃肠道功能紊乱 ,导致患者 吸收能力变差 。
解释: 胃肠道功能紊乱 是 吸收能力变差 的一个直接原因, 吸收能力变差 是 胃肠功能紊乱 的直接结果。
2. 条件关系:
条件关系是指医学概念片段中一些特定的条件, 用于修饰特定的因果关系 ,注意:条件并不能直接导致某个结果的发生。
例子1: 对阿莫西林过敏 的患者不可以使用, 服用阿莫西林 可能会引起 皮疹、药物热 和 哮喘 等过敏反应,因此使用前一定要做青霉素皮试试验。
解释: 其中, 对阿莫西林过敏 是 服用阿莫西林 导致 皮疹 的条件。
例子2: 如果已经 怀孕 ,出现 小腹疼痛 或者 阴道出血 ,可以视为 先兆流产 。
解释: 在 怀孕 的前提/条件下,如果出现了 小腹疼痛 过着 阴道出血 一般是 先兆流产 导致的;也就是在某种特定的条件下,所修饰的因果关系才能产生。
3. 上下位关系:
上下位关系指的是概念之间的大小关系。
例子: 阿尔茨海默症 是一种 精神类疾病 ,生活中比较常见。
解释: 其中, 阿尔茨海默症 是 精神类疾病 的一种,因此与精神类疾病构成了上下位关系。
1. 标注的实体尽可能的完整包含有用的信息比如症状的程度,频率等,无关信息不在标注范围,如:“不及时治疗在局部可能会引起疼痛”中会标注出“局部可能会引起疼痛”,仅标注“疼痛”会存在信息丢失;如果涉及人群涌来区分疾病特点的,需要把人群也标注上,如“宝宝咳嗽”。
2. 疾病和临床之间的表现关系,本次标注任务归为因果关系;例如“感冒常见症状是咳嗽”中,“感冒”和“咳嗽”之间是因果关系。
3. 针对多个实体连在一起的长mention,本任务按照如下规则进行标注:如果每个实体具备独立意义则分开标注,如:“过量饮酒、使用激素、劳累等引起的股骨头缺血性病变”中标注(“过量饮酒”,“股骨头缺血性病变”),(“使用激素”,“股骨头缺血性病变”)和(“劳累”,“股骨头缺血性病变”)3对因果关系;如果是非连续(dis-continued)实体,本任务合并标注为长mention,如:“食用奶酪、巧克力、可乐会导致过度肥胖”中标注(“食用奶酪、巧克力、可乐”,“过度肥胖”)1对因果关系。
4. 本任务只标注一度关系,不标注推导关系,如“A导致B,B又导致C”,则本任务只标注(A,B)和(B,C)两对因果关系,(A,C)不标注;同样的,对于上下位或者别名的情况,仅标注最直观的实体,如“A,又称为B,会导致C”,只标注(A,C)即可。
5. 本任务基于段落标注,因此会存在跨句子的关系标注。
6. 部分记录为常识性描述,可能不存在本任务定义的3类关系。
{
"text": "在心率规整的情况下,脉搏的频率与心率是一样的,成年人的脉搏一般在60-100次之间,大部分在70-80次之间,怀孕后的女性由于生理性贫血的影响以及循环血量增加使心脏的负担加重,可能会使心率相对增快。",
"relation_of_mention": [
{
"head": {
"mention": "怀孕后的女性",
"start_idx": 55,
"end_idx": 61
},
"relation": 2,
"tail": {
"type": "relation",
"head": {
"mention": "生理性贫血",
"start_idx": 63,
"end_idx": 68
},
"relation": 1,
"tail": {
"mention": "心脏的负担加重",
"start_idx": 80,
"end_idx": 87
}
}
},
{
"head": {
"mention": "怀孕后的女性",
"start_idx": 55,
"end_idx": 61
},
"relation": 2,
"tail": {
"type": "relation",
"head": {
"mention": "循环血量增加",
"start_idx": 73,
"end_idx": 79
},
"relation": 1,
"tail": {
"mention": "心脏的负担加重",
"start_idx": 80,
"end_idx": 87
}
}
},
{
"head": {
"mention": "心脏的负担加重",
"start_idx": 80,
"end_idx": 87
},
"relation": 1,
"tail": {
"type": "mention",
"mention": "心率相对增快",
"start_idx": 92,
"end_idx": 98
}
}
]
}
以 json 格式提供,包括如下字段:
♢ "relation"包括三种关系,数字1,2,3分别代表“因果”,“条件”和“上下位”关系。
注意关系是有顺序的
:因果关系,head和tail分别是原因和结果;条件关系,head和tail分别代表条件和所修饰的因果关系;上下位关系,head和tail分别表示上位词和下位词。
  ♢ "head"包括"mention", "start_idx"和"end_idx"三个字段,分别表示实体片段,文本起始、结束下标,span下标采用左闭右开表示法。
  ♢ "tail"包括"type"和其他字段,"type"字段主要用于区分条件关系和另外两种关系。当"relation"是因果关系或者上下位关系时,type为"mention",尾实体也是一个实体,同头实体,包括"mention","start_idx"和"end_idx"三个字段;当"relation"为条件关系时,type的值为"relation",尾实体是头实体所修饰的因果关系,同因果关系的定义,包括"head", "relation"和"tail"3个字段。