评测四:新冠肺炎趋势预测
任务简介
自2019年12月31日武汉市首次公开通报肺炎病例,全国范围内,新型冠状病毒迅速传播,政府快速启动紧急应急响应,人民正常生活以及社会经济等均受到严重阻碍。时隔半个月后,美国宣布第一例新冠确诊病例出现,疫情快速席卷全球。时至今日,全球新冠肺炎确诊病例已累计2000万,死亡人数75万,每日新增人数高达近30万。在缺少疫苗和特效药的情况下,各国政府纷纷采取不同的防控措施,以降低人群接触导致的病毒传播。从疫情爆发以来,公共卫生领域的相关专家和学者针对新冠疫情未来趋势的预测,提供决策者重要参考。
任务详情
本测评任务目标为基于某一区域性已公开发布的新冠肺炎每日新增确诊患者统计数据,预测未来一段时间内每日新增确诊患者数。
预测基本原则:
- 时序数据为真实历史数据,无任何人为修改。
输入/输出:
- 输入: 某一特定区域的历史数据。日期范围从首例确诊日期起至2020年8月中旬,观测统计维度选用每日新增确诊病例数(或结合提供的特征数据,可自由选择是否使用)。
- 输出: 未来一段时间内,每日新增确诊病例数。
数据简介
-
典型三个区域性确诊病例时序数据:
- 源数据均来自统一公开发布网站。无任何修改。
- 每份数据集取样典型某一区域,时长跨越均为4个月以上,每日新增确诊人数为统计值,防疫措施为此区域的政府公布的相关管理措施。
- 本任务总共提供三份典型区域性时序数据集。
- 样例:
区域:A 日期 每日确诊人数 防疫措施 2020/3/8 25 2020/3/9 56 开始投入核酸检测 ... ... ... 2020/4/31 320 建议部分区域企业可实行远程在家办公 ... ... ... 2020/5/5 371 公众活动取消、禁止人群聚集、学校关闭 ... ... ... 2020/5/28 600 禁止部分国家入境 -
特征数据:针对每一份区域性数据的特征描述,样例如下
区域: A 总人口数 106000 人均GDP 25000 老龄人口比 13.55 ... ...
评价标准
由于源数据特点是每日实时更新,测试数据选用未来某一周(7天)期限内的预测结果与真实公布确诊数据做比较。出于尊重每位参赛选手的任务成果,维护测评任务的公平性,测评前公布特定一周期限的具体日期,具体测评方法如下:
- 计算每日预测结果y^与实际公布结果y差异率,综合计算三份数据集的最终差异值,差异值最小为优。
- 测评计算公式:当时间为`t`时,`S=\sum_t^n{\frac{|\hat{y_t} - y_t|}{y_t}}` , n为预测总天数。
-
最终提交文件要求:最终排名前5的队伍需提交材料如下:
- 测试结果文件,用result.csv 命名。格式为两列,日期和每日预测确诊人数.需提供未来一段时间的预测结果 (至未来特定一周)。
- 相关代码及解释说明。
- 方法描述文档。
- 代码及其文档需打包成一个文件(tar,zip,gzip,rar等均可),用code.xxx命名,要求提交所有的程序代码及相关的配置说明,程序应当可以运行且所得结果与result.csv相符。如果方法使用了额外资源,要求说明并提供资源文件或地址。
参赛规则
注意,以下通用规则适用于本评测任务。在此基础上,参赛选手还需遵循具体大赛的特有规则。如有冲突,以后者为准。
- 参赛选手需要提交“参赛队名,队长信息(姓名,邮箱,联系电话),参赛单位名称”等信息,报名方式见下文。
- 报名截止到测试数据集发布,在测试数据集发布之后,未报名的选手/队伍不能再报名或提交。
- 每支队伍需指定一名队长,队伍名称不超过15个字符,队伍成员不超过4人。
- 每名选手只能参加一支队伍,一旦发现某选手以注册多个账号的方式参加多支队伍,将取消所有相关队伍的参赛资格。
- 允许使用公开和选手个人/组织内部的代码、工具、数据,但需要保证参赛结果可以复现。
- 参赛选手最终需要提交可运行的代码和方法描述文档,若在排行榜上的结果无法复现,将取消参赛资格。
- 欢迎国内外在校生及社会在职人士参加。比赛组织方成员不可参赛。
报名方式
- 下载《数据使用与保密承诺书》,在文档末尾填写参赛队信息;
- 参赛队负责人签名(手写签名);
- 将签名的《数据使用与保密承诺书》扫描件(pdf)发送至以下邮箱:1446269148@qq.com,邮件标题为:参赛队名+ “【新冠肺炎趋势预测任务】数据使用申请”:
时间安排
- 报名时间:8月9日— 10月9日
- 训练及验证数据发布:8月24日— 08月31日
- 测试数据发布:10月10日
- 提交测试结果:10月12日
- 评测论文报告:10月31日
- CHIP会议日期(评测报告及颁奖):11月6日—8日
任务组织者
- 黄孝炜1446269148@qq.com
- 杜鑫惠 xinhui.du@yiducloud.cn
评测主席
- 雷健波,北京大学医学信息学中心(jianbolei@qq.com)
- 李作峰,飞利浦亚洲研究院(lizuofengcn@163.com)
- 汤步洲,哈尔滨工业大学(深圳)鹏城实验室(tangbuzhou@hit.edu.cn)