- · 《领导科学论坛》栏目设[05/28]
- · 《领导科学论坛》数据库[05/28]
- · 《领导科学论坛》收稿方[05/28]
- · 《领导科学论坛》投稿方[05/28]
- · 《领导科学论坛》征稿要[05/28]
- · 《领导科学论坛》刊物宗[05/28]
数据科学,如何帮我们应对新冠疫情?
作者:网站采编关键词:
摘要:在新冠肺炎流行期间,很多数据科学家和商业分析从业者们都被拉进了流行病学的领域——当然,他们大都很乐意这样做。拥有数据科学团队的大企业,希望尽可能地了解这种流行疾病
在新冠肺炎流行期间,很多数据科学家和商业分析从业者们都被拉进了流行病学的领域——当然,他们大都很乐意这样做。拥有数据科学团队的大企业,希望尽可能地了解这种流行疾病在他们开展业务的地区可能出现的感染情况。有一些组织内部原本就拥有一些流行病学家或者医务人员,但是他们不见得拥有足够多的分析人才对病毒的流行和病例增长方面的数据进行量化分析。
这些数据科学家们努力的主要方向是报告或者预测新冠肺炎引起的病例和/或死亡。尽管有很多网站都提供了关于这种疾病流行情况的基本描述性分析,但是绝大多数的网站都没有提供对未来感染病例和死亡数量的预测,这些网站提供的数据的精细度也不足以供企业使用。很多公司由于自身所处的行业特点及商业模式,都有充足的理由要进行这项工作,弄清楚这场疫情对他们的业务、客户以及员工的影响。
因为数据科学的每一个特定的用例都取决于环境,所以我会在介绍每个用例的时候也介绍应用这个用例的公司的情况。一些公司和他们的代表希望保持匿名,但是他们确认了项目的详细情况。
一家人寿保险公司预测死亡人数
一家大型人寿保险公司的分析和数据科学团队于2020年3月份启动了一个项目,该项目的目标是预测新冠肺炎疫情造成的死亡情况。人寿保险公司需要了解任何导致意外死亡人数大量增加的大流行病,并对其可能的发展状况进行预测。当然,该公司对于其代理机构和办公室的员工何时能够安全返回办公室上班,以及能有多少人能够返回岗位这个问题也非常感兴趣。
他们的模型表明,新冠肺炎疫情造成的死亡人数将比大多数人估计的数量更高,这部分取决于控制病毒传播的措施。这些模型不仅依赖于已报告的死亡病例进行外推,还对“超额死亡”进行了分析,所谓的“超额死亡”指的是那些由于新冠肺炎造成但却不会被官方统计计入疫情死亡人数的死亡病例。这些数据科学家们多次调整过他们的模型,以覆盖美国全境范围内的新数据和新的防疫政策。该模型汇总了州一级的预测数据,并且考虑了每个州计数缺漏以及政策收紧和开放水平的影响。然后,该公司将所有的州分成四个标准化的开放阶段。标准化阶段的分类包含诸如学校是否开学/停课、非必要商业以及其他设施和机构是否开放等标准。
为了评估疫情对分支机构以及其办公室的影响,数据科学家们还依据县级的数据进行了更为精细的预测。分析团队没有预测新冠肺炎感染病例的数量——部分原因是因为感染病例数对该公司的业务影响较小,更主要的原因是因为能够获得的关于美国病例数量的数据可靠性较差。该公司内部所有的高管和部门对于该团队的分析结果都非常感兴趣。
一家物流公司预测疫情对人员配备的影响
一家物流公司的健康与安全负责人正在思考如何用数据帮助这家公司更好地适应疫情。由于他的工作职责包含了病假计划,他对于预测员工因为感染新冠肺炎请病假的情况以及这些情况会对该公司运营造成何种影响非常感兴趣。他要求他的分析团队创建了一个新冠疫情对公司影响的面板。其中一个关键的项目就是预测因为感染新冠肺炎造成的病假情况。
这位健康与安全负责人表示,该面板非常受欢迎,公司各个部门的请求纷至沓来。但总的来说,他指出,相比于对于未来可能发生状况的预测,管理人员们还是对于已经发生情况的描述性数据更加感兴趣。
一家动物保健公司预测对肉类加工厂的影响
First Analytics是一家分析和数据科学服务公司(我是这家公司的联合创始人兼非执行董事长),它为大型公司提供分析服务。新冠肺炎疫情流行期间,负责领导公司的Mike Thompson和Rob Stevens认为他们的某些客户可能会对美国新冠肺炎疫情流行情况的预测分析感兴趣,他们知道,有一些来源可以提供美国县级的病例和死亡数据,但是这些数据没有一个是可预测的——至少在当时是这样。所以First Analytics的团队创建了一个预测模型,该模型采用了《纽约时报》汇总的县级数据,并据此预测几周后可能发生的病例和死亡率。该模型考虑了州或者县的封锁状态以及该地区阳性测试结果的百分比。当然,该模型会受到监狱或者疗养院等疫情局部爆发的困扰。
文章来源:《领导科学论坛》 网址: http://www.ldkxzzs.cn/zonghexinwen/2021/0525/1410.html
上一篇:袁隆平同志病重期间和逝世后,中央有关领导同
下一篇:没有了