看啥推荐读物
专栏名称: SegmentFault思否
SegmentFault (www.sf.gg)开发者社区,是中国年轻开发者喜爱的极客社区,我们为开发者提供最纯粹的技术交流和分享平台。
今天看啥  ›  专栏  ›  SegmentFault思否

全球最大 COVID-19 研究数据集正式开放,加强科技抗疫

SegmentFault思否  · 公众号  · 程序员  · 2020-03-18 11:50
 近日,全球多家研究机构以及科技企业为了更好的应对疫情,联合发布了一个 COVID-19 开放研究数据集(简称为 CORD-19 ),该数据集中包含针对文本进行优化的文本处理工具包 SciSpacy、在科学文本上进行预训练的 BERT 模型 SciBERT、开放研究语料库和 API 等,并汇集了有关 SARS-CoV-2 病毒内容在内的近 29,000 篇文章。此次公开的数据集是机器可读的,因此可以轻松地进行解析,以用于机器学习目的。该项目由艾伦 AI 研究所、Chan Zuckerberg Initiative(CZI)、乔治敦大学安全与新兴技术中心(CSET)、微软以及美国国立卫生研究院国家医学图书馆(NLM)等机构组成。在新闻发布会上,美国首席技术官 Michael Kratsios 称新数据集为“迄今为止最广泛的机器可读冠状病毒文献 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照