找回密码
 立即注册

IBM 推出开源工具,助力抗疫新冠病毒数据分析

2020-6-29 18:25 来源: C114 科技快报

IBM 开源数据和 AI 技术中心(CODAIT)推出了一个新工具包 covid-notebooks,该工具包可帮助开发人员和数据科学家回答有关大流行的问题。

covid-notebooks 旨在帮助完成以下任务:

获得有关爆发当前状态的权威数据,

清除最严重的数据质量问题,

将数据整理成易于使用 Pandas 和 Scikit-Learn 等工具进行分析的格式,

以及构建一组初始的示例报告和图形。

IBM 方面表示,处理好这些任务,开发人员和数据科学家就可以解放出来,专注于高级分析和建模任务,而不用担心数据格式和数据清理等问题。该存储库使用开发者友好的 Jupyter notebook 来涵盖每个初始数据分析步骤。

此外还使用 Elyra Notebook Pipelines Visual Editor 和 KubeFlow Pipelines 创建了数据处理管道。示例如下:

这些管道使用户只需单击一个按钮即可重新运行整个提取、转换、分析工作流程。“我们资源库中的工具使用权威来源,得出决策者可用于做出实时、关键决策的综合见解。“

IBM 开源数据中心和 AI 中心首席架构师 Frederick Reiss 表示:“对于正在分析 COVID-19 的影响并试图根据数据提出可行计划的数据科学家和决策者来说,相关信息可以说是铺天盖地。来自研究报告、新闻媒体、社交媒体和健康组织的数据几乎源源不断,这使得将数据分析为有用的行动的任务几乎不可能完成。开发人员和数据科学家需要回答他们关于数据来源、工具以及如何从不断变化的数据中得出有意义的、统计上有效的结论的问题。”

IBM

  免责声明:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

  另,市场有风险,选择需谨慎!此文仅供参考,不作买卖依据,投资者若据此操作,风险自担。

  投稿邮箱:[email protected]。详情访问科技快报网:http://www.citreport.com

编辑:张晴
微信公众号
意见反馈 科技快报网微信公众号