数据科学在全球卫生:编程库/资源列表


PDF文档图标fs - 18 - 280. - pdf- PDF文档,138 kB(141616字节)

作者(年代):测量评价

年:2018年

数据科学在全球卫生:编程库/资源列表 文摘:

开始使用数据科学可以是一个艰巨的任务。识别和理解适当的方法和技术提出了一个挑战,而生产所需的代码来实现这些方法和技术提出了另一个挑战。

测量评估的编程库/资源列表寻求解决这些双重挑战通过提供现有资源的链接数据科学技术的概述和应用这些技术的示例代码。这个资源列表中的链接仅供全球卫生专业人员与温和的基本编程技能和有兴趣加强他们的知识和经验数据科学方法和技术。

与R代码

加州大学洛杉矶分校资源
这个网站提供了多个R的链接资源包括了软件的下载链接:https://stats.idre.ucla.edu/r/

网站包括免费的在线链接模块引入R原理包括导入数据,变量建设、和数据可视化表示:
https://stats.idre.ucla.edu/r/modules/

额外的链接提供代码数据可视化表示形式和各种统计方法包括描述性统计、逻辑回归、和多级模型:https://stats.idre.ucla.edu/r/codefragments/介绍/
https://stats.idre.ucla.edu/other/dae/

UNC资源
开放课程资料作为单独的讲座为各种统计方法,包括多个负二项回归。网站还包括讲座介绍贝叶斯方法进行回归分析,和图形表示R R .每堂课页面提供样例代码为每个方法:
https://www.unc.edu/courses/2010fall/ecol/563/001/docs/lectures/lecture1.htm

Rspatial
这个网站提供了代码和描述空间数据分析R,以及各种空间分析包的下载链接。该网站还包括一个在R介绍操纵空间数据:http://www.rspatial.org/

代码索引
收集特定任务的代码片段:https://source.opennews.org/code/

从数据分析与R /争论:我希望我被告知的事情
R的描述数据争论技术和相关代码:
http://reganmian.net/blog/2014/10/14/starting-data-analysiswrangling-with-r-things-i-wish-id-been-told/

R参考卡片数据挖掘
R包和函数的列表,可以协助数据挖掘:
http://www.rdatamining.com/docs/r-reference-card-for-data-mining

在时间序列因果影响:估计因果影响
谷歌开发的开源R包使因果分析简单、快速。基于贝叶斯结构时间序列模型。我们使用这些模型来构建一个综合控制会发生到我们的结果指标没有干预。这种方法可以估计因果效应,可以归因于干预,以及随着时间产生的变化:https://opensource.googleblog.com/2014/09/causalimpact-new-open-source-package.html

RAPPOR
R和Python从谷歌的开源项目,以促进数据分析,同时保留个人隐私:
https://github.com/google/rapporhttps://ai.googleblog.com/2014/10/learning-statistics-with-privacy-aided.html

映射与ggplot:创建一个漂亮的等值线图映射在R
R中的基本教程就如何制作等值线图的地图:
http://rforpublichealth.blogspot.com/2015/10/mapping-with-ggplot-create-nice.html

介绍R减价(R笔记本)
Jupyter笔记本的减价是R版本。可以编写代码和执行文档中,可以发现和分析,还包括代码的输出用来进行分析,使可再生的结果:https://rmarkdown.rstudio.com/r_notebooks.html

Flexdashboard:简单的交互式仪表板R
交互式仪表板用R减价的。可以与闪亮的可视化动态:https://rmarkdown.rstudio.com/flexdashboard/

实现可再生的数据分析工作流程
最佳实践的概述在R中创建一个工作流的可复制。可复制的工作流程可以执行数据分析,推出一个R脚本,可以促进合作:
http://blog.jom.link/implementation_basic_reproductible_workflow.html

从R访问全球健康观测数据
Github库的代码来访问数据从世界卫生组织全球卫生观察站在R:https://github.com/pierucci/rghohttps://cran.r-project.org/web/packages/WHO/vignettes/who_vignette.html

通过API获取国土安全部数据
获取国土安全部数据通过一个API代码片段:
https://api.dhsprogram.com/ / samples-python.cfmhttp://api.dhsprogram.com/ / samples-r.cfm

应用可视化或地图数据:http://api.dhsprogram.com/ / sample-apps.cfm

国土安全部。利率R包:https://cran.r-project.org/web/packages/
DHS.rates /小插曲/ DHS.rates.html

与Python代码

Python数据科学
这短引物在Python是旨在提供一个快速的“入站”,使电脑程序员已经熟悉其他编程语言中的概念和结构足够了解Python促进开源和专有的有效使用面向机器学习和数据科学工具:
http://nbviewer.jupyter.org/github/gumption/Python_for_Data_Science/blob/
主/ Python_for_Data_Science_all.ipynb

Python数据科学的基础
教程使用Python和Jupyter笔记本。概述关键的Python库和技术,介绍Jupyter笔记本:
https://data36.com/python-for-data-science-python-basics-1/

贝叶斯急救:皮尔森相关测试
理解两个变量之间的相关程度,是有效利用数据决策的关键一步。贝叶斯分析提供了机会来评估相关数据没有一个正态分布:
http://www.sumsar.net/blog/2014/03/bayesian-first-aid-pearson-correlation-test/

通用数据科学的联系

数据科学的工具箱是一个基于Ubuntu的Linux虚拟环境,特别适合做数据的科学。它的目的是让你在几分钟内开始。你可以在本地运行数据科学工具箱(使用VirtualBox和流浪汉)或在云中:http://datasciencetoolbox.org/

交叉验证是一个问答网站感兴趣的人统计,机器学习,数据分析,数据挖掘和数据可视化:
https://stats.stackexchange.com/

了下: 数据, 数据科学, 全球健康
Baidu
map