原文链接 🔗 8 Links to Other Resources
# 基本工具
- Apple 开发者工具 Unix 工具链。直接用命令
xcode-select --install
安装,或者尝试在终端中使用git
,然后 macOS 会提示你安装该工具。 - Homebrew 包管理器。可以非常方便地安装这里提到的几个软件,比如 Emacs 和 Pandoc。
- Emacs。强大的文本编辑器,点击下载最新版 适用于 macOS 的 Emacs。
- R。统计计算平台。
- knitr。R 中实现纯文本文档可复现的包。
- Python 和 SciPy。Python 是一种越来越多地用于数据统计和分析的通用编程语言。
- RStudio。R 的 IDE,使用 R 和 RMarkdown 最直接的方式。
和 。排版系统,可以直接用来写 .tex
文件,也可以在后台运行,以供其他工具使用。MacTeX 是 macOS 上的发行版。 - Pandoc。将纯文本文档转换为各种格式。可以用 Homebrew 安装。同时,也最好安装
pandoc-citeproc
来处理引用和参考书目,以及pandoc-crossref
生成交叉引用和标签。 - Git。版本控制系统,可以通过 Apple 开发者工具安装,或者使用 Homebrew 获取最新版本。
- GNU Make。你告诉
make
创建文档或程序的各个步骤,当你编辑和更改各个部分时,它会自动确定需要更新和重新编译的部分,并发出执行此操作的命令。相关的简短介绍,请阅读 Karl Broman 的 minimal make,make
会随 Apple 开发者工具自动安装。 - lintr 和 flycheck。帮助你编写更加整洁代码的工具。
# 助手和模板
- Emacs 社会科学入门工具包。设置 Emacs,以使用本指南描述的许多工具。
- Pandoc 模板。
和 HTML 模板,以及 Pandoc 配置文件和使用 Pandoc 从纯文本文件生成精美的 PDF、HTML 和 Word 文档所需的其他东西。 md-starter
项目 和rmd-starter
项目。假设你已经安装了上述工具和 Pandoc/的模板,这些主干项目文件夹包含基本的 .md
或.rmd
启动文件和Makefile
,能够按照本指南前面介绍的流程生成.html
、.tex
、.pdf
和.docx
文件。- RMarkdown Cheatsheet 概述了 Markdown 和 RMarkdown 的基本操作。
- RStudio Cheatsheets 包括其他的快速指南,更全面的 RMarkdown 参考和有关使用 RStudio IDE 的相关信息,以及 R 中的一些主要工具。
# 指南
- R 风格指南。写出具有良好可读性的代码。
- Jenny Bryan’s Stat 545。不列颠哥伦比亚大学 Jennifer Bryan 教授的数据分析课程的课件和教程,包含大量有价值的材料。
- knitr 作者谢益辉写的 knitr 演示文档和示例,以及一本更加详细介绍 knitr 的 书籍。
- 来自 RStudio 的 RMarkdown 文档,包括很多非常好的例子。
- 纯文本指南。此项目的 GitHub 仓库。
- Karl Broman 的教程和指南 对这里描述的很多工具和主题提供了准确和简明的指南,比如 进行可复现的研究、Git 和 GitHub 指南、knitr 的简短介绍。
- 用于 OCR 和转换 Shapefile 的 Makefile。数据分析中进一步使用
Makefiles
的例子,可以参考 Lincoln Mullen 的博客。
# 付费应用和服务
- Marked 2。实时预览 Markdown 的 HTML 文档,只有 macOS 版本。
- Sublime Text[2]。基于 Python 的文本编辑器。
- Zotero、Mendeley和 Papers 是拥有 PDF 存储、注释和其他功能的文献管理工具。Zotero 可以免费使用,Mendeley 有高级版本,Papers 试用期结束后需付费。我不经常使用这些工具,但这不是出于任何强烈的原则问题,主要是个人习惯。如果你使用其中一个,并希望在与这里提到的其他工具结合使用,只需确保它可以导出为 BibTeX/BibLaTeX 文件,比如我最近常用的 Papers,可以方便地将论文输出为 Pandoc 格式的引文。
# 参考资料
- Dalgaard, P. (2008). Introductory statistics with R (Second edition). New York: Springer.
- Fox, J. (2002). An r and s-plus companion to applied regression. Thousand Oaks: Sage.
- Gelman, A., & Hill, J. (2007). Data analysis using regression and multilevel/hierarchical models. New York: Cambridge University Press.
- Harrell, F. (2016). Regression modeling strategies (Second). New York: Springer.
- Healy, K., & Moody, J. (2014). Data visualization in sociology. Annual Review of Sociology, 40, 105–128.
- Maindonald, J., & Braun, J. (2003). Data analysis and graphics using R: An example-based approach. New York: Cambridge University Press.
- Matloff, N. (2011). The art of r programming. San Francisco: No Starch Press.
- Venables, W. N., & Ripley, B. D. (2002). Modern applied statistics with S (Fourth). New York: Springer.
- Xie, Y. (2015). Dynamic documents with r and knitr (Second). New York: Chapman; Hall.
译者注:微软收购 GitHub 后,GitHub 在 2019 年 1 月 宣布,免费用户可以创建不限数量的私人仓库。 ↩︎
译者注:Sublime Text 虽然是一个付费软件,但不付费也是可以正常使用的,只是它每隔一段时间会弹出一个让你掏钱购买的窗口(所以我已经弃用 Sublime Text,转向 Visual Studio Code)。 ↩︎