📋 目录

# 这是一本什么书?

plaintext-cover-us-letter.png

普通人的社会科学纯文本指南(The Plain Person’s Guide to Plain Text Social Science,后文简称 Plain Person Text(opens new window) )的作者是美国杜克大学(Duke University(opens new window) )社会学系教授 Kieran Healy(opens new window) ,是一本对社会科学领域研究者利用纯文本进行学术创作的指南。

从 开篇介绍(opens new window) 的口吻来看,这是作者写给初入学术领域的研究生的一本指南。总的来说,该书算是一本工具书,涉及众多工具,包括 Git(opens new window) 、Emacs(opens new window) 、Pandoc(opens new window) 、R(opens new window) 、RStudio(opens new window) 、RMarkdown(opens new window) 、Python(opens new window) 、Make(opens new window) 、 & (opens new window) 等,以及作者为这些工具的设置写的一些指导或模板。但是,Kieran Healy 并没有手把手地指导该怎么使用这些工具,而重点是介绍这些工具在学术工作中的具体应用场景,以及工具之间的组合,并在其中穿插着许多高效工作的原则或观点。阅读过程中,我们可以感受到作者是一位学识丰富、涉猎广泛的学者[1],应该说 Plain Person Text 是一本内容非常丰富的书籍。

# 我为什么要翻译?

我接触到 Plain Person Text 非常偶然。[2] 一直以来,我对 Microsoft Word 等文字处理软件都没有什么好感,而作为一名爱折腾的同学,不想仅仅囿于 Word,因此我先后了解并运用过 、Markdown 以及 RMarkdown 等(纯文本)来写作,其中用 是最多的,但没有形成一种连贯统一的工作流[3]。因此,我一直想要探究一下纯文本写作学术论文的工作流程,并在我的博客选题列表中写下了一个题目:「去 Word 化」写作 —— 纯文本写作学术论文。在搜集资料的过程中,我用关键词「plain text research paper」在 Google 中搜索(opens new window) ,排在第一的搜索结果[4],就是 Plain Person Text,如下图所示。

将 Plain Person Text.pdf 下载下来之后,发现这本小书不仅排版精美[5],大致浏览之后,其中的内容也正是我在寻找的,那一刻,我感觉找到了知音,这就是对的它!第二天,我就到打印店去把它打印成了纸质版[6],准备认真研读。

plain-person-text-1.jpg

从上图可以看到,我把纸质版的封面都翻得「旧不堪言」了[7]。甚至刚开始还做了笔记,不过后来觉得纸质版实在不方便阅读,还是去读电子版了。

plain-person-text-2.jpg

好了,言归正传,我为什么要翻译这本书?直接阅读英语原文不好吗?实际上,这也是动工之前我问自己的问题。下面是我的答案:

  1. 中文互联网或中文学术界目前很少或根本没有系统介绍纯文本写作学术论文的资料。
  2. 我想把人文社科领域 Word 「一统天下」的天捅一个窟窿,翻译成中文有利于「纯文本主义」的传播。[8]
  3. 不是能读懂英文就能翻译成中文,我打算尝试一下。[9]

# 我得到授权了吗?

没有。

但在翻译之前,我非常诚恳地给 Kieran Healy 教授发了一封邮件,请求将他的书翻译成中文,他打开了我的邮件 5 次,但始终没有回复我。可能是他信不过我这样一个籍籍无名的中国学生吧,或者教授实在太忙了,顾不上回复我,又或者他还想要再完善一下,现在时机还不太成熟。总之,我没有得到他的肯定回复。

但是,既然作者已经把该书的 PDF 版和网页版放在网上,供自由下载和公开阅读,并且 源代码(opens new window) 也在 GitHub 开源,我想翻译成中文应该是不涉及侵权的,至少他没有回复邮件说不允许我翻译。

此外,本网站采用 MIT License(opens new window) 开源协议,其开头部分是这样写的:

Permission is hereby granted, free of charge, to any person obtaining a copy of this software and associated documentation files (the "Software"), to deal in the Software without restriction, including without limitation the rights to use, copy, modify, merge, publish, distribute, sublicense, and/or sell copies of the Software.

我将中文翻译成果免费无限制地提供给所有人阅读,这符合 MIT License,也体现了一种开源精神,一定程度上降低了涉嫌侵权的可能性。好吧,我就是在给自己找几个翻译的正当理由,如果真侵权了,那就「侵删(opens new window) 」吧。

# 我是怎么翻译的?

虽然 Kieran Healy 在一开始就 提到(opens new window) 可以将网页版中 .html 扩展名更改为 .Rmd 获得页面的纯文本源文件,但这样获得的源文件还是英文版。因此,为了快速获得经软件翻译后的中文 .md 文件,我使用了如下的方法:

  1. 安装 Chrome 浏览器扩展 Google 翻译和 Web Clipper(opens new window) ;

  2. 在 Chrome 浏览器中打开 Plain Person Text 的 网页版(opens new window) ;

  3. 点击 Google 翻译,翻译整个页面;

  4. 再点击 Web Clipper,将翻译后的网页保存为 Markdown 文件到在线笔记应用中[10]。

这样,就快速得到了经过软件翻译后的中文 Markdown 文件。但是 Google 翻译的效果并不那么令人满意,有些地方意思甚至完全不对[11],还有很多需要修改的地方,因此接下来就只有进行「人肉翻译」了。

上图是 Timing(opens new window) 记录的我在过去一周使用电脑的总时间,将近 60 小时。左下角是各个应用程序的使用时间,排名前三的应用就是我在翻译过程中用到的 3 个软件:Typora(opens new window) 和 Code(opens new window) 用来编辑,Safari 浏览器用来查看英文原文。粗略估计一下,平均翻译一篇(也就是一章),大概需要 5 个小时。也可以以电量消耗来衡量,一篇完成,电脑电量差不多就从 100% 降到了 20% 甚至更低。

总结起来,我所做的主要工作如下:

  • 规规矩矩地将英文翻译成中文。
  • 更正了原文中很多链接,其中最多的是将 http 改为 https,因为作者写的时候大多数网站还没有使用 https 这种更加安全的加密协议。
  • 纠正了一些写法,比如称 Pandoc 时,软件名称使用 Pandoc,命令使用 pandoc;Endnote 改为 EndNote 等。
  • 加上了作者少写的另一半括号[12],改正了一个错误单词「intertia」[13]。

# 全书结构

# 🚌​ 1. 开篇介绍(opens new window)

# ☃️ 2. 保持记录(opens new window)

# ✍️ 3. 写作和编辑(opens new window)

# 🔁 4. 复现你的工作(opens new window)

# 👨‍👩‍👧‍👦 5. 集中在一起(opens new window)

# 🎒​ 6. Emacs 入门工具包(opens new window)

# 👀​ 7. 我必须使用这些工具吗?(opens new window)

# 🔗​​ 8. 其他资源链接(opens new window)

# 总结

  • 不要畏惧代码。本指南大部分工具都涉及到代码,但不要害怕。代码是人类与计算机交流的工具,如果你想成为一位深刻理解计算机的「高端玩家」,接触代码是必不可少的。在这一点上,我很赞同苹果大力普及编程的做法 —— 苹果官网有一个专栏 人人能编程(opens new window) ,可以下载使用 Swift 语言编程的资料和课程。今年 8 月,苹果在 Apple Store 推出了一个课程:[AR]T 实验室:增强现实体验 - 携 Sarah Rothberg 联合推出(opens new window) ,这是一个借助 iPad,使用增强现实(AR)来创作出充满奇趣对象和声音的课程,需要使用一点 Swift 语言,但很简单,不用担心没学过。我在 8 月 27 日参加了这一课程,在其中的一个教学视频中,艺术家及教育工作者 Sarah Rothberg(opens new window) [14] 提到,编程和音乐、绘画、摄影一样,也是一种兴趣爱好,会让我们的生活更加美好而有趣。
  • 多加练习。光说不练假把式。民族复兴不是敲锣打鼓就能实现的(opens new window) ,这本指南也不是看看就能掌握的,而需要在实践中多加练习才能熟练掌握。但是 作者也提到(opens new window) ,你不必一开始就使用所有工具,或者马上开始学习所有内容,你真正需要开始做的唯一的事情就是立即做好备份。比如 Pandoc 的说明手册(opens new window) 超过 120 页,不可能一上来就从头读到尾[15],合理的做法是掌握基本的命令,遇到具体的需求,再去查阅手册。
  • 最后,如果觉得我的中文翻译很拗口,就…… 就去看英文原文吧~
  • 欢迎加入纯文本的世界!热情欢迎与我交流文中提到的任何内容[16]。

  1. Kieran Healy 教授还出版过一本数据可视化的书籍:Data Visualization: A Practical Introduction(opens new window) 。 ↩︎

  2. 但从辩证唯物主义的观点来看,又存在着必然。 ↩︎

  3. 可能也是受 谢益辉(opens new window) 影响的原因。曾经我也是 的坚定信仰者,但现在慢慢觉得也许可以适当跳出反斜杠的世界。 ↩︎

  4. 可能随着时间的变化,Google 对搜索结果权重的调整会导致排序有所变化,但 Plain Person Text 应该是非常靠前的。 ↩︎

  5. 从元数据可以看到 PDF 编码软件是 pdfTeX 引擎,但从作者书中描述的方法来看,他肯定不是直接在 .tex 文件中写的,而是通过 Pandoc 转换得到 PDF 文件。 ↩︎

  6. 全书一共 55 页,是我在打印店打印过最长的非作业材料。 ↩︎

  7. 其实它变得这么旧是放在书包里被挤压过的原因,不是我翻成这个样子的🙈 ↩︎

  8. 虽然我并不指望有多少人阅读。 ↩︎

  9. 还有一个理由是因为翻译完了之后,我的博客就会增加 8 篇文章。(写在这里希望没有人看见🤪 ↩︎

  10. Web Clipper 支持 Bear、GitHub、Notion、OneNote、有道云笔记和语雀 6 种在线笔记服务。我选择保存到 Notion(opens new window) ,然后从 Notion 中导出 .md 文件。 ↩︎

  11. 顺便测评了一下各种翻译工具,包括 Google 翻译(opens new window) 、欧路词典(opens new window) 、有道翻译(opens new window) 等,结论是没有哪一个翻译工具是最好用的,各有优劣。 ↩︎

  12. 这里(opens new window) 7.2 节第一段,希望作者不是故意这样写的🌚 ↩︎

  13. 原文位于 这里(opens new window) 的最后一段,我猜应该是 inertia(惯性、惰性)吧。 ↩︎

  14. Sarah Rothberg 的个人网站,一个很有趣的网站,一定要点开看看! ↩︎

  15. 从头读到尾差不多也忘完了。 ↩︎

  16. 我的邮箱是 [email protected],欢迎通过邮件交流。 ↩︎