正值十一假期,近期准备把自己的python
笔记精编整理,做一个pdf
电子书。在调研如何把多个markdown
文档转化为单个pdf
的时候,试了很多种方法。最后找到了最佳方案,也就是本文的主角,由phodal
前辈整理的电子书生成项目ebook-boilerplate。这个项目不仅支持批量转markdown
为pdf
,而且还支持转成ebook
等多种格式。
使用这个项目的时候,也踩了一些坑,需要做一些额外的配置。以笔者的场景为例,电子书生成环境是Ubuntu22
,需要转化一堆中文的markdown
。clone
了这个项目之后,除了ebook-boilerplate
本身README.md
里描述的内容之外,实际还需要留意以下环节:
第一块是pandoc
跟texlive
的环境,最好是官网下载最新的版本,apt
里面的版本已经过时了。尤其是texlive
,apt
拿到的版本很多宏库都没有,得要用官网最新的install
脚本才会自动把各种package
都装上。
然后是生成pdf
的操作里,需要指定一种支持中文的tex-engine
,笔者是选择了xelatex
。需要在makefile
的pandoc
生成pdf
那块做修改:
1 | pdf: markdown |
之后,markdown
生成pdf
的步骤,实际是把所有markdown
内容按文件名顺序(可以用数字标识组织一下)拼接在一起,然后用toc
按照markdown
的标题文本(h1
、h2
之类)生成目录,最后再生成pdf
。这里有一个问题,就是我们每一章都要分页,而在markdown
里标识分页的html
标签<div STYLE="page-break-after: always;"></div>
在tex-engine
下面,是没法出分页的效果的。这种情况下的解决方案是:把这个标签换成\newpage
,这样tex-engine
就能识别了。也就是说,你的md
文件的内容应该是:
1 | # 1.1 xxx.md |
再之后,我们可以修改listings-setup.tex
以及template/template.tex
里的内容,去修改代码高亮跟正文的排版参数。以笔者的观感为例,这里面的内容编辑了以下几个部分:
- 代码高亮,即
listings-setup
,basicstyle
设置字号为\small
template.tex
里,取消对于中文刊物习惯的设置,正文字号为9pt
,行距调整为1.1
。xelatex
下,中文字体为Noto Sans CJK SC
,默认字体为Helvetica
。当然,如果你喜欢衬线Serif
字体,也都得调整成衬线的形式。
最后就是各种调试勘误,生成最后的文档了。
当然,一开始所说的,笔者精心整理的python
笔记,现在也已出炉。各位读者可以阅读这篇文章以获取资源。