首先,下载软件
所需软件名为FreePic2pdf,下载后页面打开如下:
此时,您需要点击右下角的“更改PDF”,弹出如下图所示的页面:
其中“书签到PDF”是根据指定的文件将文件挂在PDF目录下,而“书签到PDF”是从PDF文件中提取目录。
二、制作步骤
先找一本没有目录的电子书,如下图:
然后,参考第1步“从PDF制作书签”。这一步的主要目的是生成一个指定格式的文件。
选择PDF电子书并运行后,会在同一目录下生成一个文件夹,如下图所示:
点击进去后,可以看到下图所示的文件:
然后你只需要在“Freepic2Pdf.bkmk.txt”中输入准备好的目录信息,调整格式即可。
目录的格式要求是:
\\t一级目录\\t页码\\t\\t二级目录\\t页码 \\t\\t\\t三级目录\\t页码 …
其中“\\t”代表Tab键。
同时调整“FreePic2Pdf.tif”中的BasePage参数。
如下图所示:
至于数值,你可以在第一章看到PDF文件的页数,这里我是12。
然后切换到“书签PDF”并点击开始生成PDF的目录。生成的效果如下图所示:
三。如何获取目录
最便捷的获取目录的方式是从百度百科或JD.COM商城复制。在大多数情况下,可以找到相应的目录。
比如在百度百科搜索后,跳转到目录页面,如下图所示:
以下是JD的搜索结果。COM:
然而,偶尔,我们找不到。这时候就需要找各种OCR识别软件。因为我是WPS的会员,所以直接用WPS自带的“提取文字”功能。当然也可以用百度翻译进行字符识别。
无论是网上查到的目录信息,还是OCR软件识别的目录信息,大部分时候都会出现格式问题。因此,有必要调整格式。
第四,调整目录格式
对于目录格式的调整,可以逐个调整,但是这种情况下工作量比较大,容易出错。所以需要一些软件用正则表达式来代替。
以下是我从网上捡来的目录:
我这里用的软件叫EditPlus。至于其他软件是否可行,你可以自己试试。需要注意的是,使用正则表达式进行替换时,需要勾选“使用正则表达式”选项,如下图所示:
去除所有的空格行
此步骤中使用的正则表达式为“[\\ t \\ n] *”,替换为“”,如下图所示:
替换结果如下:
对类似1.1.1这样的三级目录进行缩径处理
使用的正则表达式是“(\\ d {1,2} \\”。\\ d {1,2} \\。\\ d {1,2})”,替换后的表达式为“\\t\\t[43]”,如下图所示:
替换结果如下图所示:
对类似1.1这样的二级目录进行缩径处理
这里使用的正则表达式是“(\\ d {1,2} \\”。\\ d {1,2})”,替换后的表达式为“\\t[47]”,如下图所示:
替换结果如下图所示:
处理页码
用于处理页码的正则表达式为“…\\t .]*(\\d{1,3})[ ]*$”,替换表达式为“\\t”,如下图所示:
替换结果如下:
至此,目录的调整已经完成。