[0247]博客的归档

一个女人要男方买房子还要在房产证上署名,这是务实的做法,降低自己将来的风险,不会因为婚姻的破裂而净身出门、流落街头。因为,男人那张嘴靠不住,因为他是活物,有可能会变,哪有无声无息、让人感觉踏实的房子等死物来得可靠呢!至于是不是因为算盘打得太精而伤害了感情,这里姑且不论。

博主如果认真对待自己博客的话,他必然重视博客的质量和安全。除了每日数据库备份,程序文件备份(镜像),感觉还差了点什么。因为一个博客在展现出来之前需要诸多环节:域名、域名解析、主机、图床,一个环节出问题,结果就是瘫痪。而我们自己在意的却只是结果,随着博客年龄的增长,文章必然越来越多,维护成本也会越来越高。或者说,为了维护这越来越多的数据的稳定可能会付出更多精力。

独立博客的精神就是自由写作。事实上随着使用越来越多,我们可能会被数据维护、数据安全、博客平台等问题所绑架而自由不再。怎么办?继续研究这其间的技术吗?各种站长工具必然是很多的,这也是一个办法,与时俱进,天天更新。然而我想,既然我们在意的是博客呈现的结果,何不定期以最终格式来归档,例如打印成PDF?所以我想到的办法是定期(例如每半年)打印PDF汇总成册。

具体操作方法是这样的:

1、打印。博客发布后一段时间(例如一个月)后,评论基本上不会再增加了,可以打印PDF(A3,保留链接),作为互动内容的评论自然应当也包含在内。至于不包括评论的话,除了一开始就打印和暂时删除所有评论之外,不知道还有什么好办法。如果考虑装订,可以调整边距,左边距:15mm,为装订留空间;下边距设为10mm,为页码留空间。打印成A3是因为打印出来字体偏小,A3缩放到100%字体大小刚好,为了阅读方便,所以保留页面上的链接。

2、排序。打印后保存到本地或网盘,单个文件并不大。因为打印出来的格式是:方室网志_博客的归档.pdf,为了排序,在方室网志后面加上发布日期,例如140811(百年之内不会重码的)。

3、合并。将博文按分类目录归类,各分类下合并博文。然后再将各分类加上封面/后封、关于博主、文章归档(放最后作附录)一起合并,那么这个PDF文档就像是一本书了,如果博文太多,数据太大,可以考虑分卷(例如按年分)。

4、插入页码和页面。用Acrobat合并后,可以通过“增加页眉页脚”插入页码,如果为了打印装订,可以在每分类前面增加分类页面。至此,基本上完成。

其实还差个目录,但是通过Acrobat搞不定。据说有可以导出书签的工具FreePic2PDF,我暂未尝试。所以将“文章归档”页面打印出来附后参考。

当然,因为打印过的博文一般不再打印,所以就有一个小小的问题,最新的评论可能不会更新(如果持续开启了评论的话,我则暂时是关闭了30天前的博文评论),不过,半月前的文章还有人看和留言吗?对我来说,问题不大,如果要评论,请移步留言板(关于博主)。博客是个活物,所以不稳定,PDF是个死物,它稳定。这样一直维护的不过是半年的博文,轻松多了!

我汇总了一下今年7月份以前的博文,加上评论部分,总共有370多页,70M+,看来分卷在所难免。这种做法明显带有前互联网时代的色彩,程序员和准程序员博主想必对此不屑一顾的,本文仅为分享,而非推荐,诸位随意。

Update

如此试行了一段时间后,由于后来博文调整幅度较大,如此归档比较麻烦,故暂停这种方式归档。

《[0247]博客的归档》上有29条评论

    1. 工作量大不大,其实和博文更新频率高低有关,只要成为习惯,这个工作就很轻了。怕的就是平日不干,堆到一天里集中去做,那就要累死人了。

  1. 普通虚拟主机还得想着天天备份数据,我用的SAE自上次出事之后,就全部都采用了一主多从的SQL数据库,丢失数据可能性几乎为零。再为了保险,一月一次足以!!

    1. 就这样坚持维护数据体几十年吗,博客都没有用另一种形式沉淀下来?物化的寄托我觉得还是有需要的。

        1. 哈哈,你的太受欢迎了!评论的多!我归档了两年的也就600页不到,不过,打印成纸质的就略奢侈了。

    1. 这个我是有印象的,但是效果不太好,贴图好像没看到,排版也不好,一点都没有一本书的感觉,而我的想法其实就是做得像一本书,一年一册,即便是日后博文供有上万篇,也不会越来越管理很累的感觉,反而会有成就感。你有什么想法,赶紧写,咱也借鉴借鉴。

      1. 你的要求高。我感觉,成书是分成两步骤的:备份内容+调整版式。我打算写的是前者,谈的是技术。后者是需要一些艺术细胞的。

    1. 你的这篇文章我以前看过,以后应该会尝试一下。不过,从WP换到Farbox有点治标不治本,文章、插图、评论、显示都完整的保存下来,除了打印下来,我想不出还有什么一劳永逸的办法来保存博文。我这一套吧,其实就相当于年度总结。

    1. 你更新的快自然就多了,chrome浏览器打开博文,右键打印,保存,一分钟都不要。加上增加日期,也就2分钟。越堆越多那就更没法弄了。

    1. 非程序员的自然选择,我这个自然可以打印出来,但是存在页码和目录问题,不方便。

    2. 原来Acrobat可以增加页码,目录问题暂时不好解决,手动显然不是好办法。你说的诗诗成长日记是http://rosechan-shishi.com/?

  2. 当我认识一位新博友的时候,会尝试把他以前的博文都挖出来读一遍,有感觉的还会留言.就像现在这样.
    遇到我这样的会让博主很无奈吧,哈哈.

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注