周至倒是不怕这些,毕竟岛国和国内一样,能够处理河豚的厨师是需要考取执照的。</p>
马爷不吃正好,周至正好顺便把他的那一份给干掉了。</p>
反倒是池田丘这样的年轻女士,对于吃这个部位一点没有异样,还笑吟吟地跟周至讨论口感,让周至感慨这女的要是在国内遇到付霞,指定聊得到一处去。</p>
之后坂本五郎对于周至和马爷的态度就好像有了点细微的差别,好像给周至的笑脸更多,对于马爷就有点应付了。</p>
听闻周至提出想要去静嘉堂访问,同时和静嘉堂文库的负责人讨论将文库数字化的工作,不由得对周至刮目相看:“周桑,这个想法,是在瀚文大字库创立之前就有了的?”</p>
说实话的确是如此,不过周至心目中的数字化图书馆远比现在任何人心目中的结构都要宏大得多。</p>
但是脑海里边的东西提前说出来一点用都没有,事情只能一步一步地做起来,现在第一步的瀚文大字库已经完成,才说得到第二步上来。</p>
第二步,当然就是将典籍的内容数字化。</p>
周至心目中的图书馆,绝不是简单的扫描,转字,存储这样简单的功能。</p>
这里面涉及到版本格式的数字化,文字内容的数字化,书目索引体系数字化,段落标签的数字化,特殊词库数字化,访问检索功能的开发,以及典籍内部与外部的联想特征接口。</p>
就拿《资治通鉴》来举例,周至要的不是一个TXT文档,而是一个立体化的数据库,研究者可以根据自己的需要,输入“汉武帝”三个字,就能够检索到资治通鉴里提到汉武帝的所有内容,由此拼合出一篇汉武帝的传记,同时还能够检索出每一个段落的具体出处,以及与汉武帝这个关键词有关系的一级标签索引段落,二级标签索引段落,三级标签索引段落。</p>
比如汉武帝的五服内亲人,父母,后妃,子女,重臣,重要制度,新立官制,政策,战争,灾异,这些就属于与之相关的一级索引。</p>
在位期间的其余地方大事,诸侯,番邦等,这些内容属于二级索引。</p>
以此类推。</p>
这样就会把编年体的《资治通鉴》,剖析出一篇纪传体的《汉武帝传》,而这篇传记上的许多内容,还可以一层一层地向下钻取,比如皇后这一索引,就可以钻取出卫子夫,从卫子夫,又可以钻取出卫青,刘据。</p>
这些是内部接口,还有外部的,比如将《资治通鉴》和《史记》、《汉书》、《后汉书》、《五代史》、《资治通鉴长编》等再度关联起来。</p>
当然这些已经是属于将来要干的事情了,当务之急是先要将典籍的内容数字化完成。</p>
也就是说,这一切的基础,是先要得到一个“《资治通鉴》.txt”。</p>
还有一个步骤,也是要和这一步同时进行的,就是“版本格式设置”。</p>
这个是用来展示用的,周至想要读者在浏览古籍的时候,体验到翻阅古籍的效果。</p>
要是再过几十年,这事儿就很简单,将典籍的高清扫描图片和隐藏的数码文字链接到一起,就能够轻松实现。</p>
不过现在却不行,因为如今的存储空间是非常珍贵的,高清扫描图片动则一两兆,《资治通鉴》一共三百万字,只需要6M的存储空间。</p>
然而要是连扫描图片一起打包的话,《资治通鉴》一共近三百册,一万多页,两页一图,拿起码也需要12G。</p>