上个月参加了“数字图书馆前沿问题高级研讨班”,去之前感觉今年不可能有太多新意,回来之后感到还有许多可以总结的东西。拖至今日,再不总结恐怕要淡忘了,特简记如下:
- 传统集成系统逐渐演化成按使用职能划分的后台管理和发现服务两大块
- 本地安装的系统向远程代管过渡
- 费用支付方式从购买转向租用
- 软件开发采用商业和开源软件混合组配
$cache_schedule_interval = '0'; //Added by WP-Cache Manager $cache_gc_email_me = 0; //Added by WP-Cache Manager $wp_cache_make_known_anon = 0; //Added by WP-Cache Manager $wp_cache_front_page_checks = 1; //Added by WP-Cache Manager $cache_time_interval = '3600'; //Added by WP-Cache Manager $cache_scheduled_time = '00:00'; //Added by WP-Cache Manager $cache_schedule_type = 'time'; //Added by WP-Cache Manager $wp_cache_home_path = '/'; //Added by WP-Cache Manager $cache_page_secret = '7b7eb013a46dc661c0490c5f249538a4'; //Added by WP-Cache Manager $cache_schedule_interval = '0'; //Added by WP-Cache Manager $cache_gc_email_me = 0; //Added by WP-Cache Manager $wp_cache_make_known_anon = 0; //Added by WP-Cache Manager $wp_cache_front_page_checks = 1; //Added by WP-Cache Manager $cache_time_interval = '3600'; //Added by WP-Cache Manager $cache_scheduled_time = '00:00'; //Added by WP-Cache Manager $cache_schedule_type = 'time'; //Added by WP-Cache Manager $wp_cache_home_path = '/'; //Added by WP-Cache Manager $cache_page_secret = '7b7eb013a46dc661c0490c5f249538a4'; //Added by WP-Cache Manager
上个月参加了“数字图书馆前沿问题高级研讨班”,去之前感觉今年不可能有太多新意,回来之后感到还有许多可以总结的东西。拖至今日,再不总结恐怕要淡忘了,特简记如下:
以下针对不同知识背景的读者,分别给出了不同详略程度和专业程度的解释,供参考(并请提出意见):
1、普通网民(知道如何上网,希望对一些网络知识做一般性的了解)
关联数据是一种由国际互联网协会(W3C)推荐的数据规范,用来联接和发布各类数据、信息和知识,使互联网上的服务器能够基于内容进行检索而不是简单的全文检索(文字相同但含义不一定一样,会检出很多不准确不相关内容),从而更准确地分享和关联信息。
2、普通图书馆员(非IT相关专业大专或本科毕业,能利用网络查找信息或为读者提供服务,懂得MARC是一种元数据)。
关联数据是按照一定方法发布的数据,它直接以每个数据的网址作为它的名称(即其中只包含字母数字和左斜杠),并且数据不是一般的网页文件,而是由字段组成的元数据记录,字段描述中通常包含到其它数据的链接。
3、资深编目员或中级职称以上自动化系统管理员(长期从事编目工作或ILS维护工作,了解国际编目规范和图书馆相关技术的最新进展,参加过元数据相关知识培训或从事过相关研究)。
关联数据是按照一定方法发布的数据,它直接以每个数据的网址作为它的名称标识(即名称中只包含字母数字和左斜杠),并且包含以RDF/XML格式描述的元数据信息。由于RDF数据里包含了指向其它RDF数据的链接,因此能形成富含元数据信息的数据关联。
4、Web应用开发人员(具有IT知识背景,熟知最新Web技术,参与过Web应用的开发)
关 联数据是任何资源在万维网上发布的一种方式,以HTTP URI方式链接到一个以RDF/XML编码的数据对象,而不是一个其它任何格式的文档。其中URI决定了数据的唯一性和“可关联”性,RDF确立了数据的 语义和链接的实体。RDF文件中应该包含更多的由URI所标识的其它资源,即尽可能不使用“空节点(blank nodes)”少使用“普通文字(literal)”,并且包含以RDF/XML格式描述的、规范格式的元数据信息。空白节点(Blank node)是指没有全局ID的本地资源(没有定义命名域的URI,如ISBN, DOI),文字(Literal)指一个字串值(可以有类型以及语言属性)
5、语义Web研究者(熟知语义Web技术,有志于为互联网带来图书馆的知识服务)
关 联数据是由Web的发明人Tim Berners-Lee提出的一个概念,定义了一种URI规范,使得人们可以通过HTTP/URI机制,直接获得数字资源(Thing),从而实现一种 Web上的富链接机制。从本质上看,关联数据是将超文本链接(即文件之间的链接)转变为超数据链接(事物Thing之间的链接)。
TBL认为关联数据是实现Data Web的关键技术,应符合四个原则:
这是发在书社会的一个帖子,引起热烈讨论,贴在这里让它继续发酵吧。
顺便做个书社会的广告,要加入可以点击 这里。
______________________________以下转贴______________________________________
前些日子接到学姐发来的邀请,希望就谷歌数字图书馆计划,为他们的馆刊写点看法。
题目是这样出的:
在这样一个悲情的日子谈谷歌,不由我不愤青一些,更加旗帜鲜明地说出我的观点:
一、 哥不是一间公司,哥是现代版的亚历山大图书馆。
亚 历山大图书馆是我们这个专业难以企及的神话,就像通天塔之于上帝,就像西西弗斯之巨石。Google昭告天下的使命是:“整合全球范围的信息,使人人皆可 访问并从中受益(To organize the world’s information and make it universally accessible and useful)”。2001年2月美国信息技术咨询委员会(PITAC)向布什总统提出报告:《数字图书馆:实现对人类知识的普遍访问 (Digital Libraries: Universal Access to Human Knowledge)》与谷歌的理念异曲同工。有人据此调侃,2049年前后,美国政府将宣布谷歌作为其国家图书馆之一。
图书只是谷歌信息世界的很小一个部分。人类目前保存在世的图书总数有多少?据估计也就1亿种左右。谷歌与图书馆和出版商合作的Google 图书搜索计划目前已达到1000万种图书的规模。最早与谷歌合作的五家图书馆:密西根、斯坦福、哈佛、牛津 Bodleian四个大学馆以及纽约公共图书馆,在世界上可算是业界翘楚,其馆藏总和不过1500万种。谷歌打算投资2亿美元,在2014年前完成这个数 字化项目。各国面对谷歌这项史上最大公益性事业的聒噪大多是一种狭隘的民族主义,或者以己度人的小人心态。谷歌认为他是在帮助图书馆实现自己的理想,他是 图书馆事业的有机组成部分,图书馆收藏有全部图书文物,而通过谷歌提供阅读服务。
二、哥不仅是一个图书馆,哥还是另一场古登堡发明和纸皮书革命
可敬而又可畏的其实并非谷歌侵入图书馆的领地而广施善行于世人,而是敢 于挑 战日渐腐朽过时的传统版权制度,营建新的利益平衡和知识秩序。
随着2008年10月Google就其扫描的绝版书与美国出版商协会 和美国作家协会达成赔偿1.25亿美元的和解协议,Google几乎就是拿到了合法的对于传统版权制度进行“侵权”执照。即便该和解协议覆盖范围极其有 限,这个模式也将为同类纠纷提供参考。这个世界还没有其他的“唐杰柯德”能够出得起Google的价码。
谷歌正在以新的商业模式探索数字时 代的知识产权保护规则。谷歌正在建立一个无比巨大的信息分销零售平台,凭借其所向披靡的搜索引擎和领先的技术优势,将人类的智力产品搜罗、标注、索引、组 合,其载体类型扩展到期刊、报告、 会议录等几乎所有传统学术出版产业中,数字媒体自然更不在话下。其内容帝国进一步与新闻、多媒体行业融合,在整个内容产业中攻城略地,依靠其平台和商务模 式,左右整个内容产业链。当然,这个领域也并非只有谷歌一个玩家,亚马逊、苹果也是其中翘楚。
三、图书馆是世界上最无私的事业,应该敞开胸怀,拥抱谷鸽及其同类。
谷歌的战略布局已经初现端倪,代表了先进生产力,任何企图抵抗的力量都将不堪一击。由Internet Archive、微软、雅虎等组成的“开放内容联盟”曾经也想在这个领域分一杯羹,但在扫描了75万册图书之后,还是放弃了。当初微软的决策纯粹居心叵 测,几乎完全是出于搅局的冲动,而非真心公益。其它类似的数字化项目还有中美百万册图书计划、古登堡数字图书馆计划和美利坚记忆数字图书馆项目等,从规模 上和技术上不能跟Google图书搜索计划相比,但也是给数字图书馆事业添砖加瓦。我们图书馆人并无自己的私利,为读者服务就是我们的最大利益。我们完全 可以利用好一切资源,谷哥正是我们最好的兄弟。


————————评论区分隔符————————————
下面是原帖后的留言评论,没想到引起这么大的争议,留言已达64条之多,其中很多都具有相当的代表性,反映了人们的认识是多么的“多元”啊!是非对错每个人都有自己的判断,一定要辩个清楚明白本身就不符合网络世界和谐共存的理念,呵呵。
如果有当事人不愿意在此贴出,请告知我(kevenlw at gmail.com),即删去。
————————以下为留言讨论———————————
程亮 2010-04-02 01:23
心态有问题
Google就是这个亮点,呵呵
聊发少年狂哦,哈哈。
我怕他们一旦形成自然垄断,就一定会扩大垄断利益,说实在, 我对资本的心态是不怎么好。。。
你 这是我以前的观点。你觉得现在这种清醒不是扯淡吗?
听 其言,观其行。资本是充满丑恶的,相对于权贵来说,资本还算是比较公平的。我们不能因为生活中充满丑恶就不相信美好,特别是美好当前的时候。那样的话就太 可悲了。
相信美好,生活才有希望.支持谷歌!支持K师!
资 本是从属与契约的。当资本和公共事务达成契约,想作恶也不是那么容易。即使有钱买下资产,没文化也只有搞死。贵国4年前发起的第一波赤膊冲锋已经死在沙滩 上了。
1、版权是技术发展的产物,也会随技术的发展而发展。破坏现有制度是需要代价的,包括我们的观念更新 的代价;我们习惯于神话制度,崇拜权威。
2、更乐于拥抱新技术的绝不是图书馆行业,而是产业界。只有他们才有打破现有格局而大发横财的动力(但也绝不是中国产业界,中国科技创新的主体在于领导而 不在企业)。对于图书馆而言,正因为目前技术进步的风暴中心在于信息技术,已经侵入家门了,不可能没有影响。9大高新技术,我们能够置喙的有几项?生物技 术?新能源?
3、敦煌经卷的案例已经很说明问题了。数字化信息也是一样。
版权的发展毋庸置疑,图书馆也乐见Google挑战版权,反正现代版权制度又不是图书馆生存基础, 反而很多地方受制于版权制度,违背了自己公益之心。但Google挑战版权与否如何挑战版权与图书馆如何处理与Google的关系是两码事。图书馆与 Google,如果太过死心塌地,那注定是一场孽恋:拥抱你,甚至爱上你,并心甘情愿被你一刀捅死。图书馆死了没关系,死之前还帮人数钞票就太伟大了。无 论如何,图书馆应该拥抱的是多元世界,而不是独大Google。
您也太爱护图书馆了吧?图书馆在乎吗?这只是一项人为的制度设计而已,其实是最没有自我的一盘散 沙,好处是可以利用一切力量。Google独大而不作恶,我看没什么不好,图书馆又不需要托付终身,那么紧张干嘛?
1.图书馆是一项人为的制度设计——敢问社会中啥啥机构不是人为的制度设计呢?
2.图书馆是没有自我的一盘散沙——吗?
3.图书馆是可以利用一切力量——是利用还是被利用?
我不反对被利用,被利用说明有价值。短期内的G图相互利用未来会是如何呢?有价值是被利用的基础。
4.Google独大而不作恶,这点判断太过武断。希拉里找了几大网络公司高层午餐之后,Google就退出中国内地,不让人不怀疑Google是美国棋 局中的一个棋子,棋子有时候是无法决定自己是否要作恶的。
5.图书馆的未来在什么地方。如果Google数字化了地球并免费提供内星人和外星人访问,图书馆就可以不存在,那没关系,乐见如此;如果Google收 费提供访问,那么Google与现在的出版商又有什么不同呢,图书馆自然有存在的基础。
6。综上:Google是否数字化地球,与图书馆的态度无关。Google用一用图书馆,其不会给图书馆带来高潮,图书馆也不必假装高潮。
一个亲身经历,是件小事,但是我不相信google是不作恶的,虽然他很伟大。
1、现代企业制度就目前而言,是一项符合社会发展规律的制度,并且还能随着人 们对社会经济及技术发展规律的认识不断提高而发展,是一种活的社会组织形式,比较不具有人为的主观性。
2、图书馆从事业整体上而言,根本是违背很多规律的,贵国的图书馆行业本身自己就没多少利益,还争得不可开交,很少合作共享,在我看来比一盘散沙还要散, 简直是同行冤家。
3、不管利用还是被利用,只要对读者用户有益,就能实现图书馆的价值,就是图书馆的存在目的。
4、至少至今为止,Google是越来越伟大,越来越可爱了。从机制上讲,它的毛孔必然流出工人的鲜血,不过我们还是先擦干自己的鲜血再说吧。
5、图书馆的未来是不用发愁的,作为公司是没有永续经营的,但是作为图书馆这种“制度安排”,已经基本上成为缺省的民享设施了,即便是国家政权宣布 google为图书馆,我们也没办法,是波?Google就是出版商又怎么了?图书馆从来就是有能力与所有肮脏制度和平共处的。
6、不必太冷淡吧?
问题就在这儿。一问兄,这里我没有看到任何资本与公共事务的契约,因为没有任何真正代表公共事务的组织与机构与资本签 约了。我只有就事论事地看到某一个案件的和解。
其实我不是担心Google的作恶,就象韩寒所比喻的,在它之前或之后,要说作恶已经不知道有多少人了,好歹Google还付点银子的,很公平。其实它的 作法,不管是披着什么样的外衣,不管对社会是好是坏,我们都可以冷静观之,合作也不是问题。实在看不清楚的时候,用常识判断,这样我们至少知道它还是家公 司吧。而图书馆才是公共事务中的一份子,不能忘了自己公共与独立的精神源头。
资本就是资本,即使从资本的角度来讲,我也看到了此事自然垄断的倾向。所以就是从资本的角度来讲,Google也是个危险的主儿了。
谷 歌曾认为我的博客网站优化作弊,很久不收录我的域名,至今不允许我开通广告账户,曾经让我一周不能访问gmail(我曾经报道此事),我都非常恼火。但我 不认为那是作恶,那只是自私、自我保护而已。我歌颂自私,己所不欲勿施于人,保护自己才知道保护别人,才有助于人人平等的法治环境。我们经历过太多假高尚 之名侵害别人尊严和利益的事情。
这是一种极其 龌龊的做法,我当然反对。这是不能跟google的行为相提并论的,谷歌跟图书馆有协议,而且严格遵守。其根本区别不是是不是读者受益,而是目的是自己赚 钱。
禁止用户某些服务可以理解为自我保护,但是把别人明确禁止商业用途的资源提供给商业公司的到商业软 件,难道还不是作恶吗
我也怀疑,但是我鼓励Google,最好让它上套,骑虎难下,为此破产(当然不可能,leon说了,它是公共公司, 不像我们的公共公司,不仅共你的产,还让你赌瘾大发倾家荡产)。
必要时我会帮助google,不管这种力量是多么微小,我帮的不是哥,是哥的事业,同样就是帮了孔子、马克思、孙中山…,我也看不到完成的那一天,但 是我尽可能享受过程,过程中自然有高潮,可能只是我虚幻的小高潮而已,只要不是假高潮…
我觉得以后学术的东西应该开放存取,非学术的东西应该是您说的信息分销零售平台,有没有google也都会实 现吧。
同情 你。。。但是举证很复杂,何不通过法律渠道来讨个说法?现有体制下,也只能相信法律了。
google 只是个符号而已,什么东西都依赖它,也肯定不现实。希望千万个google站起来,嘿嘿。
想 到我还在用它的很多服务,我就原谅它了
谷歌与**公司只是盈利模式上的不同吧?何来一个伟大,另一个龌龊?
我已 经说清楚了:目的截然不同。俩愣头青看上你家千金,一个是爱上你家千金,一个是爱上你万贯家产,你应该嫁谁这都看不出来,还管他商务模式?
说清楚点:google books计划分两块,跟图书馆合作的那块是不允许拿来挣钱的。**公司的第一桶金是如何挣的我就不去说他了,这些个原罪都是要还的。
1.现代企业制度中的垄断企业和反垄断法律约束,本质上也是一种人为的制度设计。——Google几乎要成为垄 断企业了,就差图书馆届再给加把油了。
2.贵国的图书馆行业争名夺利的事不光是行业本身的问题,一个靠分享纳税人收入生存的行业怎么可能不练就一身争名夺利的本事呢。教育事业、卫生事业、文化 事业,争名夺利的事儿多了去了。
3.对读者用户有益,是看暂时有益还是长远有益了。读者的免费是从哪里来的?图书馆花钱买的。图书馆的钱是从哪里来的?纳税人的。谁是纳税人?图书馆的读 者。好,垄断之后的结果就是图书馆需要花更多更多的钱买访问权满足读者的需求。
4.擦干自己的鲜血,这里没明白。请K师指点、明示。
5.铱星电话系统作为人类历史上第一个真正意义的全球卫星定位系统,最开始是由美国一家公司建设、经营的。现在这家公司破产了,铱星系统就被美国政府接手 了。美国历史上这些例子很多,如果未来Google真被图书馆(政府)给接手了,也不错。
6.嘿嘿,冷淡是假装冷静。
Google的目的也是赚钱,这个Google自己也承认。
我家的千金就是我家的万贯家财。谢若琳说,你。。。你。。。你告诉我桌上这两根金条 哪。。。哪。。。哪一根是高尚的,哪。。。一根是龌龊的。Google和**公司就是那两根金条。
老马的观点在西方已经过时,但在中国正在上演。呵呵
谷歌退出内地是因为谷歌作恶还是GFW作恶?
关于垄断,图书馆人就不要瞎操心了,美国有反垄断法,如果Google成为垄断性公司,美国政府将会依 法拆分。图书馆人有时想得太多,等你想清楚了,世界早就变了。
商业公司难道不是公共事务的一部分?谁又是公共事务的主体?政府?
赞一个!发人深省!!
恰恰相反,以 2008年以来的数据分析,老马的观点正是研究热点。
谷歌退出内地是因为谷歌作 恶,这点在中国是有法理基础的。另外,GFW作恶并不能证明谷歌不作恶。
奇怪了,中国人干嘛要看美国法律为依据来判断自己是否想多了。
longway, 你这是典型的中庸之道,各打50大板。“GFW作恶并不能证明谷歌不作恶”可不是好的推理,能否说一说谷歌如何作恶了?
老魏也开始中庸了。为什么对“迹象”就要开始批评?我们理解迹象后面代表了何种事物?GFW就像戴墨镜看东西,两眼一抹 黑,什么都是阴暗的。老花镜看东西近地清楚,远地模糊,很多迹象都会出来。我们要有勇气用望远镜看东西,脚下可能会摔跟头,但大方向要清楚,这是信息时代 赋予我们的责任!
不 懂啊,google触犯了哪条法?不安政府的意愿办就是犯法?是否触犯法律应该由法院说了算,可惜政府并没有通过法律途径,可见没犯法。
赞!
同赞

关于 Google的不作恶,事实上这是一个非常扯的slogan。作恶与否,首先要确定恶的标准。如果恶的标准不一样,那么对于恶的界定也不一样,对吧。甲之 熊掌,乙之砒霜。我们就能说熊掌就是一定好东西吗?中国政府以某某国内法律要求Google对关键词进行过滤,如此要求Google不作恶,而 Google认为中国政府这是在作恶。因为Google拿着“普世标准”来衡量恶与不恶。
好,现在的问题就是恶的标准到底应该是什么?我认为目前是新旧标准互相博弈的阶段,没有一个明确的标准。这样的博弈和斗争在许多场合都存在,比如哥本哈根 会议上减排标准拟定,比如人民币的汇率是否合理。
还是没有明白Google如何作恶了。
举一个例子,你从超市买回一包大米,你们家的“领导”说必须把小一点的米粒挑出来才可以做饭,你说我不干了。这是你在作恶还是“领导”在无理取闹?
或许生产大米的公司有这种责任,但是不能要求背大米的人对大米袋里的内容负责。更何况有时小一点米粒的营养更好,“领导”根本无法代替使用者作出决定,因 为他根本不知道这袋米会是用来做米粉还是做米饭的。这样的人才是真正的可恶!
我能理解longway同学站在某种“后现代”的角度批判任何既定的标准(虽然我不确定这么说是 不是合适)。但是至少对我来说,在实践中,这件事里显然是有相对的谁对谁错,谁好谁坏的。
能不能告诉我,你最近一次去图书馆是在什么时候?
中学?大学?某次路过?
没关系,不用为没去过图书馆而感到内疚,你可能根本就找不到它。目前在中国每47万个人才有一个公共图书馆。如果你碰巧还有一张“读者证”的话,那么真的要恭喜你了,你属于“百里挑一”:每130个人当中才有一个1。
全民阅读调查统计显示,我国每个识字公民年购书经费约在30-40元,除去教科书教辅书,其中真正购买“图书”的花费不足10元;被调查者自述年阅读图书一般在4-5本。从图书馆方面来统计,全国公共图书馆人均年购书经费0.5元;全国2762个县级以上公共图书馆收藏了4.8亿册图书,人均0.39册;服务了总人口的0.8%,即1062万持卡读者;年借阅图书2.03亿册次(2005年),平均每个读者每年看书19.11本。
而美国,每三个公民就有两个是图书馆的持卡读者,平均每人每年去图书馆7次(年接待人数22亿),图书流通率相当于美国人口的近5倍(14亿册件)。在英国,每一万人就有一所图书馆。
这些数字说明,我国远远算不上一个图书馆大国或者读书大国,但图书馆的读者却都是读书狂人。公共图书馆成了极少一部分自己买不起书,却酷爱读书的公民的乐园,它用了极少的社会投入,获得了极大的社会效益。
与此同时,我们所处的时代又是一个信息泛滥的时代,人们每天一睁眼,就被“信息污染”包围,始终处于“被阅读”、“被轰炸”的状态。书店里坐卧横斜人满为患,地铁里嘻哈一族捧着PSP、手机看小说,“起点中文网”的崛起标志着网络阅读财源滚滚,出版界为Kindle、电纸书而疯狂,手机报正在兴起,3G厂商也已推出多媒体阅读概念……,未被“娱乐至死”的电视媒体所终结的印刷王朝,几乎已经无法在数码网络时代继续苟延残喘。
这一切说明人们并非不喜欢阅读,社会也并非不需要阅读,而是阅读正在转型,阅读也需要重新定义。
在这个过程中,传统的图书馆正在OUT。
数字图书馆正在兴起。
一、数字图书馆:不再有“书”的图书馆
前国家领导人李岚清在1998年10月2日视察国家图书馆时指出:“数字图书馆是图书馆的未来”2。这当然不是他本人的研究成果,而是自上世纪九十年代开始,随着美国国家科学基金会(NSF)、国防部高级研究署(DARPA)和美国航空航天局(NASA)巨额资助数字图书馆研发之后,国内连续数年不断学习、消化、试验、讨论,形成的一定程度上的共识。
然而,对于什么是数字图书馆,可以说至今还没有给出能够得到大家公认的定义,或许我们只能让“数字图书馆”的未来发展自己来定义。
什么不是数字图书馆,倒是得到了一定程度的公认,这种公认与人们的常识有一定距离:通常认为的“数字图书馆”,一般是指印刷的图书经过扫描数字化、变成“电子书”之后,在网上提供在线阅览或下载服务的网站。这恰恰不是“数字图书馆”的主流,至少不是数字图书馆的理想形式,最多只是一种形式而已。计算机科学家甚至认为“数字图书馆”与现在的图书馆没有多少关系,它只是因特网上海量信息的一种结构化存在形式。
不过目前这种“山寨”数字图书馆概念充斥了主流媒体,从而在人们的大脑中形成了认知惯性。这应该都是“图书”这个名称惹的祸。2006年美国OCLC的调查表明,社会大众对于“图书馆”的认知,是与“图书”这种形式紧紧捆绑的,这种捆绑有利有弊,“利”在于赋予了图书馆一种实在、永恒的特性,一想到图书馆,总是巍峨的大厦,无尽的书架和人类所有的知识;“弊”也显而易见,随着传统“图书”的消亡,图书馆也将无可避免地走入历史。数字时代,一切皆有可能。
其实图书馆只是通过“图书”,最终与“知识”达成捆绑。“图书”(包括期刊、报纸等传统纸媒读物)这种载体形态及其所造成的阅读习惯是印刷时代的产物,知识一旦数字化之后,内容与载体就彻底分离,编码与形式得以彼此独立,任何内容、任何媒体,还原为计算机可处理的0和1,一下子就“人人平等”。对于图书馆来说,只是知识的载体形态发生了变化,知识的内容并无发生改变,图书馆收藏、保存、传播知识的职能并未发生变化。
因此,从上世纪九十年代以来,图书馆开始收藏光盘,后来是越来越多的文摘索引数据库和全文数据库,数字媒体在图书馆的采购比例越来越高。目前,国内外一些研究型图书馆采购数字资源的比重最高可达订购经费的80%。由于检索、传递和使用的方便性,数字资源的利用率更是远远超过传统资源。
资源的数字化对图书馆的业务流程和服务方式造成了重大影响,对图书馆员的素质要求和工作内容也产生了巨大变化。一个直接的影响就是,图书馆员必须自己首先具有相当的计算机技能,克服“信息鸿沟”,才能帮助读者,提供必需的服务。目前我们正处于由传统图书馆向数字图书馆过渡的时期,“复合型图书馆”就是为在这个特定时期、传统资源与数字资源混合的业务和管理模式提出的一个新的概念。
“图书”等传统载体形态,随着出版行业的彻底的“数字化”,成为数字化信息内容的一种输出形式。因为将来的绝大多数信息都是“Born Digital” 的,先有数字形式,再有物质形态,而不是相反的先有传统出版,再进行数字化。而且由于传统图书的材料消耗和工艺流程所造成的高额成本(相对于数字拷贝而言),“印刷”将成为一种“贵族”消费。现在的图书必然是将来的“古籍”和艺术品,按需打印的图书也会进入奢侈品的行列。
从另一方面看,电子图书、数字期刊以及手机报纸之类传统出版物的直接“转型”其实只占“数字出版”的很小规模。据报道我国2008年数字出版行业的规模达到530亿元,而50万种电子图书的产值只有区区3亿元规模,9000多种电子期刊也只带来7.6亿元的收入,两者相加刚过10亿元,只占了整个数字产业规模的2%,其趋势看来就是可以忽略不计了。
数字图书馆就像一台大熔炉,所有的数字信息都可以在其中煅烧、冶炼,然后水银泻地一般,通过覆盖世界各个角落的互联网传播开去。大众阅读将彻底碎片化、多媒体化、动态化,任何手持设备都能够显示内容,计算机可以在任何时候, 、任何地点,瞬间将任何内容,在全球范围内,以任何载体、形态、格式和体验传输给任何需要它的“读者”。
这就是未来的数字图书馆。
二、数字图书馆:时势造英雄
与 “图书”捆绑的图书馆最终将会为图书陪葬,与“知识”捆绑的图书馆,才能独立于知识形态和载体的变化,不论信息技术风云变幻,继续实践图书馆“收集保存、有序组织、知识交流、休闲娱乐”的社会职能。图书馆的社会职能可能会随着社会分工变化和替代行业的出现而发生重点的转移,但是无论如何,作为一种保障民众获取知识与信息的公平权利、消除知识鸿沟和信息鸿沟的公益性社会机构,无论是实体的还是虚拟的,纸张的还是数字的,其职能是永恒的。
如果我们把“无纸社会”作为传统媒体向数字媒体过渡的一种象征的话,真正的“无纸社会”只是一个无限逼近的目标。历史上媒体的变迁很少有直接替代的情况发生,更多的是由于功能被新的媒体所替代而造成使用方式和习惯的迁移,老的媒体通常能发掘出新的用途,或者以前的次要功能发展成主要功能。
美国伊利诺伊州大学厄本那—香槟分校的兰开斯特教授分别在1978年和1982年写过两本关于未来图书馆和图书馆员的书3,预言无纸化社会将在上世纪末到来。1999年他老人家对他的预言进行了反省,提醒人们技术的发展会带来对人的忽视。其实技术的发展总有个过程,计算机科学和网络技术一直在向更加人性化的方向发展,可视化、虚拟现实、穿戴电脑等都是近年来最前沿的技术,上世纪七十年代兴起的人工智能研究虽然是失败了,但记载了科学家的努力,Web2.0、语义万维网更是技术以人为本的证明。技术到底还是为人服务的。人的贪婪总是会对技术提出越来越高的要求,归咎于技术,只能是人的无能和无知,也是把技术异化了的表征。有人根据兰老的反省仿佛见证了兰老的愚蠢,认为他的预言的破产就是信息技术的破产,并举例说“无纸社会”实际上用纸更多了。
真是这样吗?预言家们只不过性急了一点,无纸社会尚未到来,但纸张作为一种印刷媒介和信息载体,已经不再具有主流媒体和知识传播的作用,不再具有大众媒体的地位,而逐渐退出历史舞台;取而代之的,数字媒体、网络传播将成为主导方式。
印刷取代手抄,报纸取代公文,电视取代广播,电话取代电报,电邮取代信件……历史上这样的故事发生过多次,但是当前的数字化浪潮恐怕只有印刷术能够相比。我们正在经历一场由信息技术革命带来的人类社会的整体变革。能源、生物、材料和信息四大决定人类未来的发动机中,到目前为止,还只有信息革命率先取得了突破。
目前全球的网民已超过16亿,我国约占五分之一,更有手机上网用户1.55亿4。这个媒体迁移过程,随着我们一两代人的更替,可以自然完成。现在的网络一代,眼不离屏幕,手不离键盘,一天可以泡网十几个小时,出门也不忘带着上网手机。网络就是他们的江湖。对他们而言,任何东西,只要网上没有,就不存在。书本基本上是个负担:书包是每天的负担,买书有金钱的负担,读书更是扼杀青春的负担。偶尔街头买一张小报,或时尚杂志,一般是为了心理需要,或者可以当个坐垫。
如果我们把人类历史的坐标尺度放大,自上世纪下半叶开始的信息技术革命已经是快如闪电了。我们生活在一个一切都按照指数级发展的时代,现代人一年中所获得的信息量,是19世纪一个英国普通人一生所获信息量的总和,而目前每年新增的信息量,又是过去5000年人类信息的总和。历史上还没有哪次新技术革命,能够给人的生活,在一个人有限的一生中带来如此剧烈的变化。
工业文明的印刷技术带来了图书馆的第一次复兴,数字时代必将带来下一次复兴。人类探索世界、追求理性的天性赋予图书馆以基本精神,这些精神随着知识的丰富和理性的进化而不断发展,即存在于图书馆收藏和整理的知识中,也浓缩和积淀于图书馆的精神和理念中,归纳起来,图书馆的基本精神就是知识自由的精神,图书馆的服务理念就是平等无差别和免费服务。现代图书馆的贫民化和开放运动、美国钢铁大王卡内基对公共图书馆的塑造、当前学术领域的开放存取运动等等,这些东西不会随着技术的进步、服务手段的提高以及图书馆形态的变化而变化的。这些理念和精神是永恒的。
这就是现在图书馆行业面临的信息环境,也是数字图书馆应运而生的土壤。图书馆的理念、价值和运作模式独立于它的形态和内容,就像印度图书馆学家阮冈那赞所说的,图书馆是一个不断发展的有机体。其最大特点就是适应性,在任何环境下,都能够调整自己,复制自己,发展自己。
三、数字图书馆:存取人类所有知识
1849年,英国考古学家莱尔德发掘了迄今确知的最早的图书馆——亚述巴尼拔图书馆,发掘出近3万块泥版文书。这座公元前6世纪的图书馆却不是最有名的,只是由于泥版文书的特殊性,使其免于战火,保存至今。而大大有名的,只限于文献记载的、比它晚400年的古埃及亚历山大图书馆,却成了一个永恒的传奇。
以羊皮书和纸莎卷为主要收藏的亚历山大图书馆命多劫难,两次毁于战火,以至于其宏富的收藏和辉煌的历史只能散见于文献,据说其最多时收藏有50万卷各类手稿,是由数百位“誊写员”(当时的图书馆员)日夜不停地抄写得来的。最使这座图书馆文明的是它的收藏理念:穷尽人类的所有知识。
从这一点来讲,Google就是现代的亚历山大图书馆。Google昭告天下的使命是:“整合全球范围的信息,使人人皆可访问并从中受益(To organize the world’s information and make it universally accessible and useful)”,这与2001年2月美国信息技术咨询委员会(PITAC)向布什总统提出的报告《数字图书馆:实现对人类知识的普遍访问(Digital Libraries: Universal Access to Human Knowledge)》如出一辙,甚至可以认为,Google就是在干未来图书馆的活。
Google与图书馆和出版商合作的Google 图书搜索计划目前已提供700万种数字化图书的在线服务5,很快会达到1000万种。这批图书最早来源于五家图书馆:密西根、斯坦福、哈佛、牛津Bodleian四个大学图书馆和纽约公共图书馆,仅这五家图书馆的藏书就高达1500万种。Google打算投资2亿美元,在2014年前完成这个数字化项目,据估计最后可能远远不止。据说人类目前保存的图书总数一共也就1亿种左右6,对于Google来说,把它们全部储存起来似乎不是什么遥不可及的事情。
随着2008年10月Google就其扫描的绝版书与美国出版商协会和美国作家协会达成赔偿1.25亿美元的和解协议,Google几乎就是拿到了合法的扫描人类所有图书的执照。即便该和解协议覆盖范围极其有限,这个模式也为将来处理同类纠纷提供了参考。当然没有多少人能够出得起Google开出的价码。Google建立了一个无比巨大的图书分销零售平台,凭借其所向披靡的搜索引擎和其它技术优势,将内容重新标注、索引、组合,并扩展到期刊、报告、会议录等传统学术出版产业中,甚至可以进一步与新闻、多媒体行业进行整合,而在整个内容产业中攻城略地,依靠其平台和商务模式,左右整个内容产业链。
现在Google的战略布局虽然初现端倪,已经很难有实质性抵抗了。由Internet Archive、微软、雅虎等组成的开放内容联盟曾经也想在这个领域分一杯羹,但在扫描了75万册图书之后,微软还是放弃了该计划。当初微软的决策似乎是出于与Google竞争的冲动,与Internet Archive的合作也使其变成纯粹烧钱商务模式。其它类似的数字化项目还有中美百万册图书计划、古登堡数字图书馆计划和美利坚记忆数字图书馆项目等,从规模上和技术上不能跟Google图书搜索计划相比,只能算是实验性或示范性项目。
当然一家通吃的局面是很难出现的,亚马逊公司凭借其Kindle阅读器一鸣惊人,通过终端的标准化,打通整个产业链,打造出一个电子书零售市场,其商务模式有模仿苹果公司itune/ipod之嫌,但依然取得了巨大的成功。该领域还有Sony等公司加入战团,实力不可小觑。
与 “数字内容”的生产、组织、发布、服务相关的公司还有一类,就是像“盛大起点网”这种原生数字内容平台公司,他们与传统出版行业的竞争看起来是最激烈的,互相渗透,抢夺地盘,但是这个战场最多只是局域性的,而且其商务模式目光短浅,很难打造起真正的行业平台。真正具有战略意义的,能够左右整个数字内容产业的应该是Google、亚马逊这类野心和实力并举、掌握了各类数字内容分销平台和渠道的公司。
图书馆在这场大战中尽可以采取坐山观虎斗的策略,谁赢谁输都没有坏处,行业整合了、科技进步了,图书馆可以更好地实现其固有的职能。要知道任何企业都是有其生命周期的,据说目前存世的最长寿的企业,是传了40代,已有1400多年历史的日本大阪寺庙建筑企业金刚组,西方最古老的企业为法国葡萄酒世家Château de Goulaine,已超过千岁了。然而正如前文所述,图书馆至少已有2600多年的历史,再强大的企业,存续再久的企业,也无法跟一项公益性的事业相比,尽管可能干了与图书馆相同的工作。
图书馆作为知识中介的功能,可能会被商业化的服务逐步取代,然而图书馆作为保障知识自由和平等获取的机构,其真正覆盖的应该是无法获得商业化服务的人群,任何时代都有这样的人群,以逐利为目的的企业总有服务的盲区。另外,图书馆尚有“保存、组织、交流、娱乐”四大职能,是任何私有企业无法完全覆盖的。
数字图书馆的前景风光无限。
四、未来的图书馆:随需而变,无所不在
图书馆事业的不可取代性,并不是图书馆可以不思进取的理由。行业的兴衰成败,背后可能的原因比企业的开停并转要复杂很多,但并不是没有前车之鉴。图书馆不管有多少职能,只要不能继续吸引读者,它的前景就堪忧。因此图书馆面临的挑战还是十分巨大的。
建设数字图书馆并非不要场地,不要空间。自古以来,图书馆都是人们交际聚会的场所,近年来更有“城市的起居室”、“市民的书房”等称谓。数字图书馆只是指它的资源是数字化的,设施是围绕数字化资源所配备的,从功能上说,它依旧是城市或社区的信息中心。
图书馆发展“信息共享空间”和“学习共享空间”,甚至“Idea Shop”,正在成为公共图书馆和高校图书馆的潮流。你如果去一个社区图书馆,可能看不到成排的书架、报栏,倒是有不少沙发、茶几,以及零星的电脑和散落各处。这种 “共享空间”的理念就是,综合图书馆的各种资源、设施和能力,以人为本,向读者提供所有可能的服务。每一个“共享空间”可能都是个性化的,就像每一所星巴克的布局都不一样,但他们提供的服务和体验是一样的。
将来你可能会见到环境优雅,音乐幽幽,提供咖啡茶点,可以免费上网的社区图书馆;或者接受专题资料预约,提供投影等会议设施,到处都能无线上网的图书馆阅览室供您在需要的时段使用;如果需要专业的参考馆员陪伴协助,也可以预约。
当前制约图书馆提供数字资源服务的还有一个重要障碍,就是版权。传统图书馆提供纸本图书、期刊和其它馆藏资源的借阅、复印,有行业规范(例如每次复印不超过一本书的三分之一之类),属于“合理使用”范围。但数字资源由于拷贝和传播的便利性,一下子就无法“合理使用”了,许多限制不能充分发挥数字资源的优势,使得许多公共图书馆在数字资源的服务和提供方面十分被动,利用率很低。
图书馆的存在本来就是对于版权制度的一种调节和弥补,是平等获取知识的一种保障。从经济价值上来考量,目前图书馆购买力大约能够占到全部出版市场的5%左右,虽然不是举足轻重,也能算相当可观。本来这一部分投入就是应用于没有能力购买出版品的广大“长尾”读者,他们是出版市场的无效用户,这些没有市场价值的用户的阅读需求由图书馆这种制度设计来满足,公共资金(或捐助资金)购买的资源或服务实际上对于出版市场来说是额外的收入。
数字出版其实也是如此,当然长尾用户的需求不一定通过图书馆来满足,但是图书馆肯定是一个拾遗补缺的、不可替代的渠道。对于如果数字资源不能通过公共图书馆进行提供,其就会丧失保障信息获取自由的职能,走向“博物馆化”就是个时间问题了。对于研究型图书馆和大学图书馆来说,一般对于开放存取具有本能的冲动,因为本身其所属机构就是学术出版的最大生产者,自己生产的知识,再通过商人的渠道,附加很多利润,再卖给自己,本身的商务模式就有许多荒谬之处,这些机构的联合所形成的购买力也是一个谈判筹码。相信进过不屑的努力,图书馆在数字资源的合理使用方面能够探索一些新的模式。
大学图书馆和研究型图书馆在向数字图书馆的过渡方面更有积极性,欧美国家已经认识到图书馆在数字时代亦然是教育和科研的基础设施,因此花巨资研究数字仓储、数字资源的保存、组织和利用问题。数字图书馆通常有两张面孔,除了现实中的古典庄重巍峨的大厦之外,通常在虚拟世界里也具有“课件中心”、“数据中心”、 “学术信息中心”及“交流中心”等职能。无纸图书馆(E-Only)将在这两类图书馆中率先实现。不仅如此,这类数字图书馆将利用各种技术,将资源入口和服务“嵌入”到用户(通常是教授、研究人员和学生)的信息环境中(例如做成桌面工具、浏览器插件、工具条等),从而更加虚拟化而真正“无所不在”。
十年内可以弯折的电子纸应该能够得到商用,电子墨水技术在灰度级别和色彩深度方面已经能够超出普通人的需求,翻转速度能够应用于基本的视频播放。“电子书包”(即存储有所有教科书和教辅书的可写电脑)的普及可能会更快一些,电子书会也像MP3一样大行其道,这些载体在感官舒适度方面甚至会超过目前的普通纸张。所有这些变化将给新闻和出版行业全盘数字化提供巨大的市场动力,人们获取新闻和学习知识的习惯也会发生重大变化。
图书馆作为一种实体空间的作用和作为一种虚拟知识传播机构的功能将会彻底分开,实体机构的图书馆依旧作为公民知识生活的中心,而虚拟的知识传播通过各类渠道和设备(例如利用无所不在的“云计算”环境)而变得“泛在”,图书馆通过网络提供大量的信息服务,但是你可能丝毫都感觉不到它的存在。
由于数字化造成的媒体融合,许多大型的图书馆或图书馆联盟同时会扮演出版商和资源服务商的角色,向产业上下游同时挺进,特别是那些有独特资源或者能够提供深度信息咨询服务的图书馆(如议会图书馆和研究型图书馆等),一方面成为知识的出版者和发布者,另一方面依靠新型电子报纸、电子书或手持设备,提供更为专指的内容分发业务,因而也可能兼具一定的媒体角色,但是这类图书馆可能为数很少。
图书馆行业现在正处于历史上独一无二的阶段,原先的产业链已经松动、断裂,新的链条尚未建立、成型。图书馆在社会中所承担的职能虽然没有本质的变化,但角色已经发生了重大变化,图书馆不再仅仅是伫立于街角等待别人上门的一栋大楼或者几个房间,而是人们电脑桌面的一个icon,手机上的几个应用,kindle上的一个帐号,等等。图书馆的服务流程与人们的学习生活密切相关,同时图书馆事业作为一个整体,依旧支撑着人类所有的知识记忆。
结语
英国哲学家波普尔曾经做过一个著名的“思想实验”:如果地球遭到毁灭,我们可以依靠图书馆中保存的人类记忆,花费一两代人的时间,重建整个人类的文明。而如果图书馆也遭到毁灭了,人类将重新进入一个漫长的文明重建时期。我由此推理,由于数字图书馆的存在,我们重建人类文明的时间将大大缩短,甚至就像恢复备份一样容易。
Tags: 图书馆未来, 数字图书馆, 未来的图书馆三大国际性数字图书馆会议中最知名的ACM/IEEE Joint Conference on Digital Libraries 2009年年会于6月15-19日在美国德克萨斯州Austin召开。今年已经是第九届年会了,从Dlib Magazine的报道来看,今年的参加人数(来自23各国家的270人)和会议规模比数字图书馆鼎盛时期都衰落了不少,以至于写这篇报道的 Michael L. Nelson 几乎是草草了事,只客观报道了此次会议的投稿和录用情况、主旨报告、议程安排和获奖论文情况,对于此次会议的具体内容没有详细涉及。
本次会议的两个主旨报告都是数字图书馆界的名人,但都不算技术派人物。这也说明前几年数图研究的方向性转变。因为数字图书馆“技术”都已经深入到具体的计算机技术门类中去了,很少有宏观的“数图技术”。这两个主旨报告分别是Christine Borgman (UCLA)所做的《数字图书馆:现状与方向》( “Digital Libraries: Now Here or Nowhere?“)和Gerhard Fischer (University of Colorado)所做的《参与的文化:数字图书馆未来的机遇与挑战》(Cultures of Participation: Opportunities and Challenges for the Future of Digital Libraries“)。
会议按照JCDL的惯常模式,分三个培训、一个博士论坛(14个报告)和三天的常规会议。常规会议包含了29篇Full Paper(交流30分钟)和13篇Short Paper(交流15分钟),另外还有项目汇报(12项)。
有意思的是JCDL2010将与三大会议的另一个ICADL(亚洲数字图书馆会议)合并举办,移师澳大利亚黄金海岸。会议将于2010年6月21-25日举行,国内数字图书馆的研究人员别忘了早作准备,该年会的会议录一直是SCI收录的啊!
Nelson, M. (2009). Report on the 2009 ACM/IEEE Joint Conference on Digital Libraries D-Lib Magazine, 15 (7/8) DOI: 10.1045/july2009-nelson
Tags: JCDL, 会议, 数字图书馆, 研客