上个月参加了“数字图书馆前沿问题高级研讨班”,去之前感觉今年不可能有太多新意,回来之后感到还有许多可以总结的东西。拖至今日,再不总结恐怕要淡忘了,特简记如下:
- 传统集成系统逐渐演化成按使用职能划分的后台管理和发现服务两大块
- 本地安装的系统向远程代管过渡
- 费用支付方式从购买转向租用
- 软件开发采用商业和开源软件混合组配
$cache_schedule_interval = '0'; //Added by WP-Cache Manager $cache_gc_email_me = 0; //Added by WP-Cache Manager $wp_cache_make_known_anon = 0; //Added by WP-Cache Manager $wp_cache_front_page_checks = 1; //Added by WP-Cache Manager $cache_time_interval = '3600'; //Added by WP-Cache Manager $cache_scheduled_time = '00:00'; //Added by WP-Cache Manager $cache_schedule_type = 'time'; //Added by WP-Cache Manager $wp_cache_home_path = '/'; //Added by WP-Cache Manager $cache_page_secret = '7b7eb013a46dc661c0490c5f249538a4'; //Added by WP-Cache Manager $cache_schedule_interval = '0'; //Added by WP-Cache Manager $cache_gc_email_me = 0; //Added by WP-Cache Manager $wp_cache_make_known_anon = 0; //Added by WP-Cache Manager $wp_cache_front_page_checks = 1; //Added by WP-Cache Manager $cache_time_interval = '3600'; //Added by WP-Cache Manager $cache_scheduled_time = '00:00'; //Added by WP-Cache Manager $cache_schedule_type = 'time'; //Added by WP-Cache Manager $wp_cache_home_path = '/'; //Added by WP-Cache Manager $cache_page_secret = '7b7eb013a46dc661c0490c5f249538a4'; //Added by WP-Cache Manager
上个月参加了“数字图书馆前沿问题高级研讨班”,去之前感觉今年不可能有太多新意,回来之后感到还有许多可以总结的东西。拖至今日,再不总结恐怕要淡忘了,特简记如下:
前三年公共图书馆发展的一些数据汇总:
| 2007年卷(06年数据) | 2008年卷(07年数据) | 2009年卷(08年数据) | |
| 全国县级以上公共图书馆数量(个) | 2777 | 2798 | 2819 |
| 其中县级图书馆(个) | 2391 | 2414 | 2444 |
| 其中独立建制少儿图书馆(个) | 86 | 84 | 88 |
| 从业人员(图书馆员人数) | 50011 | 50190 | 50637 |
| 建筑面积(万平方米) | 702.5 | 724.4 | |
| 平均每馆面积(平方米) | 1616 | ||
| 阅览坐席(万个) | 50 | 52,4 | |
| 电子阅览室终端(个) | 37036 | 44623 | |
| 藏书总量(万册/件) | 47454 | 49422 | 52367 |
| 其中图书(万册) | 43318 | 43694 | 46053 |
| 流通数量(万人次) | 24826 | 25777 | 27813 |
| 流通增长 | 3.83% | 7.90% | |
| 书刊外借(万册次) | 19236 | 19897/21080 | 22964 |
| 读者活动(次) | 82288 | 84049 | 87695 |
| 参加人次(万) | 2726 | 2650 | 3284 |
| 发放借书证(万) | 1149 | 1263 | 1439 |
| 公共图书馆总收入(万元) | 403689 | 487793 | |
| 年财政拨款(万元) | 290268 | 355185 | 440578 |
| 拨款增长(比上年,万元) | 36070 | 64917 | 85393 |
| 拨款增长(比上年,增幅) | 14.2% | 22.36% | 24.04% |
| 总支出(万元) | 313936 | 394440 | 474659 |
| 支出增长率(比上年) | 10.6% | 25.6% | 20.3% |
| 新增藏量购置费(万元) | 59750 | 73716/73698 | 78962 |
| 其中购书经费(万元) | 53092 | 64492 | 69040 |
| 图书购置费增长率(比上年) | 11.1% | 21.47% | 7.1% |
根据官方数据对基本情况进行的一个汇总,留作素材。
1、 网民数量巨大,增速继续惊人,尤其是手机网民。但增速已有放缓迹象(普通网民的增长百分比已呈个位数)。据今年7月15日CNNIC(中国互联网信息中 心)发布的第26次统计数据,我国已有网民4.2亿,比半年前增加3900万,手机网民2.77亿,比半年前增加4334万人。奇怪的是,大约有4914 万网民只用手机上网。
2、 网站总数和域名总数下降明显。其中域名总数下降1121万,.CN在域名总数中的占比从80%降至64.7%。与此同时,.COM域名增加53.5万,比 重从16.6%提升至29.6%。据说全球网站数也在下滑,根据Netcraft的统计,2010年上半年全球互联网站点数减少2700万个,降幅达到 11.5%。
3、IP地址资源紧张,危机已现。中国网民数与地址数不成比例是一个特色问题,中国IPv4地址只有2.5亿,远少于网民数量。全球IPv4地址资源最快将在2011年8月耗尽,向IPv6地址过渡是大势所趋。但我们似乎还没有做好充分准备。
4、宽带不宽。接入商把注意力都放在利用各种手段扩大用户基数方面,基础设施的更新维护和管理跟不上,造成中国的平均上网速度只有857kbps(根据Akamai公司去年底的报告测算),接入速度远远落后于美国、日本、韩国等互联网发达国家。
5、网络购物发展迅速。全国网络购物用户达到1.4亿,网上支付、网络购物和网上银行半年用户增长率均在30%左右,远远超过其他类网络应用。
6、 网络安全问题巨大,同时网络信息的可信度亦然是个问题。特别是网络电子商务应用受此影响严重。CNNIC的调查发现,仅上半年,就有59.2%的网民在使 用互联网过程中遇到过病毒或木马攻 击;30.9%的网民账号或密码被盗过;电子商务网站访问者中89.2%的人担心假冒网站,其中86.9%的人表示如果无法获得该网站进一步的确认信息, 将会选择退出交易。
上周在市政协听了一个演讲,一个美国人讲保障性住房政策,很多朋友说:“美国有经验?教训还差不多!”
但听了他的演讲你会发现,这个Nicolas先生确非等闲之辈。
作为哈佛大学联合房产研究中心主任,作为一位曾在政、商、学三界爬滚多年,目前还担任美国多家不动产杂志专栏作家,尼古拉斯先生的观点很直接,很简单,很实在。
他首先回顾了历史,说美中两国从完全不同的两个方向,走向了同一个理想:即“每一个家庭,都应该有体面的居住”。
美国是从来不顾劳动人民的住房的。土地私有,住房是商品,从一开始就放任市场运作。1890年前后,政府开始关心百姓的住房,是基于卫生的理由,而非人权。到三十年代大萧条之后,国家建造住房,主要也是为了解决就业问题。目前美国大约有5%的国有住房,租住给排队等候的水深火热中的人民。美国政府早已放弃了建设“保障性住房”的责任,因为人民不答应,无论哪个社区也不愿意与“贫民窟”为伍。(而且美国历史上曾发生“城市空心化”过程。)所以美国一般是通过发放补助形式恩泽众生。政府的保障行为,不能破坏市场的公平性。(强行规定房价就是影响市场的做法,还滋生不公甚至腐败)
而中国老大哥一开始并不承认房地产的商品属性,一切公有,国家分配,直到难以为继。并且一直到现在还在痛苦中摸索,摸着石头过河,似乎越弄越不不公平。
尼先生在演讲中提到保障性住房建设的一些经验教训:
1、需求有不同,保障也应该有层次。
2、人们应该有选择,租房并不可耻。
3、保障性住房不仅仅是保障居住,还必须有医院、学校等配套环境。
4、集中保障不一定可取,可政策性保障,要求建筑商必须附带条件(例如批地附加一定比例的保障房,在税收等方面予以减免优惠)。
5、住房必须与就业综合考虑,保障房不是流放地。
另一方面提到几个原则:
1、住房是私有财产,交给市场做才最公平。政府做的唯一目的是保障,不是营利(保值增值)。
2、“居者有其屋”也是有尊严的居住,甚至可以更有尊严,应该鼓励。
3、住房作为投资走得太远,就要吃苦头。(美国的教训是:忘了住房是消费品而只当作投资品,以为它永远值钱)
4、城市的经济增长依靠房地产是不健康的。
5、规则程序必须公开,操作应该透明,衍生品炒作就会适可而止。
“美国那么正确,为什么会发生房利美房地美倒闭涅?为什么会引发出整个金融危机涅?”演讲之后的提问阶段,有人明嘲暗讽地问了这个问题。
尼先生说,关键在于美国人没有很好地理解什么叫“居者有其屋(体面的居住)”,认为体面的居住就是“拥有巨大的房产”。而美国政府没有及时预警,却放任自流,甚至予以鼓励,放松了监管。
他最后直面听众的提问,对政府能做什么,不应做什么,能走多远?如何利用市场机制解决问题?何时可能出问题?如何预警?如何解决问题?等等,谈了自己的看法。老美很会说话,一方面很技巧地恭维贵政府,能够及时预警问题,就能够拿得出对策,同时也明确地说出自己的观点:政府不能迁就既得利益者,误导心理预期,默认甚至支持房价飙涨,作啦啦队长…
但是,老大哥听得进去吗?
Tags: Nicolas Retsinas, 保障性住房, 笔记, 美国, 讲座本章开始是我真正感兴趣的所在了:本 体建模和本体编码。渐入佳境。
(一)
(二)
除了rdfs:subClassOf之外,RDFS还扩展了许多元素,rdfs:subPropertyOf是其中最重要的一个。
类有子类,也有 属性。属性有子属性。
[5]
ex:著 rdfs:subPropretyOf ex:创作
由:
[6] ex:曹雪芹 ex:著 ex:红楼梦
可以得到:
[7] ex:曹雪芹 ex:创作 ex:红楼梦
建模举例:
某图书馆的工作 人员中有职业的图书馆员,外聘的信息技术人员、外包公司的技术人员以及自由职业者,如果要建立他们与图书馆之间的各类用工关系,该如何做?
首先析 出需要描述的关系:合同关系contractsTo,自由职业freeLancesTo,外包公司indirectlyContractsTo,直接聘用 isEmplyedBy,以及笼统的用工关系worksFor。
所有职员与公司之间的这些关系,其实都是“属性”关系,应该用 rdfs.subPrepertyOf建立起联系。
上述五种属性之间的关系,用工关系包括合同用工和直接聘用,合同用工又包括自由职业者合同和外 包公司合同(用词在这里不一定符合中国法律,但语义就是这个意思)。可以作如下表达:
[8]
ex:isEmplyedBy rdfs:subPropertyOf ex:worksFor
ex:contractsTo rdfs:subPropertyOf ex:worksFor
ex:freeLancesTo rdfs:subPropertyOf ex:contractsTo
ex:indirectlyContractsTo rdfs:subPropertyOf ex:contractsTo
这样,如果:
Keven isEmplyedBy TheLibrary
机器可以得到以下推理:
Keven worksFor TheLibrary
如果:
Marcia freeLancesTo TheLibrary
Raizen indirectlyContractsTo TheLibrary
机 器就可以自动做出下面的推理:
Marcia contractsTo TheLibrary
Raizen contractsTo TheLibrary
属性之间的这种关系定义,在面向对象的编程中是没有对应规定的,这一点需要注意。
(三)
RDFS另外有两个重要扩展:rdfs:domain 和rdfs:range,它们也跟“属性(Property)”元素有关:rdfs:domain关乎属性的主语的取值,rdfs:range关乎属性的 宾语(对象)的取值,都是一种约束(限定),或者说提供了对三元组当属性词(谓语)确定之后,用来描述主语和宾语的限定的扩展元素。
举例说明如下:
[9]
如果属性P的值域(domain)为D,x的P属性是y,那么x的类 型一定是D。可以写为:
IF
P rdfs:domain D
and
x P y
THEN
x rdf:type D
[10]
如果属性P的范围(range)为R,x的P属性是y,那么y的类型一定是R。可以写为:
IF
P rdfs:range R
and
x P y
THEN
y rdf:type R
有 了这两个元素,就能够对于取值范围进行约束,从而可以采用规范词表之类的方法进行取值的规范控制。但是RDFS不能描述某一个实例不属于某个类(这在 OWL中得到了扩展),当定义了P的domain和range之后,如果有“x’ P y’”,不论x’或y’取何值,系统都必然地把它们归入预定的domain和range,加入预设的domain和range(例如规范词表或分类法)中 没有x’或y’的实例,就会发生矛盾,需要另外解决。
进一步,结合rdfs:subClassOf,可以有一些更有意思的推理:
如 果某个属性P有值域D,而值域D是D’的子类,则D’也是P的值域。表示如下:
[11]
IF
P rdfs:domain D
and
D rdfs:subClassOf D’
THEN
P rdfs:domain D’
具体举例:网页(D)是网络资源(D’)的子 类,具有URL的HTML页面(P)是网页(属于值域D),那么也一定是网络资源(属于值域D’)。
这里与面向对象的分析和设计似乎相反,类的属 性不是被子类继承,反而被超类获得。这是Web的特性决定的:属性自身就是资源,不专属于特定的类。
属性交集的例子:
[12]
如 果:
属性P ⊆ R ⋂ S
x P y (x的P属性值为y)
则:
x R y (x的R属性值为y);
x S y (x的S属性值为y)。
(四)
例子:
甲图书馆用 Lib1:borrows表示外借图书,乙图书馆用Lib2:checkedOut来表示,一个Web应用要将他们的外借数据合并,可以采用以下方法等同 这两个属性:
Lib1:borrows rdfs:subPropertyOf Lib2:checkedOut
Lib2:checkedOut rdfs:subPropertyOf Lib1:borrows
然后,让这两个属性共同作为一个属性的子属性:
Lib1:borrows rdfs:subPropertyOf ex:hasPossession
Lib2:checkedOut rdfs:subPropertyOf ex:hasPossession
这样,使用ex:hasPossession就可以获取所有两个图书馆 外借图书的数据了。
这种方法可以用来整合多个不同的元数据方案。例如,用DC元数据元素作为“核心集”时,MARC等不同元数据方案中的 诸如ex:author,ex:editor之类的元素,都可以 subPreportyOf dc:creator,就可以支持DC标准作为统一查询的元数据标准了。
不用作推理的RDFS元素还有如下一 些:rdfs:label(给定一个显示 名),rdfs:seeAlso(交叉参考),rdfs:isDefinedBy(定义主体),rdfs:comment(注释)等等。
总结一下:
RDFS是用来描述RDF的模式语言,主要提供了定义类(class)、类与类之间的关系(subClass)、属性 (property)、属性之间关系(subProperty)的方法,并规定了简单的、基于集合理论的类继承规则,以及属性继承规则。可以看出RDFS 对RDF的上述扩展,也是完全基于RDF的(全都是三元组),这也保证了RDFS可以像RDF一样,具有同样的开放性,任何人都可以用来定义任何RDF模 式。
虽然RDFS引入了值域和范围,用来限定资源类的属性取值,增加了RDFS的复杂性,但RDFS仍然是非常简单的,没有多少内容。也因 为此,它的适用面和能力是非常强大的。当然如果要表达更为丰富的语义和推理关系,还需要从规则表达(如OWL和SKOS)和词表(如SKOS、FOAF、 DC等等)两方面进行扩展。任何元数据方案以及本体模式,都是组成语义网标准规范体系中的成员,都是对语义网的贡献。
Tags: OWL, RDFS, 实用语义网, 笔记, 语义Web, 语义技术下面是看书时随手记下的内容,为了加强印象,特别是看原版书,不记一些东西很快就扔到爪哇国去了。笔记不一定正确,贴在这里供大家批判。
第 一章 什么是语义万维网
第二章 语义建模
第三章 RDF-语义Web的基础
第四章 语义Web应用架构
刚去“图书馆技术前沿”(http://kevenlw.jimdo.com/)添加了“博客RSS”和“动态RSS”两个链接:
欢迎订阅。
并添加了一个帖子:
从早期我们实验性地开发了一些支持通用元数据模式(schema)实例著录和格式转换平台,到后来希望支持元数据元素的登记注册系统、元数据服务(模式转 换、rdf示例、rdf编码),再到后来希望支持各类本体的构建、转换和术语服务(DCAP和RDA可以做为上述应用的特例),一直需要试验一些软件平台 支持上述想法。目前商用解决方案大多缺乏通用性,一般是专门为某些机构或需求而开发,难于推广,所以很需要在开源系统的基础上建立类似的平台和应用。
很高兴看到Drupal以及Mediawiki对于语义应用的支持已经形成了一定的社区,不停地开发一些插件,本身这些开源在架构方面还是很灵活的,似乎可以被用来当作类似应用的平台。希望国内也能有这样一些IG(兴趣小组)进行一些实验。我们希望今后在这方面多做些工作。
这里有一个访谈,介绍了Drupal在语义功能方面的一些开发。
Ning被墙了之后,一直想再建一个墙内的技术交流平台,还没想好用什么来建(欢迎建议),看到Jimdo建站服务挺方便,但是它的2.0功能(社区交流功能)看起来很弱,于是想把发布和交流分开,现在这里(kevenlw.jimdo.com)建一个图书馆前沿信息技术应用的网站(以信息发布为主),目前打算先汇总如下一些内容,我们将不定期地进行更新。希望有感兴趣的同仁加入我们的团队。
我们会继续利用这个“数字图书馆讨论组”进行交流,另有一个“图书馆2.0讨论组“,都欢迎大家加入。这两个都是利用Google的邮件列表群组功能建立的,需要申请一个gmail邮箱,具体使用方法参见这里。
顺便一说,Jimdo建站的确做到了方便,我大概总共用了5-6个小时,其中大部分时间还是在内容添加上。Jimdo的模板和功能比Google Site更加丰富与人性化。我就不拿它与Ning或Facebook等比较了,因为定位不同,不公平。一个好的Web2.0应用应该使用户专注于他自己的内容和业务,需要时可以提供“高级”的技术升级能力。相信今后这类“好的应用”会越来越多。
Tags: 技术前沿, 笔记这次来厦门,我已经开始向馆长们宣传这个“天堂是图书馆模样”的图书馆照片网站了,但是连个说明都没有,说也说不清楚。
在这里先写一个简单的,以后再弄一个图文并茂进行宣传推广。
1、打开网址:http://www.libphoto.cn/。
2、点击右上角“注册”(如已注册,点击“登录”)。
3、准确填写所需信息,注意电子邮件地址必须填写正确,否则无法进行密码找回。
4、注册成功后即可登录。登录成功后点击页面左上角“天堂是图书馆的模样”或这个地址:http://www.libphoto.cn/main.php,即可进入主页。
5、左下角(下拉到头)可看到操作菜单,点击“添加相册”。
6、填写目录名(比如xiamenlib)、相册名(比如“厦门市图书馆”)、相册摘要、关键词、描述等(也可不填,以后任何时候都可以填)。然后点击“新建”。一个新的相册(目录)就建立起来了(此时出现的所有设置均可以置之不理)。
7、再点击左侧菜单中“添加项目”,即可选择文件,确定照片标题(如果不写缺省为文件名)……重复这个操作(一次上载超过两张照片,可以点击“More Uplaod Boxes”以出现更多上载窗口),即可选择更多的图片。
8、点击下面的”添加项目“即可把刚才选中的硬盘上的照片添加进来。
欢迎大家注册、测试、多多上载。我们会定期进行整理,有问题可以给我留言,或者email。
Tags: 照片, 笔记