Archive for the ‘笔记’ Category

2011数图研讨班参会收获与感想

星期日, 七月 10th, 2011

上个月参加了“数字图书馆前沿问题高级研讨班”,去之前感觉今年不可能有太多新意,回来之后感到还有许多可以总结的东西。拖至今日,再不总结恐怕要淡忘了,特简记如下:

1、移动图书馆研究和实践渐成大潮。会上既有现状总结和成熟应用介绍,又有基于调查研究和前瞻性的技术指导,还有业务模式讨论。大家都认识到,为体现无所不在的服务、更好地担负起图书馆消除信息鸿沟的责任,我们必须提供数字资源的移动服务。会议涉及很多移动服务特有的、颇具创新的内容,例如:基于地点的服务(LBS)、社会性应用和基于用户体验的设计(我称之为“移动服务特征三要素”),移动阅读、新的服务流程设计、二维码应用等等,在大量的报告中都能找到相关内容。
2、图书馆自动化系统的发展趋势。张甲老师就这个主题带来了很好的报告。这么多年过去,张老师越来越具有敏锐性和洞察力,让人十分佩服。他总结了四个方向(如下),并对第一项中的后台管理和服务发现又做了详细的阐述。
  • 传统集成系统逐渐演化成按使用职能划分的后台管理和发现服务两大块
  • 本地安装的系统向远程代管过渡
  • 费用支付方式从购买转向租用
  • 软件开发采用商业和开源软件混合组配
3、图书馆的生存危机继续存在,且没有丝毫减缓的迹象。从OCLC新的调查(中文版已由《数字图书馆论坛》发布),到美国研究图书馆的调查,都说明这一点。图书馆根据类型的不同而在风格上不断分化将成为一种趋势,与此同时图书馆之间加强全方位更紧密的合作是外包、众包、内包的必然选择(例如2CUL模式)。图书馆界目前其实还不够积极,动作还太慢。这可能也是图书馆的职业特征吧。特别地,图书馆长的感觉与读者用户对图书馆的感觉存在反差,似乎馆长们还不愿承认我们已坐上了坦泰尼克号,必须对他们猛击一掌了。
4、图书馆知识组织的深化。图书馆服务在数字时代面临的一个巨大的挑战是如何深入到更细小的知识单元(如数据),进行组织、整理、“策管”(Curator,秦健教授的翻译)和服务,而不局限于电子书、期刊文章技术报告等。这一直是图书馆近年来研究的热点和核心内容,被认为是图书馆学和图书馆行业的核心竞争力。新的技术架构(包括关联数据、知识组织、云平台和移动技术等)让虚拟图书馆逐渐走向后台,隐形于各类网络服务之中,不一定要直接面向读者,而是作为一种基础服务(包括数据服务),成为赛百空间的基础设施之一。这种新的存在形式,真正能够体现数字图书馆的价值,特别是能够对科研、教育和医药卫生等方面提供持续的支持。
5、读者用户的体验(UX)开始引起高度重视。从广义上来讲图书馆的用户体验可以包括真实空间和虚拟空间两部分。物理空间的体验延续IC、LC、KC的发展路径,图书馆要给读者更多的空间。虚拟空间方面,读者驱动的购买(PDA)、网站界面及服务流程设计等方面,都要体现用户体验(对专业图书馆影响较大,例如JISC的VRE)。
会上很多业界明星(交大、清华、北大、中科图、国图以及东道主)都做了很有特色的报告,特别是交大,已形成了一套上升到理论的完整模式和做法,虽然不太可能一帆风顺,但值得借鉴的地方多多,值得关注。

技术酒徒:老外现在关心什么?

星期一, 三月 14th, 2011

LITA,Information Technology and Libraries,美国图书馆协会ALA的信息技术刊物(季刊),一本相当于我国《现代图书情报技术》的杂志,在网上开放获取(近两期除外)。这里罗列近两年来的文章目录,希望统计出其主题热点。

Volume 30, Number 1 March 2011 ISSN 0730-9295
2011年第一期:http://www.lita.org/ala/mgrps/divs/lita/ital/302011/3001mar/index.cfm
目录
A Simple Scheme for Book Classification Using Wikipedia (7-15)[HTML] [PDF]
将维基百科用于图书分类的简单分类法
主题:知识组织,维基百科
The Internet Public Library (IPL): An Exploratory Case Study on User Perceptions (16-23) [HTML] [PDF]
因特网公共图书馆:关于用户认知的实验性案例研究
主题:数字图书馆,网络图书馆,案例研究,用户研究
Semantic Web for Reliable Citation Analysis in Scholarly Publishing (24-33) [HTML] [PDF]
语义网对于学术出版引用分析可信度的意义和作用
主题:语义网,学术出版,引文分析,可信网络
Web Accessibility, Libraries, and the Law (34-43) [HTML] [PDF]
有关图书馆网络可获得性(为残障人士服务)的法律问题
主题:万维网可获得性,法律问题,知识产权,合理使用,特殊服务
Usability of the VuFind Next-Generation Online Catalog (44-52) [HTML] [PDF]
下一代联机目录:VuFind的可用性
主题:可用性,联机目录,OPAC,VuFind
Volume 29, Number 4 December 2010 ISSN 0730-9295
2010年第四期:http://www.lita.org/ala/mgrps/divs/lita/ital/292010/2904dec/index.cfm
目录
Generating Collaborative Systems for Digital Libraries: a Model-Driven Approach (171-186) [HTML] [PDF]
数字图书馆协同系统的构建:模型驱动方法
主题:数字图书馆,协同,用户参与,模型驱动
The Middle Mile: The Role of the Public Library in Ensuring Access to Broadband (187-194) [HTML] [PDF]
中介与桥梁:公共图书馆保证公民接入宽带网络的作用和角色
主题:接入服务,宽带,公共图书馆,职能
An Evolutive Process to Convert Glossaries into Ontologies (195-204) [HTML] [PDF]
词表转化为本体的过程研究
主题:本体,知识组织,词表,转换
Bridging the Gap: Self-Directed Staff Technology Training (205-213) [HTML] [PDF]
跨越鸿沟:员工自我指导的技术培训
主题:技术培训,信息鸿沟
Volume 29, Number 3 September 2010 ISSN 0730-9295
2010年第三期:http://www.lita.org/ala/mgrps/divs/lita/ital/292010/2903sep/index.cfm
目录
Metadata Creation Practices in Digital Repositories and Collections: Schemata, Selection Criteria, and Interoperability (104-116) [HTML] [PDF]
数字仓储和馆藏建设中的元数据创建实践:模式、选择标准和互操作
主题:元数据,数字仓储,元数据模式,互操作,数字资源建设
Batch Loading Collections into DSpace: Using Perl Scripts for Automation and Quality Control (117-127) [HTML] [PDF]
DSpace数字仓储的批量上载:应用Perl代码进行自动上载和质量控制
主题:数字仓储,自动处理,质量控制
Authentication and Access: Accommodating Public Users in an Academic World (128-140) [HTML] [PDF]
认证与存取:帮助普通用户利用学术资源
主题:数字认证,系统设计
The Next Generation Library Catalog: A Comparative Study of the OPACs of Koha, Evergreen, and Voyager (141-150) [HTML] [PDF]
下一代图书馆目录:Koha、Evergreen和Voyager系统的OPAC比较研究
主题:OPAC,比较,ILS
Are Your Digital Documents Web Friendly?: Making Scanned Documents Web Accessible (151-160) [HTML] [PDF]
你的数字文件是否适用于网络?:如何使你的扫描文档上网
主题:数字文档,文档发布,数字化
Volume 29, Number 2 June 2010 ISSN 0730-9295
2010年第二期:http://www.lita.org/ala/mgrps/divs/lita/ital/292010/2902jun/toc.cfm
目录
Usability Studies of Faceted Browsing: A Literature Review (58-66) [ HTML] [ PDF]
分面浏览的可用性分析:文献调研
主题:分面浏览,可用性分析
Reducing Psychological Resistance to Digital Repositories (67-75) [ HTML] [ PDF]
减少对于数字仓储的心理障碍
主题:数字仓储,利用
Web Services and Widgets for Library Information Systems (76-86) [ HTML] [ PDF]
图书馆信息系统的Web服务和插件
主题:图书馆信息系统,Web服务,插件
On the Clouds: A New Way of Computing (87-92) [ HTML] [ PDF]
云上风光:一种新的计算模式
主题:云计算
Volume 29, Number 1 March 2010 ISSN 0730-9295
2010年第一期:http://www.lita.org/ala/mgrps/divs/lita/ital/292010/2901mar/toc.cfm
目录
Monitoring Network and Service Availability with Open-Source Software (8-22) [HTML] [PDF]
利用开源软件监控网络服务
主题:开源软件,网络服务,质量控制
Tending a Wild Garden: Library Web Design for Persons with Disabilities (23-29) [HTML] [PDF]
垦荒:为残障人士设计图书馆网站
主题:网站设计
The Path toward Global Interoperability in Cataloging (30-33, 39) [HTML] [PDF]
通向全球目录互操作之路
主题:书目,互操作
Tagging: An Organization Scheme for the Internet (34-39) [HTML] [PDF]
标签:因特网资源的组织方式
主题:知识组织,标签
Dublin Core, DSpace, and a Brief Analysis of Three University Repositories (40-46) [HTML] [PDF]
都柏林核心,DSpace以及三所大学机构库的简要分析
主题:机构库,DC元数据,DSpace
Geographic Information Systems: Tools for Displaying In-Library Use Data (47-52) [HTML] [PDF]
地理信息系统:展示图书馆数据利用的工具
主题:GIS,展示工具,可视化
Volume 28, Number 4 December 2009 ISSN 0730-9295
2009年第四期:http://www.lita.org/ala/mgrps/divs/lita/ital/282009/2804dec/toc.cfm
“Discovery” Focus as Impetus for Organizational Learning (164-171) [HTML] [PDF]
“资源发现”:组织学习的推动力
主题:资源发现
Information Discovery Insights Gained from MultiPAC, a Prototype Library Discovery System (172-180) [HTML] [PDF]
利用多书目系统进行信息发现:一个图书馆资源发现的原型系统
主题:书目,资源发现
Usability as a Method for Assessing Discovery (181-186) [HTML] [PDF]
可用性作为资源发现评价的方法
主题:可用性,资源发现,评价
UNLV Special Collections in the Twenty-First Century (184-186, 190) [HTML] [PDF]
UNLV大学图书馆的21世纪特藏
主题:趋势,特藏
Smartphones:  A Potential Discovery Tool (187-188) [HTML] [PDF]
智能手机:一种极有潜力的资源发现工具
主题:手机应用,资源发现
Building Pathfinders with Free Screen Capture Tools (189-190) [HTML] [PDF]
利用免费抓屏工具建立导航工具
主题:软件应用,资源导航
Enhancing OPAC Records for Discovery (191-193) [HTML] [PDF]
强化OPAC目录以利资源发现
主题:OPAC,资源发现
Volume 28, Number 3 September 2009 ISSN 0730-9295
2009年第三期:http://www.lita.org/ala/mgrps/divs/lita/ital/282009/2803sep/toc.cfm
目录
Employing Virtualization in Library Computing: Use Cases and Lessons Learned (110-115) [HTML] [PDF]
图书馆的可视化应用:案例和教训
主题:可视化
Success Factors and Strategic Planning: Rebuilding an Academic Library Digitization Program (116-136) [HTML] [PDF]
成功因素和策略制订:重新制订学术图书馆数字化计划
主题:学术图书馆,数字化
Gender, Technology, and Libraries (137-142) [HTML] [PDF]
性别、技术与图书馆
主题:技术应用,图书馆社会学
The Efficient Storage of Text Documents in Digital Libraries (143-153) [HTML] [PDF]
数字图书馆中文本文件的高校存储
主题:数字图书馆,存储,文本文件
Delivering Information to Students 24/7 with Camtasia (154-156) [HTML] [PDF]
利用Camtasia向学生读者不间断地传递信息
主题:数字资源服务,软件应用
Volume 28, Number 2 June 2009 ISSN 0730-9295
2009年第二期:http://www.lita.org/ala/mgrps/divs/lita/ital/282009/2802jun/toc.cfm
Can Bibliographic Data be Put Directly onto the Semantic Web? (55-80) [HTML] [PDF]
书目数据能否直接发布为语义网络?
主题:语义网,书目数据
Public Access Technologies in Public Libraries: Effects and Implications (81-91) [HTML] [PDF]
公共图书馆的公共技术:影响与后果
主题:信息技术,公共图书馆,评估
Missing Items: Automating the Replacement Workflow Process (93-99) [HTML] [PDF]
消失的款目:替换流程的自动替换
主题:业务处理
Adding Delicious Data to Your Library Website (100-103) [HTML] [PDF]
为图书馆网站增加美味书签
主题:图书馆2.0,美味书签
Volume 28, Number 1 March 2009 ISSN 0730-9295
2009年第一期:http://www.lita.org/ala/mgrps/divs/lita/ital/282009/2801mar/toc.cfm
One Law with Two Outcomes: Comparing the Implementation of CIPA in Public Libraries and Schools (6-14) [HTML] [PDF]
一部法律两种结果:公共图书馆和学校图书馆应用CIPA的比较(儿童上网保护法案)
主题:网络服务,儿童上网,法律问题,CIPA
Classification of Library Resources by Subject on the Library Website: Is There an Number of Subject Labels? (16-20) [HTML] [PDF]
图书馆网站应用主题进行资源分类:主题标签是否有理想的数字?
主题:用户研究,知识组织
A Semantic Model of Selective Dissemination of Information for Digital Libraries (21-30) [PDF]
数字图书馆的选择性信息传播的语义模型
主题:语义模型,信息传播,数字图书馆
LaneConnex: An Integrated Biomedical Digital Library Interface (31-40) [HTML] [PDF]
Laneconnex:生物医药数字图书馆的整合界面
主题:资源整合,数字图书馆
CatQC and Shelf-Ready Material: Speeding Collections to Users While Preserving Data Quality (41-48) [HTML] [PDF]
采用CatQC上架资料:既保证数据质量又加速馆藏加工周期的的方法
主题:馆藏加工

2011年春节期间上海图书馆系列活动

星期一, 一月 31st, 2011

史上最牛ppt案例

星期三, 十一月 24th, 2010

当然,这是吹牛,但也欢迎PK,挑刺也行。
当然,这也并不是用“骗骗他”做的,而是用骗骗他的死对头“尅了它”(Keynote)做的,也只有尅了它这么给力。
不好意思的是,做完之后必须把文件输出成视频再包装成骗骗他提交领导过目(乔布斯知道后顿时吐血倒地、休克过去!@#$%^&**)
需要说明的是,一个好的骗骗他,思想内容永远是第一位滴,演讲技巧也是非常重要滴,第三才是制作技巧。。。

Tags: ppt, 案例, 笔记

Related posts

公共图书馆三年发展

星期六, 十月 2nd, 2010

前三年公共图书馆发展的一些数据汇总:

2007年卷(06年数据) 2008年卷(07年数据) 2009年卷(08年数据)
全国县级以上公共图书馆数量(个) 2777 2798 2819
其中县级图书馆(个) 2391 2414 2444
其中独立建制少儿图书馆(个) 86 84 88
从业人员(图书馆员人数) 50011 50190 50637
建筑面积(万平方米) 702.5 724.4
平均每馆面积(平方米) 1616
阅览坐席(万个) 50 52,4
电子阅览室终端(个) 37036 44623
藏书总量(万册/件) 47454 49422 52367
其中图书(万册) 43318 43694 46053
流通数量(万人次) 24826 25777 27813
流通增长 3.83% 7.90%
书刊外借(万册次) 19236 19897/21080 22964
读者活动(次) 82288 84049 87695
参加人次(万) 2726 2650 3284
发放借书证(万) 1149 1263 1439
公共图书馆总收入(万元) 403689 487793
年财政拨款(万元) 290268 355185 440578
拨款增长(比上年,万元) 36070 64917 85393
拨款增长(比上年,增幅) 14.2% 22.36% 24.04%
总支出(万元) 313936 394440 474659
支出增长率(比上年) 10.6% 25.6% 20.3%
新增藏量购置费(万元) 59750 73716/73698 78962
其中购书经费(万元) 53092 64492 69040
图书购置费增长率(比上年) 11.1% 21.47% 7.1%
Tags: 公共图书馆, 数据, 汇总, 笔记

Related posts

我国互联网发展的现状和问题

星期六, 十月 2nd, 2010

根据官方数据对基本情况进行的一个汇总,留作素材。

1、 网民数量巨大,增速继续惊人,尤其是手机网民。但增速已有放缓迹象(普通网民的增长百分比已呈个位数)。据今年7月15日CNNIC(中国互联网信息中 心)发布的第26次统计数据,我国已有网民4.2亿,比半年前增加3900万,手机网民2.77亿,比半年前增加4334万人。奇怪的是,大约有4914 万网民只用手机上网。
2、 网站总数和域名总数下降明显。其中域名总数下降1121万,.CN在域名总数中的占比从80%降至64.7%。与此同时,.COM域名增加53.5万,比 重从16.6%提升至29.6%。据说全球网站数也在下滑,根据Netcraft的统计,2010年上半年全球互联网站点数减少2700万个,降幅达到 11.5%。
3、IP地址资源紧张,危机已现。中国网民数与地址数不成比例是一个特色问题,中国IPv4地址只有2.5亿,远少于网民数量。全球IPv4地址资源最快将在2011年8月耗尽,向IPv6地址过渡是大势所趋。但我们似乎还没有做好充分准备。
4、宽带不宽。接入商把注意力都放在利用各种手段扩大用户基数方面,基础设施的更新维护和管理跟不上,造成中国的平均上网速度只有857kbps(根据Akamai公司去年底的报告测算),接入速度远远落后于美国、日本、韩国等互联网发达国家。
5、网络购物发展迅速。全国网络购物用户达到1.4亿,网上支付、网络购物和网上银行半年用户增长率均在30%左右,远远超过其他类网络应用。
6、 网络安全问题巨大,同时网络信息的可信度亦然是个问题。特别是网络电子商务应用受此影响严重。CNNIC的调查发现,仅上半年,就有59.2%的网民在使 用互联网过程中遇到过病毒或木马攻 击;30.9%的网民账号或密码被盗过;电子商务网站访问者中89.2%的人担心假冒网站,其中86.9%的人表示如果无法获得该网站进一步的确认信息, 将会选择退出交易。

Tags: 互联网, 数据, 笔记, 网民

Related posts

保障性住房:美国的做法

星期六, 四月 10th, 2010

上周在市政协听了一个演讲,一个美国人讲保障性住房政策,很多朋友说:“美国有经验?教训还差不多!”

但听了他的演讲你会发现,这个Nicolas先生确非等闲之辈。

作为哈佛大学联合房产研究中心主任,作为一位曾在政、商、学三界爬滚多年,目前还担任美国多家不动产杂志专栏作家,尼古拉斯先生的观点很直接,很简单,很实在。

他首先回顾了历史,说美中两国从完全不同的两个方向,走向了同一个理想:即“每一个家庭,都应该有体面的居住”。
美国是从来不顾劳动人民的住房的。土地私有,住房是商品,从一开始就放任市场运作。1890年前后,政府开始关心百姓的住房,是基于卫生的理由,而非人权。到三十年代大萧条之后,国家建造住房,主要也是为了解决就业问题。目前美国大约有5%的国有住房,租住给排队等候的水深火热中的人民。美国政府早已放弃了建设“保障性住房”的责任,因为人民不答应,无论哪个社区也不愿意与“贫民窟”为伍。(而且美国历史上曾发生“城市空心化”过程。)所以美国一般是通过发放补助形式恩泽众生。政府的保障行为,不能破坏市场的公平性。(强行规定房价就是影响市场的做法,还滋生不公甚至腐败)
而中国老大哥一开始并不承认房地产的商品属性,一切公有,国家分配,直到难以为继。并且一直到现在还在痛苦中摸索,摸着石头过河,似乎越弄越不不公平。

尼先生在演讲中提到保障性住房建设的一些经验教训:
1、需求有不同,保障也应该有层次。
2、人们应该有选择,租房并不可耻。
3、保障性住房不仅仅是保障居住,还必须有医院、学校等配套环境。
4、集中保障不一定可取,可政策性保障,要求建筑商必须附带条件(例如批地附加一定比例的保障房,在税收等方面予以减免优惠)。
5、住房必须与就业综合考虑,保障房不是流放地。

另一方面提到几个原则:
1、住房是私有财产,交给市场做才最公平。政府做的唯一目的是保障,不是营利(保值增值)。
2、“居者有其屋”也是有尊严的居住,甚至可以更有尊严,应该鼓励。
3、住房作为投资走得太远,就要吃苦头。(美国的教训是:忘了住房是消费品而只当作投资品,以为它永远值钱)
4、城市的经济增长依靠房地产是不健康的。
5、规则程序必须公开,操作应该透明,衍生品炒作就会适可而止。

“美国那么正确,为什么会发生房利美房地美倒闭涅?为什么会引发出整个金融危机涅?”演讲之后的提问阶段,有人明嘲暗讽地问了这个问题。
尼先生说,关键在于美国人没有很好地理解什么叫“居者有其屋(体面的居住)”,认为体面的居住就是“拥有巨大的房产”。而美国政府没有及时预警,却放任自流,甚至予以鼓励,放松了监管。

他最后直面听众的提问,对政府能做什么,不应做什么,能走多远?如何利用市场机制解决问题?何时可能出问题?如何预警?如何解决问题?等等,谈了自己的看法。老美很会说话,一方面很技巧地恭维贵政府,能够及时预警问题,就能够拿得出对策,同时也明确地说出自己的观点:政府不能迁就既得利益者,误导心理预期,默认甚至支持房价飙涨,作啦啦队长…

但是,老大哥听得进去吗?

Tags: Nicolas Retsinas, 保障性住房, 笔记, 美国, 讲座

Related posts

世博园先睹记(视频)

星期三, 三月 31st, 2010




Tags: Expo2010, 世博, 世博园, 笔记

Related posts

世博园先睹记

星期三, 三月 31st, 2010

Tags: Expo2010, 世博会, 世博园, 笔记

Related posts

《实用语义网》学习笔记(第6章)

星期一, 三月 15th, 2010
《实用语义网》封面

作者: (美) 亨德勒 / (美) 阿利芒ISBN: 9787115193841 页数: 330定 价: 59出版社: 人民邮电出版社装 帧: 平装出版年: 2009-2-1

第六章 RDF模式(Schema)

本章开始是我真正感兴趣的所在了:本 体建模和本体编码。渐入佳境。

(一)

  1. 数据表达(也是一种知识表达)可以基于多种模型,每 种模型可以有多种方法来表达,每种方法也可能有多种编码模式(Schema,如XML模式,数据库模式等)。模式告诉我们所有数据需要传递和表达的信息 (包括结构和语义)。就RDF来说,也有多种等效的方法,但虽然等效,处理方式可能大相径庭,不同的处理方法可能带来不同的“计算”能力(对于语义Web 来说,也是一种推理能力),以及对应于不同的数学运算方式。
  2. 例如RDF三元组表达,其本质上是图像(节点-连线图),但RDFS更适合 于用集合来表达。点线图的计算和集合的运算是非常不同的,这两种方法可以看成是模型表达的不同。相对说来,集合运算在数学上是非常成熟的。
  3. RDFS 可以看成是领域模型表达成RDF的形式化语言,就是说领域模型中的各类实体关系,都用RDF三元组来表达,写成RDF模式的序列化形式。当然数据实例,也 都是RDF三元组。这一方面降低了RDFS的应用难度(RDF标准在设计时吸取了XMLS的经验),同时却常常使初学者感到迷惑。好在这个迷惑的过程不会 很长。
  4. 所谓推理,在这里实际上只是比“检索”前进了一步,即不仅能检索出已经明确表达的知识,而且能够根据规则,判断出没有“显式”表 达出来的知识。应 用到RDF模式,就是不仅能对Asserted Triples进行查询,也能够对Inferenced Triples进行查询。这本来就是RDFS设计的初衷,当然没有问题。当然,如果RDFS本身的表达有问题,有矛盾,通过工具应该是能够检验出来 的,XML模式也可以进行Validation的检查,RDFS当然也行。
  5. 传统的描述数据的“模式”都不是存在于模式中,或者以模式的 编码方式存 在。例如关系数据库的“模式”,通常是附注文本,或单独的文件,面向对象的对象模型的“模式”也不是以对象的方式进行描述,早期XML文本描述的DTD定 义,也不是合法的XML文件。目前很多数据格式的定义模式一般都采用与数据格式相同的方式,例如通用Lisp的元对象以及Java对象模型的API自定义 表达都是采用自身相同的语言定义模式,XML Stylesheet,以及XML模式,也采用XML方式进行定义。
  6. RDFS引入更多的 “资源”来定义资源和资源之间的关系,定义的这些资源其实只是一个“约定”,本来任何人都可以这样定义,只是W3C作为一个约定,写入了“标准”中去了而 已。
    例如rdf:type只能定义实例的类型,例如《红楼梦》是一本小说:
    [1] ex:红楼梦 rdf:type ex:小说
    其中ex表示定义“红楼梦”和“小说”的命名域。
    如果要定义“小说”(类名)是一种“文学作品”(类名), 就没有相应的rdf资源元素,W3C扩展了一个rdfs:subClassOf,以及rdfs:superClassOf,可以这样定义:
    [2] ex:小说 rdfs:subClassOf ex:文学作品
    或者:
    [3] ex:文学作品 rdfs:superClassOf ex:小说
  7. 当然,要使计算机理解 rdfs:subClassOf和rdfs:superClassOf之间的关系,还需要进一步用到本体定义语言OWL扩展的一个元 素:owl:inverseOf。实际上OWL也是一套对RDF进行扩展的词表,丰富了RDF的语义表达能力。
    继续上面的例子。由[1]和 [2],就可以推出:
    [4] ex:红楼梦 rdf:type ex:文学作品
    其中 rdf:type,rdfs:subClassOf两个资源之间的语义关系是RDF标准中定义(预设)好的(包括与rdf:superClassOf,以 及这两个资源元素与owl:inverseOf之间的关系),因此机器才能自动做出上述推论。
    这样的推理,类似于编程语言中IF/THEN表达的 语句。
    这其实才是RDF推理。

(二)

除了rdfs:subClassOf之外,RDFS还扩展了许多元素,rdfs:subPropertyOf是其中最重要的一个。
类有子类,也有 属性。属性有子属性。
[5]
ex:著 rdfs:subPropretyOf ex:创作
由:
[6] ex:曹雪芹 ex:著 ex:红楼梦
可以得到:
[7] ex:曹雪芹 ex:创作 ex:红楼梦

建模举例:
某图书馆的工作 人员中有职业的图书馆员,外聘的信息技术人员、外包公司的技术人员以及自由职业者,如果要建立他们与图书馆之间的各类用工关系,该如何做?
首先析 出需要描述的关系:合同关系contractsTo,自由职业freeLancesTo,外包公司indirectlyContractsTo,直接聘用 isEmplyedBy,以及笼统的用工关系worksFor。
所有职员与公司之间的这些关系,其实都是“属性”关系,应该用 rdfs.subPrepertyOf建立起联系。
上述五种属性之间的关系,用工关系包括合同用工和直接聘用,合同用工又包括自由职业者合同和外 包公司合同(用词在这里不一定符合中国法律,但语义就是这个意思)。可以作如下表达:
[8]
ex:isEmplyedBy rdfs:subPropertyOf ex:worksFor
ex:contractsTo rdfs:subPropertyOf ex:worksFor
ex:freeLancesTo rdfs:subPropertyOf ex:contractsTo
ex:indirectlyContractsTo rdfs:subPropertyOf ex:contractsTo

这样,如果:
Keven isEmplyedBy TheLibrary
机器可以得到以下推理:
Keven worksFor TheLibrary

如果:
Marcia freeLancesTo TheLibrary
Raizen indirectlyContractsTo TheLibrary
机 器就可以自动做出下面的推理:
Marcia contractsTo TheLibrary
Raizen contractsTo TheLibrary

属性之间的这种关系定义,在面向对象的编程中是没有对应规定的,这一点需要注意。

(三)

RDFS另外有两个重要扩展:rdfs:domain 和rdfs:range,它们也跟“属性(Property)”元素有关:rdfs:domain关乎属性的主语的取值,rdfs:range关乎属性的 宾语(对象)的取值,都是一种约束(限定),或者说提供了对三元组当属性词(谓语)确定之后,用来描述主语和宾语的限定的扩展元素。

举例说明如下:

[9]
如果属性P的值域(domain)为D,x的P属性是y,那么x的类 型一定是D。可以写为:
IF
P rdfs:domain D
and
x P y
THEN
x rdf:type D

[10]
如果属性P的范围(range)为R,x的P属性是y,那么y的类型一定是R。可以写为:
IF
P rdfs:range R
and
x P y
THEN
y rdf:type R

有 了这两个元素,就能够对于取值范围进行约束,从而可以采用规范词表之类的方法进行取值的规范控制。但是RDFS不能描述某一个实例不属于某个类(这在 OWL中得到了扩展),当定义了P的domain和range之后,如果有“x’ P y’”,不论x’或y’取何值,系统都必然地把它们归入预定的domain和range,加入预设的domain和range(例如规范词表或分类法)中 没有x’或y’的实例,就会发生矛盾,需要另外解决。

进一步,结合rdfs:subClassOf,可以有一些更有意思的推理:
如 果某个属性P有值域D,而值域D是D’的子类,则D’也是P的值域。表示如下:
[11]
IF
P rdfs:domain D
and
D rdfs:subClassOf D’
THEN
P rdfs:domain D’
具体举例:网页(D)是网络资源(D’)的子 类,具有URL的HTML页面(P)是网页(属于值域D),那么也一定是网络资源(属于值域D’)。
这里与面向对象的分析和设计似乎相反,类的属 性不是被子类继承,反而被超类获得。这是Web的特性决定的:属性自身就是资源,不专属于特定的类。

属性交集的例子:
[12]
如 果:
属性P ⊆ R ⋂ S
x P y (x的P属性值为y)
则:
x R y (x的R属性值为y);
x S y (x的S属性值为y)。

(四)

例子:
甲图书馆用 Lib1:borrows表示外借图书,乙图书馆用Lib2:checkedOut来表示,一个Web应用要将他们的外借数据合并,可以采用以下方法等同 这两个属性:
Lib1:borrows rdfs:subPropertyOf Lib2:checkedOut
Lib2:checkedOut rdfs:subPropertyOf Lib1:borrows
然后,让这两个属性共同作为一个属性的子属性:
Lib1:borrows rdfs:subPropertyOf ex:hasPossession
Lib2:checkedOut rdfs:subPropertyOf ex:hasPossession
这样,使用ex:hasPossession就可以获取所有两个图书馆 外借图书的数据了。

这种方法可以用来整合多个不同的元数据方案。例如,用DC元数据元素作为“核心集”时,MARC等不同元数据方案中的 诸如ex:author,ex:editor之类的元素,都可以 subPreportyOf dc:creator,就可以支持DC标准作为统一查询的元数据标准了。

不用作推理的RDFS元素还有如下一 些:rdfs:label(给定一个显示 名),rdfs:seeAlso(交叉参考),rdfs:isDefinedBy(定义主体),rdfs:comment(注释)等等。

总结一下:

RDFS是用来描述RDF的模式语言,主要提供了定义类(class)、类与类之间的关系(subClass)、属性 (property)、属性之间关系(subProperty)的方法,并规定了简单的、基于集合理论的类继承规则,以及属性继承规则。可以看出RDFS 对RDF的上述扩展,也是完全基于RDF的(全都是三元组),这也保证了RDFS可以像RDF一样,具有同样的开放性,任何人都可以用来定义任何RDF模 式。

虽然RDFS引入了值域和范围,用来限定资源类的属性取值,增加了RDFS的复杂性,但RDFS仍然是非常简单的,没有多少内容。也因 为此,它的适用面和能力是非常强大的。当然如果要表达更为丰富的语义和推理关系,还需要从规则表达(如OWL和SKOS)和词表(如SKOS、FOAF、 DC等等)两方面进行扩展。任何元数据方案以及本体模式,都是组成语义网标准规范体系中的成员,都是对语义网的贡献。

Tags: OWL, RDFS, 实用语义网, 笔记, 语义Web, 语义技术

Related posts

《实用语义网》学习笔记(1-5章)

星期一, 三月 15th, 2010

下面是看书时随手记下的内容,为了加强印象,特别是看原版书,不记一些东西很快就扔到爪哇国去了。笔记不一定正确,贴在这里供大家批判。

《实用语义网》封面

作者: (美) 亨德勒 / (美) 阿利芒ISBN: 9787115193841 页数: 330定 价: 59出版社: 人民邮电出版社装 帧: 平装出版年: 2009-2-1


第 一章 什么是语义万维网

  1. 这的确是一个很难向普通人解释的问题,我们来看看两位大师是怎么做的。
  2. 首先他们介绍了 本书的主题:关于语义万维网 和本体建模。语义万维网顾名思义,肯定是关于万维网的,而且要表达语义。语义按照一般的解释,就是自然语言所表达的含义。本体建模为什么有必要谈呢,主要 是因为W3C固然搞了一大套东西,但不同的工匠做出的活儿肯定是不同的,本书是要教导你做出漂亮的活,而不是粗糙的、仅仅符合W3C那些定义的活。
  3. 然 后解释了Web的伟大意义,即任何人可以在上面就任何话题说任何话,即AAA口号(Anybody can say Anything about Any topic)。这正是Web的魅力和价值所在。万维网的价值与它参与者的数量和资源数 量成正比,万维网的魅力就在于它是一个不断增长的有机体。那么语义Web又能做什么东东呢?作者举了两个Web应用例子(涉及到四个网站),一个是会议旅 馆信息不同步,一个是冥王星被驱逐出太阳系九大行星行列之后,一些网站的信息同步问题。作者在后文中还会用到这两个例子。
  4. 通过这两个例 子,说明目前的Web是有很大缺陷的,同时说明,语义Web就是要解决这些个问题。作者称之为“聪明的Web和傻Web”的问题。
  5. 接 着作者探讨了如何使Web变得聪明,在现有的Web架构中,你不可能提供一个集中式的管理方法,或者架构,使其“聪明”起来,任何这种企图在开放的、分布 式环境下都是不可能的,不仅是经济上不可能,操作上也不可能。所以作者对“聪明”的Web有一个定义,就是需要把数据在适当的时候,以适当的方式呈现出 来。语义Web的架构只要实现这个,就够了。
  6. 然后作者又对“聪明的程度”作了探讨,聪明并不意味着绝对正确,不可能存在绝对真理,语义 网“容错”是一个关键问题,如何容错,如何继续允许AAA,同时建立自己的过滤和“权威”审定机制,也是这个架构设计中的重要方面。目前主要采用唯一的 URI命名来共存,以及采用RDFS标注来说明概念间的关系。

第二章 语义建模

  1. 首先介绍了模型的概念:对事物的抽象,隐藏细节、反映概貌,以及模型的作用:沟通、解释预测以及协调不同意见。
  2. 模 型描述用自然语言在人和人之间交流,比通过计算机交流,要容易得多。人类的交流通常隐含了很多前提条件(语境),例如知识、文化、科技、宗教背景。当然, 也会因此而造成理解程度的差异。
  3. 整个一章基本上是围绕模型的三个功 能:communication,explanation/prediction,mediating来写,最后着重说明了如何表达异见、以及表达能力有 高有低等问题。

第三章 RDF-语义Web的基础

  1. 首先提出,语义Web所涉及的语义,不同于符号语义学很复杂的东西,而仅仅是为所涉及的“资 源”给出了一个链 接,作为资源名(即URI)。实际上给出了语义Web一个基本假设:链接即语义。有了这样一个URI,任何指代的东西就有了根据,通过这样一个基本的三元 组的建立,使得认知三角形得以成立(实际上是这样一个认知模型),从而提供了逻辑的结构基础(砖块):三元组构成的判断式,从而所有的推理运算可以在此基 础上展开(例如一元谓词逻辑的所有计算,最简单的等同计算,以及通过RDF建立关系链接能够表达的所有关系计算——超类,子类,以及通过OWL描述逻辑能 够进行的更复杂的计算,如“非”等等)。
  2. 本章通过一个莎士比亚戏剧作品的年 表,展示了如何从关系数据库的表单结构表达的隐含语义,转化为分布式Web网络环境上可被获得的三元组链接。这也印证了人们对语义Web的一个通常的说 法:语义Web就是分布式环境下的关系数据库。介绍了表达三元组的技术细节(如说明了采用qname的URI由怎样的两部分组成)。本章的最后提了本书的 第一项“挑战”(Challenge,类似于作业或操练,不过紧跟着就提供了答案和讨论,非常有启发):把一个关系表转化为RDF表达。这是很有特色的一 种写法。最后还讨论了高阶(逻辑)关系和三元组(RDF)的其它表达(序列化)形式:N-Triples, Notation 3(N3), RDF/XML, 空节点(Blank Nodes)

第四章 语义Web应用架构

  1. 首先解释了在这样一本以“建模”为题的著作里,为什么要介绍“架构”(Architecture), 因为这本书同时也 是for working ontologist,要具有实用性。为了解释如何使用,必须要介绍语义Web的高层架构、组成、内容(输入inputs)及来自何处、以及如何用到 RDF的优点、与其他架构的不同之处,等等。
  2. 支持语义网应用的软件主要有以下几类:
    • RDF解析器 (Parser)/序列化工具(Serializer);
    • RDF 库(Store,又称三元组库:Triple Store);
    • RDF 查询引擎(Query Engine);
    • 各种专门应用(Application),如后面介绍的转换器、刮擦器等等。
  3. 目 前实现所有语义Web应用的底层技术还是以关系型数据库为基础的Web三层应用模式,只是其中增加了语义处理的内容,如查询部分需传递SPARQL语句, 处理和存储部分都需要支持RDF三元组数据,等等。
  4. 本 章后面其实没讲什么“架构”,都讲各类语义应用/软件了,例如:转换器converter/刮擦器scraper(指从HTML网页或传统应用中获取语义 信息——通常是RDF数据——的工具,当然可以通过各类微格式或其他准标准文档格式进行“刮擦”,通常需要编写GRDDL来实现);RDF库的互操作解决 方案;查询和提问标准及其与SQL的比较;基于RDF的门户等,最后对于跨库的数据合成(特别是动态合成,类似于Mashup)。
第五章 RDF与推理
  1. 上来就引述第一章讲到“傻瓜数据”时所举的例子:“傻瓜 数据如何基于更多的互联关系而使Web上的应用更聪明”(how a more connected Web infrastructure can result in behavior that lets smart applications perform to their potential)。其实当时也没怎么看懂,姑且继续往下看去。
  2. 基 于RDF的数据整合最大的好处,是保证分布式环境中数据的一致性(consistency)。数据的整合视图可以通过整合数据和整合提问两种方式得到,整 合提问通常需要架构的支持,并且需要适当的提问构建工具/环境以方便构建整合视图。
  3. 前文中“衣物和衬衫”的例子可以用规范词表的形式来 解决,如规定衣物是衬衫的上位概念,这样在查询衣物时,它的所有下位概念都会出来。这也是一种推理。
  4. 著名的语义Web堆栈图已经充分说 明了提供推理支持的语义网架构,这个架构是基于RDF,以及以RDF为基础的描述模式的。
  5. 推理引擎能够判断并未描述出来 的逻辑,不同的引擎判断的能力不同,RDFS和OWL的引擎就有所不同。
  6. 对于RDF库来说,有两种方式支持推理:Asserted triples和Inferenced triples,其区别类似于实时索引和物理索引的区别,极端的情况是,要么把所有能够推理出的三元组全部都罗列出来,放入库中,要么能不放都不放,所有 的三元组查询都通过规则实时导出。前者利用空间节省时间和计算能力,后者利用计算能力而节省了空间却牺牲了时间。对这两种做法进行动态更新时会碰到不同的 问题,在实际应用中,很难说那种更好,一般都采取折中的做法。
Tags: OWL, RDFS, 实用语义网, 笔记, 语义Web, 语义技术

Related posts

“图书馆技术前沿”RSS订阅

星期六, 八月 1st, 2009

刚去“图书馆技术前沿”(http://kevenlw.jimdo.com/)添加了“博客RSS”和“动态RSS”两个链接:

欢迎订阅。

并添加了一个帖子:

希望试验一些支持语义应用的软件平台

从早期我们实验性地开发了一些支持通用元数据模式(schema)实例著录和格式转换平台,到后来希望支持元数据元素的登记注册系统、元数据服务(模式转 换、rdf示例、rdf编码),再到后来希望支持各类本体的构建、转换和术语服务(DCAP和RDA可以做为上述应用的特例),一直需要试验一些软件平台 支持上述想法。目前商用解决方案大多缺乏通用性,一般是专门为某些机构或需求而开发,难于推广,所以很需要在开源系统的基础上建立类似的平台和应用。

很高兴看到Drupal以及Mediawiki对于语义应用的支持已经形成了一定的社区,不停地开发一些插件,本身这些开源在架构方面还是很灵活的,似乎可以被用来当作类似应用的平台。希望国内也能有这样一些IG(兴趣小组)进行一些实验。我们希望今后在这方面多做些工作。

这里有一个访谈,介绍了Drupal在语义功能方面的一些开发。

Tags: , , ,

Related posts

“图书馆技术前沿”开通

星期四, 七月 30th, 2009

Ning被墙了之后,一直想再建一个墙内的技术交流平台,还没想好用什么来建(欢迎建议),看到Jimdo建站服务挺方便,但是它的2.0功能(社区交流功能)看起来很弱,于是想把发布和交流分开,现在这里(kevenlw.jimdo.com)建一个图书馆前沿信息技术应用的网站(以信息发布为主),目前打算先汇总如下一些内容,我们将不定期地进行更新。希望有感兴趣的同仁加入我们的团队。

“图书馆技术前沿”网站开通

我们会继续利用这个“数字图书馆讨论组”进行交流,另有一个“图书馆2.0讨论组“,都欢迎大家加入。这两个都是利用Google的邮件列表群组功能建立的,需要申请一个gmail邮箱,具体使用方法参见这里

顺便一说,Jimdo建站的确做到了方便,我大概总共用了5-6个小时,其中大部分时间还是在内容添加上。Jimdo的模板和功能比Google Site更加丰富与人性化。我就不拿它与Ning或Facebook等比较了,因为定位不同,不公平。一个好的Web2.0应用应该使用户专注于他自己的内容和业务,需要时可以提供“高级”的技术升级能力。相信今后这类“好的应用”会越来越多。

Tags: ,

Related posts

关于“天堂是图书馆模样”照片网站的简单说明

星期一, 六月 29th, 2009

这次来厦门,我已经开始向馆长们宣传这个“天堂是图书馆模样”的图书馆照片网站了,但是连个说明都没有,说也说不清楚。

在这里先写一个简单的,以后再弄一个图文并茂进行宣传推广。

1、打开网址:http://www.libphoto.cn/

2、点击右上角“注册”(如已注册,点击“登录”)。

3、准确填写所需信息,注意电子邮件地址必须填写正确,否则无法进行密码找回。

4、注册成功后即可登录。登录成功后点击页面左上角“天堂是图书馆的模样”或这个地址:http://www.libphoto.cn/main.php,即可进入主页。

5、左下角(下拉到头)可看到操作菜单,点击“添加相册”。

6、填写目录名(比如xiamenlib)、相册名(比如“厦门市图书馆”)、相册摘要、关键词、描述等(也可不填,以后任何时候都可以填)。然后点击“新建”。一个新的相册(目录)就建立起来了(此时出现的所有设置均可以置之不理)。

7、再点击左侧菜单中“添加项目”,即可选择文件,确定照片标题(如果不写缺省为文件名)……重复这个操作(一次上载超过两张照片,可以点击“More Uplaod Boxes”以出现更多上载窗口),即可选择更多的图片。

8、点击下面的”添加项目“即可把刚才选中的硬盘上的照片添加进来。

欢迎大家注册、测试、多多上载。我们会定期进行整理,有问题可以给我留言,或者email。

Tags: ,

Related posts

本博账单

星期四, 六月 4th, 2009

今日贴图不语(注:这是一个月的数据,数字并不好看,但也要衷心感谢大家!)

kana1

kana2

kana3

kana4

kana5

Tags: , , ,

Related posts