张琪玉先生说:
“索引是对某种文献或某一文献集合中所包含的各篇文章,或所讨论的各个局部主题,或所涉及的各种试想(如地区、人物、机构、事件、生物、矿 物、产品、设备、公式、数据、著作等)以简明的方式分别著录标引,即确定其检索标识和指出其所在位置,并将款目按一定的可检顺序排列和组织,以方便检索的 一种工具。”
由以上定义,可以得出以下两点结论:
一、索引与目录一样,都是提供一种检索方法或工具,通过析出知识单元并加以有序组织,而在大量的信息中进行定位。
二、索引有三要素:
- 结构化–带来“单元性”–要有URI和元数据格式;
- 有序化–产生“组织性”–要采用知识体系(本体)进行组织;
- 可视化–造就“交互性”–要有二维、三维界面进行时空或抽象呈现;
传统索引的有序化主要是指对索引单元(款目)的编排以字符或语义单元的自然属性(通过音序、字形编码顺序来检字)来排列的方式,在印刷过程中通过排版技巧(字体字号空格缩进段落等)来实现,可以认为其有序化和可视化是一体的。
数字索引学的研究课题:
除与传统索引进行转换之外(如书后索引的自动建立、方正格式等的索引点标注等),数字索引学还将研究:
- 资源标识体系(索引什么,如何标识,如各种URI);
- 元数据格式(如何描述、表达、互操作,如RDFa、各种微格式等);
- 有序化(自然顺序之外,还包括本体和各类KOS)组织方式;
- 自动索引(信息或知识单元的自动抽取);
- 可视化方式。
数字索引学技术基础:
- Web架构;
- XML/RDF编码;
- 语义描述(元数据与本体标准);
- 关联数据;
- 规范控制;
- 信息可视化。
结论:索引与索引学已经与数字资源组织的各专门领域和学科大融合。
Tags: 专业评论, 张琪玉, 数字化, 知识组织, 索引, 索引学