数位图书馆与博物馆 metadata 管理系统 -- Metalogy 之设计
陈昭珍 国立台湾师范大学社教系副教授 国家图书馆阅览组主任 chao-chen@msg.ncl.edu.tw 陈雪华 国立台湾大学图书资讯学系教授兼系主任,所长 sherry@ccms.ntu.edu.tw 陈光华 国立台湾大学图书资讯学系副教授 khchen@ccms.ntu.edu.tw
摘要 数位图书馆/博物馆的研究随著网际网路的 发展相当受到世人的重视,各先进国家无不 热烈支持有关的各项计画.我国台湾地区有 许多机构在从事珍贵藏品数位化的计画,例 如数位博物馆专案计画,国家数位典藏机制 专案,地方文献数位化计画,以及中华回忆 网等相关的计画正在进行中或将於近期内开 始执行.将资源数位化并呈现於全球资讯网 上是首要的工作,但是更重要的是:必须针 对这些资源的特性加以组织与整理,才能有 效地检索,使用. 在数位化计画中,metadata 扮演很重要 的角色,其订定需由了解使用者需求及资讯 属性入手,同时也需考虑到资讯系统之间的 互通性,所以相关标准的采用非常重要.目 前发展中的数位图书馆系统不管用那一种 metadata ,其交换语言大多选用 XML 或 SGML ,尤其是 XML 语言可取 SGML 之长, 补 HTML 之短,是目前网际网路界极力推广 的语言.本文主要在说明设计 metadata 时所 涉及之问题,并介绍我们在国科会「数位博 物馆」 专案计划所发展的一套 XML/Metadata 通用系统 – Metalogy,说明其系统特色,架 构,功能及使用方式. 关键词:数位图书馆,数位博物馆,数位博 物馆专案计画,XML,诠释资料,metadata , Metalogy 1 前言
最近数年,数位图书馆/博物馆的研究随著 网际网路的发展相当受到世人的重视,各先 进国家无不热烈支持有关的各项计画.我国 有悠久的历史文化,累积丰富的文化资产, 是世界的瑰宝.另外,关於台湾本土的珍贵 文献与历史文物,许多机构与学术研究单位 有丰富的典藏.为了避免损坏这些宝贵的资 源,因此无法开放让大众参观.现在,透过 无远弗届的网际网路连结,能够将这些宝贵 的资源呈现於全球资讯网上,既能够扩大浏 览的族群,也能够让终将损坏的珍贵资源以 另一种方式维持其恒久的生命. 台湾地区目前从事珍贵藏品数位化的机 构主要有台湾大学,中央研究院,国家图书 馆,故宫博物院,历史博物馆,科学博物馆 等.另外还有如台湾科学教育馆,台湾博物 馆,科学工艺博物馆,台北市立美术馆等单 位,其部分馆藏文物也都有数位化之成果.1 将这些宝贵的资源数位化并呈现於全球资讯 网上是首要的工作,但是更重要的是:必须 针对这些资源的特性加以组织与整理,才能 有效地检索,使用,因此,在数位化计画中, metadata 扮演很重要的角色. 基本的数位化系统,从使用者的角度而 言,应包含的功能主要有查询,浏览及其他 相关网路资源连结.而通常资料量大的数位 图书馆系统都会以资料库来管理其书目记录 及数位化物件,或连结的网址,为避免连结 网址的失效,及数位化物件变更存放的位 置,所以也会考虑使用 Handle System 之类
的机制来做识别处理. 以目前的检索技术而言,提供查询的方 法不外为:全文检索或栏位查询.全文检索 可以不必对资料做描述,但检索效能较差, 对於无文字的影像,声音或视讯资料而言, 全文检索技术也无法派上用场,所以以人工 描述 metadata ,建立栏位化的书目资料,对 於数位图书馆而言,是绝对必要的工作.因 此,在一数位图书馆或博物馆等系统中, metadata 扮演重要的角色.Metadata 的订定 需由了解使用者需求及资讯属性入手,同时 也需考虑到资讯系统之间的互通性,所以相 关标准的采用非常重要,如国际间已发展出 来的格式 :Dublin Core (Dublin Metadata Core Element Set) (http://purl.oclc/dc) , EAD (Encoding Archival Description) (http://lcweb.loc.gov/ead/) , FGDC (Federal Geographic Data committee) (http://www.fgdc.gov/) , GILS (Government Information Locator Service) (http://www.access.gpo.gov/su_docs/gils/index .html),TEI (Text Encoding Initiative Headers) (http://www.uic.edu/orgs/tei/);以及 metadata 的交换语言,如 SGML/XML/HTML 等.目 前发展中的数位图书馆系统不管用那一种 metadata ,其交换语言大多选用 XML 或 SGML ,尤其是 XML 语言可取 SGML 之长, 补 HTML 之短,也是目前网际网路界极力推 广的语言.本文主要在说明设计诠释资料时 所涉及之问题,并介绍我们在国科会「数位 博物馆」专案计划所发展的一套 XML/Metadata 通用系统 – Metalogy,说明 其系统特色,架构,功能及使用方式.
2 数位博物馆专案计画
国家科学委员会(简称国科会)为了加强人 文社会科学的研发以及科学教育工作,从 1998 年五月开始推动「迎向新千禧一以人文 关怀为主轴的跨世纪科技发展」 方案. 「数位 博物馆」专案即为此方案中的计画之一,其 主要目标为:整合建置一个适合国情并具有 本土特色的「数位博物馆」 ,以发展教育性网 际网路内涵.2 藉由无远弗届的网际网路建立 并推动文化,艺术,科技等教育性网站内涵 的典范,使一般大众得以不受时空限制,随 时上网检索或浏览并利用其资讯,进而丰富 人民生活的内涵与享受终身学习的乐趣.3 此外,更希望藉由数位典藏的推动,刺激多 媒体数位典藏技术与产业之发展.
「数位博物馆」 专案计画自 1998 年八月 推动以来,目前已进入第二阶段.国科会在 第一年首先邀集中央研究院,台湾大学,清 华大学等已进行数位典藏与相关技术研究的 专家学者,共同建立一个「数位博物馆」的 推动与合作机制.该专案的推动大致区分为 主题计画以及技术支援等两大类.4 另外, 还有「推广教育计画」 ,系培养数位典藏种子 人才,并将主题计画与技术支援计画推广给 各界使用. 从内容来看,第一阶段的主题计画包括 了本土风情和传统文化两方面.在本土风情 方面,有二个综合性质的人文主题计画,即: 淡水河溯源(台湾大学图书馆)和台湾原住 民— 平埔族群(中央研究院民族学研究所) . 在自然科学与自然生态方面则有:蝴蝶生态 面面观(暨南大学资讯工程学系与自然科学 博物馆) ,台湾的鱼类(中央研究院动物研究 所)和台湾本土的植物(中央研究院植物研 究所) .在传统文化方面有:传统思想与文学 (四书,老庄,唐诗) (中央研究院语言学研 究所筹备处) ,不朽的殿堂--汉代的墓葬与文 化(中央研究院历史语言研究所) ,火器与明 清战争(清华大学历史系)等三个计画.5 在共通技术支援的系统方面,第一阶段 已著手建立的有:关於时间,空间和语言文 字等共同的座标体系,此即人文与自然资源 地图(中央研究院计算机中心)和搜文解字 —语文知识网路(中央研究院语言学研究所 筹备处)两个计画的主要内涵.此外,还有 一些共同的资讯技术项目,包括:资源组织 与检索之规范(台湾大学图书资讯学系) ,系 统评估(台湾大学图书资讯学系) ,以及数位 典藏系统先导计画(中央研究院资讯科学研 究所)等.资源组织与检索之规范为主题计 画建立中文诠释资料交换格式,索引典以及 检索与搜寻等规范,使各主题系统具有国际 化的透通性.系统评估以淡水河溯源计画为 例,建立主题系统建置过程中的各项评估规 范与准则,促使各主题系统具有较高的品质 与传播效果.6 数位博物馆专案推广办公室(台湾大学 图书馆)成立於 1998 年八月,其目的在於培 育数位典藏种子人才,并将计画成果扩散而 广为社会各界运用.推广办公室透过研讨 会,教师网路素养训练班,专业训练课程, 媒体专文介绍,电子报传送等方式,加强台 湾地区典藏单位与产业界对数位图书馆与博
物馆的认识,提升民众的兴趣,充实中小学 教师使用网路资源能力,并培养建置数位图 书馆与博物馆的专业人才.7 目前,数位博物馆专案计画已进入第二 阶段,执行期间为 2000 年一月至十二月.本 阶段开放并扩大参与的单位,在近九十件申 请的主题计画中核准十二件,包括:1.故宫 文物之美(故宫博物院)2.玄奘西域行(台 湾大学哲学系) 3.淡水河溯源数位博物馆 (台 湾大学图书馆)4.台湾民间艺术家数位博物 馆之建置--以杨英风数位艺术博物馆为例 (交通大学)5.台湾老照片数位博物馆(艺 术学院)6.台湾建筑史 (义守大学)7.生命科 学数位博物馆--人体奥秘展览馆(台北医学 院) 8.台湾原住民--平埔族群数位图书馆与博 物馆(中央研究院民族学研究所)9.中小学 语言文学知识网路(中央研究院语言学研究 所筹备处)10.寻回台湾本土的淡水鱼类(中 央研究院动物研究所)11.中医药,针灸虚拟 数位博物馆(中国医药学院)12.兰屿生物/ 文化多样性数位博物馆(暨南大学资讯工程 学系)等.以上十二件计画中,有四件计画 (编号 3, 8, 9, 10)系延续第一年的计画.8 本阶段之技术支援计画则减为两件:资 源组织与检索之规范与系统实作(台湾大学 图书资讯学系)以及数位博物馆影像版权资 讯植入技术与软体之开发(交通大学资讯工 程学系) 9 .
3 资源组织与检索之规范与系统实作
在国科会的「数位博物馆」专案计画开始之 前,我们与一些图书资讯学界的同仁於 1997 年三月在「台大电子图书馆与博物馆」 ( National Taiwan University Digital Library/Museum, NTUDL/M)计划中成立了 「诠释资料研究群」 ,著手於中文资讯诠释资 料交换(Metadata Interchange for Chinese Information,简称 MICI)之相关研究.工作 项目包括了解藏品之背景与特性,研究国内 外现有之诠释资料格式,了解诠释资料与资 料库及整个系统之关系,以及潜在使用者的 资讯需求与搜寻行为.研究群认为,诠释资 料格式的考量重点为符合藏品特性,提供使 用者必要的检索点,未来与其他数位图书馆 资料交换上的共通性,以及编目著录品质之 考量.NTUDL/M 数位化的藏品型态主要为 古文书,在了解古文书的性质之后,研究群 深入研究许多描述类似藏品之诠释资料,包
括描述博物馆艺术藏品的 CIMI (Computer Interchange of Museum Information) (http://www.cimi.org) 及 描 述 档 案 资 料 的 EAD,然而由於文化及藏品性质的差异,这 些诠释资料无法完全满足於中文特藏,因此 有必要积极从事中文诠释资料的研究,这也 是「诠释资料研究群」成立的主要目标.10 1998 年我们执行一项名为 「资源组织与 检索之规范」 (Resources Organization and Searching Specif ication, 简称 ROSS)专案计 画,2000 年则继续执行「资源组织与检索之 规范与系统实作」 ,作为国科会 「数位博物馆」 专案计画之下技术支援的分项计划.ROSS (Resources Organization and Searching Specif ication) (http://ross.lis.ntu.edu.tw) 计 画 的研究目标涵盖在中文环境数位图书馆 博 物馆中,有关於资讯组织与检索各个层面的 重要议题;包括资料的储存与管理系统的设 计,使用者资讯需求及查询资料的方式,各 系统间整合等. ROSS 研究群於 1998 年十一月开始为 国科会「数位博物馆」专案计划展开古文书 之外其他藏品(器物,古地图,图像照片, 蝴蝶标本等资料)诠释资料的制定.在制定 的过程当中,除了经常与专家们讨论之外, 我们亦参酌相关数位博物馆的著录方式. ROSS 计画第一年的工作主要支援淡水河溯 源和蝴蝶生态面面观两个计画的诠释资料制 订.ROSS 计画第二年的工作则主要发展一 个能使各种诠 释 资 料并存的管理系统 – Metalogy,并提供有需要的各个主题计画使 用.
4 4.1 Metadata 之意义与功能
Metadata 之意义
所谓 metadata ,在资讯组织界最普遍的解释 是 " data about data",意指有关资料的资 料,即资料之描述性资讯,如图书馆的 MARC (Machine-readable cataloging) (http://www.nlc -bnc.ca/marc/emarc.htm) 记 录,即为一种 metadata.但 Renato Innella 认 为这种解释,忽略了 metadata 最重要的概念, 即其结构性, 他认为应将 metadata 定义为 " structure data about data" 此结构二字,使得 采用 metadata 做组织资讯的方式和全文索引 (full-text indexing)有所区隔.11 对资料做描 述以建立索引的作法并非始於今日,但 metadata 一词却是在网路资讯出现后,才普
遍被使用的,且多指网路资源等电子资讯的 描述.国内翻译名词有诠释资料12 ,元资料 13 ,超资料14 ,纷歧显见.
4.2 Metadata 之功能
求:17 1. 促使系统互通,而不只是在提供摘 要性资讯; 2. 当越来越多的资讯被电子化时, metadata 模组应能让电脑连接资讯 源并自动撷取 metadata; 3. Metadata 管理系统应能定期核对原 始资讯源,以确保 metadata 资讯的 正确性. Jeff Rothenberg 认为和一资料库有关之 metadata 有三类:18 1. 协助或限制检索的 metadata; 2. 作为分享与互通之用的 metadata; 3. 表达资料特性及作为索引资料的 metadata. 同 时 Jeff Rothenberg 更 进 一 步 的 将 metadata 分为三种层次,每一层中所包含之 资讯如下: 1. 资料库层次之 metadata (database level metadata) 2. 资 料 项 目 层 次 之 metadata (data-element level metadata) 3. 资料值层次之 metadata (data-value level metadata)
4.3 Metadata 相关之课题
Locan Dempsey 认为 metadata 的功能主要 有:15 1. 找到资讯之位址 (location); 2. 搜寻资讯 (discovery); 3. 纪录资讯 (documentation); 4. 评估资讯 (evaluation); 5. 选择资讯 (selection); 6. 其他. Renato Iannella 及 Andrew Waugh 也提 出类似的观点,他们认为 metadata 主要用 来:16 1. 概述资料之内涵 2. 让使用者查到该资料 3. 让使用者决定该资料是否是他所要 的 4. 避免使用者存取该资料(如禁止儿 童使用某类资料) 5. 让使用者检索,复制资料 6. 指示应如何解译该资料(例如说明 资料之格式,编码,加密的情况) 7. 用来决定可检索哪一个资料(若资 料可多种格式存在) 8. 说明资料使用的合法情况 9. 说明资料之历史,如说明其原始资 料为何,及其他的改变 10. 说明资料之联络人,如拥有者 11. 指示该资料与其他资源的关系 12. 控制资料的管理 但就资料库系统而言,metadata 则直指 资料库管理系统之架构(schema),且其对 metadata 的讨论偏重在如何藉由 metadata 的 使用,以达到多资料库系统(multi-databases) 的互通(interoperability)等问题.香港科技大 学的 Pamela Drew 及 Jerry Ying 认为传统的 metadata 被定义为:有关资讯源的静态观点(a static view over some source information),此 观点通常由 metadata 应如何让使用者搜寻 及存取资讯源之角度来思考.但是现在,因 整个广域网路中资讯源需互连,故而传统 metadata 的范围与角色也随之改变.所以, 他们认为,现在的 metadata 应满足三项需
如果将 Jeff Rothenberg 的三种层次再进一步 诠释,我们也可以说 metadata 的设计必需考 虑三方面的问题,一是语意(semantic),二是 结构(structure),三是语法(syntax). 此外,分散式资讯的整合检索虽不是 metadata 的直接内涵,但在网路环境中是一 个重要的课题,而且相关标准的设计和 metadata 息息相关.兹分别说明如下: 1. 语意问题 (semantics): Metadata 的语意内涵乃根据资料的特性及使 用者的需求而定,它探讨的问题包括应该描 述资料的那些属性 属性的名称如何命名 描述该属性时所根据的资讯来源为何 以及 该属性内容是否应根据索引点或权威档来描 述 AACR2 (Anglo-American cataloguing Rules Second Edition) (http://www.libraries. psu.edu/iasweb/personal/jca/aacr/) , Dublin Core,AAT (Art and Architecture Thesaurus) (http://shiva.pub.getty.edu/aat_browser/) , LCSH (Library of Congress Subject Heading) (http://lcweb.loc.gov/cds/lcsh.html) , LCNA
(Library of Congress Name Authority File)等 属於此类标准. 2. 结构问题 (structure): 决定了资料应描述属性后,接下来的问题是 建立属性的结构.属性的结构在呈现属性之 间的关系,使得属性的描述清晰易懂,不叠 床架屋,且便於程式的撰写.MARC,DTD (Document Type Definition),RDF (Resource Description Framework) (http://www.w3.org/ RDF/)等所关心的即是这个层次的问题. 3. 语法问题 (syntax): 要使 metadata 具备互通性,可以在不同系统 之间交换,则包装 metadata 的语法是非常重 要的部份.犹如 ISO 2709 在不同的图书馆自 动 化 系 统 之 间 穿 梭 自 如 ,HTML 是 使 得 WWW 文献能在不同系统间交换的主要功 臣,而 SGML,XML 是电子图书馆/博物馆/ 档案馆系统用来标示其 Metadata 及全文资料 的标准语言. 4. 整合检索的问题 即使每个系统都根据相同的 metadata 描述资 料,但各系统的索引模式与检索指令仍会不 同,因此使用者往往必需学习不同系统的检 索介面及指令以查寻不同的系统.当资料库 很少的时后,这样的学习还可忍受,若资料 库很多时,太多检索指令及介面的学习则毫 无效率可言.更何况在电子图书馆/博物馆/ 档案馆领域中,不同学科领域或资讯类型往 往使用不同的 metadata.因此分散式资讯的 整合检索在网路环境中是一个非常重要的课 题.Z39.5019 ,START (The Stanford Protocol for Internet Retrieval and Search)等即属此类 的标准.
5 中文诠释资料交换格式
中文诠释资料交换格式(MICI)乃以 Dublin Core 十五个基本栏位为主要的架构.但是为 了描述文化遗产丰富的属性,更精确表达描 述藏品的语意,MICI 按照藏品类型特色,在 相 关 栏 位 下 , 搭 配 栏 位 修 饰 语 ( element qualifier)的使用,不仅可以扩大其应用的范 围,同时也具有国际性.我们将以 DC 核心 集为基础并加上自行定义的栏位修饰语的诠 释资料格式称为 MICI-DC.
5.1 都柏林核心集 Dublin Core
Dublin Core 起源於 1995 年由 OCLC (Online Computer Library Center)与国家高速电脑应
用中心(National Center for Supercomputer Applications, NCSA ) 於 美 国 俄 亥 俄 州 的 Dublin 共 同 召 开 了 一 个 诠 释 资 料 研 讨 会 (OCLC/NCSA Metadata Workshop),提出为 网路资源提供诠释资料的议题,以期支援跨 领 域 的 资 源 搜 寻 . 都 柏 林 核 心 集 (Dublin Core,简称 DC)诠释资料是一种专为网路上 电子资源所设计的诠释资料格式,原为网路 资源著作者设计,目的为辅助跨领域网路资 源的搜寻;但却引起博物馆界,图书馆界, 政府机关与商业团体的广大响应.因此 DC 工作小组邀聚各界学者专家,探讨如何在 DC 核心集上,发展跨学界的国际共识.参 与并推广 DC 的国家遍及世界,共有 20 多个 国家.DC 的优势是简单易用,若能推广成 为标准,具备跨领域的语意共通性后,就能 进行跨领域的资讯交换.此外,DC 具有延 伸性,能够记录架构,并描述较为复杂的语 意.目前 DC(语意—资源的描述)与 RDF (架构) 及 XML(语法)结合,三者各自 独立,但彼此互补. DC 是一种诠释资料格式,基於国际的 共识,定义了在网际网路的作业环境中,描 述资源的基本资讯(http://purl.org/dc/) .由 於 DC 的目的是要让资源的创造者或出版者 自行建立资源的诠释资料,格式简单易用为 其一大特点.都柏林核心集的格式虽然简 单,但为了符合使用者的不同需要,仍然维 持了相当的延展性(extensibility)及可变性 (modifiability) .十五个栏位名称如下:题 名 (Title) ,创作者 (Creator) ,主题 (Subject) , 简述(Description) ,出版者(Publisher),贡 献者( Contributor ) ,日期( Date ) 类 型 , (Type) ,资料格式(Format) ,辨识资料 ( Identifier ), 来 源 ( Source ), 语 文 (Language) ,关连(Relation) ,时空涵盖范 围(Coverage) ,权限范围(Rights)等. 简 易 DC ( Simple Dublin Core or Unqualified Dublin Core)是没有用到修饰语 的 DC 诠释资料.换言之,栏位是以十五个 DC 诠释资料栏位来表达属性,并未进而定 义著录架构,修饰语值或是其他的处理资 讯.DC 修饰语(Qualified Dublin Core)的 诠释资料则定义了著录架构,控制词汇,或 是表示出诠释资料的栏位值是 compound 或 是 structured 的.DC 修饰语应用了其他资 讯,以提高诠释资料的精确度.例如,日期 可以进而细分为最后修改日期,出版日期,
并以特定的著录方式著录,以免产生模稜两 可的解释.主题栏位可以从某个特定的控制 词汇选单(如 US Library of Congress Subject Headings, LCSH)来著录.
5.2 MICI-DC
目前 MICI-DC 可处理的资料类型包括:古文 书,地图,图像/照片资料,器物以及故宫的 书画,器物与文献(佛经,佛经图绘) .除采 用 DC 制订之修饰语外,也根据各典藏单位 之需求自行定义相关修饰语,使用者可自行 选择 DC15 个栏位与修饰语,并视需求调整 栏位顺序,在遵循国际标准外,同时提供最 大弹性以符合使用者的需求.
5.3 MICI-DC 著录手册
为让使用者更易於著录 MICI-DC,我们制作 了 MICI-DC 著录手册,根据 15 个栏位及其 修饰语做语意上的说明,并提供相关范例, 让一般使用者可以自行选择弹性运用,不需 假手他人.
6 XML/Metadata 系统发展实例-Metalogy 系统介绍
或任何主题资料之资料库.它具有利用 DTD 建立资料库,编辑 metadata,编辑权威档(或 索引典),查询(含 Window 介面及 Web 介 面),及转入及转出 XML 记录等功能,此系 统之特色主要有下列数端: a. 系统 schema 依据输入之 DTD 决定. b. 系统允许使用多种不同之 DTD. c. 多种不同格式资料能够同时被检索. d. 允许使用者依据 schema 调整内定之 栏位格式与使用条件. e. 具有亲和的介面让使用者自订超连 结,索引,检索及显示栏位. f. 资料转入与转出能依循所属之 DTD 格式. g. 系统能判定转入之资料是否符合指 定之 DTD 格式,以及执行重复查核. h. 系统能处理栏位式结构,多媒体结 构,与全文. i. 系统包含存取控制(access control), 异动记录(transaction log)等系统管理 功能. j. 提供有 Web 查询功能,可让一般使 用者透过 WWW 查询资料库. Metalogy 系统之架构主要如图一所示.
6.2 系统开发工具及目前已发展出来之功能
XML具有SGML的特性,又不似SGML那麼 复杂; XML 便於在网路上传输,又提供 HTML所没有的弹性及精确性,所以它已成 为网路界及资料库界积极支持的语言.因 此,当ROSS要设计一个metadata 管理系统 时,也决定采用这种语言,做为资料库间交 换资料的主要依据.但是除了语法外,如前 所述,尚有语意的问题,由於目前已发展出 来的metadata 格式相当的多,同时,为了能 表达各类型各主题资料之属性,尚未发展 metadata格式的领域可能还会发展出该领域 的metadata格式,所以一个有弹性的metadata 管理系统,不能只是针对一种metadata 格式 来开发,而应该能让使用单位自己决定要用 那一种格式.所以,开发一个XML/Metadata 的通用性系统正好可以满足这种需求,这也 是Metalogy这个系统最主要的特色.详细设 计理念及架构说明如下:
6.1 Metalogy (version 1.0) 系统特色与架构
Metalogy 是 ROSS 在国科会数位博物馆专案 下 20 , 费 时 一 年 多 所 发 展 出 来 的 XML/Metadata 管理系统,这个系统可以用来 建立数位博物馆,数位图书馆,数位档案馆
Metalogy 所使用之开发工具为 Delphi 5.0, Web Searching 所用之程式语言为 ASP,后端 可用的资料库管理系统为 Oracle 及 SQL server. 目前 Metalogy 已开发出来的功能包括: 1. 载入 DTD,建立资料库 只需要载入任何一种 XML DTD ,即会建 立对应之资料库,并产生编目画面. 2. 定义资料库之 schema 由於 DTD 在宣告上并不具备资料格式, 特殊处理转换,输入长度,所属权威款 目,索引种类等栏位定义,虽然在转入 DTD 时,系统会依照该 DTD 自动产生, 但仍需要人工检视,定义. 3. metadata 编目功能 选择所要编目的资料库后,可以新增, 修改或删除某笔记录.当编辑某一笔记 录时,能依据资料库之 schema,针对某 一栏位提供复制,删除,插入子栏位, 代码,权威控制,与连结多媒体档案等 功能.并可直接呼叫查询画面,让使用 者能快速查检所欲维护之记录.
XML及ISO2709 记录转入/载出
新增,修订或删 除资料
DTD instance
转入/载出XML及 ISO2709权威记录
M etadata查询与 编辑
DTD Normalize
WWW Server
权威档
Metadata资料库
DTD Definition files
全文资料 多媒体资料库
全文资料的标志
图一:Metalogy 系统架构图 4. 索引典建立及权威控制功能 建立索引典或权威档之流程完全同一般 编目资料,系统会自动依据资料库之 schema 执行权威控制. 5. 数位化资料的管理与描述 可对单笔多媒体档案进行简略编目,若 有大批多媒体档案需同时汇入,也可以 采取批次汇入的功能,以节省人工作业. 6. 一般查询功能 可以选择一个(含)以上或所有的资料 库执行,提供精确或模糊查询,同音, 及布林逻辑运算等查询功能. 7. 权威款目参照查询功能 同一般查询功能. 8. 转入 XML 记录 Metalogy 透过 XML 和外界做资料交 换,只要系统存有该 XML DTD,即可接 受该 DTD 之 XML 档,档案内可存一笔 或一笔以上的纪录,但不接受一个 XML 档内有不同 DTD 格式之记录.为避免资 料重复,也可事先设定转入之判断条 件,针对一个(含)以上的栏位,进行 查核的动作. 9. 载出 XML 记录 可以选择系统流水号或依指定的日期来 载出 well-formed 的 XML 档案,以供外 界存取.除了可以在载出时设定相关参 数外,也提供事先设定欲载出或不载出 栏位之功能.此外,透过查询功能来达 到此一目的. 10. 使用者权限控制 提供使用者管理功能,来设定使用者之 基本资料,及其操作权限.登录系统时 需输入使用者代码与密码,完成确认 时,系统会记录此一使用者允许使用之 权限. 11. 讯息管理 指定各错误讯息之说明内容,图示,与 按钮种类.主要目的是提供系统在不须 重新编译的情况下,能够随时依使用者 实际需要修改显示的讯息内容,以避免 部份讯息用语含糊或术语不够专业,造 成使用者误解. 12. Web 查询功能 提供与 Metalogy 系统内部相同之检索功 能.
6.3 Metalogy 操作手册
为了便於使用者利用本系统,我们也制作了 Metalogy 操作手册,以图示法详细说明本系 统的安装,设定,使用及操作方法,相信透 过本手册,使用单位可以不假他人的帮助, 轻易的就能使用自如.
6.4 Metadata 及 DTD 范例
设计数位博物馆/图书馆/档案馆之际,一定 会针对要处理的资料设计 Metadata ,而要使 用 Metalogy , 也 一 定 要 将 Metadata 以 XML/DTD 来表示.由於 Metadata 及 DTD
的订定需要对使用者之资讯需求及所处理的 资讯属性深入了解,也需考虑系统的互通 性,相当费时,最好能使用既有之标准.我 们今年为故宫博物院的数位博物馆计画设计 了几份 Metadata 及 DTD ,包括:书画metadata 及 DTD ,器物metadata 及 DTD ,文献metadata 及 DTD,展览 metadata 及 DTD,参考书目 之 metadata 及 DTD,人名权威档之 metadata 及 DTD,主题权威档之 metadata 及 DTD, 地名索引典之 metadata 及 DTD,时代索引典 之 metadata 及 DTD,同时也有著录手册及著 录范例.
7 结语
7
Metadata 技术是数位图书馆系统的核心,而 XML 是目前 metadata 最普遍采用的语言. Metadata 的格式相当多,如 EAD,GILS, FGDC,MARC,CIMI,TEI,DC 等,尚有 很多格式是根据上述这些格式设计的;此 外,一个机构的资料类型可能有很多种,也 可能会采用多种 metadata 格式,这都是数位 图书馆与传统图书馆不同之处.因此,设计 metadata 管理系统时,不能只针对一种格 式,而应该以 XML 为核心,能兼容并蓄各 种 metadata 格式是比较适当的,Metalogy 就 是在这样的理念下发展出来的系统,目前 Metalogy 是免费的,欢迎各界索取使用,并 回馈意见,做为修正的参考.
注释:
1
2
3
4
5
6
张善政,「国家典藏数位化」,在行政院第九次 电子,资讯与电信策略(SRB)会议资料,台 北市,民 88 年 7 月 5-9 日,行政院科技顾问组 编(台北市:编者,民 88 年),153-182. 黄镇台,「以『人文关怀』为主轴的跨世纪科技 发展」,科学发展月刊 27 卷 7 期 (民 88 年 7 月),715-718. 王美玉,「数位博物馆专案计画成果」, 科学发 展月刊 28 卷 4 期 (民 89 年 4 月),249-253. 国科会「数位博物馆专案」八十九年度徵求主题 计画通告.上网日期:民 88 年 12 月 25 日. World Wide Web: http://www.nsc.gov.tw/announce/89digi_museum. html 国科会 「数位博物馆专案计画」 概况.World Wide Web: http://www.nsc.gov.tw/y2k/dml/880209DATA2.h tml 同上注.
计画简介:「数位博物馆专案推广办公室」.上 网日期:民 89 年 7 月 11 日.World Wide Web: http://mars.csie.ntu.edu.tw/~dlm/plan/1st/intro12. htm 8 国科会数位博物馆计画办公室主题计画介绍.上 网日期:民 89 年 7 月 11 日.World Wide Web: http://dm.ee.ntu.edu.tw/projects.htm 9 同上注. 10 陈雪华,陈昭珍,陈光华,「数位图书馆 博 物馆中诠释资料之理论与实作」,图书馆学刊 13 期 (民 87 年 12 月),37-60. 11 Renato Iannella (1998). Mostly Metadata: A Bit Smarter Technology. Retrieved date from Dec. 25, 1999 from the World Wide Web: http://www.dstc.edu.au/RDU/reports/VALA1998/ 12 陈雪华,图书馆与网路资源(台北市:文华, 民 85 年),页 206. 13 吴政睿,「从电子档案和元资料看未来资料著 录的发展趋势」,在海峡两岸图书馆事业研讨 会论文集,民 86 年 5 月 25-28 日,中国图书馆 学会编,163-174,台北市:编者,民 86. 14 陈昭珍,「电子图书馆资讯组织问题之探讨」, 在海峡两岸图书馆事业研讨会论文集,民 86 年 5 月 25-28 日,中国图书馆学会编,175-196, 台北市:编者,民 86. 15 Lorcan Dempsey (1996). ROADS to Desire. Retrieved date from Dec. 25, 1999 from the World Wide Web: http://hosted.ukoln.ac.uk/mirrored/lis -journals/dli b/dlib/july96/07dempsey.html 16 Renato Iannella and Andrew Waugh (1997). Metadata: Enabling the Internet. Retrieved date from Dec. 25, 1999 from the World Wide Web: http://www.dstc.edu.au/RDU/reports/CAUSE97/ 17 Pamela Drew and Jerry Ying. A Metadata Architecture for Multi-System Interoperability. Retrieved date from Dec. 25, 1999 from the World Wide Web: http://www.nml.org/resources/misc/metadata/proc eedings/drew/metaarch.html 18 Jeff Rothenberg. Metadata to Support Data Quality and Longevity. Retrieved date from Dec. 25, 1999 from the World Wide Web: http://www.nml.org/resources/misc/metadata/roth enberg_paper/ieee.data-quality.html 19 "Z39.50" refers to the International Standard, ISO 23950: "Information Retrieval (Z39.50): Application Service Definition and Protocol Specification", and to ANSI/NISO Z39.50. 20 Metalogy 系统主要发展人员包括:陈昭珍,陈 雪华,陈光华,余显强,陈嵩荣,蔡礼晖,谢 顺宏,欧阳慧.
- 图书借阅管理系统论文 > 数位图书馆与博物馆
-
数位图书馆与博物馆
下载该文档 文档格式:PDF 更新时间:2010-10-08 下载次数:0 点击次数:1文档基本属性 文档语言: 文档格式: pdf 文档作者: Lenovo User 关键词: 主题: 备注: 点击这里显示更多文档属性 经理: 单位: Lenovo (Beijing) Limited 分类: 创建时间: 上次保存者: 修订次数: 编辑时间: 文档创建者: 修订: 加密标识: 幻灯片: 段落数: 字节数: 备注: 演示格式: 上次保存时间:
- 下载地址 (推荐使用迅雷下载地址,速度快,支持断点续传)
- PDF格式下载
- 更多文档...
-
上一篇:领导谈科技
下一篇:分包1:图书馆集成管理系统与硬件设备需求明细与技术要...
点击查看更多关于图书借阅管理系统论文的相关文档
- 您可能感兴趣的
- 小型图书借阅管理系统 图书借阅管理系统er图 图书管理和借阅系统 图书借阅管理系统源码 自助借阅图书系统 图书借阅系统 图书馆图书借阅系统 图书借阅管理制度 图书借阅管理规定
- 大家在找
-
- · 少数民族民歌教案
- · 74ls20pdf
- · 酒店仪态礼仪培训光碟
- · 驾驶证c1科目2视频
- · 无源滤波器设计
- · 宜宾柏溪地图
- · 现代战争3安卓
- · office的书
- · 湿法脱硫效率
- · 结核性脑膜炎脑脊液
- · 西南科技大学土木工程
- · 杨师傅ug分模思路教程
- · 飞机相撞视频
- · 纽卡特行星齿轮减速机
- · 上海本科生找工作难吗
- · 古加尔攻略视频
- · 江西钢材网黄页
- · 天翼华为c8650报价
- · 无投资手工活外发加工
- · 85度c上海店地址
- · 办公设备的使用方法
- · 查大学英语四级成绩
- · 高低液位报警器
- · 南通职业技术学校
- · 2011政法干警考试网
- · 国家计算机二级vb教程
- · 建设工程安全生产条例
- · 机械设计与自动化考研
- · 护士的坐姿和蹲姿
- · 办公自动化的应用
- · 数控加工仿真系统破解版
- · 102.5
- · 儿科临床鉴别诊断
- · 天籁说明书
- · 工程量清单计价论文
- · 腾讯微信下载2011官网
- · 电视剧第八号当铺全集
- · 会计基础知识教材下载
- · 无胆饮水机缺点
- · 再别康桥原文解析
- 赞助商链接