-
OCLC的新一代编目产品 - [若有所思]
2008-06-23
OCLC副总裁Lorcan Dempsey是LC书目控制未来工作组成员,但在工作组长达一年多的活动期间,他几乎没有在自己博客上谈论过小组内情。即使在报告发布以后,好象他也没有在博客上发表过自己的意见,印象中只提供过一个OCLC对报告意见的链接。但在小组的报告草案于2007-11-30发布不久,OCLC立刻在网站上挂出了一个名为“新一代编目”(Next Generation Cataloging)的试验计划(DC.Date.Created=2007-12-11),其中引用了报告草案的建议。
这个新一代编目试点项目,就是抓取来自出版社的ONIX数据并对质量加以强化,以及早加入WorldCat。显然项目的结果是,OCLC将由用户贡献数据的分销商转而成为原始数据供应商──OCLC将此项目归在试验中的产品(ProductWorks),顺便可以看看OCLC琳琅满目的试验中产品。
项目运作过程:
· 合作出版社/供应商(Ingram图书集团、Hachette图书集团、普林斯顿大学出版社、Taylor and Francis)提供ONIX格式的信息。OCLC将数据转换为MARC格式加入WorldCat,并尽可能通过数据挖掘与数据映射的方式自动强化数据。强化后的元数据以ONIX格式返回给出版社/供应商,以对OCLC的强化作出评估。
· 合作图书馆(芝加哥公共图书馆、凤凰城公共图书馆、MIT图书馆、俄亥俄州立大学图书馆)评价通过上述过程加入到WorldCat中元数据的质量,反馈其用于图书馆技术服务流程的适应性。
据OCLC负责WorldCat与元数据服务的副总裁Karen Calhoun在不久前举行的“编目未来”会议(The Future of Cataloging: a PALINET Symposium, 29 May 2008)所作主旨发言“转变之旅:从苟延残喘到蓬勃发展”(Traveling Through Transitions: From Surviving to Thriving,PPT),试验计划将于本月结束,目标是在2009财政年度正式发布(p.46)。
在即将举行的ALA的2008年会上,6月29日将会有一场名为“OCLC编目新方向”(New Directions in Cataloging at OCLC)的专场,介绍新一代编目项目的试验结果。再顺便看一看OCLC在年会上排得满满的四天活动日程,Big O真是牛得让人无话可说。 -
分面OPAC使用统计及其他 - [若有所思]
2008-04-10
分面OPAC的哪类分面最受欢迎?这是BiblioCommons的产品经理Steve Toub在NGC4LIB邮件组提出的问题。他提供了看到的两家OPAC数据,还希望得到更多数据。看两个链接,很有收获。
[1] 美国北卡罗莱纳州立大学:A New Kind of Catalog / Charley Pennell(NCSU首席元数据编目员)
(slides 53-55)
一个关于OPAC的非常好的PPT,综合分析介绍了NCSU新版OPAC出现前后的环境,内容丰富。NCSU新版OPAC在2006年1月发布,曾轰动一时。本PPT还提供了很多NCSU新旧版OPAC的测试对比数据,分析也相当中肯。可用性测试在美国真的很普遍了?
slide 49: 可用性测试-任务困难度对比,四个等级:容易(43->59%),中等(12->12%),困难(22->7%),失败(23->22%)。觉得容易的比例增加、觉得困难的比例减少,应在意料之中,作者指出有意思的是觉得中等和失败的比例几乎未变。
slide 50: 可用性测试-任务持续时间,测试10项成功完成的任务,其中仅有1项新版比旧版用时长。平均用时:1:34->1:00,还真节约了不少时间。
slide 51: 使用统计-按字段,依次是关键词(缺省)、ISBN、题名、作者、主题、多字段。[缺省的关键词遥遥领先意料之中,ISBN居然多于题名、作者似乎有点不可思议]
slide 52: 新鲜劲儿过了?(Newness wearing off?) 2006/3-5及2006/7-2007/1二个时间段,搜索(51->67%),导航(21->8%),先搜索后导航(29->25%)。搜索比例明显上升[导航应该只是辅助]。
slide 53: 导航方向(2006/7-2007/1):主题-论题(26%),LCC (21%),载体(10%),馆藏地(105),主题-体裁(6%),作者(6%),主题-地域(4%),语种(3%),主题-时代(2%),可得性(2%) [LCC在NCSU新版目录中占据屏幕上部一整块显著位置。据slide 55,在用户界面最前面的是可得性]
[2] 澳大利亚塔斯马尼亚州图书馆(State Library of Tasmania)
All for naught - using existing bibliographic data to deliver modern search tools / Lloyd Sokvitne, Jan Lavelle, Carmel Denholm (图5)
看上去很悲观的题名:“全部化为乌有:利用现有的书目数据提供现代化的检索工具”。文摘:“2006年,SLT着手开发一个分面目录以取代其传统OPAC。显然,提供哪些分面,与传统书目数据库数据的质量与可获得性密切相关。这些数据反映多年来内外编目政策的变化,SLT发现必须对数据做广泛的更正、修改、操作并创建一系列的数据,以提供所需的分面。本文详述这些过程的细节。”
这是一篇详述用现有MARC数据制设计新型OPAC过程的会议论文,并有使用数据,附件1是分面与MARC的对照表,附件2是载体表,还有参考文献。本文对有意设计与使用新型OPAC的业界人士会很有参考意义(会议:VALA2008)。
使用统计部分:
p15图5:分面使用统计,依次是:载体(近40%,一枝独秀;以下列出的在10-5%之间)、论题、读者对象、小说/非小说、作者、体裁、馆藏地、丛编、可得性等。
p16图6:检索词类型,依次是作者(<40%)、题名(>35%)、主题(20-25%)、载体(约2%)、体裁(约2%)。
p16图7:反馈:在易用性、功能、设计三方面正面评价均高于负面评价。负面评价最高的是功能(>10%)──相当大的比例是要求提供更多功能!
或许因为二者一个是大学馆,一个是公共馆,读者类型差异,因而统计数据差别相当大。因为是孤例,也不知道是不是典型。或许这也就是Steve Toub想要获取更多数据的原因吧。
对于新型OPAC设计来说,或许应当将检索途径、分面类型等的用户界面作为可定制的项目,以适应不同类型图书馆的需求。
关于NCSU新版OPAC,参见:OPAC改朝换代由此开始 (2006-01-16)
关于BiblioCommons,一家神秘的加拿大公司。网站只有一页,声称因公司太忙而无暇顾及,对产品也是语焉不详──似乎是在开发一个社会化的OPAC。网页下面是几个名人的评论及链接,Jon Udell (Infoworld, LibraryLookup作者), Mike Cunningham (Ex Libris), K.G. Schnieder (Free Range Librarian),对其产品演示评价极高。通过Google查到的,也是一片好评。
K.G. Schnieder的评论:“第一个真正社会化的联机目录。当你看到bibliocommons,你意识到象WorldCat Local和primo本质上是1.0技术,给OPAC加上标签解决不了问题。” -
LCCN永久链接服务 - [若有所思]
2008-02-15
书蠹精已经报道,我也从同样来源得到消息:美国国会图书馆提供LCCN永久链接服务。通过每条LC书目记录都有的LCCN号,可以直接链接到该记录──一个独立的网页。以后还将增加通过规范记录的LCCN号链接到规范记录的功能。
基本句法:http://lccn.loc.gov/[LCCN]
如:http://lccn.loc.gov/2003556443
http://lccn.loc.gov/mm78044693(3位前缀中的空格去掉)
如果要显示MARCXML、MODS或DC格式,则在基本句法中后附限定词,分别是:
http://lccn.loc.gov/[LCCN]/marcxml
http://lccn.loc.gov/[LCCN]/mods
http://lccn.loc.gov/[LCCN]/dc
上月看“LC书目记录转换工具”的时候,琢磨其句法还很费了一番功夫,可作对比:
http://lcweb2.loc.gov:8081/diglib/admin/test/sru.xml?stdID=[LCCN/ISBN/ISSN]&stylesheet=[样式表名称]
作为一个检索工具(Search LC Catalog by Standard ID),多了ISBN/ISSN的途径,显示格式也更多些。
LCCN永久链接服务的作用?据其FAQ:
1、LCCN永久链接是LC联机目录中书目记录的永久URL,使用LC赋予书目与规范记录的识别号──LCCN构造链接。
2、LCCN永久链接提供一种引用与链接LC联机目录中书目记录的简单途径,可在……电子邮件、博客、数据库、网页、数字文档等中使用。
OCLC早已在WorldCat.org的图书记录页面加上了自己的链接,用的也是自己的控制号。句法:http://worldcat.org/oclc/[OCLC号]
再早,LibraryThing也可用类似的方法提供链接。记得当时还有一位博主在与网友讨论推荐图书的时候选用哪个链接的问题。
LC的加入,意味着大家又多了一个选择。只是目前可以从永久链接页面链接到LC联机目录看馆藏情况,但联机目录中还没有显示这个永久链接──对一般用户使用还是个障碍。
via MARC Forum:
New LC Permalink Service in production / Ardie Bausenbach (Thu, 14 Feb 2008)
参见:
书蠹精:美国国会图书馆宣布永久LCCN号链接
Library of Congress: LCCN Permalink Frequently Asked Questions
LC书目记录转换工具 (2008-01-23) -
LC书目记录转换工具 - [若有所思]
2008-01-23
远洋留言,介绍OCLC的xISBN和LC的书目记录转换工具。xISBN以前关注过,LC的这个工具却是闻所未闻:
Search LC Catalog by Standard ID
http://lcweb2.loc.gov/diglib/tools/html/searchStdNum.html
输入LC控制号(LCCN)、ISBN或ISSN,选择格式,即可返回相应格式的书目信息,繁简各不相同:
[owc] OpenWorldCat View (OCLC的Open WorldCat显示格式)
[marctags] MARC Tags View (MARC字段名格式)
[english] English Tags View (MARC文字说明格式)
[ser2dig] Ser2Dig MiniBib View (不明,似乎是LC所用Voyager系统的馆员用表格形式)
[srwdc] SRW Dublin Core XML Record (SRW DC XML记录)
[mods] MODS XML Record (MODS XML记录)
[none] SRU Result Set with MARC XML Record (MARC XML记录的SRU结果集,这种格式可以是多记录的)
[rss] RSS View (RSS格式,最简单的信息加链接,这种格式可以是多记录的)
[mods2rdf] RDF MODS XML Record (SIMILE version) (RDF格式的MODS记录,SIMILE版)
逐一试过,看来它是用不同的样式表来显示不同的格式(上段方括号中即样式表名称),基本句法是:
http://lcweb2.loc.gov:8081/diglib/admin/test/sru.xml?stdID=[LCCN/ISBN/ISSN]&stylesheet=[样式表名称]
(在没有样式表名称,或样式表名称有误时,显示[none]格式)
如“Information circular”一书的RSS格式(此书较旧,没有ISBN,用其LCCN号86655102):
http://lcweb2.loc.gov:8081/diglib/admin/test/sru.xml?stdID=86655102&stylesheet=rss
这应该是一种Web服务了,可以适应不同的格式要求。看URL,试验中,也没查到有关该工具的说明信息。未来会开放到什么程度?
远洋2007/11听LC书目控制未来工作组报告,第一感想是“Users不光是人,还有applications”。这就是LC面向机器用户的一个试验吧。
不过,编目员也是可用的,在没有Z39.50客户端的时候,此法查书目比用LC联机目录速度会快很多,只不知道数据是不是完整。
附:
远洋留言(发表于2008-01-23 01:08:47)
Thought you would be interested to know another tool:
It is a record conversion tool that have been developed at LC. : http://lcweb2.loc.gov/diglib/tools/html/searchStdNum.html
By typing an ISBN you would be able to see several formats for the item, including all popular ones related to MARC and MODS, as well as DC, RSS, RDF/MODS, etc.
Hope you can access it.
SIMILE: Semantic Interoperability of Metadata and Information in unLike Environments
http://simile.mit.edu/
SIMILE is focused on developing robust, open source tools that empower users to access, manage, visualize and reuse digital assets. Learn more about the SIMILE project. -
ONIX记录数据库及Onix/UNIMARC对照表
2007-02-09
加州数字图书馆的 Roy Tennant 收集了10万多条出版社下载的ONIX记录,做了一个检索系统,提供题名、介绍、出版者和ISBN四个检索途径。
检索结果除了简单的书目信息,一般还有目次与内容简介。当然最令人感兴趣的是它的 raw record,也就是ONIX记录。
曾经在LC的MARC标准主页见过ONIX/MARC21对照表,所以识得ONIX的字段,但没有见过ONIX记录。就好象见过MARC手册,没见过2709格式。以前没有刻意找过,如今真是得来全不费功夫。在 Roy's Prototype Space——ONIX Records for Libraries,除了上述检索系统,还有相关出版社ONIX记录样本,以及各出版社的获取记录方法页面链接。有鱼还有渔,真是不错。
想到去ONIX主页逛逛,发现有“ONIX mappings to MARC”,MARC21对照表不但有LC版,还有OCLC的 Bob Pearson 版。尤其令人感兴趣的是还有UNIMARC对照表——ONIX / UNIMARC Mapping 由不列颠图书馆 Alan Danskin 制作。
点击链接后才发现高兴太早,因为链去的BIC主页改版,对照表踪影全无。Google了一圈,全都只有链接,没有找到原文。或许要想法联系作者,才能得到那个Onix/UNIMARC对照表了。关于ONIX:
The ONIX for Books Product Information Message is the international standard for representing and communicating book industry product information in electronic form.
Latest general release: Release 2.1 (revision 02)
For users in most countries, the current release is Release 2.1 revision 02, published in 2004, with some minor revisions to documentation in February 2005.via: Catalogablog (2007-2-8)
ONIX Resource http://catalogablog.blogspot.com/2007/02/onix-resource.html







