-
2009-04-27
OCLC的云计算图书馆自动化系统 - [若有所思]
前两天在看OCLC报告——联机目录:用户和馆员需要什么,等写完博回过头来看积存下来的RSS订阅,才发现错过了更火爆的消息:OCLC announces strategy to move library management services to Web scale——OCLC于23日宣布将把WorldCat Local由OPAC前端变成完整的图书馆自动化系统(ILS)。
该产品被称为“Web级管理服务”(Web-scale management services),被认为超越了软件即服务(SaaS),即不只是硬件、软件,还包括数据与服务:Web级的流通与传递、Web级的印刷本与电子采访,Web级的许可管理,Web级的自助配置,Web级的工作流程,Web级的合作情报(Intelligence)。
目前由FirstSearch订阅WorldCat的图书馆将免费得到WorldCat Local的快速启动(quick start)服务:OCLC announces "quick start" version of the OCLC WorldCat Local service,在2009年7月开始以WorldCat.org作为OCLC FirstSearch的用户界面,集成电子书刊等的检索。2009年5-6月将宣布Web级管理服务的测试/试验参与机构及咨询委员会。
关于此事的影响及意义等,可参看Ted的“OCLC 終於宣示跨足 ILS 市場”()和Keven的“OCLC进攻地球,你是拥抱还是战斗?”。接下来各方肯定会有反响,先八卦一下消息公布前两天博客方面的情况。
负责此事的Andrew Pace,在北卡州立大学率先以Endeca更新OPAC、开启了OPAC变脸风潮,之后不久跳槽至OCLC,现任OCLC网络图书馆服务执行主任。他在描述此事的博文中兴奋异常:And now for something completely different,说到此事已经忙了15个月了。终于真正不为猪抹口红了!
OCLC之外,当天就在博客上发布此消息的,大概数英国Huddersfield大学的David Pattern。这位热衷于给OPAC化妆的技客,在博文"OCLC to launch web based ILS"提供了一个Twitter截屏,看来消息来自Marshall Breeding——正酝酿头条新闻,润色中(Big news brewing. Stay tuned.)。博文发布时,Marshall的文章尚未上线。可继续关注Marshall Breeding的Twitter。
最早正式而全面的评论,就是Marshall Breeding在Library Journal上发表的In Challenge to ILS Industry, OCLC Extends WorldCat Local To Launch New Library System,文中特别提到对传统ILS及其产业的挑战。这位图书馆自动化领域的专家,每年愚人节在LJ发布年度市场总结(最新版:Investing in The Future: Automation Marketplace 2009)。经营的Library Technology Guides网站,集成图书馆自动化领域的各种信息。
如此大事,业界肯定不平静。社会化编目网站LibraryThing创立者Tim Spalding一天二博,首博表明OCLC此事做对,并继续表达对OCLC垄断MARC数据的不满(The OCLC End Game),二博报道各方反应(OCLC news reactions),仍关注OCLC的书目数据政策——毕竟这也是OCLC未来系统赖以展开的基础。
LJ继续发表Josh Hadro文章Tough Questions Emerge on OCLC's Competitive Advantage and Data Policies,引述了各方反应,如Ex Libris北美经理Carl Grant,矛头直指OCLC的数据政策。
Carl Grant认为该系统主要对中小型机构有吸引力,这未免太乐观了,这也绝不是OCLC的目标。WorldCat Local于2007年4月宣布,5月即试水华盛顿大学,而加州大学也已于2008年加入,这都不是中小型图书馆吧?曾在“编目的未来”一文中总结编目发展的四大趋势,其中之一为联合目录本地化——按目前的术语就是本地目录云计算化了。
接下来,继续关注OCLC。一年前OCLC的WorldCat及元数据服务的副总裁Karen Calhoun曾提及OCLC的下一代编目试验,称将在2009财政年度发布Next Generation Cataloging(Traveling Through Transitions: From Surviving to Thriving),应该也快了吧?
参见:
OPAC改朝换代由此开始 (2006-01-16)
WorldCat Local:取代本地OPAC?(2007-04-16)重要背景:
OCLC的书目数据政策:Policy for Use and Transfer of WorldCat® Records
关于此事的讨论维基:OCLC Policy Change
圖書館觀點:關於「WorldCat書目記錄使用及轉出政策」
数图研究笔记:到达彼岸(Getting There译文 / Diane I. Hillmann)之“风险与机会”部分 -
2009-04-25
OCLC报告——联机目录:用户和馆员需要什么 - [若有所思]
Online Catalogs: What Users and Librarians Want : An OCLC Report / Principal contributors, Karen Calhoun ... [et al.]. Dublin, Ohio : OCLC Online Computer Library Center, Inc., c2009. 58p. ISBN: 1-55653-411-6 (PDF下载)
OCLC又发布了新的报告《联机目录:用户和馆员需要什么》。报告由主管WorldCat及元数据服务的副总裁Karen Calhoun领衔,基于对WorldCat用户的三个调查,以不同用户(最终用户与图书馆员)对目录数据质量的认识作为调查重点,并以此得出改善目录数据的建议。
三个调查:
1、焦点小组(focus group) (p5):针对WorldCat.org,调查时间2008/5
· 分3个小组、每组8人,分别是:18-24岁大学生组、25-59岁偶而检索者组、学者组(教员及研究生)
· 执行三个任务(p.7):1)自己设计问题进行检索;2)指定图书检索;3)针对其兴趣或专业检索
· 通过软件,抓取用户使用数据及标记信息(正面、负面及评论),并在检索结束后进行讨论。
从用户样本看,比较偏向文科,在说明的职业(偶而检索组)或学科(学者组)中,只有一个来自计算机科学属于理科。
2、WorldCat.org弹出窗口调查(p7):调查时间2008/5/12-7/9
· 封闭式问题25题、开放式问题1题。共收到回复11,152,回收率4%
· 纳入统计分析的非馆员用户占68%,共7583人
推算下来,在此期间用户点击详细记录的次数近28万;而我好象参加过一次调查,应该也在排除之列了。
3、图书馆调查(p9):调查时间2008/9/10-11/30
· 面向以不同界面使用WorldCat的馆员,包括WorldCat.org、FirstSearch、Connexion和Z39.50(主要编目员用)及WorldCat Resource Sharing(馆际互借员工用)
· 收到1,397个回复,分别任职馆长、公共服务/参考咨询、编目、采访及馆际互借。
报告照例以数据说话,有很多图表。调查结果将用户对目录的要求分成两大方面,即传递(delivery)与发现(discovery),这也是OCLC副总裁Lorcan Dempsey一直以来对目录功能的区分。
调查结果:
用户对数据质量的要求(p11)
· 直接链接到联机内容
· 评价性内容,如文摘、目次和片断
· 相关检索结果
· 馆藏可得性信息(是否可得、如何获得)
· 简单关键词检索,附高级检索选项
馆员对数据质量的要求(p23)
· 合并重复记录
· 更正拼写错误
· 升级简单记录
· 评价性内容,如目次、文摘及封面
馆员与最终用户认识异同(p39)
馆员总以为自己是代表最终用户利益的,但由于两者使用联机目录的目的并不一致,因而认识有差异也是可以想见的。下面右侧是其中的一个对比表(p44):
结论有“元数据与内容”部分,提到用户强化需求中选择了“主题信息”,并不意味着他们需要更多的受控主题标目,而是指标准目录描述中没有的主题丰富的数据元素。受控主题词有多方面的用处:作为索引词,支持多语种主题检索,限定或扩检的分面,浏览,链接到分类法或其他术语表,决定相关排序的因素。为支持这些特性,现在的目录依赖劳动密集性工作产生受控主题标目。此种传统方法不具有可持续性,需要寻找更经济的手段,一如受控主题词表那样便利最终用户。(p52)
后半段的陈述不能视为调查结果,而是作者的观点,即承认受控主题的优点,但尚未找到可替代的方法。由于本报告针对的是联合目录,其结论并不一定完全适合一般图书馆的联机目录(OPAC),但肯定有很多共通的部分。
Via Lorcan Dempsey's weblog: QOTD: library catalogs and users (April 21, 2009)
关于信息查找行为的参考文献(p2):
Bates, Marcia J., "Improving user access to library catalog and portal information: final report," prepared for the Library of Congress, 2003.
含信息寻找文献评价
Case, Donald O., Looking for information: a survey of research on information seeking, needs, and behavior (San Diego CA: Academic Press, 2002)
作者在书中指书(p6),许多研究关注信息源(如图书或报纸)与系统(如目录),而不关注信息用户的需要、动机与行为。
Foster, Nancy Fried, and Susan Gibbons, “Understanding faculty to improve content recruitment for institutional repositories”, D-Lib Magazine 11 (1) (2005)
本文首先将可用性专家的“工作实践”(work practice)方法应用于图书馆问题,研究教员的研究工作实践以识别学者可能如何使用机构库。 -
2009-04-22
充满娱乐性的世界数字图书馆 - [乱花迷眼]
世界数字图书馆(World Digital Library)昨日开张,之前之后看到的公开报道满是溢美之词。首页的地图展示内容、时间标尺限定内容,确实比较出彩。只是盛名之下,内容实在少得可怜——1170项。
就目前来看,WDL充其量不过是个展示馆,可以看着玩玩,却不是实用的数字图书馆。如中国国家图书馆放上了镇馆之宝,《四库全书》提供在线浏览(含单页下载),《永乐大典》还另外提供PDF文件下载,看着是大手笔,实际内容不过是极少部分:在“物理描述”中《四库全书》标明五卷,结果似乎只有四卷,《永乐大典》如标明的为一卷。更说明其玩乐性质的是,无论在标题还是描述中,都没有说明所提供的是哪(些)卷册,需要看到图像才能了解。相比之下,日本国会图书馆提供的《源氏物语》倒标明了卷册。
倡议者美国国会图书馆(LC)提供了最多内容,共505项,涉及中国的有21项,比如多件纳西象形文字。另《耕織圖》除可以在线浏览及PDF下载外,还有介绍视频,也是娱乐性的一部分吧。
可以肯定,直接上参与机构的网站,获取的内容无疑会丰富得多。比如LC提供的505项与其网站上数以百万计的数字资源相比,几乎可以忽略不计。
附:WDL元数据(不含数字对象部分)
标题
描述
编纂人(链接浏览)
创建日期
出版地(不知道为什么标注皇帝纪年,如:朱棣(明成祖,永乐皇帝), 南京)
语言(链接浏览)
地点(多级链接浏览)
非洲
中亚与南亚
东亚
欧洲
拉丁美洲与加勒比海
中东与北非
北美
大洋洲与太平洋
东南亚
南极洲
世界
时间(时间段链接浏览;首页下部有时间尺标)
8000 公元前 - 499 公元
500 公元 - 1499 公元(1000年)
1500 公元 - 1699 公元(500年)
1700 公元 - 1799 公元(200年)
1800 公元 - 1849 公元(50年)
1850 公元 - 1899 公元(50年)
1900 公元 - 1949 公元(50年)
1950 公元 - 2009 公元
专题(多级链接浏览)
哲学 & 心理学
宗教
社会科学
语言
自然科学 & 数学
应用技术
艺术; 美术 & 装饰艺术
文学 & 修辞
历史 & 地理
其他关键字(链接浏览)
条目类型(链接浏览):图书、期刊、原稿、地图、影片、版画与照片、录音制品
物理描述
机构(收藏机构;链接浏览)
从网页上看到的WDL元数据相当简单;时间取值是很粗放的年代段,主题(专题)取值也是用于格式化浏览的;也没有采用XML格式。 -
2009-04-20
YouTube上的国家图书馆 & LC的“创收” - [大千世界]
本月7日,美国国会图书馆(LC)开通了它在YouTube上的频道。LC博客上报道此事的博文标题是"YouTube, and Now We Do Too",可见在YouTube上开频道的图书馆已有不少。OCLC副总裁Lorcan Dempsey链接了其中的国家图书馆(National libraries on YouTube) ,计有:
* The European Library(http://www.youtube.com/user/theeuropeanlibrary)
* The National Library Board of Singapore(http://www.youtube.com/user/NationalLibraryBoard)
* The National Library of Wales(http://www.youtube.com/user/llyfrgen)
* The National library of NZ(http://www.youtube.com/user/NationalLibraryNZ)
* The National Library of Scotland(http://www.youtube.com/user/NLofScotland)
* The Library of Congress (http://www.youtube.com/user/LibraryOfCongress)
不知道是不是按开设时间为序排列的?
来自英国的Dempsey还着重介绍了苏格兰国家图书馆(NLS)。从资料看,NLS早在2007年就开始在YouTube中上载自己的视频,作为展示自己的窗口(shop window),树立自己的视频资料品牌"Scottish Screen Archive"。
像任何机构一样,图书馆使用YouTube或Flickr这样的网站,目的都是自我推广。LC自称掌管着世界最大的音像资料库,有六百万电影、广播及录音资料。首次在YouTube上提供的70件视频,肯定是经过精挑细选的,今后也会像LC的Flickr项目一样,逐步增加内容。目前YouTube被GFW挡住,不容易看到,可以到LC网站的“美国记忆”搜索,入口:http://memory.loc.gov/。比如那个一百多年前的无声喷嚏,7秒钟,YouTube上会有什么评论?
一直觉得LC开放做得好,但也不忘“创收”。免费观看、任意下载的都是一般像素的,随便看看也就可以了,但如果需要高清晰度的,就得掏钱,当然前提是版权允许。比如视频资料,提供复制(Obtaining Copies of American Memory Film Collection Materials),根据载体格式,价格从30分钟$60左右到120分钟$250,加急另收50%左右。另外,它庞大的图片库也提供复制(Miscellaneous Items in High Demand - Obtaining Copies),黑白、彩色(Photographic Services) 、数字(Digital Imaging Services),打印、负片、文件复制,提供品种不少,$22起价,也着实不便宜。
关于苏格兰国家图书馆与YouTube,参见:
YouTube and the National Library of Scotland (WIDWISAWN, v.6, no.1, p.4/6; ISSN 1478-8055)
着重讨论与NLS利用YouTube相关的元数据、管理、版权问题并分享其经验。
There's no Place like Home? YouTube and the National Library of Scotland (PPT)
Outlines an NLS pilot project with video sharing site YouTube and associated metadata issues. Part of the Cataloguing and Indexing Group in Scotland (CIGS) seminar "Toto, I've got a feeling we're not in Kansas anymore": metadata issues and Web2.0 services.
上文所依据的会议PPT,第8页有YouTube可编辑元数据图示
关于LC的数字化图片,参见:
不仅仅是第100万张数字化图片上网 (2005-12-01)
Flickr上的美国国会图书馆珍藏集 (2008-01-18)
想访问YouTube?可参考:
解锁你的YouTube (April 18, 2009) -
2009-04-15
乱谈图书馆自动化系统 - [敝帚自珍]
前些日子看到有个老外讲起图书馆自动化系统(ILS),把Innovative (III) 的Millennium归入“外包”的系统,初看有点出乎意料,转而想想也有点道理。当年选系统的时候,自动化部特别希望买这个系统,理由是系统由公司远程管理,有问题只要找公司解决就行,自己不用管,省心。“省心”也是有代价的,那就是连系统日志都看不到。某次发现系统中有一批记录更新出问题,想找出谁做的,向公司提出请求,正遇上圣诞假期,过后没及时催,紧接着学校放假,等开学了再找公司,时间已过,信息已经查不到了。
不管什么系统,无论系统理员是不是省心,使用的部门一样会头大。有人说Google聪明,上线几年的应用,仍然挂着beta,摆明出错是正常的,试用版嘛。当然Google是免费的,出错可以原谅。但事实上花费不菲买来的商业ILS,每次升级也会出现各种各样的问题,大概也是正常的(要不为什么某使用 Horizon的图书馆轻易不愿升级),并且也不得不“原谅”。不过,像III这样,每年收大把的维护费,要做些维护的事,比如使用培训,比如重新做一次索引,还要另外收费,就很不可思议了。
最不可原谅的,是Millennium系统的汉字是永远的alpha版,这么多年没什么长进(或者因转到Unicode而更糟?),永远不清楚即将进入系统的字会变成什么模样——虽然问题字符应该不到1%,也足够让人头痛。2000年在HKIEd,她们就在很认真地抓同一个汉字进入系统呈现不一样代码而查不到的问题。后来香港用户协会一同做这件事,向公司提供了字符对应表──本来应该是公司做的事,竟然由用户承担,只能说是“骑虎难下”。不知道香港有了字符对应表,问题是否彻底解决。大陆地区从GB/GBK对应到 CCCII/EACC(现在是Unicode),用不上香港的表,用户又各自为阵,据说某馆竟然有十个人处理乱码问题。按一般逻辑,买来的系统应该是可用的,保证进入系统的字符正确理所应当,并且每年还在付维护费,如果已经进入系统的字符出问题,公司负责改正也是理所应当──不幸事实却是,由于码表不全、字符对应错误,进入系统字符出错是每天都在发生的事,需要用户发现后逐个向公司提出,并且同一个字符更改正确后,保不准过些日子又出问题;而所有已经进入系统的乱码都要用户自己来改。竟然有如此痛苦的“外包”!
曾经看到国外对多家图书馆自动化系统的用户调查,对Millennium的满意程度相当高,公司显然也很是引以为傲的。近些年有Geek对ILS公司不满, 在于公司不开放接口让用户开发自己的应用,从把Millennium看作外包来看,Millennium本来就是适用傻瓜型系统管理的(似乎是目前唯一一家不开放的大ILS公司),用户方面大概也很少自主开发的要求,因此就很满意?如果在中国做ILS调查,不知道结果会怎样。
认真想一想,虽然是用户调查,还真不知道调查表是什么人填的,馆长?系统部?业务部门?最终用户?恐怕结果会大相径庭的。同样地,图书馆打算更新系统前, 向谁了解系统情况?也是需要认真考虑的。一个完整的ILS,有很多的模块与功能,对各系统的功能与操作流程的综合平衡,才是最终决定因素(撇开价格因 素)。在各系统大多数功能相似的情况下,有时候,某个功能特别强大,会成为最终决定时很重要的砝码,但也不要忘了,如果某个功能特别弱,也是会被断然抛弃的。
前面说撇开价格因素,其实价格是开始圈定候选系统时首先考虑的因素。在设定价格范围内开始考察系统时,入选公司会向你展示最完美的系统,当觉得满意而有意向后,或许会“不经意中发现”,某些演示的功能没有包含在基本价格中──大价钱都已经接受了,再附加一点也可以承受吧,最终价格可能会因此悄悄地上调不少。十多年前我们选系统时,OPAC还不是一个受人关注的部分,好象没有什么人考虑读者如何使用,只考虑本部门要用的功能能否方便地实现。现在大家观念不同了,所以学网上有人说,可以上网去测试。只是一般人可能不知道实现同样的功能,在某些系统是含在基本价格中的,而有些系统则另有代价,比如显示封面图片,比如提供外部相关链接,比如2.0的OPAC界面。[update] 2009-6-3 经多次努力,本馆Millennium字符问题终获解决。









