• OCLC推出实验分类服务Classify - [若有所思]

    2008-07-11

    版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明
    http://catwizard.blogbus.com/logs/24553227.html

        OCLC前些日子刚推出了针对LCSH、MeSH、TGM(图形资料叙词表)等的控制词表术语服务(Terminology Services),接着又推出了实验性分类服务(An experimental classification service),这是一项基于WorldCat数据挖掘的原型服务Classify,采用OCLC的FRBR作品集算法,提供作品的DDC、LCC及NLM分类号。
        从Classify检索入口,可以通过ISBN、ISSN、OCLC控制号、UPC(通用产品码)或者作者/题名进行检索。由于很多作品都有不同版本,所以分类号也可能呈现五花八门的情况。
        目前提供的信息有:
    基本信息:题名、作者、体裁、版本、收藏馆数
    分类信息(DDC、LCC、NLM):最常用分类号及收藏馆数,最新分类号及收藏馆数,最新分类法版本、分类号及收藏馆
    分类号分布图:分为所有及DDC、LCC、NLM的分布
    版本详细信息,包括题名、作者、语种、收藏馆数、MARC类名、分类号等

        其中最抢眼的是分类号分布图。同一种书,分类号大多数情况下差别不会太大,于是分类号分布饼图一般情况下就象游戏中那个张着大嘴吃豆子的小家伙。下面特意找了个有很多不同分类号的例子截图




        昨天看到时没觉得这个分类服务有什么用,今天看到David说这是个“快速、简单获取分类号的途径,而无须是OCLC成员”,方才想到原来WorldCat是不显示分类号的。David在一个专业馆工作,在美国很多小馆无钱参加OCLC,而查LC的命中率又不够高,如同我当初,千方百计、削尖脑袋找免费的数据来源。
        Classify提供最新分类号、分类法版本也是挺有用的,因为有可能反映了分类法的更新,常常新分类号更接近最新理解。看了几个例子,或许都不是医学方面的,没有见到NLM号。

       不管“有用”、“没用”,可以看到OCLC在如Lorcan Dempsey所说的那样,不断地"make data work hard"。难怪OCLC尽管属于图书馆行业,却已连续三年名列《计算机世界》最佳IT工作单位(Computerworld's Best Places to Work in IT),并且排名从2007的第86位上升到了2008的第51位。

       另:在WorldCat.org查上图中的书“Stilwell and the American experience in China, 1911-45”,共14条,而且首条只显示10版本(而不是上图的15),可见WorldCat.org“版本”部分的FRBR化做得还不到家──10版本中没有包括检出的几个中文译本,即《史迪威与美国在中国的经验》《史迪威与美国在华经验》《蔣介石的外國高級參謀長 史迪威》。

    参见:
    Class numbers on works (July 09, 2008) from Lorcan Dempsey's weblog
    Classify from OCLC (July 10, 2008) from Catalogablog


    收藏到:Del.icio.us




    引用地址:

    评论

  • 关于编码的事谊我已请冠景的老师测试了,结果有待证实,另外我还有一事请教您,是这样的,我们是一家图书出版公司,现正在筹措给图书馆做西文编目,并也有了一定的客户源,但因西文数据中的关键词和分类比较难给,并且也没有工具书,因此冒昧的问您一句,可否请您有偿的给我司制作full-marc,或者您给把把关也行?不过您也知道现在图书馆加工marc数据已开始竞争了,而且非常的激烈,我们不仅想在质量上也想在价格上都具有竞争实力。如果能有您的指导和帮助,那我们就更有信心和把握了!
    cat wizard回复陈雪飞说:
    争取能早点退休,再加盟贵公司吧:)
    2008-08-11 16:52:53
  • 您好,收到您的回信,十分感激,我是这一行的新手,以后如遇到问题还希望能够得到您的指教,也希望不会给您带来太多的麻烦,先再此谢过!
  • 燃眉之急^
    是这样的,有一家国外的图书馆,我现在在给他做marc,它们馆用的是UTF-8编码,我用的软件是冠景的编目软件,导出数据时也是用的UTF-8的编码,而且,也有几家图书已经有业务来往了,但此家图书馆回复说其它字段没有问题,只有显示汉字的字段乱码。请问您问题究竟出在了哪里呀?如能赐教,不胜感激!!!
    cat wizard回复陈雪飞说:
    主题词一般用LCSH的比较多,如果没有印刷版的,可以用LC的规范档,选择主题途径查就可以了(authorities.loc.gov)。分类法一般会是DDC,没有印刷版的话,网上也没有免费的电子详版。只能参照类似图书给号。
    对MARC的编码不了解,只知道在头标中有一个字符位是表示编码的。我想这个问题还是应该问冠景公司。
    2008-08-07 20:45:07
  • 您好,看了您关于marc介绍的文章,我真是受益良多,我本身也是做西文编目的,但也只是刚刚入行,我主要是用西文的编目规则做中文学术类的图书,因为没有系统的学过西文编目,所以只是自学的知识了一些皮毛,但对于图外图书馆的主题关键词和分类就无从入手了,还望您以后能多发表一些关于此类的信息,和途径。十分感激!

发表评论

您将收到博主的回复邮件
记住我