e-mail
  •     前一阵用CNKI的《中国引文数据库,感觉不错。看到本馆试用维普的《中国科学指标数据库(CSI),赶紧试试,也可对照感受一下。

    三个模块:
    排名分析:学者、机构、地区、期刊
    学科评估:学科排名、学科基线、研究前沿
    顶尖论文:高被引论文、热点论文

    学者排名:“展示各学科核心研究成员及其研究成果,提供各学科学者的科学指标查询”。可按学科、作者、机构、地区选择或检索查看,再按发文量、被引量、篇均被引值排序。

        选择学科“图书馆情报学”,缺省按被引量排序,改按篇均被引值排序,结果发现“郑州大学”的“程焕文”只发了1篇文章,就被引110次,真是太牛了(点击该文,显示被引量为108次,二者竟然不一致)。
        点击看“顶尖论文”,含意不明,比如图书馆情报学被引量排名第一的张晓林,顶尖论文4篇,被引量从81到21不等;而排第三的范并思,顶尖论文12篇,被引量从146到2不等。差别也太大了。
        点击看“趋势图”,更有意思了,不是逐年、而是交叉的5年时间段,显示发文量、被引量、篇均被引值的柱形图。

    期刊排名:选择学科,图书馆情报学有1190种。按篇均被引值排序,原来依据的是刊登文章的学科,不少期刊发文量只有一篇。这也有一定的合理性。

    研究前沿:“科学家紧密联系的研究区域一定程度上代表了学科发展的前沿区域”。选择学科,或者查关键词。
        图书馆情报学:列出了17个研究前沿,按被引排名第一的是“公共图书馆 图书馆精神 服务 图书馆权利”,不知道是如何组合出来的。一览表中列有平均发表年,有好几个都是2001年的,不论其主题如何,仅从年份而言,8年前的还能称“前沿”吗?
        关键词:查“数字图书馆”、“编目”、“文献”都没有结果,实在不甘心,查“图书馆”,总算有了14个结果──应该说“关键词”是名不符实的。点击第1个"公共图书馆 图书馆精神 服务 图书馆权利",跳出来一个很酷的关系图,每一个节点都链接到图下的文章信息,边上有下载全文链接:

    热点论文:“近两年发表的,在一个较短时间内被高度关注的论文是一个潜在的研究热点”
        图书馆情报学:列出79条,被引数在20到2之间,时间在2006年中以后。全部学科有2006年第1期的,似乎不同学科年限不尽一致。

        印象中维普收录期刊数量一直在CNKI之上,但从CSI引文数据看,应该在CNKI之下。比如查机构,本校被引量最前的二篇均为范并思的,肯定会让本校众多教育学科的大牛不爽。再比如那篇"图书馆2.0:构建新的图书馆服务“,在CSI被引145次,而在CNKI中接近翻番。
         找来两方的介绍做一下对比:
    CNKI《中国引文数据库》“收录了中国学术期刊(光盘版)电子杂志社出版的所有源数据库产品的参考文献……截至2007年12月,累计链接被引文献达 6848642 篇”。
    维普
    《中国科学指标数据库》(CSI)“涵盖了包括理、工、农、医和社会科学等方面的4000余种期刊,数据评价时段从2000年跨度至当前,每双月更新”。与维普《中文科技期刊数据库(引文版)》“收录1989年以来8000多种期刊论文的参考文献”相比,竟然少了一半──实在想不通啊。

        总的来说,维普CSI是一个与CNKI引文库不同的产品,只是数据的数量与质量均差强人意,可用性就存疑了。虽然不知道二个产品内在运行机制,但从上述自我介绍及使用感受,CNKI引文数据应该是与主库同步的,数据量大、动态性好,而维普CSI却是独立于主库的产品,技术上似乎就落后了一截。
    现在H指数作为个人评价指标很流行,但维普如此数据,显然不敢提供──某人在CNKI的H指数为9,到了维普,竟只有1,谁还用它?

  •     现在提供手机访问的网站越来越多了。最新的消息:
    一、EBSCO推出了数据库的手机访问,看了一下,需要系统管理员开通。不知道手机如何通过认证?
    二、清华大学无线移动数字图书馆项目网站上线

        虽然用智能手机的人越来越多,什么网站都能访问,但多数针对手机的网站仍是WAP网站。要对手机网站进行测试或试用,最方便的方法是通过电脑模拟手机访问,现在有以下几种可选择途径:
    1、用Opera浏览器,据说要修改UA参数(参见百度知道
    2、下载WAP模拟软件
    3、安装浏览器插件,IE和Firefox都有。关于Firefox插件,参见:用电脑模拟手机访问WAP版网站
    4、访问在线WAP模拟器
        更全面信息,参见:pc电脑上浏览手机网站在线wap浏览器或模拟器软件

        第四种方法最方便。用上海图书馆、同济大学及清华大学的手机图书馆选择几个网站做了测试(三家都不能用的未列出来),以技术含量较高的书目查询为重点。还没有发现三家都能正常使用的模拟网站,不知道是哪方面的问题。三家网站所用标记语言各不相同,上图、同济的可用普通浏览器访问,清华的不行:

    上图手机图书馆(采用XHTML 1.0):http://m.library.sh.cn
    同济大学图书馆手机版(采用XHTML Mobile 1.0):http://www.lib.tongji.edu.cn/m
    清华大学图书馆手机版(采用WML):http://166.111.120.151:8080/thulib(旧版采用XHTML Mobile 1.0:http://thulib.m.cn/,长得和同济很像,书目查询只是OPAC入口链接)

        看百度WAP搜索,旧版用的是WML ((Wireless Markup Language),目前用XHTML Mobile,清华何以反其道而行之?

        以下依据三家手机图书馆可访问情况,给在线WAP模拟器打星(这样做其实并不公平):
    **** 好的WAP网:http://www.haodewap.com/wapurl/kong.net/nba.htm(清华一切正常;同济可以访问,但书目检索结果不能显示;上图不能访问)
    *** 泡泡通wap浏览器:http://so.pp.cn/phone/general.jsp(三家均可正常访问首页,但书目查询入口都有问题,上图、清华没有查询按钮,同济没有输入框)
    *** 儒豹WAP:www.roboo.com(三家均可正常访问首页,但书目查询入口都有问题,上图、同济进入后没有输入框及查询按钮,清华查询出错)
    ** 倾城视窗:http://ie.qcmw.com/(同济书目查询入口可访问,但检索出错;清华书目查询入口可访问,但按“查询”没有反应;上图不能访问)
    * UU视窗:http://win.uucun.com/(只能访问清华,大概只识别WML;但无法进入书目检索页)
    * 114啦:http://tool.114la.com/wapview.html(上图可以访问,但无法进入书目检索;清华没反应,同济出错)
    * 谷歌手机网站生成器:http://www.google.com/gwt/n(同济可以访问,但书目检索入口没有输入框及查询按钮;清华“重定向”;上图不能访问)

        随后用智能手机做了测试,上图、同济一切OK,清华有问题:
    UCWEB:服务器没有响应(不支持8080端口?)
    Opera:书目检索“查询”不起作用(未显示为按钮,是这个版本的浏览器问题?)
        换普通手机,清华访问正常;同济书目查询有问题(查“上海年鉴”没有结果,应该有;查“上海”“网页连接失败”,结果太多?);上图无法访问(下载连接网页失败)

        看测试结果,真对做手机网站没有信心啊。

  •     去年更新《新一代OPAC案例分析》(OPAC 2.0案例分析(2008版))时,澳大利亚国家图书馆(NLA)实验室(LibraryLabs)的四个与OPAC相关的原型只有“集成图书馆发现服务”(Single Business Protoype)仍在建设中。前些天,被称为SBDS原型0.1已经发布(Single Business Discovery Service)。由于是原型系统,所以有些数据可能是过时的,并没有及时更新,也就有可能碰到链接出错的情况。Beta版最早将于2009年10月发布。

        略做试用,感觉除了OPAC 2.0的效果外,一站式集成的内容相当丰富,今后可以作为一个重要的参考数据源。看介绍(About),包括:

     元数据:

        * 澳大利亚国家书目数据库 1900万条
        * 澳大利亚图片 160万张
        * 澳大利亚研究在线 30万件
        * OAIster 2000万资源
        * Open Library 30万联机公共域图书
        * Hathi Trust 20万联机公共域图书
        * 维基百科 30万与图书相关的关键词(标签)

     文本:

        * 澳大利亚报纸:1803-1954年报纸文章全文
        * Pandora 澳大利亚重要网站存档复制品
        * NLA手稿检索工具
        * 美国国会图书馆 40万图书目次、出版说明及部分章节
        * Internet Archive 10万全文公共域图书

        另外技术方面:

    检索相关排序规则:
        * 题名、主题或作者字段匹配优先
        * 完全一致优先词干一致
        * 检索词相邻优先分离
        * 题名类似时,以附注及全文中出现检索词优先
        * 密度优先(即检索词占全部查询文本的比例越高排序越先)

    技术细节:
        * Java编程语言
        * Solr/Lucene索引
        * MySQL记录聚类
        * Jetty及Restlets为HTTP容器,FreeMarker为模板语言

        本想照例做一些截屏,但发现在LibraryLabs的Wiki的项目介绍中,有据称为2008年十月澳大利亚图书馆咨询委员会会议准备的说明文件SINGLE BUSINESS DISCOVERY PROJECT(文件标明日期为2008/2/7),其附件中有六个屏幕设计样例,说明得很细致,基本上与现在情况吻合,自己也就省掉此步骤了。

        还看到在2008年12月,项目组找了少量最终用户做了一个“卡片分类练习”(card sorting exercise),以确定最终的类别,及各类用语。大致浏览了一下长达31页的分析报告(Single Business Card Sort Report),很值得学习。
        从概念上讲,这种方法属于“以用户为中心的设计”。网上查到一个中文说明“利用卡片分类进行信息架构”,有具体实施方法。所下的定义是:
    卡片分类法(Card Sorting)是一种以用户为中心的方法,可以观察出用户如何理解和组织信息。顾名思义,就是将信息(概念、条目、内容、小分类等)分别写在一张张的卡片上,然后归类。既可以事先提供固定的分类,也可以由志愿者自己创建分类。通过卡片分类,可以了解用户所想,然后更好的完成页面、导航、内容组织等网站的信息架构。


    对SBDS的介绍,参见(怎么都是OCLC的?):
    Roy Tennant: One-Stop Searching With a Can-Do Attitude (May 26, 2009)
    Lorcan Dempsey: A single business system environment redux (May 30, 2009)

  •     终于在年前把手头干了很久的活基本了结。
        在这过程中遇到不少旧西文名称,不知对应的中文名称,于是频繁使用谷歌金山词霸,发现很多都是在“Google网络词典”部分得到答案的。其实它根本不是什么词典,只是把在不同网页中相邻出现的西文-汉语视为同义语呈现出来(尤其当一方在括号中出现时),可以说是一部虚拟词典。以它为参考,我得到了很多旧西文人名、地名、机构名的中文名称。比如Eroshenko中文名“爱罗先珂”,来自小说搜索网站的书目记录;比如Astor House Hotel为“浦江饭店”,来自该饭店自己的网站;比如Woosung即“吴淞”,其出处是某博客。
        因为不是真正的词典,所以它远非完备,有些名称找不到。其中有的地名凭自己的知识还能猜出来,有的就一筹莫展了。幸好在寻找过程中在网上发现一位同行高人,蒙她热情相助,解了我不少疑问。

        在此把自己得到的旧西文拼音地名部分列出来,或许哪天在Google网络词典上查到也未可知呢。由于这些地名通常按当地发音拼写,与现在通用的汉语拼音并不一致。

    一、上海地名旧译

    Shanghai, Shang-hai(英语)
    Schanghai(德语)
    Changhai, Chang-hai(法语)

    Pootung 浦东
    Tsang-Ka-Leu 张家楼(浦东)
    Ngan-Hoei 南汇
    Tarzang 大场
    Chenju 真如
    Kiangwan 江湾
    Yangtszepoo, Yangtszepoo Creek 杨树浦
    Chapei 闸北
    Hongkew, Hong Kew, Kong Que 虹口
    Zi-ka-wei, Siccawei, Si-ka-wei  徐家汇
    Tung-Ka-Doo 董家渡
    Kiaochow Park 胶州公园
    Honan Road 河南路
    Shantung Road 山东路
    To Malloo 大马路(南京路)
    Whangpoo, Huang Pu River, Hwang Pu River 黄浦江
    Woosung 吴淞
    Woosung Bar吴淞口
    Wusung River 吴淞江
    Soochow Creek 苏州河
    Lunghwa Temple 龙华寺
    Tsungming 崇明
    Tsungming Island 崇明岛

    二、全国地名旧译

    Tche-Li 直隶
    Pékin 北京
    Tientsin 天津
    Honan 河南
    Shantung 山东
    Tringtau, Tsingtao 青岛
    Kanton 广州

    Yangtse, Yangtsze, Yangtsekiang, Yangtze-Kiang 长江
    Chungking, Tchoung-King 重庆
    Ichang, I-chang 宜昌
    Hankow, Hankéou 汉口
    An-whui 安徽
    Kiukiang 九江
    Anking 安庆
    Wuhu 芜湖
    Panpu 蚌埠
    Nanking 南京
    Chinkiang 镇江
    Soochow 苏州
    Shihpu 许浦(苏州)
    Haimen 海门
    Kiangyin 江阴
    Hai Chow 海州(连云港)
    Kiangnan, Kiang-Nan 江南
    Chekiang 浙江
    Hangchow 杭州
    Ningpo 宁波
    Yin-hsien 鄞县(宁波)
    Hoo-chow-foo 湖州府
    Wenchow 温州

    另:涉及上海的旧名还可以在上海市地方志办公室网站的“专业志”部分找到。最集中的如《上海租界志》附录,有“新旧路名对照”、“人名译名对照”及“机构、职衔等译名对照”。  

  •     当年刚迷上Google时,把它的每一个产品都玩了一遍,其中包括Google Catalog Search。此后Google实验室不断推出新产品,追着后面看都来不及。如果不是看到Google在1月15日结束始于2001年的目录搜索的消息,根本不会想起自己以前曾经见过Google的这个产品。
        职业关系,当初以为这个Catalog是图书馆目录,一番搜索,看到结果是一些彩色的产品目录。只觉得那些目录自己用不上,就没再关注了。
       昨天看到Google图书搜索(GBS)博客报道,才知道目录搜索与图书馆还真有点关系──目录搜索采用的“扫描+字符识别”的方式,在当年还属于新技术。从在小房间中自己扫描成千上万件目录开始,Google积累了经验,在2004年开始了大规模扫描图书馆藏书的Google Print项目,也即现在已达数百万册的Google图书搜索。
        据GBS博客报道,除了扫描与字符识别两方面,Google还由目录搜索学到了用户如何联机阅读扫描文献,以及如果更好地向用户展示这类信息。
        虽然产品本身不成功,但由此孕育出一个成功的产品,入黄泉也可瞑目了。所以GBS称目录搜索为“伟大的实验”。

    Via Google Book Search Blog: Farewell, Google Catalog Search


        又:大概也是受金融风暴影响吧,Google停止多项服务。除了目录搜索,还有:
    Google Video 视频(早入Google麾下的YouTube可取而代之)
    Google Notebook 笔记本
    Jaiku 微博客(Twitter更红火)
    Mashup编辑器

        其中自己最觉得可惜的是Google笔记本,早半年刚开始习惯用它来记下一些临时的想法,很方便。好在只是停止开发,服务仍继续开放。

    Via 译言:无可奈何花落去:Google 即将关闭Google 视频、记事本、目录搜索等服务