e-mail
  •     Nalsi本月开始把译文发到译言上,甚至没有同时发在自己博客Islander的西文编目笔记。译文大多是图书馆界的热点,“Google能使用OCLC的数据么?能,但是……”就是其中之一。原文"So, Can Google Use OCLC Records? Yes, But: Questions remain about the impact of WorldCat on Google's metadata"发表在Library Journal (9/10/2009, 仅网站?)。
        对GBS元数据的质疑始于加州大学伯克利分校信息学院的Geoffrey Nunberg,他在8月28日举行的Google Book Settlement Conference上,列举了GBS中的元数据问题(Google Books: The Metadata Mess,PDF),诸如年份混乱、分类错误,而Google方面还不急于改进。他更指出GBS用只有3千主题的BISAC主题取代有20万主题的LCSH,数据并非来自图书馆,只适合书店、不适合学术使用。
    作者另外发表了博文"Google Books: A Metadata Train Wreck" (August 29, 2009),其后又在The Chronicle Review上发表"Google's Book Search: A Disaster for Scholars" (August 31, 2009),进一步阐述其观点。
        GBS的Jon Orwant在上述博文下长篇留言,指出元数据并非OCR而来。如前述译文,GBS的元数据来自不同机构,包括WorldCat及参与GBS的图书馆,Google员工所做的基本上只是在不同来源的元数据间做取舍。
        其实大家都知道,图书馆的元数据本身存在错误。分面OPAC出现后已将这些错误显性化,拥有大量图书的GBS或许更放大了这些错误,Thomas Claburn在Information Week上很夸张地说"Google Books Metadata Includes Millions Of Errors"(Sep 3, 2009)。
        Stephen's Lighthouse在博文"The Google Books Metadata Debate" (September 8, 2009)中提供了很多讨论链接。最后举了Typo of the day for librarians这个专门讨论书目记录中各种拼写错误的博客为例,说明:Nobody's perfect。

        Cataloging Futures的博主Christine Schwartz一直关注这场论讨,她则从中看到了图书馆面临的相同问题(Google's metadata questions - they're our questions also
    ):

     · 元数据取自哪里?
     · 在数据化流程的哪个点抓取/创建元数据?
     · 如果外包元数据创建,是否自己做、如何做质量控制,或者由外包公司决定?
     · 元数据抓取/创建是一次性的过程,还是反复的过程?
     · 谁(或在自动抽取时,什么)创建元数据?
     · 在自动抽取过程后,是否做人工审核?
     · 在元数据创建中用户的职责是什么?
     · 如果有多个来源可选,什么是最佳来源?
     · 如果有多个记录可选,什么是最佳记录?能否自动选择?


    另参见:
    Coyle's InFormation
    GBS and Bad Metadata (September 07, 2009)
    Google Books Metadata and Library Functions (September 15, 2009)

    Cataloging Futures
    Metadata problems at Google Books (September 03, 2009)
    Google responses to metadata "mess" (September 08, 2009)
    Google's metadata questions - they're our questions also (September 09, 2009)

  •     去年下半年才开始正式用Google日历,觉得很好用,一下子建了几个,分别用于私事和工作。私事再分家事和个人活动,工作再分馆里的和部门的,再加上共享朋友的日历以及公共日历“中国节假日”,日历上五彩缤纷,做过的事、要做的事,重要日期、朋友日常安排等一一呈现。自己作以下用途:

    1、记事:
        每学期都要写小结,所以工作日志必不可少。以前很土地记在本子上,现在则把日历当成了记事本。
        当然也不限工作,日记是早就不记了,但平时去哪里玩、在哪里FB过,就记录在此。
    2、安排:
        做事前定时间,先看日历,包括朋友的日历,看对方是否有空。
    3、邀请:
        创建或修改活动时,可以同时邀请其他人。被邀请者的回复(Yes/Maybe/No)会即时显示在日历中,很适合聚会安排。
    4、提醒:
        日程可以通过弹出式窗口、电子邮件及短信,设置在预定时间前若干提醒。
        刚设了短信提醒,移动和联通都可以。应该接收是免费的吧。
    5、共享:
        部门日历与部门所有同事共享,部门内的重要事情,馆里的学期安排,将要做的事情等等,随时可查、可看。
    并且设置的权限是每个同事都可更新,比如增加自己参加的学术会议信息。
        私事日历,可选择只共享是有空,而隐藏具体细节。
    6、发布:
        部门日历嵌入在Google站点的网页中,所有共享者在开通日历功能后都可以看。

        公开的日历也可以嵌入到其他网页中。
    7、查找:
        事情过去久了,记不大清,可用“搜索我的日历”全文查找。
        自己特意给FB标了“餐饮”,可以一下子搜出来。
    8、复制:
        朋友日历上的活动也是自己要参加的,就复制一下,免得自己新建。
    9、备份:
        不用其他日历,太相信Google,导出也没什么用,做备份吧。

        公务用Google日历有什么好处呢?好象清华大学图书馆曾用来发布读者讲座安排。看文章"Library 2.0: Balancing The Risks And Benefits To Maximise The Dividends" (Kelly, B. Program Electronic Library Information Systems, 43 (3), pp. 311-327)(下载),其中提到的优点是:只需更新Google日历,所有嵌入日历的页面就一同更新了;用户可以订阅日历,也可把事件加入自己的日历(即复制)。

  •     很多Web2.0网站的成功,在于由用户贡献内容(UGC)。问题是,俗世大众毕竟是利己的,不管此“利”是金钱、名声、心理满足,还是最最简单的“实用 ”,要让足够多的用户心甘情愿地“贡献”而让网站能够维持并发展,至少也该让他们觉得有所得,否则只能是空有一番想象。因此如何设计服务,以达到利己利人的效果,是真正的艺术,而Google无疑是个中高手。
        Google翻译(Google translate)上线很久了,我经常用。虽然时常对翻译结果并不满意,但对页面右下角的“更好的翻译建议”(Contribute a better translation)基本上是无视的,原因如下:第一,有时只是想看看大概是什么意思,并没有那么多时间逐字翻译;第二,即使在做翻译,也只是参照给出的翻译,在自己的文档中做自己的翻译,而不会向Google“提供建议”,因为我并不是翻译家,不那么确定自己的翻译是最好的;第三,不知道“提供建议”的结果是什么。
        从不那么“高尚”的人性角度估计,像我这样的用户还是很多的,Google内部对翻译使用的统计数据肯定能说明这一点。大概正因为此,Google今天推出了翻译辅助系统(Google translator toolkit),让用户在这个系统中上载文件,由系统自动进行翻译。随后用户在这个系统中修改并保存翻译的结果,在这个过程中做出的所有修改,自然就成 了向Google提供的翻译建议,也就成了Google翻译自学习系统的贡献者。
        从自己的使用体验,在线翻译方面雅虎的宝贝鱼虽然语种不及 Google翻译多,但翻译效果与Google翻译难分伯仲。尤其是日语方面,语序的正确率要比Google强大得多。不过,翻译辅助系统上线后,Google将积累大量的翻译对照素材,以Google强大的算法分析能力,如果雅虎没有改善翻译的对策,终将被Google抛在后面。
        目前来说,谷歌翻译辅助系统不支持PDF格式的,且只支持1M以内的文件,略有遗憾。

    参见:
    Google黑板报:信,达,雅的翻译境界 - 谷歌翻译辅助系统的事业

  •     今天发现Google的Doodle变了模样


    庆祝俄罗斯方块25岁生日

    当时我处于登录Google.com的状态(非登录状态下为正常Google图案),不像在Google.cn首页那样有汉字提示,一时不明白又是什么纪念日。后来看到“谷歌中国LOGO又变 庆祝俄罗斯方块25岁生日”,才明白原来是俄罗斯方块!

        自己只玩最简单的游戏,最痴迷的就是俄罗斯方块。
        记得是1992年暑假外出,在火车上,同行的外甥女拿了个手掌机,里面就有俄罗斯方块。漫长的旅途无聊,就借来玩玩,不料一玩竟然上了瘾。接下来的几天,常常玩到半夜三更。
        然后买了一台家用游戏机。虽然也玩里面的打坦克、超级马里奥之类的,但最喜欢的还是俄罗斯方块。
        等到家里买来电脑后,看到各种俄罗斯方块及其变体都不放过,拷贝来玩。已经不记得玩过哪些版本了,总之是来个新的版本就玩到不能自已,以至有时儿子会跑来,幽幽地看着我,说:“妈,别玩了吧。”只听说小孩子玩游戏上瘾家长心急上火的,而自己竟然堕落到这个地步,惭愧之余,每每表决心不再玩。但只要游戏还在,不玩的“决心”就没有意义,每次最终的“决心”就是把游戏删除。
        后来上了宽带,面对网络版的俄罗斯方块,玩起来更带劲,连删除也不起作用了。

        为何如此痴迷俄罗斯方块,至今想不明白。最终把我从游戏中解救出来的,是博客、是RSS阅读。修炼至今,看到Doodle中那个正在下落的四点小棍,竟然没有产生一点联想,真是戒了!
        倒是儿子一看就说:俄罗斯方块!判断依据是:1、下落的四点小棍;2、没有一排是同一个颜色的。按照俄罗斯方块的规则,有一排同色就要清掉──即使那正下落的四点小棍掉下来,这个Google也不会跨掉。

        如果不知道俄罗斯方块,可以看维基百科:http://en.wikipedia.org/wiki/Tetris
        如果没玩过俄罗斯方块,可以访问:http://www.tetris.com/(1985-2009,似乎是正宗的)

  •     曾经收藏过花果山的博文“豆瓣图书馆”和“图书馆学的教科书,被气死”。博主哈雷前两天发来邮件,说自己信管系本科毕业工作后,现在很向往图书馆工作,咨询如何才能实现,是否一定要考研。自己只能就身边的情况告知一二。
        回邮后浏览了他的博客,
    有不少和图书馆有关的内容,还发现有厦门的售票点地图,便向他请教如何做成的。根据他推荐的指南,做了几个试验,“神州-东瀛履痕”是其中之一。


       玩Google经常花掉不少时间,比如体验Picasa网络相册的脸部识别功能
    [update 2009-5-23: 今天发现Picasa一个很恶劣的问题:之前加过的name tag,只要是没有联系人邮箱的,全都不见了!],那几天每天弄到深更半夜。这次决定不能玩物丧志,接下来计划用“我的地图”做院系资料室位置图。


    附哈雷推荐的使用帮助:

    如何使用
    google“我的地图”使用帮助
    香港版“我的地图”使用帮助(这个讲得清楚一点)

    地图应用实例
    谷歌发现之旅,展现家乡之美
    香港版google地图比赛