2007年06月23日

The Google Five Libraries: Two Years, Six Months, and Seven Days in the Life of Google Library Project

PLA Blog
The Google Five Libraries: Two Years, Six Months, and Seven Days in the Life of Google Library Project
Saturday, June 23rd, 2007 by Rick Roche


Is there no downside to being a library partner in the Google Library Project? Until pressed by members of the audience, the five-member panel only admitted it was a lot of work and the lawsuits were annoying. The panelists all seemed almost unconcerned that they really do not know what the ramifications of the project are.

The meeting began with a bit of history. In December 2004, when Google was rolling out lots of products, it announced Google Print, a project to make full texts available for reading and printing from the web. Within weeks the company also announced that it had agreements with five large libraries to digitize their printed materials and make them searchable on the web. Many librarians thought the idea was great, but publishers and authors objected. The upset parties filed lawsuits against Google and the libraries. In Fall 2005 the project was renamed Google Books.

Adam Smith, the Product Management Director of the Google Book Search summed up the status of the project. As of June 2007, there are 25 libraries providing are scheduled to join the project, whose goal is making searching books as easy as searching the web. He also said that around 10,000 publishers had signed on to provide content at differing levels. Some have full texts, some sample pages, and others snippets with keywords. He said that Google Book Search had been integrated with Google Universal Search, and showed that special “About This Book” pages combining metadata, reviews, book backgrounds, and library holdings are being added to Google Book Search.

The five libraries are Harvard, University of Michigan, New York Public, Stanford, and Oxford University’s Bodleian. Their panelists indicated that libraries themselves had differing objectives, but all admitted they signed on because they were failing to digitize at fast enough rate before Google made its tempting offer. Though the number of items digitized to date is being treated like an industry secret, they all claim that they are much farther along than before the web giant stepped in.

The obvious benefit for the five is items are being made digitally available. There are many side benefits. The work has forced the libraries to pull out seldom used materials. They have discovered items that were never catalogued or added to online database. The Bodleian even discovered many books whose pages had never been cut. They have to varying degrees discovered how damaged their books are by time and usage. (Brittle and breaking spine items are not being scanned.) They are getting new ideas for bibliographic description and finding new ways to share their resources.

Several of the panelists said that Google Book Search is sparking requests for materials in a way that being part of other online catalogs never did. This is where public libraries benefit. Because full texts are searchable, subjects are being found in books that researches had never considered.

The program became more interesting when the audience began its questions. Some of the project disappointments began to be revealed. Much was made of the limitations of sticking only to public domain known items for digitization. To be safe, several of the libraries have stuck to pre-1923 books. One speaker said that many 1923-1964 books are now in the public domain but no one knows what titles, as no one has ever reported on copyrights not renewed. The University of Michigan has a team now systematically checking 1923-1964 copyright renewals. It is estimated if these books can be identified, the body of public domain items will double.

The panelist also admitted that the quality of the digital documents is not good enough to be considered preservation. The goal is just to make the items searchable on the web. At this, the project is successful already. What lies ahead is uncertain. One panelist said that until much copyrighted material can also be added and open for reading and printing, the project is not really complete.

posted by gljblog at 00:00| Google Book Searchプロジェクト | このブログの読者になる | 更新情報をチェックする

2007年06月07日

Googleの書籍検索構想に米12大学が新規参加

Googleの書籍検索構想に米12大学が新規参加
http://itpro.nikkeibp.co.jp/article/NEWS/20070607/274012/?ST=ittrend

 米Googleは米国時間6月6日,同社の書籍本文検索プロジェクト「Google Books Library Project」に,米国の12大学で構成するコンソーシアム「Committee on Institutional Cooperation(CIC)」が加わったと発表した。GoogleはCICと協力し,参加大学の図書館から最大で1000万冊の蔵書を選択してデジタル化する。

 このプロジェクトには,すでにハーバード大学,スタンフォード大学,オックスフォード大学などが参加しており,CICが加わることで参加大学の数が倍増するという。今回,新たにシカゴ大学,イリノイ大学,インディアナ大学,アイオワ大学,ミネソタ大学など中西部の大学がこのプロジェクトに参加することになった。多くの大学が加わることで,それぞれがが保有する貴重な書籍コレクションにオンラインでアクセスできるようになる。

 Googleは,このプロジェクトでデジタル化したパブリック・ドメインの書籍ファイルをCICに提供する。CICは,これらのファイルを使って大学間で共有できるデジタル・レポジトリを作成するという。

 パブリック・ドメインの書籍については,オンラインで検索や閲覧が可能で,すべてのテキストを読むこともできる。著作権で保護されている書籍は,書籍名,著者名といった基本的な情報や,検索に関連する本文の数行,その書籍を購入または借りられる場所などの情報が表示される。

(ITpro)  [2007/06/07]
posted by gljblog at 00:00| Google Book Searchプロジェクト | このブログの読者になる | 更新情報をチェックする

GoogleのLibrary Projectに大学コンソーシアムCICが参加

GoogleのLibrary Projectに大学コンソーシアムCICが参加
http://www.itmedia.co.jp/news/articles/0706/07/news016.html

CICはシカゴ大学やイリノイ大学など、全米12校の大学が構成するコンソーシアム。
2007年06月07日 08時15分 更新

 米Googleは6月6日、Committee on Institutional Cooperation(CIC)がBook Search Library Projectに加わったと発表した。CICは全米12校の大学が構成するコンソーシアムで、シカゴ大学、イリノイ大学、インディアナ大学、アイオワ大学、ミシガン大学、ミシガン州立大学、ミネソタ大学、ノースウェスタン大学、オハイオ州立大学、ペンシルベニア州立大学、パーデュー大学、ウィスコンシン大学マディソン校が参加している。GoogleはCICと協力、参加大学の図書館から、1000万冊近い蔵書を選択、デジタル化する。

 Googleはプロジェクト向けにデジタル化したパブリックドメインの書籍のデジタルコピーをCICに提供する。CICはこれらコピーからデジタルリポジトリを作成、CIC間で共有することができる。

 著作権の切れた書籍については、ユーザーはオンライン上で自由に検索、ブラウズ、フルテキストを読むことができる。著作権がある書籍については、書籍のタイトルや著者名などの基本情報と、検索に関連する内容数行、およびその書籍が購入または借りられる場所の情報が表示される。

 CICメンバーのうち、ミシガン大学とウィスコンシン大学マディソン校は、既にGoogleのBook Search Library Projectに参加している。

posted by gljblog at 00:00| Google Book Searchプロジェクト | このブログの読者になる | 更新情報をチェックする

2007年06月04日

Live Search Booksがパワーアップ - Google対抗、販売書籍も読めるように

Live Search Booksがパワーアップ - Google対抗、販売書籍も読めるように
http://journal.mycom.co.jp/news/2007/06/04/016/
2007/06/04
湯木進悟

米Microsoftは、Windows Liveサービスの「Live Search Books」β版のバージョンアップを発表した。新たに複数出版社と提携して、著作権のある販売書籍などのオンライン表示機能などが追加されている。

これまでLive Search Books(英語版)では、著作権で保護されていない書籍の閲覧が可能とされてきたものの、同社は今回、Cambridge University Press、Harvard University Press、MIT Press、Oxford University Press、Simon & Schuster、Taylor & Francis Group、The Perseus Books Group、University of Massachusetts Press、Yale University Pressを始めとする、数多くの出版社との提携をアナウンス。提携によって、オンライン掲載が許可された著作権で保護されている一部の販売書籍などに関しても、閲覧できるようになったという。今後も複数出版社との提携強化などが計画されているようだ。

また、同社はインタフェースデザインの改良も図り、表示される書籍データの画質向上を実現したとしている。検索キーワードに応じてリストアップされる書籍が、どの程度までオンラインで無料で読めるかなどの情報がクイック表示され、全文を読める書籍のみに検索結果を絞り込むことも可能。詳しく内容を見たい書籍をクリックすると、専用ビューア画面が立ち上がり、ズームイン・ズームアウト、ページフリップ、カウンタ、表紙や目次へのジャンプ、全文ダウンロード、購入ショップへのリンクなどが表示されて、快適な閲覧が行えるとされている。

なお、同社は今回の発表において、提携出版社との合意に至っている書籍のみが閲覧可能で、著作権侵害行為は一切ないとするコメントを発表。無許可で著作権保護された書籍も閲覧可能にしているとされる、米Googleの同種のサービス「Google Book Search」を批判する姿勢も明らかにした。
posted by gljblog at 00:00| その他の蔵書デジタル化計画 | このブログの読者になる | 更新情報をチェックする

「Live Search Books」で著作権のある書籍の検索を開始

「Live Search Books」で著作権のある書籍の検索を開始
http://internet.watch.impress.co.jp/cda/news/2007/06/04/15925.html

「Live Search Books」の検索結果画面。書籍の中における検索語句の出現箇所を示したグラフも表示されている
 米Microsoftは1日、同社のサーチエンジン「Live Search」において、著作権の保護期間内の書籍を対象とした検索を可能にしたと発表した。このサービス「Live Search Books」ではこれまで、著作権が切れたパブリックドメインの書籍の検索しか提供していなかった。

 今回、Microsoftは著作権を保有している出版社と交渉し、インデックス作業に同意した出版社の書籍のみをLive Search Booksにインデックスしたという。合意した出版社の中には、Cambridge University Press、Harvard University Press、John Wiley & Sons Publishing、McGraw-Hill Companies、MIT Press、Oxford University Press、Pearson Education、Springerなどが含まれている。

 これらの書籍をスキャンする際には、最高品質の画像を検索結果として提供できるように注意が払われたとしている。さらに書籍をきれいに拡大・縮小することも可能だ。検索結果は、学術論文を検索する「Live Search Academics」で既に導入されている2ペインのユーザーインターフェイスが採用された。左側に検索結果一覧が表示され、各検索結果の上にマウスカーソルを重ねていくと、右側のペインに書籍の詳細な情報が表示される仕組みだ。

 Live Search Booksではこれを一段と改良し、書籍の中で検索語句が出てくる場所の密度をグラフで表示するようになった。それによって書籍のどの部分に自分が知りたい情報が含まれているかを容易に見分けることができる。

 検索の結果、書籍を購入したい場合には、出版社やメジャーなインターネット書店へのリンクも提供されている。


--------------------------------------------------------------------------------
関連情報

■URL
  Live Search公式ブログの該当記事(英文)
  http://blogs.msdn.com/livesearch/archive/2007/06/01/live-search-books-now-with-in-copyright-content.aspx

( 青木大我 taiga@scientist.com )
2007/06/04 12:19

posted by gljblog at 00:00| その他の蔵書デジタル化計画 | このブログの読者になる | 更新情報をチェックする

2007年06月02日

MSのLive Search Books、著作権のある書籍の内容も検索可能に

MSのLive Search Books、著作権のある書籍の内容も検索可能に
http://www.itmedia.co.jp/news/articles/0706/02/news009.html
2007年06月02日 08時59分 更新

パートナー出版社の協力により、著作権のある書籍の内容を検索、一部を読むことができる。

 米Microsoftは6月1日、「Live Search Books」β版で著作権のある書籍の内容を検索できるようになったと発表した。

 Live Search Booksでキーワードを入力して検索すると、関連する書籍タイトルの一覧が表示され、書籍の内容が閲覧可能かどうかが示される。このプレビューページには、表示可能な書籍の場合、表紙写真、概要、目次なども表示される。また書籍の内容の何ページまでを閲覧できるかもここで分かる。


 書籍を選択し、キーワードで検索すると、情報が含まれるページが関連性の高い順番で表示される。

 書籍内検索が可能なのはMicrosoftのパートナー出版社が許可した書籍のみ。パートナー出版社としては、Cambridge University Press、John Wiley & Sons Publishing、McGraw-Hill Companies、MIT Press、Simon & Schuster、The Perseus Books Groupほか多数が名を連ねている。
posted by gljblog at 00:00| その他の蔵書デジタル化計画 | このブログの読者になる | 更新情報をチェックする

広告


この広告は60日以上更新がないブログに表示がされております。

以下のいずれかの方法で非表示にすることが可能です。

・記事の投稿、編集をおこなう
・マイブログの【設定】 > 【広告設定】 より、「60日間更新が無い場合」 の 「広告を表示しない」にチェックを入れて保存する。


×

この広告は1年以上新しい記事の投稿がないブログに表示されております。