2007年01月23日

Google、電子ブックの販売も計画?

2007年1月23日(火曜日)
Google、電子ブックの販売も計画?

英The Sunday Times紙がGoogle Book Searchの欧州担当者に行ったインタビューによると、Googleは将来的には電子ブックの販売も視野に入れているとのことです。同社の今後の動向が注目されます。

Google plots e-books coup - The Sunday Times
http://www.timesonline.co.uk/article/0,,2095-2557728,00.html

Google Book Search担当者、電子書籍販売プラットフォームの開発を示唆? - hon.jp
http://hon.jp/news/1.0/0/890/
グーグル、書籍のダウンロードサービスを計画か–ブログ界の反応 - CNET Japan
http://japan.cnet.com/news/media/story/0,2000056023,20341274,00.htm
posted by gljblog at 00:00| Google Book Searchプロジェクト | このブログの読者になる | 更新情報をチェックする

グーグル、書籍のダウンロードサービスを計画か--ブログ界の反応

http://japan.cnet.com/news/media/story/0,2000056023,20341274,00.htm

グーグル、書籍のダウンロードサービスを計画か--ブログ界の反応
文:Margaret Kane(CNET News.com)
2007/01/23 18:06

 報道によると、Googleでは、コンピュータに書籍をダウンロードし、BlackBerryのようなモバイル端末で読めるようにする計画だという。

 英The Times Onlineの報道によると、この取り組みは、世界の図書館にある蔵書をスキャンしてデジタル化する「Google Book Search」プロジェクトの下で進められるという。Google Book Searchプロジェクトは、出版社や作家らが著作権の侵害を訴えるなど、これまで物議をかもしてきた。

 欧州でGoogle Book Searchに取り組むディレクターのJens Redmer氏は(The Times Onlineの記事の中で)「休暇に出かける旅先の情報を借りたり、書籍の中のある章だけを買ったりしたいというニーズもあるかもしれない。本の読まれ方を決めるのは、読者だ」とコメントしている。

 電子書籍の分野ではまだ、これといって大きく成功している企業はない。Googleの取り組みが、電子書籍の分野を切り開くことになるのだろうか。

 以下がこのニュースに対するブログコミュニティーの反応である。

 「Googleが書籍のダウンロードビジネスに参入すれば、電子書籍は注目を浴びることになるだろう。しかし、だからといって電子書籍が突然ブームになるとも考えられない。Googleは検索には長けているが、電子書籍の分野ではとても苦労するだろう」--Mark Evans

 「大きな枠組みで捉えると、Googleによる電子書籍の小売り業参入はE Inkの技術を採用した電子書籍リーダーの登場よりも、はるかに重要な意味を持つかもしれない。PDAや携帯電話、デスクトップを表示装置とする市場が今も残っているのだから」----TeleRead

 「Googleは、印刷された全ての書籍を検索可能にしたがっているとして、多くの人々から非難を浴びている。懸念を表明しているのは、著作権の問題や盗作を気にする人たちだ。ここで興味深いのは、Googleのシステムのおかげで、売り上げが向上したと発表している出版社がいくつか存在することだ。もう1つ言わせてもらうと、現在の電子書籍に採用されている役立たずなDRMの仕組みより良いものが出来上がるに決まっているのだから、やはり自分はGoogleを応援したい」--GottaBeMobile
posted by gljblog at 00:00| Google Book Searchプロジェクト | このブログの読者になる | 更新情報をチェックする

2007年01月22日

Google Book Searchにテキサス大学オースティン校も加わる

2007年1月22日(月曜日)
Google Book Searchにテキサス大学オースティン校も加わる
http://www.dap.ndl.go.jp/ca/modules/car/index.php?p=2910

Googleの書籍デジタル化プロジェクト“Google Book Seach”に、テキサス大学オースティン校が加わると発表されました。同校の図書館は全米で5番目の規模で、中南米の貴重書・手稿などを集めたNettie Lee Bensonコレクションなどが有名とのことです。

University of Texas at Austin becomes our latest library partner - Inside Google Book Search
http://booksearch.blogspot.com/2007/01/university-of-texas-at-austin-becomes.html
The University of Texas Libraries Partner with Google to Digitize Books - The University of Texas at Austin
http://www.utexas.edu/opa/news/2007/01/libraries19.html

posted by gljblog at 00:00| Google Book Searchプロジェクト | このブログの読者になる | 更新情報をチェックする

Google Library Keeps Growing, and Growing

http://www.gameshout.com/news/google_library_keeps_growing_and_growing/article8907.htm

Google Library Keeps Growing, and Growing
Posted Jan 22, 2007, 2:44 PM ET

Google has added another major U.S. college library to it's library project to put all the world's books online.

The University of Texas library in Austin Texas has better than one million written works, and Google intends to convert them all into digital format and add them to the Google Library Project. Some of the university's collection includes some rare books and manuscripts from early Latin American history.

University director of libraries Fred Heath said in a statement today that "Intellectual discovery is at the heart of the scholarly research process." Be further added that "the best collections of information are only as useful as the quality of the tools available for discovering and accessing that information."

Google initiated the Google Book Search project in 2004. Its aim was to scan every literary work into digital format and make them available online. Google has partnered with the New York Public Library and major universities such as Harvard, Oxford, Complutense of Madrid and the University of California to add their collections to its virtual book shelves.

They have of course faced some opposition as received outcries from publishing houses and authors. For this reason, Google modified its online library to offer only summaries of copyrighted works along with information regarding where to buy or borrow the books. Additionally they have seen complaints saying that since Google is a U.S. company, they are favoring only English works, but Google plans on rolling out a Google Book Search in French.
posted by gljblog at 00:00| Google Book Searchプロジェクト | このブログの読者になる | 更新情報をチェックする

Googleの書籍本文検索プロジェクトにテキサス大学が参加,100万冊以上をデジタル化

http://itpro.nikkeibp.co.jp/article/NEWS/20070122/259203/

Googleの書籍本文検索プロジェクトにテキサス大学が参加,100万冊以上をデジタル化

 米Googleは米国時間1月19日,同社の書籍本文検索プロジェクト「Google Books Library Project」に,テキサス大学オースチン校(UTA)が参加すると発表した。UTAの図書館は,米国大学のなかで5番目の規模を持ち,Nettie Lee Benson氏の中南米に関する蔵書で有名という。

 これにより,GoogleはUTAと協力して100万冊以上の書籍をデジタル化し,書籍検索サイト「Google Book Search」(ベータ版)で本文を検索できるようにする。著作権が消滅している書籍に関しては,全テキストの閲覧や検索が可能(関連記事)。一方,著作権が保護されている書籍は,タイトルと著作者名,検索キーワード周辺の数行だけを表示する。

 なお,Google Books Library Projectには既にミシガン大学,ハーバード大学,スタンフォード大学,カリフォルニア大学,スペインのマドリッド・コンプルテンセ大学,ニューヨーク公立図書館,英国のオックスフォード大学などが参加しているが,著作権の観点からさまざまな論議を呼んでいる(関連記事)。

(ITpro)  [2007/01/22]

posted by gljblog at 00:00| Google Book Searchプロジェクト | このブログの読者になる | 更新情報をチェックする

Google's library grows and grows

http://australianit.news.com.au/articles/0,7204,21097119%5E15841%5E%5Enbv%5E,00.html

Google's library grows and grows
Correspondents in San Francisco
JANUARY 22, 2007

GOOGLE has announced that another major US college library had joined its controversial project to put the world's books online.

The more than one million written works at the University of Texas library in Austin will be converted to digital format and added to Google Books Library Project.
The university's collection includes rare books and manuscripts from early Latin American history, Google said.

"Intellectual discovery is at the heart of the scholarly research process," university director of libraries Fred Heath said in a statement.

"The best collections of information are only as useful as the quality of the tools available for discovering and accessing that information."

The Google Book Search project was initiated in 2004 with the aim of scanning every literary work into digital format and making them available online.

Google has partnerships with the New York Public Library and major universities such as Harvard, Oxford, Complutense of Madrid and the University of California to add their collections to its virtual book shelves.

The company has stored on its searchable database classic works in the public domain, along with copyrighted books either sent with or without the publishers' permission.

After outcries from publishing houses and authors, Google modified its online library to offer only summaries of copyrighted works along with information regarding where to buy or borrow the books.

Google has rejected claims that, being based in the United States, it has favoured English and it promised it would next roll out a Google Book Search in French.

Opposition to the project, particularly by French and US editors, resulted in a group of book publishers forming the Open Content Alliance (OCA) in October of 2005.

The OCA is a non-profit organisation which joins together an array of universities, foundations, and data processors to create a "common pot" of digitised books available online for download or printing.

The OCA won the support of Yahoo, which was to tailor a search engine for the alliance and finance converting 18,000 books to digital format.

Microsoft promised to contribute 150,000 digitised books to the OCA collection. The OCA hoped to recruit the National Library of France, where 90,000 books have already been scanned.

Microsoft launched an online library in December in a move that pits the world's biggest software company against Google's book project.

Microsoft said the US test version of Live Search Books featured tens of thousands of out-of-copyright books, including works held by the British library and major universities in the United States and Canada.

Microsoft has book-scanning partnerships with New York Public Library and the American Museum of Veterinary Medicine. It also has agreements with the University of California system and the University of Toronto.

At stake for the companies were revenues that could be raked in by placing ads on web pages visited by book-seeking internet surfers.

Reuters


posted by gljblog at 00:00| Google Book Searchプロジェクト | このブログの読者になる | 更新情報をチェックする

2007年01月20日

Google Books Libraryにテキサス大学オースティン校が参加

Google Books Libraryにテキサス大学オースティン校が参加

全米の大学図書館で第5位の規模を誇るテキサス大学オースティン校が、Google書籍検索プロジェクトへの参加を表明した。

2007年01月20日 07時36分 更新
http://www.itmedia.co.jp/news/articles/0701/20/news005.html

 米Googleは1月19日、テキサス大学オースティン校がGoogle書籍検索プロジェクトに参加したと発表した。同大学図書館は全米の大学図書館のなかでも第5位の規模を誇り、特にラテンアメリカ関連のコレクションBenson Collectionは世界的にも有名だ。

 Benson Collectionは当初、メキシコに関する希少本や文書の寄贈から始まったが、現在ではラテンアメリカに関連する豊富な文献を蔵する。特にブラジル、チリ、ペルー関連の書籍は充実しており、アルゼンチンや中央アメリカ諸国の書籍も多い。同コレクションはラテンアメリカの歴史、政治、社会学、著名な作者の文献を年代順に保管している。

 Googleとテキサス大学は、100万冊以上を共同でデジタル化していく計画で、誰もがWeb上で自由に閲覧可能となる。著作権の存在する書籍については、書籍のタイトルと作者名、書籍に関する簡単な情報と購入(または借り出し)方法が表示される。

posted by gljblog at 00:00| Google Book Searchプロジェクト | このブログの読者になる | 更新情報をチェックする

Google Books Libraryにテキサス大学オースティン校が参加

Google Books Libraryにテキサス大学オースティン校が参加

全米の大学図書館で第5位の規模を誇るテキサス大学オースティン校が、Google書籍検索プロジェクトへの参加を表明した。

2007年01月20日 07時36分 更新
http://www.itmedia.co.jp/news/articles/0701/20/news005.html

 米Googleは1月19日、テキサス大学オースティン校がGoogle書籍検索プロジェクトに参加したと発表した。同大学図書館は全米の大学図書館のなかでも第5位の規模を誇り、特にラテンアメリカ関連のコレクションBenson Collectionは世界的にも有名だ。

 Benson Collectionは当初、メキシコに関する希少本や文書の寄贈から始まったが、現在ではラテンアメリカに関連する豊富な文献を蔵する。特にブラジル、チリ、ペルー関連の書籍は充実しており、アルゼンチンや中央アメリカ諸国の書籍も多い。同コレクションはラテンアメリカの歴史、政治、社会学、著名な作者の文献を年代順に保管している。

 Googleとテキサス大学は、100万冊以上を共同でデジタル化していく計画で、誰もがWeb上で自由に閲覧可能となる。著作権の存在する書籍については、書籍のタイトルと作者名、書籍に関する簡単な情報と購入(または借り出し)方法が表示される。

posted by gljblog at 00:00| Google Book Searchプロジェクト | このブログの読者になる | 更新情報をチェックする

2007年01月11日

カタロニア国立図書館が“Google Book Search”プロジェクトに加わる(スペイン)

2007年1月11日(木曜日)
カタロニア国立図書館が“Google Book Search”プロジェクトに加わる(スペイン)

“Inside Google Book Search"によると、スペインのカタロニア国立図書館が“Google Book Search”プロジェクトに加わるようです。なお1/11の時点で、カタロニア国立図書館からの公式発表はなされていません。

The National Library of Catalonia joins the Library Project
http://booksearch.blogspot.com/2007/01/national-library-of-catalonia-joins.html

Biblioteca de Catalunya
http://www.bnc.cat/
posted by gljblog at 00:00| Google Book Searchプロジェクト | このブログの読者になる | 更新情報をチェックする

カタロニア国立図書館が“Google Book Search”プロジェクトに加わる(スペイン)

http://www.dap.ndl.go.jp/ca/modules/car/index.php?p=2844

カタロニア国立図書館が“Google Book Search”プロジェクトに加わる(スペイン)

“Inside Google Book Search"によると、スペインのカタロニア国立図書館が“Google Book Search”プロジェクトに加わるようです。なお1/11の時点で、カタロニア国立図書館からの公式発表はなされていません。

The National Library of Catalonia joins the Library Project
http://booksearch.blogspot.com/2007/01/national-library-of-catalonia-joins.html

Biblioteca de Catalunya
http://www.bnc.cat/

posted by gljblog at 00:00| Google Book Searchプロジェクト | このブログの読者になる | 更新情報をチェックする

2007年01月09日

ICADL2006 - Google Book Search技術担当者が語るデジタルアーカイブ

【レポート】
ICADL2006 - Google Book Search技術担当者が語るデジタルアーカイブ
2007/01/09
http://journal.mycom.co.jp/articles/2007/01/09/icadl/menu.html


(1) Google Book Searchの驚異

人類の知=書物すべてを検索可能へ

サーチエンジンを手始めに、Google マップ、Gmailと多角展開しつつ、売り上げの90%を広告から得ている広告企業Google。そのGoogleが目標に掲げるのが、これまでの人類の知すべてを検索可能にすることである。

具体的にGoogleが進めているプロジェクトが、これまでに刊行された書物すべてをスキャンしてデジタル化し、OCRでテキスト化、検索可能にする「Google Book Search」(日本では「Google ブック検索」)である。

Googleは、アメリカ内外の大学図書館や公共図書館と協力して、全書籍のデジタル化を進めている。パートナーには、ハーバード大学、ミシガン大学、カリフォルニア大学、オックスフォード大学、スタンフォード大学、ニューヨーク公共図書館などが名を連ねる。ちなみに、それぞれの蔵書には日本の出版社の蔵書も含まれていて、それらも分け隔てなくスキャンの対象となっている。

このGoogle Book Searchには、驚かされるところがいくつもある。

ひとつは、ブルドーザー的なスキャンの規模である。

もうひとつは、著作権への対応である。

ご存じかと思うが、筆者は『記憶する住宅』というプロジェクトで、これまでに約100万ページのデータをスキャンおよびデジタル写真によって蓄積してきた。1冊200ページの書物として換算すると、だいたい5,000冊分に相当する。これは個人の規模としては充分大きいが、Googleのやろうとしている規模にはとうてい及ばない。というか、Googleの全書籍のスキャンと比較すると、ドン・キホーテ的な香りもする。

全書籍とは、なんとも勇ましいというか、うらやましいというか、いったい、これはどういうことなのだろうか。

米GoogleのBook Searchプロジェクトの技術責任者であるDaniel Clancy(ダニエル・クランシー)氏が来日して講演した。


(2) Google創業者、ラリーとサーゲイのアイデアとは

デジタルライブラリーを作ろう

ダニエル・クランシー氏の講演は、Googleの歴史から始まった。Googleはご存じのように、スタンフォード大学の学生だったラリー・ペイジ氏とサーゲイ・ブリン氏が共同で創業した。

「Googleは情報にアクセスするのを容易にした」とクランシー氏はいう。「人びとはlazy(怠け者)で、ちょっとだけの文字(をタイプして)大量の情報にアクセスしたいと思っている。Googleは求めているものを提供した」

ラリーとサーゲイのアイデア(Larry and Sergey's Idea)。それは、「デジタルライブラリーを作ろう」というものだった。「デジタルライブラリーは必要で役に立つ」と考えたのだ。「すべての情報とおなじように、ひとはすべての本にアクセスしたいと思っている」

これは筆者自身の体験でもあるのだが、デジタル化した書物は、じっさいに本棚に入って死蔵しがちの書物より、ずっと身近に感じられるようになってくる場合がある。とくに、書棚に本があふれて、本が前後二段に入っていて、どこに求める本があるかどうかわからないような場合には顕著だ。

最初に読むときには紙の本のほうが2万倍くらい優れているけれど、一度読み終わったあとで、もう一度本にアクセスしたいと思ったら、デジタル化された本のほうが、ずっと効率的にアクセスすることが可能だ。

「Googleのミッションは、世界の情報を体系づけ、アクセス可能にし、役立てること」とクランシー氏はいう。そして、その対象となるのが、オンラインコンテンツでありすでに検索対象となっているWebページと、オフラインコンテンツでありまだインデックス化されていない厖大な書物なのである。


米GoogleのBook Searchプロジェクトは、世界中の本を完全に検索可能にすることを目的とする


著作権の切れた85%
Googleが打ち出すふたつの方針とゴールは、次のようなものだ。

まず、出版社と協力して行う「出版社向けプログラム」。

Googleによれば、過去ならびに現在出版されたすべての書籍のうち、わずか15%が流通している状態にある。これらをスキャンするのが出版社向けプログラムである。

残りの85%は、絶版になっていたり、すでに著作権の切れているもの。これらの本は図書館でしか見つけることができず、これをスキャンするのが「図書館プロジェクト」である。

そして、Googleスキャンのゴールは、出版社の権利をクリアした状態で、すべての書籍の総合的なスキャンを完了することだ。

「Googleは、法律を遵守する」とクランシー氏はいう。

書籍のスキャンというと、著作権の問題をどうクリアするかは、きわめて重要なテーマとなる。


(3) "すべての本"とは一体なにか

歴史的に誕生したすべての本はわずか4億冊

すべての本。

ここで問題なのが、じゃあぜんぶの本というのは、どのくらいあるんだ、という話である。

クランシー氏によれば、各図書館の蔵書数は、700万〜2,400万冊。合計するとざっと1億冊となる。ここには重複しているものもあるだろう。Googleの見積もりでは3,000万冊となっている。

別の計算もできるかもしれない。

日本で1年間に出版される本の冊数は74,587点(2004年)である。1980年ごろには、5万冊を超えたというような話があった。戦後、紙が少なかったころにはもっと小規模だったが、グーテンベルグの15世紀以降、約500年にわたって本は出版されてきたわけだ。

とくに、20世紀後半(戦後)の50年と現在までを書物の爆発期としてひじょうに大ざっぱに計算すると、次のようになる。

7万冊/年間×(2006-1945年)=430万冊。

この50年間に、日本で出版された全書籍の合計は、ざっと430万冊である。

日本の図書といえば、明治からスタートし、主として納本によって「すべての本」を収蔵している国立国会図書館の蔵書数が目安となる。2005年度の蔵書数は、図書8,598,798冊(うち、和漢書6,199,302冊、洋書2,399,496冊)。620万冊である。書店で販売する書籍と国会図書館のいう図書との概念にはややずれがあるだろうし、先の430万冊は1945年以前の書籍は含まれていないから、620万冊というのはまあ納得できる数である。

外務省によれば、世界には2006年7月現在で、192の国がある。これほどの大規模な出版というのは、それなりに国が安定していなければできないだろうから、このうち半数の85カ国で毎年7万冊出版されたと仮定しよう。たとえば、『A Wild Haruki Chase 世界は村上春樹をどう読むか』(文藝春秋 柴田元幸ら編)によれば、村上春樹の本は世界の40カ国近くで翻訳されているという。そうだとすれば、本ということでいえば、85カ国というのはあながち根拠が皆無ということでもないだろう。合計の本は次のようになる。

7万冊/年間×61年×85カ国=3億6,295万冊。ざっと3.6億冊である。620万冊×85カ国としても5.3億冊にとどまる。

全書籍をスキャンする作業量

Googleの統計の1億冊よりも多めの見積もりになるが、それはまあ数字を多めにとっているための誤差だ。こういうのを誤差といってよいのか微妙ではあるが、まあ人間がこれまでに作ってきた本の総数は、1億冊から4億冊程度で収まる、と考えてよいだろう。これだけ大ざっぱに計算してわずか4倍程度の差もないのだ。この数字の桁が、何桁も違うことは考えにくい。たとえば、1兆冊とかではない、ということだ。

1億冊とか4億冊というのは、もちろん充分に多い。充分に多いけれど、思った程でもないな、というのが筆者を始めとするおおぜいの感じるところではないだろうか。

ひとりで5,000冊スキャンするとしたら、4億冊をスキャンするとして、のべわずか8万人で足りるのである。10年で作業するとすれば8,000人でよい。

あるいはまた、スキャナーの性能からでもいい。キヤノンのもっとも安価なドキュメントスキャナ「DR-2050C」は、性能上1日に700枚程度のスキャンが推奨されている。ざっと200ページの書籍3冊分である。これを使って、1年間に200日スキャンしたとすると、1年間で600冊をスキャンできることになる。のべ7万人(7万台)で10年作業をすれば、4億冊である。作業量から計算しても、4億冊は「たったその程度」の分量にすぎない。「歴史上刊行された全書物」というバベルの塔的な途方もなさに較べれば、これは充分現実的な数字だ。

「いまGoogleは、書籍のデジタル化にフォーカスしている。その仕事はとてもかんたんな仕事のひとつだ」とクランシー氏は説明する。たしかに、本のスキャンはコピー取りと同程度にかんたんな仕事である。


テクノロジーが可能にする!
「これから24年で、書籍の一次情報へのアクセスをテクノロジーが可能にする。これは革命だ」とクランシー氏は断言する。すべての書籍のオリジナルソース、オリジナル情報にアクセスできるようになるのだ。

Googleとパートナーによるその1億冊の本の内訳は、次のとおりだ。

15%は現在出版されていて著作権の現存するもの。65%が著作権が明瞭でないもの。著作権の寿命からいって、1923年以降の書籍がこれに該当する。20%が著作権の切れたもの。

全書籍のスキャンは物量で解決できる問題であるが、著作権のほうは法的な問題をクリアにする必要がある。「Copyright War」とクランシー氏はいう。

著作権の状態によって、表示の仕方も変わってくる。たとえば著作権の現存するページは、書籍のうちサンプルのページのみを表示する、明瞭でないものは部分的な表示をする、著作権の切れたものは全ページをページイメージで表示する、というようなかたちになる。著作権者の意向によっては、サンプルのみの表示さえできないこともあるだろう。

実例として、ここでクランシー氏は、じっさいにGoogle Book Searchにアクセスし、「kyoto history」をキーワードとして入力、Mary Elizabeth Berry著の『The Culture of Civil War in Kyoto』のページをめくってみせた。

検索にヒットした文字には、イエローのマーカーラインが引かれている。めくるのとは違うが、スクロールできる。本とは違うが、Webページよりもずっと書物としての本に近い。

この本に、じっさいにGoogle Book Searchを使ってアクセスしてみると、すべてのページは公開されていないことがわかる。つまり、この本は、著作権をもっているか、著作権の状態が不明の書物だということである。洋書には奥付がないことが少なくないので、出版年月がいつかはわからなかったが、アマゾンへのリンクがありそちらを見ると、1997年3月20日発行とある。

ちなみに、アマゾンのSEARCH INSIDE!(「なか見!検索」)でも、この本のなかのページに、おなじようにアクセスすることができている。スキャンをしているのは、ひとりGoogleだけではないのだ。

上記のパートナーの図書館に収蔵されていれば、日本語の本もスキャン対象となっている。たとえば日本語ではもっとも一般的なひらがなと思われる「は」で検索すると、319冊の本がヒットする。「の」では4,480冊が、「た」では0冊がヒットした。これで見ると、すくなくとも4480冊程度は日本語の本もすでにスキャンされて検索できるようになっているのである。


Googleは書物のスキャンに対してふたつのアプローチをとっている
著作権の状態によって、表示できる状態を変化させる



この本はアマゾンでも中身を見ることができる
日本語の本もスキャンの対象となっている。「は」で検索すると319冊がヒットした


Book Flow Process
続いてクランシー氏は、米国初代大統領ジョージ・ワシントン(1732年2月22日-1799年12月14日)の日記を開いた。著作権が切れているため、この本は、ほとんど本そのもののように表示される。

スキャンしたページを見ていくと、たとえば12ページには下に黒い染みがあるなど、ほんとうにその本のありのままの状態に近い形でスキャンしていることがわかる。その他のページを見ても、必ずしもスキャンの精度が高いとはいえない。

Google Book Searchでは、高いクオリティを求めていないことは見ればすぐにわかる。

表示がモノクロ表示になっていて、本来書籍のもつカラー情報は失われている。

このあたりが、写真や絵を忠実に再現しようとするグラフィックスキャンとの作業の違いである。

「数千万の本があり、それを効率的にスキャンする必要がある」とクランシー氏はいう。「Googleは本をスキャンし、蓄積し、インデックスをつけて検索可能にしてサービスとして提供する」


ジョージ・ワシントンの日記
ジョージ・ワシントンの日記の12ページには黒い染みもある



スキャンした本にはレファレンスページも用意され、本が絶版になっていなければ購入することもできる
本をスキャンし、蓄積し、インデクシングしてサービスする


立ちはだかる難題
じっさいの書物を前にしては、「ページを知る」ということさえもむずかしいことになる可能性がある。

クランシー氏は、事例をあげる。

「あるページの肩の部分が斜めに破かれていました。はたしてこれは何ページでしょう?」

「(破かれて次のページが99ページなのだから)97ページになる!」と、会場の声。

「OCRで読むとしても、ロシア語と英語とが混在している本の場合、スペルはどうやって判定したらよいでしょう? 日本語のような縦書きの場合には?」

結局、本というものは、通常思っているよりもずっと柔軟で、これと定まったかたちをもっていない、ということに直面せざるを得ない。これが唯一という真実はないのである。それを機械的に自動的にスキャンする方法は、たぶんまだない。

「書籍をスキャンする」作業のうち、物理的なスキャンというのは、もっとも単純でかんたんな作業で、それ以外のページを見極めるとか、テキスト化するとか、分類整理するとか、著作権をクリアする(著作権者の権利と公共の利益のバランスを取る)とかのほうが、重要な課題なのだ。


たとえばページが破かれた本
ロシア語と英語が混在した書籍のスペルチェックを自動化するには?
日本語のような縦書き右綴じの場合のページ送りは英文の書物とは逆になる


Finding Stuff
「書籍をスキャンするよりも重要なのは、たとえばどうやってわれわれは探したいものを探しているか、ということを考えることだ」とクランシー氏はいう。

検索するのか、ブラウジングして閲覧するのか、偶然の発見をするのか、検索補助(アシスタンス)によるのか。

検索するといっても、リッチで明解な構造は存在しない。問題は山積している状態だが、Googleは物量で問題を乗り越えようとしている。


どうやってひとは探したい情報を探しているのだろうか
問題は山積し議論しながら進めている、とダニエル・クランシー氏

posted by gljblog at 00:00| Google Book Searchプロジェクト | このブログの読者になる | 更新情報をチェックする

2006年12月04日

グーグルの戦法に専門家が賛否両論──著作権侵害訴訟で

http://www.computerworld.jp/news/trd/53849.html

グーグルの戦法に専門家が賛否両論──著作権侵害訴訟で
(2006年12月04日)

 米国グーグルが著作権侵害で提訴されている問題で、新たな論争が起きている。同社が今回の提訴と関係のないライバル企業に対し、機密情報の提供を求めて召喚状を送付したことについて、法律専門家の意見が真っ二つに分かれているのだ。召喚状を送付されたヤフー、アマゾン・ドットコム、マイクロソフトの3社は困惑の色を隠せない。

 グーグルは昨年、同社の「スキャン・プロジェクト」と呼ばれる書籍検索サービスが著作権を侵害したとして、米国出版者協会(AAP: The Association of American Publishers)、米国著作者協会(AG:The Authors Guild)、および3人の個人著作者から提訴された。原告側は、著作権で保護された図書館の所蔵本を著作権者の許諾なしにスキャンして検索可能にすることは違法だと主張している。

 これに対してグーグルは、スキャン・プロジェクトについて、著作権がある作品でも限定的な利用が認められる「公正利用の原則」に当たると主張。検索時に作品の内容の一部しか表示されないことを、その論拠としている。

 また、グーグルは今年10月、裁判所を通じてヤフー、アマゾン、マイクロソフトの3社に召喚状を送り、書籍スキャンに関する各社の取り組みについて情報提供を求めた。グーグルは各社から情報を入手し、自社の正当性を主張するために利用しようとしているのだ。

 グーグルのこの作戦は、専門家の間で評価が真っ二つに分かれている。強引かつ異例であり、同社は裁判で有利な立場にはならないとの見方がある一方、著作権訴訟では一般的な防衛手法だと一定の評価をする意見も出されている。

 知的財産訴訟を専門とする法律事務所ブルームバーグ&サンスタインのパートナーであるリー・ブルームバーグ氏は、「召喚状の送付はこの種の訴訟で前例がない」としたうえで、グーグルの作戦をこう批判する。

 「ライバル会社が書籍のスキャンを行っているのであれば、グーグルも自社のスキャン・プロジェクトには違法性がないと主張するだろう。しかし、ライバル会社が召喚状に応じて情報を提供したとしても、グーグルに有利な証拠になるとは思えない。グーグルのやり方は度が過ぎている」

 同氏はまた、この種の召喚状送付は、訴訟に関連した情報を持っている非当事者の第三者から証拠を入手するための手段であると指摘する。例えば、グーグルがビジネス・パートナーや原告の知人に召喚状を送るのであれば、それは理にかなっているのだという。

 一方、ハーバード大学ロースクール バークマン・センターのフェローであり、インターネット関連の法律と知的財産を専門とするウェンディ・セルツァー氏は、まったく別の見解を示す。

 「召喚状の送付は一般的な防衛方法だ。グーグルは書籍のスキャンが著作権者や出版市場に打撃を与えないことを証明しようとしている。グーグルの最終的な目標は、『同社の活動が公正利用の原則に保護されている』というお墨付きを裁判所から得ることだ」

 グーグルが召喚状を送付した3社のうち、ヤフーとアマゾンは召喚に応じないことを表明している。さらに両社は、裁判所に提出した書類の中で、グーグルからの情報請求は不当なものであるとして徹底的に抵抗すると述べている。一方、マイクロソフトは召喚状への対応自体を明らかにしていない。

 ヤフーとアマゾンが召喚状に従わなかったため、グーグルはこの2社とも法廷で争うことになった。グーグルは両社に対し、召喚状に応じる求めを裁判所に申し立てすることができる。裁判所が申し立てを認めた場合、アマゾンとヤフーは上訴することも可能だ。

 グーグルは、ヤフーとアマゾンが召喚に応じなかったことについて、「現在進んでいる訴訟の一部」だとし、両社と話し合いを持ちたいとの意向を示している。

 これに対しアマゾンは、グーグルと会談するか否かについて態度を明確にしていない。一方、ヤフーの法務担当副代表弁護士であるレジー・デービス氏は、「われわれは召喚状に応じて書類を作成することはしないという立場だ」とコメントしている。

 デービス氏も、召喚状送付は攻撃的すぎだとしてグーグルのやり方に批判的だ。ヤフーは、著作権に配慮したアーカイブの構築を目指すOCA(Open Content Alliance)のメンバーであり、著作権に対する考え方がグーグルとはかなり異なっている。

 知的財産専門の弁護士で、法律事務所アレント・フォックスのパートナーを務めるシェルドン・クライン氏は、「グーグルの著作権侵害訴訟だけでなく、召喚状自体を巡って長期の論戦が展開される可能性がある」と語っている。


(ホアン・カルロス・ペレス/IDG News Service マイアミ支局)
posted by gljblog at 00:00| Google Book Searchプロジェクト | このブログの読者になる | 更新情報をチェックする

2006年11月22日

Google Book Searchにズームなどの新機能

http://www.itmedia.co.jp/news/articles/0611/22/news081.html

Google Book Searchにズームなどの新機能

本のページを縦に並べて、スクロールでページをめくれる1ページモードも追加された。
2006年11月22日 18時02分 更新

 米Googleは11月21日、書籍検索サービス「Google Book Search」に新機能を加えたことを明らかにした。

 今回追加されたのは、虫眼鏡のアイコンをクリックしてテキストや画像を拡大・縮小表示するズーム機能と、本のページを縦に並べて1ページに収め、スクロールでページをめくれる1ページモード。書籍によっては、紙の本を開いたときのように、見開きでページを表示する2ページモードもある。

 また、画面右上の「Full screen」アイコンをクリックすると、書籍のページをブラウザの画面いっぱいに表示することができる。さらに、「Summary」の下の「About this book」リンクをクリックすると書籍の詳細な情報が表示される。ここにはユーザーが関心を持っている本の関連書籍や、その本に言及しているほかの書籍や学術論文の情報が掲載されている。
posted by gljblog at 00:00| Google Book Searchプロジェクト | このブログの読者になる | 更新情報をチェックする

スクロールでページがめくれる「Google Book Search」の新UI公開

http://internet.watch.impress.co.jp/cda/news/2006/11/22/14022.html

スクロールでページがめくれる「Google Book Search」の新UI公開

 米Googleが書籍検索サービス「Google Book Search」のユーザーインターフェイスを大幅に改良したことが21日までに明らかになった。

 新しいユーザーインターフェイスでは、書籍のページ画面を縦にスクロールしていくだけでページが次々に読み込まれていく。これまでのように次のページを示す矢印をクリックする必要がないのは非常に便利だ。PDFを画面で表示している感覚だ。また、書籍表示画面をフルスクリーンに拡大できるるとともに、ズーム機能を使って文字の拡大・縮小も行なえる。字が細かい書籍を閲覧する時などには、フルスクリーンモードで文字を拡大するなど機能を組み合わせると、非常に利便性が高まる。

 Google Library Projectによって登録された書籍の場合には、本を見開き状態で読むことが可能だ。この場合、画面上部のアイコンをクリックすると元のスクロール画面に戻すこともできる。見開き状態で本を見る場合は普通の本を読んでいる感覚で利用できる。ページをめくる場合には右矢印をクリックする方法だけでなく、キーボードのスペースキーやPage Up、Page Downキーを押すことによってもめくれる。その場合には自動的に新しいページが読み込まれるため、キーを押していくだけで次々にページがめくれるという極めて読みやすいユーザーインターフェイスとなった。

 もう1つ重要な新サービスとして書籍に関する詳細な情報を提供する「About This Book」ページが用意された。これは書籍を表示している画面の右欄上部にある「About This Book」あるいは「More about this book」リンクをクリックすると表示できる。

 このページには書籍に関する概略の説明だけでなく、関連書籍一覧や書籍の中で引用されている書籍へのリンク、書籍の中で多用されるキーワードの一覧のほか、書籍の中から何ページかを選び出して書籍の様子を見ることができる。これらの情報にはサードパーティによる情報も含まれているという。このページを見ると、その書籍に関する必要な情報を一度に調べることができるという優れものだ。もちろんここから米Amazonなどのオンライン書店で購入することもできるし、その書籍が利用できる図書館を検索することも可能だ。Googleはこのページを生成するためにアルゴリズム的手法を採用して自動生成しているため、現時点ではこのページに表示される情報を要望に応じて変更することはできないという。

2006/11/22
posted by gljblog at 00:00| Google Book Searchプロジェクト | このブログの読者になる | 更新情報をチェックする

Google Book Searchにページ送り等の新機能

http://www.dap.ndl.go.jp/ca/modules/car/index.php?p=2584

Google Book Searchにページ送り等の新機能

Google Book Searchに、拡大/縮小機能、ページ送り機能、関連図書・引用文献の表示機能が追加されました。
posted by gljblog at 00:00| Google Book Searchプロジェクト | このブログの読者になる | 更新情報をチェックする

2006年11月21日

京都大学で、電子図書館に関する国際会議開催(ICADL2006)

http://www.dap.ndl.go.jp/ca/modules/car/index.php?p=2573

2006年11月21日(火曜日)
京都大学で、電子図書館に関する国際会議開催(ICADL2006)

11月27日〜30日にかけてICADL2006(アジアデジタルライブラリ会議)が京都大学で開かれます。Google Book Searchのディレクターの講演があるほか、特別セッションとしてシンガポール国立図書館、国立台湾大学、インドネシア大学等の電子図書館サービスについてのセッションが組まれています。

ICADL2006(アジアデジタルライブラリ会議)
http://www.icadl2006.org/index-jp.html

posted by gljblog at 00:00| Google Book Searchプロジェクト | このブログの読者になる | 更新情報をチェックする

A new way to browse books - Official Google Blog

http://googleblog.blogspot.com/2006/11/new-way-to-browse-books.html

A new way to browse books
11/21/2006 06:51:00 PM

Posted by Nathan Naze, Software Engineer

As a kid, I was a bit of a fixture at my hometown library. My mom and I would visit frequently and the librarians knew me by name. It's only fitting that now, decades later, I work as an engineer for Google Book Search, Google's project to make the world's books searchable, just like the web.

My latest assignment has been to help develop a better way to browse our digitized books on a computer screen. I've always had an interest in cutting-edge web applications ? existing Google products such as Gmail, Google Maps, and Google Docs & Spreadsheets make heavy use of JavaScript and DHTML to create full-featured applications in a web browser that you can use without having to download and install anything.

In an effort to make online book reading easier, we've given our product the same treatment. I'm tremendously excited to announce the first fruits of these efforts. Here's a quick tour of some of the changes:

Zoom in on text and images. Here's a cool full-page sketch of a ship from an 1898 book on steam navigation. Looking for something less dated? Perhaps this colorful page of a room from a book on interior design. Want a better look? You can now zoom in and out ? just click on the and buttons. Play with it until you find a size you like.

One book, one web page. No more reloads! In one-page mode (just click the button), pages appear one below the other, like a scroll of paper. For full-view books, there's also a two-page mode () in which pages appear side by side, just like in a physical book (perfect for two-page images). In both modes, you'll be able to use and to turn pages.

Scroll, scroll, scroll your book… using the scrollbar or your mouse wheel, or by dragging (in most browsers, you'll see a ). You can also use the keyboard (try the spacebar, page up, page down, and the arrow keys). Or you can click on a link in the table of contents or your search results to jump right to that page (like this photo from the 1906 book Geronimo's Story of His Life).

This page was made for reading. We've tried to tidy up the clutter to leave as much room as possible for what's important ? the book. We've put all the information about the book in a scrollable side menu. Still not enough room? You can put the screen in fullscreen mode with , so you can use the whole window for browsing. Try it with a nice illustrated book of Celtic fairy tales or, for some lighter reading, electromagnetic wave theory.

More on this (and other) books. Find other books that interest you. Just click on "About this book" to find more books related to the book you're reading. If the book How to Draw Comic Book Heroes and Villains interests you, you'll probably like Comic Book Artist Collection, Vol. 1. We also revised our "About this book" page to provide better information for in-copyright books, from which you can just see short snippets or a limited preview.

Explore citations and references. You can also find other books that refer to your book of interest. If scholarly works from Google Scholar have references to the book, you'll see them too. As an example, see what other works have referred to Aristotle's works or the 1922 book All About Coffee.
So check out the new Google Book Search. We hope it'll help you find new (and old) books that interest you. Try it out, and let us know what you think.

posted by gljblog at 00:00| Google Book Searchプロジェクト | このブログの読者になる | 更新情報をチェックする

2006年11月16日

Google Books Library Projectにバージニア大学図書館も参加

http://www.dap.ndl.go.jp/ca/modules/car/index.php?p=2554

Google Books Library Projectにバージニア大学図書館も参加
2006年11月16日(木曜日)

Google Books Library Projectの9番目の参加機関として、バージニア大学が加わることが発表されました。

The University of Virginia Library Joins the Google Books Library Project
http://www.google.com/press/annc/books_uva.html

U.Va. Library Joins the Google Books Library Project
http://www.virginia.edu/uvatoday/newsRelease.php?id=1053
posted by gljblog at 00:00| Google Book Searchプロジェクト | このブログの読者になる | 更新情報をチェックする

2006年11月15日

バージニア大学、GoogleのBooks Libraryに参加

http://www.itmedia.co.jp/news/articles/0611/15/news019.html

バージニア大学、GoogleのBooks Libraryに参加

米国建国の父のひとり、第3代大統領トーマス・ジェファーソンが設立したバージニア大学図書館も、Googleの書籍検索プロジェクトに参加する。
2006年11月15日 07時57分 更新

 米Googleは11月14日、書籍検索プロジェクト「Google Books Library Project」に、新たに米バージニア大学が参加すると発表した。同大学の図書館はトーマス・ジェファーソン大統領が設立、米国建国時の蔵書や資料の豊富さで知られる。

 同図書館は拠点であるバージニア州ロタンダを中心に13カ所に支所を持ち、500万冊を超える蔵書、1700万以上の原稿、稀少本、デジタル文書を所有。Googleは図書館が所有する歴史、文化、人文科学関連の蔵書の一部をデジタル化する。

 パブリックドメインにある同大学の書籍については、誰もが自由に検索、閲覧可能となる。著作権がある書籍については、「Book Search」機能で基本情報(書籍名、著者名など)のみが見られる。その本を入手可能な場所や借りられる図書館などについての情報も表示される。

 Googleの書籍検索プロジェクトには、既に米国議会図書館、ハーバード大学、ニューヨーク公立図書館、カリフォルニア大学、ミシガン大学、オックスフォード大学、スタンフォード大学、ウィスコンシン大学マディソン校などがパートナーとして参加、蔵書のデジタル化を進めている。
posted by gljblog at 00:00| Google Book Searchプロジェクト | このブログの読者になる | 更新情報をチェックする

2006年11月14日

U.Va. Library Joins the Google Books Library Project

http://www.google.com/intl/en/press/annc/books_uva.html

U.Va. Library Joins the Google Books Library Project

Nov. 14, 2006 -- Today, Google welcomes its newest partner - the University of Virginia Library - to the Google Books Library Project. Built by Thomas Jefferson, one of the founding fathers of the United States, the U.Va. Library carries a wealth of early American historical material among its rich collections.

Google will digitize hundreds of thousands of books from the Library, including selected portions of the Library's American history, literature, and humanities works collections, and make them searchable online through Google Book Search. With 13 physical locations as well as the original Rotunda, the Library contains more than five million volumes, 17 million manuscripts, rare books and archives, and rapidly-growing digital collections.

For scholars and readers all over the world, this offers even more access to the great works of history and culture. By simply searching online, researchers across the globe can discover books held on the shelves of the U.Va. Library, including a broad range of materials from American literature to Buddhist studies.

"This is an historic moment," said University President John T. Casteen III. "When Jefferson designed the University, he placed the library at its center -- both physically and academically. Reading and the quest for knowledge were all-important to him. Reaching out into the world -- what we now call Globalization -- was central to his vision of what an American university must do to promote the knowledge that sustains personal freedom. To have the library that is the clearest single emblem of this vision now assume a role in a vast, international digital library has special meaning here. It puts a distinctly contemporary meaning to our founder's dream of making knowledge accessible to all people."

Anyone will be able to freely view, browse and read U.Va.'s books in the public domain. For books protected by copyright, scholars searching on Book Search will be able to see the basic background of relevant books (such as the title and the author's name), and at most a few lines of text related to their search. They can also find information about where they can buy or borrow a book.

The University of Virginia becomes the latest partner in the Google Books Library Project, which also includes the University of California, Harvard University, University Complutense of Madrid, University of Michigan, the New York Public Library, Oxford University, Stanford University and the University of Wisconsin-Madison. Google is also conducting a pilot project with the Library of Congress.

The Google Books Library Project digitizes books from major libraries around the world and makes their collections searchable on Google Book Search. More information can be found at: http://books.google.com .

Also see today's blog post on the Google Book Search about the announcement: http://booksearch.blogspot.com/.

posted by gljblog at 00:00| Google Book Searchプロジェクト | このブログの読者になる | 更新情報をチェックする

広告


この広告は60日以上更新がないブログに表示がされております。

以下のいずれかの方法で非表示にすることが可能です。

・記事の投稿、編集をおこなう
・マイブログの【設定】 > 【広告設定】 より、「60日間更新が無い場合」 の 「広告を表示しない」にチェックを入れて保存する。


×

この広告は1年以上新しい記事の投稿がないブログに表示されております。