ビジネス創出

図書館検索カーリルから見える図書館の実態[前編]――全国6,800館を一元化

記事内容の要約

  • 既存の図書館システムのユーザーは1館ごとでは少ないが、全国が対象なら大きな利用規模になると気づく
  • 公共要素の強い事業に長期的な視点で取り組むために短期的な収益モデルは考えない
  • 自社で開発したソフトウエアなどはオープンソースとして公開し、公共性を高めている
  • はてなブックマーク
  • follow us in feedly

図書館検索サイト「カーリル」(*1)は、全国6,800以上の図書館・図書室にある本の所蔵情報と貸し出し状況を、誰でも簡単に検索できるサービスだ。岐阜県中津川市にある従業員5人の株式会社カーリルは、その卓抜した思想とエンジニアリングによって、いまや図書館とユーザーをつなぐ欠かせない存在になりつつある。前編では、「すべての図書館をつなぐ」ことをめざすカーリル誕生の経緯としくみ、その狙いについて探っていく。株式会社カーリル代表取締役・エンジニアの吉本龍司氏に話を聞いた。

サービスの対象は “全国”であることが絶対条件

吉本氏が図書館に関連した事業に関わるようになったのは、たまたま地元の図書館関係者から、「(蔵書検索を中心とした)図書館システムがせっかくあるのに、利用者は年間100人しかいない」という話を聞いたのがきっかけだった。

「数千万円かけてシステム開発を行っても、年間利用者はたったの100人。ほかの地域の図書館を見ても似たような状況であることが多く、コストをかけた割に活用されておらず、多くの人々が使いたくなるような図書館システムがないと感じました」(吉本氏)

しかしその一方で、図書館システムを手がけることへの可能性も吉本氏は感じたという。

「人口8万人の都市に利用者が100人いるなら、全国で見てみれば実は相当数のユーザーがいるのではないかとも思いました。それなら、自分で全国のユーザーに使ってもらえるような図書館の蔵書検索サービスを作ってみるか、と思い立ったのです」

吉本氏が図書館システムの開発を決めたと同時に意識したことは、「全国の図書館を対象に検索できるようにする」ということだった。「使われるためには、ユーザーの利便性を上げなくてはならない。特定の図書館だけで蔵書を管理するシステムをつくるのではなく、『ここになかったら違う図書館で』と、蔵書を横断的に探せるようにする必要があり、そのためにも絶対に“全国”を対象にしなくてはいけない」と考えたという。

たとえば、市立図書館であれば、蔵書検索の対象は各自治体内の図書館に限られることが一般的だ。その制約をなくして全国の図書館を対象に蔵書検索できることで、より多くの人にとって利便性の高いサービスになるというわけだ。

そしてウェブ上に蔵書情報を公開している図書館すべてを対象とし、スクレイピング(*2)でデータを収集、効率的に統合し、利用しやすい形に加工・編集してウェブ上で提供してサービスを開発した。

サービス開始は2010年3月。蔵書検索できる図書館は4,300館からスタートし、2016年12月時点で6,800館と、公共図書館の93%以上をカバーしている。「絶対に“全国”を対象にやらなければいけない」というこだわりから、大学図書館や専門図書館、公民館図書室などの情報も含んでいる。現在対象となっていない図書館は離島など、そもそも図書館側が情報公開していないケースがほとんどだ。

カーリルウェブサイト
カーリルウェブサイト

一般的な検索ニーズのほとんどに対応

世の中に出回っている本には、一部の同人誌や古書などを除き、「ISBN(国際標準図書番号)」という書籍を特定するための番号がつけられており、カーリルの蔵書検索システムも、ISBNを図書固有のIDとして利用している。

「実は当時、世の中のすべての本にISBNが付与されていると思っていました。図書館が独自に管理している郷土資料や古書のようなものは把握することが難しく、現在もISBNのない本には対応できていないことは欠点ですね」

吉本氏は自虐気味にそう話すが、ISBNが付与されている本だけで、一般的な検索ニーズのほとんどを網羅できている。図書館関係者だと、どうしても「すべて検索できるようにしなければ」という発想になってしまいがちだが、まずはできるところだけでもすぐ探せるように、というのは民間企業ならではのフットワークの軽さだろう。

データ連携のポイントは「HTML」

カーリルでは、前述のようにスクレイピングによって蔵書データを取得しているが、それは「図書館システム分野のデータ連携において、一番安心して使えるデータはHTML」という吉本氏の考えに基づいている。これはどういう意味なのだろうか。

「一見、APIを使ってデータを取ってくるほうが機能的で効率もよさそうに思えますよね。でも現実は、図書館がAPIを提供しているケースは少ないんです。さらにAPIを提供していたとしても、正常に機能していなかったり、データが脱落・劣化していたりして、使い物にならないことが多いのです」(吉本氏)

図書館側のシステム運用の主な目的は、一般ユーザー向けの蔵書検索や情報提供であり、API提供はプラスアルファのサービスという位置づけが多い。そのため、メンテナンスのためのリソースが十分に取れないことも多く、結果的にデータが脱落・劣化してしまうことも少なくないのだ。

さらに、大半の図書館システムは5年リースで、入れ替え時には何日もサービスを止めてしまう。「カーリル」のデータでも、検索対象6,800館のうち、毎日10館前後はサービスが止まっているのだという。一般的なウェブサービスが24時間365日稼働し、メンテナンスなどでもなるべく止めないのとは対照的な話である。

「限られたエンジニアしか不具合に気づけない、時々止まってしまうようなAPIより、一般ユーザーや図書館司書が日常的に利用しているHTMLページのデータのほうが信頼性は高いといえます」と語る吉本氏。HTMLをベースにしたスクレイピングという割り切りがあったからこそ、全国を対象にした図書館の蔵書データを網羅できたといえる。


株式会社カーリル 代表取締役・エンジニア 吉本龍司氏

短期的発想のグロースハックはやらない

カーリルのユニークな点は、ビジネスに対する考え方にもある。

現在のところ、カーリルの収益源は、Amazonアソシエイトとシステム利用料。岐阜県中津川市にオフィスを構え、社員5人という体制のため、これで十分支えられるそうだが、なぜマネタイズに対してもっと積極的にならないのか。吉本氏はその理由をこう語った。

「図書館というのは公共性を重視している性質上、10年、20年という長いスパンで成長を考えなければなりません。そうなると、それに関わる事業も同様ですよね。本来なら、急成長や短期的な成果が求められがちな日本のウェブビジネス業界が参入するような領域ではないんです。それはわれわれも自覚しています」

長期的な視野でサービスの成長を考えているからこそ、短期間で成長を促すための施策も行わない。そのため社内でも「どうやったらもっと広告のクリック数が増えるだろうか?」などといった会話はまったく出ないそうだ。

また、会社の方針として受託開発を禁止している点も興味深い。この理由について吉本氏は、次のように説明する。

「特定の組織のためだけに製品を作ることは考えていません。カーリルのポリシーは、“開発したソフトウエアは、必ずオープンソースにしよう”です。あくまでも、カーリルは図書館サービスをユーザーに直接提供していこう、というスタンスです」

成果物のオープンソース化は必然

前述のようにカーリルは、API経由での機能提供だけでなく、自社で開発しているさまざまなソフトウエアそのものもオープンソースとして公開している。その背景には、「もともとオープンなデータを使って事業をしているので、うちも還元するのが当然」という考えがある。

ただし、図書館が利用している書誌情報は、商用MARCデータの購入が一般的であり(*3)、利用許諾の関係で、勝手に情報を公開できない。もちろんカーリルでも無断利用できないため、カーリルの書誌情報は国立国会図書館ウェブサイトやAmazonなど、書誌情報を提供しているウェブサービスのAPIから取得している。ただ、「図書館が、このISBNがついた本を持っている」という事実情報はライセンスの対象外なので、この蔵書情報とAPIから取得した書誌情報を、ISBNを軸に結びつけて検索結果としてユーザーに示しているというわけだ。

カーリルのしくみ
カーリルでは、(1)図書館ウェブサイトから蔵書や貸出情報を取得、(2)出版・図書系ウェブサービスからAPI経由で書誌情報を取得、(3)ISBNをキーにして蔵書と書誌情報を結びつけてユーザーの検索結果を示す、というステップにより、ユーザーは全国の図書館を対象に蔵書を検索できる。また、APIを公開し、派生サービスが作られることを容認している。

いくら一般に公開されていて誰でも利用できる情報を使っているとはいえ、スクレイピングで勝手に集めたデータを使ってサービスを作る行為に批判的な人もいることは確かだ。そこでカーリルでは、活用可能な「所蔵データ」を広く集め、再利用することにより、カーリルだけではなくオープンな情報を活用すること自体の価値を高め、社会的合意を形成するよう務めている。

つまり、公共のメリットを主張するには、成果物をオープンにしていくのはある意味必然だったのだ。

後編では、検索サービスの先にある、データの利活用や今後の展開について掘り下げていく。

この記事の後編を読む

注釈:
(*1)カーリル(外部サイト)
(*2)「スクレイピング」とは、ウェブページ内にあるデータを自動的・機械的に取得する技術手法。ウェブページにアクセスし、テキストを選択してコピー&ペーストといった処理を高速に実行できる。
(*3)株式会社図書館流通センターTRC MARC(図書館ツール)(外部サイト)

プロフィール

株式会社カーリル 代表取締役・エンジニア 吉本 龍司氏

1982年、岐阜県生まれ。慶応義塾大学卒業。小学生の頃からプログラミングを始め、高校生のとき、有限会社アール・ワイ・システムを設立。2010年3月に図書館検索サービス「カーリル」を公開し、その運営組織として2012年6月に株式会社カーリルを設立。

  • はてなブックマーク
  • follow us in feedly

Insight for Dの
ページにいいねしよう!

「いいね!」してInsight for Dの最新情報をチェック

Q. Yahoo! JAPANのデータソリューションは何がスゴイんですか? 答えはこちら

Q. Yahoo! JAPANのデータソリューションは何がスゴイんですか? 答えはこちら

Insight for Dの公式Facebookページ、Twitterでも最新情報や取材の様子を発信中。