書籍を管理するとき、多くの人はISBN(国際標準図書番号)が「1冊の本に1つのコード」だと思い込んでいるのではないでしょうか。実はこの前提が、書籍データベースをややこしくしている根本原因になっています。
ISBNは「版×フォーマット」ごとに異なる
ISBNの仕組みでは、同じ作品でもハードカバー、ペーパーバック、電子書籍といったフォーマットごとに別々のコードが付与されます。さらに、新しい序文が追加された改訂版にもまた新しいISBNが発行されるため、1つの作品に数十ものISBNが存在するケースも珍しくありません。
開発者のRyan Goldstein氏は、自身のブログでこの問題を詳しく検証しています。Google Books APIで「The Last Unicorn」を検索すると、同じPeter S. Beagle著の作品が異なるISBNで10件以上ヒットしたそうです。読んだ本を記録したいだけのユーザーにとって、これは大きな障壁となります。
Letterboxdのような読書アプリが生まれない理由
映画の世界にはLetterboxdという人気のログアプリがあり、その裏にはThe Movie Database(TMDB)という高品質なオープンデータベースが存在します。映画データベースの規模は約100万件で、コミュニティの貢献によって正確性が保たれてきました。
一方、書籍の世界ではOpenLibraryが4,000万件以上の作品を抱えていますが、データの重複や不整合が目立ちます。規模が映画の40倍以上あるうえに、商業的な支援も限られているため、クリーンなデータベースの構築は格段に難しいのが現状でしょう。
図書館学のFRBRモデルが示すヒント
図書館情報学の分野では、FRBR(書誌レコードの機能要件)というモデルが知られています。このモデルでは情報を4つの層に分類します。
- 作品(Work):知的・芸術的な創作そのもの
- 表現(Expression):特定の版やテキスト
- 体現(Manifestation):ハードカバーや電子書籍といった物理形態
- 個別資料(Item):図書館の棚にある1冊
ISBNが扱っているのは「体現」レベルであり、多くのユーザーが求めているのは「作品」レベルの識別です。このギャップが、読書管理アプリの使い勝手を損なう原因になっているわけです。
GoodReadsはなぜ改善されないのか
GoodReadsのUIが使いにくいのは、Amazonの書籍販売事業における優先度が低いからだとGoldstein氏は推測しています。読書の記録にたどり着くまでに何回もクリックが必要で、チャレンジ機能やニュースレターが画面の大部分を占めている状態です。独立系のStorygraphも改善を試みていますが、根本的なデータ構造の問題は解決できていません。
関連する話題として、Lispが66年間生き延びた理由でも触れた「技術的な負債が長期間残り続ける構造」と共通する課題が見えてきます。また、Semantic NavigatorのようにAIで既存のデータ構造を「意味」で再整理するアプローチが、書籍データベースにも応用できるかもしれません。
書籍データの未来に向けて
ISBNの仕組み自体は出版業界のインフラとして重要な役割を果たしてきました。しかし、エンドユーザーが「読んだ本を手軽に記録したい」という単純なニーズを満たすには、作品レベルでの統一的な識別システムが必要になります。OpenLibraryのようなオープンプロジェクトの成長に期待しつつ、ISBNの構造を理解しておくことが、書籍関連サービスの開発者にとっては欠かせない知識と言えるでしょう。
テック業界のビジネス動向については、MetaのAI規制介入の記事もあわせてご覧ください。
