Creativity Sharing and
Entrepreneurial Support

OdGenji:源氏物語の香りDB

License : CC0
【概要】本作品「OdGenji」は、『源氏物語』に現れる「嗅覚としての香り」表現を、検索・再利用可能なLinked Open Data(LOD)として整備した学術データベースである。校異源氏物語TEI-XMLを基盤に、生成AI(Google Gemini 2.5 Pro)を用いて香り描写を自動抽出し、原文・現代語訳・英訳に加え、香りの性質・場所・知覚者・状況などのメタデータを付与してRDF/XMLでデータを構築し、公開した。本プロジェクトは国文学研究資料館との共同研究(2025–2026年度)の成果の一部であり、日本古典文学における嗅覚情報の知識グラフ化という未整備領域を国際標準の枠組みにも接続・貢献するものである。 【背景】文化遺産のデジタル化は進展しているものの、香りのような多感覚情報は、テキスト中に埋め込まれた叙述として扱われることが多く、横断的な比較や定量的分析、展示・教育への転用が難しいという課題がある。また、『源氏物語』においては「にほひ」が視覚的・比喩的用法を含むなど、嗅覚情報として扱うためには、記述の選別基準と機械可読な構造化が不可欠である。 【社会的動向】研究データのオープン化やFAIR原則の重視により、単なる可視化や全文検索に留まらず、異分野・異言語のデータと接続できる知識グラフとしての公開が求められている。特に生成AIの活用が広がる現在、抽出結果のみならず、抽出手続き・データモデル・根拠の提示が、学術的信頼性と再現可能性を左右する。また、多様な資料・情報を活用した探究的な学びを通して多面的・多角的な見方・考え方の育成が求めらてれいる昨今の教育現場、とりわけ国語・古典教育においても、伝統的な文字資料からの知識の暗記や文法の理解、テキスト読解などの方法論のみに依拠しない、学習者の「問い」に即した古典世界へのアプローチとそのための情報基盤が求められている。 【関連研究】欧州のOdEuropaは「嗅覚遺産」を対象に、香りの記述を分析・共有するためのオントロジーや技術的知見を提示した。しかし、日本古典文学を対象に、国際的に相互運用可能な枠組みで香り記述をLODとして整備した事例は限定的である。そのケーススタディとしては小澤ら(2025)が提示した「多感覚情報フローモデル」(https://cir.nii.ac.jp/crid/1050587970429956096)の提示などが挙げられるが、このモデルを大規模データへ拡張するためには、(1)抽出のスケーラビリティ、(2)視覚的「にほひ」等の曖昧性への対処、(3)横断検索・比較を可能にする共通語彙とURI設計、という課題が残る。 【提案手法】本研究は、TEI-XMLという人文学で広く利用されるテキスト形式を入力として、香り情報抽出を自動化し、LOD化まで一貫して実装した点に新規性がある。具体的には、①TEI-XMLから香りに関わる叙述候補を抽出し、②生成AIを用いて「嗅覚的な香り描写のみ」を厳密に選別(視覚的・比喩的用法を除外)し、③原文・現代語訳・英訳の整備とともに、香り語彙、性質、香源(匂いの担体)、場所(空間)、知覚者、時間、状況、効果などのメタデータを付与する。④データ構造はCIDOC-CRMおよびOdEuropaのオントロジーに基づきRDF/XMLとして表現し、学術LODの相互運用性(Interoperability)を担保する。さらに、抽出方法・画像生成方法・データ構造を技術資料として公開し、第三者が検証・再実行できる手続きの透明性を確保する。 【構築したDBの特徴】源氏物語全54巻から、香り描写140件を抽出・収録し、香り記述が確認できる33巻について統合RDFデータとして公開した。これにより、Web上で巻数・香りの言葉・性質・場所・知覚者・時間などのファセットにより、研究者が仮説に沿って絞り込み探索を行えるようになった。各レコードは、原文・現代語訳・英訳を並置し、叙述と構造化属性を往復できる設計である。また「香源(smell sources)」「香りの空間(fragrant spaces)」等の観点から横断的に参照でき、文学作品内の香り表現を、人物・物質・空間・状況の関係として扱える分析単位へ変換した点にも特徴がある。  さらに、「植物」などの集計ページから、クリックで検索可能な機能を実装すると共に、Odeuropaに対して問い合わせを行い、関連情報を自動的に表示する機能を開発した。 (以下のページの下部) https://odgenji.vercel.app/ja/smell-sources/flora/ 【本作品の意義と貢献】本作品「OdGenji」は、(1)日本古典文学の嗅覚情報をLODとして体系化したデータセットを提供し、(2)OdEuropa等の国際的枠組みと接続可能なデータモデルで表現することで、地域・言語を越えた比較研究の基盤を構築し、(3)TEI-XML×生成AI×RDFという実装パイプラインを公開することで、他古典作品への拡張可能性と再現可能性を同時に提示し、実際にOdEuropaと接続した探索的なLODを実現した。これは、従来「読解」に留まりがちだった多感覚情報を、探究学習や研究・学術において活用可能な発展的なデータとして共有・検証・再利用を可能にする方法論的な貢献もできたと考える。  本作品は、国文学・デジタルヒューマニティーズ研究における定量的検討(語彙・場面・人物関係の分析)を促進すると同時に、教育や展示における<香りを媒介とした理解>をデータ駆動で支援する。さらに、香りという無形の文化要素を、知識グラフとして国際的に接続・流通させることで、感覚文化遺産の新しい共有のかたちを提案するLODである。
Update: Dec 16, 2025

Text detail
「国書データベース」 国文学研究資料館が構築する国内外の多くの機関等及び国文学研究資料館が所蔵する古典籍等資料の書誌情報と、その画像を一度に検索・利用できるデータベース
Update: Dec 16, 2025 (Masao Oi)
Text detail
「Odeuropa」 ヨーロッパの香りに関するプロジェクト
Update: Dec 16, 2025 (Masao Oi)
Text detail
「デジタル源氏物語」 東京大学のデジタル源氏物語
Update: Dec 16, 2025 (Masao Oi)

Grant Information

Suggested fund information for realizing the idea.

Comments