公開研究会「日本のアーカイブズの電子的検索手段のために」

過去のイベント
【各報告要旨】
  XSLTPHPによるEAD/XMLファイルの変換と表示
  国文学研究資料館アーカイブズ研究系リサーチアシスタント 丸島和洋
 本報告ではEAD/XMLファイルの表示方法についての具体例を提示し、技術的な問題について言及する事を目的とする。史料館では、EAD/XMLファイルをアーカイブズの管理データベースとして利用することを検討しており、EAD/XML1ファイルに、1史料群の情報すべて(解題と一件目録の双方)を 記述している。このため、中には刊行目録1冊分の情報を含むものもある。単に全内容を表示するだけでは、あまりに情報量が多すぎて、閲覧者が目的の情報に たどり着くのは困難である。ファイルの大きさも数MBにまで膨らむことがあり、表示完了までの待ち時間が長くなりやすい。
 したがって、閲覧者によって要求した情報のみを展開し、画面に表示する形が望ましい。報告者はスタイルシートXSLTXPATH)を複数作成し、トリガーにPHPを利用してシートを切り替えることで対応を行った。具体的には、解題の各内容(史料の概要記述/関連資料/履歴/詳細目録など)ごとに異な るスタイルシートを用意している。それぞれのスタイルシートには必要な情報(タグ)のみ表示するよう記述し、これをEAD/XMLファイルと組み合わせる ことで、動的にHTMLへと変換していくのである。
 EAD/XMLは、史料一件毎の目録記述に史料群構造を反映できる点にひとつの特徴がある。これを活かし、目的の階層に限定した史料記述(解題/下位構造 の目次/含まれる史料の詳細目録)の表示も可能である。
 以上の背景にあるのが、1史料群―1EAD/XMLであることに変わりはない。しかし必要な情報のみを切り出すことで、視認性と速度の双方を向上させてい る。またスタイルシートを用いているため、細かい設計の変更も比較的容易に行うことが出来る。ただし以上のシステムは、EAD/XMLファイルがある程度 のガイドラインを踏まえて記述されていることを前提としており、こうした点の議論を深めていく必要がある。

  VBAを利用した史料目録EAD化のためのツール開発
  国文学研究資料館アーカイブズ研究系客員助教授・駿河台大学文化情報学部助教授 村越一哲
 本報告では、市販のアプリケーション・ソフトを用いることによって、比較的容易に史料目録をEAD/XML化できることを示す。XMLデータを作成するた めには、専用のエディタやコンバータを利用することがまず考えられるだろう。しかしながら、データがテキスト化されていれば、表計算ソフトで十分対応でき る。表計算ソフトはセルの集合体なので、1行からなるレコードの開始列を階層ごとに統一することによって階層構造を明示的に表現することができ、階層ごと にデータを処理できるからである。アプリケーション・ソフトとしてMS-Excelプログラミング言語としてMS-OFFICEに添付されている Visual Basic For Application(VBA)を用いた。そのため、特別なアプリケーションは必要としない。また、プログラミングに際して、テキストベースの目録には 誤植等が存在していることを考慮し、完成までのいくつかの段階でデータを修正できるようにすることを目標とした。

  元号を含む日付の西暦変換:Microsoft Excelのアドイン関数の開発
  駿河台大学文化情報学部教授 岩熊史朗
 本報告では、元号を含む太陰暦の日付、いわゆる和暦を西暦(グレゴリオ暦)に変換するためのツールについて取り上げる。
 和暦を西暦に変換するためには、従来、紙に印刷された対照表が用いられてきた。これは辞書を引く要領で和暦と西暦の対応を調べるもので、多数の日付を調べるにはかなり時間を要する。また、パソコン上にテキストデータ化された和暦データがあっても、その都度人間が調べて、入力し直す必要がある。これをコンピュータ上で自動的に西暦に変換できれば、研究効率を大幅に向上させることができる。
 既に和暦−西暦変換を目的としたコンピュータ・ソフトは開発されているが、年単位での変換を目的としたものがほとんどである。また、日単位での変換が可 能であっても、完全に独立したアプリケーション・ソフトとなっており、表計算ワープロといった他のアプリケーション・ソフト上のデータを変換するのには 適していない場合もある。
 そこで、Microsoft Excel上にある和暦データを、日単位で西暦に変換するツールの開発を行なった。Excelでは、“関数”を用いることによって、多数のデータを一括して処理することができる。Excelには予めMicrosoft社が開発した多様な関数が組み込まれており、その中には日付に関連したものもある。ところが、これらの関数で扱えるのは、太陽暦採用後の和暦だけであり、太陰暦を西暦に変換することはできない。今回、新たに開発した関数は、グレゴリオ暦が採用された1582(天正10)年以降のすべての和暦を扱うことができる。さらに、西暦を和暦に変換する機能や漢数字で表記されたものをアラビア数字に変換する機能等も加えた。なお、Microsoft社の多くのアプリケーション・ソフト間には共通性があるため、この関数は同社のWordやAccessにおい ても利用可能である。

  日本におけるEAD検索手段のデータ記載形式:EAD実践ガイドラインをもとにして
  国文学研究資料館アーカイブズ研究系助手 五島敏芳,
  国文学研究資料館アーカイブズ研究系COE非常勤研究員 戸森麻衣子
 アーカイブズ(記録史料)の電子的検索手段(目録,索引等)のデファクト国際規格としてはEAD, Encoded Archival Description(符号化記録史料記述)が知られており,日本の記録史料の記述または目録への適用も最近になって試みられるようになった.しかし, それらの適用事例は,けっして多くはなく,共通のデータ記載形式を持っているわけではない.その理由は,おそらくつぎのようなものだろう:日本の記録史料は,その時代や収蔵機関(または収蔵者)の違い等により,多様な「史料目録」で伝統的に表現されてきたため,それにそくしたEADデータ構築の実例が蓄積されていない;現在しばしばXMLデータとして構築され表現されるEADデータは,DTD(文書型定義)から一定の統制を受けるものの,その表現・管理の ための技術的環境等によってデータ構成を変化させることができるほど自由度が高い.
 いっぽうEADを生み出した米国では,EADデータ構成・記載形式について,いくつかの指針(ガイドライン)が存在する.本稿では,こういったガイドラインのうちOAC, Online Archive of California(カルフォルニア電子アーカイブ)のための最良実践ガイドラインを紹介しつつ,日本の伝統的「史料目録」の一例として『史料館所蔵史 料目録』を取り上げ,同目録の構成・記載要素との対応やその理解について議論する.その結論として,管理用(または技術的)データ発生の支援工具(ツー ル)を用い,前記ガイドラインの求める必要最低限の記載の一式を揃えさえすれば,EADデータを構築でき,記録史料の情報共有が可能になることを明らかに する.なお,いわゆる「記録史料の階層構造分析」が完了していなくても,その分析水準にそくしたEADデータ構築を実現でき,情報共有とそれによる分析深 化の可能性を拓くものであることも,付け加えておく.

過去のイベント