総合目録ネットワークの 書誌データ登録機能 平成22年度 総合目録ネットワーク研修会 総合目録ネットワークの 書誌データ登録機能 先程の研修は検索・相互貸借依頼とゆにかねっとを利用するという観点からお話しました。今度はデータ提供館としてゆにかねっとに書誌データを提供するという観点からお話を進めたいと思います。 国立国会図書館関西館 図書館協力課 安藤 一博
目次 データ提供 初期データ登録と全件入替 同定処理 書誌データの削除 メール通知と日々の確認点 このような流れで話をすすめてまいります。 このような流れで話をすすめてまいります。 データ提供館がゆにかねっとお送りいただいたデータがどのように登録されるのか、そして、どのように処理されて、総合目録として利用できるようにするかについてご理解いただければ幸いです。また、日常の運用における確認点についても説明します。
総合目録DB データ提供館 参加館 データ提供館 データ提供館 NDL 検索機能(詳細) 相互貸借支援 インターネット 検索機能(一般) 書誌データ 総合目録DB データ提供館 書誌データ 書誌データ 検索機能(一般) 利用者 全国書誌 データ提供館 これはさきほどの研修でもお見せした図です。 データ提供館からは定期的に書誌データを送付。総合目録DBに登録。 NDL(当館)の全国書誌データも定期的に総合目録DBに登録。 それらのデータを統合処理した上で、インターネットを通して利用者に提供。 この二つの枠でかこった部分をそれぞれみていきましょう。 NDL
1.データ提供 (1)データ提供とは (2)データ提供の流れ (3)データ提供フォーマット (4)フォーマットの変換ミス (5)データ送付方法 (6)定常作業 (7)データの提供頻度 参加館の皆様がデータを実際に提供する過程を詳しくお話します。
1.データ提供 (1)データ提供とは 都道府県立・政令市図書館の所蔵資料(和図書)の書誌データを所定のフォーマットに変換してシステムに登録すること ■対象 都道府県立・政令市図書館の所蔵する和図書 データ提供とは都道府県立・政令市図書館の所蔵資料(和図書)の書誌データを所定のフォーマットに変換してシステムに登録することをいいます。 登録対象データは都道府県や政令市の図書館の所蔵資料であり、また和図書であるということ。
(2)データ提供の流れ フォーマット変換 各図書館システムのフォーマットから 総合目録共通フォーマットへの変換 1.データ提供 参加館書誌 総合目録DB フォーマット変換 各図書館システムのフォーマットから 総合目録共通フォーマットへの変換 各図書館システムのフォーマット 総合目録共通フォーマット 都道府県立・政令市図書館の所蔵資料(和図書)のデータを総合目録DBに登録するためには、データを各図書館システムから抽出していただきます。それをさらに各図書館システムのフォーマットから総合目録共通フォーマット変換していただき、総合目録データベースに送付していただきます。
(3)データ提供フォーマット 構成 ■総合目録共通フォーマット 1.データ提供 ● 書誌データ ・ 識別ブロック ・ 記述ブロック JAPAN/MARCに準拠した構造・項目 構成 ● 書誌データ ・ 識別ブロック ・ 記述ブロック ・ アクセス・ポイント・ブロック ・ その他のブロック ● 所蔵ローカルデータ ※ フォーマットの版:第2版(H10~)、第3版(H16~) <http://somoku.ndl.go.jp/info.html#format> その総合目録共通フォーマットについてですが、JAPAN/MARCに準拠した構造・項目となっています。 大まかな構成としては、書誌データを収録する部分と所蔵ローカルデータを収録する部分からなります。 さらに書誌データの部分は、いくつかのブロックに分かれています。 ISBNやマーク番号を収録する識別ブロック、 書誌を表示する際に使用するデータが収録されている記述ブロック、 検索時に使用するデータが収録されているアクセスポイントブロック からなります。 それでは、実際に総合目録共通フォーマットを見ていきたいと思います。配布資料1をご覧いただけますでしょうか。 これは総合目録共通フォーマット第3版の各フィールドを列挙したものです。 左の列から順に、ブロック名称、フィールド郡名、フィールド名、添え字、フィールド項目名とあり、さらにタグ出現率やレコードの例、コメントと続いていますが、網がけされている部分は新規提供などの際のデータチェック時に当方からコメント付でお送りするフォーマットとなります。 これと合わせて、実際のデータを見てみたいと思います。 <具体的に検索 タイトル:googleとの闘い> このように基本書誌が表示されるのですが、ここで、基本書誌タグ表示、という表示をしてみます。 総合目録共通フォーマットの書誌を確認することができます。 まず左側のカッコの部分は、この表示の際に見やすくするように書いているだけで実際に送られてくるデータには含まれていません。この数字から右側が、実際に各館から送られてくるデータとなります。 例えば、010のAにはISBNが含まれています。他には、配布資料の2ページ目を見ていただいて、251のAには本タイトル、Bにはタイトル関連情報、Fには責任表示、が含まれています。このように、各数字とそれに対応するデータという形でお送りいただくのがゆにかねっとへの登録データとなります。 では、システムに登録する上で、大切な項目について説明します。 1ページ目の左上に色分けのはんれいが載せてありますが、これが各フィールドの中で重要な項目となります。 まず必須項目、これは書誌データを登録する際に必要となる項目です。この項目が抜けていると登録ができませんので、必ず登録する必要があります。 続いて、準必須項目、これは、書誌同定の際に使用する項目です。 最後にアクセスポイントですが、これは検索の際に検索対象となる項目です。基本書誌となった場合に、と書いてありますが、検索対象となるのは基本書誌のみとなります。 アクセスポイントですが、アクセスポイントブロックは全てが対象となっているのですが、アクセスポイントブロック以外でも検索時に使用するフィールドがありますので、そこは色をぬっています。たとえば、P.1のISBNやマーク番号といった項目は準必須項目でもあり、またアクセスポイントともなります。色の塗り分けが分かりにくいかもしれませんが、そのようなことを表しています。ISBNやマーク番号でも検索できますので、そういったことが分かるようにしています。 スライドに戻って、フォーマットの版についてですが、現在、フォーマットには第2版と第3版があります。まだ、2版をお使いいただいている図書館もありますが、それでは2版と3版の違いについて簡単に説明しておこうと思います。 大きくは1点 請求記号の収録フィールドが2バイトになったこと。請求記号に漢字が入る場合がありますが、2版だと収録できなかった。漢字部分を取り除いて収録していただくか、あるいはそのまま登録し表示の際に文字化けとなってしまうか。3版になって収録できるようになっています。 その他の細かい変更点はホームページに掲載しているフォーマットをご覧下さい。2版、3版ともにフォーマットを掲載しています。
(4)フォーマットの変換ミス 1.データ提供 変換ミスの例 13桁のISBNが13桁で抽出されていない MARC番号種別の指定間違い [090A][001][JLA] ←正しくはJP [090B][001][78024685] 刊行年の変換間違い [100A][001][ [198 ](半角) ←正しくは1983 [270D][001][[1983]](全角) アクセスポイント未収録 基本書誌番号 12060344 ←551B(タイトル)が未収録 参考までにフォーマットの変換ミスの例を紹介します。(変換ミスをするとどうなるかをきちんと話す。) 共通フォーマットへの変換の際には、いくつか変換ミスが起こっていますのでいくつかを列挙してみました。また、配布資料1の右側部分の間違ったレコードの例・コメント欄にも列挙していますので、また後程ごらんいただければと思います。 まず、ISBNフィールドが13桁になっていない問題。010AはISBNを入力するフィールドです。次の001は添え字なのでここは、無視してください。ご存知のように、今ISBNは13桁化されていると思います。13桁のISBNの場合、頭が978はじまっています。この場合は、978で始まっていますので13桁で収録されていなければいけませんが、この場合不足しています。実際にこのようなデータが送られてきています。誤同定の原因となる。 次に、MARC番号種別の指定間違いというのがあります。 この場合は、正しくはJPと指定する必要があります。 非常に多いのが、刊行年の変換ミス。同定の際は100Aの刊行年を使っている。多くの図書館システムでは、270Dの収録データから機械的に頭4文字を半角にして収録している。そのため、刊行年が異なるため同定できない場合があり、書誌割れの原因となる。できれば数字だけを取り出していただければ、書誌割れは減っていくと思います。 それから、アクセスポイントの収録漏れ。資料には551Bの収録漏れについて記載しています。551Bといえば、タイトルですが、タイトルのアクセスポイントが未収録だとどういう影響が出ると思いますか? アクセスポイントは検索対象となる項目ですので、アクセスポイントがなければその書誌は検索することが出来なくなります。 このように551Bの収録がない書誌は検索することができません。この場合、基本書誌にひもづいていた参加館書誌も検索できなくなりますので、551Bのタイトルだけに限らず、アクセスポイントの収録はしていただくようにお願いします。
(5)データ送付方法- FTP転送方式- ■FTP転送方式 ① 1日に複数ファイルの送付が可能 1.データ提供 (5)データ送付方法- FTP転送方式- ■FTP転送方式 ① 1日に複数ファイルの送付が可能 ② 転送されたデータは、PM10:00に取り込み ③ 取り込んだタイミングで、ゆにかねっとからメール通知 ここでデータ送付方法について説明しておきます。更新データをお送りいただく際には、の2つの方法があります。 1つ目がFTP転送で、この図に描いていますように、データ提供館からデータを送って頂く方式となります。 特徴として3点ほどあります。1日に複数ファイルの送信が可能であるということ。2点目として、転送いただいたデータは、転送していただいた時点ですぐに取り込むのではなく、夜の10時に取り込むという点です。3点目として、取り込んだタイミング、つまり夜の10時にゆにかねっとからデータ受領のメールが送信されます。 総合目録DB FTP転送 (送って頂く) データ提供館 参照:マニュアル別綴 P.29, 34
(5)データ送付方法 http-get方式 ■ http-get方式 1.データ提供 ① 1日に転送できるのは1ファイル (5)データ送付方法 http-get方式 ■ http-get方式 ① 1日に転送できるのは1ファイル (管理機能から転送予約) ② PM10:00にデータを取得し、システムに取り込み ③ 取り込んだタイミングで、ゆにかねっとからメール通知 もう1つはhttp-getという方式です。図にありますように、ゆにかねっと側からデータを取りにいく形となります。特徴の1点目として、1日に転送できるのは1ファイルのみです。 送信の際は、ゆにかねっとの管理機能画面から転送予約をする必要があります。ウェブサーバなりの公開しているサーバにデータを置いていただいて、その場所を転送予約画面に入力します。すると、夜の10時に指定した場所からデータを取得しシステムに取り込みます。つまり、ゆにかねっとが指定された場所までデータを取りに行くという形です。そのタイミングで、つまりこちらも夜の10時になりますが、データ受領通知をゆにかねっとからメール送信します。 これら2つの方式があるのですが、できればFTP転送方式で自動的に転送できるような設定が可能であれば、転送漏れもなくなりますので、よいのではないかと思います。 1つ注意点として、システムがリプレースされた場合、ネットワークの設定も変わる場合があります。アクセスを許可していただく設定をしていただく場合もあり、またゆにかねっとの設定変更をしなければならない場合もありますので、そういう可能性もあるということを頭に入れておいていただければと思います。 http-get 総合目録DB データ提供館 (取りに行く。) 参照:マニュアル別綴 P.29, 34
(6)定常作業 各図書館の以下の更新データを定期的に送付 ・新規に受け入れた資料 ・書誌情報を変更した資料 ・廃棄した、除籍した資料 1.データ提供 (6)定常作業 各図書館の以下の更新データを定期的に送付 ・新規に受け入れた資料 ・書誌情報を変更した資料 ・廃棄した、除籍した資料 以上、データ提供の一連の流れをお話しました。定常作業としてどういったことを何を行う必要があるのか、ですが、このような流れで定期的に更新データをお送りいただいております。 各図書館では新規に受け入れた資料や、書誌情報を変更した資料、廃棄した資料があるかと思います。それらの情報を定期的にゆにかねっとに反映する必要がありますが、そのために定期的に更新データを送ってもらう必要があります。そういった作業が定常的に発生します。 参照:マニュアル別綴 P33~39
(7)データの提供頻度 1. データ提供 それでは、参考ということで、少し古くなりますが、 2008年1年間1月から12月までのデータ転送頻度の割合です。 中には週2回以上だとか、年1回だとかいう図書館もあります。 また、年数回というのであっても、しばらくシステムリプレースで送信が止まっていた場合というのも含まれていますので、 ほとんどの図書館は週1回から月1回程度というところに収まるのではないかと思います。 ただ、年数回というのでも問題はないのですが、例えば、しばらく提供が止まっていた図書館からは、何度か除籍資料への依頼がありました、という話を聞いたことがあります。あまり間隔が空いてしまうとそういったこともありますので、あまり相互貸借に関して問題が増えないような頻度、そういった頻度でお送りいただければと思います。
2. 初期データ登録と全件入替 (1)概要 (2)初期登録(新規提供) (3)全件入替 (4)全件登録の流れ これまでは通常の更新作業の流れについてお話しました。次はちょっと例外的なデータ提供方法といいますか、通常のデータ提供とは流れが異なるデータ提供についてお話します。
(1)概要 ■初期データ登録 ■全件入替 ※送付前後に当館との調整が必要 2.初期データ登録と全件入替 (1)概要 ■初期データ登録 和図書の書誌データを参加館の図書館システムから全件抽出し、登録すること ■全件入替 総目システムに登録されていた書誌データ全件を削除して、新たに全件登録 ここの挙げた初期データ登録と全件入替がそれになります。実は二つあるといっても、この二つは図書館の和図書の全データを登録するというところが共通しているので、流れも共通する部分が多いです。 ※送付前後に当館との調整が必要
(2)初期登録(新規提供) 和図書の書誌データを参加館の図書館システム から全件抽出し、登録すること 2.初期データ登録と全件入替 まずは初期登録ですが、先程ご説明しましたが、全データを登録することです。データ提供館の図書館システムから和図書のデータを全件抽出したデータをお送りいただき、それをゆにかねっとに登録します。 詳細な流れはこちらのマニュアルに詳しく書かれておりますので、こちらをご参照ください。 参照:マニュアル別綴 4章
(3)全件入替 その1 全件入替が必要となる場合 総目システムに登録されていた書誌データ全件を削除して、新たに全件登録 2.初期データ登録と全件入替 (3)全件入替 その1 総目システムに登録されていた書誌データ全件を削除して、新たに全件登録 ※初期登録とは手順が若干異なる(FTPかhttp-getで転送) 全件入替が必要となる場合 図書館システムの更新で、タイトルコードなどの書誌IDの番号体系の変更がある場合など ※ゆにかねっとでの参加館書誌データの管理 ⇒各書誌データのコントロール番号(タイトルコードなどの一意の番号)をキーにして管理 データの全件入替えについて説明しておきたいと思います。 全件入れ替えとは、ゆにかねっとに登録されていた書誌データ全件を削除して、新たに全件登録することをいいます。 全件を登録する部分は、新規登録の手順とほぼ同じ手順になります。新規提供との一番の違いは、データを送付いただく方法です。 定常運用時と同じように、全件データをFTP転送やhttp-getでの転送をしていただく必要があり、その際に、全件データを2万件を1ファイルとして分割していただく必要があります。新規登録の場合は、媒体でお送りいただくことになっています。要するに、新規登録の場合は、CDなどの媒体で、全件入替えの際は、FTPやhttp-getといってネットワーク上を送信いただくことになっています。 これは登録の都合上、そうしていただく必要がある。 どのような場合に全データを入れ替える必要があるかですが、システムリプレースなどで書誌ID、タイトルコードをよばれることが多いそうですが、書誌IDの番号体系に変更がある場合がそれにあたります。各館の書誌データを書誌IDのようコントロール番号をキーにして管理をしていますので、ここが変わると入れ替える必要が生じてしまいます。 (なぜ番号体系が関係しているかと言うと、ゆにかねっとの書誌データの管理方法に理由があります。どのように参加館のデータを管理しているかと言うと、ゆにかねっとでは各書誌データのコントロール番号をキーにして管理しています。どういうことかというと、書誌を指定するのに番号を使っているのですが、その際に使うのがコントロール番号となります。フォーマットにコントロール番号を収録する ) システム更新などで資料管理IDが変わってしまうと、すでにゆにかねっとに登録されてしまっている書誌データのIDを指定することができなくなりますので、それを避けるために全件入替えということで、いったん全てを削除してから、再度全件を登録するようにしています。 ただ、システム更新といっても、コントロール番号を引き継ぐ場合は全件入替えをする必要はありません。これも更新前後のシステムによりますので、更新の前後では念のために状況を確認させていただければと思います。 全件入替えについてもマニュアルを見ていただければ、フローを載せていますので参考にしていただければと思います。 参照:マニュアル別綴 5章
2.初期データ登録と全件入替 (3)全件入替 その2 システムリプレースでタイトルコードなどの書誌IDの番号体系の変更がある場合など、大規模な書誌データの変更がある場合はNDL総目担当者に事前にご相談ください。 システムリプレースでタイトルコードなどの書誌IDの番号体系の変更がある場合など、大規模な書誌データの変更がある場合は、一度NDL総目担当者に事前にご相談いただければと思います。 参照:マニュアル別綴 5章
(4)全件登録の流れ 新規登録・全件入替時の全件登録の流れ ① サンプル書誌データの抽出・検証 ② 全件書誌データの抽出・検証 2.初期データ登録と全件入替 (4)全件登録の流れ 新規登録・全件入替時の全件登録の流れ ① サンプル書誌データの抽出・検証 ・抽出データの共通フォーマットへの変換・送付(提供館側) ・送付されたデータの検証(国会図書館側) ② 全件書誌データの抽出・検証 ・①と同様の作業 ・問題なければデータ登録開始 ③ 差分更新データの抽出・検証 ④ 差分更新データ転送テスト 新規提供や全件入替で参加館の書誌データをすべて入れることになる際の作業の流れを紹介します。 まず、①~、ということで、サンプルデータとして書誌データを抽出して、共通フォーマットに変換し、送付していただきます。 当館で、お送りいただいたデータをチェックします。何を見るかということですが、チェック点としては、フォーマットへ正しく変換されているかをチェックします。それでもんだいがなければ、②~、ということで、今後は全件データを抽出していただき、今度はそれをチェックします。 全件データに問題がなければ、ゆにかねっとへのデータ登録を開始します。データ登録が始まると、ゆにかねっとを通した相互貸借依頼が届き始めますので、その点はご注意ください。 全件の登録と並行して、③~、差分データのチェックを行い、また④~、データ転送テストを行います。問題がなければ、運用開始となります。 マニュアルのP.23をご覧下さい。ここには手順をフローを示していますので、参考にしてください。 参照:マニュアル別綴 P23
3.同定処理 (1)概要 (2)比較処理 (3)機械同定処理の欠点 (4)スケジュール (5)データの送付から処理まで それでは、ここからはデータ提供館からデータをゆにかねっとにお送りいただいた後、つまりNDL側でどのような処理を行っているかについてお話します。
(1)概要 比較処理 同じ資料が? 書誌データの統合 3. 同定処理 比較処理をして、 ・同じ書誌がない 基本書誌として登録 参加館書誌 参加館 書誌 参加館 書誌 ある 書誌データの統合 比較処理をして、 ・同じ書誌がない 基本書誌として登録 ・同じ書誌がある 基本書誌に関連付けをして登録 ※全国書誌のレコードは必ず基本書誌となる データを参加館から提供されるとNDL側で同定処理を行います データを受け取るとまずはすでにデータベース内にある書誌データを比較処理を行います。つまり、すでに総合目録DBに同じ書誌があるかないかを比較する処理です。 比較の結果、次に書誌の統合処理を行います。同じ資料があった場合となかった場合とでそれぞれここにあるような処理を行う。 同じ書誌がなかった場合は基本書誌となります。 すでに同じ書誌が存在すれば、それの下に参加館書誌として紐づくことになります。 スライドの下の方に、注意書きとして「全国書誌のレコードは必ず基本書誌となる」と書いていますが、通常は後から来たデータは参加館書誌としてくっつくのですが、NDLの書誌データが入力された場合は必ず基本書誌となります。
3. 同定処理 (2)比較処理 ■書誌データ中の下記データ項目を同定キーにして比較(同定処理フローチャート) http://somoku.ndl.go.jp/info_argo.html ユニークキーマッチング ①JP番号 ② MARC番号 ③ ISBN・出版年・巻 文字列マッチング ④ 書名・出版者・その他項目の組み合わせ ■同定された書誌が持つ別のMARC番号も同定キーとし、後発の書誌と比較 それでは、同定処理の中の比較処理についてすこしくわしくお話します。 同定処理のフローチャートはこのURLで公開していますが、簡単に説明しますと まず①~、JP番号を持っていた場合、すでに登録されているデータの中から同じJP番号を持つ書誌を探します。 無ければ、②~、の比較に進みます。 そこでもなければ、次に③~ の比較に進みます。ISBNだけではなく、出版年・巻号も合わせて、全てが一致した場合に同定と判断しています。 そこに無ければ最後④~、に進みます。最終的に見つからなければ、その書誌を基本書誌と判定します。 それでは2点目、同定された書誌が持つ別のMARC番号も同定キーとする、とありますが、このような処理を行っています。実際に見てみます。 <具体的に検索:タイトル「21世紀の歴史」> 国立国会図書館の書誌が表示されていますが、ここには全国書誌番号しかありません。京都府立を見てみるとJLAで同定、これは覚えたJLAを使って同定しているということです。どういうふうに覚えるか、北海道を見てみると、ISBNで同定されていることが分かります。そのとき、JLA番号を持っていたので、ここでJLA番号を覚えて、次回以降の同定に使っていることになります。続いて青森を見ると、今度はJLAで同定しましたとあるように、JLA番号を使って同定されていることが分かります。同様に、栃木県立図書館との同定においてNPL番号を学習し、その次の埼玉県立の同定に使っていることが分かります。
(3)機械同定処理の欠点 ■ 書誌割れ ■誤同定 3. 同定処理 (a)各データ提供館の書誌データ作成ルールの違いにより 発生(商用MARCからのコピーカタロギング分を含む) 書誌割れの発生例: 国会図書館: 京都へでかけよう. 2009 (昭文社) 他の図書館: 京都へでかけよう. ’09 (昭文社) ■誤同定 発生した場合に、発見が難しい (システムは自動的に登録) 機械的に同定処理をしている、と話しましたが、機械的な処理の場合の欠点について説明します。 1点目として、これまで何度も話してきましたが、書誌われが発生します。例としては、このように書誌記述のルールの違いで書誌われが発生している場合があります。各データ提供館ごとのルールだけではなく、商用MARCのデータについても、例えば、TRCとニッパンでの記述の違いにより書誌割れが発生する場合があります。 それから2点目、誤同定はまれに発生してしまうというお話はしましたが、誤同定が発生した場合に発見するのが難しい点が挙げられます登録は自動的に行われますので、もし誤同定されていたとしても、その書誌を実際に見てみるまでは、それが誤同定なのか同定されているのかは分からないということです。相互貸借依頼をゆにかねっとを通じて行う際は、参加館の書誌が表示されますのでかならず確認してください。 ただし、同定時に誤同定の手がかりだけは残すようになっています。実際に見てみたいと思います。 <具体的に検索:ISBN「978-4-540-070」> 「これならやれる!耕作放棄地の解消対策」を見てみますと、これだけ見ても誤同定なのかどうかは判断が出来ないと思います。参加館書誌を見てみて、はじめて誤同定と言うことが分かります。ちなみにこの場合、「トルコのごはん」は明らかにタイトルが違っていますが、これが同定条件としてタイトルが一致していません(警告)ということで記録されています。他にどういった同定条件があるのかは、同定条件をクリックしていただくと、どういった同定条件があるのかが列挙されています。
(4) スケジュール ■同定処理 ■処理結果のメール通知 3. 同定処理 ① 処理が終了したタイミングでメール通知 ① PM8:00から処理を開始 (原則的にはデータ転送の翌日) ② 定められた図書館順に処理 ※ 各図書館ごとに処理できるファイルは1日1ファイル ※ 1ファイルの上限(20,000件) ※ 1日に処理できる総件数には上限(150,000件) ■処理結果のメール通知 ① 処理が終了したタイミングでメール通知 ② 通知内容は、エラーの有無・データの内訳(新規登録・更新・削除)など それでは、同定処理の流れ、ということで取り込んだデータをどういったスケジュールで処理していくかについて説明します。 まず同定処理の開始は午後8時からとなります。データの取り込みは10時からですので、原則的には、データを転送した翌日に同定処理が行われてデータベースに登録されることになります。 開始されると、あらかじめ定められた図書館順で処理が進んでいきます。その際、2つほど制限があります。まず1点目として、各図書館ごとに処理できるファイルは1日1ファイルまでとなります。例えば、更新データが多く、2ファイル転送した場合、処理の1日目に1ファイル、2日目にもう1ファイルというように処理が行われます。 それから、もう1点目として、1日に処理できる総件数には制限があり、現在は1日最大15万件に設定しています。経験的に、これを超えた件数になってしまうと1日で処理が終わらずに、翌日の夜8時以降まで処理が続いてしまうことになりますので、このように制限をかけています。ですので、1日の処理件数が多い場合、後ろの方の順番になっている図書館までは処理が進まない可能性もあります。そういった場合は、データ転送の翌日ではなく、さらに後ろの日になってしまいます。もし、そういったことが連日続きますと、処理が回りませんので、順番の変更をして、回るように調整は行っています。ですので、翌日に処理されない場合は混んでいるのだと思ってください。お尋ねいただければ、状況等はお伝えできますので、遠慮なく問い合わせいただければと思います。 それでは、メール通知についてです。のちほど詳しくお話しますが、各図書館ごとの処理が終了した時点で、処理の終了した図書館宛にメールが送られるようになっています。メールの内容としては、エラーの有無や処理データの件数などです。 参照: マニュアル別綴 P36
(5)データの送付から処理まで 3. 同定処理 データ① データ② データ③ データ④ データ受信(FTP) データ取込(FTP) 同定処理 9/2 9/3 9/4 9/1 データ① データ② データ③ データ④ それではデータ送付から登録処理までの流れについてもう一度見てみたいと思います。 たとえば、9/1の22時以降にデータを提供をしていただいたと仮定した上で上のような流れを表示しております。少し細かいのですが、後程じっくりご覧いただければと思いますが、データを提供してから実際に利用できるようになるまで2-3日かかるということを抑えていただければと思います。 データ①から④まで、別々の図書館からデータが送られてきたとします。データ①~③までは日中にFTP転送され受信しました。データ④に関しては日中に転送予約をしました。 その日の夜10時になり、FTP転送されたデータについてはゆにかねっとがデータを取り込みます。http-getの転送予約がされたデータについては、データをとりにいき、とってきたデータを取り込みます。そのときに、メールが各館宛に送信されます。 そして翌日の夜8時になり同定処理が始まり、同定後はデータベースに登録されます。それぞれの図書館ごとの登録処理がおわるたびに、メールが通知されます。この場合はデータ①から順に登録されているようになっています。 一連の流れは以上のようになっています。 22:00 22:00 20:00 20:00 転送予約(http-get) データ取込(http-get)
4.書誌データの削除 (1)書誌データの削除とは (2)差分更新によるデータ削除 (3)全件削除/全件入替 (4)1件単位の書誌データ削除 では、次にゆにかねっとに登録した書誌データの削除方法についてお話します。
(1)書誌データの削除とは ■基本書誌になっている書誌データの削除 ■(基本書誌ではない)参加館書誌の削除 4.書誌データの削除 ・参加館の指定した書誌が削除される。 ・再度同定処理が行われ、他の参加館書誌が基本書誌となる。 ■(基本書誌ではない)参加館書誌の削除 ・参加館の指定した書誌が削除され、ゆにかねっと書誌画面の所蔵館情報から図書館名が削除されます。 書誌を削除するということはどういうことかについてまずお話します。 書誌データを削除するとはもちろんゆにかねっとのデータベースからデータを削除することを指します。ゆにかねっと内の内部的な処理ですが、書誌の集約や同定に関わってくることになりますので参考までにお話します。提供していただいた書誌が基本書誌になっているのか、そうでないのかでデータベース内での処理が変わってきます。 基本書誌になっている書誌のデータを削除される場合、まず指定した参加館の書誌が削除されます。基本書誌に同定されていた他の参加館書誌は集約された状態が一度解体され、ばらばらにされて、再度、ゆにかねっとのデータ全体の中で再度同定処理が行われます。 基本書誌でない書誌は書誌が削除され、所蔵情報一覧から図書館の名前が消えます。
(2)差分更新によるデータ削除 参加館で除籍した資料 4.書誌データの削除 (2)差分更新によるデータ削除 参加館で除籍した資料 差分更新データとして除籍情報が送付される。差分更新時に参加館が除籍した書誌データが総合目録DBから削除される。 差分更新によるデータ削除についてです。おそらくこれがもっとも使われている削除方法だと思います。 いつも更新データとしてお送りいただいているデータには新規登録された書誌や更新された書誌はもちろんですが、除籍した書誌の情報もいっしょに送付されてきます。・・のはずです。その情報を受けて、ゆにかねっと側でも書誌の削除処理を先程お話した形で進めていきます。 この方法であれば、あえて削除という作業をゆにかねっとに対して行っていただく必要はありません。 ですので、差分更新データを送付していただけると更新処理としてデータの削除がおこなわれます。
(3)全件削除/全件入替 総目システムDBに登録されていると当該館の書誌データ全件を削除して、新たに全件登録 ■全件入替が必要となる場合 4.書誌データの削除 (3)全件削除/全件入替 総目システムDBに登録されていると当該館の書誌データ全件を削除して、新たに全件登録 ■全件入替が必要となる場合 図書館システムの更新で、タイトルコードなど書誌ID体系の変更がある場合など ※ゆにかねっとでの参加館書誌データの管理 ⇒各書誌データのコントロール番号(タイトルコードなどの一意の番号)をキーにして管理 つきは全件削除、つまり、参加館の書誌をすべて削除する方法についてです。全データを入れ替える必要になったときです。それで全件削除、全件入替となっています。これは先程お話した全件入替と同じお話ですので説明は省かせていただきます。 書誌IDなどの番号体系が変わる以外でも、書誌のデータが大規模に変更が生じた場合、通常の差分データ更新で修正することも可能ですが、処理不可を考えると全件削除、全件入替を行ったほうが早い場合もございます。 参照:マニュアル別綴 5章
(4)1件単位の書誌データ削除 管理機能ログイン オンライン書誌削除 ・基本書誌番号 ・コントロール番号 で書誌を指定 4.書誌データの削除 (4)1件単位の書誌データ削除 管理機能ログイン オンライン書誌削除 ・基本書誌番号 ・コントロール番号 で書誌を指定 非公開措置等で、至急削除が必要な場合などに 最後に1点単位の書誌データ削除の方法についてお知らせします。 差分更新でも除籍情報を送付していただくことにより1点単位から削除することが可能ですが、急いで削除が必要な場合は管理機能から書誌データの削除が可能です。非公開措置等ですぐに削除しなければならない場合は、そちらの機能をお使いください。 削除されるタイミングについてだけは説明しておきたいと思います。実際にデータベースから削除されるタイミングがボタンを押した後即座に削除される、というわけではありません。削除実施後の20時となります。20時は送付されてきたデータの同定処理が始まる時刻ですが、同定処理の前に、オンライン削除が実行されたデータについての削除を行います。 参照: マニュアル別綴P50~54
5.メール通知と日々の確認点 (1)メール通知 (2)日々の確認点 (3)データ提供に関する技術的な相談 それでは、最後の章になりますが、「メール通知と日々の確認点」ということで、メール通知と日々の確認点について話させていだきます。
(1)メール通知 5. メール通知と日々の確認点 ゆにかねっと データ提供館 ②処理結果の通知 同定処理 ①データ受領通知 参加館 書誌データ 基本 書誌 図書館システム 書誌データ フォーマット変換 参加館 書誌 参加館 書誌 データ送付 データ抽出 参照:マニュアル別綴 P33~39
(2)日々の確認点 ■データ送付について ■更新処理について ・ メール通知の確認(送付した日: PM10:00) 5 メール通知と日々の確認点 (2)日々の確認点 ■データ送付について ・ メール通知の確認(送付した日: PM10:00) ■更新処理について ・ 更新処理結果メール通知の確認 (データが処理されるのは送付した翌日以降) メール通知は、同じものがNDLの総合目録ネットワーク担当にも届き、日々確認を行っています。不明な点はお気軽にお問合せください。 参照:マニュアル別綴 P33~39
お気軽にご相談ください。 (3)データ提供に関する技術的な相談 5 メール通知と日々の確認点 (3)データ提供に関する技術的な相談 データ提供館担当者、図書館システム担当、SE、NDL総目担当者の3者でやりとりさせていただいて構いません。 お気軽にご相談ください。
国立国会図書館関西館 図書館協力課 安藤 一博 ご静聴ありがとうございました。 国立国会図書館関西館 図書館協力課 安藤 一博