ゆうキャンパスリポジトリ - 山形県域地域リポジトリ - 山形大学 小白川事務部小白川図書ユニット 図書チーム(情報サービス担当) チームリーダー 三 角 太 郎
本日は技術寄りの話 in=attach&refer=DRF%2FShaRe- Hiroshima&openfile=yamagata_ShaRe2008.pdf 運用寄りの話題は DRF/ShaRe-Hiroshima の資料を見てください
学術機関リポジトリ構築ソフトウェア 実装実験プロジェク CSI :学術機関リポジトリ構築連携 支援事業 第一期 CSI :学術機関リポジトリ構築連携 支援事業 第二期 フェイズ1 構築 フェイズ2 展開 フェイズ3 運用 NII ゆうキャンパ ス リポジトリ CSI :学術機関リポジトリ構築連携 支援事業 第三期 ???
学術情報部会への参加図書館 ● ● ● ● ● 山形大学 (農) 山形大学 (工) 山形大学 (人文・教育・理) 山形大学 (医) 東北公益文科大学 山形短期大学 県立保健医療大学 県立米沢女子短期大学 羽陽学園短期大学 東北芸術工科大学 鶴岡工業高等専門学校 放送大学 (山形学習センター) 鶴岡市 山形市 米沢市 ● ● ● 酒田市 ● 天童市 ● 新庄市 ● 県立産業技術短期大学校 県立農業大学校
機関別統計 アイテム数アクセス数 DL 数 アイテムあた りアク セス数 アイテムあ たり DL 数 山形大学 東北公益文科大学 山形県立産業技術短期大学校 東北芸術工科大学 鶴岡工業高等専門学校 山形県立米沢女子短期大学 山形県立保健医療大学 羽陽学園短期大学 総 DL 数
こんなにアクセスが あるとは思わなかっ た
JAIRO Japanese Institutional Repositories Online launched at October 22, 2008(test open)
強力な手段であることは 間違いない 総数 IR 数共同 IR 国立大学 8759 公立大学 8922 私立大学 短大 4340 高専 640 共同利用機関 年 9 月時点 総数、 IR 数は IRDB コンテンツ分析( ) IR 整備率 より( 確認 ) 。共 同 IR 数は JAIRO( 機関一覧、 HARP( 参加大学を比較し算出 ( 確認 )
私立大学のIR事情 呉大学 (27 件 ) 日本赤十字広島看護大学 (100 件 ) 広島経済大 学 (64 件 ) 広島工業大学 (61 件 ) 広島国際学院大学 (42 件 ) 広 島国際大学 (29 件 ) 広島女学院大学 (35 件 ) 広島文教女子大学 (71 件 ) 関西学院大学 (256 件 ) 関東学院大学 (527 件 ) 近畿大学 (509 件 ) 慶應義塾大学 (12,681 件 ) 高知工科大学 (236 件 ) 国士舘大 学 (3,049 件 ) 東京歯科大学 (462 件 ) 東京慈恵会医科大学 (1,736 件 ) 同志社大学 (9,416 件 ) 日本貿易振興機構アジア経 済研究所 (626 件 ) 法政大学 (1,642 件 ) 明治大学 (103 件 ) 立命 館大学, 立命館アジア太平洋大学 (63 件 ) HARP 独立 * JAIRO( 機関一覧、 HARP( 参加大学を比較しリストアッ プ( 確認 ) 東北芸術工科大(93)、東北公益文化大 (149) ゆうキャンパス
公立大学のIR事情 尾道大学 (11 件 ) 広島市立大学 (105 件 ) HARP * JAIRO( 機関一覧、 HARP( 参加大学を比較しリストアッ プ( 確認 ) 山形県立保健医療大学 (38) ゆうキャンパ スリポジトリ
短大のIR事情 * JAIRO( 機関一覧、 HARP( 参加大学を比較しリストアッ プ( 確認 ) 山形県立米沢女子短期大学 (84) 羽陽学園短期大学 (12) 山形県立産業技術短期大学校 (95) ゆうキャンパス IR 公開短大はゆうキャンパスの み!
高等専門学校のIR事情 * JAIRO( 機関一覧、 HARP( 参加大学を比較しリストアッ プ( 確認 ) 鶴岡工業高等専門学校 IR 公開高専もゆうキャンパスのみ!
ゆうキャンパス分がすべて山形 大学のコンテンツとしてカウン トされてしまっている 山形大学 (2010) 山形大学( 1450) 東北公益文科大学 (149) 山形県立産業技術短期大学校 (95) 東北芸術工科大学 (93) 鶴岡工業高等専門学校 (91) 山形県立米沢女子短期大学 (84) 山形県立保健医療大学 (38) 羽陽学園短期大学 (12) 実際の数字 JAIRO上の 数字
搾取 してる 気分
NII が参加機関を 把握できていない IR 整備率が、すでに実態とずれてしまってい る
今日の本題 なぜこんな事に なったのか? 山形でしか起きてないが、何処でも起きうる 問題なので、どこかで言っておかないとマズ イ!
Repositry System Web Server contents University Contents upload metadata register Metadata register System administration Metadata administration Copy right management Material digitalization Library Contents upload contents metadata contents Paper, education material,software,experim ent data, letter,report etc members contents Contents IR flow
Repositry System metadata register members IRDB harvesting University NII CiNiiJAIROIRDB analysis
Shared IR metadata C univ. metadata A univ. metadata B univ. harvesting metadata Shared IR Institute Contamination 一括ハーベスティングすると IRDB 上で “ 機関コンタミ “ が起きる! Junii2 には機関識別情報が無いので 混ざると仕分けができない IRDB
Shared IR metadata では HARP は? C univ. metadata A univ. metadata B univ. harvesting metadata C univ. metadata A univ. metadata B univ. harvesting 機関の数だけ、ハーベストを繰り返 す IRDB
少しだけ Dspace に特化した話 ・ Dspace の個々のアイテムには、機関を 識別するコードが入ってない(コレク ションを識別するコードのみ) ・ HARP はかなりイレギュラーな処理を 行っている(広工大:森保さん) ← 具体的にどういう処理をしているの か?
DRF/ShaRe-Hiroshima で 森保さんに直接聞いてみた
さっぱり わからない 『ガリレオ』風に言うと
森保さんから送っていただいたメー ル import org.dspace.content.Community; import java.sql.SQLException; import org.dspace.content.Collection; public String createMetadata(Object nativeItem) throws CannotDisseminateFormatException { Item item = ((HarvestedItemInfo) nativeItem).item; Community parentCommunity = null; Community community = null; String communityHdl = null; try { //Item が属するトップコミュニティーを見つけます。 Collection collection = item.getOwningCollection(); Community[] communities = collection.getCommunities(); parentCommunity = communities[0]; while(parentCommunity != null) { community = parentCommunity; parentCommunity = community.getParentCommunity(); } communityHdl = community.getHandle(); } catch (SQLException sqle) { System.out.println(sqle); } // アイテムが属するトップコミュニティのハンドル ID // が /5( 広大 ) でない場合例外を投げます。 if (!(communityHdl.equals(" /5"))) { throw new CannotDisseminateFormatException("oai_dc"); } > // Get all the DC これで dspace-oai.war をビルドし、大学ごとにファイル名を変えて、 ( 工大 :dspace-oai.war 、広大 :dspace2-oai.war としました。 ) tomcat のウェブ・アプリケーション・ディレクトリに配置します。
プログラムをみて、ようやく 意味がわかってきた ← すぐにわかったわけではな い! ← わかるまでは、トンチンカンな ことを言いまくってた ← しかし、わかってないのはみすみだ けではないのでは?
Dspace のデータはツリー構造 532 もみじ経済大宮島水産大流川産業大 大学毎にコミュニティ分 け
もみじ経済大のデータのみを ハーベスティングするには 11 8 2 16 親が No.11 親が No.8 親が No.2 親はない ← 一番トップ No.16 の所属コミュニティは No.2 メタデータをわた す もみじ経済大は No.2
もみじ経済大のデータのみを ハーベスティングするには 11 8 5 16 親が No.11 親が No.8 親が No.2 親はない ← 一番トップ No.16 の所属コミュニティは No.5 メタデータをわたさな い もみじ経済大は No.2 だから違 う
雑誌の変遷をイメージしてほし い 単独の書誌を見ても継続前誌はわかる が継続前誌のさらに前はわからない ・前に前にとたどっていけば最初がわか る ・メタデータも親をたどっていかないと コミュニティがわからない
すべてのメタデータのコミュ ニティを一つ一つ調べていけ ば、もみじ経済大のみのメタ データを抽出できる
HARP は抽出プログラムを 機関の数 だけ作成 機関ごとにディレクトリを作成し、 その機関のメタデータだけを渡 すプログラムを置いて、その ディレクトリをその機関の BaseURL として NII に登録
確かに イレギュラー
森保さん が いたからこその HARP 広島は人材が豊富だなぁ。。。
森保さんが居ない 山形はどうすべきか? あんまり複雑なことはしたくな い ← やりたくったってでき ない ・できるだけ汎用的な方法をとりたい
とりあえず今考えていること 選択的ハーベスティングは 可能か? pmh2.0/OpenArchivesProtocol.htm#SelectiveH arvestingandSets
OAI-PMH oai/request?verb=ListRecords&metadataPrefix =junii2&from= &until= &set=hdl_ _3893 Metadata’s format=junii Register_date=2008/04/ /10/30 Collection’s handle=hdl_ _3893 Set が hdl_ _3893 のみを選択的に抽出
Reseponse
XML data T09:05:19Z − − −
oai:repo.lib.yamagata-u.ac.jp: / T16:00:22Z hdl_ _3893 やわらかな夜 ヤワラカナ ヨル A Sweet Night 木原, 正徳 キハラ, マサノリ Kihara, Masanori 東北芸術工科大学 トウホク ゲイジュツ コウカ ダイガク Tohoku University of Art and Design 論文 (Article) Departmental Bulletin Paper text text/html ↓continue↓ XML data(2) Metadata format=junii2
XML data(2) ↓ AN 東北芸術工科大学紀要 = Annual Review of Tohoku University of Art & Design jpn handle=hdl_ _3893 は東北芸術工科大学紀要のコレクションに対応
選択的ハーベスティングのため に 1) Dspace の set にコミュニティのコードをい れる ← パッチはある [ ] Add Community and Sub-Community to OAI Sets p_id=19984&atid= 2) NII と交渉して、選択的ハーベスティン グに対応してもらう ← 他のシステムのためにも!
いずれにせよ メタデータの再構築が必要 IRDB だけならまだいいが CiNii 連携していると厄 介!
convert 4912→ repo.yamagata.jp/ J AIRO は Handle system っぽいものを 使ってるらしい ← 中がよくわからない prefix CNRI handle server Changing the server, only need to update convert table Prefix:institute identification number user
metadata A univ. metadata B univ. harvesting metadata CiNii と連携したメタデータは 変更ができない A univ. metadata B univ. IRD B ShaR e CiN ii metadata 動かすとC iNii との 連携が切れてしまう フルテキストへの リンクもおかしくなる
FAQ より Q7-3 : CiNii 連携しています。 junii2 フォーマットで出力する設定( ex. クロスウォーク)を変更 しました。通常の差分ハーベストではなく、 IRDB から一度全件削 除して、再度全データをハーベストして欲しいのですが。 A7-3 : CiNii 連携をしている IR のデータを IRDB ・ CiNii から削除し、 全件取り直す方法ですと、 CiNii で行った同定処理(機械処理・人 手処理)を 解除し、再度同定処理をやり直すことになります。こ のため CiNii 連携している IR については、全件置き換えはお引受け 致しかねます。 なお、クロスウォークのみの修正の場合、個々のアイテムの datestamp は変更されないため、差分ハーベストでデータを更新す ることができません。 つきましては、通常の差分ハーベストで上書き更新ができるよう、 該当データ全ての datestamp を変更してくださいますようお願いい たします。 SQL で一括書きかえ可能と思われますので、システムご担当者様 にご相談ください。 ---
これから共同リポジトリを はじめる機関へ ハーベスティングを開始する前に メタデータがどう流れていくかを 十分に シミュレーション す ること を 強く オススメします!!!
ゆうキャンパスリポジトリ ・システムのカスタマイズが 必要 ← 今年度は予算がな い ・IRへのデータ投入は控え めに ← 投入して大丈夫なのか? やっちまったものは仕方がない ♪
反省はしているが 後悔はしてません
来年度の ShaRe にむけて システム毎のノウハウの共有が必 要 組織の独立、合併のシミュレー ション アクセス解析 さらにいろいろなシステムの問題 が でてきそう
共同リポジトリ ≠ 機関リポジト リ
Happiness Only Real When Shared from “Into the Wild “Jon Krakauer 最後に