第2回 1999/10/7 情報検索の歴史(1) 使用文献 講座図書館の理論と実際5 情報検索 細野公男編 情報検索概説II(99秋) 第2回 1999/10/7 情報検索の歴史(1) 使用文献 講座図書館の理論と実際5 情報検索 細野公男編
連絡事項 講義のホームページ http://www.mita.keio.ac.jp/~msyk/irg2/
索引方式 索引 事前結合索引方式 事後結合索引方式 ある対象を的確に示す用語 索引語がそのまま対象に対応している 複数の索引語から主題を導く 索引語の組み合わせを後から行う その結果、対象が導かれる
情報検索システムの発展経緯 機械的な手段は1930年代から
現在の検索システムの普及要因 コンピュータの出現と、その急激な技術的進歩と普及 コンピュータを効率的に使うデータベース放逐技法の発展 データベース化技術の発展に伴う印刷物のデータベース化の普及 通信網の普及
1950年以前-萌芽期 米国での20世紀初頭 第二次世界大戦頃に、こうした機材を情報検索に使うようになった 特徴 文書の記録にマイクロフィルム データ計算管理にパンチカード 第二次世界大戦頃に、こうした機材を情報検索に使うようになった 特徴 逐次検索方式による検索機械 パンチカードを使用した事後結合索引方式
逐次検索方式による検索機械 1938年、米国農務省、ショー Rapid Selector マイクロフィルム 文献 2進数のコードで示した主題
パンチカードによる事後結合索引方式 1940年ごろ、バッテン、特許情報の管理 パンチカードのもとになった「ほれリスカード」を使う 主題→1枚のカード 文献番号からカードの位置 カードを重ねる ピーカブーシステム 主題の数は無制限にできる
Zatocoding System 1940年代末、ムアズ ホールソートカード(へり穴カード) 統制語彙 カードには書誌情報 カードのヘリに主題概念をあらわす穴 用語(ディスクリプタ)に応じた穴 統制語彙 あらかじめ決められた主題
1950年代-揺籃期 事後結合索引方式の確立 コンピュータによる情報検索システム 転置ファイル ブール代数
事後結合方式の確立 1951年、タウベ、事後結合方式の提案 1953年、ユニターム方式、カードで実現 索引語ごとにカードを用意 カードにその主題を含む文献番号を記載 複数の索引語の場合、いずれのカードにも含む文献番号から検索できる
コンピュータによる検索システム 1951、MITでオンライン情報検索システムの可能性が研究される 1954、IBMが汎用コンピュータで最初の情報検索システムの実験 1958、ウェスタンリザーブ大学、ペリーとケント、磁気テープ 同時にパンチカード、16ミリフィルム、マイクロフィルムも研究されたが、60年代のコンピュータの広がりの中、この種の検索機械は衰退する
転置ファイル データ自体を逐次検索すると非常に時間がかかるようになる 1958、タウベ データのありかを記録したファイル
1960年代-成長期 1957年、スプートニックショック オフラインバッチ型情報検索システム オンライン会話型情報検索システム 米国の科学技術予算の増大 オフラインバッチ型情報検索システム オンライン会話型情報検索システム
オフラインバッチ型検索システム 米国国立医学図書館、MEDLARS ロッキード、USAirforce、SDC 医学文献を対象 磁気テープを利用 検索に2週間、結果が得られるまで6週間 ロッキード、USAirforce、SDC ハーバード大学ソルトン、SMART ピッツバーグ大学ホーティ、法律の条文のフルテキスト USAirforce、LITE
オンライン会話型検索システム SDC、ロッキード:Protosynthex OLEX ORBIT ロッキード:DIALOG Goloden Book Encyclopedia 転置ファイル、全文検索機能 近接演算、部分一致演算 OLEX ORBIT Arpanetで利用 ロッキード:DIALOG
1970年代-発展期 オンライン会話式検索の商用サービス データ通信の発達 タイムシェアリングシステムの普及
商用サービスの展開 サービス範囲の拡大 データベースがビジネスになる 書誌ユーティリティ 代行検索者 利用者訓練 書誌情報から法律、記事、特許 データベースがビジネスになる 書誌ユーティリティ 代行検索者 利用者訓練
データベースの発展経緯 データベースの意味 データとプログラムの分離 整合性の維持 セキュリティ 複数ユーザーの同時利用 障害時のデータの保護
1950年代-揺籃期 入力 パンチカード、紙テープ 記憶 磁気テープ パンチカードによる人口調査 UNIVAC コンピュータを利用した印刷
1960年代-成長期 磁気テープ、磁気ディスク さまざなデータが蓄積されるようになった 米国国立医学図書館、MEDLARS 米国航空宇宙局、STAR Chemical Abstracts Service 索引誌、抄録誌 米国議会図書館 百科事典、法令 物性データ(Chemical Registry System)
1970年代-発展期 1972年、商用サービス、DIALOG リレーショナルデータベース パソコンの登場 IBMのコッドが理論体系を作り上げた 現在の主流となるデータベース管理手法 パソコンの登場