1 データベースの構築 慶應義塾大学 DMC 機構専任講師 大久保 成 日本における『百科全書』パリ版デジタルアーカイブ共同研究の現状.

Slides:



Advertisements
Similar presentations
TCP/IP によるチャットプログラ ム 薄井 秀晃. 基礎知識編 TCP/IP とは? IP とは・・・ Internet Protocol の略称であり通信方法の技術的なルールで あり、実際にデータを送受信する前にデータを小さなデータ に分割し、それに発信元と受信先の IP アドレスを付加させて.
Advertisements

オープン&ビッグデータ活用・地方創生推進機構 事務局 オープン&ビッグデータ活用・地方創生推進機構 評価版ツールの状況報告 平成26年度第3回 技術委員会 資料3-1.
1 金属加工会社における 生産工程管理システムの開発 電子情報システム工学専攻 S0713 清水 邦宏.
データベースの基礎知識 ACEESS の基本操作. データベースの基礎知識 データベース  特定のテーマや目的に毎のデータの集合体 データベースソフトウェア  データベースを作成、管理するソフトウェアの総 称 Oracle(Oracle) IBM(DB2) Microsoft(SQL Server)
1 最終授業 試験は行いません 全課題の最終締め切りは 1/13 の 21:00 で す。 基本課題は必ず全て提出してください。 提出先に間違いがないか再度確認して ください。
コンピュータ演習 Excel 入門 岡田孝・山下雅啓 Excel の機能は膨大 その中のごく一部を紹介 表計算機能 – データの入力、表の作成、計算など グラフ機能 – 棒グラフ、円グラフなどグラフ作成 データベース機能 – 並べ替え(ソート)、検索、抽出など マクロ機能 – VBA で自動化したマクロを作成可能.
SQLエディタによる データベースプログラミング 01. データベースとはデータを1つにまとめて 複数のシステムで共有できるようにしたもの 蔵書管理システム 貸出管理システム 生徒ファイル 生徒番号 学年 クラス 番号 名前 性別 住所 貸出ファイル 貸出番号 図書番号 貸出月 貸出日 蔵書ファイル.
情報処理 第 13 回. 今日の内容 練習用ファイルのダウンロードデータの入力 – データベースに適したデータの入力方法 – ウィンドウ枠の固定 ( 見出し行の固定 ) データの並べ替え –1 つの列の値で並べ替え – 複数の列の値で並べ替え.
クリックすると、 [SourceEditor2.0] の インストール / 更新・起動 クリックすると、 [MarkReader2.0] の インストール / 更新・起動 クリックすると、 [MarkReader2.0] の インストール / 更新・起動 SQS ホームページ
Accessによるデータベース(1) Ver.1 /11.
DB(データベース)のおはなし 作成者:小野正広 DBと言っても、  ドラゴンボール ではないですぞ! 3/1/2017.
WagbyR6.5 Update 14 PPT版 更新情報
リレーショナル・データベース データベース論 第10回.
HG/PscanServシリーズ Acrobatとなにが違うのか?
SQLエディタによる データベースプログラミング
Flashプレイヤーを使った動画配信 情報工学科 宮本 崇也.
OpenOffice.org で版管理 西木 毅 第2回関西OpenOffice.org勉強会 大阪電気通信大学
Excel による データベース入門 Ver /9.
ウェブページ制作の基礎 タグの直接入力によるウェブページの制作 次のスライドへ進んだり,戻ったりしたい時は,右下のボタンをクリック。 次へ.
「サイボウズ Office on cybozu.com」 すぐできるBOOK -ワークフロー 編 -
talend活用事例 ・ナビゲータグラフのカスタマイズにおける事例 ・CSVダウンロードでのカスタマイズ事例
オンライン登記申請マニュアル 【第4段階】 オンライン登記申請編
JavaによるCAI学習ソフトウェアの開発
文献管理ソフトRefWorksの利用 2009.
ACCESSによる データベースアプリケーション開発実習 日本工業大学 情報工学科 “データベースの実際” 教材
Accessによる SQLの操作 ~実際にテーブルを操作してみよう!~.
ケータイキット for Smarty のご紹介
ホームページの作り方.
5.WEKOコンテンツ登録 準備 マニュアル Version 2.1
WagbyR6.5 Update 12 PPT版 更新情報
三上研究室学生のための 文献検索および入手の基礎講習
第2章 ソフトウェアの基礎知識 電子制御設計製図Ⅰ    2010年5月11日 Ⅲ限目.
ユーリテクノスのFlashテクノロジーを 利用した様々なサービスのご提案
第2章 ソフトウェアの基礎知識.
高専間教育素材共有システム (教育素材の登録)
図書館システムの歴史と 日本語処理を考える
第7章 データベース管理システム 7.1 データベース管理システムの概要 7.2 データベースの格納方式 7.3 問合せ処理.
Webを利用した授業支援システムの開発 北海道工業大学 電気電子工学科 H 渋谷 俊彦.
情報処理 第13回.
Web上で管理・利用できる 面接予約データベースシステムの構築
CiNii Articlesトップページ クイックガイド <キーワードによる検索方法>
この資料は、テキストをもとに、講義のために作成したものです.学習用に活用してください.
マイクロソフト Access での SQL 演習 第1回 SQL問い合わせ(クエリ)
お勧めのリンク集                氏名        宮城教育大学 課程、専攻 学籍番号.
川口真司 松下誠 井上克郎 大阪大学大学院情報科学研究科
地理情報システム論演習 地理情報システム論演習
プログラミング 設計資料 メンバー:.
第8章 Web技術とセキュリティ   岡本 好未.
データベース設計 第2回 データベースモデル(1)
メールの利用1 Webメールの利用方法.
クイックガイド <キーワードによる検索方法>
オープンソース開発支援のための リビジョン情報と電子メールの検索システム
マイクロソフト Access を使ってみよう 第2回
日本郵便 「Web-EDI」利用ガイド (JP EDIシステム)
ユビキタス・コンピューティング に関する研究紹介
文字エンコーディング 2010年7月.
7-3. 移行データ登録簡易マニュアル Version 1.0
ディスカバリーサービス プリモ ~ Discovery & Delivery ~
Garoon on cybozu.com 2014年9月版 新機能 Copyright© 2014 Cybozu.
構造的類似性を持つ半構造化文書における頻度分析
大学図書館における研究開発 「ライブラリシステム研究会」について 三田図書館・情報学会月例会 2002年9月21日
情報検索演習:第4回 前回の配布資料: 教室の前方のカサ立てにある パソコンを起動したさいに入力する 氏名に 「時限-学籍番号-名前」
リレーショナル・データベース J2EE I (データベース論) 第2回 /
vc-1. Visual Studio C++ の基本操作 (Visual Studio C++ の実用知識を学ぶシリーズ)
情報処理 第13回.
Googleマップを活用した 生物調査データベースの構築
情報処理Ⅱ 2007年12月3日(月) その1.
CADシステムとソフトウェア 電子制御設計製図Ⅰ    2009年4月28日 Ⅲ限目.
地理情報コンテンツ・データベースコンテンツ新規作成
「図書系職員のための アプリケーション開発講習会」
Presentation transcript:

1 データベースの構築 慶應義塾大学 DMC 機構専任講師 大久保 成 日本における『百科全書』パリ版デジタルアーカイブ共同研究の現状

2 まずは現物をご覧ください ml

3 従来のアーカイブ系コンテンツ の特徴 独自型 – 電子辞書など – データとインターフェースが一体化 – コンテンツごとの独自性を発揮させやすい – 他形態への応用が難しい 汎用型 – 図書館システムなど – データは分野を超えて収蔵可能だが、イン ターフェースが貧弱

4 最近の傾向 「収蔵庫」と「展示場」の分 離 – ウェブコンテンツのデータベース化 – 汎用的なデータを格納しつつ、個別 のインタフェースを用意 – データベース部分は汎用性を高める – インターフェース部分は個別性を高 める

5 KDDE の基本システム データベース部分 –PostgreSQL –PHP –UTF-8 インターフェース部分 –Logosware 社の Flipper を利用 –Macromedia (現 Adobe 社) Flash の 応用

6 Flipper 部分の作成 DMC 機構の貴重書撮影技術 を活用 –RAW データで撮影 – 14.6 MB(4922×3328 pixel) JPEG に変換後、 Flipper へ取 り込み

7 データベース構築にあたり PostgreSQL を活用 – フリー(無料) – 多言語処理が得意 IT 業界での「国際化」というのは「日 本語化」程度の意味しか持たないこと が多いが、 PostgreSQL は真の意味での マルチリンガルな仕様になっている (複数の文字セットを任意に変換可能 な仕様) ただし、 Unicode 上のギリシア文字と Shift-JIS 上のギリシア文字(全角)は 違う文字で扱われるなど、文字コード に対する一定の理解は必要

8 データベース構築にあたり データベースの基礎的考え方 – テーブル=エクセルの表 – レコード=エクセルの行 – フィールド=エクセルの列 「ひとつのセル」に「ひとつ の情報」

9 「ひとつの情報」とは? e.g. 「 49a-53b 」 – 「49ページ」の「左段落」から「始ま り」、「53ページ」の「右段落」で「終 わる」 –6 つの情報 e.g. 「 101a 」 – 「101ページ」の「左段落」から「始ま り」、「101ページ」の「右段落」で 「終わる」 「見た目がひとつの情報」であ っても、複数の情報を含有して いる 構造を明らかにしないといけな い SQL でいうところの「第2正規 化」

10 どこまで分割するか? 細かく分ければよいか? –→NO – どのレベルで検索をかけたいかによ る – 機械的には決められない – 「 ART DES ESPRITS, ou ART ANGÉLIQUE 」で「 ART ANGÉLIQUE 」が単独で検索され る必要がある場合は、「別名フィー ルド」などを作り、検索の対象とす る

11 どこまで分割するか? e.g. 「 *ARCHANGEL 」 2つの情報が含まれている – 「*」:ディドロが執筆した – 「 ARCHANGEL 」という項目 「 DIDEROT 」というフィールド を作り、「*」が付いた項目に フラグを立てた – 検索すると以下のような順序で処理される – 「前方一致で検索」 → 「 DIDEROT フィール ドが On か Off か?」 → 「 On の場合、*+項 目名で表示」 – 研究者からみて違和感のないようなインタ ーフェースの工夫が必要

12 どこまでを「同じ内容」とす るか 「包摂」という問題 – 「 Géog. 」と「 Géog r. 」は同じか否か? – SQLでいうところの第一正規化 今回は「分類項目(現代表 記)」でのみ検索可能にした – 「 Géographie 」のみが検索語に指定可能 – 「品詞と性」については 今回は正規化を 見送り 「 adj. 「 adject. 」「 adjectif 」はそれぞ れ別の項目として検索される

13 今後の課題 メニューなどの多言語化 – トップページのみ日英仏から選択可 能 正規化 – 入力ルールの整理と徹底化 ユーザ管理 – 誰でも修正可能な状態 ウェブ上での研究コミュニテ ィつくり

(参考)フィールド一覧( basic ) フィールド 名 フィールド形式内容 idtext レコード ID entrytext 項目名 diderotcharactervarying(1) 「ディドロマーク」 tomecharactervarying(2) 巻数 stpagetext 開始ページ stcoltext 開始ページの段落 edpagetext 終了ページ edcoltext 終了ページの段落 genretext 性と名 des_oritext 分類項目(オリジナル表記 ) des00text 分類項目(現代表記) des01text 分類項目(現代表記) des02text 分類項目(現代表記) des03text 分類項目(現代表記) des04text 分類項目(現代表記) des05text 分類項目(現代表記) des06Text 分類項目(現代表記) des07Text 分類項目(現代表記) des08Text 分類項目(現代表記) des09text 分類項目(現代表記) des10text 分類項目(現代表記) des11text 分類項目(現代表記) des12text 分類項目(現代表記) lengthtext 長さ attribtext 執筆者同定 schwabtext Schwab 番号 ts timestampwithouttimezon e レコードのタイムスタン プ

(参考)フィールド一覧( flipper ) フィールド名フィールド形式内容 stpagetext 開始ページ flipperinteger Flipperにおけるページ数(第一巻の場合、実物の 1 ページは Flipper で は 72 ページ) dirtext Flipperを呼び出すためのファイルのディレクトリ名とファイル名 tstimestamp レコードのタイムスタンプ

(参考)ページ遷移(ユーザから見える範囲の み) index.html トップページ index.html トップページ search.php 検索語入力 search.php 検索語入力 list.php 結果一覧 list.php 結果一覧 allinfo.php 項目のメタデータ allinfo.php 項目のメタデータ book115.php Flipper の呼出 book115.php Flipper の呼出 update_list.php 修正用ページ update_list.php 修正用ページ (別ウィンドウで 開く)

(参考)ファイル一覧(ルートディレクトリ) allinfo.php 指定項目の全メタデータ表示 attrib.php 執筆者同定一覧を生成( search.php で利用) common.css 表示ページに共通のデザインを CSS で指定 des_nor.php 分類項目(現代表記)一覧を生成( search.php で利用) genre.php 性・名の一覧を生成( search.php で利用) img 【ディレクトリ】ページに共通の画像部品を格納 index.html トップページ kdde1_flipper 【ディレクトリ】 Flipper データを格納 language.php 表示言語の対訳一覧 length.php 長さの一覧生成( search.php で利用) list.php 検索結果表示 MYDB.php データベース接続のための共通部品 search.php 検索ページ stpage.php 開始ページ一覧を生成(ローマ数字なども含まれるため、処理が必要) tome.php 巻数一覧を生成 update.php 修正用の命令をデータベースに送信( update_list.php から呼出) update_list.php 修正用ページ