情報技術演習Ⅰ 人文学研究のための情報技術入門 2013/05/09

Slides:



Advertisements
Similar presentations
情報技術演習Ⅰ 人文学研究のための情報技術入門 2014/06/11 担当:林晋 TA: 橋本雄太.
Advertisements

1 情報処理基礎 2006 年 7 月 6 日. 2 本日の学習項目 HTML 文書の基礎知識を習得する。 ホームページ・ビルダーの基本的な使 い方を習得する。 ホームページの作成 自己紹介のためのホームページを作成する。
情報基礎演習I(プログラミング) 第9回 6月22日 水曜5限 江草由佳
応用コース:ワープロを活用する WORD2000 1回目 基礎コースの復習(第1章と付録) 2回目 文字の入力(第2章と第4章)
映像技術演習 第7回:オーサリング・書き出し.
情報・知能工学系 山本一公 プログラミング演習Ⅱ 第3回 配列(1) 情報・知能工学系 山本一公
本日のスケジュール 14:45~15:30 テキストの講義 15:30~16:15 設計レビュー 16:15~16:30 休憩
情報技術演習Ⅰ 人文学研究のための情報技術入門 2016/05/11
情報処理実習 第05回 Excelマクロ機能入門 操作マクロ入門.
ブラウザの基本操作 前のページに戻る ブラウザの左上にある 「戻る」ボタンで、自分がたどってきた一つ前のページに戻ることができます。
情報技術演習Ⅰ 人文学研究のための情報技術入門 2014/05/29
情報技術演習Ⅰ 人文学研究のための情報技術入門 2015/07/02
情報技術演習Ⅰ 人文学研究のための情報技術入門 2011/11/10
QRコード作って使ってみる 作成者: 川瀬 智美 川瀬智美ですよろしくお願いします ここにあるマークご覧になったことありますでしょうか?
計算機リテラシーM 第2回 メール 伊藤 高廣.
情報技術演習Ⅰ 人文学研究のための情報技術入門 2013/06/26
情報技術演習Ⅰ 人文学研究のための情報技術入門 2013/04/18
情報システム利用入門 パワーポイントの使い方
ファイルやフォルダを検索する ①「スタート」→「検索」→「ファイルとフォルダ」とクリックする。
情報技術と著作権.
心理学情報処理法Ⅰ やってみよう:Wordの起動.
ただで使えるソフトウェア ーインストールとお絵かきー
コンピュータ演習Ⅰ 8月7日(日) 1限目 ファイルの種類.
コンピュータ上でICトレーナーを動かそう!!
エクスプローラ ● エクスプローラ: ファイルやフォルダを階層構造で表示してあり、これらを操作するのに便利。
ファイルシステムとコマンド.
コンピュータと情報 第3回 補遺 ファイルとフォルダ.
情報技術演習Ⅰ 人文学研究のための情報技術入門 2012/11/29
情報技術演習Ⅰ 人文学研究のための情報技術入門 2013/04/11
さとりすと Satori Ghost Editor 里々ゴーストの統合開発環境を作ったよ page: 1/25
アナログとディジタル 高校1年 社会と情報⑤.
9 Microsoft Word(1).
情報工学科 二宮 洋・鈴木 誠 小林 学・高畠俊徳 火曜日 1コマ目
コンピュータ基礎実習上級 #10 絶対パスによる指定
情報技術演習Ⅰ 人文学研究のための情報技術入門 2011/10/13
NC-2 情報通信基礎実験 WEBデザイン基礎実験 (1日目) 担当:清水,田代 副手:浦辺,石井.
情報技術演習Ⅰ 人文学研究のための情報技術入門 2017/07/06
情報技術演習Ⅰ 人文学研究のための情報技術入門 2017/06/22
情報技術演習Ⅰ 人文学研究のための情報技術入門 2013/06/06
情報技術演習Ⅰ 人文学研究のための情報技術入門 2017/06/01
(Wed) Edited by KON IT講習会 一太郎編.
情報技術演習Ⅰ 人文学研究のための情報技術入門 2017/04/20
経営工学基礎演習a PowerPointの利用.
Microsoft PowerPoint98 Netscape Communicator 4.06[ja]
文献の整理術 ―文献管理ソフトを使ってみよう―!
情報技術演習Ⅰ 人文学研究のための情報技術入門 2011/12/01
単語登録(1) ◎MS-IMEの「単語登録」に、単語、語句、記号など自分がよく使うものを登録しておくと、便利である。
コンピュータ概論B課題 - PowerPoint -
1.Webサイトの情報を活用しよう プレゼンテーション資料
情報技術演習Ⅰ 人文学研究のための情報技術入門 2014/05/01
6演習 「ICTを活用した授業の展開」 すでに学校に英語ノートのコンピュータ用ソフトが届いているかと思います。電子黒板がある学校では、そのソフトをさらに効果的に活用することもできます。電子黒板でどんなことができるかを紹介します。
地域情報学 C言語プログラミング 第1回 導入、変数、型変換、printf関数 2016年11月11日
情報スキル活用 第4週 基礎技術-4 : その1(タグのまとめ).
Htmlの基本.
情報技術演習Ⅰ 人文学研究のための情報技術入門 2017/06/08
基礎プログラミング演習 第12回.
情報処理 第13回の教材 プレゼンテーションソフト PowerPoint 高知大学 共通教育 理学部 対象 担当教員 : 塩田
ファイルやフォルダを検索する ①「スタート」→「検索」とクリックする。 ②「表示項目」から適当なものを選択する。
第1章 いよいよプログラミング!! ~文章の表示 printf~
情報技術演習Ⅰ 人文学研究のための情報技術入門 2016/06/09
ホ-5班 発表タイトル(30字以内) 学籍番号1 名前 学籍番号2 名前 学籍番号3 名前 学籍番号4 名前 …
プログラミング入門 電卓を作ろう・パートI!!.
2.関数の組み合わせ によるプログラム.
情報技術演習Ⅰ 人文学研究のための情報技術入門 2017/04/13
情報技術演習Ⅰ 人文学研究のための情報技術入門 2015/04/09
情報技術演習Ⅰ 人文学研究のための情報技術入門 2017/05/
エクスプローラ ● エクスプローラ: ファイルやフォルダを階層構造で表示してあり、これらを操作するのに便利。
単語登録(1) ◎MS-IMEの「単語登録」に、単語、語句、記号など自分がよく使うものを登録しておくと、便利である。
レポート&筆記試験について.
情報基礎Ⅰ 情報セキュリティの部 共通認証IDの使い方
Presentation transcript:

情報技術演習Ⅰ 人文学研究のための情報技術入門 2013/05/09 情報技術演習Ⅰ 人文学研究のための情報技術入門 2013/05/09 担当:林晋 TA:橋本雄太 2009/10/14

今回のテーマ OCR の使い方 2009/10/14

文書とOCR 「文書」という言葉には色々な意味があります.コンピュータ上では, “aaa.txt”, “bbb.doc” などの文書がありますし,“20130502.ppt” というファイルも「PowerPoint の文書」と呼ばれることがあります.これらはSJIS, Unicode などの文字コードで文を表現していますので,コード化文書と呼べるでしょう(一般的用語がないので,林が作った言葉です). 紙の上のインクや看板上のペンキ,石碑上の凹み,などの物理的模様による文書を物理的文書ということにしましょう.皆さんが見ているモニタ(ディスプレィ)上の,この文書も物理的文書と言えるでしょう. また,物理的文書をデジカメで撮影して作った “aaa.jpg” “bbb.bmp”などの電子画像を画像化文書(正確には電子画像化文書)と呼びましょう. OCR とは画像化文書をコード化文書に変換することだといえます.物理的文書を画像化して画像化文書にするのにはデジカメやスキャナーを使います. 2009/10/14

自炊 大量の書物を読んでレポートを書く,卒論を書く,研究する場合,それが Google Books の書籍のように検索できると大変便利 また検索ができなくても,書籍がデジタル画像になっていれば,大量の本を軽々ともち運ぶことができる. 本棚も不必要になり省スペースになる それらを可能にするのが,いわゆる自炊 本を解体したりして,スキャナーで電子画像にし,PDFファイルなどにまとめることを自炊という. 注意!!! これは自分だけのためにやるのならば問題がないが,人に渡してしまったりすると著作権侵害となる(らしい)ので注意!! これからやる演習の結果も,林への課題提出以外では,決して他人に渡してはいけません 2009/10/14

自炊のやり方を書いたWEBページ http://wikiwiki.jp/bookjisui/ http://ushigyu.net/2012/03/01/jisui_q_and_a_by_jisui_blogger/ http://bizmakoto.jp/bizid/articles/1006/01/news031.html http://pc.watch.impress.co.jp/docs/topic/feature/20110218_426830.html 2009/10/14

二つの方法 今日は,自炊を行う二つの手段を実際にやってもらいます. そして,その結果のPDFファイルとHTMLファイルが提出すべき課題となります. 注意:自炊の方法はほかにも色々ある.しかし,ここで紹介するのは典型的ケース. 2009/10/14

専用ブックスキャナを使う方法 本をフラットベッドスキャナーと呼ばれる廉価なスキャナーでスキャンして電子画像にしようとすると,厚い本の場合,真ん中あたりが曲がってスキャンされる. さらには真ん中に黒い帯が入ってしまい,場合によっては,文字が読めない場合もある.これはコピー機の場合と同じ. これを防ぐために,作られたフラットベッドスキャナー 本の中央をスキャナの端にあててスキャンしてもコピーができる. 普通のスキャナは,周りに余裕を持たせてあるので,そうやると真ん中が欠けてスキャンされる. 2009/10/14

長所と短所 長所 短所 本を分解しなですむ. ページごとに上下が交代する. やすいといっても,兎に角,スキャナを買わなくてはならない. 不必要なら古本として売れば良い. 短所 ページごとに上下が交代する. やすいといっても,兎に角,スキャナを買わなくてはならない. 2009/10/14

本を解体する方法 本を裁断して,ドキュメントスキャンという,文書専用スキャナで読み込む. 長所と短所 短所:本がバラバラ.捨てることになる. 長所:裁断さえできれば,読み込み(スキャン)は簡単かつ速い 短所:裁断は裁断機のよいものがない場合は大変 2009/10/14

裁断の事例集 http://www.youtube.com/watch?v=pYBLZUKB0Uw http://www.youtube.com/watch?v=6D_6unB4X6c&feature=related http://www.youtube.com/watch?v=RD2EmcgVRR8&feature=related ディスクカッター http://www.youtube.com/watch?v=wJ5Lefyx26E&feature=related http://www.youtube.com/watch?v=G7i9E4XovMw&feature=related 置き場所にさえ困らなければ,比較的安い裁断機がある. それを実習で使ってみる. 指などを怪我しないように切り落とさないように注意!!! 2009/10/14

実際にやってみよう 説明をした後,前に集まってもらいます. そして、まず,林と橋本がスキャン+OCR使用をやってみせます.その後で,それぞれのPCに適当に分かれて,各自,自分で実際にやってみてください.それが今日の課題です. 裁断機はひとつです.裁断は指を裁断すると困るので,林か橋本がやってみせます. スキャナは2種類.それぞれ林と橋本が担当しますので,すくなくとも一方で説明を聞いて実習を行ってください.時間がある場合は両方やってください. 2009/10/14

OCRは e-typist を使用 OCR は二つのPCとも e-typist を使います. YouTube の画像にように,スキャナのボタンを使う方法もあるのですが,今回は e-typist からスキャナを呼び出してスキャンする方法で行います. それぞれのPC+スキャナの周りに集まり, 林か橋本の説明を聞いてください. 林: ブックスキャナ OpticBook 担当 橋本:ドキュメントスキャナ ScanSnap 担当 どちらでやっても構いませんが, 待ち時間を考慮してスキャナを選択ください. 使い方の説明は必要に応じて繰り返します. 2009/10/14

ScanSnap S1500 による自炊 That Noble Dream を裁断 なれていないと危ないので,この部分だけは林か橋本が行います 自分で本や文書を持ってきたひとは,この本ではなくて,自分がもってきたものでやって結構です.ただし,裁断は林か橋本にまかせてください. ひとりあたり数ページをScanSnapでスキャンしてOCRでテキストにしてください. スキャンのためには,デスクトップにリンクがある eTypist を使ってください. 動画でやっていたような,スキャナのボタンを押してのスキャンはしないでください 詳しい使い方は林か橋本が説明します. 結果は何ページ読んだ場合でも,一つのテキストファイルか HTMLファイルにして,デスクトップにある「情報技術演習提出用」というフォルダに置く. ただし,ファイル名を 自分の名前学籍番号.txt のようにしてください. 例えば,西田幾多郎0100243333.txt これで課題提出となります. OCRはかなり読みを間違います.この誤認識は気にしなくて結構です. 2009/10/14

OpticBook 4600での自炊 言語都市・ベルリン 1861‐1945のどこでもよいから,自分の好きなページを幾つかスキャンしてください. 自分で本や文書を持ってきたひとは,この本ではなくて,自分がもってきたものでやって結構です. ひとりあたり数ページを OpticBook でスキャンしてOCRでテキストにしてください. スキャンのためには,デスクトップにリンクがある eTypist を使ってください. スキャナのボタンを押してのスキャンはしないでください 詳しい使い方は林か橋本が説明します. 結果は何ページ読んだ場合でも,一つのテキストファイルか HTMLファイルにして,デスクトップにある「情報技術演習提出用」というフォルダに置く. ただし,ファイル名を 自分の名前学籍番号.txt のようにしてください. 例えば,西田幾多郎0100243333.txt これで課題提出となります. OCRはかなり読みを間違います.この誤認識は気にしなくて結構です. 2009/10/14