発表32 レポート評価支援について (剽窃部分と指導箇所の検出)

Slides:



Advertisements
Similar presentations
11 インターネットの危険 情報セキュリティの視点から 2012 年 7 月 15 日 (日) 駒澤大学 経営学部 教授 西村 和夫 オープンキャンパス/模擬授業.
Advertisements

1 共通科目 コンピュータ・リテラシ b 第 2 回 WWW における情報検索とブラウ ザ 担当: 遠藤 美純
1 通信教育学部 コンピュータ演習 WWW における情報検索とブラウザ 担当: 遠藤 美純
CEC 公開授業 Web サイト制作の流れ ~テーマ決定からサイト公開まで~ 2007 年 9 月 14 日 於:京都すばる高校 学校インターネット教育推進協会.
学びとしての PC スキルアップ 講座 熊本大学生協 PC スキルアップ講座スタッフ 高畠 舞美 九州ブロック学生事務局 小島 健太郎.
コンピュータプラクティ スⅠ アンケート 水野嘉明 1. 本日の予定 「アンケート」  人間的な要因を評価するための 一手段として、アンケートの方 法について学ぶ  実験では、アンケートの集計を 行う 2.
情報利用のルール 著作権・引用 インターネット情 報 電子資料の利用. 著作権・引用 「コピペ論文」 ̶ 「丸写し」はなぜいけない? ̶ 他人の著作権の侵害:盗作・剽窃 未公開・無料公開でも → 他人の著作物を正しく利用するに は・・・ 引用 ̶ 出典を明記する:先人への敬意 先行研究を調べたことの証明.
知的財産権を考えよう! 社会と情報 ⑪.
インターネットの利用 教科書 P22~27,36~41 埼玉県立大宮武蔵野高等学校・情報科.
学校における 著作権  学校には、図画、作文、習字、彫刻、かべ新聞など、児童生徒の「著作物」が多数掲示されています。授業に使う教科書、楽譜、テスト問題や図書室の本、音楽CD、ビデオ、パソコンのソフトなども著作物であり、学校はまさに「著作物の宝庫」です。しかし、私たち教師は、著作権について、どれだけ意識して授業や校務を行っているでしょうか。
レポートの書きかた 2012年4月10日.
画像展示サイト“Fragments” 『閲覧しやすさ』と『デザイン性』を両立させた Webデザイン
知識情報演習Ⅲ(後半第1回) 辻 慶太(水)
第1回レポートの課題 6月19日出題 今回の課題は1問のみ 第2回レポートと併せて本科目の単位を認定 第2回は7月に出題予定
情報技術と著作権.
<14> 試験実施 関連ガイド 授業内試験(期間外試験)実施予定日
情報爆発A01支援班 マイサーチエンジン開発環境支援グループ 中村聡史, 大島裕明, 田中克己, 喜連川優
このPowerPointファイルは、 情報処理演習用に作った フィクションです。
情報処理技術者試験 2009 科目担当 松本 章代.
学校の コンピュータ 発表者 Miho Harusawa.
1.自然言語処理システム 2.単語と形態素 3.文節と係り受け
データ構造とアルゴリズム論 第9章 木構造 平成16年12月21日 森田 彦.
Webサイト運営 09fi118 橋倉伶奈 09fi131 本間昂 09fi137 三上早紀.
Webからの剽窃レポート 検出手法の実装と評価
Webサイト制作の流れ CEC公開授業 ~テーマ決定からサイト公開まで~ 2007年11月20日 於:東京都立板橋有徳高校
テキストの類似度計算
Webを利用した授業支援システムの開発 北海道工業大学 電気電子工学科 H 渋谷 俊彦.
Wordの使い方.
データ分析基礎c(2012年以降入学) 情報編集基礎c(2011年以前入学)
クリッカブル三次元地図の制作 情報工学科 服部 真和 (指導教員: 金子 教授) 研究背景 目的
データベース設計 データベース設計 第0回 オリエンテーション 坂口利裕.
著作権について グループ名:左後ろ.
スマホでクリッカー(1) clickest を使ってみよう.
平成22年6月15日 図書系職員のための アプリケーション開発講習会
オントロジーを使用した プログラム開発支援システムの提案
コードクローンに含まれるメソッド呼び出しの 変更度合の分析
コードクローンに含まれるメソッド呼び出しの 変更度合の調査
情報処理 第8回.
レッスン1 情報の収集と整理 から プレゼンへ (道具を使いこなす)
卒業研究中間発表 社会情報システム学講座 高橋義昭.
学生の相互評価を用いた モデリング支援システムの開発
プリムのアルゴリズム 重み付きグラフG=(V,E)の任意の点集合 U⊂Vに対して一方の端点がUの中にあり、他方の端点がV-Uの中にあるような枝の中で最小の重みを持つものをlとすれば、枝lを含むような最小木が存在する。
ネットショップデザイン入門Ⅰ・ⅡSEO 2013/12/18 Webデザイン入門 SEOの基本.
明日の授業でも作成を継続する予定です 2017/11/13、2017/11/14
単語登録(1) ◎MS-IMEの「単語登録」に、単語、語句、記号など自分がよく使うものを登録しておくと、便利である。
情報検索(6) メディア検索の仕組み 教員 岩村 雅一
Internet広域分散協調サーチロボット の研究開発
類似度を用いた WWW のリンク構造の解析 谷 研究室    栗原 伸行.
暗号技術 ~暗号技術の基本原理~ (1週目) 情報工学科  04A1004 石川 真悟.
Webコミュニティ概念を用いた Webマイニングについての研究 A study on Web Mining Based on Web Communities 清水 洋志.
基礎プログラミング演習 第12回.
情報処理基礎A・B 坂口利裕 横浜市立大学・商学部
項目間の対応関係を用いた XBRL財務報告書自動変換ツールの試作
構造的類似性を持つ半構造化文書における頻度分析
設計情報の再利用を目的とした UML図の自動推薦ツール
ホ-5班 発表タイトル(30字以内) 学籍番号1 名前 学籍番号2 名前 学籍番号3 名前 学籍番号4 名前 …
QRコードを用いた演習用紙の効率的な電子コンテンツ化
 期末試験と成績評価について  2012年度「企業論」 川端 望.
大規模コーパスに基づく同義語・多義語処理
自然言語処理2015 Natural Language Processing 2015
シミュレーション演習 G. 総合演習 (Mathematica演習) システム創成情報工学科
Webページタイプによるクラスタ リングを用いた検索支援システム
情報スキル入門 第11週 Excel-1.
自然言語処理2016 Natural Language Processing 2016
単語登録(1) ◎MS-IMEの「単語登録」に、単語、語句、記号など自分がよく使うものを登録しておくと、便利である。
mi-8. 自然言語処理 人工知能を演習で学ぶシリーズ(8)
一問一答式クイズAQuAsにおける学習支援の方法
第4回講座(2/21)のまとめ 2019/11/1.
Presentation transcript:

発表32 レポート評価支援について (剽窃部分と指導箇所の検出) NLP若手の会 第3回シンポジウム 発表32 レポート評価支援について (剽窃部分と指導箇所の検出) 2008/9/23 峯脇 さやか 弓削商船高等専門学校 情報工学科

研究の目的 大学生・高専生のレポートはコピペが多い 情報技術の発展 ネット上の記述をコピペすることに,意識が低い 学生への教育が不十分 ネット上には,多種多様な記述が存在 マウスを使うだけで,コピペ完了 ネット上の記述をコピペすることに,意識が低い 盗用(=犯罪)であることを知らない 著作権についてよく知らない 学生への教育が不十分 コピペさせない指導とは? “いたちごっこ”のような気も・・・ 安易にコピペすることにより,文を書く力が向上しない

研究の目的 教員にとって,レポートチェックはとても大変 レポート評価を支援するソフトがあると,とても便利 1つ1つ手作業でチェックする 時間も労力もかかる コピペレポートをチェックしてもむなしい レポート評価を支援するソフトがあると,とても便利

レポート評価支援 剽窃部分の検出 指導箇所の検出 どの部分がコピペか自動検出 類似度計算 Web検索 他者から/ネットから 類似度計算 Web検索 指導箇所の検出 模範解答を用いて,課題にあった回答かどうかチェック 文章校正 誤字脱字 表記ゆれ …など

本研究の立場 レポート = 自由記述文 教師のレポート評価を支援しようという立場 実験のレポート 授業での課題 e-Learningで使えれば,出題の幅が広がる 現在は,多肢選択式がほとんど 教師のレポート評価を支援しようという立場 全ての評価を自動で行うという立場ではない 評価は教師がすべきものであって,支援ソフトなどの使い方は,その教師次第

先行研究 「コピペ」を発見するソフト/杉光 内容の独自性を視覚化するレポート評価支援システム/川口,砂山[2007] ネット上に類似する文章があるか検索 2009年中に市販予定 内容の独自性を視覚化するレポート評価支援システム/川口,砂山[2007] オリジナリティで評価 ニューラルネットワークを用いた実習レポート評価支援システムの開発 /渡辺[2008] 1対比較法とTF・IDF法でコピーレポート判定 理解度チェック単語数で考察の評価

剽窃部分の検出 剽窃とは 剽窃部分 = コピペされた部分 他人の作品・学説などを自分のものとして発表すること(goo辞書より) いわゆる「パクリ」 引用との違い 引用は,自説を補強するためのもの 剽窃部分 = コピペされた部分

剽窃部分の検出 コピペの傾向 他学生からのコピペ ネットからのコピペ ある1学生から 複数の学生から良い所取り ある1つのサイトから 同級生 上級生(過去の合格レポート) 複数の学生から良い所取り ネットからのコピペ ある1つのサイトから 複数のサイトから

他学生からのコピペ検出 1文ごとに類似度を計算する 依存構造木を用いたテキスト間の類似度計算 共通の単語を持つときのみ計算 依存構造木 ノード:文節 リンク:係り受け関係 類似度 ≒ 共通部分木の数 正規化

他学生からのコピペ検出 類似度が大きいものの密度を調べる 似ている文が連続している場合 似ている文が分散している場合 レポートA 文1 文2 文3 文4 文5 ・・・ レポートB レポートBの文2~文5は レポートAの文1~文4を コピペした可能性が高い レポートC 文1 文2 文3 文4 文5 ・・・ レポートA 似ている文が分散している場合 コピペしたと判断するのは・・・?

ネットからのコピペの検出 Googleで文をレポート中の文を1文ずつ検索 検索キーを文字コードに変換&URL生成 Unicode(UTF-8) http://www.google.co.jp/search?hl=ja &q=%E5%AE%9A%E5%9E%8B%E5%8C%96 ... &lr=&aq=f&oq= 定 型 化 Unicode(UTF-8) 定:0xE5AE9A 型:0xE59E8B 化:0xE58C96

ネットからのコピペ検出 検索結果ページ(HTML)を取得 ソースを解析 emタグで囲まれている (文字を強調する)

指導箇所の検出 模範解答を用いて,課題にあった回答かどうかチェック 模範解答との文書間類似度を計算 模範解答とは ベクトル空間モデル 教師が作成したもの 過去の合格レポート

指導箇所の検出 文章校正 誤字脱字 表記ゆれ 文末表現 字数 ○:「~である」 ×:「~です」 (字数指定がある場合)クリアしているか? 少なすぎないか?(説明が不十分) 多すぎないか?(冗長)

まとめ レポート評価支援 剽窃部分の検出 指導箇所の検出 蔓延するコピペを少しでもなくす レポートチェックにかかる教師の手間を軽減 学生間のコピペは,テキスト間類似度を使用 ネットからのコピペは,Googleで検索&結果ページを解析 指導箇所の検出 模範解答との類似度を計算

学生への指導 コピペさせない教育をどのようにするか? 著作権についての教育 コピペが発覚したら減点する? “いたちごっこ”にならないようにするには? 著作権についての教育 著作物とは コピペ = 著作物の盗用(犯罪) 著作権法第32条に“引用”について記述 参考:『引用』と『盗用』の境界線 http://yaplog.jp/momo_shiro/archive/149