自作コーパスを利用した学生研究 ~応用言語学者の養成

Slides:



Advertisements
Similar presentations
英作文支援システムの 構築に関する研究 平成 15 年 11 月 18 日 ( 火 ) A1 グループ M2 永易 稔 中間発表.
Advertisements

コーパス言語学実践 2006 年度 2 学期 第 2 回. 2 本日の内容 前半の作業について – 語彙調査の演習 – 用語の説明 語彙,単位語,延べ語,異なり語,見出し 語 作成作業 その1 – データ収集開始.
研修のめあて 授業記録、授業評価等に役立てるためのICT活用について理解し、ディジタルカメラ又はビデオカメラのデータ整理の方法について研修します。 福岡県教育センター 教員のICT授業活用力向上研修システム.
インターネットの利用 教科書 P22~27,36~41 埼玉県立大宮武蔵野高等学校・情報科.
北海道大学理学部地球科学科地球物理学 惑星物理学研究室 B4 加藤 学
ブラウザの基本操作 前のページに戻る ブラウザの左上にある 「戻る」ボタンで、自分がたどってきた一つ前のページに戻ることができます。
第11章 プレゼンテーションの基本スキル 1 プレゼンテーションとは 2 プレゼンテーションの種類と特徴 3 プレゼンテーションツール
コーパス言語学実践 2006年度2学期 第10回.
Java I 第2回 (4/18)
第2章 ネットサービスとその仕組み(前編) [近代科学社刊]
小学校3年 指導資料例データ.
総合学科における全員履修科目としての「情報」の取り組み -教科情報必修化にさきがけて-
情報処理基礎 2006年 6月 1日.
ITの日本語教育への利用1 PART II 小澤伊久美
本日のゴール ①パワーポイントでサンプルのフラッシュ型教材(スライド3枚)を作成できる。 ②作成したデータを、デジカメに保存できる。
知識情報演習Ⅲ(後半第1回) 辻 慶太(水)
環境教育用E-Learningシステム の開発 平成19年度環境教育実践専修構想発表会 環境教育実践専修 鵜川研究室 彭艶萍
相互評価システムの開発と大学情報科目における利用 柴田好章(名古屋大学大学院) 小川亮(富山大学教育学部)
情報リテラシー(1) ガイダンス 情報リテラシ2003 野村松信・須藤秀紹.
5秒以上見続けたくなるYouTubeの動画広告に関する研究
オンライン英単語・リスニング 学習ソフト 佐々木研究室 N02k1114 北隅 麻実.
日本の高校における英語の授業は英語でがベストか?
クイズ 「インターネットを使う前に」 ネチケット(情報モラル)について学ぼう.
Webサイト運営 09fi118 橋倉伶奈 09fi131 本間昂 09fi137 三上早紀.
日本人の英語文章の中で「ENJOY」はどういうふうに使われているのか
経済データのダウンロードと グラフの作成 経済データ解析 2011年度.
インターネット大学へ向かって ムードルにいたるまでの道.
クラシック音楽普及プロジェクト KG:mao B3 wakutin.
最終課題 Webアプリケーション 〜ページのしおり機能〜
~私たちはことばを使って何をしているか~ 学びLIVE2006/6/18 東洋大学 三宅和子
EBSCOhost 詳細検索 チュートリアル support.ebsco.com.
発表者 2011/01/08 楽しい256バイトイントロの 世界 発表者 2011/01/08.
On Digital Tools for Language Documentation 言語記録保存のためのデジタルツールについて
中間発表 アリの王国更新 金華山の写真整理 柏崎 奈々 中間発表を始めます。
2011年6月24日(金) 於 名桜大学言語学習センター 国際学群 伊藤孝行
ケータイの使い道に関心を 子どもがケータイをどのように使っているかご存知ですか?
理論試験速報 理論問題部会長 鈴木 亨 先生 (筑波大学附属高等学校) にインタビュー.
C-2 導入プレゼン1 国際交流って何?.
練習問題アイテムバンクの開発研究 ~再生形式~
ICT活用指導力チェックシート(小学校版)
【プログラミング応用】 必修2単位 通年 30週 授業形態:演習.
自由席にしています。 資料のある席へお座りください.
チーム よせあつめ 検索エンジンについて.
インタネットマーケティング グーグルの戦略
ICTを活用した授業づくり ③プログラミング教育
経済データのダウンロードと グラフの作成 経済データ解析 2009年度.
環境リスクマネジメントに関する 検索システム
ネットショップデザイン入門Ⅰ・ⅡSEO 2013/12/18 Webデザイン入門 SEOの基本.
平成25年3月27日(水) 東京工科大学 コンピュータ蓑寝椅子学部 在学生ガイダンス
単語登録(1) ◎MS-IMEの「単語登録」に、単語、語句、記号など自分がよく使うものを登録しておくと、便利である。
1.Webサイトの情報を活用しよう プレゼンテーション資料
レビューとは (プロジェクト管理の観点から)
2003年度 図書館活用論 Ⅰ 第9講 検索エンジンの仕組みと活用 (明治大学図書館庶務課システム担当 中林)
日本の高校における英語の授業は 英語がベストか?
理論研究:言語文化研究 担当:細川英雄.
(C)Hiroshi Tanaka/Yoshihiro Sato
SPIRIT 外国にルーツを持つ子ども達への学習支援
Googleの マーケティング戦略 馬 橋琳.
コーパス コーパス(Corpus)はコンピュータの発達とともに、計算機可読なデータを容易に作成・収集することができるようになったことがその背景にある。現在ではコーパス言語学などの学問もある。
自然言語処理2015 Natural Language Processing 2015
情報技術演習Ⅰ 人文学研究のための情報技術入門 2017/04/13
英文法活用アクティビティ 英文法のポイントを理解させた後に、それを使った文例を暗唱し、実際に使ってみることで、そのルールを定着させ、スピーキングやライティングでも使えるようにする。 CAN-DO: 不定詞の副詞的用法を「〜するために」という意味で使い言いたいことを伝えることができる。
第10回 質問(3) メール講座 Next Stage:翻訳力アップ自己トレ(1)
第7回 Q&A メール講座 Next Stage:翻訳力アップ自己トレ(1)
自由席にしています。 資料のある席へお座りください.
図15-1 教師になる人が学ぶべき知識 子どもについての知識 教授方法についての知識 教材内容についての知識.
自然言語処理2016 Natural Language Processing 2016
単語登録(1) ◎MS-IMEの「単語登録」に、単語、語句、記号など自分がよく使うものを登録しておくと、便利である。
新潟国際情報大学 大学見学 担当:情報システム学科 小宮山智志 2006年10月20日
Elements of Style 第3回 2019年6月11日(火).
Presentation transcript:

自作コーパスを利用した学生研究 ~応用言語学者の養成 米岡ジュリ 熊本学園大学 熊本市大江2-5-1 096―364―5161(1311) FAX 096-372-0702 judy@kumagaku.ac.jp

教育改革の要求 主体的学習 総合的学習 課題探求能力

コーパス言語学とはなにか? コーパスをコンピュータソフトによってコンコーダンスやコロケーションを分析する応用言語学の分野 「ハンディフォン」って和製英語?「data」は単数なのか、複数なのか?日本人は、ハリウッド映画でどう見られているのか?こんな疑問をすべてコンピュータで解決できる便利な応用法は、コーパス言語学分析法である。  コーパス言語学は、大量の文章・口語言語データを、コンピュータソフトによって分析する応用言語学の分野である。従来の言語学と違って、ネーティブスピーカの「感覚」ではなく、実際のデータに基づく分析ができ、より正確な情報が得られる。そして、専門家でなくても、誰でも自分の外国語への疑問を解決できる便利なツールでもある。

ハッ? コーパス=大量の文章・口語言語データ コンコーダンス=単語や表現のリストto and fro

英語学習にどう使うのか? Armchair linguistics (肘掛け椅子言語学) ではなく、実際のデーターに基づいた言語分析 data driven learning(データに基づいた学習)

DDL(Tim Johns)の仕組み 学習者の疑問 コンコーダンスの作成 問題の解決  次に、コンコーダンスを分析することになる。このような研究は1985年よりTim Johns先生がData Driven Learning(DDL)と名づけている。例として、「data」が単数または複数で使われる、[like to ~~] と[like ~~ing]の語法や違い、persuadeとconvinceのような同意語のニュアンスの違いが、www. にあげられている。 問題の解決

代表的な市販コーパスやソフト Cobuildオンラインコーパス (2002年で4.5億ワード) Windows のCONCORDANCE  代表的な市販コーパスやソフト Cobuildオンラインコーパス (2002年で4.5億ワード) Windows のCONCORDANCE   コーパスも分析ツールも、市販のものはたくさんあるが、スキャナーやインターネット上の大量の資料を寄せ集めた自作コーパスと、MAC用のフリーソフトであるCONCやBBEDITの組み合わせで簡単な研究も十分にこなせられる。本発表では、学生が作った映画台本コーパス「movies」と日本の大学生の英語文章コーパス[complist]などを用いた研究の実例報告をする。 値段:BNC £500 per annum 11-50 machines (9万円ぐらい) Cobuild 500 for 12 months unlimited connection time

問題 1.予算の仕組みやタイミング (年間契約ものの窓口) 2.ニーズに合わないかもしれない

自作コーパスとフリーソフト COMPLIST 1649通、 126718ワード MOVIESCRIPTS 300件、600万ワード (学生のMLへの投稿メール) 1649通、 126718ワード MOVIESCRIPTS 300件、600万ワード MacのCONCとBBEDIT  「movies」とは、http://www.script-o-rama.com/のような映画台本がたくさん収録されているサイトより学生がダウンロードしてコンパイルしたコーパスである。映画の数は300近くにも上って、語数は約600万語である。また、索引を利用して目標別にいくつかの映画も選択できる。一方、[complist]は一年間に渡って、大学3年生がメーリングリストに投稿したものをファイルにまとめた日本の大学生の英語文章コーパスである。このようなファイルは原則としてスペルチェックがかかっているが、文法チェックまではできていない。学生や先生の名前などの固有名詞を除いたが、後は学生自身の英語文書の大量なデータ(1649通、126718ワード)となる。  このようなコーパスではいったい何ができるのか?まず、CONCというMAC用なフリーソフトにかけて、各単語がABC順に並べ変われるコンコーダンスというファイルが作成される。それぞれの単語の使われた回数、場所と実例がずらーと出てくる。また、BBEDITを用いて、特定の単語を複数のファイルで検索し、それぞれの前後をあわせた別ファイルを作ってくれる機能がある。

学生研究の研究の実例 Complistコーパスにて Aの使い方について 映画コーパスにて Japanの使用について Scottish Englishについて 比較研究 Which の口語と文語的頻度 このようなプロの研究は、一般学生にもできる。いくつかの実例を見てみよう。まず、日本人の典型的な英語の使い方を探る「」という学生発表では、同大学生の英作文が収録されている「COMPLIST」というコーパスを利用して、冠詞のAの使い方を詳しく分析した。Aの使い過ぎが学生のミスの6割も占めているという、ちょっと驚く結果が得られた。   映画コーパスを使って、特集の言語の使い方は研究できる。Scottish Englishについて また、社会・文化の研究も可能となる。、JapanまたはJapaneseの出る回数と場面を徹底的に調べた。そこで、映画を通して日本や日本人のイメージを捉えることができた。 辞書に載らないような、実態データが得られる。「What’s up?」の学生研究で、映画 コーパスを利用して、その出る場面と使い方を調べた。同時に、what’s new? What’s cooking? What’s going on? などの、ほとんど辞書に載らない英語表現を探し出すことができた。

アメリカ英語、イギリス英語、オーストラリア英語新聞用語の比較 もうひとつの発展: 学生自作コーパスへ 特徴を探る 星 真一の作品の用語 英語を比較する アメリカ英語、イギリス英語、オーストラリア英語新聞用語の比較 同様、自分で特集コーパスを作って例えば、ある作家か音楽の作詞の「お気に入り」表現を、前は読みながら「Shinichi Hoshi」の学生研究はこの例の一つである。 ジャンル別にも比較研究もできる。現在、イギリス英語とアメリカ英語だけではなく、複数の英語が認めてきつつある。そこで、それぞれの英語の特徴を探る研究の一例として、「A comparative study of American, British and Australian newspapers」がある。口語と文語の違いも、which の研究のような研究実例もある。

ネット自体がコーパス handiphone “cunning Japanese” 和製英語 or 新外出語 固定観念の実感 極端に言えば、ネット自体もコーパスだ。例えば、「ハンディフォン」が和製英語かどうかという問いに対して、handiphoneをヤフーの検索エンジンにいれてみると、.jpのページのみがズラーと出てくる。そこで、学生の質問に無理をして答えるよりも、パソコンにちょっと手を出せば実用に基づいた信頼のできる答えがすぐ得られる。しかも、先生だけではなく、学生もコーパスの原理と概念を正しく理解するようになれば、自分でも簡単に答えを出せる。文部科学省の新教育改革で求める、学生の実習性や問題解決力にも役立つツールとなる。

同意語の使い分け “big, great, huge” 表現の例文:応用問題 “so---that” 教材作成 同意語の使い分け “big, great, huge” 表現の例文:応用問題 “so---that” 微妙なニュアンスの違い “take (on)”  こんな研究をさらに応用して、教材作成にも応用できる。ある文法のポイントを教えるために、先生がコーパス研究法を応用すれば、英語教育に欠かせない実例が簡単にあっという間にたくさん収集できる。また、適当に単語を抜けたり空所をつけたり、または言葉の順序を変えたりすれば応用問題も簡単に作れる。

結論 Armchair linguisticsではなく、実践的なデータに基づく結論 Student empowerment: 学生が自分の質問にたいして自信をもって答えられる English as an International Language: 世界語としての英語やその中の日本英語の位置付けが見えてくる   コーパスのテクニックを応用して、興味を持っている分野(音楽、映画、文学など)を自分流に分析できる。将来の外国語(または母国語)の先生を始め、これからの国際人には欠かせない技術ツールと言っても過言ではない。

参考リンク DDLhttp://sun7.bham.ac.uk/johnstf/timconc.htm COBUILDhttp://titania.cobuild.collins.co.uk/ CONChttp://www.sil.org/computing/conc/conc.html BBEDIThttp://www.barebones.com/