メンタルレキシコン4: ことばの意味を言語データから 探る. コーパス言語学とは? コーパス言語学とは、コーパス ( テキスト の総体 ) をつかった、言語の科学的研究の ことです。

Slides:



Advertisements
Similar presentations
平成 22 年度 言語情報学演習 コーパス言語学入門 第 1 回.  授業名:情報システムコース実験演習 後期 火 曜第 2 フレーム  担当部分:言語情報学演習(コーパス言語学入 門)  担当教員:藤 正明  日時: 10 月 5 日・ 10 月 26 日・ 11 月 2 日の 3 時 30.
Advertisements

Humble and Honorific Language By: Word-Master Leo, Mixer of Ill Beats.
Note for How to Write an English Paper (2014 Second Semester)
英語特別講座 疑問文 #1    英語特別講座 2011 疑問文.
All Rights Reserved, Copyright (C) Donovan School of English
Today’s Goal: Use irregular verb
英語勉強会.
間接疑問文 I know him. I know (that) he is a doctor. ↓ why he is a doctor.
 辞書系(じしょけい).
Chapter 11 Queues 行列.
Recognise, ask about and talk about purpose
Verb plain form + ことができます Abilities.
コーパス言語学 第1回.
All Rights Reserved, Copyright (C) Donovan School of English
メンタルレキシコン: ことばの意味を言語データから探る
絶対だよ! 助動詞 must「~しなければならない」.
言語体系とコンピュータ 第6回.
授与動詞(あげる).
じょし Particles.
疑問詞+ to 動詞の原形.
~知ってる? 間接疑問文.
G: Objectives Can I read all the hiragana? Can I understand Japanese in a movie? Agenda A: Renshu N: らりるれろ、わをん A: Flashcards, えいが G: Can I test.
英語特別講座 代名詞・前置詞・形容詞・助動詞 #1   
日本人の英語文章の中で「ENJOY」はどういうふうに使われているのか
第四課の単語と文法 Chpt 4 Vocab Grammar.
How do you talk about Positions/ Locations?
形態素解析および係り受け解析・主語を判別
~私たちはことばを使って何をしているか~ 学びLIVE2006/6/18 東洋大学 三宅和子
On Digital Tools for Language Documentation 言語記録保存のためのデジタルツールについて
Nagoya University Global 30 program
V 03 I do NOT eat sushi. I do NOT do sumo.
by Phil Sonn and John Kim
Reasonので + Consequence clause
定期考査2 英語.
Presentation by Hiroshi Kaga
Handy Verbs Future Tense
The Sacred Deer of 奈良(なら)
Who Is Ready to Survive the Next Big Earthquake?
Did he/she just say that? Get your head out of the gutter! Oh wait….
動詞の共起パターンを用いた 動作性名詞の述語項構造解析
ストップウォッチの カード ストップウォッチの カード
Causative Verbs Extensively borrowed from Rubin, J “Gone Fishin’”, Power Japanese (1992: Kodansha:Tokyo) Created by K McMahon.
English class Management
関係代名詞(接触節) 目的格の関係代名詞の省略.
完了を表す現在完了形 ~してしまった.
疑問詞 1年生で学習した疑問詞.
いきます・きます・かえります.
受け身の疑問文 Practice ~ed・・・?.
Today’s Goal: Ask whether your friend did yesterday or not
Smiley.
Lesson 1 第一課   これ は 本 です。.
分詞 participle 文章の中で使ってみよう.
2019/4/22 Warm-up ※Warm-up 1~3には、小学校外国語活動「アルファベットを探そう」(H26年度、神埼小学校におけるSTの授業実践)で、5年生が撮影した写真を使用しています(授業者より使用許諾済)。
ロールプレイアクティビティ ある状況設定の中で、登場人物になりきり会話をします。 CAN-DO: 状況に応じた適切な質問をすることができる。
3人称単数現在形 疑問詞を使った疑問文.
Because & when 接続詞の用法.
Tag question Aoyama Shogo.
The difference between adjectives and adverbs
Created by L. Whittingham
英語音声学(7) 音連結.
英語音声学(6) イントネーション.
Indirect speech Toshiyuki Naka.
コーパス コーパス(Corpus)はコンピュータの発達とともに、計算機可読なデータを容易に作成・収集することができるようになったことがその背景にある。現在ではコーパス言語学などの学問もある。
自然言語処理2015 Natural Language Processing 2015
We learned what Chris Moon did to make people realize
第7回 Q&A メール講座 Next Stage:翻訳力アップ自己トレ(1)
Elements of Style Rule 7-11 (P7-14)
自然言語処理2016 Natural Language Processing 2016
Indirect Speech 間接話法 Kaho.I.
Elements of Style 第3回 2019年6月11日(火).
Presentation transcript:

メンタルレキシコン4: ことばの意味を言語データから 探る

コーパス言語学とは? コーパス言語学とは、コーパス ( テキスト の総体 ) をつかった、言語の科学的研究の ことです。

コーパスとは何か ? コーパス( corpus, pl. corpora; 「身体」 を意味するラテン語に由来)とは 、ある 言語研究の目的のために大量に収集され たテキストの総体です。 近年ではコーパスは大抵コンピュータに よって収集、処理、アクセスされます。

コンピュータ登場以前のコーパ ス シェイクスピアの著作 聖書やそれに関したテキスト オックスフォード辞典を作成するための 参考資料集め。

コンピュータによる大規模化 初期のコーパスは必然的に量に限界があ りました。しかし、コンピュータの発達 により、言語学者や他の研究者はより大 きなコーパスを作り始めました。

The Brown Corpus 最初のコンピュータをつかったコーパス。 1961 年に Brown University で作成された。 新聞記事、教会の説教、小説など、幅広 いジャンルのアメリカ英語から 100 万語を 収集した。

ブラウン・コーパスで扱われるテキスト は、慎重に抽出され、広範囲にわたるた め信頼性が比較的高い。 さらに、無償で提供されているため、現 在でも多くの研究者が利用してる。

なぜコーパスをつくるのか ? ブラウン・コーパスや他のコーパスの目 標: – 英語の多様性を捉えること – そして、それを言語学的に説明すること

1960s のノーム・チョムスキーから始まり、 1980s ごろまで、多くの言語学者は「ネイ ティブの直感」に頼った方法で言語を研 究していました。

たとえば、言語学者は次のような形でネ イティブに質問していました。 –“How do you say X in your native language?” –“Is this sentence grammatical in your language?”

話者は創造的で、新しい文章をどんどん 作ることができるのだから、なにが言語 にとって可能であるかは、ただ発せられ た文を見るだけでは分からない、と主張 されてきました。

しかし、コンピュータ化した大規模な コーパスにより、すべての可能な文を収 集することは不可能だが、一人の人間が 一生のうちに発する文よりもっと沢山の 文を集めることができるようになりまし た。

さらに、大規模なコーパスの中には、 ネイティブが「非文法的」と見なすよ うな文も、ある特定のコンテキスト(文 脈)に置かれると「自然」と感じられる といった文があることが分かってきま した。

例) the verb bark “The dog barked loudly” おそらく、 bark は上の例のように、自動 詞としてしか使わない、とネイティブは 考えるでしょう。

“The dog barked” “The dog barked at me” は自然で文法的ですが、 “The dog barked me awake” は不自然に聞こえます。 従来のようにネイティブの直感に頼って きた言語学者は、これを非文法的とみな すでしょう。

しかし、コーパスの中を探してみると、 次のような例を見つけることができま す:

She'd been alerted by our dog Brian who had barked her awake under the firm impression that his master was having a nervous breakdown.

コーパスのデータが示す、「典型的」ま たは一般的なことばの使用方法は、ネイ ティブが想定するものとは違うことがあ ります。

動詞の run を例に考えてみます。 もし run の意味を定義し、それをつかった 文をつくるとすると、どうしますか?

おそらく、最初に思い浮かぶ定義は次の ようなものではないでしょうか。 run: to move very quickly, by moving your legs more quickly than when you walk ( Longman Dictionary )

このような run の意味を用いた文は次のよ うなものがあります: “The girl ran all the way to school.”

おそらく、このような文が「基本的」も しくは「典型的」な run の使い方だと感じ るでしょう。 しかし、それは必ずしも実際に一番よく 使われる「一般的」な用法ではありませ ん。

試しに、 run を British National Corpus (BNC) のオンライン版(フリー)を使っ て、表示される 50 の例文を見てみましょ う。

What runs? people and animals BUT ALSO, computers, machines trains, buses, roads, streets businesses, organizations

これを聞くと、ネイティブは当たり前の ことだと思うかもしれませんが、しかし、 このことなかなか気がつきません。

これが、辞書を作成する出版社などが大 規模なコーパスを作り始めた理由のひと つ。 辞書を作成するには、言語使用の説明は できるだけ完全で正確であることが必要。