Download presentation
Presentation is loading. Please wait.
Published byのぶみつ ふじつぐ Modified 約 8 年前
1
メンタルレキシコン4: ことばの意味を言語データから 探る
2
コーパス言語学とは? コーパス言語学とは、コーパス ( テキスト の総体 ) をつかった、言語の科学的研究の ことです。
3
コーパスとは何か ? コーパス( corpus, pl. corpora; 「身体」 を意味するラテン語に由来)とは 、ある 言語研究の目的のために大量に収集され たテキストの総体です。 近年ではコーパスは大抵コンピュータに よって収集、処理、アクセスされます。
4
コンピュータ登場以前のコーパ ス シェイクスピアの著作 聖書やそれに関したテキスト オックスフォード辞典を作成するための 参考資料集め。
5
コンピュータによる大規模化 初期のコーパスは必然的に量に限界があ りました。しかし、コンピュータの発達 により、言語学者や他の研究者はより大 きなコーパスを作り始めました。
6
The Brown Corpus 最初のコンピュータをつかったコーパス。 1961 年に Brown University で作成された。 新聞記事、教会の説教、小説など、幅広 いジャンルのアメリカ英語から 100 万語を 収集した。
7
ブラウン・コーパスで扱われるテキスト は、慎重に抽出され、広範囲にわたるた め信頼性が比較的高い。 さらに、無償で提供されているため、現 在でも多くの研究者が利用してる。
8
なぜコーパスをつくるのか ? ブラウン・コーパスや他のコーパスの目 標: – 英語の多様性を捉えること – そして、それを言語学的に説明すること
9
1960s のノーム・チョムスキーから始まり、 1980s ごろまで、多くの言語学者は「ネイ ティブの直感」に頼った方法で言語を研 究していました。
10
たとえば、言語学者は次のような形でネ イティブに質問していました。 –“How do you say X in your native language?” –“Is this sentence grammatical in your language?”
11
話者は創造的で、新しい文章をどんどん 作ることができるのだから、なにが言語 にとって可能であるかは、ただ発せられ た文を見るだけでは分からない、と主張 されてきました。
12
しかし、コンピュータ化した大規模な コーパスにより、すべての可能な文を収 集することは不可能だが、一人の人間が 一生のうちに発する文よりもっと沢山の 文を集めることができるようになりまし た。
13
さらに、大規模なコーパスの中には、 ネイティブが「非文法的」と見なすよ うな文も、ある特定のコンテキスト(文 脈)に置かれると「自然」と感じられる といった文があることが分かってきま した。
14
例) the verb bark “The dog barked loudly” おそらく、 bark は上の例のように、自動 詞としてしか使わない、とネイティブは 考えるでしょう。
15
“The dog barked” “The dog barked at me” は自然で文法的ですが、 “The dog barked me awake” は不自然に聞こえます。 従来のようにネイティブの直感に頼って きた言語学者は、これを非文法的とみな すでしょう。
16
しかし、コーパスの中を探してみると、 次のような例を見つけることができま す:
17
She'd been alerted by our dog Brian who had barked her awake under the firm impression that his master was having a nervous breakdown.
18
コーパスのデータが示す、「典型的」ま たは一般的なことばの使用方法は、ネイ ティブが想定するものとは違うことがあ ります。
19
動詞の run を例に考えてみます。 もし run の意味を定義し、それをつかった 文をつくるとすると、どうしますか?
20
おそらく、最初に思い浮かぶ定義は次の ようなものではないでしょうか。 run: to move very quickly, by moving your legs more quickly than when you walk ( Longman Dictionary )
21
このような run の意味を用いた文は次のよ うなものがあります: “The girl ran all the way to school.”
22
おそらく、このような文が「基本的」も しくは「典型的」な run の使い方だと感じ るでしょう。 しかし、それは必ずしも実際に一番よく 使われる「一般的」な用法ではありませ ん。
23
試しに、 run を British National Corpus (BNC) のオンライン版(フリー)を使っ て、表示される 50 の例文を見てみましょ う。
24
What runs? people and animals BUT ALSO, computers, machines trains, buses, roads, streets businesses, organizations
25
これを聞くと、ネイティブは当たり前の ことだと思うかもしれませんが、しかし、 このことなかなか気がつきません。
26
これが、辞書を作成する出版社などが大 規模なコーパスを作り始めた理由のひと つ。 辞書を作成するには、言語使用の説明は できるだけ完全で正確であることが必要。
Similar presentations
© 2024 slidesplayer.net Inc.
All rights reserved.