R Basics 2013/12/09 Yamada. 今日の方針 Today’s plan テキスト・文字列を扱うにあたっての用 語の理解をすることの方が、 R での操作を 見るより有意義と思われるので、そちら を優先 Learning terms on text/strings is more.

Slides:



Advertisements
Similar presentations
統計学入門2 - 後期 第 1 回 - 1 統計学入門2 講義内容の紹介 推測統計とは. 統計学入門2 - 後期 第 1 回 - 2 教科書 & 参考書 教科書 特に使用しない 参考書 「統計解析の基本と仕組み」 ( 秀和システム ) 「データ分析のための統計入門」(共立出版)
Advertisements

だい六か – クリスマスとお正月 ぶんぽう. て form review ► Group 1 Verbs ► Have two or more ひらがな in the verb stem AND ► The final sound of the verb stem is from the い row.
て -form - Making て -form from ます -form -. With て -form, You can say... ~てもいいですか? (= May I do…) ~てください。 (= Please do…) ~ています。 (= am/is/are doing…) Connecting.
Essay writing rules for Japanese!!. * First ・ There are two directions you can write. ・よこがき / 横書き (same as we write English) ・たてがき / 縦書き (from right to.
VE 01 え form What is え form? え? You can do that many things with え form?
“Business English Pro” Why is it necessary to learn this course?
Regex takatosi.
All Rights Reserved, Copyright (C) Donovan School of English
The Bar バー.
Japanese Class for Advanced Lesson 6
第1回レポートの課題 6月15日出題 今回の課題は1問のみ 第2回レポートと併せて本科目の単位を認定 第2回は7月に出題予定
 辞書系(じしょけい).
Chapter 11 Queues 行列.
Location nouns.
What did you do, mate? Plain-Past
How to Become a Supply Chain Analyst with Free
Verb Plain Negativeform
AP 私の食生活 Write a paragraph summarizing the data you collected. Include some conclusions. Present to your partner. Up to 90 sec.
Object Group ANalizer Graduate School of Information Science and Technology, Osaka University OGAN visualizes representative interactions between a pair.
String - 文字列 2009年10月9日 7ADD2116 佐藤洋輔.
日本人の英語文章の中で「ENJOY」はどういうふうに使われているのか
Noun の 間(に) + Adjective Verb てform + いる間(に) during/while.
Ch13-1 TB250 てフォーム.
Japanese verbs informal forms
There are 5 wearing verbs in Japanese depending on the part of body or the item being worn.
東京工科大学 コンピュータサイエンス学部 亀田弘之
Agent&Society.
日本語3 4月26日 漢字ゲス 出会い How do people meet? お見合いは何ですか?
にほんご JPN101 Sep. 23, 2009 (Wednesday).
にほんご JPN101 Sep. 17, 2009 (Thursday).
十年生の 日本語 Year 10 Writing Portfolio
Reasonので + Consequence clause
Unit Book 10_课件_U1_Reading2-8 4 Word power university 1.
Chapter 4 Quiz #2 Verbs Particles を、に、で
定期考査2 英語.
The Sacred Deer of 奈良(なら)
CRLA Project Assisting the Project of
日本語解析済みコーパス管理ツール 「茶器」
Topics on Japan これらは、過去のインターンが作成したパワポの写真です。毎回、同じような題材が多いため、皆さんの出身地等、ここにない題材も取り上げるようにしてください。
Session 8: How can you present your research?
芝野耕司 ISO/IEC JTC1/SC2 (Coded Character Sets)委員長 東京外国語大学
Input slides 1 – 11 – teacher says word - pupils repeat – word appears on click Ohayoo. おはよう。
Causative Verbs Extensively borrowed from Rubin, J “Gone Fishin’”, Power Japanese (1992: Kodansha:Tokyo) Created by K McMahon.
Term paper, Report (1st, first)
Volleyball club ZAURUS
Where is Wumpus Propositional logic (cont…) Reasoning where is wumpus
豊田正史(Masashi Toyoda) 福地健太郎(Kentarou Fukuchi)
Question Words….
半構造化テキストに対する 文字列照合アルゴリズム
名古屋大学大学院国際原語文化研究科 第46回日本語教育学講座講演会
データ圧縮技術による文字列照合処理の高速化に関する研究
2019/4/22 Warm-up ※Warm-up 1~3には、小学校外国語活動「アルファベットを探そう」(H26年度、神埼小学校におけるSTの授業実践)で、5年生が撮影した写真を使用しています(授業者より使用許諾済)。
Term paper, report (2nd, final)
統計ソフトウエアRの基礎.
第6回レポート解説 条件1 条件2 条件3 月の入力 月、日、曜日の表示 日の入力 曜日の入力
ー生命倫理の授業を通して生徒の意識に何が生じたかー
Conflict of Interest disclosure slide A potential conflict of interest exists when there is involvement between the speaker/presenter with any for-profit.
Created by L. Whittingham
The Facilitative Cues in Learning Complex Recursive Structures
Visualizing Japanese Grammar Appendix
Cluster EG Face To Face meeting
We learned what Chris Moon did to make people realize
せつぞくし 接続詞 Conjunctions.
Grammar Point 2: Describing the locations of objects
Term paper, report (2nd, final)
NDL Search Screen Okuinshi/Sakai 09/15/04.
~国際比較にみる達成目標と評価のガイドライン~
識別子の読解を目的とした名詞辞書の作成方法の一試案
アノテーションガイドラインの管理を行う アノテーションシステムの提案
Improving Strategic Play in Shogi by Using Move Sequence Trees
Presentation transcript:

R Basics 2013/12/09 Yamada

今日の方針 Today’s plan テキスト・文字列を扱うにあたっての用 語の理解をすることの方が、 R での操作を 見るより有意義と思われるので、そちら を優先 Learning terms on text/strings is more useful than checking commands/functions/packages for string operations, I believe.

String 文字列 文字列(もじれつ)は、単語や文章のよ うな、文字の連なったもの。ストリン グ (string) 、テキスト (text) という場合も ある。コンピュータ、特にプログラミン グの分野で用いることが多い。文字テキストコンピュータプログラミン グ In computer programming, a string is traditionally a sequence of characters, either as a literal constant or as some kind of variable. computer programmingsequencecharactersliteral constant (computer_science) AD%97%E5%88%97 “ “ 文字列 ”

正規表現 Regular expression 正規表現(せいきひょうげん、 regular expression )とは、文字列の集合を一つの文 字列文字列 In computing, a regular expression (abbreviated regex or regexp) is a sequence of characters that forms a search pattern, mainly for use in pattern matching with strings, or string matching, i.e. "find and replace"-like operations. で表現する方 法の一つである。computingcharacterspattern matchingstringsstring matching on “ “ 正規表現 ”

テキストマイニング (Statistical) Text Analysis テキストマイニング( text mining )は、文字列を 対象としたデータマイニングのことである。通常 の文章からなるデータを単語や文節で区切り、そ れらの出現の頻度や共出現の相関、出現傾向、時 系列などを解析することで有用な情報を取り出す、 テキストデータの分析方法である。文字列データマイニング単語文節 Text mining, also referred to as text data mining, roughly equivalent to text analytics, refers to the process of deriving high-quality information from text. High-quality information is typically derived through the devising of patterns and trends through means such as statistical pattern learning.data miningtext analyticsinformationtextstatistical pattern learning “ “ テキストマイニング ”

ファイルフォーマット File format 区切り、改行、制御文字 Delimiters, New line, Control characters

エンコーディング 文字化け Mojibake Encoding 文字化け(もじばけ)とは、コンピュータで 文字を表示する際に、正しく表示されない現 象のこと。コンピュータ Mojibake ( 文字化け ? ) (IPA: [mod͡ʑibake]; lit. "character transformation"), from the Japanese 文字 (moji) "character" + 化け (bake) "transform", is the presentation of incorrect, unreadable characters when software fails to render text correctly according to its associated character encoding. ?[mod͡ʑibake]Japanesesoftwarecharacter encoding “ “ 文字化け ”

1 Reading and writing text files 2 Character encoding 3 Regular Expressions 4 Handlings of strings Table of contents

さて、 R のページをささっと眺 めよう Scan the R page based on the knowledge we’ve learned

Handlings of String Concatenating Splitting a string Counting the number of characters Detecting the presence of a substring Extracting the position of a substring or a pattern in a string Extracting a substring from a string Making some substitution inside a string Converting letters to lower or upper-case Filling a string with some character Removing leading and trailing spaces Comparing two strings

さて、 R のページをささっと眺めよ う Scan the R page based on the knowledge we’ve learned 時間があれば If we have time…