データ分析入門(7) 第7章 データの操作と比較 廣野元久.

Slides:



Advertisements
Similar presentations
生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
Advertisements

生体情報論演習 - 統計法の実践 第 1 回 京都大学 情報学研究科 杉山麿人.
情報基礎 A 第 4 週 データベースと表計算 情報基礎 A 第 4 週 データベースと表計算 1 徳山 豪 東北大学情報科学研究科 システム情報科学専攻 情報システム評価学分野.
1 データ分析入門( 8 ) 第 8 章 散布図と相関係数 廣野元久. 第 8 章 散布図と相関係数 廣野元久 &高橋行雄 2/28 本章の概要 2つの量的データのばらつき方を調べ, その関連 ( 相関関係 ) をグラフと数値で評価する 2変量間の相関関係には, 因果関係と擬似相関があるため, 関連を見誤らないように,
情報処理 第 13 回. 今日の内容 練習用ファイルのダウンロードデータの入力 – データベースに適したデータの入力方法 – ウィンドウ枠の固定 ( 見出し行の固定 ) データの並べ替え –1 つの列の値で並べ替え – 複数の列の値で並べ替え.
第5章 JMPのインストールと基本操作 廣野元久
SPSS操作入門 よい卒業研究をめざして 橋本明浩.
データ分析入門(12) 第12章 単回帰分析 廣野元久.
エクセル(1)の目次 起動法、ブック、シート、セル ブックの開き方 エクセル画面 マウスポインターの種類 シート数の調節 データの入力法
2017/3/2 情報処理 第8回.
発生生物学特論 PowerPoint の使い方
林俊克&廣野元久「多変量データの活用術」:海文堂
Microsoft PowerPoint98 Netscape Communicator 4.06[ja]
データ分析入門(11) 第11章 平均値の差の検定 廣野元久.
徳山豪 東北大学情報科学研究科 システム情報科学専攻 情報システム評価学分野
デスクトップを画像として保存する(1) ① デスクトップの画像をクリップボードへコピーする。
2017/3/7 情報処理 第8回.
ファイルやフォルダを検索する ①「スタート」→「検索」→「ファイルとフォルダ」とクリックする。
文字書式設定(1) 方法1: ①文字書式を設定したい文字列を選択する。 ②「書式」メニュー → 「フォント」とクリックする。
統計学 第3回 「データの尺度・データの図示」
第1回 担当: 西山 統計学.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
エクセル(2)の目次 セル範囲の指定方法 データの消去法 アクティブセルの移動 セル内容の複写と移動 セル幅の変更方法
データ分析入門(10) 第10章 クロス集計表と仮説検定 廣野元久.
流れ(3時間分) 1 ちらばりは必要か? 2 分散・標準偏差の意味 3 計算演習(例題と問題) 4 実験1(きれいな山型の性質を知ろう)
デスクトップを画像として保存する(1) ① デスクトップの画像をクリップボードへコピーする。
エクスプローラ ● エクスプローラ: ファイルやフォルダを階層構造で表示してあり、これらを操作するのに便利。
第3章 二つの変数の記述統計 二つの変数を対象として変数同士の関係を捉える 量的変数どうしの関係 質的変数どうしの関係.
臨床統計入門(3) 箕面市立病院小児科  山本威久 平成23年12月13日.
データ分析入門(13) 第13章 主成分分析 廣野元久.
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
情報処理 第13回.
1変量データの記述 経済データ解析 2006年度.
Webで恋愛の類型を測り集計しレポートにまとめる
データの分類 P.128 診断や治療を,長年の経験則に頼らず, 科学的根拠に裏付けされた事実に基づいて判断する。
この資料は、テキストをもとに、講義のために作成したものです.学習用に活用してください.
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
地理情報システム論演習 地理情報システム論演習
簡単PowerPoint (PowerPoint2007用)
情報処理1~第12回~ 野中良哲.
Microsoft PowerPoint Netscape Communicator
経営工学基礎演習a PowerPointの利用.
看護研究における 統計の活用法 Part 1 京都府立医科大学 浅野 弘明 2012年11月10日.
数理統計学 第4回 西山.
Rコマンダーで分割プロットANOVA 「理学療法」Vol28(8)のデータ
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
単語登録(1) ◎MS-IMEの「単語登録」に、単語、語句、記号など自分がよく使うものを登録しておくと、便利である。
中澤 港 統計学第4回 中澤 港
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
マイクロソフト Access での SQL 演習 第2回 集計,集約
analysis of survey data 堀 啓造
エクセル(2)の目次 セル範囲の指定方法 データの消去法 アクティブセルの移動 セル内容の複写と移動 セル幅の変更方法
ex-8. 平均と標準偏差 (Excel 実習シリーズ)
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
ファイルやフォルダを検索する ①「スタート」→「検索」とクリックする。 ②「表示項目」から適当なものを選択する。
都市・港湾経済学(総) 国民経済計算論(商)
表計算 Excel 演習 1.Excel を使ってみる.
統計処理1 平均・分散・標準偏差.
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
1変量データの記述 (度数分布表とヒストグラム)
情報コミュニケーション入門b 第9回 表計算ソフト入門(3)
情報処理 第13回.
数理統計学  第6回 西山.
ex-8. 平均と標準偏差 (Excel を演習で学ぶシリーズ)
図や表の作成 ここでの目標.
回帰分析入門 経済データ解析 2011年度.
エクスプローラ ● エクスプローラ: ファイルやフォルダを階層構造で表示してあり、これらを操作するのに便利。
単語登録(1) ◎MS-IMEの「単語登録」に、単語、語句、記号など自分がよく使うものを登録しておくと、便利である。
確率と統計 年1月7日(木) Version 3.
Presentation transcript:

データ分析入門(7) 第7章 データの操作と比較 廣野元久

本章の概要 データの変換 複数のグループの比較、名義尺度でグループ化 JMPによる四則演算の方法 JMPによる基準化の方法 量的データを比較する ヒストグラム、分散分析 質的データを比較する グラフによる比較  第7章 データの操作と比較 廣野元久 &高橋行雄

1.データ変換 2.データの標準化 1.1 データの基準化 例)従業員1人当りの利益 1.2 四則演算 例)3科目のテストの合計 1.データ変換    2.データの標準化 1.1 データの基準化  例)従業員1人当りの利益 1.2 四則演算      例)3科目のテストの合計 2.  データの標準化 魚はそのままでは食べない      刺身・焼く・煮る テストの点数               偏差値        元の変量    データ変換  新しい変量       データ変換にJMPの計算ウインドウを使う!! 第7章 データの操作と比較 廣野元久 &高橋行雄

1.1 データの基準化 Dasampleのフォルダを開く 県データ.jmpをロードする 変量:商店数でヒストグラムを描画する 1.1 データの基準化 Dasampleのフォルダを開く 県データ.jmpをロードする 変量:商店数でヒストグラムを描画する 人口の多い県では商店も多いから県の比較にならない 第7章 データの操作と比較 廣野元久 &高橋行雄

1.2 四則演算(1) 企業の経営度を調べるとき 県データ.jmpでも人口1000人あたりの商店数の計算をしてみよう 経常利益や設備投資,環境対策費など大規模な企業が多いのは自明 一人あたりの経常利益などで評価しないとミスリードする 県データ.jmpでも人口1000人あたりの商店数の計算をしてみよう 第7章 データの操作と比較 廣野元久 &高橋行雄

1.2 四則演算(2) 県データ.jmpのデータテーブルをアクティブにする 県データ2.jmpとして新規保存する 1.ダブル 3.変量名を クリック すると 列が 1つ増える 3.変量名を 千人当り 商店数 にする 2.プロパティの ウインドウを 表示させる 5.を押す 4.リストの計算式を選ぶ 第7章 データの操作と比較 廣野元久 &高橋行雄

1.2 四則演算(3) 4.÷ボタンをクリックして分数表示に 6.人口をクリック 2.商店数を クリック 3.□に商店数 が表示 5.分母の□をクリック 1.□をクリック 第7章 データの操作と比較 廣野元久 &高橋行雄

1.2 四則演算(4) 4.計算 終了 2.1000を入力 3.適用をクリック 1.×をクリック 5.OKをクリック 第7章 データの操作と比較 廣野元久 &高橋行雄

1.2 四則演算(5) 1000人当の 店舗数が多い 店舗数が少ない 高知,富山 神奈川,千葉,埼玉 第7章 データの操作と比較 第7章 データの操作と比較 廣野元久 &高橋行雄

2.データの標準化(1) 測定単位の異なるものを比較するには、標準化してから、ばらつき具合という土俵で比較する 偏差値:数学、英語の試験を受けた 数学:平均50点、標準偏差10点で60点だった。 英語:平均60点、標準偏差5点で63点だった。 どっちがよい結果か? 第4章の練習問題3(サッカーの順位予想) チームごとに,データから平均値を引くと違いが見える 標準偏差で割らない方が順位のばらつきが見える 第7章 データの操作と比較 廣野元久 &高橋行雄

2.データの標準化(2) 標準化の方法 データを平均0、標準偏差1に変換する 第7章 データの操作と比較 廣野元久 &高橋行雄

2.データの標準化(3) ビッグクラス.jmpをロードする 身長(インチ)と体重(ポンド)のヒストグラムを描画する 2.保存から  標準化を選び、  データテーブル  に保存する 1.赤い▼を クリックして メニューを 表示する 第7章 データの操作と比較 廣野元久 &高橋行雄

2.データの標準化(4) 平均0、標準偏差1 第7章 データの操作と比較 廣野元久 &高橋行雄

3.データのグループ間比較 名義尺度の変数で分類して,違いを比較する ビッグクラス.jmpで身長(インチ)の違いを調べる 年代による漫画の読書時間 性別による電話使用時間 ビッグクラス.jmpで身長(インチ)の違いを調べる 第7章 データの操作と比較 廣野元久 &高橋行雄

4.量的データのグループ別集計と比較 ビッグクラス.jmpをロードする 1.テーブルから 列の分割を 選択 2.ウインドウが される表示 第7章 データの操作と比較 廣野元久 &高橋行雄

4.1 グループ別集計 2.それ以外を追加tへ 1.性別をラベル列へ 3.列の分割を選択 4.集計データの テーブルが表示 4.1 グループ別集計 2.それ以外を追加tへ 1.性別をラベル列へ 3.列の分割を選択 4.集計データの テーブルが表示 第7章 データの操作と比較 廣野元久 &高橋行雄

4.2 グループ間の比較 男女別のヒストグラムを作る 目盛を合わせる 1in は2.54cm 男女では,約3inほどの差  By 変数を使えば簡単にできる 1in は2.54cm 男女では,約3inほどの差 女学生の方が中心付近 に集まっている 第7章 データの操作と比較 廣野元久 &高橋行雄

4.2 グループ間の比較 By変数を使い簡単に比較する方法 ・1変量の分布をクリックし ダイアログを表示する ・身長(インチ)をY,列に指定  ダイアログを表示する ・身長(インチ)をY,列に指定 ・性別をByに指定 ・OKをクリック 第7章 データの操作と比較 廣野元久 &高橋行雄

5 条件判断によるデータの分類 量的データを適当な区間で分類する 質的データの分類を変える 身長:高い,普通,低い 成績:良い,普通,悪い 身長(高いと普通) VS (低い) 地域(近畿,中国,四国) VS (関東,甲信越) 車の調査.jmpを使って,年齢層による車の嗜好の違いを比較する 列を一つ追加する 第7章 データの操作と比較 廣野元久 &高橋行雄

5 条件判断によるデータの分類(2) 1.計算式を選ぶ 2.をクリック 3.条件付きを選択 4.Ifをクリック 5.条件文が表示される 第7章 データの操作と比較 廣野元久 &高橋行雄

5 条件判断によるデータの分類(3) 4.値,変量,値を入力 5.入れ子構造:繰り返し 前スライド3~本スラ イド3 1.条件文が表示される 6.再び,値,変量,値 値 を入力 2.をクリック 3.の条件をクリック 第7章 データの操作と比較 廣野元久 &高橋行雄

5 条件判断によるデータの分類(4) 1.年齢グループ変量が作成された 第7章 データの操作と比較 廣野元久 &高橋行雄

6 質的グループのグループ別集計と比較 車の調査.jmpを使う 4.タイプをクリック 3.&5.グループ化をクリック 6.OKをクリック 6 質的グループのグループ別集計と比較 車の調査.jmpを使う 4.タイプをクリック 3.&5.グループ化をクリック 6.OKをクリック 1.テーブルから  要約を  クリック 2.年齢グループをクリック 第7章 データの操作と比較 廣野元久 &高橋行雄

6.1 グループ別集計 全体 新規テーブルの表示 (要約表) 年齢グループ で分類 1 2 3 タイプで分類 F S W F S W 6.1 グループ別集計 新規テーブルの表示 (要約表) 全体 年齢グループ で分類 1 2 3 タイプで分類 F S W F S W グループ化に登録する順番で 要約表の形が変わる F S W 第7章 データの操作と比較 廣野元久 &高橋行雄

6.2グループ別のグラフ作成(1) 2.グラフをクリックし,チャートをクリック 1.要約表を アクティブ にする 3.N を選択 4.統計量をクリックし, データをクリック 第7章 データの操作と比較 廣野元久 &高橋行雄

6.2グループ別のグラフ作成(2) 5.OKをクリック 1.年齢グループ をクリック 3.タイプを クリック 2.&4.X水準をクリック  をクリック 3.タイプを クリック 2.&4.X水準をクリック 第7章 データの操作と比較 廣野元久 &高橋行雄

6.2グループ別のグラフ作成(3) 1.棒グラフが描画される 3.円グラフが描画される 2.円をクリック 円の大きさは頻度による 第7章 データの操作と比較 廣野元久 &高橋行雄

課題(1) データ分析のホームページから衆議院選挙得票2000をダウンロードせよ. 変量の合計の得票数に着目して,150万票で都道府県を2分し,県分類という名前をつけなさい テーブルの要約を使い グループに県分類,統計量の合計を使い,自民党,民主党,共産党,合計を指定し,要約表を作成せよ 要約表で,自民党,民主党,共産党を合計で割り,得票率のデータにせよ 県分類を使い,自民党,民主党,共産党の得票率を棒グラフにせよ 第7章 データの操作と比較 廣野元久 &高橋行雄

課題(2) 要約表のデータを使い,棒グラフよりも もっと分かりやすいグラフを作成せよ. グラフ作成にあたりJMPを使わなくても良い 第7章 データの操作と比較 廣野元久 &高橋行雄