回 | 授業テーマ | 学習内容(アクティブラーニング・情報リテラシー教育・ICT活用を含む) | 教室外学習(予習・復習)の内容 | 教室外学習の時間(分) |
第1回 | データサイエンスとは何か | データサイエンスを取り巻く環境を理解する。データの4つの尺度(名義尺度・順序尺度・間隔尺度・比例尺度)とデータの種類(構造化データと非構造化データ)について学ぶ。 | データの4つの尺度について復習する。 | 復習:180分 |
第2回 | 1変数の要約 | データの中心傾向(平均値・中央値・最頻値)とデータの散らばり(分散・標準偏差)を学ぶ。Rを使用して統計量を算出できるようになる。 | データの中心傾向と散らばりについて復習する。ExcelとRの基礎的な関数を復習する。 | 復習:180分 |
第3回 | 1変数の可視化① | 質的変数の集計(単純集計・クロス集計)と量的変数の集計(度数分布表)を学ぶ。質的変数の可視化(棒グラフ・円グラフ)と量的変数の可視化(折れ線グラフ)について実践的に学ぶ。Rを使用して頻度の集計とグラフの作成をできるようになる。 | ExcelとRを使用して、データの集計と可視化ができるように復習する。 | 復習:180分 |
第4回 | 1変数の可視化② | 量的変数の可視化(ヒストグラム・箱ひげ図)と層別の処理を学ぶ。シンプソンのパラドックスについて理解する。Rを使用してヒストグラムと箱ひげ図を作成できるようになる。 | ExcelとRを使用してヒストグラムと箱ひげ図を作成できるように復習する。 | 復習:180分 |
第5回 | 2変数の要約と可視化 | 2変数の関係を表す統計量(共分散・相関係数)と散布図について学ぶ。また、その他の統計量(幾何平均・加重平均・調整平均・移動平均・順位相関係数)について理解する。Rを使用して相関係数の計算と散布図の作成をできるようになる。 | 相関係数について復習する。ExcelとRで散布図を作成できるように復習する。 | 復習:180分 |
第6回 | 標本抽出 | 母集団と標本について理解し、母集団の統計量(母平均・母分散)と標本の統計量(標本平均・不偏分散・標本の大きさ・標本数)について学ぶ。標本抽出の方法(有意選出・無作為抽出)についても学ぶ。Rを用いて標本抽出を実践する。 | 母集団の統計量と標本の統計量について復習する。 | 復習:180分 |
第7回 | 確率分布 | 確率変数、離散変数の確率分布(一様分布・二項分布)および連続変数の確率分布(正規分布・標準正規分布)を学ぶ。標本分布について理解する。Rを使用して二項分布と正規分布を作成できるようになる。 | 二項分布と正規分布について復習する。 | 復習:180分 |
第8回 | 推定① | 大数の法則と中心極限定理について理解する。点推定と区間推定を学ぶ。特に母分散が既知のときの母平均の区間推定について学び、Rを使用して実践できるようになる。 | 正規分布の性質と区間推定について復習する。 | 復習:180分 |
第9回 | 推定② | t分布を理解し、母分散が未知のときの母平均の区間推定について学ぶ。演習として、実際の考古学のデータを使用し、寺院の建立年代の推定を行う。 | t分布を仮定した区間推定について復習する。 | 復習:180分 |
第10回 | 検定① | 帰無仮説と対立仮説、有意水準、棄却域を理解し、1標本のt検定について学ぶ。Rを使用して、1標本のt検定を実践できるようになる。 | 1標本のt検定について復習する。 | 復習:180分 |
第11回 | 検定② | 対応のない2標本のt検定および対応のある2標本のt検定について学び、Rを使用して実践できるようになる。演習として、t検定を用いた夏目漱石の文体の変化についての分析を行う。 | 2標本のt検定について復習する。 | 復習:180分 |
第12回 | 検定③ | 独立性の検定(カイ二乗検定・フィッシャーの正確確率検定)について学び、Rを使用して実践できるようになる。 | 独立性の検定について復習する。 | 復習:180分 |
第13回 | 2変数の関連性 | カイ二乗値、クラメールの連関係数、ファイ係数について学ぶ。 | クロス集計表を用いた関連性の計算方法について復習する。 | 復習:180分 |
第14回 | 回帰分析 | 説明変数と目的変数について理解する。最小二乗法と決定係数について学び、Rを使用して回帰分析を実践できるようになる | 単回帰分析について復習する。 | 復習:180分 |