シラバス参照

印刷
講義名 データサイエンス入門
代表ナンバリングコード
講義開講時期 前期 講義区分 講義
基準単位数 2
代表曜日 代表時限
校地 千代田三番町キャンパス
授業科目の区分 共通教育
実務経験の有無
開設学科・年次 全学科・1年次
必修・選択の別 選択

所属名称ナンバリングコード

担当教員
職種氏名所属
非常勤講師◎ 土山 玄指定なし

授業概要(教育目的) 本授業の主題はデータサイエンスの手法を学ぶことに加え、データ分析の有効性と重要性を学ぶことです。それゆえ、データサイエンスの手法を理解するだけではなく、多種多様なデータに対してデータサイエンスの分析手法をどのように応用するのか実践的に理解することが重要になります。また、本授業では生活に必要なデータサイエンスの基礎を、直感的に理解できる内容をめざしながら、卒業研究の際に必要になりえるデータ分析の基礎も演習を通じて身につけてもらうことを目標とします。演習ではExcelとプログラミング言語であるRを使用します。
学習計画
授業テーマ学習内容(アクティブラーニング・情報リテラシー教育・ICT活用を含む)教室外学習(予習・復習)の内容教室外学習の時間(分)
第1回データサイエンスとは何かデータサイエンスを取り巻く環境を理解する。データの4つの尺度(名義尺度・順序尺度・間隔尺度・比例尺度)とデータの種類(構造化データと非構造化データ)について学ぶ。データの4つの尺度について復習する。復習:180分
第2回1変数の要約データの中心傾向(平均値・中央値・最頻値)とデータの散らばり(分散・標準偏差)を学ぶ。Rを使用して統計量を算出できるようになる。データの中心傾向と散らばりについて復習する。ExcelとRの基礎的な関数を復習する。復習:180分
第3回1変数の可視化①質的変数の集計(単純集計・クロス集計)と量的変数の集計(度数分布表)を学ぶ。質的変数の可視化(棒グラフ・円グラフ)と量的変数の可視化(折れ線グラフ)について実践的に学ぶ。Rを使用して頻度の集計とグラフの作成をできるようになる。ExcelとRを使用して、データの集計と可視化ができるように復習する。復習:180分
第4回1変数の可視化②量的変数の可視化(ヒストグラム・箱ひげ図)と層別の処理を学ぶ。シンプソンのパラドックスについて理解する。Rを使用してヒストグラムと箱ひげ図を作成できるようになる。ExcelとRを使用してヒストグラムと箱ひげ図を作成できるように復習する。復習:180分
第5回2変数の要約と可視化2変数の関係を表す統計量(共分散・相関係数)と散布図について学ぶ。また、その他の統計量(幾何平均・加重平均・調整平均・移動平均・順位相関係数)について理解する。Rを使用して相関係数の計算と散布図の作成をできるようになる。相関係数について復習する。ExcelとRで散布図を作成できるように復習する。復習:180分
第6回標本抽出母集団と標本について理解し、母集団の統計量(母平均・母分散)と標本の統計量(標本平均・不偏分散・標本の大きさ・標本数)について学ぶ。標本抽出の方法(有意選出・無作為抽出)についても学ぶ。Rを用いて標本抽出を実践する。母集団の統計量と標本の統計量について復習する。復習:180分
第7回確率分布確率変数、離散変数の確率分布(一様分布・二項分布)および連続変数の確率分布(正規分布・標準正規分布)を学ぶ。標本分布について理解する。Rを使用して二項分布と正規分布を作成できるようになる。二項分布と正規分布について復習する。復習:180分
第8回推定①大数の法則と中心極限定理について理解する。点推定と区間推定を学ぶ。特に母分散が既知のときの母平均の区間推定について学び、Rを使用して実践できるようになる。正規分布の性質と区間推定について復習する。復習:180分
第9回推定②t分布を理解し、母分散が未知のときの母平均の区間推定について学ぶ。演習として、実際の考古学のデータを使用し、寺院の建立年代の推定を行う。t分布を仮定した区間推定について復習する。復習:180分
第10回検定①帰無仮説と対立仮説、有意水準、棄却域を理解し、1標本のt検定について学ぶ。Rを使用して、1標本のt検定を実践できるようになる。1標本のt検定について復習する。復習:180分
第11回検定②対応のない2標本のt検定および対応のある2標本のt検定について学び、Rを使用して実践できるようになる。演習として、t検定を用いた夏目漱石の文体の変化についての分析を行う。2標本のt検定について復習する。復習:180分
第12回検定③独立性の検定(カイ二乗検定・フィッシャーの正確確率検定)について学び、Rを使用して実践できるようになる。独立性の検定について復習する。復習:180分
第13回2変数の関連性カイ二乗値、クラメールの連関係数、ファイ係数について学ぶ。クロス集計表を用いた関連性の計算方法について復習する。復習:180分
第14回回帰分析説明変数と目的変数について理解する。最小二乗法と決定係数について学び、Rを使用して回帰分析を実践できるようになる単回帰分析について復習する。復習:180分
評価割合 中間レポート(40%)、期末レポート(50%)、受講状況(10%)
使用教科書名(ISBN番号) 授業でアナウンスをする。
参考図書 授業でアナウンスをする。
ディプロマポリシーとの関連 【知識・理解】データサイエンスの知識に基づき、課題を発見し、その解決策を立案できる。
【関心・意欲・態度】積極的にデータサイエンスについての関心を持ち、実社会における様々な課題を解決するためにはどのようにデータサイエンスを活用すると良いのか思考する。
【技能・表現】種々の課題解決のために、データ分析を実践できる。
学生へのメッセージ 数学が苦手でもデータサイエンスには体験することで理解が深まることがたくさんあります。授業で採り上げた内容に不明なことがあれば積極的に質問してください。
オフィスアワー 原則として、メールで対応する。必要に応じて、対面やオンラインでの対応も行う。
評価方法 中間レポートおよび期末レポートでは分析手法に対する理解の程度とデータ分析の実践力を確認する。
受講状況では質問の提出頻度などによって学修意欲を評価する。
履修条件 コンピュータの操作にある程度習熟している。
教育等の取組み状況
該当有無 概要
実務経験を活かした授業
アクティブ・ラーニング
情報リテラシー教育
ICT活用
コンピュータを使用した演習
評価基準
評価基準
評価方法 知識・理解(K) 思考・判断(K) 関心・意欲・態度(V) 技術・表現(A)
中間レポート
期末レポート
受講状況
学習目標(到達目標)
学習目標(到達目標)
知識・理解の観点 (K)
データサイエンスの手法について理解する。
思考・判断の観点 (K)
関心・意欲・態度の観点 (V)
データサイエンスに関心を持ち、主体的に学修する。
技術・表現の観点 (A)
データ分析を実践できるようになる。