高等学校の教科書・教材|知が啓く。教科書の啓林館
数学

高等学校統計実践報告①「散布図・相関係数」

神戸大学附属中等教育学校 数学科教諭
神戸大学・数理・データサイエンスセンター客員研究員
林 兵馬

1.はじめに

高校の指導要領に,「データの分析」が入って以来,統計・データサイエンス分野の指導が叫ばれるようになってきた。また,令和4年度からは,数学Ⅰ「データの分析」に仮説検定の考え方の項目が,また数学Bの「統計的な推測」も令和5年度より様々な学校で実施されると考えている。
神戸大学附属中等教育学校数学科では,令和4年度以降の数学科学習指導要領改訂を見越し,令和2年度より神戸大学数理・データサイエンスセンター(以下CMDS)の全面協力の元,

をSSHの学校設定科目として開講し,実践を進めてきた。

今回,啓林館のホームページで計3回,本校で実践を進めてきたDSⅠ,DSⅡから実践報告をさせていただく機会を得た。また今回の内容は,筆者が本校での実践に加え,本校の他教員の実践,CMDS主催高等学校教員向け統計研修会での発表内容,兵庫県立明石北高等学校での高校1年生向けの特別授業の内容などを含んでいる。本校の関係の先生方,神戸大学の指導助言の先生方,関わってくださった方々,そして授業を受けてくれた生徒の皆さんには,この場を借りて心よりお礼申し上げる。

第1回は,「散布図・相関係数」を取り上げた。散布図・相関係数は記述統計の基礎でもあり,回帰分析などを取り扱うことができる。また,本文中に出てきている課題0~課題5は,ダウンロードできるExcelファイルに対応している。本実践では,教科書の内容に加えて,表計算ソフトやPythonなどを利用して,実際に統計量を求めてみる,図を描いてみる,分析をしてみることを大切にしている。当実践報告に実際に授業で使用したExcelファイルもダウンロードできるようになっている。皆様の授業の参考になれば幸いである。なお,提供しているデータはすべて実データを模して創作したものである。

2.散布図・相関係数の指導

数学Ⅰ「データの分析」の学習指導要領の記述において,

散布図を手書きで描くことも,相関係数を手計算で求めてみることもできるが,統計分析においてはコンピュータを使うことが実践的であろう。

課題0:Sheet1_0相関係数を定義に従いExcelで計算してみよう。

課題0のSheet1_0は,相関係数を定義通りに計算するプロセスを体験させるためのものである。

課題0の前時の授業では,生徒の状況によっては一度手計算で相関係数を求める経験があってもよいと思われる。

課題1:Sheet1_1の相関係数をExcelの関数を用いて計算してみよう。

課題1のSheet1_1では,Excelの関数「=CORREL」を用いて相関係数を求めることを想定している。Excelに用意されている関数の有用性を伝える。

【図1 Sheet1_0 相関係数の計算】

【図2 Sheet1_1 Excelの関数を用いた相関係数の計算】

課題2・課題3:Sheet1_2,Sheet1_3のそれぞれの項目の相関係数をExcelの関数を用いて計算してみよう。

課題2のSheet1_2,課題3のSheet1_3は,一部データを除き,ほとんどSheet1_1の内容と変わらない。しかし,20のデータのうち1つのデータが違うだけで相関係数に大きな影響を及ぼすことを理解させることを狙いとしている。

【図3 Sheet1_2 相関係数の計算】

【図4 Sheet1_2 50m走と走り幅跳びの散布図】

【図5 Sheet1_3 相関係数の計算】

図6【Sheet1_3 50m走と走り幅跳びの散布図】

生徒になぜそのようになったか想像してみようと問うと,
課題2については,
「入力者のミス」
「ストップウォッチを押し忘れた」
課題3については,
「高校生のデータに小学生が混ざった?」
「20番は計測当日コンディションが悪かったのでは?」
などの意見があった。
Excelなどコンピューターを用いると,データ全体を俯瞰せずに相関係数を出す生徒が目立つ。データを可視化すること,また外れ値や異常値(およびその候補)がある場合はそのデータを調べるなどの指導をするようにする。
また,相関係数については,

などを状況に応じて生徒に投げかけてもよい。
また,Pythonを使用できる環境であれば,seabornなどを用いて描画してもよい。

図7【Sheet1_2 Pythonを用いた散布図行列と,相関係数行列のheatmap】

課題4:Sheet1_4の男女に分けた相関係数を求めてみよう。

課題4のSheet1_4は,40件全体で相関係数を求めると0.14であるが,男女別で相関係数を求めると女性:0.69,男性:0.66となる。全体では相関係数はないが,分類をしてみると見えてくる様子が異なる例である。また,男女別に色を分けると以下の散布図を作成できる。

図8【Sheet1_4立ち幅跳びと長座体前屈の散布図】

3.単回帰分析

課題5:Sheet1_5単回帰分析を行い,2021年12月の売上の予測をしてみよう。

課題5のSheet1_5は,単回帰分析の例である。
データセットには,20年分の11月のX市の平均気温(℃)とY高等学校にある自販機Aの12月のホットドリンクの売上(本)のデータがある。相関係数を求めると-0.71であり,2021年11月のX市の平均気温のデータがあれば,2021年12月の自販機Aの売上本数の予想が立ちそうか?という問いを生徒に投げかける。散布図を描かせると,確かに右肩上がりになっており,生徒から散布図より2021年12月の自販機Aの売り上げの大まかな予想が返ってくる。
目的変数yと説明変数xに相関関係がみられる場合,xとyの変数の間関係を示す当てはまりの良い回帰直線y=ax+bを求める。最小二乗法を用いるが,授業計画によっては,その導出を数学的に行うとよい。散布図と相関係数を求めたあと,回帰直線を求める。今回,回帰直線がy=-46.5x+1136と求められたので,xに2021年12月の気温を代入すると2022年12月の売り上げ本数の予測をすることができる。ただし,決定係数R2についても可能であれば言及をしておくべきであろう。
【相関係数課題】

4.今後の展望

今回紹介した散布図・相関係数については,令和4年度の数学Ⅰの教科書では,例えば啓林館の数学Ⅰ(数Ⅰ 709)ではp.171~p.175に記述がある。

【啓林館 数学Ⅰ p.171~p.175】

教科書内容を理解したうえで,実際に統計を活用することが大切になると考えているので,上記のような実践を行った。
また,散布図・相関係数に加えて単回帰分析の実践を紹介してきたが,今後は高等学校情報科「情報Ⅰ」の第3章,第4章や,理数探究基礎,課題研究をはじめとする教科横断的な考え方はますます重要になっていくであろう。
なお本実践の内容では,数学的に説明が不十分である。今後は,数学的にどの程度補足をすべきか,またワークシートの公開などを視野に入れていきたい。

次回は,数学Ⅰの仮説検定の実践報告を行う予定である。数学Aの「場合の数と確率」を履修していることを前提としていることを予めご了承いただきたい。

【参考文献】