高等学校の教科書・教材|知が啓く。教科書の啓林館
数学

数学Ⅰ「データの分析」の導入段階の指導について
~生のデータから作成した「ヒストグラムを読む」授業の構成~

茨城県立大洗高等学校 沢畑 雅彦

1.はじめに

前回(平成25年)の学習指導要領の改訂から,数学Ⅰに「データの分析」が入り,統計分野が必修となった。しかし,高校時代に統計の授業を受けた教員はまだまだ少なく,この分野を「教えるのが苦手」という話はよく耳にする。私も高校時代は統計の授業を受けてはなかった。大学から大学院にかけては数学を専攻したが,専門外の統計に触れることはほぼなかった。
しかし修士論文では,ゼミの日合文雄教授の研究をいただく形で「中心極限定理」をテーマとした研究を行った(論文名「The Central Limit Theorem in Free Random Variable」)。

その頃の私は関数解析学が専門であったため,中心極限定理については学部生時代に履修した「統計学の中にあったような気がする」程度の認識しかなかった。そのため,教授のおこぼれ研究とは言え,論文のために統計学を学び直す必要が生じた。しかし,結果として,このときの経験が教員になってから非常に役に立つことになった。若いころの苦労はしておくものだと実感した。

日本の産業構造が第2次産業から第3次産業へと移行すると同時に,数学の重要な分野も解析から統計に移行してきた。POSシステムに代表されるように,統計学はサービス業にとって欠くことのできない分野である。高等学校の数学においても,それまで「数学B」にあり,教えなくても良いあいまいな分野の扱いだった統計が,必修である「数学Ⅰ」の分野になったことは,時代の流れに沿った必然的なものだと思う。

数学の中で,確率・統計の分野は他の分野に比べて,実践的な学習活動を構成しやすい分野である。そのため数学が苦手な生徒に対しても,興味が持てるような授業を組み立てやすいと思う。確率の分野の話ではあるが,前任校では中学生向けの体験授業で,サイコロ100個を一度に投げてカウントさせるという実験をやったが,なかなかの評判であった。サイコロを実際に使った授業というのは多くの教員が実践していると思うが,「同時に100個投げる」という体験は珍しく,中学生は目を輝かせて体験授業に臨んでいた。

統計分野においても,生徒の生活に密着した生のデータを使うなどの工夫をすれば,生徒は興味を持つはずである。しかし,加工されていない生のデータを扱うと,計算がたいへん複雑になる場合が多い。その上,そのデータから何かを読み解こうと思うとかなりの知識を要する。結果として,扱いづらい生のデータには手を出さず,教科書等の問題をいじるだけのつまらない授業で終わっているように思われる。

そこで,「データの分析」分野の導入段階において,生のデータを使ったヒストグラムを作成し,そのヒストグラムから何が読み解けるかという授業をしたところ,生徒の反応がとてもよい授業を展開することができた。今回は,実際の授業で実践した,生のデータを活用した「ヒストグラムを読む」授業について書かせていただきたい。

2.教科書の問から

まず,私がこの授業を思いついたきっかけは前任校の茨城県立日立第一高等学校(以下,日立一高)の数学部での活動からであった。日立一高はスーパーサイエンスハイスクール(以下,SSH)の指定を受けており,理系教育に力を入れていた。SSHの指定前から物理・化学・生物・地学の各部はすでに存在していたが,指定を機に数学を研究対象とする「数理科学研究同好会」を立ち上げた。その後,同好会を立ち上げた先生が異動することになり,後継者に私を指名していただいたため,同好会の顧問を引き受けることになった。しかし,引き受けたものの何をやっていいものかさっぱり分からなかった。学生時代は卒論らしいものも書かず,修士論文ですら教授の研究のおこぼれで切り抜けた私にとって,「高校生に数学の研究をさせる」というのは,経験したことはもちろんないし,アイディアなどまったく浮かばなかった。しかし,部員とテーマで話し合っている中に「統計について勉強したい」という言葉があったので,当時の「数学B」の教科書を説明することから始めた。彼らは数学が好きで集まった生徒たちなので「答えさえでればいい」という感じではなく,ちょっとした疑問であっても「なぜ」と考えながら教科書を進めることができた。教科書は簡単な用語の説明から始まり,データから度数分布表を作り,それを基にヒストグラムを作成するという流れだった。これ自体はたいした問題ではない。そこで部員たちには「ヒストグラムから何を読み取るか」という点を強調した。

「ヒストグラムを読む」と言っても,どのように読み解くべきか。それには「理想的なヒストグラム」があり,実際に作ったヒストグラムと理想のものとを比較して,どこがどう違うかを見いだし,その原因について仮説を立てる。このような方法で,ヒストグラムを読み解く指導をした。この考え方を支える重要な定理が「中心極限定理」である。これは「多くの場合,母集団の分布がどんな分布であっても,その誤差は標本の大きさを大きくしたとき近似的に正規分布に従う。」という定理であり,数学Bの教科書でも「データの数を増やし,階級の幅も細かくしていくと,ヒストグラムは釣鐘型の曲線に近づくと考えられる」とあり,その曲線こそが正規分布曲線である。そこで正規分布曲線とできあがったヒストグラムとを比較し,ズレが大きな部分について,その原因を考えてみるように指導した。

ここで実際に扱った問題の例を見てみたい。そのとき使っていた「数学B」の教科書の問は「新幹線の駅間の距離」であった。

上の表は東海道新幹線と山陽新幹線の各駅間の距離の一覧表である。表の中の「距離」とは前の駅とその駅との距離を表している。教科書では5kmから75kmまで10kmごとに階級を設定していた。そのときの度数分布表とヒストグラムが以下の通りとなる。

できあがったヒストグラムと正規分布曲線を比較し,「65km以上75km未満」の階級値が非常に多いと生徒は感じたようだ。具体的には「米原~京都」「相生~岡山」「小倉~博多」の3カ所であった。それらの共通点を考えると,「城」と「県庁所在地」の2点が挙がった。しかし,「城」は大小さまざまあり,現存するかしないかでも印象が違う。もう一方の「県庁所在地」について見ると,この路線上の県庁所在地は横浜,静岡,名古屋,京都,大阪,神戸,岡山,広島,山口,福岡の10都市であった。そうすると京都,岡山,博多だけを特別扱いする理由はないように思われた。しかし,もう少し調べてみると新富士,掛川,三河安城,新尾道,東広島の5駅は後から作られたものであることが分かった。つまり,以前はほとんどの県庁所在地付近の駅間の距離はもっと長かったが,その後,駅の追加により駅間の距離が短くなったことが分かった。

もっと詳しくみれば,まだまだいろいろな事が分かるかもしれないが,最初に感じた3カ所の駅間の長さにはそれなりの理由があったと考えられた。

この経験から,生徒ばかりでなく私もヒストグラムに興味を持つようになった。

ちなみにこのときの部員たちは統計学に関する研究を続け,「モンテカルロ法」や「ビュフォンの針」からヒントを得て,10円玉を投げて円周率を求める「ビュフォンの10円玉」という研究を総文祭全国大会で発表した。その後,実績が評価され数学部に昇格した。

3.授業の準備

ここからは現在勤務する茨城県立大洗高等学校での実践例となる。この「ヒストグラムを読む授業」を展開する上で前もって何点か注意しておきたい。

まず「どこまで授業を深めるか」という問題がある。この授業の目的は,視覚化によって議論すべきポイントを発見することであり,統計学的にはそのポイントが見つかれば終わりである。しかし,授業としてはもったいない。そこで生徒にはそのポイントがなぜそうなったかという仮説まで立てさせたいと考えた。ただ仮説を立証するにはそれぞれの専門分野の知識を必要とし,統計学の域を越えてしまう。先述の「新幹線の駅間」を例にとれば,完成したヒストグラムを正規分布曲線と比較して,「65km以上75km未満が異常に多く感じられる」という点に気付けば,それで統計学的な目的は達成したことになる。しかし「なぜ」にまで踏み込み,自分なりの仮説を立てた方が,生徒たちは数学に面白みを感じるだろう。ただ仮説の検証まで行うと,数学のみの知識だけでは太刀打ちできなくなり,場合によっては膨大な時間を検証に費やすことになる。そのため,数学の授業としてはそれぞれの生徒が仮説を立てるところで留めておくべきである。ただ,生徒がどうしても検証したい場合は,「総合的な探究の時間」等の別な時間を活用するようにすれば良い。つまり数学の授業においては,「ヒストグラムから議論すべきポイントを発見し,その理由について仮説を立てる」というところまで授業を深めたいと考えた。

次にどのようなデータを使うかだが,これは生徒たちの生活に密着した生のデータを使いたい。自分の生活とはかけ離れたデータを使用すると,仮説すら立てることができず,授業に深みが生まれない。一方,自分たちの身近なデータを使うと仮説を立てやすくなり,議論も活発となる。しかし生のデータを活用する場合は,計算が面倒であったり,データ量が適切でなかったりと,うまくいく事の方が少ない。そのため,前もっての準備が必要となる。この点はエクセルのようなソフトを活用することで,教員の負担は軽減できると思う。

では,これらを踏まえた授業で,うまくいった例を見ていきたい。

ここで示す授業の実践例は,本校において就職が主な進路先となる生徒が多く在籍する「キャリア教養」というコースで行った授業である。就職希望者の多い本校の中でも特に「キャリア教養」を選択する生徒たちの学習に対するモチベーションは高いとは言えない。また,この授業をおこなった「実用数学」は学校設定科目であり,就職に有利になるような内容を扱う目的で設定された授業であるが,単純な計算だけの授業を展開すると生徒はすぐに飽きてしまい,授業の成立が難しい。そのため,生徒の興味・関心を惹きつつも,簡単な内容で授業を展開する必要がある。そこで,私は内容の一つに統計学を選んだ。

導入では教科書を説明しつつ,多くの練習問題を扱った。教科書や問題集の問題であっても,ヒストグラムを作成した場合は,そこから何が読み取れるかを考えるように問いかけた。授業がある程度進んだところで,エクセルを使ってヒストグラムをかけるように練習した。科目名が「実用数学」という名前であったため,授業でやった内容が就職してから現場でも使える事を考慮しタブレットを使用した。

授業では生徒の身近な生のデータを活用したいと思い,いくつかのデータを準備した。この授業で使用したのは本校の地元を通る「大洗鹿島線」のデータである。この路線は人気アニメ「ガールズ&パンツァー」のラッピング電車で有名である。大洗鹿島線を運営する鹿島臨海鉄道株式会社は茨城県内で貨物および旅客鉄道事業を行う第三セクターである。大洗鹿島線と鹿島臨港線の2路線を保有しているが,鹿島臨港線は貨物専用であるため,一般の方々には水戸駅と鹿島サッカースタジアム駅を結ぶ大洗鹿島線の方がよく知られている。本校の最寄り駅が大洗鹿島線の「大洗駅」であり,この路線を利用したことのない生徒はまずいない。そこで先述の新幹線にあやかって「各駅間の距離」のヒストグラムを作成した。

以下がインターネット上に公開されている大洗鹿島線の各駅間の距離のデータである。

新幹線の例と同じで,表の中の「距離」は前の駅とその駅との距離を表している。この表に関して注釈を入れたい。まず最後の「鹿島神宮駅」はJR東日本の駅であり,大洗鹿島線の駅ではない。鹿島サッカースタジアム駅は鹿島サッカースタジアムで試合が行われるときのみの臨時駅であり,普段は閉鎖しているため,乗り入れの形で鹿島神宮駅が終点のようになっている。また表中の「長者ヶ浜」は略称で正式名称は「長者ヶ浜潮騒はまなす公園前駅」で,一時は日本一長い駅名だった駅である。

生のデータなので,階級の値や幅は自分で決めなければならない。そのため,何種類かの度数分布表とヒストグラムを作成した。

例①の場合,ヒストグラムは完全に左右対称の理想的な形となる。つまりデータとしては自然なデータであったと言える。しかし,これでは議論のポイントとなる点は見つからず,この授業では使えないヒストグラムとなる。ちなみにヒストグラムの値が「2.4」や「3.4」となっているのはエクセルで使用したFREQUENCY関数の特性によるものである。

次に階級の幅を変えてみた。例②であっても,ヒストグラムはほぼ左右対称であり,議論できそうな点は発見できない。このデータでは面白そうな授業展開は難しいかもしれないと思い,このテーマでの授業を諦めかけていた。

例③は例②とほぼ同じ度数分布表である。ただ,階級の切り方が例②では「〇〇以上から〇〇未満」を例③では「〇〇より大きいから〇〇以下」とした。これだけの差ではあるが,課題となりそうな点がありそうなヒストグラムを作ることができた。これ以外であれば,「階級の幅を変える」「階級の値を2.3以上2.8未満のようにする」などが考えられるが,例③は非常にすっきりとした形なので,公開授業では例③を採用した。

4.実際の授業

実際の授業では,「数学が苦手な生徒であっても,テーマの選び方によっては面白い授業となる」ということを示したかったので,数学があまり得意ではない「キャリア教養」で実施した。形態はこちらが指定したメンバーによるグループ学習とした。メンバーは数学が得意な生徒と苦手な生徒を織り交ぜて構成した。グループ学習ではあるが,全員が授業に参加するように,「個人でやってからグループ」という流れを大事にした。授業の大まかな流れは次の通りである。

まず「大洗鹿島線の駅間の距離」のデータをエクセルに入力させ,FREQUENCY関数を使ってヒストグラムを作った。この関数を使えば,度数分布表は意外と簡単に作ることができる。普段の授業の様子から「ヒストグラムを完成するまでには15分ほどかかる」と予想していたが,グループにしたため,早く終わった生徒が遅い生徒を手助けし,10分ほどで全員がヒストグラムを仕上げることができた。

次にヒストグラムと正規分布曲線を比較して,どの点が議論すべき点かと問いかけた。ほとんどの生徒が【例③】のヒストグラムの(2)だけに注目したが,数人の生徒が「(1)も気になる」と答えたので,(1)と(2)の両方について全員で仮説を立てることにした。

続いて,仮説を立てるために,生徒たちはインターネットでそれぞれの理由を検索した。その結果,(1)の部分については「長者ヶ浜潮騒はまなす公園前駅が後から作られた駅だから」という意見で一致した。これは私が準備した答えといっしょなので,授業ではこの仮説で統一した。(2)の部分については様々な意見が出た。対象となるデータが「大洗駅~涸沼駅」の区間であり,まさに彼らの地元である。私は「大洗町には駅が1つしか作れない理由があった」との仮説をもって授業に臨んだ。

しかし,生徒たちからは「長いトンネルがある」「森林が多い」「運動公園やゴルフ場がある」「原子力の施設がある」など,様々な意見が出た。どれも,実際に大洗鹿島線に乗っていたり,生活していたりすればこそ出る意見である。生活に密着したデータを活用したため,数学に苦手意識を持っている生徒も積極的に発言することができた。授業では仮説を統一せず,オープンエンド的な終わり方になってしまったが,生徒たちはとても楽しそうに授業を終えた。

ちなみに,後日,大洗鹿島線の担当者と話す機会があり,この疑問をぶつけてみたところ,「駅を作ったのは国鉄時代にまで遡り,きちんとした資料が残っているかどうかまでは確認できないと思うが,地理的要因だと思う」とのことであった。

5.最後に

今回は「駅間の距離」のデータだけの話になってしまったが,準備したデータは他にもあった。「1日の保健室利用者数」は,特定の生徒が多く利用するためか期待通りのヒストグラムにはならなかった。また「某社の株価の終値」や「生徒の苗字の画数」は面白いデータが取れたが,個人情報に触れる恐れがあるので今回ここで取り上げるのはやめた。

長々と書かせていただいたが,「ヒストグラムを読む」という授業は,

とシンプルにまとめることができる。

統計的な分析を行う際,私が大事にしているのは「統計的分析の結果は,分析者の主観や視点に依存する」という言葉である。本などによって多少言い回しは異なるかもしれないが,このことは統計に関する多くの本などで述べられている。私はこの言葉を「統計には正しい答えなどないから,どんどん自分なりに解釈していけばよい」と前向きにとらえ,実践している。

最後に,「データの分析」で授業につまってしまっている先生方が,この実践報告を参考に生徒の身近なデータを基に授業を展開していただき,教員と生徒の双方が「統計って楽しいな」と思っていただければ幸いである。