統計検定2級の取得メリットと勉強法 – 80点合格のエンジニアが解説

2023年に統計検定2級に80点で合格しました(合格点は60点)。筆者は現役のエンジニアであり、経済学部と金融工学の大学院を修了しているので、統計学については一定の前提知識がありました。加えて標準より多い175時間の勉強時間を投下したことからかなりの自信をもって臨みましたが、本番は苦戦し80点でした。簡単な試験ではないです。本稿では、統計検定2級の概要、取得のメリット、難易度、勉強法、筆者の使用した参考書、分野別の傾向と対策について解説します。

試験結果レポート

(2023年2月4日の受験直後に受領)


統計検定2級の概要

統計検定2級は民間の検定資格ですが、民間企業が営利目的で運営する資格ではなく、日本統計学学会が2012年1月に統計教育の成果を評価する仕組みとして創設した学術的な資格です。民間企業の後援はなく、応用統計学会、日本計算機統計学会、日本計量生物学会などの学会が賛助会員となり、総務省、文部科学省、経済産業省、内閣府、厚生労働省が後援する、公的な後押しの強い検定です。試験の概要次の通りです。


名称統計検定2級
創立当初は「統計検定」であったが、3級、4級、準1級の創設に伴い2級となる
試験内容大学基礎課程(1年・2年次学部共通)の記述統計・確率・推定・検定
試験日いつでも受験可能
受験方式CBT方式(受験日時と会場を選べる)
受験費用一般7,000円 学生5,000円
受験資格なし
試験形式・問題数4-5肢の択一問題が約35問程度(可変)
試験時間90分
合格ライン正答率60%と公表
最優秀成績賞 – S評価正答率90%(推定)
優秀成績賞 – A評価正答率80%(推定)
合格率
2021年6月実績
受検者数:731名
合格者数:249名
合格率 :34.1%
合格発表試験の直後に合否判明(合格証の発行は1ヶ月後)
当日の持ち物電卓、写真入りの身分証明書、オデッセイのIDとパスワード
電卓持ち込み可(条件あり、後述)
電卓以外の持ち込み不可、ただし下記3点が貸与又は配布される
・ボールペン2本
・メモ用紙2枚(表裏使用可)
・Z分布、t分布・χ2乗分布・F分布の分布表

試験概要につき、当日の注意事項を含めて何点か補足します。

試験日・受験方式

試験会場に直接申し込みます。私の場合は木曜日に申し込んで土曜日に受験しました。受験料の振り込み確認を事前にとる必要があるので、受験前日や当日の申込みに対応する受験会場は少ないかもしれません。試験会場に申し込んだ後、必ずオデッセイというサイトに登録し、IDとパスワードを取得、会場でオデッセイのIDとパスワードを使って受験します。

受験方式

必要な登録を済ませた後、試験開始というボタンを押すと試験が始まるので、試験開始時間をある程度コントロールできます。私は軽くストレッチをする、メモ用紙を半分に折る、画面の明るさを調節するなどにより、試験開始ボタンを押す前に1分ほど使いました。開始後の残り時間は画面の左下に秒単位で表示されます。また、それぞれの問題には後で見るというチェッボックスを付けることができます。90分が経過すると画面が切り替わりアンケートの画面になって試験終了です。合格は直後にすぐわかります。私が過去問では9割近い正答率ながら、本番で8割に留まった要因(敗因)はPCの画面と手元の計算用紙の間に物理的な距離があり、その往復に戸惑った点があります。CBT対策としては、なんらかのPC画面上の問題を見ながら手元の紙で問題を解く訓練をするといいかもしれません。この点は後ほど再び触れます。

試験形式・問題数

大部分の問題がマウスのクリックによる択一ですが、時々半角英数字で正しい選択肢を入力して回答する問題があります。問題数は35問程度と公表され可変です。過去問も34問の年や35問の年がありました。私が受験したときも35問ではありませんでした。問題の総数と現在の問題が何番目であるかは、試験中、常時画面の周囲に表示されます。

合格率

合格率は、紙のPBT方式で実施された2021年6月の合格率34.1%が最新の値です。現在のCBT方式になってからは公表されておりません。

優秀成績賞

統計検定には、最優秀成績賞(S成績)・優秀成績賞(A成績)という成績優秀者の表彰制度があります。賞状をもらえるだけでなく、統計検定のホームページ上に氏名と勤務先/大学名が公表されます。私は優秀成績賞ギリギリの80点合格ですが、60点合格ではなく90点合格が目標でした。

統計検定2級を取得するメリット

統計検定2級取得には4つの目的(メリット)がありそうです。

  1. データサイエンティストに最も人気
  2. 転職(就職)に有利
  3. 大学院の入学に有利
  4. 準1級や1級に向けた準備

データサイエンティストに最も人気

下記は、データサイエンティスト協会が個人会員556人を対象に実施した資格に関するアンケートです(2022年5月)。取得済みと取得検討中を合わせると、統計検定2級以上が最も人気の資格となっています。データサイエンティストには、統計検定2級以上の取得が必要である、または、業務上有用であると多くの人が判断していると言えます。


データサイエンティストに人気の資格

転職(就職)に有利

統計検定2級を応募資格の条件としている求人(データサイエンティストの求人)は多いです。例えば、indeedで統計検定2級と検索すると1,278件、dodaで検索すると60件、レバテックキャリアで検索すると33件の求人がありました(2023年2月11日現在)。indeedには重複する掲載も多いので、業界最大手クラスのdodaの60件、または、データサイエンティストを含むエンジニア転職に特化したレバテックキャリアの33件が実態に近い数字だと思います。下記は両サイトから抜粋した求人の必須条件部分です。求人データは全て2023年2月11日現在。

ディー・エヌ・エー  【データアナリスト】

想定年収600~1,200万円の求人です。必須条件6点の3番目として、統計検定2級程度の統計の知識を要求しています。出所:レバテックキャリア

統計検定2級の求人 - ディー・エヌ・エー

サイバーエージュエント 【データアナリスト・データサイエンティスト】

想定年収400~1,100万円の求人です。必須条件の2番目にて、統計検定2級以上を求めています。出所:レバテックキャリア

統計検定2級の求人 - サイバーエージェント

タイミー 【データアナリスト】

タイミーは、すきま時間バイトの自社サービス(アプリ)を持つ会社です。本件は想定年収600~1,200万円の求人です。必須条件の3番目に統計検定2級相当以上を要求しています。統計検定2級ではなく2級以上を求めている点と、Python、Rでの実装能力よりも統計の知識を重視している点はサイバーエージェントと共通します。出所:doda

統計検定2級の求人 - タイミー

大和証券 【データサイエンティスト】

最近は証券会社もデータサイエンティストの確保に力を入れているようで、大和証券の想定年収は、今回調査した中では最も上限レンジが高い700~1,500万円でした。必須条件の4番目で、統計検定2級以上の統計リテラシーを求めています。出所:doda

統計検定2級の求人 - 大和証券

大学院の入学に有利

2020年頃よりデータサイエンス大学院の設置が増えており、私が調査した限りでは下記の5つの大学院が統計検定2級を試験科目とする、あるいは目安であると公表しています(2023年1月調査)。単に合格すればよいということではなく、例えば滋賀大と横浜市立大学では統計検定2級の点数が評価されます。


滋賀大学 – データサイエンス研究科(修士、以下同じ)統計検定2級の点数にて、300点中の100点を配点
横浜市立大学 – データサイエンス研究科統計検定2級の試験結果レポートが出願書類
大阪公立大学 – 医学研究科 – 医療統計学統計検定2級以上が入学要件
京都大学 – 医学研究科社会健康医学「統計検定2級程度の統計学的能力があることを確認するためのコース専用問題」を受験
上智大学 – 応用データサイエンス筆記試験が免除になり得る資格の筆頭として統計検定に言及

統計検定1級又は準1級に向けた準備

時々統計検定2級をスキップして準1級や1級に合格される方がいますが、多くの準1級・1級合格者は2級の合格を経ていて、かつ、2級の取得を推奨されています。準1級や1級合格のステップとしての2級合格においては、2級の合格それ自体にあまり意味がないので、高得点合格が目標になります。私がネット上で調査した限りでは2級を80点で合格された準1級合格者の方が1名おりました。その他、高得点合格のメリットとしては前述の成績優秀者の表彰制度・ホームページ上の氏名公表制度もありますので、80点又は90点がちょうどいい目標になりそうです。

統計検定2級の難易度

統計検定は大学基礎課程(1年・2年次学部共通)の理解度を問う試験ということもあり、過去問でも私の受験した回でも極端な難問やひっかけ問題は出題されませんでした。また試験範囲は広いですが明確なので、十分な時間(80 – 100時間)をかければ60点合格は難なく、90点合格も可能な試験だと思います。合格率は前述の通り34.1%です。

勉強法(参考書)

私は統計検定準1級が目標でしたので、2級の学習においても準1級に通じる「統計学入門(通称赤本)」を中心に勉強し、公式テキストは使いませんでした。赤本の内容と統計検定2級の試験範囲のズレに対する対策としては、出題範囲表をよく参照しておりました。出題範囲表には詳細に出題範囲が記載されていますので、不足なく学習できます。例えば、相関係数の区間推定は、区間推定の中でも難易度が高く、過去問でも出題を見ることはありませんが、出題範囲表には記載があります。私は赤本の該当する問題を何度も解き、確実に解ける用意をしておりました。赤本の他に、私が使用した参考書と投下した学習時間は次の通りです(私が時間をかけすぎた点は後述)。


統計学入門(赤本)150時間
確率統計キャンパス・ゼミ10時間
統計学のための数学入門30講5時間
統計検定2級公式問題集 CBT対応版7時間
統計検定2級公式問題集 2018年 – 2021年3時間
合計勉強時間175時間

統計学入門(東京大学出版会)

本書は統計学の名著です。表紙の上部とタイトルが赤いので「赤本」と呼ばれることもあります。とくに確率分布、中心極限定理、区間推定、検定が丁寧に書かれており、章末問題も良質な問題が充実しています。章末問題の解説はあっさりしていますが、人気の名著ですのでネット上で詳しく章末問題の解説を書かれている方もいて学習には困りません。本書を精読すると2級の過去問は簡単に感じると思います。私は本書を2週し過去問では9割近い正答率、本試験でも8割の正答率でした(一発合格)。

統計学入門(赤本)のデメリット

本書は前述の通り2級と準1級の間のレベルとされていて、2級の合格だけを目標とする場合はオーバースペックです。SNSではいい意味でも悪い意味でも「沼」と表現されています。例えば、モーメント母関数と最尤推定は2級ではなく準1級での重要な出題範囲ですが、本書では丁寧に解説されています。2級に最短の学習時間で合格することを目標とする場合は、出題範囲外の記載を読み飛ばすか、本書ではなく2級の公式テキスト、または、のちほど紹介する「基本統計学」での学習をお勧めします。本書を含めた公式テキスト以外の書籍を使用する場合の他の大きなデメリットとしては、本の内容が出題範囲表と一致しない点です。出題範囲表のうち本書では次の5つのテーマの記載がありません。なおいずれも2級で出願される範囲では難易度が相対的に低いテーマなので、過去問の演習と解説で十分です(反対にこれら分野の過去問の演習は重点的にやる)。

  1. 成長率
  2. 実験計画、フィッシャーの3原則
  3. パーシュ指数・ラスパイレス指数
  4. 標本抽出法
  5. 一元配置分散分析

下記の本は、先ほどから何度か言及している統計検定公式テキストです。

確率統計キャンパス・ゼミ

統計検定2級では、高校数学の知識が前提となります。例えば確率分布関数に対して積分を用いて期待値や分散を計算させる問題は、過去よく出題されています。本書は大学生1・2年生向けに作られており、公式テキストや赤本とは異なり計算の過程が丁寧に解説されている点が特徴です。私は本書の問題を全て解いていませんが、赤本ではわかりにくい計算過程を学ぶために使用しました。また、本書は問題数が比較的多く、一部の問題は難易度が2級よりやや高いも範囲が統計検定2級とほぼ一致しているため、過去問を解き終わってなお演習量が不足していると感じる方にもお勧めします。

統計学のための数学入門30講

本書は名称の通り統計学に必要な数学を網羅し、大学入試の参考書のような構成で解説と問題が掲載されています。30テーマは、第1章「基礎と1変数関数の微積分」、第2章「線形代数」、第3章「多変数関数の微積分」に大別され、各テーマ内の「統計学ではこう使う」というコラムで統計学での計算例が解説されています。ただ「統計学ではこう使う」に掲載されている事例の多くは、2級のレベルを超えた準1級の難易度です。私は統計検定準1級も展望して本書を購入し辞書のように使っていましたが、数学が得意な方と、反対に、数学が得意ではないが統計検定2級の合格だけを目標とする方には本書は必要ないと思います。数学が苦手な方が統計検定2級の合格を目標とする場合には、前述の確率統計キャンパス・ゼミで補うことをお勧めします。

統計検定2級公式問題集 CBT対応版

実際に出題された過去問も含めて分野別に整理された公式問題集です(2023年1月発売)。分野別に整理されているので使いやすいです。本試験では過去問では見たことのない問題も多く出題されましたが、過去問に近い問題も同様に多かったです。合格を目指す場合は過去問の演習は必須だと思います。ただ本書に掲載の問題は出題範囲表を網羅していないので、本書だけを何度も回すという勉強スタイルでは余裕を持った合格とはならないと思います。過去問に取り組むこと以上に、公式テキストまたは赤本などそれぞれの基本書で出題範囲表の内容を十分に理解することが重要だと思います。

統計検定2級公式問題集 2018年 – 2021年

紙のPBT方式で出題されていた頃の公式の過去問題集です。5回分の過去問が掲載されています。前述のCBT方式対応の公式問題集と一部問題が重複していますが、CBT方式対応問題集に掲載のない問題も一部本書には掲載されております。十分な演習量を確保したい場合にはお勧めです。私は両方使いました。

その他評判のいい書籍 – 基本統計学

2級合格者に最も人気のある書籍です。統計学入門(赤本)同様の丁寧な解説が評判です。赤本よりも平易で初学者に優しく、私も立ち読みした限りですが紙面も読みやすいです。また例題に基づいた解説をしている点も特徴です。デメリットは2点あります。1点目が赤本同様に本の内容と2級の出題範囲表が一致しない点(例えば頻出のポアソン分布がないようです)、2点目は例題ではなく練習問題の解説があっさりしている点です。統計検定準1級をすぐに受ける予定がない場合は、赤本よりもこちらの基本統計学をオススメします。

勉強時間の目安 – 80時間(合格者中央値)

私は高得点狙いで6か月間で175時間使いましたが、私が合格体験記を調査した限りでは、他に、40時間、50~70時間(計算上は60時間と見做す)、67.5時間、80時間、100時間、130時間の6事例がございました。私も加えた7人の合格者の平均勉強時間は93.2時間です。最小値と最大値がやや外れていることから中央値をとると80時間です。私は時間をかけすぎたという実感がありますので、2級の60点合格を目標とする場合の80時間という数値はしっくりきます。合格者の中央値80時間に対して、数学が得意な方はマイナス20時間で60時間程度、数学が苦手な方、あるいは高得点狙いの方は100時間以上を要するということだと思います。

分野別の傾向と対策

公式ホームページより取得した出題範囲表の要約は次の通りです。

  • 1変数データ(中心傾向の指標、散らばりの指標、中心と散らばりの活用、時系列データの処理)
  • 2変数以上のデータ(散布図と相関、カテゴリカルデータの解析、単回帰と予測)
  • 推測のためのデータ収集法(観察研究と実験研究、各種の標本調査法、フィッシャーの3原則)
  • 確率(統計的推測の基礎となる確率、ベイズの定理)
  • 確率分布(各種の確率分布とその平均・分散)
  • 標本分布(標本平均・標本比率の分布、二項分布の正規近似、t分布・カイ二乗分布、F分布)
  • 推定(推定量の一致性・不偏性、区間推定、母平均・母比率・母分散の区間推定)
  • 仮説検定(p値、2種類の過誤、母平均・母比率・母分散の検定[1標本、2標本])
  • カイ二乗検定(適合度検定、独立性の検定)
  • 線形モデル(回帰分析、実験計画)

1変数のデータ

1変数のデータは次の2変数以上のデータと併せ、統計学では記述統計と呼ばれる体系に属します。データの背後に確率関数を仮定せずに、散布図などでデータそのものを観察し、あるいは、標本平均、標本分散、相関係数などの特性値によって観察されたデータを要約する(=記述する)ことを目的とします。

1変数のデータは他の分野と比較すると難易度が低く、得点を取りやすいです。ただ1変数であれば、紙と電卓で特性値の計算が可能であるため、分散の計算など時間のかかる計算問題が出題されやすいです(要注意)。

2変数以上のデータ

散布図や各種グラフの読み取り問題(データを観察する問題)と、特性値を計算する問題に分かれます。読み取り問題は1変数のデータ同様に他の分野と比較すると難易度が低く得点しやすいです。計算問題も相関係数・偏相関係数など統計検定2級で出題される特性値は限られ、比較的解きやすい問題が多いです。カテゴリカルデータ(質的データ)とは度数表・2元クロス表のことで、同様に得点しやすいです。単回帰と予測には、文字通りの回帰の問題の他に、出題範囲表では、変動の分解、分散分析表なども含まれ、統計検定2級全体の中では難易度が比較的高いです。過去問の出題傾向は似ているので、過去問での演習が有効だと思います。

推測のためのデータ収集法

この分野はデータ(標本)を収集する方法論で、前述の記述統計の体系と、後述の統計的推測の体系に共通の基礎です。計算問題がほぼ出ません。また、過去問の傾向が似ています。30秒~1分で解ける出題が多く、確実に得点を稼ぎたい分野、または満点を狙いたい分野です。

確率

確率はなんらかの確率分布を前提として、その分布から生じる具体的な実現値の確率を求める問題です。記述統計とは異なる考え方で、後述の統計的推計の体系に属します。過去問に示されるよう、多様な問題が出題される傾向にあり、統計検定2級の中では推定・仮説検定に次いで演習を要する分野です(過去問ではやや不足)。他方で難問は出題されないので、大学入試で確率が得意だった方には容易です。また過去問を含む演習に時間をかければ十分得点可能です。私は中途半端に大学入試時の知識があったことから、過去問を解く以上の特別な対策をせず、本試験(自分の感触)では苦労した分野でした。

この確率以降後半の分野は、統計的推計と呼ばれる体系に属します。統計的推計は、データの背後に確率分布を仮定し、観察されたデータ(標本)を確率分布の実現値であると考えます。データの背後にある確率分布をまず学び、続いて標本の分布について学びます。標本と標本分布から背後の確率分布(の母数)を推測する手法が区間推計と仮説検定です。カイ二乗検定と線形モデルもこの体系に属すると考えると分かりやすいです。

確率分布

統計的推測の考え方に基づき、観察されたデータの背後にあると想定する確率分布の例を学びます。具体的には、ベルヌーイ分布、二項分布、ポアソン分布、幾何分布、一様分布、指数分布、正規分布、超幾何分布、負の二項分布が主題範囲表に記載のある確率分布です。対策として(1)確率関数又は確率密度関数、(2)平均、(3)分散を暗記し、簡単な具体例に確率分布をあてはめることが出来れば短時間で得点しやすい分野です。出題文が簡潔になりやすい特徴もあります(読む時間がかからない)。準1級以上を展望する方は、各確率分布のモーメント母関数と、分布間の関係についても2級の段階で時間をかけて学ぶといいと思います。私はここでかなりの勉強時間を使いました。

標本分布

データ(標本)の背後にあると仮定する(母集団の分布である)確率分布に対して、現実の標本が属する分布が標本分布です。推定と仮説検定、すなわち統計的推測の前提となる知識です。統計検定2級で最も重要な分野と言ってもいいかもしれません。過去問等での演習よりも、各標本分布の意義と導出を赤本、基本統計学、または公式テキストで丁寧に学ぶことが重要だと思います。中心極限定理の理解も重要です。

推定

統計的推計そのものです。データである標本からその背後にある確率分布のパラメーター(母数)を推計します。統計検定2級では仮説検定と併せ頻出で、最も時間をかけるべき分野ですが、前提となる確率分布と標本分布をしっかり理解すれば推定の理解自体は容易で、過去問の演習を通じて得点しやすい分野です。ただ出題範囲表に記載のある相関係数の区間推定だけは、先ほども書きましたが、他の推定と比較しても難易度が高いです。出題頻度も低いと思われ、90点合格を狙わない限り、相関係数の区間推定は捨てるということでもいいかもしれません。

仮説検定

推定と並ぶ統計的推計の代表的な手法です。推定と同様に統計検定2級では頻出で、最も時間をかけるべき分野です。推定を正しく理解していれば、仮説検定の理解は苦労しないです。他方で、第一種の過誤・第二種の過誤が、推定にはない仮説検定固有の頻出テーマです。丁寧に手を動かしながら 学ぶ必要があります。また仮説検定は、推定と同様に設問本文が長くなる傾向があり、過去問演習を繰り返し慣れる必要があります。

カイ二乗検定

一見すると難しそうですが、適合度検定と独立性の検定は主題パターンが限られ、得点しやすい頻出分野です。過去問を繰り返すことで満点をとれます。私もこの分野は万全の満点の感触でした。

線形モデル

線形モデルは、記述統計に属する2変数以上のデータの知識、統計的推測の基礎である標本分布、それに検定の知識・理解が前提になるという意味では難易度の高いテーマですが、過去問が豊富で出題傾向が似ており、対策は立てやすい分野だと思います。高得点を狙う場合は、多重共線性など、2級の範囲では難易度の高い論点も抑えておきたいです。

本試験の特徴と対策

受験の際に秘密保持義務を課せられており、出題について具体的に言及することはできませんが、本章では私か試験中と試験後に感じた教訓について解説いたします。

①約35問のそれぞれにかかる時間が均等ではない:90分を35問で除すると1問当たり平均2分30秒で解くことになりますが、2分30秒では解けない問題と、30秒程度で解答可能な問題が混在しています。短時間で解ける問題で時間を稼ぎつつ、解答に時間のかかる問題に出会っても焦らず確実に解くことが重要です。

②未回答にしない:後から解くというチェックボックスがあり、不明な問題は未回答として後から戻ることも可能です。私は自信のない問題について、仮のチェックをしつつも後から解くチェックボックスを活用しましたが、結局時間がギリギリでしたので戻って見直すことができませんでした。後から解く場合も、いったん仮の回答を付けることをお勧めします。

③画面と紙の視線の往復ロスを最小化する:過去問は手元だけで完結しますが、本試験は画面上の問題に対して手元のメモ用紙で計算するので視線の往復が生じます。とくに計算後に計算過程を確認する際に視線の往復で時間をロスするので、確認の際は、手元のメモ用紙を画面のすぐ下に持っていき視線の往復に使う時間を節約することをお勧めいたします。私は当初時間のロスに戸惑っていましたが、途中からこの方法を思いつきペースを上げることができました。

④試験用の電卓に慣れる:私は普段、関数電卓(HP12C)を使用しています。スマホの電卓を使用されている方も多いと思います。ただ試験で使える電卓は、次節で紹介する制限がついているので、早い段階で普段の使い慣れた電卓ではなく試験用の電卓を使用して慣れることをお勧めします。

統計検定でおすすめの電卓

統計検定で使用可能な電卓は、公式ホームページでは次のようにされています。

【持ち込み可能な電卓】
四則演算(+-×÷)や百分率(%)、平方根(√)の計算ができる普通電卓(一般電卓)または事務用電卓

【持ち込み不可の電卓】
上記の電卓を超える計算機能を持つ金融電卓や関数電卓、プログラム電卓、グラフ電卓、電卓機能を持つ携帯端末

平方根は不可欠です。メモリー機能については持ち込み可能に明示がありませんが不可とされていないことから、持ち込み可能です。実際、ネット上の合格体験記では使用可能と解説する方が多く、また、私も試験会場では、メモリー機能付き電卓を監督官のチェックを経て使用可能でした。メモリー機能は計算問題では重宝します。おすすめの電卓は、平方根とメモリー機能に加えて、次の機能を有する電卓です。

  • 正負の符号の変換ボタン(プラスマイナスボタン)
  • 十分な大きさ
  • 12桁の電卓

短時間で正確な計算をするためには、十分な電卓のサイズ(≒ボタンのサイズ)が必要です。桁数は12桁を使うことはありませんが、計算過程で十分な精度を維持する必要があることから12桁電卓がおすすめです。この条件にあう電卓は多いですが、私は1,000円強で購入できる下記の電卓を使用しました。

今日も最後まで読んで頂きありがとうございました。