G検定の概要と対策

2022年7月2日の試験でG検定に合格いたしました。合格通知(メール)、成績、合格証は次の通りです。私は金融工学の大学院で機械学習も学びましたので、十分な前提知識はあったと思いますが、それでも試験当日はかなり苦労しました(結果的に超えましたが、正答率9割を超えてる感触はとてもなかった)。簡単な試験ではないと思います。本稿では、G検定の受験を検討されている方向けに、試験の概要、日程、対策、受けるメリット等についてご紹介いたします。


G検定 2022#2合格通知


G検定 2022#2合格証書

G検定 2022#2合格証書

日本ディープラーニング協会(JLDA)とは

2017年に設立された民間の一般社団法人で、NDIVIA、BrainPad、モルフォなどのAIに関わる多数の正会員企業と、大学教授等で構成される有識者会員が運営しています。理事長は東京大学大学院工学系研究科の松尾豊教授です。設立目的は次の通りで、人材育成の一環として、ジェネラリスト向けのG検定とエンジニア向けのE検定を実施しています。

本協会は、ディープラーニングを中心とする技術による日本の産業競争力の向上を目指します。

そのため、ディープラーニングを事業の核とする企業および有識者が中心となって、産業活用促進、人材育成、公的機関や産業への提言、国際連携、社会との対話 など、産業の健全な発展のために必要な活動を行っていきます。

賛助会員

運営を担う正会員とは別に、「本協会の目的に賛同し、ディープラーニングの社会実装および人材採用に意欲的な企業や団体」として賛助会員がございます。Bay Current, ABeam, Google, Microsoftなど外資系企業も並んでいます。日本企業は広報目的が多いかもしれませんが、GoogleとMicrosoftがディープラーニングで先進的な取り組みをしていることは周知の事実(広報不要)ですので、2社は純粋に本資格を後押し・推奨しているものと推察されます。


ディープラーニング協会 - G検定の賛助会員

G検定の概要

試験の概要は次の表の通りです。


名称ディープラーニングG検定(ジェネラリスト検定)
試験日毎年3月・7月・11月の3回(土曜日)
2022年11月の受験は、試験的に金曜日と土曜日の2日開催(いずれか)
申込期間各試験日の約2ヶ月前から1週間前
受験方式自宅のPCでオンライン受験
受験費用一般13,200円 学生5,500円
再受験:2年以内の方は半額(一般:6,600円、学生:2,750円)
受験資格なし
試験形式4択問題が191問
試験時間13:00 – 15:00の120分又は16:00 – 18:00の120分(2022#3は2回実施)
合格ライン未公表も、6-7割とされる
合格率
2022#2 試験実績
受検者数:6,398名
合格者数:3,917名
合格率 :61.2%
合格発表試験の約2週間後(2022#2は、7月2日受験で7月15日にメールで合格通知)
合格証合格証のpdfは、試験の1ヶ月後にメールで届きます。
デジタル証明書のオープンバッジも別途、同時期にメールで届きます。

受験費用は類似の試験と比較するとやや高めですが、次に紹介する合格後のメリットが多いので、チャレンジの価値は十分あると思います。年に3回チャンスがあるのと、自宅でオンライン受験できる点も大きな特徴です。自宅受験であるため後述カンペも使える試験ですが、120分で191問解く(見直しの時間10分残すと1問当たり35秒)必要があるので、基本的にはその場で自力で解かないと時間が足りなくなります。

次回試験日、申込期間 GENERAL 2022#3

2022年11月試験は、2日間の開催です(いずれかを選択)。受験の機会を増やすことが目的だそうです。


試験日2022年11月4日(金)16:00開始
2022年11月5日(土)13:00開始
申込期間2022年8月1日(月)13:00 ~2022年10月27日(木)23:59
オンライン説明会2022年8月22日(月)18:00 – 18:30 URL:https://g202203.peatix.com/
受験申込URLhttps://www.jdla-exam.org/d/

勉強時間

一般に、勉強時間は30時間程度が目安とされます。ただデータサイエンティスト(DS)検定と同様、この試験も現役のデータサイエンティスト、情報系の学生、または私のようなその他エンジニアの受験生が多いと思われ(前提知識がある)、それ以外の属性の方が試験を受ける場合は+10時間程度の勉強時間を確保した方がいいかもしれません。私はかなりの前提知識がありましたので勉強時間は5-10時間でした(準備期間は1週間)。

次回の試験日と申込期間

次回、2022年3回目の試験日は2022年11月5日(土)です。申込期間は、9月中下旬から10月28日頃までだと思います。情報がアップデートされ次第、こちらの記事も更新いたします。9月中下旬からの学習開始で十分だと思います。

G検定を取得するメリット

数学とPythonを学ばないG検定をとっても機械学習モデルもディープラーニングも組めるようになれず、ディープラーニングに関する一般教養が身に付くだけです。そうすると取得のメリットはなんでしょうか。一般教養も積極的に捉えれば大きなメリットですが、最大のメリットはコミュニティーに参加できることです。G検定の合格者には、合格の1か月後に開催される合格祝賀会(平日の夕方)に呼ばれて情報交換やネットワーク拡大ができる他、Community of Deep Learning Evangelists(CDLE)というこれまでのG検定/E検定合格者の集まるコミュニティーに参加することができます。コミュニティーはSlackで運営され、合格するとSlackへの招待が届きます。私もコミュニティー参加のために取得いたしました。コミュニティー参加の案内は、本稿の冒頭にその一部を掲載した合格通知メールの下段に記載されています(本稿では転載せず)。

カリキュラムと点数配分

点数配分は公表されていませんが、公式テキストの問題数の配分は下記の通りです(本文ページ数でも勘案)。セクション5と6のディープラーニングの配点が高いには当然として、セクション7(法令等)の配点が厚いのも特徴です。セクション7の配分は17%ですので、5-6問に1問の割合で出題されます。私が受けたときの感触とも一致します。


セクション配分
1.人口知能(AIとは)10%
2.人口知能をめぐる動向16%
3.人口知能分野の問題9%
4.機械学習の具体的手法8%
5.ディープラーニングの概要14%
6.ディープラーニングの手法26%
7.ディープラーニングの社会実装に向けて – 法律・倫理・社会問題17%

計算問題(数理・統計)は公式テキストに記載がないので、上の表には含めていない外数ですが、数問出ます(配分割合は1.5%)。私が受験したときは191問中、中央値、平均値、分散、標準偏差の問題が1問、非常に簡単なニューラルネット(加法と乗算だけ)が1問、計算のいらない四分位範囲に関する問題が1問の計3問出題されました。1つ目の中央値等の算出の問題については、実際の計算は35秒では無理なので、データの分布を見て回答しました。詳細については後述します。

G検定の参考書、問題集

1つ目は公式テキストです。日本ディープラーニング協会が監修しています。400pの本書で試験範囲の90%強をカバーできます。カバーできる90%強の範囲については、松尾先生の監修のもと、大学の教授、大学の研究員、AIエンジニア、他実務家計13人が執筆を分担し、非常にわかりやすく詳細に書かれています。また、後述カンペでも公式テキストは活用可能な他、試験には直接関係でないも、Appendixでは実社会でのディープラーニングの具体的な適用事例が約40ページに亘ってか紹介されています。必携と言っていいと思います。

公式テキストのデメリット

公式テキストでカバーできない分野は2つあります。一つは目は数理・統計です。公式テキストには数理・統計の章すらありません(対策は後述します)。二つ目は、法律・倫理・社会問題です。公式テキストにも記載はありますが内容が薄く、テスト対策としては不十分です。本書にはこれらデメリットを補ってあまりあるメリットがあるのは前述の通りですが、足りない部分は、問題集で補う必要があります。

G検定の問題集は2択です。通称黒本と呼ばれる黒い本と、赤本又は茶本と呼ばれる、表紙の帯が茶色の本の2択です。G検定のシラバスは2021年4月に改訂があり、「AIプロジェクトの計画・データ収集、法律/契約分野の出題」が増えました(出典:協会からのリリース)。公式テキストも改訂されたのですが、改定後も法律/契約の内容が不足しているには前述の通りです。よって、問題集は2021年4月以降に改訂されたものを選ぶことが重要です。赤本は2022年8月下旬に改訂され第二版となり、黒本も2021年9月に改訂されましたので、2022年8月現在、いずれかの問題集であれば問題ございません。

赤本と黒本の比較

書店で手にとっていただくか、あるいは下記のAmazonの試し読みでもわかるのですが、黒本よりも赤本の方が黒と青の2色で図や表も多く、明らかに読みやすいです。対する黒本は地味な一色刷りで、一見すると、赤本の方が黒本より優れているように見えますが、黒本もそれぞれの問題に対して赤本と同等の充実した解説がついています。両者の解説はほぼ同じボリュームですので、見やすさを優先するなら赤本、少しでも値段を抑えたなら黒本ということだと思います(赤本第2版は2,728円、黒本は2,310円で、黒本の方が約400円安い)。なお、私は数理・統計がもともと得意だったので、G検定は問題集を使わずに公式テキストだけで合格しましたが、同じ時期に合格したDS検定ではDS検定の黒本を重宝しました。

黒本:

赤本:
2022年9-10月頃までは、書店・Amazon・楽天のどこでも、第1版と第2版が両方並んでいると思いますので、誤って第1版を買わないように注意してください。

オンライン模擬試験

オンライン(無料)の模擬試験もございます。私が利用したのはStudy AIです。無料のβ版ですので、2021.4以降の新しいカリキュラムに対応していないような印象を持ちました。無理してオンライン模擬試験をやらず、黒本をしっかりやった方がいいかもしれません。

カンペ

G検定では皆さんカンペを用意されています。私は1946年(エニアック)から2045年(シンギュラリティ)までの年表だけを、A4見開きでぎっしりで用意いたしました。年表の各イベントには公式テキストのページ数も記載しました。範囲が広すぎるので分野別のカンペは使いにくいと思います(公式テキストの巻末索引の方がよっぽど使える)。また、G検定ではなくGoogle検定と揶揄されていますが、1問当たり35秒しか時間がありませんので、Google検索は全く使えません。

G検定の試験範囲別の傾向と対策

1.人口知能(AIとは)

配点10%で、具体的には出題される内容は下記の通りです。このセクションはさほど難しくありません。公式テキストを読めば十分に対応できますので正答率100%を目指して得点源にしましょう。

人工知能とは何か、人工知能のおおまかな分類、AI 効果、人工知能とロボットの違い、世界初の汎用コンピュータ、ダートマス会議、人工知能研究のブームと冬の時代

2.人口知能をめぐる動向

16%の配点で、出題される内容は下記の通りです。このセクションは下記項目の大部分(9割)が出題されました。難問はなかったですが、ここに記載の内容はほぼ全部出た印象なので漏れなく学ぶことが重要です。とくに探索木、モンテカルロ法、オントロジーは公式テキストをじっくり読み、かつ問題集に取り組むことをお勧めいたします。

探索木、ハノイの塔、ロボットの行動計画、ボードゲーム、モンテカルロ法、人工無脳、知識ベースの構築とエキスパートシステム、知識獲得のボトルネック(エキスパートシステムの限界)、意味ネットワーク、オントロジー、概念間の関係 (is-a と part-of の関係)、オントロジーの構築、ワトソン、東ロボくん、データの増加と機械学習、機械学習と統計的自然言語処理、ニューラルネットワーク、ディープラーニング

3.人口知能分野の問題

配点9%です。次のような内容が出題されます。割合は9%ですが、全部で191問あるのでここから17問出題されます。一方でこのセクションのテーマ(学習範囲)は9つしかありませんので、全て出題されます。私が受けたときも全部出ました。対策は、公式テキストで十分です。このセクションは100%の正答率を目指して得点源にしましょう。

トイ・プロブレム、フレーム問題、チューリングテスト、強い AI と弱いAI、シンボルグラウンディング問題、身体性、知識獲得のボトルネック、特徴量設計、シンギュラリティ

4.機械学習の具体的手法

配点はたったの8%で範囲が広いですが、全7章では最も実務的なセクションではないしょうか。公式テキストにも記載の通り、多くの現場の課題はディープラーニングを使わずとも、線形回帰、ロジスティクス会期、SVM、k-means法などの機械学習で解決します。実装もずっと簡単です。試験対策上も、セクション4は配点の多いセクション5と6の基礎になります(基礎と応用の関係にある)。勉強法は公式テキストを読み込むこんだ後の黒本での演習をお勧めいたします。このセクションも100%の正答率を目指して得点源にするのが理想です。私もこのセクションは正答率100%でした(本稿の冒頭に転記した成績書を参照)。

線形回帰、ロジスティック回帰、ランダムフォレスト、ブースティング、サポートベクターマシン (SVM)、ニューラルネットワーク、自己回帰モデル (AR)、k-means 法、ウォード法、主成分分析 (PCA)、協調フィルタリング、トピックモデル、バンディットアルゴリズム、マルコフ決定過程モデル、価値関数、方策勾配、正解率・適合率・再現率・F 値、ROC 曲線と AUC、モデルの解釈、モデルの選択と情報量

5.ディープラーニングの概要

配点14%です。ディープラーニングのセクションですが、暗記の多いセクション6に比べると基礎的でかつ理論的な内容なので得点しやすいと思います。tanh以下の活性化関数、勾配降下法、ドロップアウト他テクニックはとくに抑えたいです。こちらもセクション4同様に公式テキストを読み込んだ後の問題演習をお勧めいたします。

単純パーセプトロン、多層パーセプトロン、ディープラーニングとは、勾配消失問題、信用割当問題、事前学習、オートエンコーダ、積層オートエンコーダ、ファインチューニング、深層信念ネットワーク、CPU と GPU、GPGPU、ディープラーニングのデータ量、tanh 関数、ReLU 関数、シグモイド関数、ソフトマックス関数、勾配降下法、勾配降下法の問題と改善、ドロップアウト、早期終了、データの正規化・重みの初期化、バッチ正規化

6.ディープラーニングの手法

最大のウェイト、26%を占めます。広範囲でよく似たモデル名の暗記を求められます(私はやや苦痛でした)。暗記が多いので時間をかければ得点できますが、短期合格を目指す場合は、ここでは負けない戦い(7割程の正解率)を目指すのがいいと思います。また、カンペが最も力を発揮するセクションのような気がいたします。その他、私が受けた回が特別だったと思いますが公式テキストでは数ページしか記載のない音声処理の問題が5問ほど出ました(いずれも公式テキストで回答可)。

CNN の基本形、畳み込み層、プーリング層、全結合層、データ拡張、CNN の発展形、転移学習とファインチューニング、生成モデルの考え方、変分オートエンコーダ (VAE)、敵対的生成ネットワー(GAN)、物体識別タスク、物体検出タスク、セグメンテーションタスク、姿勢推定タスク、マルチタスク学習、データの扱い方、リカレントニューラルネットワーク (RNN)、Transformer、自然言語処理における Pre-trained Models、深層強化学習の基本的な手法と発展、深層強化学習とゲーム AI、実システム制御への応用、ディープラーニングのモデルの解釈性問題、Grad-CAM、エッジ AI、モデル圧縮の手法

7.ディープラーニングの社会実装に向けて、及び、法律・倫理・社会問題

17%のウェイトを占めます。私はこのセクションで最も苦戦しました。公式テキストだけでは50-60%ほどしか得点できない印象です。個人情報保護法に関する問題がとくにやっかいです。公式テキストを読んだ後、黒本での十分な補完をお勧めいたします。法律や制度が得意な方はこのセクションは得点源になると思いますが、それ以外の方はここでも負けない戦い(7割の正解率)を目指すのがいいと思います。

AI のビジネス活用と法・倫理、AI プロジェクト進行の全体像、AI プロジェクトの進め方、AI を運営すべきかの検討、AI を運用した場合のプロセスの再設計、AI システムの提供方法、開発計画の策定、プロジェクト体制の構築、データの収集方法および利用条件の確認、法令に基づくデータ利用条件、学習可能なデータの収集、データセットの偏りによる注意、外部の役割と責任を明確にした連携、データの加工、プライバシーの配慮、開発・学習環境の準備、アルゴリズムの設計・調整、アセスメントによる次フェーズ以降の実施の可否検討

8.数理・統計

公式テキストでは解説がありませんが、数理統計もシラバス上は学習範囲で「統計検定3級程度の基礎的な知識」が出題されます。先ほども書きましたが、私が受験したときは191問中3問出題されました(私は正答率100%)。3問中2問は、高校1年生の数1で学習する「データの分析」と数Aで学習する「場合の数と確率」の基礎的な問題が解ければ確実に得点できるレベルでした。残りの1問は、ニューラルネットを組んだことのある方にとっては5秒で解ける容易な問題ですが、そうでなくてもその場で30秒考えれば十分に正解できると思います。高校数学が得意な方、データサイエンティスト(DS)検定を取得した方、又は、統計検定3級以上を取得された方は対策不要、それ以外の方は前述の黒本の第四章「基礎数学」の問題(または赤本第2版の第三章の基礎数学の部分)をやることをお勧めいたします。数学が不得意で満点を狙う場合は、統計検定3級に準拠したテキスト又は問題集を購入されるのがいいと思います。DS検定の白本でも十分この範囲がカバーされています。DS検定の白本については私のこちらの記事をご覧ください。

試験当日の進め方

試験開始時間は13時とされていますが、12時50分から13時10分までの間の任意のタイミング試験を開始できます。13時10分を過ぎると受験できなくなるので12時50分から試験の画面にアクセスし準備、お手洗い・空調・余計なアプリケーションを落としてメモリを解放するなどPCの調子を整え、13時開始を目指すといいと思います。受験開始画面は3段階になっています。「開始する」> 画面遷移 > 「受験を開始する」> 黒い画面のポップアップ >「試験を開始する」を押してようやく試験が始まります。下記は実際の1段階目の「開始する」ボタンの画面です。12時50分以降に3段階目の「試験を開始する」のボタンを押すと黒いポップアップの中で試験が始まります。下記は1段階目の画面です。ここで「開始する」を押してもまだ始まりません。



下記は2段階目です。ここで「受験を開始する」を押すと、別ウィンドウで黒いポップアップが開きます。



下記が3段階目。ここで「試験を開始する」をクリックするとようやく始まります。以降、この黒いポップアップウインドウの中で191問を回答していきます。


試験当日の時間配分

G検定は問題数が多いので時間切れになったという話をよく聞きます。残り時間と残りの問題数が画面の上部に表示されますので、時間切れににならないよう、ペース配分(マイルストーン)を予め設定することをお勧めします。例えば最後に10分見直しの時間を残したい場合は、30分に50問を少し上回るペースで解く必要があるので、残り90分になった時に残139問、残り60分で残87問、残り30分で残35問を目安にするといいと思います。考える問題やカンペの確認を要する問題は必ずあるので、簡単な問題はなるべく数秒で即答し時間をセーブします。また、各問題には見直しのためにチェックを残す機能がありますので見直したい問題(10分では10問程度が限界)にチェックをしておきましょう。

今日も最後まで読んで頂きありがとうございました。