ISTQB AI Tester認定のChapter 3:Machine Learningでは、
「どの機械学習(ML)の手法を選ぶべきか」という非常に重要なテーマが扱われます。
本記事では、3.3 Selecting a Form of Machine Learning の内容をもとに、
-
機械学習の学習形態の選び方
-
データや出力の違いによる判断基準
-
試験でも実務でも使える具体例
を交えながら、わかりやすく解説します。
機械学習の3つの基本的な学習形態
まず前提として、機械学習には次の3つの学習形態があります。
① 教師あり学習(Supervised Learning)
-
入力データと**正解ラベル(出力)**がセットで与えられる
-
主な用途
-
分類(Classification)
-
回帰(Regression)
-
② 教師なし学習(Unsupervised Learning)
-
正解ラベルが存在しない
-
データの構造や特徴を自動的に発見する
-
主な用途
-
クラスタリング(Clustering)
-
アソシエーション(Association)
-
③ 強化学習(Reinforcement Learning)
-
環境との相互作用を通じて学習
-
状態・行動・報酬を繰り返しながら最適化
-
**知的エージェント(Intelligent Agent)**として振る舞う
MLの学習形態を選ぶ際の基本ガイドライン
では、実際にどの学習形態を選べばよいのか。
ISTQB AI Testerでは、以下の観点が重要だと説明されています。
① 十分な学習データ・テストデータがあるか
最も重要なのは データの有無と品質 です。
-
学習用データ(Training Data)
-
テスト用データ(Test Data)
-
MLモデルが理解できる適切な形式
これらが揃っていなければ、どんなML手法でもうまく機能しません。
② 正解ラベル(出力データ)が存在するか?
ここが教師あり/教師なしを分ける最大のポイントです。
✔ 正解ラベルがある場合 → 教師あり学習
例:
-
「このメールはスパムか?」(Yes / No)
-
「住宅価格はいくらか?」(数値)
③ 出力の種類で分類か回帰かを判断する
教師あり学習の場合、出力の性質によってさらに分かれます。
分類(Classification)
-
出力が 離散的・カテゴリ型
-
例:
-
合否判定(合格/不合格)
-
画像が「犬 or 猫」
-
回帰(Regression)
-
出力が 連続的な数値
-
例:
-
売上予測
-
気温予測
-
車両の停止距離予測
-
④ 正解ラベルがない場合 → 教師なし学習
データに出力ラベルがない場合は、教師なし学習を検討します。
クラスタリング(Clustering)
-
似たデータをグループ化
-
例:
-
顧客の購買傾向によるセグメント分け
-
センサーデータの異常検知
-
アソシエーション(Association)
-
同時に起こりやすい関係を発見
-
例:
-
「ビールを買う人はスナックも買う」
-
ECサイトのレコメンド機能
-
⑤ 環境との相互作用があるか? → 強化学習
次のような条件がある場合、強化学習が適しています。
-
環境が存在する
-
行動の結果として報酬が得られる
-
状態が変化し続ける
例:
-
自動運転
-
ゲームAI
-
ロボット制御
-
動的な在庫・価格最適化
⑥ 複数の状態と意思決定が連続するか?
-
状態(State)が複数存在
-
各状態で意思決定が必要
このような問題設定では、強化学習が最適です。
まとめ|MLの学習形態は「データ」と「出力」で決まる
ポイントを整理すると、次のようになります。
|
観点 |
適した学習形態 |
|---|---|
|
正解ラベルあり |
教師あり学習 |
|
出力がカテゴリ |
分類 |
|
出力が数値 |
回帰 |
|
正解ラベルなし |
教師なし学習 |
|
グループ化したい |
クラスタリング |
|
関連性を見つけたい |
アソシエーション |
|
環境と相互作用 |
強化学習 |
「どんなデータがあり、何を出力したいのか」
これを明確にすれば、適切なML手法は自然と見えてきます。
ISTQB AI Tester試験でも、この判断ロジックそのものが問われるため、
暗記ではなく「理由付きで説明できる理解」が重要です。

コメント