ISTQB AI Tester認定の**Chapter 4(MLとデータ)**は、
「理論を理解しているか」だけでなく、
実務で起こりがちな課題を正しく認識できているかが問われる章です。
この記事では、公式チュートリアル動画で紹介されているサンプル問題3問を使って、
-
試験で何が問われるのか
-
なぜその選択肢が正解/不正解なのか
-
実務ではどういう場面に対応する知識なのか
を、順番に解説します。
問題1:MLソリューション開発・テスト時に起こりやすい課題はどれか?
問題文
次のうち、機械学習(ML)ソリューションの開発およびテストの過程で、起こりやすい課題の例はどれか?
選択肢
A. データ匿名化(Anonymization)には、さまざまなMLアルゴリズムの専門知識が必要である
B. 使用されるデータが非構造化データである
C. 予算の大部分がデータ準備に費やされる
D. モデル学習時にデータパイプラインのスケーラビリティが課題となる
正解
C. 予算の大部分がデータ準備に費やされる
解説
ML開発では、
-
データ収集
-
データクレンジング
-
前処理・整形
-
ラベリング
といったデータ準備工程に、全体工数の40〜50%以上がかかることが一般的です。
結果として、時間・コストの多くがデータ準備に集中することが大きな課題になります。
他の選択肢が誤りな理由
-
A:データ匿名化はセキュリティやプライバシーの問題であり、MLアルゴリズム知識は必須ではない
-
B:画像・音声・自然言語などの非構造化データは、MLでは一般的
-
D:スケーラビリティは主に「運用・デプロイ時」の課題
問題2:特定のアルゴリズムだけ学習できない理由は?
問題文
あるデータサイエンティストが、「同じ学習データを使っているのに、特定のアルゴリズムではモデルを学習できない」と訴えている。最も可能性が高い原因はどれか?
選択肢
A. データが誤っている
B. データが欠損している
C. データのラベル付けが不適切である
D. データ量が不足している
正解
D. データ量が不足している
解説
ポイントは、
👉 「他のアルゴリズムでは学習できている」 という点です。
-
データが誤っている/欠損している/ラベルが不適切
→ どのアルゴリズムでも学習に失敗する可能性が高い
一方で、
-
一部のアルゴリズムだけ失敗する
→ そのアルゴリズムが要求するデータ量が足りない可能性が高い
たとえば、
-
単純なモデル:少量データでも学習可能
-
深層学習モデル:大量データが必要
という違いが、試験でも実務でも重要です。
問題3:画像を回転させてデータを増やす手法は何か?
問題文
MLエンジニアが、学習データ不足を補うために、既存のラベル付き画像を回転させて追加の学習データを作成している。このとき使われているアプローチはどれか?
選択肢
A. クラウドソーシング
B. データ拡張(Augmentation)
C. AIベースのラベリング
D. アウトソーシング
正解
B. データ拡張(Augmentation)
解説
**データ拡張(Data Augmentation)**とは、
-
回転
-
反転
-
明るさ変更
-
ノイズ付加
などを行い、既存データを変形して学習データを増やす手法です。
他の選択肢との違い
-
A クラウドソーシング:多数の人にラベル付けを依頼する方法
-
C AIベースのラベリング:AIが自動でラベルを付与する方法
-
D アウトソーシング:作業自体を外部委託すること
今回の例では、MLエンジニア自身が既存データを加工しているため、
明確に「データ拡張」が正解になります。
Chapter 4 サンプル問題から分かる試験対策ポイント
-
理論よりも「実務での起こりやすさ」が問われる
-
「一部だけ動かない」「なぜこの選択肢は違うのか」を論理的に考える
-
データ準備・データ量・ラベリング・拡張は超重要テーマ
👉 Chapter 4は、現場経験がある人ほど有利な章でもあります。
まとめ
ISTQB AI Tester Chapter 4のサンプル問題は、
-
データ準備のコスト
-
アルゴリズムとデータ量の関係
-
データ拡張の正しい理解
といった、AIテストに必須の実践知識を確認する内容になっています。
単なる暗記ではなく、
「なぜその答えになるのか」を説明できるレベルまで理解しておくと、
本試験でも確実に得点できます。

コメント