応用情報技術者試験 令和6年秋 午前問2 解説付き過去問
問題
AIにおける教師あり学習での交差検証に関する記述はどれか。
正解
解説
- 交差検証の概要
交差検証は、学習モデルの汎化性能を評価するために使用される手法です。
学習モデルの汎化性能とは、未知のデータに対する予測能力を指し、学習データに適合しすぎた過学習を防ぐことが重要です。
交差検証は、学習データを効率的に利用しながらモデルの精度を評価します。
- 交差検証の具体的な方法
データを複数のグループ(フォールド)に分割し、以下の手順を繰り返します。
- 各フォールドを一度ずつ評価データとして使用します。
- 残りのフォールドを学習データとしてモデルを訓練します。
- 評価データでモデルの性能を測定します。
- すべてのフォールドについて評価結果を平均化し、最終的な評価指標とします。
- 交差検証の利点
- データを効率的に活用できるため、小規模なデータセットにも適しています。
- モデルの汎化性能を高い精度で評価可能です。
- 評価結果に偏りが出にくく、モデルの性能を客観的に判断できます。
- ハイパーパラメータの調整やモデル選択の際に有効です。
- 交差検証の注意点
- 計算コストが高くなる場合があります。特にデータが大規模な場合や、複雑なモデルを使用する場合は注意が必要です。
- データの分割方法によって結果が異なる場合があるため、適切な分割数(例えば5分割や10分割)が推奨されます。
- データの特性や分布を考慮し、不均衡データの場合は分割に注意が必要です。
- 今回の正しい記述
問題文に示された「データを複数のグループに分割し、一部を学習に、残りを評価に使い、順にグループを入れ替えて学習と評価を繰り返す」という記述は、交差検証の一般的な手法を的確に表しています。