応用情報技術者試験 令和5年春 午前問3 解説付き過去問
問題
AIにおける機械学習で、2クラス分類モデルの評価方法として用いられるROC曲線の説明として、適切なものはどれか。
正解
解説
この問題は、機械学習における2クラス分類モデルの評価指標として使われるROC曲線に関する正しい理解を問うものです。以下の手順で解説します。
- ROC曲線とは何か
ROC曲線(Receiver Operating Characteristic Curve)は、分類モデルの性能を視覚的に評価するために用いられるグラフです。
特に、モデルが出力するスコアや確信度に対して、分類の閾値を変化させたときの挙動を確認するために使用されます。 - ROC曲線の軸
ROC曲線では、横軸に「偽陽性率(False Positive Rate:FPR)」、縦軸に「真陽性率(True Positive Rate:TPR)」を取ります。
これらは以下のように定義されます。 - 真陽性率(TPR)= 真陽性の数真陽性 + 偽陰性
- 偽陽性率(FPR)= 偽陽性の数偽陽性 + 真陰性
- ROC曲線の特徴と使い方
ROC曲線の理想的な形は、左上に近いカーブを描く形です。
モデルの性能を一つの数値で表す指標として、「AUC(Area Under the Curve)」があり、これはROC曲線の下の面積を表します。
AUCが1に近いほど、モデルの性能が高いことを意味します。 - 他の指標との違い
適合率(Precision)や正解率(Accuracy)などの指標は、ROC曲線では扱いません。
適合率を使うグラフとしては、適合率と再現率の関係を表す「PR曲線(Precision-Recall曲線)」があります。
ROC曲線は、分類のしきい値を変化させながら、FPRとTPRをプロットして得られる曲線です。
したがって、ROC曲線は「真陽性率と偽陽性率の関係を示す曲線」であることが正しい説明です。