応用情報技術者試験 令和5年秋 午前問2 解説付き過去問
問題
複数の変数をもつデータに対する分析手法の記述のうち、主成分分析はどれか。
正解
解説
この問題は、「主成分分析」がどのような分析手法であるかを理解しているかを問うものです。主成分分析は、多変量データを扱う代表的な次元削減手法の1つです。以下に詳しく解説します。
- 主成分分析の目的
主成分分析(Principal Component Analysis:PCA)は、複数の変数から構成されるデータにおいて、情報をできるだけ損なわずに、変数の数(次元)を減らすことを目的とする手法です。具体的には、元の複数の変数を線形結合して、新たな変数(=主成分)を作成し、重要な情報を保持しながら次元を圧縮します。
- 新たな変数(主成分)の意味
新たに作成される主成分は、元の変数の分散を最もよく説明できる方向(軸)に沿って構成されます。第1主成分はデータの分散が最大となる軸であり、第2主成分は第1主成分と直交し、かつ次に分散が大きい軸となります。このようにして得られる主成分によって、変数間の相関を利用しながら、情報量を保持したまま次元の削減が可能になります。
- 正しい記述の選択
問題文の選択肢のうち、
「変数を統合した新たな変数を使用して、データがもつ変数の数を減らす方法」
という記述は、主成分分析の特徴を正しく表しています。「変数を統合する」というのは、主成分(元の変数の線形結合)を生成する操作であり、「変数の数を減らす」というのは、次元を削減するという目的に合致しています。