市場調査・マーケティングリサーチ会社のアスマーク

公開日:2020.03.04

コレスポンデンス分析

  • 知識

分析担当者でなくても、日々データと向き合う仕事をされている人は、「コレポン」というワードを一度は耳にした経験があるのではないでしょうか。「コレポン」は多変量解析という分析手法の一つで、正式には「コレスポンデンス分析」といいます。日本では対応分析とも呼ばれ、主にクロス集計表を用いて行側の要素(表側)と列側の要素(表頭)間の関係性を視覚的に把握するための解析手法です。
自社と競合ブランドを比較して、イメージのポジショニングを把握するために使われることが多く、分析結果は散布図で表示され、各要素のカテゴリーの位置関係が近いほど類似していることを示しています。

■メリット
コレスポンデンス分析のメリットは、視覚的にカテゴリー間の関係を把握できることです。クロス集計表はカテゴリー数が増えれば増えるほど、数表から結果を読み解くことが難しくなるため、直感的に傾向を確認するのに有効な手法と言えます。
また、集計前のローデータが手元になくても、クロス表があれば分析が可能なため、インターネット上に公開されているデータを利用することもできます。

■デメリット
コレスポンデンス分析のデメリットは、分析結果からサンプルサイズを把握できないことや、クロス表の回答数や割合の大きさが点の位置関係と一致するとは限らず、データの解釈を間違う可能性があることです。
例えば以下のような複数回答(MA)のクロス表の場合、ブランドAは他のブランドと比較して「話題性がある」の回答数が多く、%表で見ても割合が最も高いため、散布図では「話題性がある」の近くに表示されそうですが、必ずしもブランドAが最も近くなるとは限りません。


分析結果を見ると、ブランドEの方が「話題性がある」の近くに表されているのがわかります。
分析結果とクロス表の解釈は同じといえますが、コレスポンデンス分析は2つの要素間の相関が最大となるようなカテゴリーのスコアを算出する方法であり、散布図には回答数の大小やサンプルサイズが反映されないため、データを読み解く際は注意をする必要があります。
※上記はデータの一例です。

コレスポンデンス分析は、身近なExcelには残念ながら標準搭載されていない機能ですが、Excel統計などアドインソフトを追加することでExcelでも使用できるようになります。その他にも「SPSS」「Python」「R」「JMP」などの統計ソフトを使用して分析することが可能です。具体例を通して分析の流れをお伝えします。

➀分析の目的を明確化する

コレスポンデンス分析の目的は、クロス集計の表頭と表側の2項目間におけるカテゴリーの類似性を、視覚的に把握することです。
マーケティングの分野では、主にブランドや製品のポジショニングマップを作成するために利用され、自社製品と他社製品を比較して、消費者にどのように捉えられているのかなどを把握します。その他に、ターゲット層がどのような特徴やニーズを持っているのか実態を把握するためなどにも使用されます。

➁データを集める

分析にはアンケート結果などのクロス表から、%表の数値でなくn表の数値を使用します。コレスポンデンス分析は通常単回答の質問で得られたデータに対して分析を行いますが、複数回答のデータに対しても分析は可能です。
今回は弊社の自主調査「電子たばこに関するアンケート調査」を使用して、性年代別について傾向を確認します。以下がアンケートから得られたクロス表です。

喫煙者に対して今後のたばこの関与度を単回答で聞いている質問ですが、なんとなく男性も女性も「紙巻メインで現状維持」と「紙巻メインに減らしたい」が多そうであることはわかります。しかし、このままでは全体の傾向が把握しにくいため、コレスポンデンス分析を行います。

③データを整理する(解釈する)

先ほどのクロス表でコレスポンデンス分析を行うと、以下のような散布図が表示されます。

散布図から年代の高い層は禁煙志向であり、20代、30代は依然として喫煙の継続を考えている様子が見て取れます。また、男女20代、30代はいずれも電子たばこ・加熱式たばことの関係がやや強く、たばこの量を減らしたいとはあまり思っていないものの、健康に配慮した商品への興味関心が高い可能性があります。
このとき男性40代と、完全に禁煙したいとの距離には注意をしてください。散布図の中央に集約されたものは、特性があるとは言えないので、この付近で距離が近いから特徴があるという解釈をするのは危険です。中央から離れていて、カテゴリー間の距離が近いほど特徴があると言えます。
このようにコレスポンデンス分析は視覚的にカテゴリー間の関係の強さを表すことで、感覚的にデータの傾向を掴むことができます。

コレスポンデンス分析の結果を解釈する際には、いくつか注意点があります。

1.散布図の縦軸と横軸には特に意味がないため、結果をわかりやすく伝えるためには、分析担当者が軸の意味付けをしてあげる必要があります。ただし、軸の意味によっては結果の捉え方にバイアスがかかるため、慎重な判断が求められます。

2.縦軸と横軸の目盛が違うと距離を見誤り、誤認をする可能性があるため、目盛を合わせることでカテゴリー間の距離を正しく把握することができます。しかし、軸の相関係数が小さく点が中心に寄っている場合に、目盛を調整して(拡大して)類似性があるように解釈するのは危険です。

3.サンプルサイズは分析結果に反映されません。サンプル数が少ない場合であっても分析自体は可能であるため、元のデータが分析可能なデータであるのか確認をする必要があります。

4.分析結果には各軸の単相関係数が表示されます。この単相関係数が低い場合は点が中心に寄って表示され、大きいと点のバラつきが大きくなります。単相関係数が低い場合には、距離による解釈がしにくくなり、類似性があると捉えることが難しいため、0.1を下回る場合には注意が必要です。

コレスポンデンス分析は、データ対象が表形式であれば基本的に分析可能です。ベースとなるデータの制約に捕らわれず、ブランドやメーカー・製品やサービスと、イメージや印象など設問項目にあたる要素の相関をビジュアライゼーションできるフレキシブルな多変量解析の手法となります。クロス集計表の読み込みが難航する場合やアウトプットの視覚化が必要な場合など、適宜使い分けて調査結果をより有効に活かしましょう。