公開日:2024.09.04

クロス集計とは?基礎知識からメリット、種類、活用方法、事例まで解説

  • マーケティングリサーチHowto

クロス集計は、アンケート調査等の定量調査において、データを多角的に分析するための基本的かつ重要なアプローチです。
 
アンケート調査の回答データは、1と0、または数字が表記されています。各質問のデータ(数値)を一覧表にまとめることで、「どのような回答をした人がどのくらいいるのか」という全体傾向を把握することができる「単純集計」というものがありますが、このアプローチでは、「男女別」「年代別」などの属性軸での比較はできません。
「クロス集計」を実施することで、属性軸での比較ができるようになるため、調査結果の深い洞察を可能にします。
 
本記事では、そんな『クロス集計』について、基礎知識からメリット、種類、活用方法、事例までを解説していきます。
 
【定量編】リサーチ業務ラインナップ 無料ダウンロードはこちら>
「アスマークのアンケートデータ集計・分析サービス」はこちら>
 
 

クロス集計の基礎知識

クロス集計とは何か?

設問に対して、性別・年代等の違いによって結果に差がないかを比較し、分析するために実施する集計方法です。クロス集計をするためには、どのような視点で設問を分析したいかを決める必要があります。その視点のことを「集計軸」、あるいは「分析軸」、「表側」などと呼びます。
 

Tips
表頭:クロス集計表などの表で、上側にある項目を呼びます
表側:クロス集計表などの表で、左側にある項目を呼びます

 

単純集計との違い

単純集計とクロス集計の大きな違いは、実施の目的(集計で出てくる数値の何を見たいか)です。
 
図1が単純集計、図2がクロス集計です。単純集計は、定量データを一覧表にまとめることで、”どんな回答をした人がどのくらいいるのか”を視覚的に分かるようにする集計方法です。クロス集計の赤枠の箇所は、単純集計の結果と同じです。単純集計の数値と同じなのであれば、クロス集計のみ作成すればよいのではないかと思われるかもしれません。ですが、単純集計はクロス集計とは異なり、情報が少ないため、回答者全体の傾向を把握することに適しています。つまり、単純集計は各設問における回答者全体の傾向を知るために実施し、クロス集計は単純集計で得られた結果に対して、性別や年代等の回答者情報ごとの傾向を知るために実施します。

図1 単純集計
図1 単純集計

 

図2 クロス集計
図2 クロス集計

詳しい「単純集計(GT集計)とクロス集計の違い」はこちら>
 
 

クロス集計の種類と方法

属性クロス集計とは?

性別や年代、居住地等の回答者の属性情報を集計軸として設定して集計することです。図2は、性別、年代別、性年代別と属性情報のみを集計軸としているため、属性クロス集計に該当します。
 

設問間クロス集計の手法

設問と設問をクロス集計することで、単純集計だけでは把握できなかった設問間の関係性を明らかにするために行う手法です。
 
図3のQ2の設問はQ1の設問で選択した紅茶の種類に対して、飲用頻度を回答する単一回答(SA)の設問です。Q2を単純集計したとしても、どの紅茶の種類に対して飲用頻度を回答されているのかは分からない状態です。そこで、図4のようにQ1を集計軸としてQ2とクロス集計をすると、Q1で選んだ紅茶の種類ごとに、回答結果を確認することが可能になります。このように前問の回答結果によって何を対象として回答するのかが変わる設問は、設問間クロス集計をよく用います。

図3 単純集計
図3 単純集計

 

図4 設問間クロス集計
図4 設問間クロス集計

 

多重クロス集計の活用法

多重クロス集計とは、集計軸の項目に対して、掛け合わせる項目数が3つ以上のクロス表(3重クロス表以上)のことです。
 
例えば、図2のように性別の集計軸とSC3の設問でクロス集計を行う場合、性別×SC3で2つの項目が掛け合わされているため、2重クロス集計になります。さらに、図2の性年代の集計軸とSC3でクロス集計を行うと、性別×年代×SC3で3つの項目が掛け合わされるので、3重クロス集計になります。つまり、掛け合わせる項目数が4つだと4重クロス集計、5つだと5重クロス集計となっていく訳です。
 
掛け合わせる項目数を多くすればするほど、よりデータを細かく分析することが可能ですが、条件が細かくなるので、その分、該当する人数は少なくなります。100人に聴取したアンケートで5重クロス集計を実施し、集計軸の各項目に該当する人数が10人未満ばかりになってしまうということも起こりえます。回答者の人数を踏まえた上で、多重クロス集計を実施することが重要です。
 
 

クロス集計のメリットとデメリット

クロス集計のメリット

分析したい視点ごとに、各設問の集計結果を一覧としてまとめて見られることは、非常に便利で圧倒的なメリットです。クロス集計の結果をローデータで確認する場合、ローデータ上でExcelの機能であるフィルターを適用し、集計軸の条件(商品Aの満足度が高い人など)に絞って、回答結果を確認することになります。1、2問の結果を知りたいだけであれば、ローデータ上で必要な数値を確認することもできるでしょう。ですが、複数の集計軸の結果を確認しようと思うと時間がかかってしまい、大変だと思います。クロス集計は、設問ごとに複数の視点から数値を確認できるため、分析時間の短縮につながります。
 

クロス集計のデメリット

お客様から「聴取した設問すべてを集計軸として設定してほしい」とご要望をいただくことがあります。どれも必要ということであれば、すべての設問を集計軸にすることは可能です。ですが、集計軸の項目が何百個もあると、何が必要な情報なのか、どこを見れば良いのかが分からなくなってしまったりと分析に非常に時間がかかります。そのため、アンケートで明らかにしたいこと(調査目的)について分析できる集計軸のみに厳選して集計することをお勧めします。また、クロス集計で分析後、報告書にクロス集計のグラフを掲載することがあると思います。グラフに関しても集計軸の項目が多いと見づらいグラフになってしまうので要注意です。集計表・グラフともに、見やすさを重視して重要な箇所に絞るということが非常に大切です。
 
 

クロス集計の具体例と事例解説

クロス集計を使った分析の実例

オフィス勤務、在宅勤務、どちらも行っており、どちらの状況でも仕事中に間食をしている人を対象に実施した【仕事中の間食に関するアンケート】の事例を紹介します。
 
図5のQ8は、仕事中に間食する際のお供にする飲み物の種類を聴取した複数回答(MA)の設問です。赤枠の選択肢4「コーヒー」の結果を見てみましょう。オフィス勤務時、在宅勤務時、どちらでも間食をしている400人のうち、8割の方が間食時にコーヒーを飲んでおり、年代が上がるにつれてコーヒーを飲む方が増加傾向であることが分かります。よって、仕事中に間食する際の飲み物と年代には相関関係があると言えるでしょう。
 
ここで1つ、分析時の注意点を説明します。クロス表を見るときは、集計軸の各項目の回答者の数を確認してください。図5は、20代の回答者が32人と他の年代に比べて少ないです。20代が32人の場合の1人の回答の重みは、3.1%です(100%÷32人=3.1%)。統計的には少なくとも30人の回答があると良いと言われています。30人以上ではあるため、母集団との大きな誤差はない想定ではありますが、標本調査(サンプル調査)は回答者の数が多ければ多いほど誤差を少なくすることができます。クロス集計から分析する際は、必ず集計軸の各項目の回答者の数を確認し、30人よりも少ない項目がある場合、誤差が大きい可能性があるため、参考値として見る程度に留めるようにしましょう。調査設計の段階で、年代を集計軸とすることを予め決めておくことで、アンケート調査の実施時に年代ごとの回収数を考慮して進めることができます。

図5 クロス集計表(※集計母数:オフィス勤務時、在宅勤務時、どちらでも間食をしている400人)
図5 クロス集計表(※集計母数:オフィス勤務時、在宅勤務時、どちらでも間食をしている400人)

 

クロス集計の活用事例と成功事例

親と同居していない「子育て世帯」と「単身世帯」を対象に実施した【帰省に関するアンケート調査】の結果から事例を紹介します。
 
図6のQ4は、理想的な帰省頻度と比べて実際の帰省頻度が低い方に対して、何がハードルとなっているのかを聴取した設問です。Q4の単純集計の結果から、[お金の余裕がない(38.3%)][時間の余裕がない(35.9%)]が主な帰省のハードルになっていることが分かります。
 
では、帰省にかかる金額がいくらから「お金の余裕がない」と感じるのか?そして、どのような人が「時間の余裕がない」と感じているのか?の2点についてクロス集計で確認してみましょう。

図6 単純集計(※集計母数:「子育て世帯」「単身世帯」&理想的な帰省頻度と比べて実際の帰省頻度が低いと回答した209人)
図6 単純集計(※集計母数:「子育て世帯」「単身世帯」&理想的な帰省頻度と比べて実際の帰省頻度が低いと回答した209人)

 
図7「お金の余裕がない」の項目(赤枠)を見ると、1人当たりの帰省にかかる片道金額が5000円以上から、(つまり、往復で1万円以上かかると)金銭的なハードルを感じ始める方が多くなる傾向がみられます。一方、図7「時間の余裕がない」の項目(青枠)を見ると、帰省にかかる片道時間が短い方が「時間の余裕がない」を選択している方が多い結果でした。「時間の余裕がない」と感じるかどうかは、帰省にかかる時間の長さではなく、心の余裕があるかどうかが影響しているのかもしれません。「時間の余裕がない」と感じる要因を探っていくことで、「時間の余裕がない」から帰省頻度が理想よりも減ってしまっている方に対してできるアプローチが見えてくるでしょう。このようにクロス集計は、単純集計で得られた結果を基に、どんな人がなぜその回答をしたのかを考える材料となり、データの深堀に活かすことができます。

図7 クロス集計表(※集計母数:「子育て世帯」「単身世帯」&理想的な帰省頻度と比べて実際の帰省頻度が低いと回答した209人)
図7 クロス集計表(※集計母数:「子育て世帯」「単身世帯」&理想的な帰省頻度と比べて実際の帰省頻度が低いと回答した209人)

 
 

まとめ

クロス集計は、単純集計に比べて、様々な視点からデータ分析をすることに長けています。
 
皆さまがマーケティングリサーチを実施する際には、明らかにしたい課題や検証したい仮説があると思います。クロス集計を行い、データをいろいろな視点・多方向から見ることで回答者のことを深く理解することができますので、課題解決・仮説検証のためにぜひクロス集計を活用してみてください。
 
ネットリサーチ(WEBアンケート)のご相談はこちら>
 

執筆者
小山 茜
株式会社アスマーク 実査部 定量3G 集計チーム
追手門学院大学卒業、社会心理学修士。 2016年新卒入社。定量調査のアンケート画面作成・データチェックを経験後、2019年より現職に至る。現在は定量調査・定性調査の集計を担当。これまで1000件以上の集計業務に携わる。実査の経験を生かした後輩育成、また社内への集計に関するアドバイスや提案活動を行っている。
監修:アスマーク マーケティングコミュニケーションG

アスマークの編集ポリシー
 
 

アスマークのアンケートデータ集計・分析サービス

アスマークのアンケートデータ集計・分析サービス

年間1,000件以上の集計業務実績を持つアスマークが、アンケートの集計~入力・分析までをワンストップで対応します。
レポート作成業務は年間450件以上。専門統計調査士、統計士などの有資格者によるプロフェッショナル集団が、調査データからみえるサマリーや結論までご希望通りのアウトプットを実現します。

● 実施したアンケートの活用方法が分からない
● データ入力・集計・レポート作成を一括で依頼したい…
● 紙アンケートを実施したがデータ入力に時間がかかる…

このような方へお勧めのサービスです。

> 詳しく見る


アンケートにおけるクロス集計のやり方(エクセル)

アンケートにおけるクロス集計のやり方(エクセル)

アンケートを実施した後、データの活用方法について困ったことはありませんか?
自分で集計をしようとインターネットで検索して調べたことがある方も多いと思います。
「データをまとめる」といっても様々な方法があります。まとめ方によってデータに隠された可能性をどこまで引き出せるかが変わってきます。
本稿では、単純集計(GT集計)からは読み取れなかった、質問と質問の関係性を知りたい場合に手軽に結果を見ることができるエクセルの『ピボットテーブル』という機能を使ってクロス集計をする方法を解説します。

> 詳しく見る