2019.12.05
標本誤差とは?意味や標準誤差との違いと計算方法、データの見方を解説
調査を行う際、調査対象となる母集団全体を調べることは現実的に難しいため、母集団の一部である標本を抽出して調査を行います。しかし、標本から得られた結果は母集団の真……
公開日:2022.08.19
広告費がどれだけ売上に貢献するだろう?
新しく出店しようとする新規店舗の売上高はどのくらいだろう?
このような課題に応えてくれるのが回帰分析です。回帰分析を用いると、広告費と売上との因果関係を明らかにすることができます。あるいは、駅からの距離や乗降者数によって、新規店舗の売上がどのくらいになるか、予測値を求めることができます。
本コラムでは、そんな分析手法「回帰分析」について解説します。
手法を理解し上手く活用することで、事業の更なる成功に繋げていただければ幸いです。
広告効果測定調査の調査票作成のポイント【テンプレート付】 無料ダウンロードはこちら>
回帰分析とは、ある結果に、関連する要因がどのくらい影響を与えているか、その因果関係を関数の形で明らかにする統計手法です。マーケティングでは、施策の将来予測、事業の最適化や効率化に役立てられます。
回帰分析では結果や要因を数値で表します。結果を数値化したものを目的変数といい、要因を数値化したものを説明変数といいます。
1つの説明変数が1つの目的変数を導くとき、それを分析することを単回帰分析といいます。
例えば、九九の習熟度という結果(目的変数)は、口に出して言ってみた回数にかなり大きな影響を受けるので、要素(説明変数)が1つしかないと想定して単回帰分析で分析してもよさそうです。
しかしビジネスで利用する場合には「これでは物足らない」と感じるはずです。なぜならビジネスの現象がたった1つの要因で起きることなどないからです。そこで重回帰分析が重要になります。重回帰分析では、1つの目的変数は複数の説明変数によって導かれると考えます。
ここで数式を使って説明します。
yは目的変数、xは説明変数です。aは切片といい、xの値が0のときのyの値を示します。bは回帰係数で、xの増減がyにどのくらい影響するか(直線の傾き)を示します。
● 単回帰分析の数式
単回帰分析の数式をみると、目的変数yの数値が、xが変化することによって変化することがわかります。aとbは固定された数値なので、yの変動要因はxだけであることがわかります。
先ほどの九九の習熟度を例にとると
となり、口に出していってみた回数のみで九九の習熟度が決まることをあらわしています。
● 重回帰分析の数式
重回帰分析の数式をみると、yが、x1やx2、x3…xnの変化によって目まぐるしく変化することがわかります。
つまり、n個あるすべてのxが増加したらyも増加しますが、x1が増加したもののx2は減り、x3はまた増えた、といったことが起きると、簡単にはyの増減は決まりません。
新規店舗の売上高を例にとると
となり、駅からの距離、駅の乗降者数、店舗面積やその他の要素に影響を受けて売上高が増減することをあらわしています。
これらのことから次のことがわかります。
● 数式(y=a+b1x1 + b2x2 + b3x3 + … + bnxn)が確立されていれば、つまりaやb1、b2、b3…bnの数値が判明していれば、x1、x2、x3…xnがどのように変化しても必ずyの値は求められます。
これは回帰分析においてとても重要なことです。
先ほど「数式(y=a+b1x1 + b2x2 + b3x3 + … + bnxn)が確立されると、x1、x2、x3…xnがどのように変化しても必ずyの値は求められる」と紹介しました。これこそ、回帰分析を使う目的になります。
マーケティング施策を例にとると、数式のyは、マーケティング施策の結果といえます。yは数値でなければならないので、例えば、あるマーケティング施策が成功して売上高が20%増えたとします。このとき「売上高20%増」がyになります。
施策を実施したことで売上高が20%も上がったら、この施策の企画者はさぞ嬉しいはずです。しかし喜んで終わってしまっては次につながりません。
目的変数y(売上高20%増)がどのような説明変数x1、x2、x3…xnによって成し遂げられたのかをみつければ、次のマーケティング施策の成功確率を上げられるかもしれません。
商品やサービスのコンセプトテストやパッケージテストを例にとると、yはコンセプト全体の評価やパッケージ全体の評価となります。コンセプトやパッケージのどの要素がどのくらい影響を与えるのか確認することができ、コンセプトやパッケージの効率的な改善に役立てられます。
顧客満足度調査や従業員満足度調査でも回帰分析は活用されます。例えば、飲食店の顧客満足度という目的に対して、接客、メニュー数、味、値段等のどの要素がどのくらい影響を与えるのか、あるいは従業員満足度調査という目的に対しては、給与、やりがい、職場環境等のどの要素がどのくらい影響を与えるのかを把握できます。影響の大きい要素を優先して見直す等の判断につなげられます。
回帰分析を活用するには、次のステップで進めるとよいでしょう。
● ステップ2:結果に影響を与えた要因を探す
例えば、気温、来店客の男女比、来店客の平均年齢
● ステップ3:要因の影響度を考える
例えば、気温の影響度はとても大きい、来店客の男女比の影響度は小さい、など
上記の準備が整えば、次のような数式をつくることができます。
■ チョコチップアイスの売上増の回帰分析の数式
チョコチップアイスの売上高=a+b1×気温+b2×女性の割合+b3×平均年齢
そしてステップ4で実際に予想します。
● ステップ4:回帰分析の計算式をつくって予想に使う
例えば、来週の平均気温は25度になる予想で、若い女性の来店客が増えそうだから、
チョコチップアイスの売上高は今週の3%増になるだろう
回帰分析を1回実施しただけでは、正しいa、b1、b2、b3は求まりません。2、3回の調査でも正確な数値は出ないでしょう。半年、1年、5年とデータを取っていくことで、a、b1、b2、b3はより正しい数値になっていきます。
長期間にわたって気温と男女比と平均年齢のデータを取ることは手間がかかる作業ですが、しかし確度が高いa、b1、b2、b3が求められたときのことを想像してみてください。予想気温と予想男女比と予想平均年齢がわかるだけで、チョコチップアイスの売上高の予想ができるようになります。売上高が正確に予想できれば、仕入不足も過度な仕入れも回避でき効率よく売上と利益を上げることができます。
回帰分析を用いる際には、注意しなければならないこともあります。
それは説明変数(結果に影響する要因、xのこと)を正確に探さないと、正しい結果(目的変数)が得られない、ということです。もちろん定数aや係数bも正しい数値をみつけなければなりません。
重要な説明変数を見落としていても、一時的に回帰分析の計算式が有効に働くことがあります。しかし重要な説明変数を加えていない回帰分析の計算式は、ある日突然「暴走」します。
例えば、ある日突然チョコチップアイスが、予想に反して爆売れして売り切れを起こしたとします。原因を調べたら、あるテレビ番組で紹介されていたことがわかりました。これは、宣伝効果というxを無視して回帰分析の数式をつくってしまったことで起きた予想の失敗です。
回帰分析はビジネスをサポートするものの、回帰分析を使った予想が100%的中するわけではないことは知っておかないとならないでしょう。
そして「不正確な回帰分析の数式」をつくってしまうと、ビジネスで結果を出すことが難しくなります。
回帰分析は軽視することも、信頼しすぎることも危険です。
回帰分析の結果はビジネス上のエビデンス(科学的根拠)と言えますので、決して軽視することはできません。回帰分析の結果があれば、エビデンスのあるビジネスを展開できるでしょう。
ではなぜ、回帰分析を軽視してはいけないのに、信頼しすぎてもいけないのでしょうか。
それは確度の高い回帰分析をするには、正しいデータ収集や高度なデータ処理、正確なデータ分析、そして数学的知識が必要になるからです。
データ収集・処理・分析のスキルや数学的な知識がないまま回帰分析を行ってしまうと、正しくない予想を立てることになってしまい、ビジネスの方向性が誤ってしまいます。
ビジネスで回帰分析を有効活用する場合は、ぜひデータ分析に定評があるプロに依頼してみてください。
市場調査についてのご相談はこちら>
2019.12.05
調査を行う際、調査対象となる母集団全体を調べることは現実的に難しいため、母集団の一部である標本を抽出して調査を行います。しかし、標本から得られた結果は母集団の真……
2019.12.09
アドホック調査とは・・・ アドホック調査とは、特定の調査目的のために、その時ごとに実施される単発調査です。アドホックという言葉は「その場限りの」「特定の目……
2020.03.04
テキストマイニングとは テキストマイニングとは、大量の記述された文章(テキストデータ)を単語や文節に分割し、その出現頻度や相関関係などを分析する技術のこと……
2020.02.13
現代のマーケティングリサーチにおいて、インタビュー調査は重要な情報収集手段として広く活用されています。その中で、特に重要な役割を担うのがモデレーターです。モデレ……