SPI REPORT

インターネット調査の偏りを補正する手法 - 傾向スコア

インターネット調査への移行に伴って

インターネット調査は、従来の面接調査や郵送調査に比べて予算的な面やスケジュール的な面で優位に立っていることから、近年市場調査の中でも急速にシェアを伸ばしています。そのため今まで継続して行ってきた調査をインターネットでの調査に変えたという企業も多くみられます。そこでよく起きることが「今までの調査の数値とインターネット調査の数値が全然違ってしまった!」という状況です。

「傾向スコア」とは?

そこで最近注目を浴びる手法が「傾向スコア」を使用したサンプルへの重み付けによるものです。傾向スコアとは、各調査対象サンプルがインターネット調査と従来の調査のどちらに出現しやすいのかを確率で表したものであり、その逆数をそのサンプルの重み付け値として使用すれば偏りが補正される、という考え方です。具体的には、インターネット調査への出現確率が、例えばサンプルAが80%ならば1÷0.8=1.25の重みを付け、サンプルBが25%ならば1÷0.25=4の重みを付けます。つまりインターネットに出現しにくいサンプルは影響度が大きく、逆にインターネットに出現しやすいサンプルは影響度が小さく計算されるわけです。

傾向スコアはどのように算出するのか?

一般的には確率算出に有効なロジスティック回帰分析を使用して傾向スコアを算出します。まずインターネット調査と従来の調査のデータを結合し、インターネット調査の各サンプルには1(つまり100%)を、従来の調査の各サンプルには0(つまり0%)を目的変数として立てます。そしてインターネットへの出現率に関連すると思われる項目を複数選択して説明変数とし、傾向スコアモデル、つまりインターネット調査出現率モデルを構築します。すると下記の図で例示したように、各サンプルのインターネット調査出現確率が予測できるというわけです。

 

2006032_1ja.png

モデル構築の際の注意

インターネット調査出現確率を予測するモデルであるため、モデルの精度を高めるための説明変数の選択が非常に重要になります。性別・年齢・インターネット使用頻度などは必須でしょう。またインターネット調査と従来の調査で採用した説明変数の割合が大きく異なっていた場合(例えば、年齢構成比率が大幅に変わっているなど)、極端な重み付けの値がつくことになるため注意が必要です。実際にSPIが分析を行ったケースでは、調査票にインターネットの使用頻度の設問が入っておらず、またインターネット調査と従来の調査で年代構成が大きく異なっていたため、傾向スコアを作成しても補正を行うことができない場合もありました。その際は、また別のソリューションをご提案させていただいたのですが、インターネット調査への移行の際には、調査設計の時点で傾向スコアによる補正を考慮に入れることも非常に重要だと考えています。

実際に偏りは補正されるのか

傾向スコアに関しては様々な研究結果がありますが、上記で述べたように適切な説明変数の選択が行われていれば偏りの補正が可能です(下記の例示グラフ参照)。ただしインターネット調査の各サンプルだけでなく、従来の調査の各サンプルにも傾向スコアが算出されるため、双方の調査対象サンプルに重み付けをすることになります。つまり双方の調査結果を互いに近づけあう、ということを行うわけです。そうすることによって偏りの補正が可能になります。

 

2006032_2ja.png
今回紹介させていただいたソリューションの他にも、SPIではマーケティング・リサーチに対するコンサルテーションを数多く行っております。課題をお持ちの企業の方は是非お問い合わせください。

文責:エスピーアイ

より詳細な情報をお求めの方は、spiindex@spi-consultants.netまでご連絡下さい。

<本レポートの引用・転載・使用に関する注意事項>

  • 掲載レポートは当社の著作物であり、著作権法により保護されております。 本リリースの引用・転載時には、必ず当社クレジットを明記いただけますようお願い申し上げます。
    (例:株式会社エスピーアイの分析によると…)
  • 記載情報については、弊社による現時点での分析結果・意見であり、こちらを参考にしてのいかなる活動に関しても法的責任を負う事はできません。
一覧ページへ戻る