複数項目の関連性を調べたり、選択・行動すべき道を探るにはどうしたらいいですか?

   「相関係数(そうかんけいすう)」を求めましょう。統計学的手法であり、品質管理、マーケティング、投資分析、経営分析、経済分析、政策立案など実に様々なビジネスシーンで使われる手法です。関係ある・ないを数値化できます。複数の項目の関連性を調査する事ができ、あらゆる分野での「判断材料」としてたいへん有効です。
 数学や統計学のサイトではないので細かい「算式」は省略し、ビジネスとして必要な「かんたんな求め方」、「判断の仕方」を紹介したいと思います。

【かんたんな相関係数の求め方】
1.ツールはもっともメジャーで使いやすいエクセル(Microsoft Excel)がよいでしょう。
2.データのサンプリング方法は測定事前に慎重に選定しましょう。ノイズ(絶対に関連性のない数値)の入りにくい方法を考え、また、各回の測定の仕方を統一しておく必要があります。ノイズとしては、「雑音」や「明らかに悪意のある事象」などがサンプリングデータに含まれてしまったことが挙げられるでしょう。これらまで含めて、適当に収集するとその影響も反映されると、相関係数としては信頼性は低いものとなってしまいます。
3.データの取り方としては、ファクター(変動する要因)として想定されるものは全て測って記録しておきます。誰かがサンプリングしたデータや統計表などから頂いても、ノイズの極めて少ない信頼できるデータなら有効でしょう。
 例1)工業データの場合・・・測定日時|室温|ツール温度|ライン速度|長さ|重さ|性質|担当者|
 例2)マーケティングの場合・・・測定日|場所|商品|売れ行き|クチコミ|客層|性別|年齢|
 例3)政策の場合・・・年|高齢者人口|労働者人口|出生数|GDP|幸福度|
・なお、「担当者」や「商品」などの「文字データ」も全て「数字」に置き換えておくとデータとして使えます
4.上の3.の自分で決めたルールに従って、任意の回数(N回)測定します。N数は大きいほどノイズが削られるため、精度が測定精度がよく、判断材料としても有効性が増します。しかし、ビジネスの現実面からサンプリングコスト・時間も考慮しましょう。分野にもよりますが、目安としては、N=100(つまり100回測定する)以上あればかなりいい精度となるのではないでしょうか。最低でもN=10は欲しいところです。
5.エクセルにデータを打ち込みます。データ部分が全て数字であればOKです。この時点であきらかにノイズの影響が強くでているなら省いてしまった方がいいかもしれません。

★次にエクセルで相関係数を算出し、分析します。
まだ続きがあります>>















最終改訂2013/2/6

著作権者 2011- T.DMY