ビジネスパーソンのための優しい統計「第6回目」
※YouTubeにて各シリーズ連載中!
中川先生のやさしいビジネス研究、ビジネスパーソンのための優しい統計学、第6回となります。今回は「二つの数字の間にある関係を分析する」これを掘り下げていきたいと思います。
二つの数字の間の関係を考える
今回、皆さんに紹介するのは、散布図という手法です。2つの数字の間にどんな関係があるのかを分析するのは、高度な統計分析の基本発想なのですが、その基本がこの散布図です。
とはいえ、まず皆さんに考えてもらいたいのは、この二つの数字の間の関係を考えるというのが、ビジネス実務の現場でどういうときに使うかです。自分事にしないと、統計みたいな科目は学びが進んでいきませんから、今回もまず皆さんに考えてもらいたいと思います。
ビジネスの現場での、2つの数字の間の関係を調べる状況。どんなものが、思い当たりますか?
(統計では、ここでいう2つの数字のことを「2変数」なんていいます。変数、という言葉を聞いてもびっくりしないでください。ほぼ「数字」って言ってるようなもんです。)
たとえばマーケティング。店舗数と売上高の関係などは、どうでしょうか。店舗を増やしていけば、当然売上高は増えていくわけですけども、だんだん立地のいいところがなくなって低減していくかもしれない。そうすると、最適な店舗数みたいなものがあるかもしれないので、店舗数と売上高の関係を分析してみたいわけです。
あるいは、何歳ぐらいの人がうちの商品買ってくれているんだよってことで、購買意欲と年齢の間の関係を分析するとか。はたまた、地域の所得水準と、店舗客単価との関係はあるのか、とか。
こんなようなことがデータとして理解できたとしたら、あなたはマーケティング上、とっても良いヒントを得ることができますよね。
また人事分野ではどうでしょうか。モチベーションと、生産性の関係。あるいは技能レベルと作業効率の関係、成果報酬と営業成績の関係。こんな形で、人事分野において、パフォーマンスを上げるためにはどういう施策が有効なのかも、データを取れば、分析から見えてきます。
会計ではどうか。売上と利益の関係。どれくらい売り上げを稼ぐと、どんな利益になるのか。販促費と売上高の関係、そんなものも分析できますね。為替レートと製造原価なども分析できる。いろいろな輸入品目を扱う会社であれば、為替レートがどれくらい製造原価に影響するのか、そんな分析もできます。
このように見ていきますと、どうやらこの2つの数字の間の関係を読み解いていくのは、ビジネスにおける数字力というものの中核をなすものだってことが、なんとなく皆さんわかってくると思うんです。
二つの数字の間にあるいろんなパターン
で、2つの数字の間にある関係を分析しようというときには、どういう分析手法が有効か。
冒頭、お伝えしましたが、散布図が最強です。
例えばこちらの形みたいに、U字型の関係、あるいは逆U字みたいな関係があるかもしれない。こういうU字型の関係っていうのは二次関数というもので表現できるわけですけども、実は「2つの数字の間には二次関数の関係があるんです、ということを一発で表現できるような統計指標は存在しない」んですね。
また、この右肩上がりであったり、円のような関係になっていたり、右肩下がりであったり、への字みたいな関係になっていたり、二つのクラスターになっていろんな散らばりのパターンがあるんです。
こういう様々なパターンを一発の数字で表現できるような統計指標というのは、残念ながら存在していない。1つの数字だけだったら、平均値だとか中央値、標準偏差などのデータでも、ある程度、こういう傾向に散らばっているんだな、ということが表現できるのですが、2つの数字の間の関係でいうと、相関という「どれくらい関連しているのか」という指標はあるけれども「実際どういう関係になっているのか」まで表現できる数値は、存在しません。
二つの数字の間に関係があるなと思ったら、散布図を見る
なので、世の統計学者さんもみんなこう言います。2つの数字の間に関係があるなと思ったら、散布図を見る。このX軸Y軸の2軸で書いてどういうふうに散らばっているのか、実際の人間が解釈可能な形で散らばりを見るほかにはないわけなんですね。
もうとにかく重要な点で何度も強調します。実際の散らばりを見るのが一番だし、なんならそれ以外に、この二つの数字の間の関係を正しく把握する方法というのはないのです。なので、この散布図を書ける・読めるというのは、徹底的に大切になってくるスキルなんです。
そんなわけで、散布図を書けると読めるということこそが統計学のとても重要なポイントになってくるのだとしたら、皆さんにまずどっちを学んでいただきたいかと言えば、読み解ける力の方。今回は、読み解きの練習を徹底的にやっていきましょう!
散布図を読み解く
第1問!
マーケティングデータとして、店舗数と売上高の関係がこんなふうに散らばっていました。皆さんはここからどんなことを読み解けるでしょうか?ぜひ考えてみてください。
皆さんはこの二変数の関係として、二つの数字の間の関係として店舗数が増えるにつれて売上高が伸びているけれども、伸び方は逓減しているんだな、こういう関係になってそうだな、ということを見抜くことができるはずです。
まずはここまでが第一歩。ただしくデータを読み解く。
次に、どういう戦略を立てるか、です。ここからの答えは、人によって変わってくるわけです。私がここで言いたいのは、「データは答えを教えてくれない」ということです。店舗増による売り上げの伸び方は逓減するんだな、までは分かる。では、どうしたらよいのか、というのは、データは指し示してくれません。戦略を考える部分は、自分でやる必要があります。
よく、統計分析というと、ここの答えまで指し示してくれるのではと勘違いする方がいますが、それはできない。考える作業は、あくまで人に残されている。
で、作戦を立てるとしたら、「売上効率を維持するために出店ペースを見直す」のも正解なら、状況によっては「売上効率が悪化しても、店舗を増やすことに意味がある」場合だってあります。もちろん「売上効率ベストな出店数まで減らす」もある。この2つの数字だけでは読み解けないその企業の置かれている今を踏まえて、最終判断をするのです。
たとえこの売り上げの増加が低減するのだとしても、それでも店舗数を多く構えて赤字にならない限り、売上高を伸ばし続けていきましょう、これも一つの戦略なわけですし、いや、こんな感じに売上が低減していくんだとしたら、最適点があるはずだ、ということで、程よいところで店舗数の増加を止めてその中で最大限の利益最大化を果たしていきましょう、これも戦略になってくるかと思います。なので、この読み解いた後の解釈・判断・戦略の部分というのは、あなたに委ねられている。でも、大切になってくるのは、増えてはいるけど伸びは逓減するんだな、という関係を見抜くこと、これが大切な議論になります。
第2問!
次は人事データとして読みましょうか。
今度はですね、個人技能と個人の作業効率との関係です。技能水準をXの方にとって、その結果、どれぐらいの作業が効率化できますかというのを、縦軸(Y軸)としました。
皆さんは、ここから何を読み解くでしょうか?
すぐに気がつきますように、二つの塊になっていることが読み解けるんじゃないかと思います。決して順繰りにだんだん上がっていくのではなくて、作業効率というのは、技能の水準があるレベルに達するとドンと跳ね上がるという性質を持っているんだと。
作業効率がグンとアップするまでは、技能を高めてもなかなか遅々として効率は上がってkれないんだけれども、あるレベルを超えた瞬間にぐんとパワーアップできる。そういう技能だということが、ここから読み解ける。なので、なかなか結果が出なくても地道に訓練を続けていくことが大切だ、ということがここから読み解けるかもしれません。
はたまた、これが、ある工場現場における実測データであるとするなら、この工場においては、人員の作業能力というのが二極化しているということかもしれない。非常に高度に習熟して作業効率が高い人たちと、まだまだ技能が十分でなく作業効率の低い人たちという二つのグループが出来上がってしまっているんだ、ということかもしれない。
そのあたりは、やはり、2変数だけに閉じないで、現場のほうをこそ見つめてやる必要がある。
なお、こうした「2つのかたまり」みたいなデータの散らばりになっていることは、相関などの数値では計測できません。やはり、散布図を見なければ、発見できないことなのです。
第3問!
今度は財務・経理のデータとして、X軸の方は「今回は販売促進キャンペーンやりました」みたいな形で販促費を測定し、縦軸の方は販促費を、その店舗ないしはその日にいくらぐらい通したら、売上高がどれぐらいになったか、そんなデータを測定してみました。皆さんはここで何を読み取るでしょうか。
この点の散らばりの様子から、何か一貫した関係性を見出すのはちょっと難しいかもしれない。販促費を増やしたところで、どうも売上高は増えていないようだと。右肩下がりかと言われるとそこまで明確な右肩下がりとは言えないかもしれないけれども、少なくともプラスではない、ということがここから読み解けるわけです。要するに、販促費は売上に影響をもたらしていない、と。
今回の販促キャンペーンは「ほとんど効果がなかったね」ってことが、わかる。それもまた、大切なことです。ああ、今回は失敗だったのだと。会社においては、失敗の中から正解を探すことのほうが大半ですから、失敗が分かるのも、大切なことなのです。効果がないんだということがわかったら、「じゃあ違う方法をとってみればいいじゃないか」という経営判断の参考になるわけなんです。「結果が出なかった」こともまた、結果なわけです。
***
このように二つの数字の間の関係を理解していくということは、一気にビジネス力をアップさせることに繋がってくるんです。この数字とこの数字の間にどういう関係があるのか、はたまた関係がないのか、これがわかったならばあなたは正しく判断ができるようになるわけです。
そんなわけで、今回のまとめ。散らばりの形は、千差万別。実際に、見て判断しよう。です。2つの数字の間の関係というのは本当にいろんなバリエーションがありうる。これらを全て上手に表現しているような統計指標完璧な指標というのはまだ存在しないし、今後もおそらく登場しない。だとすれば、皆さんがやるべきことというのは、まずは散布図を書いてみること、そしてその散布図を虚心坦懐に見て、そこにある関係というものを正しく読み解くこと、そういうことになるわけです。
散布図の書き方
ただ、今回まだちょっとやり残しが残っていますね。散布図、じゃあどうやって書いてみるのってことなんですけど、これ知っていればExcelであっという間にできるんです。本当に誰でも簡単にできてしまうので、次回はこのExcelで散布図を書く練習を皆さんと一緒にできたらなと思います。
また、この二つの数字の間の関係を捉えるための指標として実は使える指標はなくはないんです。さらにその先の回では、この相関係数だとか、それを使った回帰分析など、ちょっとハイレベルな分析にも進んでいきたいと思います。
その全ての起点が「散布図を読み解けること」ということで、今回しっかり皆さんの力に変えてもらいたいと願っています。
※次回は散布図の書き方!
※その先には、相関係数、さらに回帰分析まで
皆さんに使えるようになってもらいます~!
Comments