top of page
執筆者の写真功一 中川

データの時代。統計の基礎!【やさしい統計学1】



今日は、AI、データサイエンス、ビッグデータなどの言葉が躍る、データの時代です。


この時代に、一般の社会人、一般のビジネスパーソンが、どれくらい統計のことを理解しておけばいいのか。実際、様々なデータ分析をやってた学者という立場から、これまでの経験も踏まえて、皆さんがどれくらい統計ということを学んでいけばいいのかを、今回、やさしい統計学の第1回としてお伝えしたいと思います。


(動画はこちらです!統計学シリーズ全話公開中!)

この「やさしい統計学」シリーズでは、皆さんが学ぶべき、これからの時代のための基礎教養としての統計学を提供していきます。


最初に結論を言うと、皆さんに求められている統計の必要なレベル感は「エクセルで基本的なことができる」です。


高度な統計ソフトを使って行う複雑な解析は、必ずしも全ての人ができる必要はないんです。高度なことや専門的なことというのは、データサイエンティストだとか研究者と言われるような人たちにやってもらえばいい。


大切なことは、その専門家たちの分析が、何をしているもので、どういう結果となっているのかを、正しく解釈ができるということ。


あなた自身が手ずから実際に操作できることとしては、エクセルを用いて、円グラフ、棒グラフ、平均、標準偏差、そういったものがぱっと作れるレベルがしっかり出来ていればよい。


データ分析の大半は、データというものの可読性を高めることです。可読性、すなわち、データが何を意味しているか。基礎的な平均や分布状況から、高度な因果関係の分析に至るまで、いずれも一貫しているのは「可読性を高める」なんです。ドバっとしたデータの塊を、意味のあるものにする。その基本を修めるという意味で、自分で出来なければいけないことは、

  1. エクセルで基礎的な処理ができること

  2. 高度な分析が、概ね何をしているのか理解できること

の、2点になるのです・


必要なのは基本的な部分ができること


高度な分析を見せられたり、人からいろんな統計データを見せられたときに惑わされず、まごつかず、その分析が妥当なものであるのかを、判断ができるということ。


統計学というものについては、何かミラクルだとかファンタジーのようなものだと思われている。私としてはまずこのベールを剥がしておきたい。


正しいリアルな実像としての統計学を知ってもらうことが、統計学を学ぶ第一歩です。


統計学についての誤解①

高度な回帰分析とかやらないと、統計分析にならない?


統計に関する第1の誤解は、高度な解析技術を使わないと、統計分析としては認められないんじゃないのか。簡単な棒グラフみたいを出したって、こんなの恥ずかしくて人を見せらんない分析なんじゃないのか、ということです。


これが、大きな誤解です。



端的に言ってしまえば、統計分析データサイエンスと言われる仕事の大半は、データのクリーニング(データを処理可能な状態まできれいにすること)、そして、基本的な円グラフや棒グラフにまとめること、なのです。

さらに言ってしまえば、高度な統計解析というもので見えてくることというのは、大抵もっと初歩的な平均や分散や相関で、ある程度見えているんです。たいていの高度なデータ分析というものは、簡単な分析で見えていたことを、より確からしく、厳密に証明しているに過ぎないのです。


学ぶべきは初歩の部分

つまり皆さんが学ぶべきは初歩の部分、基礎の部分を固めることなんです。


棒グラフ、どういうふうに書くんですか?

散布図はどう書くんですか? どういうふうにそれを解釈するんですか? そういうのは、基本的には中学数学レベルです。


これが、かっちりできること。


それができれば、解像度を上げるための高度な分析を専門家にお願いしたうえで、その分析結果をビジネスに活用することができるようになります。


統計学についての誤解②

機械学習とかAIは、なんかもう別世界?


統計というものについての二つ目の誤解は、機械学習だとかAIだとかっていうのは、もう私達には全く理解できないような天才の世界なんでしょう、という誤解です。

実は機械学習だとかAIだとかも、私達が基本的にタッチする初歩的な統計の延長線上にあるものです。


とはいえやってることは確かにめちゃくちゃ高度です。



9.99999の9をいくつ並べられるのかというような精度でやるような研究、例えば自動運転なんてそんな感じです。人類の運転回数で言えば、1億回運転して1かいでも死亡事故が出たらいけないわけです。1億分の1のエラーだとしても、それは人類全体の試行回数からすれば、運転回数からすれば結構な頻度でエラーが出ちゃうことになるわけです。

そんな世界では、果たしていくつ9を並べられるのか…ということになり、めちゃくちゃに高度な統計分析が必要にはなります。


でも、そんな世界ですら、ベースになっているものは、私達が素人感覚でわかるような基本的なことです(それだけでも0.9くらいまではいくのです。そこからがしんどい)。



だとすれば、機械学習とかAIが何をやってるのかということも、基本的な統計を理解していけば、分かるようになるということです。


もう何度でも強調しますが、だからこそ、皆さんは徹底的に基本を押さえるべきです。


実際ビジネスの場のデータサイエンス


実際ビジネスの現場でどういうふうにデータサイエンス統計というものが生きるのか、実際に皆さんにその一例をお見せしたいと思います。




公開されているデータを利用させていただきます。

ゲームエイジ総研さんが、2021年大ヒットしたウマ娘というゲームアプリについて、データを提供して下さっています。このデータから、どういうふうにしてマーケティング策を考えればいいのか。

皆さんもぜひちょっと頭のエクササイズとして考えてみてください。


分析を始めるために現状を知る

分析を始めるときにどこから手をつけていいのか。

ここで皆さんのビジネスパーソン社会人としての常識からスタートするのがおすすめです。

どれくらい売れてるのか、からですね。

データサイエンスの基本的な仕事は、このリアルなビジネスの常識に沿って、数字を見て解釈をしていくこと。

というわけで最初は売上高ユーザー数を見ていきましょう。


1週目でドーンと89万人、スタートダッシュに大変華々しい成功を収めたということが言えます。

そこから1ヶ月4週間で206万人、そこから先の4週間でも100万人以上増やしている。

ということで、本当にこの初動、最初の1週間1ヶ月で大きな成功を収めている成功事例だと言えます。

でもこれを見ても皆さんすぐにわかりますよね見えてきますよね?

初動は良かったけど、次第に獲得ユーザー数は鈍化していますね。

「わずか1ヶ月で鈍化する、そういう産業なんだ」「こういうものなんだ」ということが皆さん見えてくるかと思います。


このデータを踏まえ、ビジネスパーソンとしては、次の策を考えつつ、次にどういうデータが必要かを考える


次の策としては、「ユーザー数を増やす」か「既存ユーザーのリテンション率や、生涯価値を高める」でしょう。どちらを選択すべきかは、データが教えてくれるわけではない。どこまでいっても、データはヒントを与えるだけ。そこから判断を下すのは、人です


ここでは仮に、さらにユーザー数を増やす戦略を採用したとしましょう。だとすれば次に必要なデータは、いま、どういう顧客がこのアプリを楽しんでいるのか、です。


解釈を進めるためにさらに現状を知る


まず男女でどれくらい分かれているのかを見てみると、圧倒的に男性の支持が強いんだということになります。

女性はほとんどいない。これも視覚化して棒グラフ等にして見てみるだけで、人は判断が可能になります。


こうしてデータで状況が言えてくれば、次の策も浮かんでくる。

素直に考えれば、男性向けのアプリなんだから、このあとマーケティングも男性を狙うかというのが自然な発想になると思います。

逆に女性を狙ってみようかっていうのも、そこから考えつく作成になると思います。

ここの判断は、再び、人間に委ねられる。


大切な事なので繰り返します。


  1. データは私たちに正しい世界を教えてくれる

  2. それに基づいてどう行動を決定するかは、人。


さて、もうちょっと詳しく見ていきますと男性といっても年齢層でいうと、もっぱら20代30代だということになりますね。


不思議なことに、興味深い事にこういうゲームアプリって10代がマーケットの中心のはずなのに、この商品は20代30代の支持を得ているというのは、割と高年齢層可処分所得が多い人たちに売れているから売り上げが大きいなということになる。

そうすると、引き続き20代30代を狙うのか、もう少し高齢の層を狙っていくのか、あるいは若年層を狙っていくのかという選択肢が浮かんでくる。


仮にここでは、男性を引き続き狙い、現在受けている20代30代を引き続きターゲットにするとしましょう。このときに、あなたがマネジャーとして次に発想すべきは、この商品は、なんでこの人たちに受けてるんだろう、ということです。


顧客価値を何かを知る

顧客にとって価値と考えていることは何なのか。

そちらを調べてみたデータがこんな感じ。




ユーザーは、ゲーム性が面白いということで、この商品を選んでいるということが見えてきます。


また、キャラクターのビジュアルやボイスの良さも売りになっている。


そしてさらには、ストーリーもなかなかに評価されている。


ということで、分析からは、このゲームがなぜ支持されているのかが解る。データが指し示すのは、ゲーム性、キャラクタ、そしてストーリーという、変化球ではない、王道の成功戦略だったということかと思います。


これがデータから分かったとして、ふたたび、判断はあなたに委ねられる。

引き続き、王道戦略でいくのか。それとも逆に、変化をつけて顧客に新しい側面をアピールしていくのか。


以上のように、データをビジネスで用いる、というのは徹頭徹尾、

「データで今を正しく知る」

「未来のための判断を人が行う」

これの繰り返しなのです。


皆さんがこのデータの時代を、どのように生きていくべきなのか。

お判りいただけてきたのではないかと、思います。


かつては、データが十分ではなかったから、実態がなかなか見えない中で、仮説を立てておそらくビジネスをしていた。そんな時代は過去になった。

現代はデータがある。であれば、正しいリアルを知ることが、全ての始まり。これができなければ、勝負の土俵に立っていない。


しかし、結局、勝敗を分けるのはその先で、人がどう判断をしたかなのです。


このデータが示してくれるリアルをもとに、どういう策を立てるのか。未来を開くのは、あなたの仕事になるわけです。


このデータの時代のビジネスにおける統計学、あなたがどう生かせばいいのかということもおわかりいただけたんじゃないかと思います。

データは今を見る目線。そしてそこから未来をひらくのがあなたの仕事、ということで、ビジネスパーソンのためのやさしい統計学を、一緒に学んでいただけましたら嬉しく思います!


Comments


bottom of page