今すぐ使える『明日からつかえるシンプル統計学』
まちがえるな、統計学は道具だ。統計は学ぶものではなく、使うもの。
これはわたし自身への戒言。だから、使い方を誤らない程度に理解していればいいし、そのために教科書をイチから読み込む必要も、Rをマスターする必要もない。もちろん様々な武器(統計手法)が使えるに越したことはないが、次のような問題と向き合っているなら、本書をオススメする。
- あと500人お客を呼び込むためには、いくら広告費が必要か?
- カスタードケーキがチョコパイに勝つには、「味の改良」と「販促キャンペーン強化」のどちらが有効か?
- クラス全体の成績が低迷している。国語と数学の両方が苦手な生徒だけ補習したほうがいいのか、全員に国語の補習をしたほうがいいのか
- 前任者から引き継いだデータが大量にあるが、それぞれの関係や着眼点がまとめられてない。どこから手をつければいいか?
- 社内のKPI(Key Performance Indicator : パフォーマンス指標)を決めたいが、どこが効きどころなのか?
高度な統計手法が必ずしも使われないには理由がある。つまり、必要とされる精度に対してコスト(=知識習得/熟練/専門のソフトウェア/分析時間)が大きすぎるのだ。コスト・メリットの観点からすると、ちょっと調べて、今すぐ知りたいという状況には合わない。重要なのは、仮説検証の手立てとしての数字に説得力を持たせること。そのための、道具としての統計なら、先ずはExcelを用いて、手を動かしながらやってみよう、というのが本書の趣旨。いちいち具体的に痒いところに手が届く。
例えば、値引きと売上げ、工期圧縮と品質など、相関関係がありそうなデータを調べるとしよう。CORREL関数の使い方を説明した後、相関あり/なしを見きわめる数値は、0.7だと教えてくれる。つまり、0.7以上であれば相関が「強い」といえる。同様に、散布図を用いた回帰分析を解説した後、決定係数R^2は0.5以上なら、“使える”精度だと述べる。「サンプルは最低30」など、厳密に言うなら前提条件に左右されるだろうが、学問的な精確さよりも、仮説検証のとっかかりとして言い切ってくれるのがありがたい。
また、弱い相関に着目して、「理論的にはつながりがあるはずだが、実際には成立していないポイントを見つける」ことで問題を特定する手法を紹介する。分析の取り組み方が分かるので、右往左往が減るだろう。
統計の「罠」について、きちんと釘を刺してくれるのがいい。因果関係があるなら、相関・逆相関が成り立つ。だが、相関があるからといって因果関係があるとは、必ずしも成り立たないと注意喚起する。人は因果をつけたがる。だが著者は、相関関係を見つけるとすぐに因果関係のストーリーを創り上げてしまうことを戒める。マスコミやケーザイ学者に彫っておきたい。
さらに、統計分析の見せ方の「罠」についても述べてくれる。同じデータをどの範囲で切り取るかによって大きく異なる分析結果になるヒストグラムを実際に見せてくれる。分析者は「どのような理由でそのデータの範囲を決めたのか」を意識しておけという。自分の思い込みで仮説を作り、気づけばその思い込みを正当化するためのデータを都合よく分析していた……なんて愚を犯さぬように。見せ方の恣意性は、統計情報を「見る」側の心得ともなる。
最後に自分メモ。本当に“使える”結果か見極めるための問いかけが紹介されているが、(わたしの実務に合うために)アレンジしてみた。
- その分析の前提は?(何のためにその分析をしたの?数値を独り歩きさせないためにグラフと同じ枠内に併記すべし)
- 分析結果を実務で使うときの制約条件は?(性能要件を見積もる場合、そのまま使えない/使わせないように)
- 制約条件の下で結論は変わる?(他の結論に目を閉じていない?)
- 分析による結論が、現在の条件を変えるだけのメリットがある?(リソースを追加してもやるべき、という結論があってもいいが、上司の上司を説得させられるだけの弾丸を準備すべし)
- 不明確な条件のときは、複数の結論に優先順位をつけられる?(落としどころに備えろ)
統計学+Excelの強みを生かせる一冊。
| 固定リンク
コメント