運営者: 多田 翼 (LinkedIn, Facebook)

データ分析の力 - 因果関係に迫る思考法 (伊藤公一朗) 。ビッグデータ時代にこそ不可欠な分析力

データ分析の力 - 因果関係に迫る思考法 という本をご紹介します。

 

データ分析の力 因果関係に迫る思考法 (光文社新書)

データ分析の力 - 因果関係に迫る思考法

 

 

エントリー内容です。

  • 本書の内容。なぜ因果関係が重要なのか
  • データ分析の醍醐味。いかに説得力を高めるか
  • ビッグデータ時代にこそ不可欠な分析力

 

本書の内容

この本から学べることは、データ分析から因果関係を言うために、どう分析設計をすればいいかです。多くの事例を使いわかりやすく解説されています。事例は、政策・ビジネス・教育と多岐にわたります。

本書の特徴は、因果関係を知るための最先端のデータ分析手法について、数式を使わずに説明をしていることです。図が効果的に使われ理解しやすいです。

以下は本書の内容紹介からの引用です。

ビッグデータが存在するだけでは、「因果関係」 の見極めはできない。データの扱い、分析、解釈においては、人間の判断が重要な役割を担う――。

本書では 「広告が売り上げに影響したのか?」 「ある政策を行ったことが本当に良い影響をもたらしたのか?」 といった、因果関係分析に焦点を当てたデータ分析の入門を展開していきます。

 

なぜ因果関係が重要なのか

ビジネスや政策へのデータ分析で大事だと思うのは、「なぜ起こったのか」 と 「それはどうすれば起こせるのか」 の2つを明らかにすることです。

前者のなぜ起こったかは 「因果関係」 、後者のどうすれば起こせるのかは 「予測と再現性」 です。因果関係と予測はつながっています。因果関係は why 、予測は so what です。

因果関係が重要なのは、X をすれば Y が起こるという要因を証明できるからです。

データ分析担当者の力量が問われるのは、因果関係から見出した構造が今後も起こるかを予測できるかです。未来のことなので 100% 断言することはできませんが、将来への予測を、どんな根拠でどの程度の確からしさで見通せるかです。

 

データ分析の醍醐味

この本のテーマは、データ分析から相関関係ではなく、因果関係があったかどうかを知るためにどうすればよいかです。分析から因果関係を見極めることのおもしろさ、データ分析の醍醐味を事例で学べます。

本書を読みながら思ったのは、データ分析のおもしろさや醍醐味は、3つあることです。

  • 分析設計をどうつくるか
  • 制約の中でいかに工夫するか
  • 分析結果がどう役立つか


以下、それぞれについて詳しく見ていきます。

1. 分析設計をどうつくるか

分析設計とは、どんなデータを使い、何と何をどうやって比較するかを設計することです。

分析によって因果関係を発見するためには、適切な設計をつくることが必要です。設計が正しくなければ、因果関係ではなく相関関係しか言えない、あるいは、間違った因果関係を言ってしまうことも起こります。

本書では、因果関係を知るための分析手法が紹介されています。具体的には以下です。

  • ランダム化比較試験 (Randomized Controlled Trial: RCT)
  • RD デザイン (Regression Discontinuity Design: 回帰不連続設計法)
  • 積分析 (Bunching Analysis)
  • パネル・データ分析


各手法がどういうアプローチか、それぞれの強みと弱みがわかりやすく書かれています。事例とともに解説されるのでイメージしやすく、分析者はどのように考えて設計しているかを知ることができます。

2. 制約の中でいかに工夫するか

データ分析とは、制約との戦いです。

ほとんどの場合、分析の目的を達成するための理想的なデータが手に入ることはありません。コストやそもそもデータが存在しないなどの現実的な理由から、データに制約がある状況で分析をすることになります。

分析設計は、制約がある中で、それでも目的を果たすために考えられる可能な限りで、できる分析を考えることです。

本書で取り扱われる分析手法も、制約によってどれを使うかが決まります。例えば、ランダム化比較試験をやりたいが、適切なデータが得られないので RD デザインになるというものです。

制約の中で何ができるかを考えることは、分析者にとって難しさであり工夫のしどころです。私は、ここにデータ分析の醍醐味があると思います。

3. 分析結果がどう役立つか

データ分析からどういう結果が得られるかも、データ分析のおもしろさです。

仮説通りの結果か、新しい発見が得られるか、仮説を覆すような予想外の結果なのかは、データ分析をやって初めてわかります。また、数字をどう解釈し、何を意味するのかを考えることは、分析者にとってはやりがいのあることです。

本書の事例で興味深かったのは、分析設計や得られた分析結果だけではなく、結果がどう役に立つかまで触れていることです。因果関係がわかるからこそ、次に活かすことができます。

 

いかに説得力を高めるか

データ分析によって説得力のある結果を提示するために注意したいことは、結果の受け手への透明性をいかに高めるかです。透明性には、以下の2つがあります。

  • 分析の再現性
  • 分析のわかりやすさ

 

1. 分析の再現性

分析に使うデータの収集方法、分析設計、集計方法、分析や解釈ロジックなど、どのような分析プロセスがされたかです。分析者以外にも公開され、やろうと思えばその分析と同じことができるかどうかです。

分析がブラックボックスではなく再現性があれば、透明性が高まり説得力のある分析になります。

2. 分析のわかりやすさ

分析設計が過度に複雑ではなく、受け手にとってわかりやすく理解できることです。

 

ビッグデータ時代にこそ不可欠な分析力

本書が興味深く読めるのは、事例とともに分析手法や結果の解釈が紹介されているからです。

事例は具体的には、節電政策、医療費の自己負担率の関係、自動車の燃費規制と自動車重量の関係、Uber の需要とタクシー料金の関係などです。いくつかの事例は著者が実際に携わったものです。

本書の 「はじめに」 では、ビッグデータ時代にも不可欠な分析力について、以下のように書かれています。

ビッグデータはたくさんのデータを提供してくれるから全て解決してくれる、という論調もありますが、データの扱い、分析、解釈においては、本書で解説していくように人間の判断が重要な役割を担います。

昨今 IT 業界を始めとする様々なビジネス業界でも、ビッグデータが存在するだけでは実務の改善に至ることは難しく、ビッグデータを解析しビジネス現場の意思決定に利用できる形にする分析力 (アナリティクス) が重要だという認識が高まってきています。

特に、本書で焦点を当てる 「因果関係の見極め方」 においては、データの量が増えても根本的な解決にはならないので、私たち自身がデータを見極める力を備える必要があるのです。

 (引用:データ分析の力 - 因果関係に迫る思考法)

 

この指摘が意味することは、因果関係を見極めるのは機械ではなく人だということです。

機械が得意なのは、相関関係を出すこと、人には思いつかないような組み合わせの相関を提示することです。一方、分析者に求められることは、データ分析の目的を明確にし、何が因果関係なのかを見極め、得られた知見で課題を解決し目的を果たすことです。

 

データ分析の力 因果関係に迫る思考法 (光文社新書)

データ分析の力 - 因果関係に迫る思考法