因果推論と統計的手法の調査

前書き


最近インターネット上に、「AだからB」といった因果関係が存在するのかも不明な発言が多く見られます。自分も普段あまり意識していないのですが、建設的な議論を進める中で、その根拠を論理付けて用意しておかないといけないと感じました。

以下の本のまとめです。一部の重要な要素だけをまとめましたが、こちらで記載されている具体例などが実践的でした。
詳細や具体例を頭に入れたい方は是非ご購入を。
www.diamond.co.jp

ゴール:因果関係の読み解く手順を知る

因果推論の秘訣

因果関係があると思わしき事象にも実はただの「相関関係」であるものも少なくないです。ビジネスでは因果関係が重要であり、因果関係の存在を確認するには、因果推論を行います。

  • 因果関係 → Aが原因でBも変化している
  • 相関関係 → AにつられてBが変化してるように見えるが、実際は関係していない

因果関係かなと思いきや、実は相関関係だった際の「あるある」は以下の通りです。

  1. ただの偶然
  2. AとBの両方に影響を与える要素の存在(交絡因子)
  3. 逆の因果関係

この因果関係を証明するには、「現実」の世界と反対を選んだ「反事実」世界との比較です。ただ「もしあの時Bを選んだら〜」みたいな世界線移動が我々にはできません。それでも比較が必要な場合は、A'とB'のグループが「比較可能」かどうかを検討すべきなのです。純粋に「比較可能」出来る場合は重要因子以外のすべての要素が似通っている場合です。でもそんなの難しいですよね。ではどうすれば「比較可能」グループを生み出せるのか。

ランダム化比較試験〜自然実験

ランダム化比較試験では、全集合から「Aの処理を施した」=介入群と「Aの処理を施していない」=対照群に分けて試験をします。これらをランダムで割り当て、対照群の設定により、介入群と対照群は互いに比較可能とします。こちらの比較で、現実と反事実の比較を実現させて、比較結果が統計的に有意な差が生じているのかを検討します。有意な差が生じるということは、誤差や偶然では説明できない差が生じていると説明でき、エビデンスも高いとされています。

ただランダム化比較試験においても「比較可能」グループを見つけ出すことは困難です。そこで用いられるのは、「自然実験」といった手法です。自然実験では「あたかも人為的な試験が行われたような」状態を観察データから見つけ出す必要があります。誰にでも予測できない事象(=外生的ショック)が要素を介入群と対照群に自然的に分けてくれる状況を利用して、因果推論しています。

注意:研究対象の集団と異なる場合での再現性

擬似実験

でも自然実験を見つけ出すのは簡単な話ではない。そこで「擬似実験」となる観察データと統計手法によりランダム化比較試験の状況を作り出します。

前後比較〜差の差分析

利点:トレンドを加味した事象Aによる因果推論を実現

「Aの事象が発生する前」と「Aの事象が発生した後」で比較して、Aの事象による効果を分析したい場合、「前後比較デザイン」を用います。ただこれには問題が二点ほど発生しています。一点は時系列に伴う「トレンド」の影響を考慮していない点。もう一点は「平均の回帰」であり、Aの事象が発生する前のスコアが極端に低い場合だと、「平均への回帰」により、その翌年はスコアが向上してもおかしくないことです。

こういった問題を分析する為には、事象Aの発生前後だけでなく、過去のデータを遡って観察する必要があります。するとデータ数が多いほど、平均に回帰した信頼性の高いデータになる上、トレンドの観察も行いやすくなります。そこでトレンドの傾向が明確になった時に、行うべき「前後比較デザイン」手法が「差の差分析」です。

差の差分析では『Aの処理を施した時の伸び具合』『Aの処理を施していない時の伸び具合』の差分をとり、伸び具合によって「処理:A」がスコアに影響を与えているのかを考察します。これによりトレンドを加味した事象Aによる因果推論を実現できます。しかし差の差分析を有効とするには以下の条件があります。

  1. 介入群と対照群で、事象A前のトレンド線が並行
  2. 事象後同じタイミングで他の変化がないか

操作変数法

利点:A(結果)ーB(原因)ーC(操作変数)のラインに影響を与えることで、(場合によっては)交絡因子を比較試験から無関係にできる

操作変数法ではある仮定を立てています。「AとBに因果関係が"あれば"、CによってAが増加する」
操作変数では、「結果(A)には直接影響を与えないが、原因(B)には影響を与える。よって間接的に結果(A)に影響を与える変数(C)」のことを示します。では操作変数法により、何が得られるのかというと、A(結果)ーB(原因)ーC(操作変数)のラインに影響を与えることで、(場合によっては)交絡因子を試験に無関係にできます。操作変数法を有効にするには、以下の条件があります。

  1. C→Bは直接関係
  2. C→Aは直接関係ではない
  3. AーBーCに直接関係する変数Dが存在しない

回帰不連続デザイン

利点:カットオフ値から事象Aによる因果推論の実現

A事象を適用するには「n人以上」といった制約が設けられています。この「n」をカットオフ値とした時、このカットオフ値前後の結果はどう分析されるのでしょうか。「n」カットオフ前後で結果に大きなズレが生じている場合、これを「A事象」による因果関係と言えるのではないでしょうか。これを回帰不連続デザインとします。回帰不連続デザインを有効にするには以下の条件があります。

  1. カットオフ値周辺で他の事象が発生していない

マッチング法

利点:共変量を元により信頼度の高い比較可能な介入群と対照群を作成できる

介入群と対照群の比較可能についての検討をさらに深掘ります。集合の要素数が異なる介入群と対照群からお互いに特徴(共変量)が似通ったペアを選び出し、さらに比較可能のグループを作り出す方法をマッチング法とします。複数の共変量が複雑に交絡している場合には、共変量をまとめて1つのスコアにする「傾向スコアマッチング(Propensity Score)」と呼ばれる手法も存在します。

rcommanderdeigakutoukeikaiseki.com

ただマッチング法で最も難しいのは共変量の選定であり、以下の条件が存在します。

  1. 共変量が数値化されている
  2. 全ての共変量が傾向スコアマッチングにて計算されている

因果関係に適さないデータの場合

本来はランダム化比較試験や擬似実験を行えれば良いのだが、そういうわけにもいきません。こういった場合は重回帰分析による分析が進められており、単回帰分析と比較しても交絡因子の要素を排除してくれます。個人としては、相関関係は得られても、因果関係を抽出できるのかサラサラ疑問ではありますが・・・。

まとめ

とりあえず因果関係を読み解くのに重要な要素は以下の通りです。

  1. 原因を紐解く
  2. 結果の明確化
  3. 偶然・交絡因子・逆の因果関係の調査
  4. 反事実の作成
  5. 比較可能となるグループの準備
  6. 比較試験・考察