因果推論

Synthetic Control Method (SCM) について

Synthetic Control Methodは、近年、医療分野でも徐々に使用されてきている疫学手法です。Abadieらを中心に、方法論や応用した研究手法が徐々に普及してきています。

Synthetic Control Methodが使用できる状況ですが、とある地域(例えばカリフォルニア州)のみに医療政策(タバコ規制の法律)が実施された場合などに使用できます。

今回の例はこちらの論文から引用させていただきました。

この手法に興味のある方は、必読の研究と思います。

Synthetic Control Methodの具体例

Synthetic Control Methodの具体例を説明しながら見ていきましょう。あまり堅苦しくなりすぎないように、説明していければと思います。

今回の論文では、アメリカのカリフォルニア州で1988年に制定されたタバコ規制の法律の効果を見ています。具体的には、

  • 1988年:1パックあたり25セントの税金アップ

をはじめとしたタバコ規制の法律が制定されました(詳細は詳しくないので、ご容赦いただければと思います)。そして、タバコの売り上げの推移を見たいと思います。

さて、この状況で、どのように医療政策を評価しますか?

政策評価はどうするか?

この場合、この政策効果を評価するにはいくつか方法があり、

  • 前後比較をする
  • コントロールグループを見つけて、DIDやITSをする
    (*ITS: Interrupted Time Series Analyis)
  • Synthetic Control Methodをする

あたりだと思います。(他にもあるでしょうが、今回は省略させていただきます)

前後比較試験について

前後比較試験が簡単に行えそうですが、いくつか問題点があります。最も問題になりそうなのが、自然の増加or 減少傾向(Natural trend)がある場合に、この解析方法は行えなくなります。

なぜなら、医療政策を開始する前に、すでにタバコの売り上げが減少傾向であれば、これは自然な減少なのか、医療政策のおかげなのかの評価が困難になるためです。

実際にタバコの売り上げのトレンドを見てみましょう。
(論文中のFigure 1)

カリフォルニア州の場合、1975年あたりをピークに、その前からすでに減少傾向にあるのがわかります。この減少傾向は1990年代も持続していますが、本当にこれが医療政策のおかげなのか、この図だけで判断するのは難しいでしょう。

DID(差の差)分析について

次にDIDについて考えてみましょう。

例えば、コントロール群をカリフォルニア州以外の49州として解析を行うことを考えます。この場合、

  1. カリフォルニア州のタバコ売り上げ:制定前
  2. カリフォルニア州のタバコ売り上げ:制定後
  3. その他の州のタバコ売り上げ:制定前
  4. その他の州のタバコ売り上げ:制定後

の4つの情報を使い、(1-2) – (3-4) のように差の差(Difference in Difference)を計算することで、政策評価を行う方法です。

DIDは政策評価で非常に多く使われている手法ですが、その前提に「Parallel Trend Assumption」という前提が必要になってきます。

この前提は、比較する2つのグループが、平行なトレンドである必要があります。

平行であれば、計測された因子も、計測されなかった因子も、その影響は一定であり、差の差を取ることで相殺されて0になると考えられるからです。

こちらの図のように、カリフォルニア州とその他の州は、少なくとも法律制定の前では平行であるとは言い難い推移です。

この場合。Parallel Trend Assumptionは成立できないため、別の方法を考える必要があります。

例えば、平行トレンドになるように、ある州だけをコントロールとしてピックアップしてマッチングさせる方法もあります。

あるいは、今回説明するSynthetic Control Methodという方法もあります

Synthetic Control Methodについて

Synthetic Control Methodを説明する前に、1つだけ重要な点を考えてみましょう。現在、私たちが持ち合わせているデータは以下の4通りでした:

  1. カリフォルニア州のタバコ売り上げ:制定前
  2. カリフォルニア州のタバコ売り上げ:制定後
  3. その他の州のタバコ売り上げ:制定前
  4. その他の州のタバコ売り上げ:制定後

では、どのようなデータがあれば、カリフォルニア州で行われた政策をきちんと評価できるでしょうか?

 

一言で答えるとすると、Counterfactual(反事実)があれば、正しい政策評価ができます。
もう少しわかりやすくいうと、「カリフォルニア州でタバコの法律が制定されなかった場合のタバコの売り上げ」が分かれば、正しい政策評価が行えます。

1988年に法律が制定された場合のタバコの売り上げデータはすでに私たちは持っています。欲しいのは、法律が制定されなかった場合のタバコの売り上げデータです。

このデータを推定する方法が、Synthetic Control Methodです。

Syntheticは合成、Controlはコントロールですが、その名の通りの研究手法です。つまり、介入がされなかった州のデータを用いて、まずは介入前のカリフォルニア州そっくりのデータを作ってしまいます。

詳細なメカニズムは省略しますが、それぞれの州のデータに重みを0〜1の間でつけて、合成カリフォルニア(Synthetic California)のデータを作ってしまいます。

今回の研究でいうと、コロラド、コネ口カット、モンタナ、ネバダ、ユタなどのデータを使用してSynthetic Californiaを作り上げています。全ての州を使用する必要はなく、あくまで州レベルの共変数や介入前のアウトカムが似通った状態を作れればOKです。

結果を解説

こちらの結果を見てみましょう。

カリフォルニア州(実線)と他州のデータから作り上げた合成カリフォルニア州(点線)は、1988年より前は、非常に似通った推移をしています。これは合成がある程度は上手く行っていることを意味します。

こちらの票を見ても、タバコの売り上げ以外のデータも、他の州より似通っているのが分かります。

アウトカムは、1988年の法律制定後のタバコの売り上げの比較になりますので、実線と点線を比較すればOKです。実線は、実際に計測されたカリフォルニア州のデータでした。点線は、仮にカリフォルニア州で法律が制定されなかった場合の売り上げデータになります(Counterfactual)。

この差をグラフにすると以下のようになります。

両者の差が1988年から徐々に広がっているのが分かります。この差が、カリフォルニア州における法律の制定による介入効果の推定値と言えます。

DIDとSynthetic Control Methodの類似点

DIDとSynthetic Control Methodは似通っている点があります。それは、ATT(Average Treatment Effects in the Treated)であるという点です。もう少しわかりやすくすると、

  • 介入/治療されたグループのデータ
  • 介入/治療されたグループが、もし介入されなかった場合のデータ

を比較している点です。話はそれますが、Propensity score matchingもATTです。

DIDとSynthetic Control Methodの違いと欠点

DIDとSynthetic Control Method (SCM)の違いですが、DIDには”Parallel Trend Assumption”が必要でした。この前提の下では、交絡因子は時間によって変化しないtime-fixed confounderである必要がありました。

SCMはもう少し前提が緩くなり、time-fixed confounderである必要はなく、時間によって変化するtime-varying confounderをも許容してくれます。

このため、SCMはDIDにおける”Parallel Trend Assumption”に自信がないときに、使用できますし、両方使用して検討してみても良いと思います。

そのほかの欠点や問題点など

一方で、SCMの場合、synthetic controlを作るときに、介入前の交絡因子とアウトカムの関係性がlinear(直線)である必要があります。

また、SCMの場合、対象とする市町村や州などのユニットは、今回のカリフォルニア州のように1つである必要があります。近年、複数のグループを1つのユニットとして使用できるか否かも評価されつつありますが、まだ評価が定まりきっていません。

また、交絡因子の選別方法や、synthetic controlに必要なデータ数(地域の数や期間)もまだ開発途上のようです。

終わりに

今回はSCMについて、論文を解説しつつ方法論の簡単な説明を行ってみました。

この論文にはさらに詳しく記載されていますし、具体的な解析コードもありますので、実用してみたい方はぜひ試してみると良いでしょう。

 

ABOUT ME
Dr-KID
このブログ(https://www.dr-kid.net )を書いてる小児科専門医・疫学者。 小児医療の研究で、英語論文を年5〜10本執筆、査読は年30-50本。 趣味は中長期投資、旅・散策、サッカー観戦。note (https://note.mu/drkid)もやってます。