疫学

第8回:観察研究と反事実(Counterfactual)について

前回はコホート研究において、暴露因子や治療を評価する際に、

  • Induction Time
  • Immortal Person Time

という2つの概念が重要であることを説明してきました。

第7回:コホート研究における暴露の評価【グループ化、時間依存性の暴露、Induction Time, Immortal Person Time】今回はコホート研究における暴露因子(Exposure of Interest)の評価方法について解説していきます。 コホート研究ときく...

今回は、

  •  理想的なコントロールについて
  •  Counterfactual(反事実)
  •  Exchangeability (交換可能性 )

の3点を説明していきます。

これらの考え方が、実際の解析とどう関わってくるかも、イメージが湧くように記載してみました。

Dr.KID
Dr.KID
どうしたら理想的なコントロールが手に入るかを考えることが、疫学研究の入り口です。

理想的なコントロールとは?

まずは、ランダム化比較試験(RCT)を例に考えてみましょう。
RCTでは、治療をランダムに割りつけることで、治療グループとコントロール・グループの患者背景は均一になります。このため、この2グループでは

  •  年齢
  •  性別
  •  重症度
  •  既往歴

など、は基本的に均一になっています。論文ではTable 1に、このサマリーが載っていますよね。

「ランダム化」という介入をすることで、2つのグループが似た者同士になったと言えます。この状況は理想的なコントロールを見つけたと言い換えても良いでしょう。

この状況を、疫学用語で「Exchangeability」があると言います。
特にRCTではグループ全体(Marginal)でExchangeabilityがあるため「Marginal Exchangeability」ということもあります。

Dr.KID
Dr.KID
ランダム化をすれば、理想的なコントロール群が作り出せる!

 RCTとコホート研究の決定的な違い

RCTとコホート研究での決定的な違いは、「治療をランダムに割りつけるか否か」でした。

別の言葉で説明すると、RCTでは治療グループとコントロール・グループは似た者同士になるが、コホート研究では治療グループとコントロールグループは似た者同士にはまずなり得ないといえます。

なぜなら、現実の診療では、とある治療を受ける人と、そうでない人は、ほとんどのケースで同じ条件ではないからです。
つまり、治療を受ける人の方が、病気が重症であったり、経済的に恵まれていたり、医療へのアクセスがよかったり、と様々な違いが生じます。

治療の例以外にも、

  •  環境汚染物質への暴露のある/なし
  •  異なる性別・人種・出身
  •  社会経済的な背景(収入など)

などでグループ分けをしても、単純にこの2〜3グループでの比較はできません。
なぜなら、それぞれのグループの背景が異なってしまうからです。

Dr.KID
Dr.KID
コホート研究では、RCTみたいに2グループを単純比較してはいけませんよ

 コホート研究で理想的なコントロールを見つけるには

コホート研究を開始する前に「理想的なコントロールは何か?」を考えることから始めます。
つまり「このグループ(暴露や治療あり)」と「コントロール」はどうしたら比較できるようになるのか?と思いを馳せます。

例えば、

  •  同じ年齢
  •  同じ性別
  •  同じ人種
  •  同じ地域に住む
  •  同じ収入レベル

であれば、2者は比較できるかもしれません。

つまり、「とある条件下(Conditional)であれば、比較可能になった」と前提を置くことで、「Exchangeability(交換可能性)」を仮定しているといえます。
このことを、「Conditional Exchangeability」といいます。

Dr.KID
Dr.KID
観察研究でグループ比較をする場合、ほとんどのケースで「Conditional Exchangeability」という仮定が必要になります

 コホート研究で複雑な解析をしている理由

RCTと比較して、コホート研究の論文では「Method」のところに難しい統計用語が沢山の出てきます。
時に数式が登場してきたりして、あまり統計や疫学に詳しくない方がと、「なんのこっちゃ」と読み飛ばしてしまうと思います。

 Conditional Exchangeabilityを作り出すために…

代表的な手法として、

  •  Regression (回帰分析)
  •  層別化やマッチング
  •  Propensity Score (傾向スコア)

などが近年はよく使用されていますが、これらの手法は2つのグループを比較可能な状況に持ち込む手法です。
例えば、層別化や回帰分析では、「同じ年齢・同じ性別・同じ地域なら…」と条件を絞り込むことで比較をしています。
傾向スコアでは、「治療を受ける確率(Propensity score)」を計算し、この確率が一緒なら、絞り込んで比較をしています。

また、(特に)疫学者は「g-method」と言われる手法を好んで使用することもあります(私もそうです)。具体的には、

  •  Inverse probability weighting with marginal structural model (IPW/MSM)
    (逆確率重み付け)
  •  g-computation (standardization)
  •  g-estimation

といった手法になります。
少し英語が並んでわかりづらいかもしれませんが、根本的なところ「治療グループとコントロール・グループを比較可能にする」という点は回帰分析などと共通しているともいえます (ただし、計測しているものは異なります)。

Dr.KID
Dr.KID
統計・疫学手法を駆使して、比較可能なグループを作り出しているのです

 観察研究の限界

ここまで説明してきて、薄々感じている方も多いと思いますが、観察研究では「とある条件下であれば、交換可能性がある(Conditional Exchangeability)」という仮定を置いています。

現時点ではこの仮定を受け入れて(妥当性の議論を諦めて)、グループ間での比較をしています。
ひょっとしたら、2グループの間で、計測できないない要因(遺伝的な背景など)のせいで、本当は比較可能でなかった可能性が残されます。

これは観察研究の限界ともいえます。

 Conditional Exchangeabilityに抗う方法

とはいえ、このConditional Exchangeabilityに抗う方法が全くない訳ではありません

例えば、Greenland教授が疫学の世界に導入した操作変数法(Instrumental Variable Methods)や、J Pearl教授が考案したフロントドア法(Front-door criterion)があります。

これらの手法が使える(くらいの)条件であれば、計測できなかった因子の影響(Conditional Exchangeabilityの破綻)については気にせずに解析をすることができます。

問題点としては、

  •  操作変数法において、理想的な操作変数を見つけること
  •  Front-door法において、完璧な中間因子を見つけること

が非常に困難という点があります。

Front-door criterionについては、こちらで詳しく説明しています↓

Front-door criterion(フロントドア基準)について解説してみましたフロントドア基準(Front-door criterion)を知りたい方を対象に、導入編として書きました。 Backdoor c...

 まとめ

今回は観察研究における理想的なコントロールに触れつつ、Counterfactual(反事実)やExchangeability(交換可能性)といった疫学の概念を説明してきました。

なんとなく理解できて、観察研究で単純にグループ比較をしてはいけない点が理解できれば良いと思います。

Dr.KID
Dr.KID
CounterfactualとExchangeabilityは、疫学研究の因果推論で非常によく使用される概念です(Causal Assumption)

ABOUT ME
Dr-KID
このブログ(https://www.dr-kid.net )を書いてる小児科専門医・疫学者。 小児医療の研究で、英語論文を年5〜10本執筆、査読は年30-50本。 趣味は中長期投資、旅・散策、サッカー観戦。note (https://note.mu/drkid)もやってます。