前回はコホート研究において、暴露因子や治療を評価する際に、
- Induction Time
- Immortal Person Time
という2つの概念が重要であることを説明してきました。
今回は、
- 理想的なコントロールについて
- Counterfactual(反事実)
- Exchangeability (交換可能性 )
の3点を説明していきます。
これらの考え方が、実際の解析とどう関わってくるかも、イメージが湧くように記載してみました。
理想的なコントロールとは?
まずは、ランダム化比較試験(RCT)を例に考えてみましょう。
RCTでは、治療をランダムに割りつけることで、治療グループとコントロール・グループの患者背景は均一になります。このため、この2グループでは
- 年齢
- 性別
- 重症度
- 既往歴
など、は基本的に均一になっています。論文ではTable 1に、このサマリーが載っていますよね。
「ランダム化」という介入をすることで、2つのグループが似た者同士になったと言えます。この状況は理想的なコントロールを見つけたと言い換えても良いでしょう。
この状況を、疫学用語で「Exchangeability」があると言います。
特にRCTではグループ全体(Marginal)でExchangeabilityがあるため「Marginal Exchangeability」ということもあります。
RCTとコホート研究の決定的な違い
RCTとコホート研究での決定的な違いは、「治療をランダムに割りつけるか否か」でした。
別の言葉で説明すると、RCTでは治療グループとコントロール・グループは似た者同士になるが、コホート研究では治療グループとコントロールグループは似た者同士にはまずなり得ないといえます。
なぜなら、現実の診療では、とある治療を受ける人と、そうでない人は、ほとんどのケースで同じ条件ではないからです。
つまり、治療を受ける人の方が、病気が重症であったり、経済的に恵まれていたり、医療へのアクセスがよかったり、と様々な違いが生じます。
治療の例以外にも、
- 環境汚染物質への暴露のある/なし
- 異なる性別・人種・出身
- 社会経済的な背景(収入など)
などでグループ分けをしても、単純にこの2〜3グループでの比較はできません。
なぜなら、それぞれのグループの背景が異なってしまうからです。
コホート研究で理想的なコントロールを見つけるには
コホート研究を開始する前に「理想的なコントロールは何か?」を考えることから始めます。
つまり「このグループ(暴露や治療あり)」と「コントロール」はどうしたら比較できるようになるのか?と思いを馳せます。
例えば、
- 同じ年齢
- 同じ性別
- 同じ人種
- 同じ地域に住む
- 同じ収入レベル
であれば、2者は比較できるかもしれません。
つまり、「とある条件下(Conditional)であれば、比較可能になった」と前提を置くことで、「Exchangeability(交換可能性)」を仮定しているといえます。
このことを、「Conditional Exchangeability」といいます。
コホート研究で複雑な解析をしている理由
RCTと比較して、コホート研究の論文では「Method」のところに難しい統計用語が沢山の出てきます。
時に数式が登場してきたりして、あまり統計や疫学に詳しくない方がと、「なんのこっちゃ」と読み飛ばしてしまうと思います。
Conditional Exchangeabilityを作り出すために…
代表的な手法として、
- Regression (回帰分析)
- 層別化やマッチング
- Propensity Score (傾向スコア)
などが近年はよく使用されていますが、これらの手法は2つのグループを比較可能な状況に持ち込む手法です。
例えば、層別化や回帰分析では、「同じ年齢・同じ性別・同じ地域なら…」と条件を絞り込むことで比較をしています。
傾向スコアでは、「治療を受ける確率(Propensity score)」を計算し、この確率が一緒なら、絞り込んで比較をしています。
また、(特に)疫学者は「g-method」と言われる手法を好んで使用することもあります(私もそうです)。具体的には、
- Inverse probability weighting with marginal structural model (IPW/MSM)
(逆確率重み付け) - g-computation (standardization)
- g-estimation
といった手法になります。
少し英語が並んでわかりづらいかもしれませんが、根本的なところ「治療グループとコントロール・グループを比較可能にする」という点は回帰分析などと共通しているともいえます (ただし、計測しているものは異なります)。
観察研究の限界
ここまで説明してきて、薄々感じている方も多いと思いますが、観察研究では「とある条件下であれば、交換可能性がある(Conditional Exchangeability)」という仮定を置いています。
現時点ではこの仮定を受け入れて(妥当性の議論を諦めて)、グループ間での比較をしています。
ひょっとしたら、2グループの間で、計測できないない要因(遺伝的な背景など)のせいで、本当は比較可能でなかった可能性が残されます。
これは観察研究の限界ともいえます。
Conditional Exchangeabilityに抗う方法
とはいえ、このConditional Exchangeabilityに抗う方法が全くない訳ではありません
例えば、Greenland教授が疫学の世界に導入した操作変数法(Instrumental Variable Methods)や、J Pearl教授が考案したフロントドア法(Front-door criterion)があります。
これらの手法が使える(くらいの)条件であれば、計測できなかった因子の影響(Conditional Exchangeabilityの破綻)については気にせずに解析をすることができます。
問題点としては、
- 操作変数法において、理想的な操作変数を見つけること
- Front-door法において、完璧な中間因子を見つけること
が非常に困難という点があります。
Front-door criterionについては、こちらで詳しく説明しています↓
まとめ
今回は観察研究における理想的なコントロールに触れつつ、Counterfactual(反事実)やExchangeability(交換可能性)といった疫学の概念を説明してきました。
なんとなく理解できて、観察研究で単純にグループ比較をしてはいけない点が理解できれば良いと思います。