疫学

選択バイアスを構造から理解すれば、暗記する必要はありませんよ

選択バイアスというと、皆さんはどんなことをイメージするでしょうか?
疫学の教科書を開くと、

  •  脱落者によるバイアス(Loss to follow-up bias)
  •  自己選択によるバイアス(Self-selection/ Volunteer bias)
  •  健康労働者によるバイアス(Healthy worker bias)
  •  無回答によるバイアス(non-response bias)

などが記載されているでしょう。

「難しい用語が並んでいる」と腰が引けてしまいそうですが、実はそうでもありません。
選択バイアスは、ある共通した構造を持っており、それを知ることが理解への近道です。

Dr.KID
Dr.KID
難しい疫学用語も、基本をおさえることで、理解が深まります。

本記事では、選択バイアスのポイントを説明します。

本記事の内容

  •  選択バイアスの構造(DAGで理解する)
  •  それぞれの選択バイアスをDAGと背景で理解する
  •  自己選択は本当に選択バイアスか?

今回も、前回に引き続き、Modern EpidemiologyとMiguel Hernan教授らの記載した論文を元に説明していきます。

A structural approach to selection bias. Epidemiology. 2004 Sep;15(5):615-25.

Dr.KID
Dr.KID
疫学の分野では超有名な論文で、私もこの論文は何度も引用しています。

選択バイアスは全て同じ構造

実は、選択バイアスは全て同じ構造をしています。以下のDAGを見てみましょう。

いずれのDAGも、2つの変数(AとL、AとY)がSに向かって矢印が伸びています。
そして、Sは四角で囲われています。これは、とある集団のみに「選択した」ことを意味します。

前回、選択バイアスについて、足の速さと身長の関連性を例に説明してきました。
本来、どの身長でも同じくらい足の速い人がいたとしても、NBA選手という特定の集団に「選択」をしてしまうと、「背の低い人の方が足が速い」ように見えてしまう点を解説しました。

DAGを使って因果関係、交絡、選択バイアスを見分ける方法について最近はビッグデータやAIなどの普及から、データ分析に関する知識に触れる機会が非常に多くなりました。 よく耳にする言葉として、 ...

実際の臨床研究でも同様のことが沢山生じています。

追跡不能(脱落者)による選択バイアスについて

ランダム化比較研究(RCT)やコホート研究でも起こりうる「追跡不能」です。
途中で研究から脱落してしまう方のことを言いますが、実は「追跡不能」のみではバイアスは生じません(A→[S])。
追跡不能となった人に一定の傾向がある場合に選択バイアスとなります。例えば、

  •  重症な人(L)が追跡不能となりやすかった(L→[S])
  •  重症な人(L)がアウトカムを発症しやるかった(L→Y)

という条件が揃うと選択バイアスとなります。
言葉を並べてきましたが、DAGをみていただければ一目瞭然です。

Dr.KID
Dr.KID
Sに向かって矢印が二本入り込んでいる!
そして、矢印の片方はアウトカムに繋がっている

健康労働者バイアス(Healthy Worker Bias)

職業コホート(Occupational Cohort)などで問題となる健康労働者バイアスですが、根本的には似たようなDAGになります。
この場合、Lを健康な人、Aを運動量、Yを致死率を考えると分かりやすいでしょう。

  •  健康な労働者は雇用されやすいため研究に入りやすく(L→[S])
  •  よく運動する方が協力的に研究に入り(L→[S])
  •  健康であるため、致死率が低くなります(L→Y)

ストーリーは追跡不能と異なりますが、DAG上は全く同じ構造になります。

Dr.KID
Dr.KID
ここでも、Sに矢印が二本向かっていて、別の一本がYに伸びている!

ケース・コントロール研究における選択バイアス

よく疫学の教科書に

  • ケースコントロール研究では、コントロールは暴露(A)と独立して選ばなければならない

と記載されているかもしれません。
この文章だけみると「何を言っているのだろう?」と感じる方も多いでしょう。
ですが、DAGを見れば、もう少し理解が深まると思います。

このDAG上では、AからSに矢印が伸びています。
この状態を「AとSは独立していない」といえます。
さらに、ケースコントロール研究では、まずはケース(Y)を特定して研究に組入れるため、必ずYからSへ矢印が伸びます。

ケースコントロール研究でバイアスが起こりやすい例として、病院内で行われたケースコントロール研究がよく例としてあげられます。
病院内からケース・コントロールを選んでしまうと、コントロールは患者ですので、ほとんどの場合、治療・危険因子(A)と関連しているのです。
これは、先ほどのNBAにおける身長と足の速さの例と共通しています。

Dr.KID
Dr.KID
病院内で行われたケース・コントロール研究(Hospital Case-Control Study)では、選択バイアスとなることがほとんど!

正しいケースコントロール研究は?

正しいケースコントロール研究のDAGは、以下のようになります。

AからSへの矢印がない状態です。
この状態に持ち込むためには、コントロールはアウトカム(Y)を起こしうる集団からランダムにサンプルする必要があります。

Dr.KID
Dr.KID
バイアスのないケースコントロール研究をするのは、非常に難しく、疫学者の腕の見せ所でもあります。

コホート研究において、自己選択や健康労働者バイアスは、必ずしも選択バイアスとは限らない

1点気をつけた方が良い点があり、コホート研究において

  •  自己選択によるバイアス(Self-selection)
  •  健康労働者バイアス(Healthy worker bias)

は選択バイアスでないことも多々あります。

例えば、「ジムでの運動(A)が、健康上のアウトカム(Y)に与える影響」をみるとしましょう。
Aが会員制ジムへの登録、Lが健康、Sが研究への参加、Yが健康上のアウトカムとします。
この場合、Sに矢印は二本入っていないため、選択バイアスではありません。
むしろ、Lという共通の原因(交絡因子)による交絡となります。

この点はGreenland教授らが記載したModern Epidemiology(3rd edition, p134-)にも、そしてHernan教授らが記載した今回の論文にも記載されており、ケースバイケースで考える必要があります。
私も「自己選択(self-selection)=選択バイアス」と決めつける風潮に反対の立場でいます。

Dr.KID
Dr.KID
「選択」という言葉が付くからといって、選択バイアスとは限らない

まとめ

今回は、選択バイアスについて簡単に説明してきました。

難しそうな言葉が並んでいますが、DAGの構造上は全て同じで、「共通の結果(S)」に矢印が向かっています。

自己選択や健康労働者バイアスは、「選択バイアス」でないケースもあるので、注意しましょう。

ABOUT ME
Dr-KID
このブログ(https://www.dr-kid.net )を書いてる小児科専門医・疫学者。 小児医療の研究で、英語論文を年5〜10本執筆、査読は年30-50本。 趣味は中長期投資、旅・散策、サッカー観戦。note (https://note.mu/drkid)もやってます。