Syleir’s note

2020.4.1より統計検定やE資格の勉強の進捗を報告しています。統計検定準1級、E資格、G検定取得しました!当ブログへのリンクはご自由にどうぞ。

MENU

target trial emulationの初歩を解説する【統計的因果推論】

はじめに

個人的にtarget trial emulationについて勉強する機会があったので備忘録としてもまとめたいと思います。

target trial emulationとは?

横文字は嫌いですが、残念ながら、適切な日本語訳が今のところ存在していない(と思っています)ので、このままtarget trial emulationを使っていきます。

最近激アツのhot topicです。頭痛が痛いみたいですね。
ここ数年で論文投稿数が鰻のぼりに上昇しています。

2024年4月現在の論文投稿数
target trial emulationを読み下すと、 対象となるRCT : randomized controlled trialを明確に定めて(target)、それを観察研究によって模倣(emulation)しようということです。 これを端的に説明するのであれば、「RCTをマネした観察研究を行うことで、制約下でも質の良い研究をしよう」 とする枠組みのこと、ということができるでしょうか。

前提知識

前提知識として、過去記事でも解説した通り、RCTは選択バイアスを減らせる良いデザインです。 syleir.hatenablog.com また、そのほかの想定していない交絡因子も調整してくれる優れものです。実際にRCTと観察研究が結果が食い違っている研究がいくつかありますが、多くの場合はRCTの方がバイアスを低減することができるデザインとされ、信頼性が高く、意思決定に用いられることが多いです。 一方で、RCTには多くの制約があります。
  • ①倫理的制約
RCTには倫理的制約があります。例えば、すでに治療効果がありそうという治療法の研究を行うと、ランダム化で対照群に割り付けられた群が不利益を被るというものや、研究として倫理的制約をはらむものがあります。
  • ②時間的制約
RCTには時間的制約もあります。RCTを行うにはかなりの時間がかかります。これから研究デザインを立てて、承認してもらって、実験して、解析して、という時間を取れないものがあります。研究の期日が決まっているものもありますし、因果推論はなんらかの意思決定のために行いますから、意思決定の期日が迫っていたりするものもあるかもしれません。明日までに治療を行うかを決める時に今からRCTは組めません。
  • ③金銭的制約
そのほか、金銭的制約もあります。治験を組んで、解析を行ってと行っていく時には必ずお金がかかります。治療法によっては莫大なお金が必要です。 そのほかにも、RCTは多くの制約をはらんでいます。このため、RCTをやりたい研究デザインであっても、行えない時があります。target trial emulationはRCTが種々の制約で行えない中で、観察研究をやむを得ず行うときに、より「正しい」結果を出すための枠組みであるとも言えます。

歴史的な流れ

歴史的な流れは理解には不要です。興味がある方だけ読んでください。 これは論文を読んでいる中で当たったもので、成書を当たったわけではないですし、ざっとしか読んでいないので正しさは保証できませんが、大枠の時系列を説明します。 target trial emulationはHarvardのHernánによって発展させられてきた概念です。最初の概念自体はEpidemiology. 2011 May;22(3):290-1.にあり、大規模データベースを用いた観察研究でもRCTと同じような枠組みで考え、CONSORTチェックリスト(RCTの結果を報告するためのチェックリスト)の枠組みで、観察研究でも同じように確認し、どのようにemulateしたか(この論文で実際にemulateという単語が出てきます)を報告する推奨が出されました。これがtarget trial emulationの概念の始まりと思われます。 実際の枠組み、方法論に関しては同じくHernánがAm J Epidemiol. 2016 Apr 15; 183(8): 758–764.の報告で、具体的な「マネ」の仕方を提示してくれました。 教科書では2020年にWhat ifが出版され、この中で取り上げられています。2024年7月に新版が出るようです。 そして、2022年にHernánがJAMA. 2022 Dec 27;328(24):2446-2447.にGuide to Statistics and Methodsとして方法論のガイドとしてのeditorialをCOVID-19に対するトシリズマブでの治療を例に、記載してくれたのでした。そしてJAMAにも載ったことで、一躍価値が認められ、前述したような爆発的な論文数の増加につながっていったのでした。(安易な因果関係の仮定です。) 今回はこれを解説していきます。原著を読みたい方は Target Trial Emulation: A Framework for Causal Inference From Observational Data | Research, Methods, Statistics | JAMA | JAMA Network これを読んでみてください。

target trial emulationの手順

以下、具体的な原著でいうframework:枠組みを解説していきます。

target trial emulationは2ステップからなる

target trial emulationは以下の2ステップで構成されます。
①どのような因果関係が知りたいのかを明確にしてそれを明らかにする仮想RCTをデザインする
第1段階は、どのような因果関係が知りたいのか?を明確にし、それがたとえ非現実的であろうと、RCTの形で定義します。現実的にはRCTが何らかの理由でできないにしろ、その制約がなかったと考えて、(例えば金銭的制約があるのであれば無限のお金があると仮定し、)「仮想RCT」を想定します。 実際に、RCTをやるなら、どのような患者を組み入れるのか、どのような治療を、どのような薬の量、期間で、どのように割り当てを行い、アウトカムをどのように設定し、どのように追跡し、どれくらいの期間追跡するか、どのように解析するかなどをできるだけ詳細に定義します。
②実際に観察データを利用して仮想RCTを模倣する
第2段階は、観察データを使用し「仮想RCT」の手順を模倣します。 上で定義した手順通りにデータベースから適格なデータを見つけ、割り当てを行い、治療を行ったとして、アウトカムが生じる、あるいは実験終了までを追跡し、同じ解析を実施します。しかし、観察研究であり、ランダムな割り付けはできないため、割り当てだけは傾向スコアマッチングなどを利用して擬似的な割り当てを行います。
観察研究ではランダムな割り付けは難しい
傾向スコアマッチングに関してはこちらの過去記事をご参照ください。 syleir.hatenablog.com

仮想RCTにおいて定義すべきもの

適格基準、治療戦略、割り当て手順、追跡期間、アウトカム、効果の種類、分析計画を定義する必要があります。
適格基準
適格基準という言葉はわかりにくいですが、「組入れ基準」+「除外基準」とざっくり考えるとわかりやすいと思います。 有名なPI(E)COで考えるとP(Population)に該当します。「どのような患者を入れて、どのような患者を除外するか」を定義します。
治療戦略
治療戦略については、PICOでいうI, C(Intervention, Conparison)に相当します。 治療群、対照群を明確に定義していきます。治療群については、どのような介入をいつからいつまで行うのかを決めます。本来のRCTではどのような治療を行うか、を考えます。 これを観察研究で模倣するときは、ビッグデータの中から適格基準を満たし、そのような治療を行った人を抽出し治療群とします。一方で対照群はビッグデータの中から適格基準を満たし、治療を行わなかった人を抽出し対照群とします。
割り当て手順
仮想RCTではランダム化による割り当てを行います。予見不可能な割当てを行う必要があります。治験責任医師や関与する医療関係者が(デザイン上可能であれば)その割り当てを知ることがないように行います。しかし、観察研究ではランダム化が難しいので、傾向スコアマッチングなどで患者背景の調整を行います。(上で書いた通りです。)
追跡期間
次に、追跡期間を定義します。開始時間と終了時間を決めます。 仮想RCTでは追跡期間の開始時間はランダム化時点(参加登録時点)です。 終了時間はアウトカムが起こった時、または観察終了時点までが一般的だと思います。 これを観察研究で模倣するときが一癖あり、追跡終了時点の決定は比較的容易で、仮想RCTと同様にアウトカムが起こった時、あるいは追跡開始時点から一定時間経過した時で良いと思いますが、追跡開始時点(time zero)については、きちんと決めないといけません。ここを曖昧にしてしまうとimmortal time bias(不死時間バイアス)などのバイアスが生まれる原因になってしまいます。バイアスの説明はここで書くと相当な分量になってしまうので、またいつか書きます。 一般的なのは適格基準を(初めて)満たしたときとすることですが、これは治療が割り当てされる前に確実に適格基準を満たすように定義しなければなりません。過不足なく、確実に明確になるように適格基準を決める必要があります。
アウトカムの設定
RCTにおけるアウトカムの重要性についてはもはや言うまでもないでしょう。RCTは研究テーマに対する科学的根拠に基づいた答えを導き出すようにデザインされるべきで、そのテーマに関連するアウトカムを設定する必要があります。またそのアウトカムは測定できることが必要です。 観察研究についてもRCTで検討されるべきアウトカムと同様のものを設定します。
効果の種類
ITT(intention to treat)効果、PP(per-protocol)効果のどちらを設定するかどうかを決めます。 ITTは当初の治療戦略を継続するかにかかわらず、当初の治療戦略としたかどうかの比較であり、治療選択の逸脱自体 も治療効果と考えます。 PPは逸脱があった場合は打ち切りとして扱います。時間依存性曝露を扱う必要があるので、IPTW(逆確率重み付け法)などで扱う必要があります。
分析計画
仮想RCTではどのように解析するかや使用する統計モデルを事前に決定しておく必要があります。 事後解析する場合はそれを明記する必要があります。 観察研究として模倣する場合も事前にどのような解析を行うかは決定しておく必要があります。

target trial emulationの限界

さて、ここまで説明したところですが、target trial emulationはあくまで「考え方」ということが理解できたでしょうか。 道具だけ揃えても職人になれないように、Ude⚪︎yの講座だけ買ってもデータサイエンティストになれないように#駆け出しエンジニアと繋がりたいのハッシュタグを使ってもエンジニアにはなれないように、target trial emulationだけあっても上手に因果推論ができるわけではありません。良い研究はいいCQやRQから生え、適切なデータベース構築をし、因果推論手法を理解して使わないといけません。 ただ、観察研究のやり方を提示し、大枠を示してくれたという意味では大いに有意義なフレームワークです。より良いものを真似する、シンプルでありながら大変有効なのでぜひ使ってみてください。

おわりに

この記事を書いている途中で これが発売されました。この中にもtarget trial emulationについても軽く触れられており、知っている限り初めての邦書だと思います(違ったらスミマセン、教えてください) 因果推論について初歩から学べる本で薄いのに充実している印象を受けました。ぜひ。